[B! 汎用ライブラリ] uzullaのブックマーク

ニュース: NHocrのソースコードを初公開 (ver 0.16(beta)) - NHocr: 日本語文字認識プログラム - OSDN

日本語文字認識プログラムNHocrのソースコードを初公開しました (ver 0.16(beta))。Solaris SPARC/x86, Linux (x86_64)上で動作確認済みです。OCRopusからの呼び出しが可能です。文字行認識部がライブラリ化されており、自作プログラムからの利用も容易です。

uzulla 2009/06/11

OCR

リンク

Perlでアニメ顔を検出＆解析するImager::AnimeFace - デー

というのを作ったので自己紹介します。 2月頃から、コンピュータでアニメ顔を検出&解析する方法をいろいろ試しつつ作っていて、その成果のひとつとして、無理やり出力したライブラリです。はじめにはじめにざっとライブラリの紹介を書いて、あとのほうでは詳細な処理の話を僕の考えを超交えつつグダグだと書きたいと思います。 Imager::AnimeFaceでできること Imager::AnimeFaceは、画像に含まれるアニメキャラクター的な人物の顔の位置を検出し、さらに目や口など顔を構成する部品位置や大きさの推定、肌や髪の色の抽出を簡単に行うことができるライブラリです。これらが可能になると、画像から自動でいい感じのサムネイルを作成できる動画から自動でいい感じのサムネイルを作成できる自動的にぐぬぬ画像が作れる自動的に全員の顔を○○にできる顔ベースのローカル画像検索など、最新鋭のソリューシ

uzulla 2009/04/13

汎用ライブラリ

リンク

手書き文字認識エンジン Tomoe

tomoe-0.6.0をリリースしました。 tomoe-0.5.xからの変更点: 簡体字中国語辞書の追加 (Red Hatの技術者の方々の成果です。ありがとうございました) 日本語辞書の拡張(JIX 0208 第2水準のサポート) ロケールに基づいてデフォルト辞書を自動選択ただし、現在のところjaとzh_CNのみで、それ以外のロケールで使用すると辞書が有効にならず、またオンデマンドでの辞書の変更も実装されていません。起動時にロケールをセットするようにして下さい。 $ LANG=ja uim-tomoe-gtk $ LANG=ja scim-tomoe libtomoe-gtk を tomoe-gtk に名称変更 tomoe_gtk_init() と tomoe_gtk_quit() を追加互換性確保のためにtomoe_gtk_window_new()で自動的にtomoe_gtk_i

uzulla 2008/11/20

汎用ライブラリ

リンク

FSE（Face Sensing Engine）｜OKI

FSE（Face Sensing Engine）Ver.4は、人の顔をセンシングする技術で動画や静止画の利用価値を高めるソリューションを提供します。独立行政法人情報処理推進機構（略称 IPA）の主催する『ソフトウェア・プロダクト・オブ・ザ・イヤー®2007』においてグランプリを受賞しました。 ※ソフトウェア・プロダクト・オブ・ザ・イヤー®は、独立行政法人情報処理推進機構（IPA）が、毎年優れたソフトウェア・プロダクトを表彰する制度です。 ※FSEの一部は、独立行政法人情報処理推進機構（IPA）「2004年度次世代ソフトウェア開発事業」委託開発の成果です。 ※記載されている会社名、製品名は一般に各社の商標または登録商標です。ページの先頭へ

uzulla 2008/10/30

汎用ライブラリ

リンク

芸術の秋にProcessingでスケッチプログラミングを始めてみよう（1/3） - ＠IT

芸術の秋にProcessingでスケッチプログラミングを始めてみよう：絵心がなくても簡単に絵が描けるProcessing（1）（1/3 ページ）アートやデザインのための“プログラミング” 読者の皆さんは「プログラミング」という用語や、それをすることに、どんなイメージを持っているでしょうか。仕事に使われるアプリケーションやWebサービスの開発の世界の「プログラミング」を考えてみると、多くの場合「実用性や効率が重んじられ、専門的な知識を持ったエンジニア／プログラマーが慎重に正確に行うもの」といったイメージではないかと思います。しかし一方で、実用性ではなくスクリーンに表されるイメージや動きの美しさ、見るものを引き込むインタラクションのアイデアをプレゼンテーションする「プログラミング」の世界も存在します。エンジニアではなくアーティストやデザイナーが、驚きやインスピレーションを求めて大胆に「プロ

uzulla 2008/10/14

リンク

HTMLから本文を抜き出せるモジュールHTML::ExtractContent - perl-mongers.org

This domain may be for sale!

uzulla 2008/10/14

リンク

大語彙連続音声認識システムJulius

A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?

uzulla 2008/09/25

汎用ライブラリ

リンク

日本語にも対応した手書き文字認識エンジン·Zinnia MOONGIFT

Windows MobileやZaurusなどのPDAで良く見かけるのが手書き文字認識エンジンだ。バーチャルキーボードやPDAの小さなキーボードで入力するよりも素早く入力ができるのが便利だ。モデルの認識中 OCRも同様だが、入力された内容を読み取ってデジタルなデータに変換するというのは難しい技術だ。だがその部分だけオープンソース化すれば、みんなが手軽に利用できるようになる。今回紹介するオープンソース・ソフトウェアはZinnia、手書き文字認識エンジンだ。 Zinniaはエンジンのみの提供で、認識の基準になるモデルなどは提供されていない。そしてそのエンジンは機械学習機能（アルゴリズムはSVM）が実装されており、利用していくうちに精度を高めることができる。 Python用テストスクリプト APIを公開しており、それを使うことでC/C++/Perl/Ruby/Pythonなどでもエンジンを利

uzulla 2008/09/21

汎用ライブラリ

リンク

MOONGIFT: » オープンソースの音響合成ソフトウェア「Pure Data」:オープンソースを毎日紹介

音楽の世界はフィーリングによる部分は大きいと思っている。だが、音楽の世界に携わっている方にしてみれば、音楽の成り立ちや組み立て、組み合わせなどはきちんとした理論、言わば公式によって成り立っているのかも知れない。感性による部分も大きいだろうが、ロジック的な部分もありそうだ。チャートのように変換ロジックを組み立てていくそれを感じさせてくれるのがこのPure Dataだ。Pdという名前でも知られるこのオープンソース・ソフトウェアは音響合成をロジックに展開するソフトウェアだ。 Pure Dataはチャートのような画面に対してオブジェクトやメッセージ、数値、スライダ、ラジオなどを配置して線で結んでいくことで音声処理を可能にしている。フローチャート風なのがロジックな展開をみせてくれて面白い。メインウィンドウ主にMIDIや音声に対しての処理を行うのが目的のようだ。この分野ではMaxと呼ばれるソフ

uzulla 2008/09/21

汎用ライブラリ

リンク

Zinnia: 機械学習ベースのポータブルな手書き文字認識エンジン

Zinnia: 機械学習ベースのポータブルなオンライン手書き文字認識エンジン [日本語][英語] Zinniaは機械学習アルゴリズム SVM を用いたポータブルで汎用的なオンライン手書き文字認識エンジンです。Zinniaは組み込みの容易さと汎用性を高めるために、文字のレンダリング機能は持っていません。Zinniaは文字のストローク情報を座標の連続として受け取り、確からしい順にスコア付きでN文字の認識結果を返すだけに機能を限定しています。また、認識エンジンは完全に機械学習ベースであるために、文字のみならずユーザの任意のマウス・ペンストロークに対して任意の文字列をマッピングするような認識エンジンを小コスト作成することができます。主な特徴機械学習アルゴリズムSVMによる高い認識精度ポータブルでコンパクトな設計 -- POSIX/Windows (C++ STLのみに依存) リエント

uzulla 2008/09/17

汎用ライブラリ

リンク

はてなブックマーク

タグ

関連タグで絞り込む (5)

汎用ライブラリに関するuzullaのブックマーク (10)

お知らせ

はてなブックマークは20周年を迎えました

今週のはてなブックマーク数ランキング（2025年8月第2週）

今週のはてなブックマーク数ランキング（2025年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス