日本語文字認識プログラムNHocrのソースコードを初公開しました (ver 0.16(beta))。Solaris SPARC/x86, Linux (x86_64)上で動作確認済みです。OCRopusからの呼び出しが可能です。文字行認識部がライブラリ化されており、自作プログラムからの利用も容易です。

というのを作ったので自己紹介します。 2月頃から、コンピュータでアニメ顔を検出&解析する方法をいろいろ試しつつ作っていて、その成果のひとつとして、無理やり出力したライブラリです。 はじめに はじめにざっとライブラリの紹介を書いて、あとのほうでは詳細な処理の話を僕の考えを超交えつつグダグだと書きたいと思います。 Imager::AnimeFaceでできること Imager::AnimeFaceは、画像に含まれるアニメキャラクター的な人物の顔の位置を検出し、さらに目や口など顔を構成する部品位置や大きさの推定、肌や髪の色の抽出を簡単に行うことができるライブラリです。 これらが可能になると、 画像から自動でいい感じのサムネイルを作成できる 動画から自動でいい感じのサムネイルを作成できる 自動的にぐぬぬ画像が作れる 自動的に全員の顔を○○にできる 顔ベースのローカル画像検索 など、最新鋭のソリューシ
tomoe-0.6.0をリリースしました。 tomoe-0.5.xからの変更点: 簡体字中国語辞書の追加 (Red Hatの技術者の方々の成果です。ありがとうございました) 日本語辞書の拡張(JIX 0208 第2水準のサポート) ロケールに基づいてデフォルト辞書を自動選択 ただし、現在のところjaとzh_CNのみで、それ以外のロケールで使用すると辞書が有効にならず、またオンデマンドでの辞書の変更も実装されていません。起動時にロケールをセットするようにして下さい。 $ LANG=ja uim-tomoe-gtk $ LANG=ja scim-tomoe libtomoe-gtk を tomoe-gtk に名称変更 tomoe_gtk_init() と tomoe_gtk_quit() を追加 互換性確保のためにtomoe_gtk_window_new()で自動的にtomoe_gtk_i
FSE(Face Sensing Engine)Ver.4は、人の顔をセンシングする技術で動画や静止画の利用価値を高めるソリューションを提供します。 独立行政法人 情報処理推進機構(略称 IPA)の主催する 『ソフトウェア・プロダクト・オブ・ザ・イヤー®2007』において グランプリを受賞しました。 ※ソフトウェア・プロダクト・オブ・ザ・イヤー®は、独立行政法人 情報処理推進機構(IPA)が、毎年優れたソフトウェア・プロダクトを表彰する制度です。 ※FSEの一部は、独立行政法人 情報処理推進機構(IPA)「2004年度次世代ソフトウェア開発事業」委託開発の成果です。 ※記載されている会社名、製品名は一般に各社の商標または登録商標です。 ページの先頭へ
芸術の秋にProcessingでスケッチプログラミングを始めてみよう:絵心がなくても簡単に絵が描けるProcessing(1)(1/3 ページ) アートやデザインのための“プログラミング” 読者の皆さんは「プログラミング」という用語や、それをすることに、どんなイメージを持っているでしょうか。仕事に使われるアプリケーションやWebサービスの開発の世界の「プログラミング」を考えてみると、多くの場合「実用性や効率が重んじられ、専門的な知識を持ったエンジニア/プログラマーが慎重に正確に行うもの」といったイメージではないかと思います。 しかし一方で、実用性ではなくスクリーンに表されるイメージや動きの美しさ、見るものを引き込むインタラクションのアイデアをプレゼンテーションする「プログラミング」の世界も存在します。エンジニアではなくアーティストやデザイナーが、驚きやインスピレーションを求めて大胆に「プロ
This domain may be for sale!
Windows MobileやZaurusなどのPDAで良く見かけるのが手書き文字認識エンジンだ。バーチャルキーボードやPDAの小さなキーボードで入力するよりも素早く入力ができるのが便利だ。 モデルの認識中 OCRも同様だが、入力された内容を読み取ってデジタルなデータに変換するというのは難しい技術だ。だがその部分だけオープンソース化すれば、みんなが手軽に利用できるようになる。 今回紹介するオープンソース・ソフトウェアはZinnia、手書き文字認識エンジンだ。 Zinniaはエンジンのみの提供で、認識の基準になるモデルなどは提供されていない。そしてそのエンジンは機械学習機能(アルゴリズムはSVM)が実装されており、利用していくうちに精度を高めることができる。 Python用テストスクリプト APIを公開しており、それを使うことでC/C++/Perl/Ruby/Pythonなどでもエンジンを利
音楽の世界はフィーリングによる部分は大きいと思っている。だが、音楽の世界に携わっている方にしてみれば、音楽の成り立ちや組み立て、組み合わせなどはきちんとした理論、言わば公式によって成り立っているのかも知れない。感性による部分も大きいだろうが、ロジック的な部分もありそうだ。 チャートのように変換ロジックを組み立てていく それを感じさせてくれるのがこのPure Dataだ。Pdという名前でも知られるこのオープンソース・ソフトウェアは音響合成をロジックに展開するソフトウェアだ。 Pure Dataはチャートのような画面に対してオブジェクトやメッセージ、数値、スライダ、ラジオなどを配置して線で結んでいくことで音声処理を可能にしている。フローチャート風なのがロジックな展開をみせてくれて面白い。 メインウィンドウ 主にMIDIや音声に対しての処理を行うのが目的のようだ。この分野ではMaxと呼ばれるソフ
Zinnia: 機械学習ベースのポータブルなオンライン手書き文字認識エンジン [日本語][英語] Zinniaは機械学習アルゴリズム SVM を用いたポータブルで汎用的な オンライン手書き文字認識エンジンです。Zinniaは組み込みの容易さと汎用性を高めるために、 文字のレンダリング機能は持っていません。Zinniaは文字のストローク情報を座標の連続として受け取り、 確からしい順にスコア付きでN文字の認識結果を返すだけに機能を限定しています。 また、認識エンジンは完全に機械学習ベースであるために、文字のみならずユーザの任意のマウス・ペンストロークに対して任意の文字列をマッピングするような認識エンジンを小コスト作成することができます。 主な特徴 機械学習アルゴリズムSVMによる高い認識精度 ポータブルでコンパクトな設計 -- POSIX/Windows (C++ STLのみに依存) リエント
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く