タグ

juliusに関するwakuworksのブックマーク (5)

  • 日本語連続音声認識エンジン"Julius"をAndroidで動作させる 3 - Tech-Sketch

    語連続音声認識エンジン"Julius"をAndroidで動作させるの連載3回目、最終回をお届けします。 第一回 と 第二回 で、Juliusを用いたAndroidでオフライン音声認識を行うアプリのJNIライブラリが生成できました。最終回の今回は、JNIを利用するJava側の実装について解説します。動作イメージは以下のようになります。 今回も少し?濃いですが、出てくるのはJavaコードだけなので大丈夫!タブンね? では、始めましょう! AndroidでJulius用に音声を録音する  Androidで音声を録音するためには、 MediaRecorder を用いる方法と AudioRecord を用いる方法の二種類が存在します。マイクから入力された音声を録音してファイル出力するだけならば、高レベルなAPIを提供するMediaRecorderを用いるほうが簡単です。出力ファイルのopen/c

  • Node.js で簡単に音声認識できるモジュールを作ってみた #nodefest - 凹みTips

    はじめに この記事は東京Node学園祭2012 アドベントカレンダーの 23 日目の記事です。 現在、オープンソースの大語彙連続音声認識エンジン Julius を利用して音声による家電操作を行なっているのですが、どんな言葉を認識させるかの文法をゴリゴリ書いたり、コールバックの処理を C++ でゴリゴリ書くのが大変だったので、これらを簡単に実現してくれる Node.js のモジュールをつくってみました。 WEB 関連の話題で扱われることの多い Node.js ですが、C++ でネイティブモジュールを作成することによる Node.js の可能性を感じてもらえれば、と思います。 出来るようになること 以下のように音声認識させる言葉を登録、その文言を Julius が解釈できる形式にコンパイルして、Julius インスタンスを生成、スタートするだけで音声認識が可能になります。 var Julius

    Node.js で簡単に音声認識できるモジュールを作ってみた #nodefest - 凹みTips
  • KURO-RSとJuliusで家電をコントロールしてみた

    起動時に組み込むため、/etc/modprobe.d/設定ファイルを作成してください。 面倒ならば、上記コマンドをrc.localにに追記でも可。 ※/dev/ttyUSBxの権限を一般ユーザでも書き込めるようにしておくと、一般ユーザでも操作できます。 今回は全部sudo使って作業しています。 ここでperl使ってかっこ良く書けばいいと思いますが、 すでに開発されている先人の知恵をお借りします。 作者に感謝して使います。 http://www.gcd.org/blog/2007/01/113/ そのまま上記サイトの内容を実施すれば使えるようになります。 ※実は、KURO-RSについては数年前から使用していますが、今見てみるとなぜか修正している場所があるため、もしかしたら上記のサイトのものでは動かない部分があるのかもしれません。 動かない場合は自分で修正してみてください。(自分の方はなんのた

    KURO-RSとJuliusで家電をコントロールしてみた
  • Saqoosha :: Flash だけで音声認識してみるテスト

    おんせいにんしきーっていうワードが聞こえてきたので、ちょっと時間あったので、オープンソースの Julius っていう音声認識エンジンを Alchemy つかって Flash に移植してみましたです。いちおう使えるレベルだけど、やっぱ遅いなー。まあ、死んでると思ってた Alchemy も Adobe が気で開発すすめるみたいなので、そのうちもっとましになるじゃろ。 Julius for Flash のテストこつら。 初期化おわるまでまつ。(辞書ファイルがでかい) PLAY で聞く、RECOGNIZE で認識テスト。 LOAD WAV FILE で任意の WAV ファイル認識させてみる。(16KHz 16bit モノラルしかダメ) さすがに NHK ニュースの認識率は高い。 ソース一式。(コンパイルするのはむずいかも) C/C++ で書いてあるライブラリでも、Flash には Alchemy

    Saqoosha :: Flash だけで音声認識してみるテスト
  • Julius on Mac OS X 10.6 - 僕の部屋の真ん中らへん

    今回はOpengazerのデベロッパ用情報をお送りする予定でしたが、OpengazerのREADMEに書いてある以上の情報を探ってないので(=そのへんソース読みしてないので)、それは必要になったらやることにします。 ここしばらくは、Juliusのほうをやってました。 今日は、Juliusの説明とか、Mac OS X 10.6での使い方とか、そのへんやります。 Juliusとは Juliusは、フリーな音声認識システムです。 ざっくり開発者用に箇条書き説明をすると、 ・研究用と言われるが、ちゃんと設定して使えば十分実用レベル ・オープンソースで独自ライセンス(かなり緩いが作成物にライセンスの同梱が必須) ・一部フォーマットの録音物とリアルタイムでの認識が可能 ・自作ソフトウェアへの組み込み用に、コアがライブラリ形式で存在 ・中身は全部C言語 ・設定やカスタマイズ可能な項目膨大 という感じでし

    Julius on Mac OS X 10.6 - 僕の部屋の真ん中らへん
  • 1