IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.
最近、急に自分の周辺で非技術者の人から twitter の話題を聞くことが多くなりました。うーんツイッター流行ってきてるんだなー、じゃなんかネタスクリプトでも書いてみよっかな、、、と30秒ほど考えて「リアルにつぶやいた内容を音声認識してツイッターにポストするか」と思いつきました。 が、しかし、誰でも思いつくことは同じで、あちこちで似たような事をしている人がいたので、やっぱやめるかと思ったものの、クリスマスで暇だし、Mac OSX上でやってる人は見つけられないしで、勢いで音声入力システムの Julius を利用したツイッター投稿スクリプト書いてみました。ちなみに環境は、Mac OSX 10.5.8 + ruby 1.8.7 です。 音声認識システム Julius のインストール まず Julius の cvs から最新のソースをダウンロードしてコンパイル&インストールします。インストール先は
今回はOpengazerのデベロッパ用情報をお送りする予定でしたが、OpengazerのREADMEに書いてある以上の情報を探ってないので(=そのへんソース読みしてないので)、それは必要になったらやることにします。 ここしばらくは、Juliusのほうをやってました。 今日は、Juliusの説明とか、Mac OS X 10.6での使い方とか、そのへんやります。 Juliusとは Juliusは、フリーな音声認識システムです。 ざっくり開発者用に箇条書き説明をすると、 ・研究用と言われるが、ちゃんと設定して使えば十分実用レベル ・オープンソースで独自ライセンス(かなり緩いが作成物にライセンスの同梱が必須) ・一部フォーマットの録音物とリアルタイムでの認識が可能 ・自作ソフトウェアへの組み込み用に、コアがライブラリ形式で存在 ・中身は全部C言語 ・設定やカスタマイズ可能な項目膨大 という感じでし
Note that performance work on the HUB4 test is not complete Key: WER - Word error rate (%) (lower is better) RT - Real Time - Ratio of processing time to audio time - (lower is better) S3.3 RT - Results for a single or dual CPU configuration S4 RT(1) - Results on a single-CPU configuration S4 RT(2) - Results for a dual-CPU configuration This data was collected on a dual CPU UltraSPARC(R)-III runni
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く