サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは本日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。
前置き 私はキーボード入力が早くないので、テキスト化が面倒だと感じる人間である。 一応、エンジニアの端くれとして、ある程度の入力速度はあるけれど、やはり口頭に比べれば圧倒的に遅いのである。 知り合いが、iPhoneの音声認識Mailを使っており、結構な精度で認識しており、「しゃべったらそのままテキストに」というのは結構現実的なのだなぁと実感した次第。 しかし、該当製品でも、誤入力、誤変換が多々あり、また話している間はパネルを触っていないと行けないということで、ちょっと不向きであった。 そこで他に何か方法がないか模索してみた。 結論 以下、長々と何を行ったか書くので、先に結論を申し上げるが、今回の手法では音声認識ソフトの認識率がいまいちだったので、実用化は難しいという結論に落ち着いた。 しかし、今後、ソフトの性能が上がる、あるいは代替可能な別のソフトで対応できるかも知れないので、今回の作業を
wav ファイル読めません。 環境 dictation-kit-v3.2-win julius-4.1.2-win32bin run_fast.bat .\bin\julius-4.1.2.exe -C fast.jconf fast.jconf 中の以下を書き換え、44,100kHz 16bit mono のwav ファイルを入力 -input rawfile すると・・・ Error: adin_file: sampling rate != 16000 (441000) Error: adin_file: error in parsing wav header at xxxx.wav Error: adni_file: failed to read speech data: "xxx.wav" と出力されます。 同キットで動作確認可能はwav ファイルサンプルを頂けませんでしょうか?
今月は更新めんどいなと思っていたのですが、下の動画見ていたらテンション上がってきたので頑張ります。 すごいですよね。ある意味これもインターフェースの一つだと思いますが、ある程度用途が決まっているものであれば、現在のAIでも結構面白いことができると思います。期待ですね。 ちなみに、Juliusが使われているのはスルーして、動画を見る限りOpen JTalkが予想以上に結構いい感じなので気になってます。僕もOpen JTalk突っ込みたいんですが、どう使うんだという話なので悩み中です。 JuliusLibとは 今日はJuliusLibをやります。 Julius自体の説明は前回したのでそれを見て頂くとして、JuliusLibは、前回コンパイルしたJuliusのコアの部分だけをライブラリ化したものです。 通常Juliusを使ってプログラミングすると、システムコールの関数を利用してコマンドを実行、と
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く