「速水 沙織 でし た イラク の 卒業 旅行 あなた に 仕官 と 愛 に 逆 に 、 根 も 果たし 、 のち の ホワイト ハウス に タテハ たち から ひとり で 。」 正しく認識できているのは4,5割程度でしょうか、お便り採用者の検出としては精度が苦しいです。他にラジオの喋りやお便り紹介部分を認識してみましたが結果はこれより少し悪い程度でした。 連続音声の認識には、音から単語を推定し、さらに前後の文章から尤もらしい候補を選んでいるようで、その為の音響モデルと言語モデルが必要になります。ディクテーションキットとWeb Juliusの違いはこのモデルが違いだと思われます。なお、ディクテーションキットには一般成人の音響モデルと書き言葉の汎用モデルが入っていますが、文節レベルではサンプルボイスを網羅できているようでした。 認識精度向上として文法、語彙をカスタマイズする方法がよく用いられ