VisualVoiceで音声を認識しているところ。左のウインドウは全文、右のウインドウはキーワードを自動的に抜き出したもの 6月27日発表 NECは、人間の会話音声を認識してテキスト変換する企業向けソフトウェア「VisualVoice」を発表した。9月より発売され、価格は400万円~。コンタクトセンターのオペレーター業務などに導入し、業務の改善を狙うもの。 従来の単語や定型文を認識させる方式と異なり、人間の自然な会話をそのままテキスト化することが可能。エンロール(事前登録)なしでも認識率は70~80%とし、会話音声の認識率では業界最高レベルという。また、発音の特徴を学習していくことで、さらに5~10%の精度向上も期待できる。 認識技術には、「木構造音響モデル」を採用。「あ」という発音1つに対して、さまざまな発音の“あ”を認識可能にすることで、多様な音声の認識を高精度で実現するという。また、