この記事は 『CRESCO Advent Calendar 2017』 1日目の記事です。 AIに対する過度な期待値を下げつつ、AIの精度向上に励んでいるウエサマこと井上 (祐)です。 本記事では、クラウド型音声認識サービスの認識精度について記述します。 音声認識の評価手法としてSWITCHBOARDデータセットを用いた、評価が代表的な手法となります。 このSWITCHBOARDデータセットは、電話にて交わされた2,400を超える英語による会話が含まれており、このデータセットに対する音声認識の誤り率5.5%が現在(2017/11月時点)の最高到達点となります。 逆に言うとほぼ95%は正解という事ですので、こう考えると人の聞き間違いの方が多いかもしれません。 (参考:”マイクロソフトの音声認識システム、「人と同等」レベルに到達“(ZDNet Japan 2017/8/24)) さて、このSW