米Microsoftは現地時間2016年10月18日、音声認識における重要な成果を達成したと発表した。会話における言葉を人間並みに認識するシステムの構築に成功したという。 同社の人工知能(AI)研究部門に所属する研究者とエンジニアのチームが10月17日に発表した論文によると、同チームが開発した音声認識システムは単語誤り率(WER)が5.9%となり、プロのトランスクリプショニスト(口述筆記者)と同等またはそれより少ない。 同社は9月に6.3%のWERを記録したと報告していたが、今回さらに精度を上げた。Microsoft最高音声科学責任者のXuedong Huang氏は「人間のレベルに達した。これは歴史的な快挙だ」と述べている。 高度な音声認識技術によって、消費者および企業向けプロダクトが大幅に進化することが期待される。例えば「Xbox」のような消費者向け娯楽デバイス、音声を文字に即時変換する