音声認識技術は盛んに宣伝されているが、これまでのところ、触れ込み通りの威力を発揮していない。音声認識技術が本当に役立つものになるには、自然言語を解釈する能力の向上が必要だ。それが実現すれば、音声が多くのアプリケーションに統合され、われわれの情報アクセスのあり方は大きく変わるだろう。 先日、わたしは西海岸から飛行機で帰るとき、フライト状況を確認しようと思って航空会社の「音声認識対応」コールセンターに電話した。そして分かったのは、その「音声認識対応」応答システムのプロセスが、プッシュホンのボタンを押して発信するDTMF(dual-tone, multi-frequency)信号による応答システムと何ら変わらないということだった。電話をかけて最初にしなければならなかったのは、自分のフリクエントフライヤー番号を「口頭で伝える」こと。次のステップは「フライト情報」と言うか、数字の1を押すことだった。