3.特集:音声認識・合成と自然言語処理の研究開発動向 −人に優しいヒューマンインタフェース実現への課題− 情報通信ユニット 亘理 誠夫 3.1 はじめに 音声認識合成技術や自然言語処理技術は人が自然な形で機器を使用するための入出力技術として昔から研究されてきた。人が機器を使うためのヒューマンインタフェース技術としては、初期のコンピュータでは、テキストによるコマンド入力とコンピュータからのテキストによるメッセージ出力であった。その後、アイコン表示とマウスによる選択というグラフィカルなインタフェースとなった。また、コンピュータグラフィックスの進歩、画像・音声・オーディオなどマルチメディア処理の進歩により多彩なインタフェースが出現している。さらに、使い勝手のよさを向上させるため、画面のデザイン、多種多様な入力デバイスの研究も進められている。 しかし、依然として情報機器のヒューマンインタフェ
モバイルコンピュータの先駆けであるiPhoneを契機に、第2次UI革命とも呼ぶべき潮流が形成されつつある。人と情報機器の関わり方を規定するユーザーインタフェース(UI)は、1960年代に開発されたマウスやGUI(Graphical User Interface)によって劇的に変化したが、それが1980年代から1990年代にかけて定着して以降、今日まで基本的に変化していない。 しかしコモディティ化したPCに代わって、モバイル端末へと商品開発の重心が移行しつつある今、屋内の使用環境を想定した従来のGUIでは限界が見えている。これに対処するために、タッチパネルやペン入力、音声認識、自然言語処理など、これまで長い研究開発の歴史を持ちながら、あまり普及しなかった要素技術が、再び注目され、本格的に導入されようとしている。また、これらを土台にして、新しいUIとコンピューティングスタイルが模索されている。
2007年6月に米国で発売されたAppleの「iPhone」は、タッチパネルを用いた独特のユーザーインタフェース(UI)が大きな注目を集め、世界の携帯電話のUIにも大きな影響を与えた。2008年7月11日には、世界22カ国で「iPhone 3G」が発売され、日本でも熱狂とともに迎えられたのは記憶に新しい。iPhone3Gの国内での販売実績については、当初期待されたほどではないとの報道もあるが、その話題性や斬新な商品コンセプトは、少なくとも新しいケータイの在り方や方向性を示したことは間違いない。 こうした中、日本を始め世界各国で、従来の機種とは大きく異なるUIを採用した携帯電話が次々と登場している。まだ製品としての完成度は低く、お世辞にも使いやすい端末とは言えないが、キャリアやメーカー各社が、市場成熟化の打開策として、UIの進化に真剣に取り組み始めたのは確かだ。その引き金を引いたのは、iPh
米サンノゼ市で開催されているセマンティック関連技術のイベント「2009 Semantic Technology Conference」の基調講演で,米Siri, Inc.,Founder兼CTOのTom Gruber氏は,同社(同社のWebサイト)が開発中の「Siri」と呼ぶ「仮想アシスタント」技術を紹介した。米研究開発企業SRI International社が開発した技術に基づくSiriは,声認識によってユーザーの希望するタスクを判別するクライアント・ソフトとWebサービスから構成される。「Siriで最も重要な機能は,ユーザーの自然言語を理解して,希望するタスクを絞ること」(Gruber氏)。 Siriは,ユーザーが携帯電話機を使って,日常生活で頻繁に行う飛行機の到着時刻の確認やレストランの予約といったタスクを支援する。例えば,ユーザーがSiriのクライアント・ソフトに搭載した携帯電話機
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く