独立行政法人・産業技術総合研究所(産総研)は10月8日、動画を音声で検索できるサイト「VOISER」を公開した。独自の「ユニバーサル符号化技術」を活用。言語に依存せず、辞書不要の音声認識・検索技術を実装した。 ユニバーサル符号化技術とは、検索対象の音声と検索キーワードの音声をそれぞれ、音素より細かい単位「音素片」に分解・符号化し、それぞれをマッチングして高速に検索処理する仕組み。 従来の音声認識技術では、あらかじめ辞書登録した語しか検索できなかったが、ユニバーサル符号化技術なら辞書不要。新語や方言、外国語でも利用できる。辞書いらずのためシステムはコンパクトで、一般的なWebブラウザで利用できる。 サイトでは、産総研が保有している動画などを検索対象とし、音声やテキストで検索できる。ユーザーからの反応をもとに技術を改良。多方面から評価用コンテンツの提供を受けるなどして研究を進め、技術の実用化に