独立行政法人・産業技術総合研究所(産総研)は10月8日、動画を音声で検索できるサイト「VOISER」を公開した。独自の「ユニバーサル符号化技術」を活用。言語に依存せず、辞書不要の音声認識・検索技術を実装した。 ユニバーサル符号化技術とは、検索対象の音声と検索キーワードの音声をそれぞれ、音素より細かい単位「音素片」に分解・符号化し、それぞれをマッチングして高速に検索処理する仕組み。 従来の音声認識技術では、あらかじめ辞書登録した語しか検索できなかったが、ユニバーサル符号化技術なら辞書不要。新語や方言、外国語でも利用できる。辞書いらずのためシステムはコンパクトで、一般的なWebブラウザで利用できる。 サイトでは、産総研が保有している動画などを検索対象とし、音声やテキストで検索できる。ユーザーからの反応をもとに技術を改良。多方面から評価用コンテンツの提供を受けるなどして研究を進め、技術の実用化に
![声で動画検索 産総研が実証サイト](https://cdn-ak-scissors.b.st-hatena.com/image/square/a8686d8ee0def9a945f7e10f602c8bbda38cef9f/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fnews%2Farticles%2F0810%2F09%2Fyuo_sansoken.jpg)