日立製作所は2008年10月6日、大規模な録音データから任意のキーワードを含む音声を高速に検索する技術を開発したと発表した。合計で2000時間の音声・動画ファイルで任意のキーワードを検索すると、3秒で検索結果を表示できる。「従来は結果の表示までに十数秒~数十秒かかっていた。アルゴリズムの最適化などで大幅に短縮できた」(日立製作所中央研究所の神田直之氏)という。 検索結果を選択すると、キーワードが登場する数秒前から音声・動画を再生する。「コールセンターで蓄積している顧客対応の音声データの活用などに応用できる」(神田氏)。そのほか、企業内の情報共有、消費者向けのWebコンテンツ、教育コンテンツなどへの活用も想定しているという。実用化の時期は「数年後をメドとしている」(神田氏)。日立グループのシステムに組み込む形で商品化する計画だ。 今回発表した音声検索技術は(1)音素記号インデックスを利用した
![日立中央研、2000時間分の音声から任意の言葉を3秒で見つける検索技術を開発](https://cdn-ak-scissors.b.st-hatena.com/image/square/bed39b5962a5d552c95b6d796db8f55e72d32943/height=288;version=1;width=512/https%3A%2F%2Fxtech.nikkei.com%2Fimages%2Fn%2Fxtech%2F2020%2Fogp_nikkeixtech_hexagon.jpg%3F20220512)