スペシャルセッション音声A/音声B/電気音響[音によるシーン理解とその進展 I] ・あらゆる音の検出・識別を目指して―音響イベント検出研究の現在と未来―(NTT CS研・大石康智) さまざまな録音に対して、これまでは音声や音楽などの特別な信号を検出・識別することが多かったが、それ以外の雑音も含めてすべての音を認識する「音によるシーン理解」。ICASSPでの発表件数も徐々に増えている。 これまでの研究課題を「音の特定度」と「時間的参照範囲」を軸として整理する。特定度は、データベースの音との同一性基準(完全同一波形かどうか)で、時間的参照範囲はフレーム単位か長時間統計を使うか。これらの分類は音楽検索からの借用。 大分類として「同一音の検出・識別」「音響イベントの検出・識別」「音声・音楽の区間検出・識別」「音環境の検出・識別」の4つを認定。 同一音の検出は完全に同じ波形の検出。研究は少ないが、今