Google Research、複数音から特定の発話者だけの声を聞こえるようにするDeep learningを用いた視聴覚音声分離モデル発表 2018-04-12 Google Researchは、Deep learningを用いて、複数の音から1人の音声だけを抜き出す視聴覚音声分離モデル「Looking to Listen at the Cocktail Party」を発表しました。 論文:Looking to Listen at the Cocktail Party: A Speaker-Independent Audio-Visual Model for Speech Separation 著者:Ariel Ephrat, Inbar Mosseri, Oran Lang, Tali Dekel, Kevin Wilson, Avinatan Hassidim, William T.
![Google Research、複数音から特定の発話者だけの声を聞こえるようにするDeep learningを用いた視聴覚音声分離モデル発表](https://cdn-ak-scissors.b.st-hatena.com/image/square/0ff591d85c5b5e2599a4725f5059647af863d924/height=288;version=1;width=512/https%3A%2F%2Fshiropen.com%2Fwp-content%2Fuploads%2F2018%2F04%2Fgoogle-1-357x186.png)