多くの人が集うパーティー会場のような、たくさんの人が談笑している中でも自分の名前や興味のある話を自然と聞き取ることができる現象は「カクテルパーティー効果」と呼ばれ、人間が持つ能力「選択的注意」の代表例とされています。Googleの研究者は、ディープラーニングを用いることでコンピューターに自動で混ざり合った音声を分離する技術を習得させて、コンピューターにカクテルパーティー効果を身に付けさせることに成功しました。 [1804.03619] Looking to Listen at the Cocktail Party: A Speaker-Independent Audio-Visual Model for Speech Separation https://arxiv.org/abs/1804.03619 Research Blog: Looking to Listen: Audio-Vis
![「複数の音が混ざった音声から特定の1人の声だけを抜き出す技術」をディープラーニングを用いてGoogleが開発](https://cdn-ak-scissors.b.st-hatena.com/image/square/9381c82ab31aefdbc1febd9f47cc742af82e484b/height=288;version=1;width=512/https%3A%2F%2Fi.gzn.jp%2Fimg%2F2018%2F04%2F12%2Flooking-to-listen-google%2F00.jpg)