Googleの人工知能開発部門の「DeepMind」が、状況や感情に応じてトーンや「間」などを使い分けて、まるで人間が話しているかのような自然な音声を出力する技術「WaveNet」を開発しました。すでに英語と中国語で、既存のテキストトゥスピーチ(TTS)技術を圧倒する品質を実現しています。 WaveNet: A Generative Model for Raw Audio | DeepMind https://deepmind.com/blog/wavenet-generative-model-raw-audio/ Google's DeepMind learns to reproduce human speech, tricks us into starting robot apocalypse http://www.neowin.net/news/googles-deepmind-le
![ディープラーニングで人間と同じトーン・スピード・抑揚を再現して自然な音声を出力する「WaveNet」をDeepMindが開発](https://cdn-ak-scissors.b.st-hatena.com/image/square/6f0358284b3e2f8dc498f0ff69d3750e92d37c34/height=288;version=1;width=512/https%3A%2F%2Fi.gzn.jp%2Fimg%2F2016%2F09%2F12%2Fwavenet%2F00_m.jpg)