2018/12/25 自然な音声を高速に合成可能な新手法を開発 ~古典的手法にニューラルネットワークを導入したニューラル・ソースフィルター・モデル~ 大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(NII、所長:喜連川 優、東京都千代田区)のコンテンツ科学研究系の特任研究員 シン ワン、特任助教 高木 信二(たかき・しんじ)、准教授 山岸 順一(やまぎし・じゅんいち)の研究チームは、高品質な音声を高速に合成する手法であるニューラル・ソースフィルター・モデル(以下、NSF法)を開発しました。この新手法は、1960年に発表された音声生成モデルを深層学習により発展させた新たな手法で、人間の肉声に近い高品質な音声波形を生成できるだけでなく、ニューラルネットワークの学習を安定して行えるのも特徴です。 背景 従来、音声波形を合成する手法として、ボコーダ法と呼ばれる手法が提案され、携帯電
![自然な音声を高速に合成可能な新手法を開発~古典的手法にニューラルネットワークを導入したニューラル・ソースフィルター・モデル~ - 国立情報学研究所 / National Institute of Informatics](https://cdn-ak-scissors.b.st-hatena.com/image/square/c6adaf590b1ca1f4919431e8bd6c4e779fc34dce/height=288;version=1;width=512/https%3A%2F%2Fwww.nii.ac.jp%2F_img%2Fogp.jpg)