NHK放送技術研究所では、AI(人工知能)を活用して、より流暢で自然な発声を実現する新たな音声合成技術1)を開発しました。 これまで日本語の音声合成方式では、「漢字仮名交じり文」をそのまま入力データとしても、漢字に複数の読み方が存在するためAIがうまく学習できないという課題がありました。 今回の開発では、「漢字仮名交じり文」から「仮名文字と韻律記号2)」を自動的に生成し、それを「系列変換モデル3)」の入力データとすることで大量のデータを効率的に学習させ、合成音声の品質を向上させることに成功しました。 また、仮名文字と韻律記号を簡単に編集できるユーザーインターフェースや、口調をニュース調や会話調などに切り替えられる技術も開発し、さまざまな番組の演出要件への対応も可能にしました。 今回の研究成果は、10月17日にBS1で放送した「ワールドニュース特集」で使用しました。今後も、より自然で使いやす
![【報道資料】新たな日本語音声合成システムを開発 ~原稿から変換した「仮名文字と韻律記号」をAI学習に用いる~](https://cdn-ak-scissors.b.st-hatena.com/image/square/d3eb4c4f3b8c5fd37f54b5d28f0a1b7a510eb841/height=288;version=1;width=512/https%3A%2F%2Fwww.nhk.or.jp%2Fstrl%2Fnews%2F2020%2Fimg%2F9_0.png)