NTTは1日、話し声の自然さを保ちながらイントネーションを自在に調整できる新しい音声合成技術を開発したと発表した。標準語で話した録音データを大阪弁のような印象に変換したり、アナウンサーが話すような聞き取りやすい声に調整したりすることが可能。がんで声帯を摘出した人が使う電気式人工咽頭や、ロボットの音声合成機能などへの応用が期待される。 「高い」「低い」などと表現される声の周波数は、声帯を伸縮させる甲状軟骨の動きによって制御されている。今回の技術は、音声データを解析し、甲状軟骨がどう動いたかを数値化・グラフ化する計算手法を確立したことで実現した。パソコンでグラフの「山」の高さや位置を調整すれば、人それぞれの声の特徴を保ちながら、異なる印象の話し方に変換できる。 同技術を開発したNTTコミュニケーション科学基礎研究所の亀岡弘和特別研究員は「入力したテキストから、人間のような自然な話し声を合成する