富士通研究所は3月31日、高品質で多彩な声を短期間で作成でき、利用シーンや利用環境に合わせたトーンで情報を伝える音声合成技術を開発したと発表した。 テキストを音声で読み上げる音声合成技術は、刻々と変化する交通情報の放送や、住民向けに地域の情報を放送する市町村防災行政無線、美術館・博物館の展示ガイダンス音声、電話による問い合わせに自動音声ガイダンスで応答する自動音声応答システム、カーナビをはじめとする組み込み端末の音声アプリケーションなど、幅広く利用されている。また、工場や作業現場などでは、ハンズフリーで作業を妨げないという利点から、音声で情報を通知するという使い方も始まっている。このような中、従来の音声合成技術はテキストを読み上げるだけだったが、利用シーンが広がるにつれ、多彩な声やトーンを自在に使い、表現力豊かにわかりやすく情報を伝える音声合成技術が望まれている。 従来の音声合成技術は、話