ここで言う音声読み上げとは、名優が朗読したオーディオブックや、ボランティアが録音した視覚障がい者用の録音図書のことではありません。純電子的に行うテキストデータの音声読み上げ(TTS: Text to Speech)のことで、音声合成技術の応用です。 実は、皆様が使われている携帯電話の音声にも音声分析&合成技術が使われています。「電話の声は俺の声だ、合成音声なんかではない」というのも無理はありませんが、そのルーツは40年前に当時の電電公社の板倉さんの偏自己相関係数の研究成果が基になっています。残念ながら後から発表した米国研究者の線形予測法の名前の方が有名になって、日本の研究者の間では癪の種でした。 この技術、判り易く言うと、元の声から話者の喉の形と声帯の振動数を抽出することでデータ量を小さくし、それを伝送して逆に声帯の振動数と喉の形から合成して声にしています。携帯電話の音質が固定電話より