注意:このエントリは音声合成のことなどほとんど知らない人間が書いています。突っ込み歓迎。 さて、2009年現在の音声合成って基本的には「声の音波の加工と切り貼り」だ。それが原因で不自然さが際立ってる面がある。 日本語の音と音の繋がりの不自然さは、これで解消できる 結論から書くと 擬似喉を作ってそれに発声させれば良い ということ。 人間の発声に関わる肉体構造をモデル化し、発声の動作をソフトウェアでシミュレートできるようにする(これを『擬似喉』と呼ぶ*1) 音量、音程、発音、その他諸々のパラメタ指定を、擬似喉の制御信号へと変換するプログラムを作る 擬似喉が制御信号通りに動いた結果として音波(声)を発生させる わざわざ擬似喉の動作をシミュレートすることによって、ある音が次の音へと変化する際の、ほんの僅かな「音が変化していく部分」を余さず発声させることができる。 擬似喉の各筋力の収縮・弛緩速度の上

