SPTKの使い方 (2)(2012/7/4)の続き。 今回は、SPTKマニュアルの2章のピッチ抽出(pitch extraction)を試してみます。ピッチとは声の高さのことで、基本周波数やF0とも呼ばれます*1。ピッチは、人間の発声におけるアクセント、イントネーション、感情表出などとも密接に関係しているため音声合成において非常に重要なパラメータになっています。 というわけでSPTKのピッチ抽出コマンドpitchを使って、音声からピッチを抽出してみました。 データの変換 使ったデータは、Galatea Talkに付属していたATR 503文の音声データです。本物は有料のようですが、同じテキストで再度録音し直して無償公開しているデータみたい。a01.adからj53.adまで503個のrawファイルが含まれています。 さっそく何て言っているのか確かめるためSPTKの使い方 (1)(2012/7