SPTKの使い方 (5)(2012/8/1)の続き。 今回は、音声認識の特徴量としてよく使われるメル周波数ケプストラム係数 MFCC(2012/2/25)をSPTKで抽出してみました。使うコマンドは、mfccです*1。 x2x +sf < data.short| frame -l 640 -p 160 | \ mfcc -l 640 -f 16 -m 12 -n 20 -a 0.97 > data.mfcパラメータの意味は、 -l 640 フレーム長は640サンプル -f 16 サンプリング周波数は16kHz -m 12 MFCCの次元は12次元 -n 20 メルフィルタバンクのチャンネル数は20 -a 0.97 プリエンファシス係数は0.97 です。まあ、-lと-fと-m以外はデフォルトでいいかな?mfccコマンドには、-c 22(リフタリング係数)というオプションもあったのですが、これ