タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

MFCCと音声認識に関するnukosukeのブックマーク (2)

  • LibROSA で MFCC(メル周波数ケプストラム係数)を算出して楽器の音色を分析 - Wizard Notes

    MFCC 算出の流れ この記事では、 音に関するデータ分析機械学習・深層学習で良く使われている MFCC*1 (メル周波数ケプストラム係数)という特徴量を使って、楽器の音色を分析できるかどうかを検証します。 MFCC とは? LibROSAを使ったMFCCの算出方法 1. 時間信号から直接算出 2. メルスペクトログラムから抽出 楽器音のデータ作成 MFCCの比較 MFCC-時間表現の比較 時間平均したMFCC係数の比較 まとめ 参考文献 補足(MFCCの闇?) DCTのTypeについて 正規化などのデータ整形処理の闇 パワー or 振幅 ? その他のパラメタ MFCC とは? MFCCは音声認識音楽ジャンル分類などで使われる特徴量であり、人間の聴覚特性を考慮した周波数スペクトルの概形(包絡線)を表しています。MFCCは楽器音に対しては音色に対応しており、音色が異なるとMFCCの形状は

    LibROSA で MFCC(メル周波数ケプストラム係数)を算出して楽器の音色を分析 - Wizard Notes
  • メル周波数ケプストラム(MFCC) - Miyazawa’s Pukiwiki

    スペクトラム(spectrum)とは † 音声や地震波などの周期性のある信号は、どれだけ複雑な信号であっても、単純な波に分解できる(フーリエの定理) 単純な波...単一の周波数と振幅をもつ正弦波、余弦波 上記の定理に従って、ある信号の周波数成分と振幅成分を抽出したものが周波数スペクトラム(スペクトル)です*1。 スペクトラムの求め方(MATLABによる説明) 以下のような複雑な波を考えます。 MATLABで上の波を生成するには、以下のコードを実行 Fs = 8820; % サンプリング周波数 8820Hz time = 0 : 1 / Fs : 0.05; sinwav_1 = 1.2 * sin(2 * pi * 130 * time); %振幅1.2、周波数130[Hz]の正弦波 coswav_1 = 0.9 * cos(2 * pi * 200 * time); %振幅0.9、周波数

  • 1