[B! MFCC] shikimihuaweiのブックマーク

shikimihuawei id:shikimihuawei

MFCCに関するshikimihuaweiのブックマーク (1)

音楽と機械学習前処理編 MFCC ~ メル周波数ケプストラム係数 - Qiita
# python import librosa x, fs = librosa.load('./hoge.wav', sr=44100) mfccs = librosa.feature.mfcc(x, sr=fs) print mfccs.shape # (n_mfcc, sr*duration/hop_length) # DCT したあとで取得する係数の次元(デフォルト20) , サンプリングレートxオーディオファイルの長さ（=全フレーム数）/ STFTスライドサイズ(デフォルト512) mfccs がいい感じの次元の ndarray になります。お急ぎでない方向け冒頭で述べたように、オーディオのデータを機械学習のロジックで扱いたいというモチベーションがあるわけですが、例えば俗に "CD音質" と呼ばれる音質で、リニアPCMという非圧縮の形式で1秒間録音した場合のデータサイズは CD
shikimihuawei 2020/02/26
窓関数

フーリエ変換

音声

fft

audio

MFCC
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx