
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Pythonで音声ファイル(モノラル・ステレオ両対応)のスペクトログラム描画 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Pythonで音声ファイル(モノラル・ステレオ両対応)のスペクトログラム描画 - Qiita
Pythonで音声ファイルのスペクトログラム描画をしてみました。とてもよくあるパターンではありますが、... Pythonで音声ファイルのスペクトログラム描画をしてみました。とてもよくあるパターンではありますが、モノラル・ステレオ両対応になっているのが特徴です。 後でも述べますが、スペクトログラム描画により、人間が話しているところと、無音もしくは人間の会話周波数と異なるノイズとを、一目瞭然で区別することが可能です。例えば、話者識別の教師データを作る場合など、スペクログラムを見ることで、やりやすくなるでしょう。 なお、音声分析にはlibrosaを使う場合も多いようです。 細かい説明はコードに書かれていますが、以下概要です。 pysoundfileでwaveファイルを読み込み 冒頭5分のみ切り出し(必須ではありませんが処理速度の関係で時間を短くしました) 高速フーリエ変換 7kHz未満の周波数のみ切り出し(人間の音声は3.4kHz未満がほとんどで、7kHz未満でも高音質) 音圧をdBに変換(相対dB)