タグ

機械学習と音声に関するshikimihuaweiのブックマーク (1)

  • 畳込みニューラルネットワークの基本技術を比較する ー音でもやってみたー - Qiita

    前回の投稿では、多くの皆様から「いいね」を頂きました。 この場を借りて御礼申し上げます。 前回は画像ファイルでしたが、音ファイルでもやってみたいと思います。 やりたいことは、音ファイルでどの技術が一番効果があるのか数値化します。 以下の流れでやっていきます。 (基CNN) → (3つの技術を追加していく) 基CNNに、3つの技術を追加しながら、分類精度の上昇幅を比較します。 コードはkerasで書いています。 画像ファイルと同じ結果になるのか? 乞うご期待! データのダウンロード 使うデータはESC-50です。 これは、人の音声や自然界の音を集めたデータで、50個のラベルが付与されています。 データの前処理 音の生データは波になっています。 import librosa import pandas as pd import os # define directories base_

    畳込みニューラルネットワークの基本技術を比較する ー音でもやってみたー - Qiita
  • 1