エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
大容量データの音声認識(CNN)をCPU上でやった作業ログ【機械学習・ディープラーニング】 - アプリとサービスのすすめ
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
大容量データの音声認識(CNN)をCPU上でやった作業ログ【機械学習・ディープラーニング】 - アプリとサービスのすすめ
今回は音声認識のデータセット「ESC-50」をCNNで分類した。 特にこだわったのが、GPUでも普通にやったら... 今回は音声認識のデータセット「ESC-50」をCNNで分類した。 特にこだわったのが、GPUでも普通にやったらOOMエラーが出るくらいの大容量のデータセットを、kerasのfit_generatorメソッドを使ってCPU上でもできるようにしたこと。 あとは音声認識は触れたことなかったので、前処理から学習するまでの作業ログ。 目次 1.音声データセット(ESC-50) 2.音声データの水増し(Augmentation) 3.水増した音声データの保存と読み込み 4.データ前処理とCPU上で学習(CNN) 1.音声データセット(ESC-50) 今回は音声データセット「ESC-50」を使う。 ESC-50の音声は環境音・自然音からなる声を含まない音。 動物の鳴き声、雨の音、人間の咳、時計のアラーム、エンジン音など50クラス。それをCNNで分類してみる。 ファイル形式は拡張子が.wavの音声。サイト