fujyaのブックマーク / 2015年8月12日

声優の声を分類してみた - Qiita

まだ終わらない。ここから手作業でコーナーの切り替わりシーンの部分とか、音楽流すコーナーとか、他の人の声が入ってる部分とかを手作業で削除していった。ただ、バックで小さな音楽が常に流れているのはもうどうしようもないので無視。このバックの音の影響を最小限、もしくは無くすにはどうすればいいんだろうか・・。とりあえず、これでデータ収集は完了！ 2.データから特徴量を抽出する周波数強度を特徴量にしたらいいんじゃない？高速フーリエ変換だ！となるが、オライリーから出てる実践機械学習システムにはそれよりメル周波数ケプストラム係数(MFCC)ってやつを使った方がいいよ！と書いてたので今回はそっちを使うことにする。色々見てみたところ、現在の音声認識ではMFCCが代表的な特徴量として用いられていて、人間の音声知覚の特徴を考慮してるらしい。しかし、MFCCにはピッチの情報が含まれないようだ。ケプス

はてなブックマーク

タグ

2015年8月12日のブックマーク (1件)

声優の声を分類してみた - Qiita

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス