ttsurumiのブックマーク - はてなブックマーク

ttsurumi id:ttsurumi

ブックマーク / qiita.com/1234224576 (1)

声優の声を分類してみた - Qiita
まだ終わらない。ここから手作業でコーナーの切り替わりシーンの部分とか、音楽流すコーナーとか、他の人の声が入ってる部分とかを手作業で削除していった。ただ、バックで小さな音楽が常に流れているのはもうどうしようもないので無視。このバックの音の影響を最小限、もしくは無くすにはどうすればいいんだろうか・・。とりあえず、これでデータ収集は完了！ 2.データから特徴量を抽出する周波数強度を特徴量にしたらいいんじゃない？高速フーリエ変換だ！となるが、オライリーから出てる実践機械学習システムにはそれよりメル周波数ケプストラム係数(MFCC)ってやつを使った方がいいよ！と書いてたので今回はそっちを使うことにする。色々見てみたところ、現在の音声認識ではMFCCが代表的な特徴量として用いられていて、人間の音声知覚の特徴を考慮してるらしい。しかし、MFCCにはピッチの情報が含まれないようだ。ケプス
ttsurumi 2015/08/12
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx