エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
WORLDの特徴量をcsvに出力してみた - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
WORLDの特徴量をcsvに出力してみた - Qiita
WORLDとは 音声分析変換合成システムの1つで,UTAUやCeVIOの音声分析の一部にもWORLDが使われているそ... WORLDとは 音声分析変換合成システムの1つで,UTAUやCeVIOの音声分析の一部にもWORLDが使われているそうです. 詳しい内容はこちらの論文を参照してください. https://pdfs.semanticscholar.org/560a/be3b4482335a93df309cb6a0185ccc3ebd8e.pdf?_ga=2.60932075.677969946.1566283448-268225603.1564207121 以下の3つの特徴量で構成されています. ■基本周波数(F0) 簡単に言えば「音の高さ」のことです. ■スペクトル包絡 人の声道特性のことですが,わかりやすく言うと「音色」のことです. ■非周期性指標 「音のかすれ具合」などのことです. それぞれの特徴量は5msごとに取得していきます. サンプリング数16kの音声を分析するときは以下の次元数を取得できます.