タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

機械学習と音声に関するxiangzeのブックマーク (3)

  • 微分可能な複素正弦波オシレータを用いて日本語5母音を近似させてみた - 備忘録

    はじめに 実装 実験 実験条件 実験結果 おわりに はじめに SNSにて、しゃをみん氏が興味深い記事をツイートされていた。 昨日書きました。 「コンピューターは遂に「音の高低」を理解した」と言えるほどの大きな進歩です。 【注目論文】Sinusoidal Frequency Estimation by Gradient Descent https://t.co/SbbNlZkdAW #Qiita @syao_mingより— しゃをみん (@syao_ming) November 13, 2022 上記の記事で紹介されている論文は、いわゆる複素正弦波オシレータが微分可能な形で定式化されることを示していた。 この「微分可能」なオシレータでは、元の波形を複素正弦波の重ね合わせで近似的に表現する。 そして各サンプル点において計算される波形の近似誤差に基づき、勾配降下法を利用してその誤差が小さくなるよ

    微分可能な複素正弦波オシレータを用いて日本語5母音を近似させてみた - 備忘録
  • 【注目論文】Sinusoidal Frequency Estimation by Gradient Descent - Qiita

    QMULのBen Hayes氏らが、勾配降下法で周波数推定を行う手法を論文で発表しました。ICASSP2023に投稿したそうです。 きわめてシンプルな手法なのですが、機械学習音声合成にとってはたいへん重要な成果だと思うので、紹介します。 論文リンク:Sinusoidal Frequency Estimation by Gradient Descent ソースコード:https://github.com/ben-hayes/sinusoidal-gradient-descent 背景:DDSPの限界 DDSP(Differentiable Digital Signal Processing)とは、微分可能な計算式を持つDSPモジュールをDNNに組み込んで機械学習をやる手法で、Google Magentaプロジェクトが最初に打ち出したアイデアです。 今ではもうDDSPシリーズと呼べるほど多様

    【注目論文】Sinusoidal Frequency Estimation by Gradient Descent - Qiita
  • 統計的声質変換の紹介 - nico-opendata

    nico-opendata niconicoでは、学術分野における技術発展への寄与を目的として、 研究者の方を対象に各種サービスのデータを公開しています。 ニコニコ動画コメント等データセット (株)ドワンゴ及び(有)未来検索ブラジルと国立情報学研究所が協力して研究者に提供しているデータセットです。 ニコニコ動画コメント等のデータが利用可能です。 利用申請フォーム※国立情報学研究所へリンクします ニコニコ大百科データ (株)ドワンゴ及び(有)未来検索ブラジルと国立情報学研究所が協力して研究者に提供しているデータセットです。 ニコニコ大百科のデータが利用可能です。 利用申請フォーム※国立情報学研究所へリンクします Nico-Illustデータセット Comicolorization: Semi-Automatic Manga Colorization Chie Furusawa*、Kazuyu

    統計的声質変換の紹介 - nico-opendata
  • 1