「Pythonで学ぶ音声合成」の Tacotron2 のメルスペクトログラム合成を LSTM から Transformer に改修した。 - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/toshiouchi

1user がブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

「Pythonで学ぶ音声合成」の Tacotron2 のメルスペクトログラム合成を LSTM から Transformer に改修した。 - Qiita

報告の概略今回の報告は、最終的な形ではなく、LSTM で行っていたことを Transf ormer で行うことが可能... 報告の概略今回の報告は、最終的な形ではなく、LSTM で行っていたことを Transf ormer で行うことが可能だったという第一報です。合成されたログメルスペクトログラムと development 用データを推論した音声とプログラムを掲載します。改修の動機音声認識において、「Python で学ぶ音声認識」(LSTMでの音声認識が解説されている）を勉強しながら、のページ（Transf ormer での音声認識）を勉強したり、OpenAI の Whisper のソース（Transf ormer での音声認識）を勉強していました。LSTM で行っていたことを Transf ormer に置き換えられそうだったので、音声合成の Tacotron2 (LSTM)のメルスペクトログラムの合成を Transf ormer でできないかという発想です。Transf ormer を用いているので、改修した

ブックマークしたユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx