サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
大谷翔平
shirowanisan.com
「シロワニさんのつくよみちゃんトークソフト」は「COEIROINK」として、UI付きのWindowsアプリケーションになりました。もしよければ「COEIROINK」をご利用いただければと思います。
Tacotron2はGoogle社が提案した「テキストから音声に変換するアルゴリズム」です。 論文発表は2017年。しかし、2020年11月現在でも、その生成音声は最高水準の品質です。 下記にその生成音声を載せておきます。肉声と違いがわからないかもしれません。 Tacotron2を使ってテキストを音声に変換する場合は「テキストからメルスペクトログラムへの変換」のあとに「メルスペクトログラムから音声への変換」を行います。 メルスペクトログラムとは、とてもざっくり説明すると声の設計図のようなものです。 Tacotron2は「テキストからメルスペクトログラムへの変換」のみを行います。 「メルスペクトログラムから音声への変換」は、Tacotron2の論文ではWaveNet、NVIDIA社のソースコードではWaveGlowというアルゴリズムを用いています。 WaveGlowは、WaveNetの処理を
このページを最初にブックマークしてみませんか?
『shirowanisan.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く