はじめに こんばんは。統計的声質変換(以降、簡単に声質変換と書きます)って面白いなーと思っているのですが、興味を持つ人が増えたらいいなと思い、今回は簡単なチュートリアルを書いてみます。間違っている箇所があれば、指摘してもらえると助かります。よろしくどうぞ。 前回の記事(統計的声質変換クッソムズすぎワロタ(実装の話) - LESS IS MORE)では変換部分のコードのみを貼りましたが、今回はすべてのコードを公開します。なので、記事内で示す声質変換の結果を、この記事を読んでいる方が再現することも可能です。対象読者は、特に初学者の方で、声質変換を始めたいけれど論文からコードに落とすにはハードルが高いし、コードを動かしながら仕組みを理解していきたい、という方を想定しています。役に立てば幸いです。 コード https://github.com/r9y9/VoiceConversion.jl Jul
![統計的声質変換クッソムズすぎワロタ(チュートリアル編) | LESS IS MORE](https://cdn-ak-scissors.b.st-hatena.com/image/square/30305c278f50a8a35b512fe1c5e02d0b2bf1fe04/height=288;version=1;width=512/https%3A%2F%2Fr9y9.github.io%2Fmedia%2Ficon_hu71488a41e9448d472219f1cc71ecc0ad_259818_512x512_fill_lanczos_center_3.png)