2021年に音声合成の手法として提案されたVITS(Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech)を用いた低遅延リアルタイムボイスチェンジャーを作成しました。2022/01/30に行われた「OV2L EVOLVING SUMMIT 2022」にて「VITSを用いた低遅延REALTIME-VC」という題目で登壇した時のアーカイブを編集したものです。(最優秀賞頂きました!!)3月末~4月中旬くらいにはOSSの方も公開できそうな進捗になってきたので、改めて編集しました!3/26(土) リリース予定!!リリースしました > sm40230761・VITShttps://arxiv.org/abs/2106.06103・OV2L EVOLVING SUMMI