neotagのブックマーク / 2022年3月28日

neotag id:neotag

2022年3月28日のブックマーク (1件)

遅延時間約0.32秒のリアルタイムボイスチェンジャーを作ってみた
2021年に音声合成の手法として提案されたVITS(Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech)を用いた低遅延リアルタイムボイスチェンジャーを作成しました。2022/01/30に行われた「OV2L EVOLVING SUMMIT 2022」にて「VITSを用いた低遅延REALTIME-VC」という題目で登壇した時のアーカイブを編集したものです。(最優秀賞頂きました！！)3月末～4月中旬くらいにはOSSの方も公開できそうな進捗になってきたので、改めて編集しました！3/26(土) リリース予定！！リリースしました > sm40230761・VITShttps://arxiv.org/abs/2106.06103・OV2L EVOLVING SUMMI
neotag 2022/03/28
リンク
- 2022年4月13日
- 2022年3月28日
- 2022年3月22日