宣伝 Style-Bert-VITS2のチュートリアル解説動画を作りました discordサーバー「AI声づくり研究会」によく出没しています 注意 (2024-02-05) この記事は、Bert-VITS2の日本語特化版が出る以前のものについて解説しています。最新の日本語特化版については をご参照ください。 概要 テキストから感情豊かで自然な抑揚の音声を生成できるBert-VITS2には、新しいバージョンでも 2.1 2.2 2.3(最終バージョン) の3バージョンがあります。 また、バージョン2.1をベースにし、感情スタイル指定をちゃんと動くようにしようとして私がリリースしたStyle-Bert-VITS2もあります: それぞれのバージョンによってモデル構造が異なっており、どちらが良いとは一概には言えません。つまり2.3が2.1より必ずしも優れているとは言えない(逆もまた然り)です。 こ
![(Style-)Bert-VITS2の仕組み・構造と、バージョンによる違いについて](https://cdn-ak-scissors.b.st-hatena.com/image/square/208128cfb4d7b8df6c48d74425fb4d08e7e50fe8/height=288;version=1;width=512/https%3A%2F%2Fres.cloudinary.com%2Fzenn%2Fimage%2Fupload%2Fs--GmWOjrYN--%2Fc_fit%252Cg_north_west%252Cl_text%3Anotosansjp-medium.otf_55%3A%2525EF%2525BC%252588Style-%252529Bert-VITS2%2525E3%252581%2525AE%2525E4%2525BB%252595%2525E7%2525B5%252584%2525E3%252581%2525BF%2525E3%252583%2525BB%2525E6%2525A7%25258B%2525E9%252580%2525A0%2525E3%252581%2525A8%2525E3%252580%252581%2525E3%252583%252590%2525E3%252583%2525BC%2525E3%252582%2525B8%2525E3%252583%2525A7%2525E3%252583%2525B3%2525E3%252581%2525AB%2525E3%252582%252588%2525E3%252582%25258B%2525E9%252581%252595%2525E3%252581%252584%2525E3%252581%2525AB%2525E3%252581%2525A4%2525E3%252581%252584%2525E3%252581%2525A6%252Cw_1010%252Cx_90%252Cy_100%2Fg_south_west%252Cl_text%3Anotosansjp-medium.otf_37%3Alitagin%252Cx_203%252Cy_121%2Fg_south_west%252Ch_90%252Cl_fetch%3AaHR0cHM6Ly9zdG9yYWdlLmdvb2dsZWFwaXMuY29tL3plbm4tdXNlci11cGxvYWQvYXZhdGFyLzhkNmVkNjBlYTQuanBlZw%3D%3D%252Cr_max%252Cw_90%252Cx_87%252Cy_95%2Fv1627283836%2Fdefault%2Fog-base-w1200-v2.png)