Hugging Faceを開いたら、Microsoftから登場したVibe Voice 1.5Bモデルがトレンドに上がってました。 気になって調べてみたところめっちゃすごかったので紹介 Vibe Voice 1.5Bの特徴 1. 長尺生成 最大90分、4人の異なる話者による自然な会話が可能とのこと 2. モデルの軽さ 1.5Bとのことで軽そーとは思いましたが、GPU積んだPCで全然動くようです。 VRAMが8GBあれば十分動かせそうです。(RTX3060以上であればOK) ベースモデルはQwen2.5 1.5bモデルです。 3. オープンソース MITライセンスでHugging Faceから無料で自由に利用可能! 4. 出力音声の品質 めちゃくちゃ自然で感情のこもった音声を出力してくれます。 従来のTTSモデルにありがちな棒読みではありません。 動かしてみる GitHubに動かすためのコー

