ブックマーク / zenn.dev/headwaters (1)

  • Microsoftから登場したVibeVoice凄すぎ

    Hugging Faceを開いたら、Microsoftから登場したVibe Voice 1.5Bモデルがトレンドに上がってました。 気になって調べてみたところめっちゃすごかったので紹介 Vibe Voice 1.5Bの特徴 1. 長尺生成 最大90分、4人の異なる話者による自然な会話が可能とのこと 2. モデルの軽さ 1.5Bとのことで軽そーとは思いましたが、GPU積んだPCで全然動くようです。 VRAMが8GBあれば十分動かせそうです。(RTX3060以上であればOK) ベースモデルはQwen2.5 1.5bモデルです。 3. オープンソース MITライセンスでHugging Faceから無料で自由に利用可能! 4. 出力音声の品質 めちゃくちゃ自然で感情のこもった音声を出力してくれます。 従来のTTSモデルにありがちな棒読みではありません。 動かしてみる GitHubに動かすためのコー

    Microsoftから登場したVibeVoice凄すぎ
    flatnote
    flatnote 2025/09/01
  • 1