タグ

2024年1月31日のブックマーク (2件)

  • AIモデルのsafetensors形式とは何者か?ckptと比較しつつ解説する

    1,そもそもckpt形式のモデルファイルはどのようにデータを保存していたのかsafetensors形式はckpt形式の様々な欠点の改善を目的として作られたデータ保存方法であり、HuggingFaceが主導しています。 そのため、safetensorsの利点を説明するにはまず従来のckptで何がアカンかったのか、ckptのデータ保存方法から読み解く必要があります。 .ckpt拡張子とpickleの関係画像生成AI関連のモデルでよく目にする.ckptという拡張子は、「pickle」というPythonのモジュールを用いて直列化して保存されたデータに用いられる拡張子です。 データを直列化(バイト列に変換する)ことを「pickle化」・「ピクル化」と呼びます。 逆に、バイト列からデータを復元することを「非pickle化」「非ピクル化」といいます。 pickleモジュールを使って、例えば以下のようなP

    stealthinu
    stealthinu 2024/01/31
    safetensors形式知らんかった。ckptの安全な置き換え版なのね。
  • (Style-)Bert-VITS2の仕組み・構造と、バージョンによる違いについて

    宣伝 Style-Bert-VITS2のチュートリアル解説動画を作りました discordサーバー「AI声づくり研究会」によく出没しています 注意 (2024-02-05) この記事は、Bert-VITS2の日語特化版が出る以前のものについて解説しています。最新の日語特化版については をご参照ください。 概要 テキストから感情豊かで自然な抑揚の音声を生成できるBert-VITS2には、新しいバージョンでも 2.1 2.2 2.3(最終バージョン) の3バージョンがあります。 また、バージョン2.1をベースにし、感情スタイル指定をちゃんと動くようにしようとして私がリリースしたStyle-Bert-VITS2もあります: それぞれのバージョンによってモデル構造が異なっており、どちらが良いとは一概には言えません。つまり2.3が2.1より必ずしも優れているとは言えない(逆もまた然り)です。 こ

    (Style-)Bert-VITS2の仕組み・構造と、バージョンによる違いについて
    stealthinu
    stealthinu 2024/01/31
    Bert-VITS2のバージョン2.1~2.3の違いについてlitaginさんが説明してくれてるもの。