GGUFって結局どのサイズ選んだらいいの？？

テクノロジーカテゴリーの変更を依頼記事元:

zenn.dev/yuki127

6 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

sh2 量子化によるサイズ、精度の変化の調査と考察

llm

2024/08/03 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

GGUFって結局どのサイズ選んだらいいの？？

検証内容 llama.cppのGGUFフォーマットについて量子化サイズ、手法での精度の変化を確認する変換、量子... 検証内容 llama.cppのGGUFフォーマットについて量子化サイズ、手法での精度の変化を確認する変換、量子化にはb3369のReleaseを使用変換するモデルはtokyotech-llm/Llama-3-Swallow-8B-Instruct-v0.1 評価対象は次の84種類 Model CardのUsageに沿ってvllmで実行したfloat32(そのままをoriginal、system promptに日本語で回答する指示を加えたものをoriginal_ja) safetensors -> GGUFに変換したF32とF16のGGUF Q8_0からQ2_Kまでのimatrixを必要としない14種類の量子化GGUF Q6_KからIQ1_Sまでのimatrixを使用できるor必要とする22種類の量子化GGUF (4についてはimatrix作成のためのデータを3種類用意しそれぞれに22種

機械学習

ブックマークしたユーザー

sh22024/08/03
s_ryuuki2024/08/03

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx