【ローカルLLM】llama.cppの量子化バリエーションを整理する｜Baku

テクノロジーカテゴリーの変更を依頼記事元:

note.com/bakushu

11 usersがブックマークコメント

コメント

2

記事へのコメント2件

注目コメント
新着コメント

stealthinu llama.cppにおける量子化の手法とbit数での品質低下度合い。この辺の技術を音声のほうに持って行けるだけの知識がない。

2023/08/30 リンク

endo_5501 これはありがたい

ai

2023/06/25 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

【ローカルLLM】llama.cppの量子化バリエーションを整理する｜Baku

「llama.cpp」はMacBookなどでLlamaベースの大規模言語モデルを動かすことを目標とするアプリケーション... 「llama.cpp」はMacBookなどでLlamaベースの大規模言語モデルを動かすことを目標とするアプリケーション。一応CPUのみでも実行でき、GPUの非力な環境でも動かしやすい。 llama.cppの量子化モデルllama.cpp(GGML)では量子化によるモデルサイズ縮小が進んでいる。例えば、下記のHuggingFaceのRepoを見ると、GGML量子化モデルは「q4_0, q4_1, q5_0, q5_1, q8_0, q2_K, q3_K_S, q3_K_M, q3_K_L, q4_K_S, q4_K_M, q5_K_S, q5_K_M, q6_K」と多岐にわたる。 Model cardに解説があるものの、専門的で素人にはサイズ以外の違いが分からない。もう少しやさしい説明がないか調べたところ、llama.cppの"quantize"コマンド内に整理されていると知ったので、和訳し

LLM
AI

ブックマークしたユーザー

Gln2024/05/04
obaratch2024/03/21
echigoya32024/02/03
stealthinu2023/08/30
tana0052023/08/16
roogh5eeSha62023/07/22
yuiseki2023/07/08
endo_55012023/06/25

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx