[B! 量子化] xiangzeのブックマーク

xiangze id:xiangze

量子化に関するxiangzeのブックマーク (3)

大規模言語モデル (LLM)における低精度数値表現
2024年5月8日のHPC研究会で使用したスライドです。 https://www.ipsj.or.jp/kenkyukai/event/hpc194.html
xiangze 2024/05/15
LLM

量子化
リンク
Quantize Llama models with GGML and llama.cpp
xiangze 2023/11/01
LLM

quantization

量子化
リンク
【ローカルLLM】GPTQ-for-LLaMAによるモデルの量子化を試す｜Baku
Llama系モデルのGPTQ量子化＆推論に使用できるパッケージには、AutoGPTQの他に、GPTQ-for-LLaMaがある。最近はAutoGPTQへの機能集約が進み、高速推論に関してもExllamaが登場したので、GPTQ-for-LLaMAはあまり利用されなくなっている。ただ、量子化に関してはAutoGPTQよりGPTQ-for-LLaMAの方が手軽という噂を聞いたので、ちょっと試してみた。 ELYZA-japanese-Llama-2-7bで試すちょうど下記モデルがリリースされたので、試しにこちらをGPTQ化してみることにした（ELYZA-japanese-Llama-2-7b-instruct）。量子化パラメータ量子化パラメータについては、HuggingFaceのGPTQConfigやTheBloke氏のGPTQのモデルカードに分かりやすい解説がある。 GPTQ-for-L
xiangze 2023/11/01
LLM

quantization

量子化
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx