misshikiのブックマーク - はてなブックマーク

misshiki id:misshiki

ブックマーク / zenn.dev/kaeru39 (1)

ローカルLLMの推論速度を高速化する5つの手法と比較評価
目的ローカルLLMの推論速度を改善する手法がいくつか報告されています。今回は実際に報告されている5つの手法を実装して推論速度がどの程度改善するか確認します。推論処理の高速化手法 1. torch.compile 計算グラフを構築各演算をCPUやGPUのデバイスに特化した細かい命令に分解与えられた入力に対して上記の命令を呼び出して演算を効率化実装モデルを読み込んだ直後にtorch.compileを追加 model = AutoModelForCausalLM.from_pretrained( model_name, device_map="cuda", trust_remote_code=True, torch_dtype=torch.bfloat16, load_in_8bit=False, load_in_4bit=False, use_cache=False, ).eva
misshiki 2024/02/09
“ローカルLLMの推論速度を改善する5つの手法を紹介、実装し比較しました。”

PyTorch

自然言語処理
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx