llama-cpp-pythonを用いたllama2制御に必要なVRAMの調査 - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/youha

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

llama-cpp-pythonを用いたllama2制御に必要なVRAMの調査 - Qiita

はじめに llama2をローカルで使うために、llama.cppについて勉強中です。今回はlama.cppライブラリのPy... はじめに llama2をローカルで使うために、llama.cppについて勉強中です。今回はlama.cppライブラリのPythonバインディングを提供するパッケージであるllama-cpp-pythonを用いて、各モデルのGPU使用量を調査しようと思います。また、私の持っているGPUがRTX3060tiのメモリ容量が8GBなので、使用量が8GBに収まるGPUオフロード設定値を見つけたいと思います。環境 Google Colabratory (GPU: T4) 実際に試してみる基本はLangChainのチュートリアルをコピペして使いました。 1. GGML-llamaモデルのダウンロード # 7b ggml llama2 !wget -q -P ./models https://huggingface.co/TheBloke/Llama-2-7B-Chat-GGML/resolve/

ブックマークしたユーザー

roogh5eeSha62023/09/14

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx