【Petals】3人で力を合わせてLlama-2-70bを動かす【Colab】 - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/simakihiro

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

【Petals】3人で力を合わせてLlama-2-70bを動かす【Colab】 - Qiita

はじめに今回の目標はこの巨大モデルLlama-2-70bを動かすことです。 700億パラメータということで、4bi... はじめに今回の目標はこの巨大モデルLlama-2-70bを動かすことです。 700億パラメータということで、4bit量子化をかけても40GB程度のVRAMが要求されます。残念ながらColabの無料枠には乗りきりません。今回はPetalsというOSSを使用することで、Colab上での実行を試みます。 Petalsとは簡単に説明すると、モデルをいくつかに分割し、複数のマシンでそれぞれの演算を担うことで、大規模なモデルでの推論を実現するというものです。現在ホストされているモデルは、こちらのHealth Monitorで確認することができ、誰でも利用することができます。サポートされているモデルとしては、BLOOM, LLaMA, Falconなどが挙げられ、どれもOSSとしては最大規模のパラメータを有します。ホストされているモデルで推論してみるまずはPetalsでホストされているモデ

ブックマークしたユーザー

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx