CTranslate2でRinnaモデルをコンバートしてCPUや8GB GPUで動くようにする - きしだのHatena

テクノロジーカテゴリーの変更を依頼記事元:

nowokay.hatenablog.com

15 usersがブックマークコメント

コメント

2

記事へのコメント2件

注目コメント
新着コメント

misshiki “CTranslate2はTransformerモデルをCPUやGPUで効率的に動かすライブラリです。” インストールして動かすところまで説明。

2023/06/16 リンク

stealthinu CTranslate2でrinna-3.6Bをコンバートして動かすエントリ。CTranslate2で量子化するとCPUでも動く。

2023/06/15 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

CTranslate2でRinnaモデルをコンバートしてCPUや8GB GPUで動くようにする - きしだのHatena

CTranslate2はTransf ormerモデルをCPUやGPUで効率的に動かすライブラリです。 https://github.com/OpenN... CTranslate2はTransf ormerモデルをCPUやGPUで効率的に動かすライブラリです。 https://github.com/OpenNMT/CTranslate2 CTranslate2の機能のひとつにモデルの量子化があります。INT8で量子化すると雑に必要メモリが半分に。そしてCPUでも動かしやすくなるので、GPUなくてもLLMが試しやすくなります。まあ、INT8を使うだけだと、モデルの読み込み時のfrom_pretrainedにload_in_8bit=Trueをつければいいのだけど、これがbitsandbytesというライブラリを使ってて、そしてbitsandbytesがWindowsに対応していない。*1 一応、有志がビルドしたDLLを使えば動くのだけど、めんどい。 https://qiita.com/selllous/it ems/fbaa2c3d2d504e43

ブックマークしたユーザー

roogh5eeSha62023/06/19
lugecy2023/06/18
einherjar2023/06/16
misshiki2023/06/16
akiyoko2023/06/16
k12u2023/06/16
sakito09022023/06/16
stealthinu2023/06/15
baboocon198204192023/06/15

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx