Google Colab + trl で SFT のQLoRAファインチューニングを試す｜npaka

テクノロジーカテゴリーの変更を依頼記事元:

note.com/npaka

5 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Google Colab + trl で SFT のQLoRAファインチューニングを試す｜npaka

「Google Colab」+「trl」で「SFT」のQLoRAファインチューニングを試したので、まとめました。前回 1. ... 「Google Colab」+「trl」で「SFT」のQLoRAファインチューニングを試したので、まとめました。前回 1. trl の SFTTrainer「trl」の「SFTTrainer」で「SFT」(Supervised Fine-tuning) のQLoRAファインチューニングを行います。「trl」は「artidoro/qlora」と比べて設定が多くて大変ですが、SFT後の「DPO」や「RLHF」などの追加学習も可能です。 3. SFTの実行ColabでのSFTの実行手順は、次のとおりです。 (1) Googleドライブのマウント。 # Googleドライブのマウント from google.colab import drive drive.mount("/content/drive")(2) 作業フォルダへの移動。 # 作業フォルダへの移動 !mkdir -p "/conten

ブックマークしたユーザー

yuiseki2023/09/07
tworks2023/08/20
roogh5eeSha62023/08/20
pokutuna2023/08/15

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx