エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Google Colab + trl で SFT のQLoRAファインチューニングを試す|npaka
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Google Colab + trl で SFT のQLoRAファインチューニングを試す|npaka
「Google Colab」+「trl」で「SFT」のQLoRAファインチューニングを試したので、まとめました。 前回 1. ... 「Google Colab」+「trl」で「SFT」のQLoRAファインチューニングを試したので、まとめました。 前回 1. trl の SFTTrainer「trl」の「SFTTrainer」で「SFT」(Supervised Fine-tuning) のQLoRAファインチューニングを行います。「trl」は「artidoro/qlora」と比べて設定が多くて大変ですが、SFT後の「DPO」や「RLHF」などの追加学習も可能です。 3. SFTの実行ColabでのSFTの実行手順は、次のとおりです。 (1) Googleドライブのマウント。 # Googleドライブのマウント from google.colab import drive drive.mount("/content/drive")(2) 作業フォルダへの移動。 # 作業フォルダへの移動 !mkdir -p "/conten