“「LLM」の「LoRA」「RLHF」によるファインチューニング用のツールキット(PEFT、OpenChatKit、H2O、LLM、Studio、RWKVのColabノートブック、llm-foundary、trl、trlx、RL4ML、DeepSpeed、Chat)をまとめ”

misshikimisshiki のブックマーク 2023/05/15 14:49

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

LLM の LoRA / RLHF によるファインチューニング用のツールキットまとめ |npaka

    「LLM」の「LoRA」「RLHF」によるファインチューニング用のツールキットをまとめました。 1. PEFT「PEFT」は、モデルの全体のファインチューニングなしに、事前学習済みの言語モデルをさまざまな下流タスクに適応...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう