[B! peft][lora] dannのブックマーク

dann id:dann

peftとloraに関するdannのブックマーク (5)

peft/README.md at main · huggingface/peft
dann 2023/05/26
peft

lora
リンク
GitHub - lich99/ChatGLM-finetune-LoRA: Code for fintune ChatGLM-6b using low-rank adaptation (LoRA)
dann 2023/05/26
lora

peft

accelerate

huggingface
リンク
ChatGLM-finetune-LoRA/train.py at main · lich99/ChatGLM-finetune-LoRA
dann 2023/05/26
lora

deepspeed

peft
リンク
rinnaとopen-calmをloraでJGLUEしてみた
はじめにここ数日間に日本語で学習させたLLMがいくつかでましたが、定量的に性能評価したい！ということで日本語LLMベンチマークライブラリのJGLUEを回してみました。ついでにloraに対応してなかったのでlora用のコードに修正。環境 AWS Ec2 p4dn.24xlage Deep Learning AMI GPU PyTorch 2.0.0 (Amazon Linux 2) 20230406 セットアップ適当なディレクトリを作成してJGLUEとtransf ormerをclone mkdir benchmark cd benchmark git clone https://github.com/yahoojapan/JGLUE.git git clone https://github.com/huggingface/transf ormers.git -b v4.9.2 tran
dann 2023/05/26
jglue

peft

lora

llm
リンク
大規模言語モデルの学習コードまとめ｜npaka
大規模言語モデルの学習コードをまとめました。 1. Alpacaの学習コード「LLaMA 」を標準の「HuggingFace Transf ormers」の学習コードをでファインチューニングを行います。「Transf ormers」はまだ「LLaMA」を公式サポートしてないため、特定のフォーク(68d640f7c368bcaaaecfc678f11908ebbd3d6176)を使用します。以下は、FSDP full_shard モードで 4つの A100 80G GPU を搭載したマシン上のデータセットで「LLaMA-7B」をファインチューニングするコマンドです。 torchrun --nproc_per_node=4 --master_port=<your_random_port> train.py \ --model_name_or_path <your_path_to_hf_conv
dann 2023/04/06
llm

fsdp

lora

peft
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx