Q&A + RAG に特化したLLMをSFTで学習させ4bit量子化モデルを作り、GPT3.5以上の性能を7Bモデルで達成する - A Day in the Life

テクノロジーカテゴリーの変更を依頼記事元:

secon.dev

46 usersがブックマークコメント

コメント

5

記事へのコメント5件

注目コメント
新着コメント

knok 短いセンテンスを出すならそれぐらいのllmでいけるのか

2023/12/15 リンク

misshiki “Q&A + RAG タスクに特化した LLM を作ってみた。元モデルのLLMとしては、rinna社が公開している、youri7b-instruction を用いている。”

2023/12/15 リンク

sh2 これはすごい。GPU用意して試してみたい

llm

2023/12/15 リンク

sifue すごい。これは良い知見。

2023/12/15 リンク

ledsun “学習可能なSFTを使い、Q&A + RAG タスクで適切な回答ができるようなファインチューンを7BサイズのローカルLLMに対して行った。結果として、量子化したモデルで速度・精度共にご家庭のマシンでGPT3.5を超える性能を達成”

2023/12/15 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Q&A + RAG に特化したLLMをSFTで学習させ4bit量子化モデルを作り、GPT3.5以上の性能を7Bモデルで達成する - A Day in the Life

なお、評価に使ったコードはこちらの eval_xxx というコードである。 https://github.com/hotchpotch/yo... なお、評価に使ったコードはこちらの eval_xxx というコードである。 https://github.com/hotchpotch/youri-7b-stf-qa-context-jaqket/ Supervised Fine-tuning Trainer(SFT) を使った学習 STFは手軽な方法で指示に対して特定フォーマットの出力(Instruction Tuning)を学習させることができる方法である。学習のさせ方も簡単で、例えば ### 指示: 今日の天気は何ですか？ ### 入力: 本日は大雨ですね。 ### 応答: 大雨のような例文を用意する。例では「### 応答:」以降がうまく出力されるように学習して欲しいデータである。この時、例文と「### 応答:」だけ与えれば、よしなに学習してくれる。実際の学習時には、「応答:」以降を推論し、望ましい回答である「大雪」のtokenの

ブックマークしたユーザー

supermomonga2023/12/21
aoi_sora_siroi_tsuki2023/12/17
nihen2023/12/16
dhesusan46492023/12/16
yuiseki2023/12/16
varietygogo2023/12/16
nukosan5552023/12/16
tworks2023/12/16
aratapage2023/12/16
whitz2023/12/15
knok2023/12/15
bayaread2023/12/15
gfx2023/12/15
ita_872023/12/15
barlog2023/12/15
BioErrorLog2023/12/15
macro15972023/12/15
kns_12342023/12/15

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx