v1.1 チューニング済みモデル・データ公開

テクノロジーカテゴリーの変更を依頼記事元:

llm-jp.nii.ac.jp

17 usersがブックマークコメント

コメント

2

記事へのコメント2件

注目コメント
新着コメント

echigoya3 以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。

2024/03/05 リンク

misshiki “インストラクションチューニングの設定の見直しや DPO (Direct Preference Optimization) の追加によって，性能を改善したチューニング済みモデル v1.1 とその際に使用したデータとコードを公開”

自然言語処理

2024/02/13 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

v1.1 チューニング済みモデル・データ公開

目次はじめに LLM-jp-13B とはインストラクションチューニングデータセット入力プロンプト比較実験... 目次はじめに LLM-jp-13B とはインストラクションチューニングデータセット入力プロンプト比較実験の設定ハイパーパラメータ学習評価 DPO データセット入力プロンプトハイパーパラメータ学習評価おわりにはじめに京都大学言語メディア研究室の児玉（個人ページ，X アカウント）です． LLM-jp では 2023年10月20日に LLM-jp-13B v1.0 を公開しました．当時事前学習済みモデルとチューニング済みモデルの両方を公開しましたが，チューニング済みモデルについては時間上の制約もあり，十分に性能を高めることができていませんでした．今回はインストラクションチューニングの設定の見直しや DPO (Direct Preference Optimization) の追加によって，性能を改善したチューニング済みモデル v1.1 とその際に使用したデータと

ブックマークしたユーザー

echigoya32024/03/05
misshiki2024/02/13
miurahiroshi2024/02/13
ledlizerd2024/02/12
ahir0ta2024/02/12
macro15972024/02/12
sek_1652024/02/12
wata_d2024/02/12
tyosuke20112024/02/12
dann2024/02/12
kybernetes2024/02/12
Unite2024/02/10

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx