wata_dのブックマーク / 2024年2月12日

v1.1 チューニング済みモデル・データ公開

目次はじめに LLM-jp-13B とはインストラクションチューニングデータセット入力プロンプト比較実験の設定ハイパーパラメータ学習評価 DPO データセット入力プロンプトハイパーパラメータ学習評価おわりにはじめに京都大学言語メディア研究室の児玉（個人ページ，X アカウント）です． LLM-jp では 2023年10月20日に LLM-jp-13B v1.0 を公開しました．当時事前学習済みモデルとチューニング済みモデルの両方を公開しましたが，チューニング済みモデルについては時間上の制約もあり，十分に性能を高めることができていませんでした．今回はインストラクションチューニングの設定の見直しや DPO (Direct Preference Optimization) の追加によって，性能を改善したチューニング済みモデル v1.1 とその際に使用したデータと

はてなブックマーク

タグ

2024年2月12日のブックマーク (1件)

v1.1 チューニング済みモデル・データ公開

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス