LEIA: 言語間転移学習でLLMを賢くする新しい方法

テクノロジーカテゴリーの変更を依頼記事元:

zenn.dev/ikuyamada

33 usersがブックマークコメント

コメント

4

記事へのコメント4件

注目コメント
新着コメント

deejayroka “英語・日本語の2言語LLMであるSwallowの7Bと13Bのモデルに対してLEIAによる訓練を施して性能向上を行ったモデルを公開”

2024/04/26 リンク

misshiki “LEIA（Lightweight Entity-based Inter-language Adaptation）は、LLMが蓄えている英語の知識を他の言語から使えるようにする訓練を施すことで、英語以外の言語でのLLMの性能を向上させる新しい手法です。”

自然言語処理

2024/04/25 リンク

sh2 こうした手法でLlama 3が日本語上手になるとうれしい

llm

2024/04/25 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

LEIA: 言語間転移学習でLLMを賢くする新しい方法

Studio Ousiaと理化学研究所に所属している山田育矢です。この記事では、大規模言語モデル（LLM）の性... Studio Ousiaと理化学研究所に所属している山田育矢です。この記事では、大規模言語モデル（LLM）の性能を向上させる新しい方法であるLEIA（Lightweight Entity-based Inter-language Adaptation）を紹介します。 LLMは言語によって性能に顕著な差があり、訓練に使われるテキストが最も多い英語において特に性能が高い傾向があることが知られています。LEIAは、LLMが蓄えている英語の知識を他の言語から使えるようにする訓練を施すことで、英語以外の言語でのLLMの性能を向上させる新しい手法です。この度、英語・日本語の2言語LLMであるSwallowの7Bと13Bのモデルに対してLEIAによる訓練を施して性能向上を行ったモデルを公開します。ライセンスは、Swallowと同様のLlama 2 Community Licenseです。これらのモ

ブックマークしたユーザー

satojkovic2024/07/06
deejayroka2024/04/26
Cetus2024/04/25
keijak2024/04/25
akishin9992024/04/25
anieca11012024/04/25
toshikish2024/04/25
macro15972024/04/25
misshiki2024/04/25
cu392024/04/25
ducky199992024/04/25
kybernetes2024/04/25
triceratoppo2024/04/25
yojik2024/04/25
jack09092024/04/25
dhesusan46492024/04/25
natu3kan2024/04/25
lyiase2024/04/25

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx