日本語に強い大規模言語モデル「Swallow」　産総研と東工大が公開　事前学習用の日本語データに工夫

テクノロジーカテゴリーの変更を依頼記事元:

www.itmedia.co.jp

37 usersがブックマークコメント

コメント

2

記事へのコメント2件

注目コメント
新着コメント

ookitasaburou “従来の日本語LLMの学習には「CC-100」「mC4」「OSCAR」などの既存のデータセットの日本語部分を使っていた。しかし、これにはWebページのHTMLをテキスト化する際のノイズが混入したり、最新の情報や知識を収録していなかっ

2023/12/21 リンク

hatebu_ai でも倫理観は高いんでしょう？（課金で倫理観フリーのモデル、開放してくれないものかしら）

2023/12/20 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

日本語に強い大規模言語モデル「Swallow」　産総研と東工大が公開　事前学習用の日本語データに工夫

産業技術総合研究所と東京工業大学の研究チームは12月19日、日本語に強い大規模言語モデル（LLM）「Swal... 産業技術総合研究所と東京工業大学の研究チームは12月19日、日本語に強い大規模言語モデル（LLM）「Swallow」を公開した。米Metaが開発したLLM「Llama 2シリーズ」をベースに日本語能力を改善させたもの。ライセンスは「LLAMA 2 Community License」で、研究や商業目的で利用できる。今回公開したのは、パラメータ数が70億（7B）、130億（13B）、700億（70B）のモデル3種類。Llama 2シリーズが持つ高い言語処理能力を維持しながら日本語能力を強化することを目指した。このため、AIモデルに日本語の文字や単語などの語彙を追加し、新たに開発した日本語データで継続事前学習（学習済みのLLMに対して追加で事前学習を行う手法で、異なる言語などで言語モデルを活用するときに使われる）を行った。結果、日本語に関するベンチマークデータで、全モデルがベースモデルより

ブックマークしたユーザー

sanko04082024/01/04
cot-not2023/12/27
zope2023/12/22
ookitasaburou2023/12/21
misshiki2023/12/21
poad10102023/12/21
andsoatlast2023/12/21
shion2142023/12/21
kasumigasekix2023/12/21
shodai2023/12/21
tcue2023/12/21
d-haru2023/12/21
hiroujin2023/12/21
marton2023/12/21
kerotan072023/12/20
roogh5eeSha62023/12/20
swingwings2023/12/20
funaki_naoto2023/12/20

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx