serihiroのブックマーク / 2024年9月3日

「ELYZA-japanese-Llama-2-70b」開発における、大規模モデル学習ノウハウの解説

はじめにこんにちは。ELYZAの研究開発チームのSam (@SamPassaglia)、佐々木 (@hikomimo)です。今年の3月に我々は、日本語に特化した700億パラメータの大規模言語モデル「ELYZA-japanese-Llama-2-70b」を開発し、日本語タスクにおいてグローバルモデルに比肩する性能を達成することに成功しました。この際の知見は、今年6月にリリースした「Llama-3-ELYZA-JP」にも活かされています。 700億ものパラメータを持つ大規模言語モデルを開発することは国内でも前例が少なく、開発を通して多くの学びがあった一方で、思わぬ対応に迫られる場面も少なくありませんでした。本記事では国内における大規模言語モデル開発のコミュニティに貢献するべく、「ELYZA-japanese-Llama-2-70b」の開発の過程で得られた知見を紹介いたします。取り組み

はてなブックマーク

タグ

2024年9月3日のブックマーク (2件)

https://mymc.jp/outpatientconsultation/covidtest/

「ELYZA-japanese-Llama-2-70b」開発における、大規模モデル学習ノウハウの解説

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス