NII、130億パラメータのLLM構築　コーパスなども全公開　「今後の研究に資するため」

テクノロジーカテゴリーの変更を依頼記事元:

www.itmedia.co.jp

50 usersがブックマークコメント

記事へのコメント3件

注目コメント
新着コメント

deejayroka “国立情報学研究所（NII）は10月20日、パラメータ数130億の大規模言語モデル（LLM）「LLM-jp-13B」を公開した。初期段階のモデルだが、アカデミアや産業界の研究開発に資するため、コーパスやツールなどを含めてすべてオー

2023/11/06 リンク

misshiki “国立情報学研究所（NII）は、パラメータ数130億の大規模言語モデル「LLM-jp-13B」を公開。初期段階のモデルだが、アカデミアや産業界の研究開発に資するため、コーパスやツールなどを含めてすべてオープンにする。"

2023/10/23 リンク

ys0000 データセットは元々のライセンスでツール類はapacheか。とても素晴らしい取り組みだ。

2023/10/21 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

NII、130億パラメータのLLM構築　コーパスなども全公開　「今後の研究に資するため」

国立情報学研究所（NII）は10月20日、パラメータ数130億の大規模言語モデル（LLM）「LLM-jp-13B」を公開... 国立情報学研究所（NII）は10月20日、パラメータ数130億の大規模言語モデル（LLM）「LLM-jp-13B」を公開した。初期段階のモデルだが、アカデミアや産業界の研究開発に資するため、コーパスやツールなどを含めてすべてオープンにする。公開したLLMの学習データ量は合計約3000億トークン。うち日本語は約1450億トークン（mC4／Wikipedia）、英語は約1450億トークン（The Pile／Wikipedia）、プログラムコード約100億トークン。計算資源としては、大学や研究機関が共同運営する仮想化環境・データ活用社会創成プラットフォーム「mdx」を12ノード活用。モデル構築にはMicrosoftのDeepSpeedを、モデル構築時の監視やログの保存には、モデル開発プラットフォームのWeights＆Biasesを利用した。 NIIが主宰するLLM勉強会（LLM-jp）で7月