Cosmopedia: how to create large-scale synthetic data for pre-training Large Language Models

テクノロジーカテゴリーの変更を依頼記事元:

huggingface.co

2 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Cosmopedia: how to create large-scale synthetic data for pre-training Large Language Models

We find less than 4 contaminated samples for MMLU, OpenBookQA and WinoGrande. Training stack We t... We find less than 4 contaminated samples for MMLU, OpenBookQA and WinoGrande. Training stack We trained a 1B LLM using Llama2 architecure on Cosmopedia to assess its quality: https://huggingface.co/HuggingFaceTB/cosmo-1b. We used datatrove library for data deduplication and tokenization, nanotron for model training, and lighteval for evaluation. The model performs better than TinyLlama 1.1B on ARC

ブックマークしたユーザー

deejayroka2024/03/26

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx