「人間の子供が聞く量の単語」のみで大規模言語モデルを新たにトレーニングするチャレンジ「BabyLM Challenge」が開催中、誰でも挑戦可能

テクノロジーカテゴリーの変更を依頼記事元:

gigazine.net

37 usersがブックマークコメント

コメント

3

記事へのコメント3件

注目コメント
新着コメント

nanakoso 小量データで学習するには親や周りの人間とのダイアローグによるフィードバックが必須とかいう結論になりそう

2023/06/23 リンク

sippo_des 面白い試み。13才つくれる？

2023/06/03 リンク

in2 たのしそうだな。「13歳の子供が聞いてきた単語の量である1億語にデータ量を制限して言語モデルをトレーニングする」

2023/06/02 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

「人間の子供が聞く量の単語」のみで大規模言語モデルを新たにトレーニングするチャレンジ「BabyLM Challenge」が開催中、誰でも挑戦可能

チャットAIに用いられる大規模言語モデルの性能は、パラメーター数やトレーニングデータの量が増えるほ... チャットAIに用いられる大規模言語モデルの性能は、パラメーター数やトレーニングデータの量が増えるほど上昇するというのが通説ですが、この通説に反して「少ないデータ量で高性能な言語モデルを作成する」というチャレンジ「BabyLM Challenge」が開催されています。 babylm.github.io https://babylm.github.io/ 大規模言語モデルの作成においては、一番最初に事前学習と呼ばれる工程があります。事前学習では文章を入力して続く単語を当てるというトレーニングが行われ、大規模言語モデルはこのトレーニングを通して文章を作成できるようになります。トレーニングに用いる単語の量は年々増加しており、2018年のBERTは30億語のデータでトレーニングされましたが、2019年のRoBERTaは300億語、2020年のGPT-3は2000億語、そして2022年のChinch

ブックマークしたユーザー

nanakoso2023/06/23
cu392023/06/22
tlo_oly2023/06/04
midas365452023/06/04
digitaltan2023/06/03
mesotaro2023/06/03
poad10102023/06/03
andsoatlast2023/06/03
rouiza20112023/06/03
k9805042023/06/03
sippo_des2023/06/03
imyutaro2023/06/03
kengo-yamashita2023/06/03
BuchuntaGo2023/06/02
morioka2023/06/02
katz19552023/06/02
shigiryou2023/06/02
Hiro_Matsuno2023/06/02

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx