サクサク読めて、アプリ限定の機能も多数!
GPT-4がtrainでtestしている疑惑。学習データのカットオフ前後で競技プログラミングの成績が全然違うなど。データコンタミへの対策・モデル評価がずさんなのではないかという指摘。
xef のブックマーク 2023/03/22 17:54
GPT-4 and professional benchmarks: the wrong answer to the wrong question[MachineLearning]GPT-4がtrainでtestしている疑惑。学習データのカットオフ前後で競技プログラミングの成績が全然違うなど。データコンタミへの対策・モデル評価がずさんなのではないかという指摘。2023/03/22 17:54
このブックマークにはスターがありません。 最初のスターをつけてみよう!
www.aisnakeoil.com2023/03/21
OpenAI didn’t release much information about GPT-4 — not even the size of the model — but heavily emphasized its performance on professional licensing exams and other standardized tests. For instan...
7 人がブックマーク・3 件のコメント
\ コメントが サクサク読める アプリです /
GPT-4がtrainでtestしている疑惑。学習データのカットオフ前後で競技プログラミングの成績が全然違うなど。データコンタミへの対策・モデル評価がずさんなのではないかという指摘。
xef のブックマーク 2023/03/22 17:54
このブックマークにはスターがありません。
最初のスターをつけてみよう!
GPT-4 and professional benchmarks: the wrong answer to the wrong question
www.aisnakeoil.com2023/03/21
OpenAI didn’t release much information about GPT-4 — not even the size of the model — but heavily emphasized its performance on professional licensing exams and other standardized tests. For instan...
7 人がブックマーク・3 件のコメント
\ コメントが サクサク読める アプリです /