MMLUをアップデートしたベンチマーク『MMLU-Pro』Phi-3やLlama 3、Claude 3、GPT-4oなどの評価結果 | AIDB

テクノロジーカテゴリーの変更を依頼記事元:

ai-data-base.com

7 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

misshiki “参照論文情報タイトル：MMLU-Pro: A More Robust and Challenging Multi-Task Language Understanding Benchmark”

自然言語処理

2024/06/10 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

MMLUをアップデートしたベンチマーク『MMLU-Pro』Phi-3やLlama 3、Claude 3、GPT-4oなどの評価結果 | AIDB

参照論文情報タイトル：MMLU-Pro: A More Robust and Challenging Multi-Task Language Understanding ... 参照論文情報タイトル：MMLU-Pro: A More Robust and Challenging Multi-Task Language Understanding Benchmark 著者：Yubo Wang, Xueguang Ma, Ge Zhang, Yuansheng Ni, Abhranil Chandra, Shiguang Guo, Weiming Ren, Aaran Arulraj, Xuan He, Ziyan Jiang, Tianle Li, Max Ku, Kai Wang, Alex Zhuang, Rongqi Fan, Xiang Yue, Wenhu Chen 所属：University of Waterloo, University of Toronto, Carnegie Mellon University 背景 GPT-4、Claude、Ge

あとで読む

ブックマークしたユーザー

sumijk2024/06/16
triceratoppo2024/06/11
xmobile2024/06/10
misshiki2024/06/10
samurairodeo2024/06/10

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx