GitHub - openai/mle-bench: MLE-bench is a benchmark for measuring how well AI agents perform at machine learning engineering

テクノロジーカテゴリーの変更を依頼記事元:

github.com/openai

5users がブックマークコメント

コメント

2

記事へのコメント2件

注目コメント
新着コメント

arrowKato ML Agentを評価するためのベンチマーク。kaggleを使って評価するそうな

2024/10/18 リンク

misshiki “論文「MLE-Bench: 機械学習エンジニアリングにおける機械学習エージェントの評価」のコード。データセットの構築に使用したコード、評価ロジック、およびこのベンチマークで評価したエージェントを公開しました。”

2024/10/17 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

GitHub - openai/mle-bench: MLE-bench is a benchmark for measuring how well AI agents perform at machine learning engineering

You signed in with another tab or window. Reload to refresh your session. You signed out in anoth... You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

ブックマークしたユーザー

vegasus2025/04/13
yuiseki2025/02/23
arrowKato2024/10/18
misshiki2024/10/17

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx