エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント43件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
最新AIも沈黙 性能評価に人類未解決問題「携帯料金プラン」採用へ
生成AIの研究者らでつくる国際団体「AIAI」は3日、AIの性能を測る新しいベンチマーク「DAS... 生成AIの研究者らでつくる国際団体「AIAI」は3日、AIの性能を測る新しいベンチマーク「DASR」を発表した。携帯各社の通信料金プランを利用した指標で、「この難問が解ければ人類の敗北が確定する」と説明する。 AIの性能を測る指標は、25年初頭に発表された「人類最後の試験(Humanity's Last Exam、HLE)」がある。数学、自然科学、人文科学など2500問を統合した最難関試験で、発表当初の正答率は10%未満。しかし、わずか1年で正答率が50%近くまで向上したことから、HLEを超える難問が求められていた。 DASRは日本の携帯会社が発表する通信料金プランを比較して、利用者に最適なプランを提示する試験。通信プランを確定するには、「新規契約/乗り換え(MNP)/機種変更」「学生/シニアなど契約者の年齢」「加入期間」「一括/分割払い」「分割回数」「家族割引」「同一キャリアの家族人数」

































2026/03/04 リンク