「ナーフされている部分がある」ね。コスト削減を頑張っているからタスクによっては弱くなるものもあるだろう。

hiroshima_pothiroshima_pot のブックマーク 2025/08/12 14:43

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

GPT-5が4oよりナーフされてることを証明してみた|まはー

    いきなり結論まとめGPT-5とGPT-4oに同じ問題を100回ずつ投げ、4oのほうが正答率が高いという結果が出た(4o:98%、5:71%)。 つまりGPT-5はGPT-4oの上位互換ではない。劣化している部分は間違いなく存在する。 読...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう