■ここ2か月ほど,SNSでは「ChatGPT-4のパフォーマンスが落ちているのではないか」というユーザーの声がよくあがっていた.GPT-4の性能低下については大幅な再設計が原因かとも噂されている.一方で,ChatGPTを運営しているOpenAI社のVP ProductであるWelinder氏は,GPT-4のパフォーマンス低下に対する憶測についてTwitterで反論しており,GPT-4の性能低下を否定,「逆に賢くなるように設計されている」と説明していた(ツイートはこちら). ■では実際に2023年の3月と6月で性能は変わったのかを検証した研究結果がarXivにpublishされた.結果は,想像以上にGPT-4の性能が低下していたというもので,とりわけ数学的問題の解決能力は97.6%から2.4%まで著しく落ちていた.一方で,GPT-3.5では数学的問題の解決能力は大幅に向上していた.センシティ