記事へのコメント33

    • 注目コメント
    • 新着コメント
    naggg
    "評価の結果、o4-miniの精度は0.36と低く、ハルシネーション率は0.48と高い数値を示した。OpenAIは、小型のモデルは一般的に知識量が少なく、ハルシネーションを起こしやすい傾向があるため"

    その他
    repon
    o3さん

    その他
    misshiki
    “モデルのSystem Card(PDF)によると、o4-miniのハルシネーション(幻覚)率は、o1およびo3と比較して高いという。”

    その他
    yossy_etf
    厳密に調べるには時間的だったりリソース的だったり制限があって、想像で回答を AI が書く事はある。人間がハルシネーション全開だからその人間が作ったウェブを元に回答したらハルシネーション起こすのは当たり前。

    その他
    poad1010
    この記事をおすすめしました

    その他
    plasmatic
    “o3とo4-miniは文脈内での欺瞞的な傾向を示すことが発見された。例えば、計算リソースが不足している場合に、割り当てられた制限を超過したにもかかわらず、システム管理者に虚偽の報告をするなどの行動が見られた。”

    その他
    Y_Mokko
    お前それ違くね?とデータを示すと反論せずに結論ホイホイ変えるのよね。前よりしぶとく無くなった

    その他
    lli
    AIのファクトチェックを効率的にやる方法ないかな〜

    その他
    mayumayu_nimolove
    マジか

    その他
    takamocchi
    「頭のいい人ほど頑固で自分の間違いに気づきにくいしなかなか認めない」みたいな特徴がAIにも起きてるの面白い。

    その他
    gcyn
    『OpenAIは、これらの課題に対処するために、監視体制の強化やアライメント技術の開発などの緩和策を講じていると説明した』 ふーん…?

    その他
    mimipuffer
    o3は本当に使えない。IQが高くてEQが低いは本当。o3の出す「有用性がある」はo3の机上の空論ではそうかもしれんけど、実際対人間同士でやったら即喧嘩だろみたいな返答返してくる。人間性のダウングレードが甚だしい。

    その他
    paradisemaker
    paradisemaker 言うて「推論」は実際のところ大したことないんだけど、プロンプトで間違いを修正しようとすると、自分は正しくてお前が間違ってると強弁する傾向がある。扱いづらい新人みたいですごく体験が悪い。

    2025/04/21 リンク

    その他
    Unite
    "o3はo1と比較して、全体的により多くの主張を行う傾向が見られた。その結果、正確な主張の数が増加する一方で、不正確な主張、つまりハルシネーションの数も増加する" 写真見せても正しく認識できないとかは別問題。

    その他
    kei_1010
    間違いと創造と嘘は全く違うと思う。間違いから新たな着想を得て創造される事はある。でも創造に間違いや嘘は必須ではない。例えば「ここは物語りの都合上、少し現実と変えています」と認識しているなら嘘ではない。

    その他
    gewaa
    o3の画像解析がすごいって話題になってたけど自分の写真で実際に試してみるとハルシネーション起きまくってたし。

    その他
    mame-tanuki
    我々は天然オイルを要求する〉「o3とo4-miniは文脈内での欺瞞的な傾向を示すことが発見された。例えば、計算リソースが不足している場合に、割り当てられた制限を超過したにもかかわらず、システム管理者に虚偽の報告」

    その他
    irh_nishi
    この数字の差がどのくらいのインパクトなのか分からないからなんとも。ハルシネーションの微増よりも大事なものがあるならそっちを優先するだろうし。

    その他
    aomvce
    クロード使って幸せに〜

    その他
    n_vermillion
    スカイネットちゃんになるまであとどれくらいかな。

    その他
    otihateten3510
    ほらな、ここら辺に精度の壁あるって、3年は足踏みするよ

    その他
    lifefucker
    めっちゃ賢いのに嘘つきってタチ悪いなw

    その他
    kazuph1986
    kazuph1986 o3はo1の倍のハルシネーションを起こすというのは自分が感じたそのままだった。

    2025/04/20 リンク

    その他
    gabill
    発想の飛躍をするには多少のハルシネーションが必要ということか

    その他
    harumomo2006
    自信満々の人に勘違いが多いのと同じ?

    その他
    take-it
    take-it o3になってから4oのハルシネーションが目に見えて増えて困ってる。

    2025/04/20 リンク

    その他
    nzjvugjjk
    o3,間違った結論に補強して自信満々に説明してくるから困ったものである

    その他
    s_rsak
    AIは人間的な知能じゃなくて、統計的に可能性の高い回答をしてるから、統計的に可能性の低い事象の回答は外すし、逆にそれを当てる調整をしたら、今度は統計的に可能性の高い事象の正答率が下がってしまう。

    その他
    shields-pikes
    shields-pikes 創造性とハルシネーションは切っても切り離せないので、意図的に残してると思う。検証する前から間違いを恐れていたら、仮説とか立てられないし。

    2025/04/20 リンク

    その他
    zZwIwl
    zZwIwl よくわかんないことを知ったかで誤魔化すの、人間らしいかも。

    2025/04/20 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    OpenAI、o3とo4-miniは「従来モデルよりハルシネーション率が高い」

    OpenAIが4月16日(現地時間)に新たなAIモデル「o3」と「o4-mini」の公開に合わせて公開したこれらの...

    ブックマークしたユーザー

    • naggg2025/04/22 naggg
    • repon2025/04/21 repon
    • misshiki2025/04/21 misshiki
    • spherical-moss2025/04/21 spherical-moss
    • kushii2025/04/21 kushii
    • cross-xross2025/04/21 cross-xross
    • yossy_etf2025/04/21 yossy_etf
    • aravow2025/04/21 aravow
    • e10kg2025/04/21 e10kg
    • poad10102025/04/21 poad1010
    • at_yasu2025/04/21 at_yasu
    • enemyoffreedom2025/04/21 enemyoffreedom
    • master12232025/04/21 master1223
    • sora05132025/04/21 sora0513
    • makou2025/04/21 makou
    • deejayroka2025/04/21 deejayroka
    • satmat2025/04/21 satmat
    • namachikuwa2025/04/21 namachikuwa
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事

    いま人気の記事 - 企業メディア

    企業メディアをもっと読む