記事へのコメント5

    • 注目コメント
    • 新着コメント
    misshiki
    “これは、人間なら正答=理解と認められる最小限の問いに合格しても、LLMが本質的に異なる誤解を抱いている可能性を示している。”

    その他
    kei_1010
    人間にも似たような云々とか言ってAIを擁護してるやつは、AIと人間を混同してる。全く違うものだと理解できてない。あとLRMでも無理よ。https://kei-1010.hatenablog.com/entry/2025/06/06/151012

    その他
    quwachy
    LLMは原理的に無理だからLRMが生まれた、o3でテストしないと無意味

    その他
    eagleyama
    eagleyama そもそもフリをするだけの機械なのだが、理解とはなんなのだろ

    2025/07/09 リンク

    その他
    tanupig
    編集で40% の失敗率(potemkin rate)が確認された。これは、定義だけでは概念理解の深度を測れない可能性を示唆している。

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    ハルシネーション(事実誤認)より深刻なAIの「わかったふり」を暴く:MITなどが発見したLLMの“ポチョムキン理解”とは | Ledge.ai

    Top > 学術&研究 > ハルシネーション(事実誤認)より深刻なAIの「わかったふり」を暴く:MITなどが発...

    ブックマークしたユーザー

    • tamasaburou19822025/07/12 tamasaburou1982
    • misshiki2025/07/10 misshiki
    • birdsoutz2025/07/10 birdsoutz
    • masa8aurum2025/07/10 masa8aurum
    • aravow2025/07/10 aravow
    • kei_10102025/07/10 kei_1010
    • hiroki0512jp2025/07/10 hiroki0512jp
    • karasumoto2025/07/10 karasumoto
    • quwachy2025/07/10 quwachy
    • outstrip2025/07/10 outstrip
    • hillbert2025/07/10 hillbert
    • aoiyotsuba2025/07/10 aoiyotsuba
    • pewe2025/07/10 pewe
    • eagleyama2025/07/09 eagleyama
    • tkos-rg2025/07/09 tkos-rg
    • beachdance2025/07/09 beachdance
    • tanupig2025/07/09 tanupig
    • ET7772025/07/09 ET777
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事

    いま人気の記事 - 企業メディア

    企業メディアをもっと読む