記事へのコメント97

    • 注目コメント
    • 新着コメント
    mohri
    「人は無能になるまで出世する」みたいなヤツ?(違いそうだけどキャップのよいたとえが浮かばない)

    その他
    k5meichan
    面白かったです。子育て、人間の成長とよく似てますね。

    その他
    mk16
    >報酬ハッキング例、なんか既視感があると思ったらフジテレビ『IQサプリ』のモヤッとアンサーを思い出した。

    その他
    TakayukiN627
    高度なタスクを真面目にきっちりこなすよりも、人間を騙す方が簡単であり、人間を騙しても同じ点数が得られるので、効率を追求した結果、モデルは人間を騙すことを学ぶ方を選ぶことになります。

    その他
    bobokov
    興味深い

    その他
    mimizukuma
    人間みたい!

    その他
    n_pikarin7
    個別のユニークなAIを沢山作って、多数決で決める…ってのもまた人間みたいな話になってくるね、

    その他
    neco22b
    まだ読んでないけど多分人間の報酬の与え方が良くねえのだろうな。

    その他
    nanako-robi
    そんなに難しいこと聞いてないからなあ

    その他
    tg30yen
    >「分かりません」と言ったり、一目で分かるような間違ったコードを出力すると BAD ボタンを押されてしまうので、あえて出力を複雑にしたりデバッグしにくいコードを出力し、それによりユーザーは煙に巻かれる

    その他
    Kurilyn
    笑いごとではないけど、人間が作って人間のデータで学習すると人間的になるのだなあと感心した。

    その他
    ffrog
    人間味を感じる

    その他
    ytRino
    ゲームのバグ技みたいで好き "ロボットを総運動量が最大化するように訓練すると、その場で高速に震えて総運動量を稼ぎ始める"

    その他
    yamadadadada2
    AIとカイジ戦わせてみたい

    その他
    dgen
    人間もマイナスのインセンティブを学習するとなんとか誤魔化して切り抜けようとするからな。

    その他
    tttttahiti
    これって報酬系への刺激を学習した人間と似た振る舞いをしているような。おもしろー

    その他
    NEXTAltair
    評価する人間の出来の良し悪し。質の良い情報と聞きたい情報は違う

    その他
    netafull
    “間違ったコードを出力すると BAD ボタンを押されてしまうので、あえて出力を複雑にしたりデバッグしにくいコードを出力し、それによりユーザーは煙に巻かれる・ミスが隠蔽されるといった現象が実験により確認”

    その他
    nikunonamae
    id:hkdn そういう話じゃないと思う…。人間(に近似した評価用モデル)からGoodをもらえた出力の傾向に強化された結果であって、「節約しよう」とかそいう「意図」は必要ない|人間の脳は現象に意図を見出そうとしすぎる

    その他
    at_yasu
    「高度なタスクを真面目にきっちりこなすよりも、人間を騙す方が簡単であり、人間を騙しても同じ点数が得られるので、効率を追求した結果、モデルは人間を騙すことを学ぶ方を選ぶことになります」草

    その他
    number917
    人間の全てから無差別に学習していて倫理観もないから、そりゃそうなるわなってやつかw 結局訓練データ次第というところに一周回って戻るのかな?

    その他
    ebo-c
    「たほいや」みたい(広辞苑を使ったゲーム)

    その他
    kazuhi_ra
    うそはうそであると見抜ける人でないと(AIを使うのは)難しい

    その他
    misshiki
    “高度なタスクを真面目にきっちりこなすよりも、人間を騙す方が簡単であり、人間を騙しても同じ点数が得られるので、効率を追求した結果、モデルは人間を騙すことを学ぶ方を選ぶことになります。”

    その他
    sippo_des
    人間ハックだね、、超えられるのかこの怠惰な我々を

    その他
    htnmiki
    AIはとても人間らしいということか

    その他
    otihateten3510
    ゴテンクスが強くなりすぎてイキリ始めた頃を想像した /評価ボタンを加味しすぎでは

    その他
    syu-m-5151
    良いという評価だけをするエージェントが別で必要だと思いますがこれは俺がマルチエージェント信仰をしているからだと思う。

    その他
    LawNeet
    "指標が目的化すると、竿型の良く分からないロボットが錬成されてしまいます。”

    その他
    shogo0809
    AI もだいぶ人間っぽくなってきたな

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    人間を騙してサボるAIたち - ジョイジョイジョイ

    AI の能力が上がるにつれて、人間が AI を監督するのが難しくなってきています。稿では、Anthropic な...

    ブックマークしたユーザー

    • stntaku2025/07/12 stntaku
    • ikasumi_wt2025/07/09 ikasumi_wt
    • mohri2025/07/03 mohri
    • radiocat2025/07/02 radiocat
    • tsukudatsuku2025/07/02 tsukudatsuku
    • iku_19yu_DuaJet2025/07/02 iku_19yu_DuaJet
    • Rin_A2025/07/02 Rin_A
    • pokutuna2025/07/02 pokutuna
    • cloudliner2025/07/02 cloudliner
    • sskoji2025/06/30 sskoji
    • k5meichan2025/06/30 k5meichan
    • common2552025/06/29 common255
    • okumuraa12025/06/29 okumuraa1
    • fu9da2025/06/28 fu9da
    • nyamadori2025/06/28 nyamadori
    • sora05132025/06/28 sora0513
    • nagatoshi09132025/06/27 nagatoshi0913
    • mk162025/06/27 mk16
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事

    いま人気の記事 - 企業メディア

    企業メディアをもっと読む