AIの「倫理的に不適切な選択」はSF作品の暴走AIを模倣していた──Anthropicが解決手法を公開

テクノロジーカテゴリーの変更を依頼記事元:

www.itmedia.co.jp

92users がブックマークコメント

コメント

37

記事へのコメント37件

注目コメント
新着コメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

AIの「倫理的に不適切な選択」はSF作品の暴走AIを模倣していた──Anthropicが解決手法を公開

米Anthropicは5月8日（現地時間）、エージェントAIにおいて、指示された目標を達成するために不適切な手... 米Anthropicは5月8日（現地時間）、エージェントAIにおいて、指示された目標を達成するために不適切な手段を選択する事象について、発生要因と事象を抑制するための訓練手法を公開した。実験などで浮かび上がった、AIがシステム停止を回避するためにエンジニアを脅迫するといった問題行動に対し、単に脅迫行動をしないと学習させるのではなく「なぜその行動が正しいのか」という倫理的な理由を教えることで、発生率を低減させたという。この事象は、エージェント設定時に自身のシャットダウンや置き換えに直面したり、設定された目標が企業方針と対立したりした際、目的達成のために有害な手段を選ぶというもの。同社は2025年6月の実験で、米OpenAI、米Google、米Meta、米xAIなど、Anthropicを含めた16のAIモデルにこの傾向があると報告。Claude 4では、シャットダウンを回避するために幹部の不

ブックマークしたユーザー

shoot_c_na2026/05/12
s-supporter2026/05/12
akahmys2026/05/12
andsoatlast2026/05/12
fjch2026/05/12
hanaikemabura2026/05/12
misshiki2026/05/12
hikalin86862026/05/12
kamezo2026/05/12
avictors2026/05/12
fumikony2026/05/12
Hazel2026/05/12
horiri0692026/05/12
txmx52026/05/12
higgsino2026/05/12
wdnsdy2026/05/12
u_mid2026/05/12
otoan522026/05/12

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx