このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。 X: @shiropen2 デンマークのコペンハーゲンIT大学とオールボー大学に所属する研究者らが発表した論文「Hacc-Man: An Arcade Game for Jailbreaking LLMs」は、大規模言語モデル(LLM)の脱獄(ジェイルブレーク)を体験できるアーケードゲームを提案した研究報告である。LLMに意図しない出力(悪意ある有害な情報や言葉など)を引き出させるゲームである。 「Hacc-Man」と呼ばれ、物理的なアーケード筐体として設置される他、オンラインでも誰でもプレイ可能。プレイヤーは6つの異なる「対戦相手」(チャレンジ)を選択できる。それぞれ
![LLMから“有害”を引き出すアーケードゲーム「ハックマン」 AIに卑劣な言葉を吐かせたら勝ち](https://cdn-ak-scissors.b.st-hatena.com/image/square/dde764045b5fb6dde18c1099ea2c76df10ca0ed2/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Faiplus%2Farticles%2F2407%2F05%2Fcover_news049.jpg)