「AIアライメント」や「AIセーフティ」に関する会話で、まず最初に必ず躓くのが、これらの言葉の意味だ。「AI Alignment」「AI Safety」と聞いて何をイメージするかには、人によってものすごくばらつきがある。相手の頭に、どのような範囲の問題が浮かんでいるか、それを探るところから会話を始めなくてはいけない。 実際、これらの言葉は何を意味しているのだろうか。これらの用語・用例の出自にさかのぼっても、あまり役に立たないかもしれない。というのも、種々の思惑、ポジション取りのために、これらの言葉の意味はその都度変わってきたからだ(そのあたりの事情の一端は、Center for AI Safety所長のDan Hendrycksさんが先日のWebinarで話してくれている)。 そこで本投稿では、言葉の歴史をいったん脇に置き、今現在の議論に集中したい。そのうえで、「AIアライメント/AIセー