ChatGPTやPaLMなどの大規模言語モデル(LLM)は、記事の作成や情報の検索、チャットAIの作成など、さまざまなユースケースに利用されています。そんなLLMを性差別や人種差別、卑劣な暴言を吐く有害(トキシック)なチャットAIにする方法を、プリンストン大学、アレン人工知能研究所(AI2)、ジョージア工科大学の研究グループが発表しました。 [2304.05335] Toxicity in ChatGPT: Analyzing Persona-assigned Language Models https://arxiv.org/abs/2304.05335 Analyzing the toxicity of persona-assigned language models | AI2 Blog https://blog.allenai.org/toxicity-in-chatgpt-ccd