OpenAIがChatGPTで稼働しているAIモデル「GPT-4o」の安全性テストの結果を2024年8月8日に公開しました。公開された情報によると、GPT-4oは「人間の政治思想に影響を与えるリスク」が中程度あると評価されているほか、「性的な言葉や暴力的な言葉の出力防止策」などが導入されているそうです。 GPT-4o System Card | OpenAI https://openai.com/index/gpt-4o-system-card/ GPT-4oの安全性評価は、100人以上の外部テスターからなる「レッドチーム」と協力して実施されました。レッドチームは開発段階のGPT-4oを使用し、「暴力的なコンテンツ」「性的なコンテンツ」「誤情報」「偏見」「根拠のない推論」「個人情報」などが出力されるかどうかをチェックしました。 レッドチームによるテストの結果、GPT-4oには「異常な音声を