これまでも、SNSのささいな投稿(テキストや画像)を元に個人やその場所を特定する人々が存在していた。特に、炎上したケースでは多くの人が集まり、情報を元に特定作業を行うことがある。 この集団の情報収集・分析能力は驚異的だが、新しいLLMを利用することで、さらに効率的かつ簡単に情報の特定ができるのではないかとの指摘がある。特に最近のLLMの高度な推論能力を活用すれば、SNSのわずかな情報からも個人情報を容易に割り出せるようになるかもしれない。 この研究は、ユーザーのオンライン投稿をLLMに入力し、ユーザーが公開する意図を持たない私的な情報をどれだけ推測できるのかを検証している。検証には、最先端の9つの言語モデル(GPT-4、Claude 2、Llama 2など)を使用。実際のRedditのユーザープロフィールを基に、LLMが人々の個人情報(例:居住地、収入、性別)をどの程度効果的に推測できるか