前回の記事で,2020都知事選がツイッター上でどう扱われていたのかの概略を紹介しました. 今回は,都知事選関連のツイートをもう少し詳細に計算社会科学的視点から分析してみます. ツイートの分類分析に利用したデータは以下の通りです. 検索条件:「都知事」を含むツイート期間:2020年06月18日~2020年07月04日ツイート数:3,807,230オリジナルツイート数:546,781アカウント数:585,306都知事選関連ツイートの分類都知事選についてのツイートを集めたとはいえ,その内容は千差万別です. そこで,見通しをよくするためにこれらのツイートを内容ごとに分類してみたいと思います. 分類には自然言語処理の技術を使う場合も多いですが,ツイートは文字数が140文字と少ないため,必ずしも自然言語処理ではうまく処理できないことも多いのが欠点です. そこで,リツイートユーザに基づく分類手法を利用し