東日本大震災が発生してから一ヶ月が経過しようとしています. そんななか, Twitter検索の@PENGUINANA_さんのご協力の下, 2011年3月5日から24日までのTwitterでつぶやかれた日本語のTweetのうち2億6688万9069Tweetを入手しました. 含まれているデータには, ・TweetID(1ツイート毎に割り当てられる唯一のID) ・ScreenName(ツイート当時の物) ・Contents(本文) ・Source(ツイート元) ・Time(ツイート時間) ・reply_to(Reply機能を使ったときのリプライ先TweetID) ・reply_to_sc(Replyを受けた人のScreenName) があります. 2011/4/8追記 各Tweetに含まれるハッシュタグと,はてなキーワードを抽出したメタデータもあります. また,@User関連のデータも作成予定