昨年10月にはtwitterのコンテンツの方をよく見てなかったんですが、 .jsonには 各々tweet(text、source)だけでなくユーザ( 言語、 source 、 フォロー数、フォロワー数、tweet数、お気に入り数 )なども直接見ることができるので、 と、いうことは どんなハードウェア使ってるユーザがどれだけツイートするのか、とか 複合条件下のリツイート傾向とか、も分かりますよ。 https://stream.twitter.com/1.1/statuses/sample.json このsample.jsonが本当に一様なサンプルであるのかはかなり疑問なのですが 2014/1/28〜1/31の間に時間開けてサンプリングしました。 たった10万tweetぐらいで 270MBにもなります。 ........... サンプルが本当に一様ならば、全tweetの内 24215/997