パクころというWebサービスを公開していて、250favs以上のツイートが現時点で161万収集されている。 気付いたらかなり集まっていたので、量があれば単純な集計だけでも何か見えないだろうかと思い立ったので雑に調べてみることにした。 (何で単純な集計だけかというとちゃんとした統計手法的なものを知らないからです) 条件について 集計にあたり、パクころ/@pakurares等で使用しているデータベースより、500favs以上取得しているツイートのうち104万件をサンプルとした。ちなみに161万件全部読み込むとExcelの行数の限界(1048576)を超えてるので収まるように適当な量まで絞っている。妥協。 なお、ツイート情報しか収集していないので、ユーザ情報に絡めては何も調べられていない。正直そっちの観点の方が面白そうな結果が出そうな気もするんだけど、無いものはしょうがない。 サンプルの都合上、
![伸びてるツイート104万件分を調べた - メモ帳DPA](https://cdn-ak-scissors.b.st-hatena.com/image/square/c337c4da10b01d39949e271c200ceba1df168906/height=288;version=1;width=512/http%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fd%2Fde0%2F20160312%2F20160312230638.jpg)