■タスク Twitterの特定ハッシュタグに関するユーザ別呟き数を分析する。 ■背景 Twitterのハッシュタグ「#twnovel」(Twitter小説)が面白く、継続的にチェックしたり作品を呟いたりしています。 2009年11末時点で参加者約1600名、投稿約22000呟となっていますが、読んでいるうちに「呟き数ランキング」「呟き数別人数分布」などに興味が湧き分析してみたくなりました。 ■方法 以前紹介した幾つかの方法・ツールを組み合わせることで、色々な素材を整えます。 1.Twitterの特定ハッシュタグの呟きを一括取得する 2.STOT形式データをTSV形式に加工する 3.TSVの特定項目を抽出する 4.データリストの正規化を行う 以上で正規化されたユーザIDの並びデータが得られるので、次のツールによって呟き数を集計します。 5.ファイルを縦に集計 以上でユーザ別呟き数ランキング情