統計学+εといいつつ、統計ネタを全然書いていないので このへんで少し統計解析に触れてみよう。 海外から見ている日本の様子は、 1に原発、2に原発、3、4がなくて、5にAKB48総選挙 という感じなのでこの総選挙の結果を予測してみる。 アイドルの人気は刻一刻と変化する時間の関数だ。 これはCDの売り上げや握手に並んだ人数といったもので測ることもできるが インターネットのトラフィック・データを用いると簡単に時系列にすることができる。 Google はこうしたデータを「Google トレンド」としてデータ化している。 例えば、今回の選挙の速報で上位5人に入ったアイドル達の 検索件数は以下のグラフのようになっている。 なお縦軸は、インターネットでの総検索件数に対する 該当キーワードの比率を数値化している。 グラフは前田敦子の平均が1となるように標準化されているが 標準化前のデータもダウンロードする