統計学が最強の学問である [単行本(ソフトカバー)] 著者:西内 啓 出版:ダイヤモンド社 ★★★★☆ ネットの世界には毎年バズワードが出て来て、去年から今年のそれはたぶん「ビッグデータ」だろう。その意味も知らないおじさんが、営業マンの「当社の**は超分散処理でビッグデータを100倍の速度で処理できまっせ」といったセールストークにつられて何億円もするシステムを入れてから、著者のところに「何に使えばいいんでしょうか?」ときいてくるそうだ。 著者は、データ量そのものには大した意味がないという。元のデータがいくらビッグでも、人間に理解できるデータ量はスモールなので、情報量をいかに圧縮するかがポイントだ。サンプル調査でも、正しくやればビッグデータとほとんど変わらない効果がある。10万のサンプルを1万増やしても、標準偏差は0.3%しか変わらない。問題はデータ量ではなく、「何を知るために調べるのか」と