気が付けば、ほぼ1年ぶりのネット系のネタになります。(大汗) あ、いや、別にインターネットから遠ざかっていたわけではないんですが・・・ というわけで、ログ解析の話でもたまにはしてみようかなと。 選択バイアスの罠の所でも書きましたが、データ分析をやる上での前提をきちっと理解しましょう的なお話です。 Yahoo!ニュースで紹介されたらCVRが1/3に ウェブサイトの内容にも依るのですが、大抵のサイトは通常のアクセス量というのが大体存在しています。(ブログとかニュースのサイトは一旦除く) ところが、そういうサイトがひょんなことでアクセス大爆発を起こすことがあります。 Yahoo!ニュースで採り上げられた!ら、そこ経由の人は平均PV1.01だとか 有名ブログで記事になったりとか はたまた、何かしらやっちゃって炎上したとか(これは言わなくていいか・汗) で、そうするとデータの母集団が全然違うものにな