昨日 7/29 の「第6回「データ解析のための統計モデリング入門」読書会」は参加しなかったのだが、ニコ生で中継してくださっていたので後半を聞くことができた。 6.6章「割算値の統計モデリングはやめよう」では、タイトルの通り観測データ同士を割り算するなと話しているわけだが、読んでいていろいろ疑問に思うところがあり。 読書会中継でちょうど 6.6 章以降を担当された 0kayu さんの発表を聞くことができたのだが、気になっていたあたりは特に質疑でも話題にならず残念。 というわけで、誰かがツッコミを入れてくれることを期待して自分の疑問をここに書いておく。 「データ解析のための統計モデリング入門」6.6章では統計モデルに観測データ同士の割り算値を持ち込むことを批判している。その理由として、 比率にすることで元のスカラー値の情報が失われる 値それぞれが分布を持っている場合、それらの割り算値の分布がよ
![「データ解析のための統計モデリング入門」6.6章 割算値はなぜダメなのか? #みどりぼん - 木曜不足](https://cdn-ak-scissors.b.st-hatena.com/image/square/237aacb93988ff8967b95db25dbd42f97f9843a0/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fn%2Fn_shuyo%2F20140730%2F20140730145248.png)