『「データ解析のための統計モデリング入門」6.6章 割算値はなぜダメなのか?』と言うエントリーが出ていて、タイトルにある署名の本の6.6章「割算値の統計モデリングはやめよう」に、タイトルの通りの疑問が呈されていた。 問題の本は生物系研究室の常識が詰まっているようなのだが、一般の統計利用ではやや窮屈な側面もあるようで、以前も離散データだから最小二乗法が使えないと言うような誤解を招いていた。今回の御題は統計モデルに観測データ同士の割り算値を持ち込めるかと言う事だが、大半のケースでは問題ないから気にするのはよそう。 「比率にすることで元のスカラー値の情報が失われる」と言うのは、計量モデルで何を見たいかと言う問題で、例えば男女比が学級崩壊を引き起こすかのような仮説を立てたら、観測データ同士の割り算値を持ち込まざるを得ない。経済系はもちろん、実験データの処理などでも見かける操作である。みんなガシガシ
![統計モデルに観測値と観測値の割り算値を入れても問題ない](https://cdn-ak-scissors.b.st-hatena.com/image/square/bfd8cb3180a6338d4dcbd80bf147f39a100c48bb/height=288;version=1;width=512/https%3A%2F%2F3.bp.blogspot.com%2F-s-tObgdu-Ao%2FUkEaEsjlwYI%2FAAAAAAAALsQ%2FpIb3lvqERdk%2Fw1200-h630-p-k-no-nu%2Flogistic%2Bregression.png)