いまフェスで鹿児島に来ています*1。 先日の重回帰の記事の追記として、「相関のある変数を取り除くこと」を「交絡調整」という視点からさくっと語りなおしてみたいと思います。 (これから書くことはたぶん間違ってはないハズとは思うんですが、もし間違っていたら適宜ご指摘ください>識者の方々) 変数の追加による交絡の調整 例として、以下のような因果構造をもつ場合について考えていきます。 ここでYは目的変数、A、B、CはYに対して因果的影響をもつ変数となります。また、とりあえずCは観測されていない(統計解析の際に説明変数として入れない)とします。 ここでわれわれが興味があるのは「要因Aの結果Yに対する因果効果の大きさ」であるとしましょう。 ここでAを説明変数として単回帰すると、どうなるでしょうか。 この場合、要因AとBの間に擬似相関があるので: Aの単回帰係数 = AのYへの影響+AB間の擬似相関による