こんにちは。林岳彦です。ggplot2を使いこなすシャレオツな若い人を見ると自分の老いを感じる今日このごろです。 さて。 今回は、「説明変数と誤差項に相関がある」とはどういうことか、について見ていきたいと思います。 経済学系の統計解析の本を読んでいると「内生性」という概念がよく出てきます(経済学系でない分野においては、「交絡」と呼ばれるものに実務上はおおむね対応する概念と言えます)。 この「内生性」の説明としては、例えば: 計量経済モデルにおいて、説明変数と誤差項との間に相関があるときに、内生性(endogeneity)があるという。このとき、説明変数は内生的(endogenous)であることになる。説明変数が内生的であれば、推定されたパラメータは一致推定量ではなくなり、推定値は統計学的に信頼されるものとはなりえない。 のように説明されます(内生性 - Wikipediaより引用*1。強調
![内生性・交絡 revisited:説明変数と残差と誤差の相関をのんびり眺めるの巻 - Take a Risk:林岳彦の研究メモ](https://cdn-ak-scissors.b.st-hatena.com/image/square/1243a98c627923d1334fe6eacfec0804bf62ebf5/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Ft%2Ftakehiko-i-hayashi%2F20170905%2F20170905064412.png)