タグ

重回帰に関するstmsyのブックマーク (2)

  • 重回帰分析における多重共線性への対応 - Matsu Blog

    はじめに StatsModels(Python)で重回帰分析をしたところ以下のようなメッセージ(多重共線性の発生)が表示され困惑したため、そのとき調べたことをまとめてみました。 [2] The smallest eigenvalue is 7.16e-29. This might indicate that there are strong multicollinearity problems or that the design matrix is singular. 多重共線性(Multicollinearity)とは 重回帰分析などの多変量解析において、説明変数間に高い相関が認められる場合に発生する事象のこと 多重共線性が発生する具体的なケース ダミー変数を使用している場合 例えば、男女をダミー変数として扱う場合、説明変数として男0or1と女0or1という二つの項目を追加してしまうと

    重回帰分析における多重共線性への対応 - Matsu Blog
  • 多重共線性

    多変量解析 の手法では、YとXの 相関 の高さを調べようとします。 この時、X同士に相関がないと、すんなり解析できます。 しかし、 実験計画法 を使ったりして、意識して集めたデータでもない限り、 普通はX同士には相関があります。 解析に支障が出るほどX同士の相関が強い時に、「多重共線性(たじゅうきょうせんせい)がある。」、と言います。 多重共線性が大きな問題になるのは、データの背景( メタ知識 )を知らないで、 多変量解析 をする時が多いようです。 多重共線性の例と、チェックの方法 X同士の相関 多重共線性の一番簡単な形は、 2つのXの組についての 相関性 と同じです。 相関が非常に高い組合せがある場合は、多重共線性もあると言えます。 すべてのXの組合せについて、散布図や相関係数を見てみると、一番簡単な形の多重共線性はチェックできます。 この図は、Rのpsychを使っています。 ダミー変数

  • 1