判別分析に用いられる二つの尺度のうち、線形判別関数でない方がマハラノビス距離である。 ということで、調べてみたけどなんだか難しめな感じ。 マハラノビス距離 - Wikipedia でもそんなに難しくなかった。 マハラノビス距離とは データ分布の広がりを加味した距離のことです。 この辺がユークリッド距離との違いです。 前提条件 マハラノビス距離では、各グループのデータが正規分布に従って存在していると仮定します。 なので、正規分布に従わないデータについてはどうなるんでしょう?って感じですね。 求め方 データの平均との偏差の絶対値を標準偏差で割ります。 標準偏差で割ることで、分布の幅を考慮した距離が求まります。 ただし、これは一変数のときだけです。 マハラノビス距離の意味 マハラノビス距離が大きいということは、正規分布の中心付近から離れているということになります。 なので、マハラノビス距離が大き