合成変数ができるだけ多くの情報量を持つようにするため、データの散らばり具合(分散)に着目します。分散=情報量といえるからです。 平面で示すためにデータが2次元(2変量)の場合で考えてみましょう。 下図のようなデータがあった時、データの分散が最も大きくなる方向に軸をとり、これを第1主成分とします。第1主成分だけでは元のデータが持っていた情報をすべて表すことは不可能です。そこで、次に分散が大きくなる方向に軸を取り、これを第2主成分とします。第2主成分の軸は第1主成分の軸に直交します。第1主成分に関する2変量の重みは、それぞれcosθ,sinθとなり、第2主成分に関しては、-sinθ ,cosθとなります。