主成分分析 (principal components analysis)† 高次元のデータを,データの分散が最大になるように,低次元のデータに変換する方法.教師なしの次元削減の手法として最も一般的. p次元のデータベクトル \(\mathbf{x}_i\) を\(n\)個集めて, \(n\times p\)のデータ行列 \(X\) を生成. 平均ベクトルは \(\mathbf{\bar{x}}_i=(1/n)\sum_i^n \mathbf{x}_i\). \(\mathbf{1}_n\) を長さが \(n\) の1ベクトルとして,\(\tilde{X}=X - \mathbf{1}_n \mathbf{\bar{x}}^\top\). 共分散行列は \(S=\frac{1}{n}\tilde{X}^\top\tilde{X}\). 共分散行列を次式のように分解する. \[S=A \La