いままで知らなかったのだが、常套手段らしい。 どういう時に役にたつか? 大目的 あるデータがあって、そのデータをクラスタリングしたい。(つまり、データをkmeasnで分離したい。) 問題どころ データの状況によっては、実数空間のままではうまく分離ができないことがある。 つまり、データの性質から望ましくない分離がなされてしまう(であろうとすでにわかっている) どう解決するか? あらかじめ、別の空間に射影しておき、その空間でクラスターに分離してしまえばよい。 つまり、PCAで新しい軸ではられる空間に射影しておき、その空間上でkmeansクラスタリングを行うのだ。 ちょっとした言い訳 自分はいままでPCAと言えば、「次元圧縮をするもの」と理解していたので、この使い方がはじめは理解できなかった。 でも、このページの主成分分析でも解説されているように、PCAには「データの特徴を表す新しい指標を見つけ