はじめに 多変量データは実世界の様々なところで現れる(e.g., 画像、音声、動画).これらの多変量データの多くは、データ自体がもつ次元 (e.g., ピクセル数)よりも小さい次元(自然画像の多様体的なやつ)で表現することができる. データから低次元の構造(低ランク行列)を取り出す代表的な方法として、PCAがある. しかし、実世界で観測されるデータには外れ値が含まれていることが多く、PCAはこの外れ値の影響を強く受けて低ランク行列を求めてしまうという性質がある. 外れ値にロバストに低ランク行列を推定する方法 (a.k.a., robust PCA)として、Principal Component Pursuitが提案されている. ここではPCPの簡単な説明と実装を行い、PCAと比較する. 低ランク行列 なんらかの低ランクな構造を持っている(日本語あやしい)多変量データは低ランクな行列とノイズ
![Robust PCA (Principlal Component Pursuit) の実装 - やったことの説明](https://cdn-ak-scissors.b.st-hatena.com/image/square/ef261eefa58b90404863f594052ef5f76b1d8a82/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fk%2Fksknw%2F20181117%2F20181117140940.png)