この記事に書かれていること K-meansの説明 PythonによるK-meansアルゴリズムの実装 クラスタリングとは何か クラスタリングとは、ざっくり言うと分類対象の沢山のデータから、それらを適当に分別するルールを勝手に獲得することだそうです。 変な言い回しですね。 これは正しく無い表現かもしれませんが、クラスタリングとはデータを分類分けする事に重きを置いています。 この分類分けという言葉が厄介で、SupportVectorMachineやベイズ規則、NeuralNetwork等による識別も分類分けをする事が出来ます。 これらの手法とクラスタリングの違いは、プログラムに対し分類対象の正解を教えるかどうかだと思います。 SVM等は分類対象のデータの中から学習用のデータを選出し、そのデータとそのデータが所属するラベルを一緒に与えて学習します。これを教師あり学習と呼びます。 そして、学習用デ