TL;DR k-meansは計算が軽く、stacking用の特徴量生成なんかでも使える。 でもクラスタ数を決めるのが悩ましい。グリッドサーチ的なこともいいけど、どうやらクラスタ数を勝手に決めてくれるX-meansというものがあるらしいので試してみる。 また、K-meansの可視化でちらほら見かけるボロノイ図のPythonでの描画の仕方について試してみる。 まえおき 統計とか数学とか機械学習とかの専門家ではないので、勘違いやミスなどあるかもしれませんがご容赦ください(勉強目的の記事です) K-meansは計算が早く便利だけど・・ K-means自体はシンプルで計算が早く、またその値を別のシンプルなモデルでstackingさせることで、最終的なモデルをシンプルなものにして、ある程度の精度を維持しつつAPIなんかでの遂次での処理に役立てたりもできます。 教師無しでも扱えるという点も、使いやすいモ
