クラスタリング、クラスター分析と言えば、k-meansが有名です。しかし、予めクラス(分類)数を指定する必要があります。この対策として、分類数を自動で決定するアルゴリズムはいくつか存在していて、「x-means」,「g-means」,「Star Clustering」などがあります。 本記事では、「x-means」と「g-means」の雛形コードと実行結果の比較例を載せました。この2つは、pyclusteringをインストールすることで使用できます。 ■インストール方法 pipの場合 pip3 install pyclustering Anaconda環境下の場合 conda install -c conda-forge pyclustering ■分析に使用した例題データ scikit-learnに同梱されているワインデータセットを用いました。本来は、機械学習の分類用に用意されたデータセ
![Python 自動でクラス数を決定してクラスタリングする「x-means」と「g-means」 - PythonとVBAで世の中を便利にする](https://cdn-ak-scissors.b.st-hatena.com/image/square/1a7c8785592c536b163907b5e92ba0c6f1f9eab2/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2FH%2FHK29%2F20210503%2F20210503134734.png)