はじめに 非階層クラスタリングの一つにxmeansという手法があります。xmeansとはkmeansを拡張した手法であり、クラスタ数をBIC(ベイズ情報量規準)を用いて自動的に決定してくれます。今回は会社での業務を通じて、xmeansの弱点を発見したので記事にしようと思います。 なお、xmeansについては以下の記事を参考にしました。 x-meansの使い方 クラスタ数を自動推定するX-means法を調べてみた Xmeansの弱点 xmeans実行 xmeansを用いたときに生じた問題を再現するため、以下のようにシミュレーションデータを作成します。ポイントは 60個の要素をもつベクトル $z$ の最初の20個が $0$ であることです。 #基礎計算系のライブラリ import numpy as np from scipy import stats #クラスタリングに用いるライブラリ fro
