タグ

Pythonとclusteringに関するbabydaemonsのブックマーク (2)

  • xmeansの弱点 - Qiita

    はじめに 非階層クラスタリングの一つにxmeansという手法があります。xmeansとはkmeansを拡張した手法であり、クラスタ数をBIC(ベイズ情報量規準)を用いて自動的に決定してくれます。今回は会社での業務を通じて、xmeansの弱点を発見したので記事にしようと思います。 なお、xmeansについては以下の記事を参考にしました。 x-meansの使い方 クラスタ数を自動推定するX-means法を調べてみた Xmeansの弱点 xmeans実行 xmeansを用いたときに生じた問題を再現するため、以下のようにシミュレーションデータを作成します。ポイントは 60個の要素をもつベクトル $z$ の最初の20個が $0$ であることです。 #基礎計算系のライブラリ import numpy as np from scipy import stats #クラスタリングに用いるライブラリ fro

    xmeansの弱点 - Qiita
  • Pythonでx-means法を実装した - WEB SALAD

    はじめに 最近、このままだと修士論文がすごくシンプルな内容になりそうなことに気づいたので、ページ数を稼ぐためによりよい示唆を得るために、何か分析を足す必要が出てきました。 色々考えた結果、x-means法によるクラスタリングを行うことにしたのですが、同手法のPythonによる実装が見つからなかったので、勉強も兼ねて自分で書くことにしました。 x-means法とは x-means法はk-means法を拡張したものであり、後者が実行時にあらかじめクラスタ数を指定しなければいけないのに対し、最適なクラスタ数を自動で推定できる点が優れています。 その基となるアイデアはPelleg and Moore(2000)で初めて提案されました。 今回は、これに改良を加えた石岡(2000)の手法を実装しました。 実装 肝心のコードですが、ここに掲載するには少し長いので、Gistに上げておきました。 Impl

    Pythonでx-means法を実装した - WEB SALAD
  • 1