タグ

クラスタリングとアルゴリズムに関するsimakawaのブックマーク (2)

  • クラスタリングの定番アルゴリズム「K-means法」をビジュアライズしてみた

    集合知プログラミング を読んでいたら、K-means 法(K平均法)の説明が出てきました。 K-means 法はクラスタリングを行うための定番のアルゴリズムらしいです。存在は知っていたんだけどいまいちピンときていなかったので、動作を理解するためにサンプルを作ってみました。 クリックすると1ステップずつ動かすことができます。クラスタの数や点の数を変更して、Restart を押すと好きなパラメータで試すことができます。 こうやって1ステップずつ確認しながら動かしてみると、意外に単純な仕組みなのが実感できました。 (追記) HTML5 版の K-means 法を D3.js でビジュアライズしてみた も作成しました。Flash を表示できない環境ではそちらをご覧ください。 K-means 法とは K平均法 - Wikipedia に詳しく書いてあるけど、もうすこしザックリと書くとこんなイメージに

    クラスタリングの定番アルゴリズム「K-means法」をビジュアライズしてみた
  • http://nakaikemi.com/clusterexp.htm

    階層的クラスター分析(Hiearchical Cluster Analysis) その2 ウォード法とは 色々な問題にクラスター分析を用いて解析してみると、比較的安定した解が得られる手法があります。それが、ウォード(Ward)法です。ウォード法は、二つのクラスターを結合する際に、「群内平方和の増加量」が最小になる二つのクラスターを一つにまとめるという手法です。 1.ウォード法の定式化 これを、まず数式で追いかけてみましょう。 いま、 をクラスター{ A } に属する i 番目の対象(クラスター{ A } 内に n個ある)の第 k変数(全部でp個ある)についての値とすればクラスター{ A } 内の平方和は

  • 1