タグ

ブックマーク / aaaazzzz036.hatenablog.com (3)

  • Rでk-means法とその拡張1 k-means編 - サボタージュ禁止のおさぼり日記

    あっ, どーも僕です。 先週, 「明日から頑張る」と宣言したはずの後輩が, その日から一度も研究室に来てくれません。 まだ, 卒論に書くことないがほとんどはずなのに..... 先輩としてどうしたらいいものか。 k-means法によるクラスリングの拡張 k-means法とその拡張が実装できたのでご紹介。 k-meansとは k-means法とは, 非階層のハードクラスタリングで, 様々なで紹介*1されています。 改めて説明する必要もないくらいによく出てきます。 特徴としては次のことがあげられるそうです。 実装が簡単 高速 アルゴリズムはなにかを参照してください。 ちょっと物足りない点としては次があげられるそうです。 最適なクラスター数が決める基準がない 変数の相関を考慮できない そんな, k-meansはいくつか拡張されたものがあります Fuzzy c-means x-means*2 変

    Rでk-means法とその拡張1 k-means編 - サボタージュ禁止のおさぼり日記
  • Rでk-means法とその拡張2 x-means編 - サボタージュ禁止のおさぼり日記

    あっ, どーも僕です。 注意!!エントリーの記述はRソースを含めて全面的に書き直しています!!(なぜかこのエントリーはアクセス数が多いので(汗))@2014/9/11 Python版はこちらから. github.com クラスター数が自動で決まるkmeans法 前回はk-means法の実装を示しました。 kmeans法は近い者同士を集めるという直感的に理解しやすいシンプルなクラスタリングですが、そのシンプルさゆえにいくつか欠点(?)があります。 その一つはクラスター数の設定です。 kmeans法ではクラスター数をパラメータとして与えます。...しかし、どうやってクラスター数を設定するればよいのでしょう。...わかりません。職人芸でしょうか。 素人にはクラスター数は決められないでしょうか? 考えるめんどくさいのでアルゴリズムに決めてもらいたいです。 そんなクラスター数をアルゴリズムに決めて

    Rでk-means法とその拡張2 x-means編 - サボタージュ禁止のおさぼり日記
  • Rでk-means法とその拡張3 改良k-means編 - サボタージュ禁止のおさぼり日記

    あっ, どーも僕です。 Rでk-means法とその拡張の最後は, 改良k-meansです。 概要は前々回の記事をみてください。また, アルゴリズムは論文をみてみてください。フリーで入手できます。 さっそく, 結果ですが, クラスター数を3にしたときがこちら。相変わらずirisを使います。色がクラスタリングの結果で, 記号はSpeciesで分けています。うまくクラスタリングされたことがわかります。 改良k-meansはどうやらRで実装されていなさそうなので正しく実装できているかは, 論文と結果を比較してみました。比較したところ, 問題なしです。論文では, 3つのデータがクラスタリング失敗していますが, グラフをみると, オレンジの三角が2つと緑の十字がひとつあることがわかります。 k-meansを多変量正規分布で修正するだけで, こんなにもすごい結果がでるのですね。すごい。 で, 問題なしと

    Rでk-means法とその拡張3 改良k-means編 - サボタージュ禁止のおさぼり日記
  • 1