タグ

クラスタに関するkazutan711のブックマーク (3)

  • Rでk-means法とその拡張3 改良k-means編 - サボタージュ禁止のおさぼり日記

    あっ, どーも僕です。 Rでk-means法とその拡張の最後は, 改良k-meansです。 概要は前々回の記事をみてください。また, アルゴリズムは論文をみてみてください。フリーで入手できます。 さっそく, 結果ですが, クラスター数を3にしたときがこちら。相変わらずirisを使います。色がクラスタリングの結果で, 記号はSpeciesで分けています。うまくクラスタリングされたことがわかります。 改良k-meansはどうやらRで実装されていなさそうなので正しく実装できているかは, 論文と結果を比較してみました。比較したところ, 問題なしです。論文では, 3つのデータがクラスタリング失敗していますが, グラフをみると, オレンジの三角が2つと緑の十字がひとつあることがわかります。 k-meansを多変量正規分布で修正するだけで, こんなにもすごい結果がでるのですね。すごい。 で, 問題なしと

    Rでk-means法とその拡張3 改良k-means編 - サボタージュ禁止のおさぼり日記
  • if 条件とクラスタ名を同じにしたいとき #rstatsj - Qiita

    id <- 1:10 x <- runif(length(id)) data <- data.frame(UserID=id, X=x) print(data) UserID X 1 1 0.9502438 2 2 0.3470344 3 3 0.4456312 4 4 0.1642439 5 5 0.3765186 6 6 0.4722742 7 7 0.3034376 8 8 0.7143706 9 9 0.5404237 10 10 0.5648573 このユーザの特性値 X を使って、ユーザを下記の3つのクラスタに分けたいとします。 0.4未満 0.4 ~ 0.6 0.6以上 そのとき、if 条件式とクラスタ名を同じにしたい時があります。 しかし、次のように書くと、なんだか同じことを何度も書いているような気がして冗長な感じがします。

    if 条件とクラスタ名を同じにしたいとき #rstatsj - Qiita
  • Rのflexmixパッケージで混合分布モデルによるクラスタ分析を行う。 - Analyze IT.

    Rで混合分布クラスタリングを行うときに有名なパッケージとしてflexmixが存在します。この記事ではflexmixの簡単な使い方を解説します。 flexmix自体は潜在クラス回帰を行うパッケージなのですが、混合分布クラスタリングを行うことも出来ます。 flexmixはRのglmクラスを用いてモデルを表現出来るため、他のパッケージに比べて柔軟なモデリングが可能というメリットがあります。 そもそも、混合分布クラスタリングとはなんぞやという人は以下の文を参考にしてください。 1.モデルベースのクラスタリングとは クラスタリングは代表的なものとして、以下の3つの方法が存在します。 おそらくk-meansと階層的クラスタ分析はみなさんご存知でしょう。 分類 メリット・デメリット 手法 階層的手法 +データを樹形図として表現可能 ‐データ数が多いと、樹形図として表現できないのでデータ数が絞られる。

    Rのflexmixパッケージで混合分布モデルによるクラスタ分析を行う。 - Analyze IT.
  • 1