[B! k-means] pandazxのブックマーク

クラスター分析手法の比較 - bob3’s blog

昨日の続きをすこしだけ。クラスター分析の手法による結果の違いを確認してみたいと思います。ウォード法、K-means法と{cluster}パッケージに入っているPAM(Partitioning Around Medoids)という手法を比較してみます。 data(iris) # 結果を２次元で観察したいので、「花弁の長さ」と「花弁の幅」だけを使う # ウォード法 WA <- cutree(hclust(dist(iris[, 3:4]), "ward"), 3) # K-means法 KM <- kmeans(iris[, 3:4], 3, nstart=100)$cluster # PAM。距離にはマンハッタン距離を使用。 library(cluster) PMM <- pam(iris[, 3:4], 3, metric="manhattan", cluster.only=TRUE)

pandazx 2012/10/12

R
k-means

リンク

クラスタリング (クラスター分析) - Toshihiro Kamishima

クラスタリング (clustering) とは，分類対象の集合を，内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です．統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ，基本的なデータ解析手法としてデータマイニングでも頻繁に利用されています．分割後の各部分集合はクラスタと呼ばれます．分割の方法にも幾つかの種類があり，全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは，クリスプなクラスタといいます)や，逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト，または，ファジィなクラスタといいます)があります．ここでは前者のハードな場合のクラスタリングについて述べます．

pandazx 2011/04/28

リンク

今日から使える！みんなのクラスタリング超入門

第2回さくさくテキストマイニング勉強会で発表したk-meansに関する資料です。Weniger lesen

pandazx 2011/04/28

リンク

Mahout Programming : K-Means Clustering - hamadakoichi blog

Mahout でのデータマイニング。mahout.clustering.kmeans を使ったクラスター分析を実装してみた。Mahoutは、Hadoop上で動くデータマイニング・機械学習の各種アルゴリズムが実装されているライブラリ。クラスター分析クラスター分析の方法論自体の内容は以下のエントリにまとめてある。 R言語プログラミング：クラスター分析 - 階層的クラスタリング - hamadakoichi blog 第２回データマイニング+WEB 勉強会＠東京 (Tokyo.Webmining#2) を開催しました - 「はじめてでもわかる R言語によるクラスター分析」 - hamadakoichi blog 第３回データマイニング+WEB 勉強会＠東京 (Tokyo.Webmining#3) を開催します - hamadakoichi blog R言語プログラミング：クラスター分析

pandazx 2010/10/13

リンク

クラスタリングの定番アルゴリズム「K-means法」をビジュアライズしてみた - てっく煮ブログ

集合知プログラミングを読んでいたら、K-means 法（K平均法）の説明が出てきました。K-means 法はクラスタリングを行うための定番のアルゴリズムらしいです。存在は知っていたんだけどいまいちピンときていなかったので、動作を理解するためにサンプルを作ってみました。クリックすると１ステップずつ動かすことができます。クラスタの数や点の数を変更して、RESET を押すと好きなパラメータで試すことができます。こうやって１ステップずつ確認しながら動かしてみると、意外に単純な仕組みなのが実感できました。K-means 法とはK平均法 - Wikipedia に詳しく書いてあるけど、もうすこしザックリと書くとこんなイメージになります。各点にランダムにクラスタを割り当てるクラスタの重心を計算する。点のクラスタを、一番近い重心のクラスタに変更する変化がなければ終了。変化がある限りは 2. に戻る。これ

pandazx 2010/06/03

リンク

はてなブックマーク

タグ

関連タグで絞り込む (5)

k-meansに関するpandazxのブックマーク (5)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (5)

k-meansに関するpandazxのブックマーク (5)

クラスター分析手法の比較 - bob3’s blog

クラスタリング (クラスター分析) - Toshihiro Kamishima

今日から使える！ みんなのクラスタリング超入門

Mahout Programming : K-Means Clustering - hamadakoichi blog

クラスタリングの定番アルゴリズム「K-means法」をビジュアライズしてみた - てっく煮ブログ

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

今日から使える！みんなのクラスタリング超入門