タグ

クラスタリングとclusteringに関するsimakawaのブックマーク (4)

  • クラスター分析とは

    HOME クラスター分析(クラスター解析)とは、似ているものを集めて分類して、その中から意味のあるものを発見しようというデータマイニングの手法のひとつです。 細かい定義などは他に説明されているページがたくさんありますので、省略します。 クラスター分析には以下の7つの手法があります。 ・最短距離法(最近隣法) ・最長距離法(最遠隣法) ・メディアン法 ・群平均法 ・重心法 ・ウォード法 ・可変法 ここでは非常に基礎的なことですが、クラスター分析についての流れを、図を追って説明していきたいと思います。 以下、最短距離法を用いてクラスター分析のアルゴリズムを説明します。 また、こちらでプログラムを組むという観点から見た説明もしています。

  • クラスター分析

    クラスター分析     Last modified: Aug 28, 2015 似通った個体あるいは変数のグループ化を行うための分析手法である。 クラスター分析の結果は,図 1 のようなデンドログラム(樹状図)として表現される。 個体が似通っているかどうかの判定基準としてはいくつかあるが,取り扱いが容易なユークリッド距離を用いる。 個体のクラスター分析を行う場合には,解析に用いるデータを正規化する場合としない場合では結果がかなり異なることがある。 解析に使用する変数が異なった単位で表されているときには,正規化した方がよいかもしれない。しかし,ある変数が決定的な性質を持つ場合には,正規化することは他の変数と同格に取り扱ってしまうことになるので正規化しない方がよいかもしれない。 $n$ 個の個体について,$p$ 個の変数 $X_{i1}, X_{i2}, \dots X_{ip}\ (i =

  • sappari wiki - クラスタリング手法

    距離が近いものからくっつけていく。または逆に遠いものを別クラスタに分ける。 最終的にツリー状のデンドログラムを書ける。 様々なクラスター間距離(類似度)の測定方法がある。 NN(Nearest Neighbor)法、最短距離法 対象すべたの組み合わせに関して距離を求めて、最も近い距離をクラスタ間の距離とする 処理が終わるまで生成されるクラスタの数が不明 分類感度は低い 連鎖する によってしきい値があったり無かったり説明が違う気がする。。 K-NN(K Nearest Neighbor)法 ある標準パターンからの距離で小さい順にソートし、上からK番目までのクラスタに重複して属させる。 他はNN法と同様。 NN法と同様にしきい値に大きな影響を受ける。 Ward法 ウォード法 - Wikipedia 階層的クラスタリングの代表的な手法 クラスター内の平方和を最小にするように併合する 最長距離法

  • クラスタリング (クラスター分析) - Toshihiro Kamishima

    クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.

    クラスタリング (クラスター分析) - Toshihiro Kamishima
  • 1