タグ

クラスタリングとデータマイニングに関するsimakawaのブックマーク (4)

  • http://nakaikemi.com/clusterexp.htm

    階層的クラスター分析(Hiearchical Cluster Analysis) その2 ウォード法とは 色々な問題にクラスター分析を用いて解析してみると、比較的安定した解が得られる手法があります。それが、ウォード(Ward)法です。ウォード法は、二つのクラスターを結合する際に、「群内平方和の増加量」が最小になる二つのクラスターを一つにまとめるという手法です。 1.ウォード法の定式化 これを、まず数式で追いかけてみましょう。 いま、 をクラスター{ A } に属する i 番目の対象(クラスター{ A } 内に n個ある)の第 k変数(全部でp個ある)についての値とすればクラスター{ A } 内の平方和は

  • Rとクラスター分析(1)

    [連載]フリーソフトによるデータ解析・マイニング第28回 Rとクラスター分析(1) 1.クラスター分析とは 我々は、物事を整理整頓する際には、機能、形状などの側面から似ているものを同じのところに集めて、片付ける。これと同じくデータについてもデータ構造の側面から似ている個体を同じのグループに仕分けることが必要である場合がある。データサイエンスにおける分類のための方法は、学習(教師、訓練)データがある分類方法と学習データがない方法に大別される。 ここで言う学習データとは、どの個体がどのグループに属するかが既知であるデータである。グループの所属を示すデータは外的基準とも呼ばれている。学習データがある場合の分類方法は、どの個体がどのグループに属するかが既知であるデータから、分類に関するモデルを作成し、そのモデルに基づいて、グループの属性が未知であるデータを最も似ていると判断されるグループに割り当

  • クラスター分析とは

    HOME クラスター分析(クラスター解析)とは、似ているものを集めて分類して、その中から意味のあるものを発見しようというデータマイニングの手法のひとつです。 細かい定義などは他に説明されているページがたくさんありますので、省略します。 クラスター分析には以下の7つの手法があります。 ・最短距離法(最近隣法) ・最長距離法(最遠隣法) ・メディアン法 ・群平均法 ・重心法 ・ウォード法 ・可変法 ここでは非常に基礎的なことですが、クラスター分析についての流れを、図を追って説明していきたいと思います。 以下、最短距離法を用いてクラスター分析のアルゴリズムを説明します。 また、こちらでプログラムを組むという観点から見た説明もしています。

  • クラスタリング (クラスター分析) - Toshihiro Kamishima

    クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.

    クラスタリング (クラスター分析) - Toshihiro Kamishima
  • 1