タグ

clusteringに関するwata_dのブックマーク (4)

  • Rとクラスター分析2

    [連載]フリーソフトによるデータ解析・マイニング第29回 Rとクラスター分析(2) 1.樹形図の切断とコーフエン相関係数 先月号では、階層的クラスター分析の基概念や樹形図の作成などについて説明した。 クラスター分析結果を分析する際には、どの個体がどのクラスターに属するかを確認することが必要である。階層的クラスター分析では、クラスターの数を指定し、樹形図を切断すると個体が属するクラスが決定される。 Rには個体が属するクラスターの情報を返す関数cutreeが用意されている。関数cutreeはクラスターの数を指定すると、個体がどのクラスターに属するかに関する情報を返す。 次にirisデータの51〜100行(versicolor品種)と101〜150行(virginica品種)の2品種のデータを用いた関数cutreeの使用例を示す。

  • CatTail Wiki*

    2つのデータが似ている度合いを,類似度の大きさや距離の近さといった数値にしてあらわすことで,クラスタ分析や,k-近傍法,多次元尺度構成法(MDS)をはじめとするいろいろな分析を行うことが可能となる. ここでは,よく知られている類似度や距離について述べる. 類似度という概念は,2つの集合の要素がまさにどれだけ似ているかを数量化したものであり,距離とは,要素同士の離れ具合,従って非類似度とちかい概念と考えてもよい. 参考までに数学における距離の概念の定義を示すと, 距離空間の定義 Sを1つの空でない集合とし,dをSで定義された2変数の実数値関数 d(SxS) → R が,以下の4条件(距離の公理) D1 : (非負性) 任意のx,y∈Sに対して d(x,y)≧0. D2 : (非退化性) x,y∈Sに対し d(x,y)=0  ⇔ x=y. D3 : (対称性) 任意のx,y∈Sに対して d(x

    CatTail Wiki*
  • データマイニング分野のクラスタリング手法(1) — クラスタリングを使ってみよう! —

    PDF閲覧時に認証を求められる記事がございます(発行後2年間)が,人工知能学会の個人会員は無料で閲覧可能です.認証のための購読者番号やパスワードは会員マイページにログインし「お知らせ」にてご確認下さい(会員情報管理システムとオンラインで連携していないため,パスワードは同システムとは異なります.また,認証情報の更新は偶数月の月末に実施しております.新規入会された方は利用できるまでしばらくお待ちください).個人会員以外は記事複製申込フォームから購入いただけます.また,アマゾンにて冊子版あるいはKindle版を購入いただくことも可能です.

  • Michiel de Hoon

  • 1