タグ

clusterに関するsimakawaのブックマーク (2)

  • Microsoft PowerPoint - pr_13_knn-bs-kinoko-errata-fix.pptx

    デジタル情報の処理と認識 (2012a) 第13回 データの分類 1  k近傍法による分類  k近傍法による数値の予測  データの標準化  k近傍法の応用 13回 データの分類 k近傍法 による分類 デジタル情報の処理と認識 (2012a) 第13回 データの分類 2 学習用データ 特徴A 特徴B 学習用のデータに含まれる情報を用いて 問い合わせデータがどのようなカテゴリに属するのかを予測 k近傍法 (k Nearest Neighbor Algorithm; KNN)  データの特徴  データが属するカテゴリ 問い合わせデータ は、 と のどちらのカテゴリか? 問い合わせデータ k近傍法 (k Nearest Neighbor Algorithm) k近傍法のアルゴリズム 5. 最多となるデータのカテゴリが、 問い合わせデータの推測されるカテゴリとなる 2. 問い合わせデー

    simakawa
    simakawa 2013/11/12
    knn k-nearestneighbor k近傍法
  • クラスタリング (クラスター分析) - Toshihiro Kamishima

    クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.

    クラスタリング (クラスター分析) - Toshihiro Kamishima
  • 1