タグ

類似度に関するmonnalisasmileのブックマーク (2)

  • クラスター分析について

    はじめまして。 クラスター分析について最近勉強を始めたところです。似たもの同士をくっつけていくというイメージはできましたが、類似度の測定方法やクラスターの合併方法がたくさんありすぎて困っています。そこで、 (1)どうゆう時にどの方法を使うのが効果的なのか? (2)各測定方法、合併方法を使う時の利点と弊害は? 以上2点についてやさしく教えて下さい。 また、詳しく分かりやすく説明してある文献があれば 紹介して下さい。 よろしくお願い致します。 自信はありませんが,手持ちの資料を参考にいくつかアドバイスをしたいと思います.浅学なため間違いがあるかもしれませんので,その点御了承下さい. クラスター分析には実に様々な手法が用意されています. (1)階層的/非階層的 (2)距離(類似性)の算出法 (3)結合(合併)の方法 この三ポイントでどの手法を用いるかが別れていきます.クラスター分析はオプションが

    クラスター分析について
    monnalisasmile
    monnalisasmile 2012/03/08
    教えて!gooにこれほど有用な情報が載っているとは思わなかった
  • 統計的テキスト解析(13)~テキストのクラスター分析~

    図書館の図書は何らかの特徴別にグループ分けしており、新聞の紙面は総合、社会、経済、国際、生活、料理、スポーツ、地域などに分けられている。図書は図書館の管理者が、新聞の紙面は編集者たちがグループ分けしている。しかし、インターネット上の大量のテキストを何らかの特徴別にグループ分けする場合、すべての内容を読み、グループ分けすることは現実的ではない。また、人為的にグループ分けすることは読む側の主観の印象や認識などに左右されるため、客観的なグループ分けが求められている。 稿では、テキストがどのグループに属するかに関する情報(外的規準とよぶ)を用いずにグループ分けする方法を説明する。このようなグループ分け方法をクラスター分析と呼ぶ。テキストのクラスター分析は、主に次のようなアプローチ多用されている。 (1)個体の特徴の情報に基づいて、平面や立体空間上で散布図を作成し、分布状況からクラスターの形成状況

  • 1