タグ

クラスター分析に関するmidnightseminarのブックマーク (5)

  • What are the pros and cons of kmeans vs. hierarchical clustering? - Quora

  • クラスタリング (クラスター分析) - Toshihiro Kamishima

    クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.

    クラスタリング (クラスター分析) - Toshihiro Kamishima
    midnightseminar
    midnightseminar 2017/03/03
    「とは」っていうより、最後のほうの階層的クラスタリングとkmeansの比較のところが参考になる。海外の質問サイトでもkmeansとhierarchicalどっち使えばいいのって質問は多い。
  • Rでk-means法とその拡張2 x-means編 - サボタージュ禁止のおさぼり日記

    あっ, どーも僕です。 注意!!エントリーの記述はRソースを含めて全面的に書き直しています!!(なぜかこのエントリーはアクセス数が多いので(汗))@2014/9/11 Python版はこちらから. github.com クラスター数が自動で決まるkmeans法 前回はk-means法の実装を示しました。 kmeans法は近い者同士を集めるという直感的に理解しやすいシンプルなクラスタリングですが、そのシンプルさゆえにいくつか欠点(?)があります。 その一つはクラスター数の設定です。 kmeans法ではクラスター数をパラメータとして与えます。...しかし、どうやってクラスター数を設定するればよいのでしょう。...わかりません。職人芸でしょうか。 素人にはクラスター数は決められないでしょうか? 考えるめんどくさいのでアルゴリズムに決めてもらいたいです。 そんなクラスター数をアルゴリズムに決めて

    Rでk-means法とその拡張2 x-means編 - サボタージュ禁止のおさぼり日記
  • 因子分析からクラスター分析までの流れ - bob3’s blog

    マーケティングの基的な考え方のひとつであるSTP戦略。 STPとはsegmentation、targeting、positioningの頭文字をとったものです。 消費者をニーズの異なるいくつかのグループに分類し、商品開発の対象を絞り込み、消費者から見た競合他社の商品との相対的な位置付けを定める、という考え方です。 そのS(segmentation)のステップではクラスター分析が良く使われます。 ここではSD法によるアンケートの回答から因子分析を行い、その因子得点をもとにクラスター分析を行うところまでをR言語でやってみたいと思います。 解説が不十分ですが、追々追記したいと思います。 データはここにある「COFFEE.txt」を使わせていただきます。 このデータは「経済・経営のための統計学」という書籍のデータです。 経済・経営のための統計学 (有斐閣アルマ) 作者: 牧厚志,和合肇,西山茂,

    因子分析からクラスター分析までの流れ - bob3’s blog
  • LR-NET(R-Tree)

    midnightseminar
    midnightseminar 2014/01/18
    そのプログラムの中身を知りたいんだが。
  • 1