タグ

ブックマーク / mjin.doshisha.ac.jp (2)

  • Rと多次元尺度法

    多次元尺度法(MDS: multi-dimensional scaling)は、個体間の親近性データを、2次元あるいは3次元空間に類似したものを近く、そうでないものを遠くに配置する方法で、データの構造を考察する方法である。 多次元尺度法は計量多次元尺度法と非計量多次元尺度法に大別される。計量多次元尺度法とは距離データを低次元に配置する方法で、非計量多次元尺度法は、順序尺度のデータの類似度あるいは距離に変換可能な親近性データを低次元に配置する方法である。 MDSにも多くのアルゴリズムが提案されているが、古典的多次元尺度法としては1950年代Torgersonの貢献が大きい[4]。 多次元尺度法をイメージ的に説明のため、近畿地方の地図を図1に示す。図1では兵庫から和歌山、大阪、奈良、滋賀、京都の距離を点線で示している。このような任意の2点間の距離を表1に示す。 計量多次元の尺度法では、

  • アソシエーション分析(1)

    アソシエーション分析(associations analysis)は、百貨店や店舗などで集めている表1のようなトランザクションデータを活用するために、バスケットの中の商品間の関連性について分析を行う方法である。アソシエーション分析は、表1に示すような、トランザクションデータから、頻出するアイテムの組み合わせの規則を漏れなく抽出し、その中から興味深い結果を探し出すことを主な目的とする。 アソシエーション分析は、1990年代初めに英国の有力百貨店マークス&スペンサーの店舗で集めているデータの活用に関して相談を受けたことをきっかけとして、IBM研究所が研究を始め、Apriori(アプリオリ)というアルゴリズムを開発したと言われている。Aprioriアルゴリズムは、巨大なデータベースからアソシエーションルール(associations rules)を抽出することを実現し、データマインニングの実用

  • 1