タグ

mdsに関するpink_darkのブックマーク (5)

  • 主座標分析について簡単に紹介するよ! - ほくそ笑む

    今日は主座標分析(Principal Coordinate Analysis; PCoA)の紹介を簡単にしたいと思います。 主座標分析は古典的多次元尺度構成法(Classical Multidimensional Scaling; CMDS)とも呼ばれる統計解析手法です。 この解析手法を使用する主な目的は、高次元のデータを2次元や3次元に落として視覚化したいという時に使います。 以前紹介した主成分分析と同じような感じですね。*1 主成分分析との違いを簡単に言うと、主成分分析はユークリッド距離をなるべく保ちながら低次元に落とす方法ですが、主座標分析はユークリッド距離だけでなく、他の距離や類似度*2が使えるという点にあります。 例えば、ユークリッド距離の代わりに相関係数を使えば、相関の高いもの同士が近い配置になるようなプロットを作ることが可能です。 データを用意する さっそくやってみたいのです

    主座標分析について簡単に紹介するよ! - ほくそ笑む
  • 主成分分析と多次元尺度構成法 | Impronta di gatto

    今日はお客さん向けの資料として、主成分分析(PCA)と多次元尺度構成法についてまとめている。 最初、多次元尺度構成法の英語名Multidimensional Scaling(MDS) しか分からず、しかもスペルミスのままGoogleしていたので、ちっともいい資料にたどり着かず、これはかなりマイナーな方法なのか?!と思ってしまった。日人が少ない外資系企業では、まず最適な日語訳を見つけることから始めねばならない。。多次元尺度構成法で調べると、わんさと出てきた。ほっ。 どちらもデータの要約に用いられる方法だが、着眼点が違う。 PCAは、データの散らばり具合を情報量としてできるだけ保持して合成変数を作成し、それを軸としてデータを要約するのに対し、MDSは対象間の距離を維持したまま、小さな次元に要約する。PCAでは、合成された変数が何かしらの意味を持つのに対し、MDSでの軸は特に意味はもたない。

    主成分分析と多次元尺度構成法 | Impronta di gatto
  • Pythonで多次元尺度構成法を実装してみる

    多次元尺度構成法(Multidimensional scaling; MDS)は多変量解析の手法です.よくデータ間の(非)類似度の情報可視化に用いられます.MDSは基的には似ているものは近くに,似ていないものは遠くに配置するような座標を求めます.ここでは古典的(計量的; metric)MDSをPythonで実装してみます. 古典的MDSは以下の手順で可視化.実装に必要なところのみ. 要素の値が距離の2乗と見なせる非類似度行列Sを用意する Sにヤング・ハウスホルダー変換を施してPとする Pをスペクトル分解する(固有値・固有ベクトルを求める) 固有値の大きい方から2~3個選び,対応する固有ベクトルを取り出す 各固有ベクトルの要素値をプロットする(2個の固有ベクトルの時は2次元,3個の固有ベクトルの時は3次元) 一応,下部に参考リンクを挙げましたが,詳しい説明は検索すれば山ほど….ヤング・ハウ

    Pythonで多次元尺度構成法を実装してみる
  • 多次元尺度構成法 - Wikipedia

    多次元尺度構成法(たじげんしゃくどこうせいほう、MDS:Multi Dimensional Scaling)は多変量解析の一手法である。主成分分析の様に分類対象物の関係を低次元空間における点の布置で表現する手法である(似たものは近くに、異なったものは遠くに配置する)。古典的MDSは主座標分析 (Principal Coordinate Analysis; PCoA) とも呼ばれ、さらに主座標分析において距離にユークリッド距離を用いた場合は主成分分析と等価になる。 例 - 1973年のアメリカ50州の人口10万人あたりの殺人、暴行、レイプの犯罪数、及び、都市人口の割合[%]の4つの要素から似た州は近くに置くように2次元空間に配置した結果。

    多次元尺度構成法 - Wikipedia
  • 多次元尺度構成法イントロダクション - kohta blog

    ちょっと多次元尺度構成法について理解する必要があったので簡単なまとめです。 多次元尺度構成法とは、多数の多次元点間の距離データのみが与えられたときに、その距離を再現するような空間(座標系)を逆算する手法です。(多次元)座標値が与えられれば距離は自由に計算できますが、距離だけが与えられた場合に座標値を計算するのは直感的には中々できません。 今、n個の点がありそれぞれの点間の個の距離がデータとして与えられたとします(はゼロです)。空間の次元をqとし、未知のn個の座標ベクトルを、それらを縦に並べた行列を とします(tは転地記号)。また、点間の距離はユークリッド距離 とします。 ここで という行列を考えます。もし何らかの形で距離データからBを求めることができれば、Bを対角化し固有値の平方根をとることで、を求めることができます。の成分は (a) であり、距離行列の成分と比べて次のような関係にあること

    多次元尺度構成法イントロダクション - kohta blog
  • 1