タグ

analysisとpcaに関するteddy-gのブックマーク (5)

  • 10分でわかる主成分分析(PCA)

    2. Self Introduction 緒方 貴紀 (ABEJA Inc.) Computer Vision やMachine Learning, Deep Learningの研究開発をやっています 4. PCA(Principal Component Analysis, 主成分分析)とは 主成分分析(しゅせいぶんぶんせき、英語: principal component analysis、PCAと略すこともあ る)は、直交回転を用いて変数間に相関がある元の観測値を、相関の無い主成分とよばれる値に 変換するための数学的な手続きのことである。主成分分析は、1901年にカール・ピアソンによっ て開発された手法である。KL展開(Karhunen-Loève expansion)とも呼ばれる。主成分は、分 散共分散行列(あるいは相関係数行列)に対する固有値分解あるいは、分散共分散行列(相関係 数行

    10分でわかる主成分分析(PCA)
    teddy-g
    teddy-g 2017/02/13
    行列だの固有値だの言い出さなくてわかりやすい
  • 主成分分析と因子分析

    ここではデータとして2022年度全国学力・学習状況調査の結果を使う: df = read.csv("http://okumuralab.org/~okumura/python/data/atest2022.csv") 頭の部分だけ表示してみる: head(df) 小国 小算 小理 中国 中数 中理 1 64.44456 61.07105 62.87208 68.59639 48.93763 48.96912 2 67.81161 63.19436 65.83762 69.13618 51.55864 48.98470 3 66.98455 61.59387 63.19816 69.80850 48.52725 47.56724 4 63.68711 60.15438 61.49521 69.14642 48.57422 49.72042 5 70.78273 66.45425 70.614

    teddy-g
    teddy-g 2015/12/07
    Rでとりあえずこの通りやったらPCAとFAはできるという。
  • 次元を下げる - ryamadaのコンピュータ・数学メモ

    昨日の記事で、多様体学習に触れた 多様体学習は、非線形に次元を下げる話と言い換えることができるが、それに関連する用語を挙げよう Isomap 点間距離を局所について測り、グラフ上の最短距離を局所において定める。その上で、すべての点間のグラフ上最短距離をそのつなぎ合わせとして決める。ペアワイズな最短距離が計算で来たら、それをユークリッド空間の距離のように見立ててMDSで低次元空間に埋め込む Kernel_PCA カーネル法(座標の計算をする代わりに内積計算をして計算量を減らす仕組みを使った方法)を文字込んだPCA拡張版。分解しやすいように、実際よりも次元を高くして分解できる条件を作ってやった上で、意味の大きい軸を引き出す Nonlinear dimensionality reduction methods これらを大きくくくるとNonlinear dimensionality reducti

    次元を下げる - ryamadaのコンピュータ・数学メモ
    teddy-g
    teddy-g 2015/01/28
    多様体学習のざっくりした説明。このくらいの理解でいいと思う。
  • Rとカーネル法・サポートベクターマシン

    図1に示すように、非線形データ構造を線形構造に変換することができれば、線形データ解析手法で非線形データを容易に扱うことができる。 データを変換することで、非線形構造を線形構造に変換することが可能である。例えば、図2(a)に示す2次元平面座標系(x,y)上の4つの点A1(1,1)、A2(1,-1)、A3(-1,-1)、A4(-1,1)を考えよう。仮にA1とA3がひとつのクラス、A2とA4がひとつのクラスだとすると、平面上でクラスの境界線を一の直線で引くことができない。しかし、新しい変数 を導入し、2次元平面(x,y)上の4つの点を3次元空間(x,y,z)に射影するとA1(1,1,1)、A2(1,-1,-1)、A3(-1,-1,1)、A4(-1,1,-1)になり、両クラスは平面で切り分けることが可能である。例えば,z=0の平面を境界面とすることができる。 図1では、関数φ(x)を用いて個体

    teddy-g
    teddy-g 2015/01/27
    Rを使ってカーネルSVMを使う説明だが、カーネルPCAの説明もある。
  • 主成分分析が簡単にできるサイトを作った - ほくそ笑む

    あけましておめでとうございます。 年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *

    主成分分析が簡単にできるサイトを作った - ほくそ笑む
    teddy-g
    teddy-g 2014/11/05
    気が利いたツールだな。
  • 1