Rion778のブックマーク / 2018年10月1日

Rion778 id:Rion778

2018年10月1日のブックマーク (7件)

Positioning the arrows on a PCA biplot
Rion778 2018/10/01
PCAをplotする際には9通りの軸のとり方がありうるという話

statistics
リンク
Rのprcomp()関数で主成分分析をするときの注意点 - StatsBeginner: 初学者の統計学習ノート
Rでの主成分分析の実行前々回のエントリで学習した永田・棟近教科書の第9章「主成分分析」にのっている計算例を、自分でRにより実行してみることとする。前半では、教科書の計算例の実行、後半では、Rのprcomp()関数を使うときに注意しなきゃなと思った点をメモしておく。永田・棟近教科書の第9章「主成分分析」をRで実行してみるまず、データの入力。 > # データの入力 > > 生徒NO <- seq(1, 10, 1) > 国語 <- c(86,71,42,62,96,39,50,78,51,89) > 英語 <- c(79,75,43,58,97,33,53,66,44,92) > 数学 <- c(67,78,39,98,61,45,64,52,76,93) > 理科 <- c(68,84,44,95,63,50,72,47,72,91) データを確認のため表示させてみる。 > 成績d
Rion778 2018/10/01
R
リンク
PCAとSVDの関連について - Qiita
この場合、長さ、幅、重さ……などの測定値を特徴量、製造所IDをラベルとして何らかの機械学習をすることが考えられます。ただ、多くの場合、この特徴量が多すぎるといった状況が発生します。中には、「製造に要した時間」のようなおおよそ関係なさそうな測定値が入っていたり、重さと体積のような、明らかに相関がありそうなものが入っていたりします。人間であれば「この特徴量は関係なさそうだな」とあらかじめアタリをつけて表から落としたりもできますが、基本的に機械学習アルゴリズムは与えられた特徴量を公平に評価します。その結果、ラベルと論理的に関係がない特徴量にまで相関を見出してしまう……なんてことも起こってしまいます。また、特徴量どうしに相関がある場合、それらのモデル内での役割はほぼ同じであり、そこまで多くの情報を持っていることにはなりません。極端な例を挙げると、「長さ」のカラムが表に2つあってまったく
Rion778 2018/10/01
リンク
水管理が不要　高糖度トマト　ゲノム編集　名古屋大、神戸大　新系統を作出（日本農業新聞） - Yahoo!ニュース
Rion778 2018/10/01
リンク
Arrows of underlying variables in PCA biplot in R - Cross Validated
Rion778 2018/10/01
biplotの軸のscaleについて詳しい説明がある
リンク
第5回多変量解析を用いたメタボロームデータ解析　-　主成分分析の「ローディング」とは？（前篇） | メタブローグ
Rion778 2018/10/01
statistics
リンク
Plotting PCA (Principal Component Analysis)
This document explains PCA, clustering, LFDA and MDS related plotting using {ggplot2} and {ggfortify}. {ggfortify} let {ggplot2} know how to interpret PCA objects. After loading {ggfortify}, you can use ggplot2::autoplot function for stats::prcomp and stats::princomp objects. library(ggfortify) df <- iris[1:4] pca_res <- prcomp(df, scale. = TRUE) autoplot(pca_res) PCA result should only contains n
Rion778 2018/10/01
R

ggplot2
リンク
- 2018年10月2日
- 2018年10月1日
- 2018年9月30日