タグ

Rに関するotakumesiのブックマーク (9)

  • 統計手法の実地への適用限界 - RjpWiki

  • 文系のための「主成分分析の可視化」(2)

    主成分分析の解釈の仕方が理解できたところで、 いよいよ、一般的な主成分分析の可視化方法である「バイプロット」を実行してみる。 今回の話は、ソフトウェアが既定で設定している値を鵜呑みにしてはいけない例。 数理的な背景を理解していれば、簡単に理解できることである。 「文系だから深く知る必要は無い。使えれば良い」などと言う人がいる。 学生であっても、時には研究者もそのようなこと言う。最低限の知識は必要。 何度も主張しているが、私は、数学が苦手な文系研究者である。 さて、「最低限の知識」との線引きは確かに困難であるが、 少なくとも、間違った解釈をしないための知識は必要であろう。 特異値分解は、必要最低限の知識に加えても良いと思う。 特異値分解を概念的に理解しておけば、逆行列や主成分分析の理解も楽である。 一般的な教科書では、主成分分析を固有ベクトルと固有値から説明するが、 文系人間には、理解しにく

    文系のための「主成分分析の可視化」(2)
  • Rのprcomp()関数で主成分分析をするときの注意点 - StatsBeginner: 初学者の統計学習ノート

    Rでの主成分分析の実行 前々回のエントリで学習した永田・棟近教科書の第9章「主成分分析」にのっている計算例を、自分でRにより実行してみることとする。 前半では、教科書の計算例の実行、後半では、Rのprcomp()関数を使うときに注意しなきゃなと思った点をメモしておく。 永田・棟近教科書の第9章「主成分分析」をRで実行してみる まず、データの入力。 > # データの入力 > > 生徒NO <- seq(1, 10, 1) > 国語 <- c(86,71,42,62,96,39,50,78,51,89) > 英語 <- c(79,75,43,58,97,33,53,66,44,92) > 数学 <- c(67,78,39,98,61,45,64,52,76,93) > 理科 <- c(68,84,44,95,63,50,72,47,72,91) データを確認のため表示させてみる。 > 成績d

    Rのprcomp()関数で主成分分析をするときの注意点 - StatsBeginner: 初学者の統計学習ノート
  • Rの基本パッケージ中の多変量解析関数一覧 - RjpWiki

  • 主成分分析と因子分析

    ここではデータとして2022年度全国学力・学習状況調査の結果を使う: df = read.csv("http://okumuralab.org/~okumura/python/data/atest2022.csv") 頭の部分だけ表示してみる: head(df) 小国 小算 小理 中国 中数 中理 1 64.44456 61.07105 62.87208 68.59639 48.93763 48.96912 2 67.81161 63.19436 65.83762 69.13618 51.55864 48.98470 3 66.98455 61.59387 63.19816 69.80850 48.52725 47.56724 4 63.68711 60.15438 61.49521 69.14642 48.57422 49.72042 5 70.78273 66.45425 70.614

  • biunit

    農学生命情報科学特論 I @東京大学アグリバイオインフォマティクス教育研究ユニット (2023-10) プログラミング言語未経験者を対象とした Python 入門講義。農学や分子生物学などの分野で利用される Python の最新事例を紹介しながら、Python の基礎文法の講義を行う。

  • 統計的消去で擬似相関を見抜こう! - ほくそ笑む

    今日は初心者向け記事です。 はじめに ある範囲の年齢の小学生32人を無作為に選び、算数のテストを受けてもらい、さらにその身長を測定しました。 身長に対する算数の点数のグラフは次のようになりました。 なんと、身長の高い子供の方が、算数の点数が高いという結果になりました! 身長が算数の能力に関係しているなんて、すごい発見です! しかしながら、結論から言うと、この結果は間違っています。 なぜなら、抽出したのは「ある範囲の年齢の小学生」であり、年齢の高い子も低い子も含まれているからです。 年齢が高いほど算数能力は高くなり、年齢が高いほど身長も高くなることは容易に推測できます。 この関係を図で表すと次のようになります。 つまり、年齢と算数能力に相関があり、年齢と身長にも相関があるため、身長と算数能力にも見かけ上の相関が見えているのです。 このような相関を擬似相関と言います。 統計解析では、このような

    統計的消去で擬似相関を見抜こう! - ほくそ笑む
  • Rによる棒グラフの描き方

    棒グラフはコマンド"barplot"にて作成する。"barplot(height)"のように用い、この"height"に描画したいデータを入力する。ベクトルまたは行列形式のデータを読み込むことができる。ベクトルを与えた場合は、各要素の値が棒の高さ (長さ) として描画される。行列を与えた場合は、オプションにより、積み上げ棒グラフかグループごと (列ごと) に要素がまとめられた棒グラフが描かれる。 まず、以下のコマンドにてベクトル型および行列型のデータを準備する。"dat_v"がベクトル、"dat_m"が2行5列の行列である。

    Rによる棒グラフの描き方
  • Rでラベル付き散布図を作成して保存するまで - 503 Service Unavailable

    この程度のことだけれど意外に少し情報探すのにも苦労したのでメモ。散布図を書く場合、どの点がどの数値なのかのラベルが欲しい時がある。Rの場合、maptoolsパッケージを用いるとうまく出力できるのでその方法を紹介する。 データの準備 maptools関数*1を読み込んで、データを準備。*2 #今回使うライブラリ library(maptools) #データの準備 CC <- c("CAN","DNK","FIN","FRA","DEU","ITA","JPN","KOR","NLD","POL","SWE","GBR","USA") PAR <- c(13.7,15.7,16.6,16.6,20.2,20.1,22.1,10.3,14.9,13.5,17.6,15.6,12.8) SE <- c(3.8,7.4,8.6,11.5,8.5,12.2,9.3,1.9,5.4,8.9,9.4,6.

    Rでラベル付き散布図を作成して保存するまで - 503 Service Unavailable
  • 1