タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

統計とRに関するnissy_24のブックマーク (3)

  • 判別分析(ステップワイズ変数選択) - CodeDaily

    2013-12-13 判別分析(ステップワイズ変数選択) R ステップワイズ変数選択による判別分析を行う。解析に用いるtest.csvは一行目が変数名x1,x2,x3,x4,x5,x6,yで、2行目以降の各行に各被験者の値が入っている。説明変数がx1-x6, 群変数がy(0:健常群, 1:疾患群)のデータで解析する。 R -- 判別分析(ステップワイズ変数選択)を利用する。 >data<-read.csv("test.csv", header=TRUE) >sdis(data[1:6], data[7], stepwise=TRUE, P.in=0.05, P.out=0.05, predict=FALSE, verbose=TRUE) 有効ケース数: 86 群を表す変数: y ***** 平均値 ***** 0 1 全体 x1 70.5319149 70.9230769 70.709

    判別分析(ステップワイズ変数選択) - CodeDaily
  • 統計的消去で擬似相関を見抜こう! - ほくそ笑む

    今日は初心者向け記事です。 はじめに ある範囲の年齢の小学生32人を無作為に選び、算数のテストを受けてもらい、さらにその身長を測定しました。 身長に対する算数の点数のグラフは次のようになりました。 なんと、身長の高い子供の方が、算数の点数が高いという結果になりました! 身長が算数の能力に関係しているなんて、すごい発見です! しかしながら、結論から言うと、この結果は間違っています。 なぜなら、抽出したのは「ある範囲の年齢の小学生」であり、年齢の高い子も低い子も含まれているからです。 年齢が高いほど算数能力は高くなり、年齢が高いほど身長も高くなることは容易に推測できます。 この関係を図で表すと次のようになります。 つまり、年齢と算数能力に相関があり、年齢と身長にも相関があるため、身長と算数能力にも見かけ上の相関が見えているのです。 このような相関を擬似相関と言います。 統計解析では、このような

    統計的消去で擬似相関を見抜こう! - ほくそ笑む
  • 主座標分析について簡単に紹介するよ! - ほくそ笑む

    今日は主座標分析(Principal Coordinate Analysis; PCoA)の紹介を簡単にしたいと思います。 主座標分析は古典的多次元尺度構成法(Classical Multidimensional Scaling; CMDS)とも呼ばれる統計解析手法です。 この解析手法を使用する主な目的は、高次元のデータを2次元や3次元に落として視覚化したいという時に使います。 以前紹介した主成分分析と同じような感じですね。*1 主成分分析との違いを簡単に言うと、主成分分析はユークリッド距離をなるべく保ちながら低次元に落とす方法ですが、主座標分析はユークリッド距離だけでなく、他の距離や類似度*2が使えるという点にあります。 例えば、ユークリッド距離の代わりに相関係数を使えば、相関の高いもの同士が近い配置になるようなプロットを作ることが可能です。 データを用意する さっそくやってみたいのです

    主座標分析について簡単に紹介するよ! - ほくそ笑む
  • 1