タグ

2013年1月10日のブックマーク (4件)

  • Rでt検定 1

    t検定の仮定 来,t検定には,さまざまな仮定が伴うものである。 各群の標が,いずれも正規母集団から得られたものであること(正規性) 各群の母分散が等しいこと(等分散性) したがって,t検定の実施に先立って,これらの仮定が成り立つかどうかを判断しなければならない。 そのために,正規性と等分散性について,それぞれ異なる検定を行う必要がある。 正規性の検定 2群のデータの分布が,正規分布に従うかどうかを検定する。 この目的には,Kolmogorov-Smirnov(コロモゴロフ・スミノフ)検定がよく用いられる。 Rでは,この頭文字をとって ks.test() という名前の関数が用意されている。 この検定の帰無仮説は「あるデータが,正規分布をなす」である。 したがって,P値が大きければ,正規分布であると判断できる。 > ks.test(x$A,"pnorm",mean=mean(x$A),sd

  • 量的分析法 勉強会/確率分布 - Miyazawa’s Pukiwiki 公開版

    変数の尺度 † 観察される変数と数値を対応させる基準は データ水準 と呼ばれる*2 名義、順序、間隔、比例の4種類 各尺度と、使うことのできる統計量(以下の統計量の種類は 統計Web | コラム | 統計備忘録 2009年3月 より引用) 名義尺度 の統計量 : 各ケースの数、計数、頻度、最頻値、連関係数*3 【引用】 質的データ、カテゴリカルデータとも呼ばれる。データは度数集計表によってあらわされる。*4 順序尺度 の統計量 : 上に加えて、中央値、パーセンタイル*5 【引用】 順位尺度は間隔をもたないので、データ自体は数値であるが四則演算は成立しない。平均を求めることさえ無意味。その反面、正規分布を前提にしない・極端値に強い・少数データを扱えるといった強みがある。*6 間隔尺度 の統計量 : 上に加えて、平均値、標準偏差、順位相関係数、積率相関係数*7 例えばデータが「クラスの各員の得

  • Cookbook for R » Graphs

    Graphs There are many ways of making the same kinds of graphs in R, each with its advantages and disadvantages. The focus here is on the ggplot2 package, which uses a "grammar of graphics" to design graphs, rather than the usual procedural methods. Graphs with ggplot2 Bar and line graphs (ggplot2) Plotting means and error bars (ggplot2) Plotting distributions (ggplot2) - Histograms, density curves

  • Cookbook for R » Plotting distributions (ggplot2)