R 入門 R ノート: データ解析とグラフィックスのためのプログラミング環境 Version 1.7.0 (2003-04-16) W. N. Venables, D. M. Smith and the R Development Core Team Copyright c 1990 W. N. Venables Copyright c 1992 W. N. Venables & D. M. Smith Copyright c 1997 R. Gentleman & R. Ihaka Copyright c 1997, 1998 M. Maechler c 1999 Permission is granted to make and distribute verbatim copies of this manual provided the copyright notice and th
グラフによる正規分布との比較 パッケージ stepfum の中の関数 ecdf() で累積分布関数 (cdf) を描き,正規分布からのズレを見ることが出来る.stepfun は階段関数を扱うライブラリで,特に経験分布関数の作図ができる. data <- rnorm(30) # データを用意 Fn <- ecdf(data) # ecdf()でデータフレームを作成 Fn # 中身を確認 summary(Fn) # Fn の要約 summary.stepfun(Fn) # Fn の詳しい要約 plot(Fn) # 経験分布関数をプロット plot(Fn, do.point=F, verticals=T) # 点を描かず,ジャンプ線(縦の線)を描く
データが正規分布にしたがうことを仮定する統計手法を利用する場合は、分析に先駆けてデータの正規性を評価しなければなりません。具体的には、ヒストグラムを描いて形状を正規分布と照らし合わせる方法と、仮説検定による方法があります。 仮説検定を利用する場合に、よく利用するのが、Shapiro-Wilk(シャピロウィルク)の正規性の検定です。この検定の帰無仮説は「変数は正規分布にしたがう」になりますので、P≧0.05となれば、帰無仮説を保留して、正規分布であることを仮定することになります。(本来は、正規分布を否定することはできない、というあいまいな意味になりますが) shapiro-wilk(シャピロウィルク)検定は多くの統計ソフトについてますが、フリーソフトのRコマンダーを利用する場合は、統計量メニューを利用することで実行できます。 以下の例では、p-value = 0.1832であり、0.05を越
2011/05/31 18:16 NTTデータは2011年6月2日、Hadoopの商用ディストリビューション「Cloudera's Distribution including Apache Hadoop v3(CDH3)」を提供開始する。パッケージには、Hadoopの導入を支援するソフトウエア群とサポート・サービスが含まれる。価格は、1ノードあたり年額25万円(税別)で、5ノード以上で販売する。CDH3は、米Clouderaが作成した、Hadoopの配布パッケージ。Hadoopを使ったアプリケーション開発で用いる代表的なオープン・ソース群を含むほか、インストール・パッケージ(RPM形式)の提供やGUIベースの独自の運用管理ソフトなど、Hadoopの導入や設定を簡単に行えるようにする仕組みを提供する。無償版に加えて、有償サポートを含む商用版を用意している。 NTTデータは今回、CDH3の商
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く