2013-12-13 判別分析(ステップワイズ変数選択) R ステップワイズ変数選択による判別分析を行う。解析に用いるtest.csvは一行目が変数名x1,x2,x3,x4,x5,x6,yで、2行目以降の各行に各被験者の値が入っている。説明変数がx1-x6, 群変数がy(0:健常群, 1:疾患群)のデータで解析する。 R -- 判別分析(ステップワイズ変数選択)を利用する。 >data<-read.csv("test.csv", header=TRUE) >sdis(data[1:6], data[7], stepwise=TRUE, P.in=0.05, P.out=0.05, predict=FALSE, verbose=TRUE) 有効ケース数: 86 群を表す変数: y ***** 平均値 ***** 0 1 全体 x1 70.5319149 70.9230769 70.709
年度(ねんど、英: year)とは、暦年とは別に、特定の目的のために規定された1年間の区切り方[1][2]。 概要[編集] 会計など事務作業を目的としたものが中心で、またその多くは政府機関や業界団体等により決定されている。 例えば会計の年度を会計年度と言う。また学校の年度は学校年度、砂糖の収穫の統計に関わる年度は砂糖年度、といった方法で命名されている。 語法[編集] 年度の中には欧米での行政の会計年度などのように、通常の暦年(暦の上での年)と開始点・終了点が一致するものもある。 日本では多くの場合、グレゴリオ暦の1月1日以外を開始点とするものが狭義の「年度」とされ、暦年と区別する意味で「年度」と呼んでいる。ただし、暦策定の目的ではない特定の目的で計算などをするために「1年」を定める必要がありそのための開始日を任意に定めており、たまたま1月1日でも良いのでそうしている場合も「年度」と呼ぶ。ま
さまざまな確率分布 probability distributions - 数理的思考 - 中川雅央 【知と情報の科学】 ■ さまざまな確率分布 (probability distributions) 観測される現象は,確率的に変動するものが多いと考えられます.その観測されたデータを説明する統計モデルに,どの確率分布を使えばうまく説明できるでしょうか. 正規分布や二項分布など,確率分布の種類は数多く,いろいろなカタチ(分布形)があります.確率分布の当てはめを考えるには,そのカタチ(分布形)を知ることが重要です.各確率分布の母数(パラメータ)によってそのカタチ(分布形)が決まります.確率変数には離散型と連続型があり,その範囲もさまざまです. このページは,代表的な確率分布について,それらを比較・検討しやすいように母数(パラメータ)やグラフ等を一覧表にまとめたものです. 1. 離散型確率分
今日は初心者向け記事です。 はじめに ある範囲の年齢の小学生32人を無作為に選び、算数のテストを受けてもらい、さらにその身長を測定しました。 身長に対する算数の点数のグラフは次のようになりました。 なんと、身長の高い子供の方が、算数の点数が高いという結果になりました! 身長が算数の能力に関係しているなんて、すごい発見です! しかしながら、結論から言うと、この結果は間違っています。 なぜなら、抽出したのは「ある範囲の年齢の小学生」であり、年齢の高い子も低い子も含まれているからです。 年齢が高いほど算数能力は高くなり、年齢が高いほど身長も高くなることは容易に推測できます。 この関係を図で表すと次のようになります。 つまり、年齢と算数能力に相関があり、年齢と身長にも相関があるため、身長と算数能力にも見かけ上の相関が見えているのです。 このような相関を擬似相関と言います。 統計解析では、このような
今日は、R-bloggers に面白い記事が上がっていたので、それを紹介してみようと思います。 問題 「子供にはすぐに解けて、大人にはなかなか解けない不思議な問題」をご存知でしょうか? 最近ネットで割と話題になりました。 その問題は、次のようなものです。 8809 = 6 7111 = 0 2172 = 0 6666 = 4 1111 = 0 3213 = 0 7662 = 2 9312 = 1 0000 = 4 2222 = 0 3333 = 0 5555 = 0 8193 = 3 8096 = 5 7777 = 0 9999 = 4 7756 = 1 6855 = 3 9881 = 5 5531 = 0 2581 = ? https://twitter.com/#!/yappyJP/statuses/172086299099004928 なかなか面白い問題です。 答えはここでは書きませ
Excelを用いて統計グラフを作成する手順や統計量を計算する手順、ブラウザ上で値を入力して統計量を出力する自動計算フォームを掲載しています。 統計グラフ自動作成Excelシート 箱ひげ図自動作成Excelシート Excelによる統計グラフの作り方 正規分布曲線のグラフの作り方 カイ二乗分布曲線のグラフの作り方 箱ひげ図の作り方(棒グラフ編) ヒストグラムの作り方 人口ピラミッドグラフの作り方 ラベル付き散布図の作り方 縦方向の折れ線グラフの作り方 正規確率プロットの作り方 エラーバー(誤差範囲)付き棒グラフの作り方 エラーバー(高低線)付き折れ線グラフの作り方 Excel関数の使い方 行列の転置・積・逆行列・行列式の計算方法 重複を除いてデータの件数を求める方法 複数の条件を満たすデータの件数を求める方法 必要なサンプルサイズの計算フォーム 母比率の区間推定 母平均の区間推定 Excelに
今日は主座標分析(Principal Coordinate Analysis; PCoA)の紹介を簡単にしたいと思います。 主座標分析は古典的多次元尺度構成法(Classical Multidimensional Scaling; CMDS)とも呼ばれる統計解析手法です。 この解析手法を使用する主な目的は、高次元のデータを2次元や3次元に落として視覚化したいという時に使います。 以前紹介した主成分分析と同じような感じですね。*1 主成分分析との違いを簡単に言うと、主成分分析はユークリッド距離をなるべく保ちながら低次元に落とす方法ですが、主座標分析はユークリッド距離だけでなく、他の距離や類似度*2が使えるという点にあります。 例えば、ユークリッド距離の代わりに相関係数を使えば、相関の高いもの同士が近い配置になるようなプロットを作ることが可能です。 データを用意する さっそくやってみたいのです
論文の紹介: 統計的ダウンスケーリング手法により構築された気候シナリオを用いるためのガイドライン Guidelines for Use of Climate Scenarios Developed from Statistical Downscaling Methods. RL Wilby et al. (Aug. 2004) ( http://www.ipcc-data.org/guidelines/dgm_no2_v1_09_2004.pdf ) 農業環境技術研究所の重要な研究目標の1つは、温暖化など地球環境の変動と農業生態系との相互作用を解明し、その管理技術を開発することである。重要研究課題を推進するため研究所内に設置されたリサーチプロジェクト(RP)の1つである 作物生産変動要因RP では、地球温暖化が水田生態系に及ぼす複合的な影響の解析、日本や東アジアにおける将来のコメ収量の変動
国立天文台が編纂する「理科年表」のオフィシャルサイトです。 理科年表は大正14年(1925)創刊以来の歴史と伝統を持つ科学データブックであり、自然科学のすべての分野を網羅したユニークなものです。このサイトでは、理科年表のデータを使いこなすためのガイドを提供いたします。ぜひともお役立てください。
お金を借りる知識をつけたい方におすすめのwebメディアです。 お金を借りる カードローンおすすめの記事などを主に掲載しております。 お金を借り入れやカードローンについての知識を得たい方やおすすめのおまとめローンなどについて知りたい方におすすめのサイトです。 もちろん皆さまお馴染みのおまとめローンの審査についても学べますよ。 分かりやすい少額融資のやり方やカードローン借り換えの仕組みについて大解説しちゃいます。 今すぐお金が必要な方向けの即日融資の方法も大解説しちゃいます。 消費者金融であるアコムの借りたら終わりという噂の真相などを解決していきます。 レイクの審査は甘いのかプロミスの審査基準も大解説。 無職でお金を借りることや専業主婦のカードローンの事についても書いてます。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く