タグ

検定に関するfeketerigoremetのブックマーク (10)

  • データ分析手法の選び方

    統計解析の分析手法は、分析の目的、データの形式、尺度水準、データの特性、分析手法の特性等から選択します。。 統計解析の手法にはいろいろありますが、次のような点を踏まえて分析手法を選びます。 データ分析の目的を明確にする データの形式から分析手法を判断する 尺度水準から分析手法を絞り込む データの特性から分析手法を絞り込む(正規性・等分散性・標サイズなど) 検定力、頑健性なども考慮する データ分析の目的と分析手法 データ分析の目的によって次のように分析手法を使い分けます。 ①仮説が正しいかどうかを判定する・・・各種検定 関係性の検定・・・グループ間の関係が独立であるかどうかを検定する 差の検定・・・グループ間の代表値の差を検定する 平均値の差、中央値の差、分散(バラつき)の差 ※比率の差(変数間の比率の差)の検定は、グループが互いに独立であるかどうかを調べることになり、関係性の検定と同

  • Fisherの正確検定

    はじめに Fisher(フィッシャー)の正確検定(Fisher's exact test)は,分割表(クロス集計表)の各行(各列)が独立かどうかを調べる方法です。直接確率法とも呼ばれます。 この方法はFisherが1935年に著した The Design of Experiments というの序章の次の第2章の最初に出てくる有名な lady tasting tea の問題を解くために使われています。Fisherの帰無仮説の考え方を最初に説明したものとしても有名です。 2×2分割表の検定 2008年12月8日のニュースによれば,麻生内閣の支持率が前回と比べて半減しました。ネットで調べられる限りの結果を私のブログに載せました。これを見ると,20.9%から25.5%と,かなりばらつきがあります。このばらつきは偶然と考えていいでしょうか。 回答数のわかっている調査について,人数に直すと,次のよう

  • 心理データ解析第3回(2)

    この結果をSPSSのχ2検定によって検討し,賛成意見よりも反対意見の方が統計的に有意に多いことを示したい。 SPSSを起動する(既に起動してある場合には,以前のデータを保存し,ファイルメニュー→新規作成→データ) SPSSデータエディタの「変数ビュー」を開く 1番目の変数の名前に「回答」 「型」は数値,「幅」「小数桁数」はデフォルトのまま 「ラベル」に「質問の回答」と入力 「値」の「...」をクリック。値ラベルを指定する。 「0」が「反対」,「1」が「賛成」になるように指定する 「測定」の部分を「名義」にする(名義尺度の水準なので) SPSSデータエディタの「データビュー」を開く 1番目から5番目までに「1」(賛成)を,6番目から20番目までに「0」(反対)を縦に入力 自由度1,カイ2乗値は5.00,5%水準で有意である。 レポート等に記述する時は… χ2=5.00, df=1, p<.0

  • 統計学入門−第5章

    (a) 2つの変数が計量尺度の時 最も基的であり、図5.5.2の左上の図のように普通の回帰直線を求め、その回帰係数の検定および推定を行います。 そして回帰直線の当てはまり具合を表す指標として寄与率を求めます。 (→5.1 相関係数と回帰直線 (2)回帰分析) (b) 説明変数が順序尺度で目的変数が計量尺度の時 この場合は順序尺度のデータを適当に計量尺度化し、それを用いて回帰分析を行います。 説明変数は確率変数ではないため、目的変数との関係が直線的であり、かつ実質科学的に妥当なものであればどのように計量尺度化してもかまいません。 (→5.1 相関係数と回帰直線 (2)回帰分析) (c) 説明変数が計量尺度または順序尺度で目的変数が順序尺度の時 この場合は順序尺度を適当に計量尺度化して回帰分析を適用するか、それとも順序ロジスティック回帰分析を適用します。 順序ロジスティック回帰分析については

  • Machine Learning | Coursera

    We asked all learners to give feedback on our instructors based on the quality of their teaching style.

    Machine Learning | Coursera
    feketerigoremet
    feketerigoremet 2013/12/28
    Andrew Ngによる機械学習の授業 クラスタリングとかk-meansとかも全部機械学習
  • 分散分析

    ● はじめに さて、今回は「分散分析」というものを扱います。 前回の検定の概念は理解できましたでしょうか?それではさっそく始めていきましょう。 ● 分散分析とは 分散分析とは、言ってしまえば検定の中の1つです。先ほどの検定でお話ししましたとおり、扱うデータの種類や数などによって検定を行う手法が異なります。その中で、2つ以上の水準を考慮しながらそれぞれの要因の有意性や要因を探ろうとした手法が、分散分析(analysis of variance)通称ANOVA法です。 データには元々ばらつき(誤差)があります。この誤差によるばらつきを、要因によって変化した値と混同してしまうと間違った分析の元となってしまいます。 そこで、意味のない変動(誤差変動)と意味のある変動(要因によって変化した部分)の分散を分け、その分散比を求めることで、要因による変動が誤差に比べて十分に大きければ要因による

  • やったー!僕にもANOVAの原理がわかったよ! - ほくそ笑む

    以前のエントリにも書いたけど、マイクロアレイ発現解析は基的に2つのグループ間での発現量の比較をします。例えば「病気の人 v.s. 健康な人」とか「薬を飲んだ人 v.s. 飲んでない人」とかです。こういうときは2群間検定(t検定とか)を使えば発現量の差が有意な遺伝子を特定できます。 しかし、たまに癌のグレード(重症度)とかのデータでコントロール(健常者)のデータが無いときがあります。このとき比較したいのは「グレード1 v.s. グレード2 v.s. グレード3」という、3つのグループ間で発現量を比較することになります。 3つのグループ間での発現量を比較するときは、t検定のような2群間比較の手法を「グループ1 v.s. グループ2」「グループ2 v.s. グループ3」「グループ3 v.s. グループ1」のように複数回行えばできるのですが、検定には間違う確率が常に付きまとうので、何度も検定を繰

    やったー!僕にもANOVAの原理がわかったよ! - ほくそ笑む
  • 23 多変量解析を用いた メタボロームデータ解析 Multivariate Analysis Approach for Metabolome Data Analysis 4.1 メタボロミクスにおける多変量解析の役割 メタボロミクスにおいて、多変量解析はデータの

    23 多変量解析を用いた メタボロームデータ解析 Multivariate Analysis Approach for Metabolome Data Analysis 4.1 メタボロミクスにおける多変量解析の役割 メタボロミクスにおいて、多変量解析はデータの視覚化、または回帰・判別の予測モデ ルの構築のために用いられている。多変量解析の手法としてよく知られ、またメタボロミク スで比較的よく用いられる方法として、主成分分析 * (Principal Component Analysis, PCA)50 または Partial least squares** (PLS)51 が挙げられる。主成分分析と PLS の違いは、その計算に 群情報を用いるか否かであり、前者は教師なし、後者は教師あり次元削減法 *** として区別さ れる。多変量解析の理論的詳細については、様々な書籍 ( 例えば文

  • Rでt検定 1

    t検定の仮定 来,t検定には,さまざまな仮定が伴うものである。 各群の標が,いずれも正規母集団から得られたものであること(正規性) 各群の母分散が等しいこと(等分散性) したがって,t検定の実施に先立って,これらの仮定が成り立つかどうかを判断しなければならない。 そのために,正規性と等分散性について,それぞれ異なる検定を行う必要がある。 正規性の検定 2群のデータの分布が,正規分布に従うかどうかを検定する。 この目的には,Kolmogorov-Smirnov(コロモゴロフ・スミノフ)検定がよく用いられる。 Rでは,この頭文字をとって ks.test() という名前の関数が用意されている。 この検定の帰無仮説は「あるデータが,正規分布をなす」である。 したがって,P値が大きければ,正規分布であると判断できる。 > ks.test(x$A,"pnorm",mean=mean(x$A),sd

  • 1