タグ

か仮説検定に関するmidnightseminarのブックマーク (13)

  • 検定の繰り返しと多重比較について(追記あり) - StatsBeginner: 初学者の統計学習ノート

    真ん中らへんに追記しました。 多重比較とは たとえば学校のクラスがA〜Bの3つあって、それぞれの国語のテストの平均値を比較して、「クラスによって国語の成績は異なるかどうか」を調べるときに、とりあえず分散分析を行いますね。しかし分散分析でクラスの効果が有意であったとしても、 A⇔B B⇔C C⇔A のどの組み合わせにおいて有意な差があるのかはわかりません。そこで、下位検定として多重比較ってのを行うように、と統計の教科書には書いてあります。 分散分析を上位検定として多重比較を下位検定と呼ぶ必要は必ずしもなく、最初から多重比較を行えばいいとも言えますが、「まず分散分析を行って、有意だったら多重比較」という手順で考察することは多いらしい。定番の手順をまとめたベージもありました。 で、初心者的にいうと、「何かと何かの平均値の差が有意であるかどうかを調べたい」場合に、2群の比較であればt検定が用いられ

    検定の繰り返しと多重比較について(追記あり) - StatsBeginner: 初学者の統計学習ノート
    midnightseminar
    midnightseminar 2014/11/08
    Yahoo!知恵袋で教えてもらったことを踏まえて追記した。
  • 信頼区間って何?

    「95%信頼区間とは,真の値が入る確率が95%の区間のことです」というような説明をすることがあります。私も,一般のかたに説明するときは,ついそのように言ってしまうことがあります。でも当は真っ赤なウソです。主観確率を扱うベイズ統計学はここでは考えません。 正規分布では,ウソの考え方をしても結論が同じになることがあるので,ここではわざと,左右非対称なポアソン分布を考えます。 ポアソン分布とは,1日に起こる地震の数,1時間に窓口を訪れるお客の数,1分間に測定器に当たる放射線の数などを表す分布です。平均 $\lambda$ のポアソン分布の確率分布は次の式で表されます: \[ p_k = \frac{\lambda^k e^{-\lambda}}{k!} \] $\lambda = 10$ のポアソン分布の確率分布をグラフにすると次のようになります(当は右に無限に延びるのですが,$k = 30

    midnightseminar
    midnightseminar 2014/10/13
    たいへんわかりやすい。
  • 信頼区間って難しい。頻度主義者にはなり難い。

    umedam @umedam 【120文字で標誤差を説明】 1)有権者の中の当の内閣支持率が45%だったとする 2)1000人の回答者を無作為に選んで 内閣支持率を質問する 3)2の過程を数多く繰り返すと, 得られた内閣支持率の95%程度が45%±3, すなわち42-48%の間に集まる こんな感じ? 2014-10-13 13:49:30

    信頼区間って難しい。頻度主義者にはなり難い。
    midnightseminar
    midnightseminar 2014/10/13
    信頼区間は、毎回、頭がこんがらがる
  • 首相の「血液型O型」の割合は日本人の平均より有意に多い(産経新聞の記事の数字を検定してみる) - StatsBeginner: 初学者の統計学習ノート

    血液型と性格の関係 産経新聞のネット記事で、首相の血液型はO型が多いということや、増税する首相はB型が多いといったことが書かれていました。 この一覧表をみてみると、興味深いことがいくつか浮かび上がってきました。 1つは、O型が突出して多いということです。36人中18人と実に半数を占めており、次いでA型の10人、B型の5人、AB型の2人(小磯国昭は不明とされていました)。 日赤などの資料による日人の割合(A型は4割、B型は2割、O型は3割、AB型は1割)と比べてみると、歴代首相のデータには偏りがあるのがわかります。 【政治デスクノート】「増税」と「首相の血液型」の仰天関係… 財務省“極秘資料”は雄弁に語っていた(1/4ページ) - 産経ニュース 私は、血液型性格占いが科学的にはまったく支持されていないというのは知ってますが*1、個人的には関連性があったほうが面白いと思っていて、血液型の話は

    首相の「血液型O型」の割合は日本人の平均より有意に多い(産経新聞の記事の数字を検定してみる) - StatsBeginner: 初学者の統計学習ノート
    midnightseminar
    midnightseminar 2014/10/08
    A型:O型:B型:AB型の全体の比率に関するカイ二乗検定(適合度検定)についても追記した。
  • 母比率の検定とは何? わかりやすく解説 Weblio辞書

    例題: 「母不良率が 3% であるはずの生産工程から,製品 20 個を取り出したとき,不良品が 2 個あった。母不良率が 3% から変化しているかどうか検定しなさい。」 検定手順: 記号の定義 ケース数を n,そのうちで対象とする属性を持つもの(陽性数と呼ぶことにする)の数を r とする。標比率を p = r / n,母比率を π,母比率の特定の値を π0 とする。 例題では,n = 20,r = 2,p = 2 / 20 = 0.1,π0 = 0.03 である。 前提 帰無仮説 H0: 「母比率はある値である π = π0」。 対立仮説 H1: 「母比率はある値と異なる π ≠ π0」。 有意水準 α で両側検定を行う(片側検定も定義できる)。 正規分布に近似する方法 ・・・・・・・・ min [ n × π0 , n × ( 1 - π0 ) ]≧ 5 の場合 例題の場合,n × π

  • 「知恵ノート」は終了いたしました - Yahoo!知恵袋

    平素よりYahoo!知恵袋をご利用いただきありがとうございます。 2017年11月30日をもちまして、「知恵ノート」機能の提供を終了いたしました。 これまでご利用いただきました皆様にはご迷惑をおかけすることとなり、誠に申し訳ございません。 長年のご愛顧、心よりお礼申しあげます。 引き続き、Yahoo!知恵袋の「Q&A」機能をご利用ください。 Yahoo!知恵袋トップ 知恵ノートサービス終了のお知らせ プライバシー - 利用規約 - メディアステートメント - ガイドライン - ご意見・ご要望 - ヘルプ・お問い合わせ JASRAC許諾番号:9008249113Y38200 Copyright (C) 2018 Yahoo Japan Corporation. All Rights Reserved.

    「知恵ノート」は終了いたしました - Yahoo!知恵袋
  • ヒストグラムと密度曲線

    1標の母平均の検定では、paired 、var.equal はデフォルトの設定を変える必要はない。次に例を用いてその使用方法を示す。 平成15年度文部科学省の調査によると全国の17際男子の平均身長は170.7cmである。某高校17際の男子25人について調査を行ったところ次に示すデータが得られたとする。ここでは関数t.testと標データを用いて前節と同じの検定を行うことにする。データの入力と関数t.testの使用例を次に示す。 >x<-c(171.6, 173.6, 167.6, 169.1, 183.0, 173.7, 168.3, 169.9, 182.3, 166.0, 172.8, 184.1, 158.9, 168.1, 168.5, 175.3, 179.6, 170.7, 173.1, 173.6, 169.1, 167.9, 177.8, 171.8, 178.

  • 比率の検定・独立性の検定

    1.母比率の検定 標におけるある比率が母集団の比率と等しいかどうかを検定する方法です. 標における比率をp,母集団における比率をp0とすると,帰無仮説H0: p = p0に対して検定統計量, が標準正規分布に従うことを利用して検定します.判断基準は以下のようなものでした.

  • P値が有意になるように頑張りすぎちゃっていませんか?

    Natureに統計学的検定の問題についてのエッセイが出ていた。フィッシャー、ネイマン、ピアソンの言い争いの紹介も含めて、P値にまつわる議論を短くまとめている。何でも、この世には統計学的に有意であるのに再現性の無い調査や研究は多々あるのだが、統計学的な検定を盲信してしまい考察が疎かになっているせいだそうだ。 P値を扱うときの問題が三つ上げられている。一つは、偽陽性の可能性がP値から連想する以上に高いことだそうだ。統計学的な厳密な議論は説明されていなかったが、例えば帰無仮説が0.5のときに、P値が0.01で有意になったとしても、再現実験では11%以上の確率で再現が得られないそうだ。一つは統計的有意であることに満足して、その効果の大きさを考察しないことがあるそうだ。一つは、P値が有意になるように分析方法を工夫しすぎてしまうケース(P-hacking)があるそうだ。 エッセイでは探索的研究と検証的

    P値が有意になるように頑張りすぎちゃっていませんか?
  • 統計学的検定に対するある拒絶反応

    「この最後の信頼区間の使い方違和感ありません?」と言われて、「仮説検定はいらない(Request for Comments|ご意見求む)」と言うブログのエントリーを見てみたら、色々と統計学への誤解が積み重なっており、さらにデータが仮説を裏付けないと言う事実に拒絶反応を示していた。色々と問題があるのだが、気付いたところを幾つか列挙してみたい。 1. 仮説検定は基的に行うべき 問題エントリーで『「施策の効果をテストしたいな」「はい。仮説検定」って、それってのび太くんにとって有益なの?』と言っているが、仮説検定をしないのはむしろ有害に思える。やっても毒にも薬にもならない事もあるわけで、そういう状況を示せ無いようなデータ分析にどれほどの意味があると言えるのであろうか。創意工夫した施策の効果が有意性無し(=施策の効果があるとは言えない)と言われたら面白くは無いであろうが、必ずしも都合の良い結果が出

    統計学的検定に対するある拒絶反応
  • そもそもビジネスの現場ではどういう「レベル」の統計学を使うべきなのか - 渋谷駅前で働くデータサイエンティストのブログ

    データサイエンティストブームが去りつつある一方で、データ分析ブームそのものはじわじわと広がり続けている感じのする昨今ですが。最近また、色々なところで「当にビジネスやるのに統計学って必要なの?」みたいな話題を聞くことが増えてきたので、何となくざっくりまとめて書いてみました。 ちなみに今回の話題の参考図書を挙げようと思ったら、この辺ですかね。 とある弁当屋の統計技師(データサイエンティスト) ―データ分析のはじめかた― 作者: 石田基広,りんと出版社/メーカー: 共立出版発売日: 2013/09/25メディア: 単行この商品を含むブログ (13件) を見る 統計学入門 (基礎統計学) 作者: 東京大学教養学部統計学教室出版社/メーカー: 東京大学出版会発売日: 1991/07/09メディア: 単行購入: 158人 クリック: 3,604回この商品を含むブログ (78件) を見る 当は赤

    そもそもビジネスの現場ではどういう「レベル」の統計学を使うべきなのか - 渋谷駅前で働くデータサイエンティストのブログ
    midnightseminar
    midnightseminar 2014/01/22
    赤本て文章は下手な気はする。
  • サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ

    Author:くるぶし(読書猿) twitter:@kurubushi_rm カテゴリ別記事一覧 新しいが出ました。 読書猿『独学大全』ダイヤモンド社 2020/9/29書籍版刊行、電子書籍10/21配信。 ISBN-13 : 978-4478108536 2021/06/02 11刷決定 累計200,000部(紙+電子) 2022/10/26 14刷決定 累計260,000部(紙+電子) 紀伊國屋じんぶん大賞2021 第3位 アンダー29.5人文書大賞2021 新刊部門 第1位 第2の著作です。 2017/11/20刊行、4刷まで来ました。 読書猿 (著) 『問題解決大全』 ISBN:978-4894517806 2017/12/18 電書出ました。 Kindle版・楽天Kobo版・iBooks版 韓国語版 『문제해결 대전』、繁体字版『線性VS環狀思考』も出ています。 こちらは10刷

    サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ
  • 「A/Bテストの数理」への批判:「有意」とはなにか - 廿TT

    目次 ※誤解を招く書き方だったようですが、記事の主張は有意水準を20%にしろということではないです。仮説検定をやるなら、「有意」っていうのがどういうことか、わかった上でやろうよ、ということです。そして意思決定を「有意水準5%」に丸投げするのはやめよう、リスクとベネフィットを考慮しようということです。 はじめに 「A/Bテストの数理」への批判 よくありそうな質問や反論とその回答 A/Bテストのガイドライン:仮説検定はいらない(Request for Comments|ご意見求む) - 廿TT に続く この記事は↓下記のブログへの批判です。 A/Bテストの数理 - 第1回:人間の感覚のみでテスト結果を判定する事の難しさについて - - doryokujin's blog ※注意:字が多いです。 けっこう話題になってるみたいなので、その尻馬にのろうとおもいました。 ↑字が多いのにこんなに読まれ

  • 1