タグ

ブックマーク / tarotan.hatenablog.com (9)

  • メモ:分割表のPearsonカイ2乗検定が行和も列和も固定して導出されている件について 〜 2つの独立な二項分布を例にして〜 - Tarotanのブログ

    このブログ記事では,2つの独立な二項分布を例にして,分割表に対する統計量が,行和および列和の両方を固定した上で導出されていることを説明します.ここでは,次の3つの導出を紹介します. 多変量正規分布で近似して,多変量正規分布の条件付き分布から導出する. 超幾何分布を正規近似することで導出する. スコア検定(ラグランジュ乗数検定)から導出する. 記号 とが,それぞれ,独立な以下の二項分布に従っているとします. ここで2つの二項分布の確率パラメータは共通です.この確率パラメータは未知であるとします. と の和をとします().の実現値を小文字のと表します. このモデルにおいては,「このモデルから観測を無作為抽出したら,抽出ごとに値がコロコロと変わりうる」という意味で,は固定されていません. 多変量正規分布で近似して,多変量正規分布の条件付き分布から導出する と固定した上でのの条件付き分布を考えます

    メモ:分割表のPearsonカイ2乗検定が行和も列和も固定して導出されている件について 〜 2つの独立な二項分布を例にして〜 - Tarotanのブログ
  • 検定や信頼区間の前提が満たされない状況に対して,テキストはどう助言してきたか? - Tarotanのブログ

    このブログ記事は,他の記事と同様,筆者個人の意見であり,すべての責任は筆者個人だけにあります.所属組織は,一切の責任を負いません. このブログ記事は,履歴を残さず変更するかもしれません. 検定や信頼区間を導出したときに仮定した前提は,実場面では成り立っていないことが多いでしょう.そのような前提の不成立に対する対処方法を私なりに要約すると,次の7つぐらいに分類できると思います. (1)検定や信頼区間を使わない. (2)特定の分布からのズレにロバストな方法を用いる. (3)従来のモデルが,前提からのズレにロバストであることを強調する. (4)従来のモデルを一般化したモデルを用いる. (5)モデルチェックを重要視する. (6)デザインによって仮定が満たされるように努力する. (7)ノンパラメトリックなモデルを用いる. いま私の手元にあるテキストで,これら7つの話題がどのように取り上げられているか

    検定や信頼区間の前提が満たされない状況に対して,テキストはどう助言してきたか? - Tarotanのブログ
  • Akaike (1982) On the Fallacy of the Likelihood Principle を読んで - Tarotanのブログ

    はじめに このブログ記事では,以下の論文に対する個人的な感想を述べます. Akaike, H. (1982). On the Fallacy of the Likelihood Principle, Statistics and Probability Letters, 1, 75-78 同論文は,以下の論文集(pp.357-360)にも掲載されています. Parzen, E., Tanabe, K. and Kitagawa, G. eds. (1998). Selected Papers of Hirotugu Akaike. Springer-Verlag. [電子版 ] Selected Papers of Hirotugu Akaike | Emanuel Parzen | Springer このブログ記事は,Akaike(1982)の内容を正確に伝えるものではありません.正確な

    Akaike (1982) On the Fallacy of the Likelihood Principle を読んで - Tarotanのブログ
  • Fisherの紅茶実験は実話なのか? - Tarotanのブログ

    R.A. Fisherの紅茶実験に対する3つの説について このブログ記事では,Fisher(1935a)の第2章で登場する紅茶実験が実話かどうかについて述べます. Fisher(1935a)の紅茶実験は,"Lady Tasting Tea"という名称でも知られており,英語Wikipediaでも項目が立っています(2020年7月24日現在). en.wikipedia.org 岩沢(2014, pp.214-218)によると,この紅茶実験が実話かどうかについて,次の3つの説があります. 1920年代末のケンブリッジでの実話であり,Fairfield Smithが同席していた. 1919年〜1923年の Rothamsted農業試験場で,Fisher(1935a)での紅茶実験の原型となるだろう出来事があった,この時の被験者は,藻類学者の B. Muriel Bristol(結婚後は,B.

    Fisherの紅茶実験は実話なのか? - Tarotanのブログ
  • 反省文:p値を<データが偶然で生じる確率>と思うのはやめます - Tarotanのブログ

    はじめに 統計学のハウツーを読んでると,p値を<データが偶然で生じる確率>や<データが偶然だけによって起きた確率>と解説しているものを時々,見かけます.私自身も,長い間,p値をそのように解釈して,また,お客様や同僚に説明してきました. 2016年米国統計学会のp値声明では,<p値は,帰無仮説が正しい確率ではない!>や<p値は,データが偶然で生じる確率ではない!>と忠告されています.p値声明の日語訳(http://www.biometrics.gr.jp/news/all/ASA.pdf)では,「研究者は、しばしば P 値を帰無仮説が正しいという記述や、偶然の変動でデータが観察される確率に変えたがるが、P 値はそのどちらでもない。P 値は仮説やその計算の背後にある仮定に基づいたデータについての記述であり、仮説や背後にある仮定自身についての記述ではない。」とアドバイスされています. そのよ

    反省文:p値を<データが偶然で生じる確率>と思うのはやめます - Tarotanのブログ
  • 古典統計学・ベイズ統計・統計モデリングの関係について - Tarotanのブログ

    2019年1月4日 9:30頃 追記 同ブログ記事に対して黒木さんからTwitterにて以下のようなご指摘をいただきました(ごく一部のツイートだけを抜粋). #統計 もう一度書くと、 * 予測分布の予測性能の比較→AIC, WAIC, LOOCVなど * モデルによるサンプル生成の確率分布がサンプルの真の分布にどれだけ近いかを比較→自由エネルギー, BIC, WBICなど — 黒木玄 Gen Kuroki (@genkuroki) January 3, 2019 ありがとうございます. ご指摘通り,このブログ記事では(最近の統計モデリングにおける特徴のひとつとして)予測性能の評価のほうしか取り上げておらず,特にAICしか触れていません. 特異モデルでも妥当であると言われているWAICへの言及ができなかったのは,私がまったく理解していないだけからです.ニューラルネットワークやベイズモデルなど

  • 読書感想:西内啓(2013)『統計学が最強の学問である』ダイヤモンド社 - Tarotanのブログ

    同書には、些細な事実誤認と思われる個所がいくつかある。そのなかのいくつかを以下に記す。いずれも同書の主旨には関係なく、重箱の隅を突くような指摘である。 ■p.002 ウェルズの予言 「「1903年、H.G.ウェルズは将来、統計学的思考が読み書きと同じようによき社会人として必須の能力になる日が来ると予言した」」(p.002) H.G.ウェルズ人は引用されているような文章を書き残していない。Tankard(1979)を参照のこと。ただし、Tankard(1979)の主張の一部を、Tee(1979)は否定している。 ■p.045 1937年の失業センサスに関する記述 「わざわざカードを入手して…」(p.045) このときの自己申告による全数調査では、「カード」は各世帯に配布されている。Hansen(1987, p.183)を参照のこと。 ■p.045 1937年の失業センサスに関する記述 「…

    読書感想:西内啓(2013)『統計学が最強の学問である』ダイヤモンド社 - Tarotanのブログ
  • あのひと、私が「分母の数」のことを「母数」と言ったら、どんな顔するだろう? - Tarotanのブログ

    ★★ 2016/08/17 19時頃 追加: お詫び ★★ taggaさんの日記(http://srad.jp/~tagga/journal/605281/ )に、ブログ記事の事実誤認や不備が指摘されています。全体的に私の考え方や調べ方が幼稚なのですが、特に、事実誤認が酷いところに取り消し線を入れました。 記事において 「denominator"の訳語として英和辞書に「母数」が登場することはブログで書いていた人がいました」 と述べていますが、これはtaggaさんのメモのことです(それらへのリンクは、先ほどのtaggaさんの日記(http://srad.jp/~tagga/journal/605281/ )に記載されています)。ただし、そこに書かれている内容を、私は、ほとんど忘れていて、かつ、歪めて記憶していました。引用しなかったことも含め、申し訳ございませんでした。 ★★ 2016/0

  • 相関係数の大きさに対する目安の歴史的変遷 - Tarotanのブログ

    2022年3月15日 Googleドライブの権限変更のため,ファイルが共有されていませんでした.リンクを変更しました. 「相関係数が0.7あれば、相関が高いと言える」 などの目安を、教科書や入門書で見かけたことは ありませんか? 私は、ちょくちょく目にするのですが、 どこの 誰が いつ 言い出したのか、ずっと不思議に思っています。 下記のリンクにあるPDFファイルで、その歴史的 変遷を追ってみました。 相関係数の大きさに対する目安の歴史的変遷.pdf 相関係数の大きさに対する目安の歴史的変遷.pdf - Google ドライブ 長くてすみません。 上手にまとめることができませんでした。 今回調べたところでは、20世紀初頭のアメリカに おける統計学や教育統計学の入門書において、 いくつかの目安が誕生したようです。 イギリスのGalton, K. Pearson, Spearmanなども 相関

    相関係数の大きさに対する目安の歴史的変遷 - Tarotanのブログ
  • 1