「〜の変化は…でX割説明がつく」という言い回し - 発声練習 ピアソンの積率相関係数を割合や確率として扱うのは論外ではないかと思いますが、それは措いて、決定係数(寄与率)に関して、説明出来るとか説明がつくといった表現は、結構見るように思います。 そこで、手許にある統計の本を参照して、この用語がどのように解説されているかを引用してみます。自分の知識の整理にもなりますし。 尚、引用文中にある決定係数の数式は省略し、<数式>と書きます。 ※強調は原文のまま 工学・品質管理・実験計画系 F検定によって,有意性を検定するだけでなく,要因によるばらつきが,全体の変動Srのどのくらいを占めているかを調べることがある。それには,寄与率を求めればよい。 例えば,<数式> したがって,全体のばらつきの43.4%を成形温度という要因で説明できることがわかる。 谷津『すぐに役立つ実験の計画と解析 基礎編』(P56
1. 確率変数Xの分散V(X)は、Xの期待値をE(X)とすると、V(X) = E( (X - E(X) )^2)で定義される。 2. 言い換えれば、分散とは「「期待値からのずれ」の二乗」の期待値である。 3. 分散は、確率変数の値がどれだけ期待値からずれるかを表すもの(として定義したい)。 4. 期待値からのずれは大きくずれる場合と小さくずれる場合の二つがある。 5. 二乗しておけばどっちに転んでも大丈夫。 6. でも、絶対値を取ることにしてもいいよね。 7. いいけど、絶対値とる計算よりも二乗するほうが計算便利だし。 …と、ここまではいいと思うんですが、以下のA,Bも二乗する定義を採用する理由になるでしょうか? A. 分散に対して、等式 V(X) = E(X^2) - (E(X))^2 が成り立つ。 《分散は、平方の期待値から期待値の平方を引いた値になる》 B. 確率変数Xが期待値からず
3. 今回のもくじ イントロ -『相関と因果』再訪 基礎編 - 因果概念の変遷: 心の習慣 から 反事実 へ - 因果と確率論を繋ぐ:Pearlのdo演算子 実務編 - 重回帰とは因果構造分解酵素である - バックドア基準による変数選択 考察 - 因果推論の不可能性, モデル選択の3視点 4. 相関と因果は一致しない 86 女 性 84 の 平 82 均 寿 80 命 78 (歳) 30 34 38 NHKの放送受信契約数(百万) http://www.stat.go.jp/data/nihon/02.htm 元データ→ http://pid.nhk.or.jp/jushinryo/know/pdf/toukei2010.pdf 5. 相関と因果は一致しない 86 p < 0.00000002 女 2 性 84 R = 0.99 の 平 82 均 寿 80 命 78 (歳) 30 34 3
日本で8月に最もよく売れたWiley(Wiley-Blackwell, Wiley-VCHを含む)の理工書トップ5をご紹介します。タイトルまたは表紙画像をクリックすると、目次やサンプル章(Read an Excerpt)など、詳しい内容をご覧いただけます。 1位 Sequence Stratigraphy Edited by Dominic Emery, Keith Myers ISBN: 978-0-632-03706-3 Paperback / 304 pages / August 1996 地層学の有力な手法として近年急速に重要性を増した「シーケンス層序学」に関する古典的教科書です。British Petroleum (BP) で使われた研修用教材を基に編纂されたもので、シーケンス層序学の基本的な概念とテクニック、応用法を解説します。 2位 Advanced Analysis of
データ解析の重要性が認識されつつある(?)最近でさえも,A/Bテストを始めとしたテスト( = 統計的仮説検定:以後これをテストと呼ぶ)の重要性が注目される事は少なく,またテストの多くが正しく実施・解釈されていないという現状は今も昔も変わっていないように思われる。そこで,本シリーズではテストを正しく理解・実施・解釈してもらう事を目的として,テストのいろはをわかりやすく説明していきたいと思う。 スケジュール スケジュール 第1回 [読み物]:『人間の感覚のみでテスト結果を判定する事の難しさについて』:人間の感覚のみでは正しくテストの判定を行うのは困難である事を説明し,テストになぜ統計的手法が必要かを感じてもらう。 第2回 [読み物]:『「何をテストすべきか」意義のある仮説を立てるためのヒント』:何をテストするか,つまり改善可能性のある効果的な仮説を見いだす事は,テストの実施方法うんぬんより本質
研究者の多くはエラーバーの意味をろくに理解していない 今日、私は認知科学日記の読者がエラーバーをどれだけ理解しているかを問うオンライン投票を開始した――エラーバーとはよくグラフに乗っている、あの小さなI字型の、統計学の賜物である。正しく理解していないだろうということは、大体予想済みである。なぜそんなに自信があるかって? それは2005年、サラ・ベリア(Sarah Belia)らのチームが、最前線の心理学、神経科学、医学ジャーナルに論文を掲載したことがある数百人の研究者を対象に行った研究成果があるからである。彼らのうちエラーバーと有意さの関係について正しい知識を示したのはほんの一握りであった。論文を掲載した研究者たちができないなら、どうしてカジュアルなブログの読者ができることを前提としてよいだろうか? 信頼区間 まずそもそも、問題の解決法を知るため、少々の説明が必要である。信頼区間というコン
について世上どのような考察がなされているか知りたいとふと思い、ぐぐってみたところ、このパワーポイントに行き当たった*1。書いたのはFrancois LevequeとLina Escobar。著者のうちLevequeはCERNA(Centre d'Economie Industrielle MINES ParisTech=パリ国立高等鉱業学校産業経済研究所)経済学部教授(HP)で、知財やエネルギー問題が専門で、EU Energy Policy Blogというブログに寄稿しているとの由。 そのパワーポイントの概要は以下の通り。 これまでに観測された炉心損傷事故は、14400年・炉数の中で、以下の11件*2。 Year Location Unit Reactor type 1959 California, USA Sodium reactor experiment Sodium-cooled p
伝えるための心理統計: 効果量・信頼区間・検定力 作者: 大久保街亜,岡田謙介出版社/メーカー: 勁草書房発売日: 2012/01/26メディア: 単行本購入: 9人 クリック: 164回この商品を含むブログ (13件) を見る先日コメント欄でYJSZKさんに教えて頂いた本です。書店に寄って、中身を確認してみました。 細かい評価は精読していないのでまたの機会にするとして、書の傾向・性質を考えれば、これぞまさに、私が「求めていた」本だと思います。 統計の勉強をしていて多くの人が悩む所として、 統計的検定の意義、「有意」とはどういう概念か、もし具体的な科学研究において「有意」となった場合に、どこまでの事が言えるのか。また、有意である事が、差の「大きさ」などの、科学において最も関心ある事柄について、一体どれくらいの情報を与えてくれるのか。 これらの事が挙げられると思います。 この種の疑問は、統計
前から思っていた事。放言です。 偏りの無い(6面の)サイコロを投げた時、それぞれの目が出る確率は1/6である。 この種の説明を見ていつも覚える違和感。 これは方向が逆で、 それぞれの目が出る確率が1/6であるサイコロを「偏りが無いサイコロと定義」する。 という事なんじゃないかと思ったり思わなかったり。 確率統計の説明って、現象を手がかりにして数理を理解させようとする工夫がよくありますが、それが逆にもの凄く解りにくくする場合も……という気がします。さっと流す人はいいかも知れませんが、私などは、この種の事に異様に拘ってしまうので…。つまり、「偏り」という概念と、数学的な「確率」の考え、そして、現実に存在する「サイコロ」という道具とをどのように結びつけるか。何故、「偏りが無い」という概念と「それぞれの目の出る確率が等しい」という事とが同じだと前提されているのか。みたいな所をいつも考えてしまいます
ほとんど、ちがやまるさん&YJSZKさん向けエントリー的。 でも、紹介する記述は、多くの人に参考になると思います。 前のエントリーで紹介した本で引用した文の続き。超大事な所なので、かなり長く引用します。※P270-272より引用。数学記号には、見えない時用に、括弧つけて別表現をします。(標本平均Xは「Xバー」とするなど)。強調+青文字装飾は、重要だと私が思った部分に施しました。 ビジネス統計学【上】 作者: アミール・アクゼル,ソウンデルパンディアン・ジャヤベル,鈴木一功,原田喜美枝,手嶋宣之出版社/メーカー: ダイヤモンド社発売日: 2007/03/16メディア: 単行本購入: 6人 クリック: 166回この商品を含むブログ (16件) を見る 中心極限定理によれば、平均がμ、標準偏差がσのどのような母集団であっても、数多くの無作為標本を選択すれば、その標本の平均X(Xバー)は(少なくと
「95%信頼区間とは,真の値が入る確率が95%の区間のことです」というような説明をすることがあります。私も,一般のかたに説明するときは,ついそのように言ってしまうことがあります。でも本当は真っ赤なウソです。主観確率を扱うベイズ統計学はここでは考えません。 正規分布では,ウソの考え方をしても結論が同じになることがあるので,ここではわざと,左右非対称なポアソン分布を考えます。 ポアソン分布とは,1日に起こる地震の数,1時間に窓口を訪れるお客の数,1分間に測定器に当たる放射線の数などを表す分布です。平均 $\lambda$ のポアソン分布の確率分布は次の式で表されます: \[ p_k = \frac{\lambda^k e^{-\lambda}}{k!} \] $\lambda = 10$ のポアソン分布の確率分布をグラフにすると次のようになります(本当は右に無限に延びるのですが,$k = 30
「ランダムに事象が起きる」という考え方 次の図は1200秒間に初代ポケットガイガー(PINフォトダイオードを使った放射線計)が放射線をカウントした時刻を示したものです。下は机の上にそのまま置いた場合(全部で17カウント),上はやさしお(カリウムを多く含む塩)の上に置いた場合(全部で38カウント)です。 par(mgp=c(2,0.8,0)) plot(c(0,1200), c(0,3), type="n", axes=FALSE, xlab="", ylab="") axis(1) x1 = c(55,81.5,178.1,194.4,214.3,254.3,517.8,548.7, 553.6,556.6,700.1,730.7,735.6,881.9,883.3,962.2,1164.2) x2 = c(43.9,54.8,85,94.3,115.2,224.5,228.5,246.1
1998 年情報論的学習理論ワークショップ 1998 Workshop on Information-Based Induction Sciences (IBIS'98) Hakone, Japan, July 11-12, 1998. Model Selection and Related Topics in Statistical Sciences 伊庭 幸人 Yukito Iba モデル選択とその周辺 Abstract: There are a number of statistical methodologies, each of which has its own philosophy and mathematical background. A way to understand them is to regard them as tools for de ning
本編の方はフィデューシャル推測の項まで書いたのでもう良いかなあ、と思って終わりにして、今回から同書の「素晴らしすぎる訳者解説」のメモを書いていきます。 訳者の方は「渋谷政昭・竹内啓」さんなのですが、巻末の訳者解説が本当に素晴らしく完成度が高いのです。「池上彰か!」とツッコミたくなるくらいその解説は分かりやすく明確です。 こんな素晴らしい解説文が絶版により埋もれてしまうのは大きな文化的損失ですので、本来ならば全文引用したいところですが、色々な事情もありますので、フィデューシャル推測に関する部分だけを引用していきます。とはいっても長いので何回かに分けて見ていきます(かなり長丁場のシリーズになるかもしれません)。 同書201pの第3節の部分から引用していきます: 統計的推測の問題をはっきりさせるために、一つの例をあげて説明しよう。 今あるものの長さを測って、75.8cm、75.9cm、75.2c
元総務大臣の竹中平蔵氏が、地震の発生確率についてラフに計算した数字をtwitterでつぶやいたので反響を呼んでいる。 この先一年、一ヶ月で考えれば確率は小さいと言いたかっただけなので、適当につぶやいたと思うのだが、『正しい確率計算』に関して錯綜した意見が飛び交っていたので、文系らしく説明してみる。 1. 周期性の有無で確率分布が変わる 地震の発生確率の予測は、まず確率分布を仮定し、過去の発生間隔をあてはめることになる。 ここで周期性が無い場合は指数分布を、周期性が有る場合は対数分布やワイブル分布、BPT分布をあてはめる事になる。 分布が変わると、大きく確率は変化する。特に指数分布と、その他の分布では何倍もの差になるので、どちらを採用するかで世界が変わる。 2. 確率分布はBPT 東海地震の発生確率の予測には、Brownian Passage Timeと呼ばれる確率分布が予測に使われている。
イカレ仲間である友人、物理学者の田崎晴明さんがぼくの始めたばかりのこのブログ をご自身のHP( これ) で紹介してくださったので、 なんかあっという間にアクセス数が100倍くらいになった。 今回は、その田崎推奨記念ということで。 田崎さんとは、ネット内のとある場所で、いろいろな議論をさせて いただいていて、話題は多岐にわたるけど、大好きなアイドル談義は 今回はおいといて、彼との数々の議論の中から確率論の話題を取り上げようと思う。 これは、お互いに忙しくて現状ペンディングになっているものだ。 それは、「もうそろそろいいかげん、確率論の新しい時代に入ろうよ」 とぼくが提案したことから始まった議論である。 現在の確率論の定番は、コルモゴロフの公理化したもので、 次のような公理から成るものだ。 (1) 空事象には数値0を割り当て、全事象には数値1を割り当て、 一般の事象には0以上1以下の数値を割り
確率論と統計学は俺がまとめるから、他の分野はお前らの仕事な。 確率論 Index of /HOME/higuchi/h18kogi 確率空間 生成されたσ-加法族 確率の基本的性質 確率変数とその分布 分布の例 分布関数 期待値、分散、モーメント 期待値の性質 独立確率変数列の極限定理 大数の弱法則(Weak Law of Large Numbers) 確率1でおこること 大数の強法則 中心極限定理 特性関数 Higuchi's Page Brown運動 Brown運動のモーメントの計算 連続性 Brown運動の構成:Gauss系として Brown運動に関する確率積分 空間L^2の元の確率積分 伊藤の公式(Ito formula) 日本女子大学理学部数物科学科の今野良彦先生のところにあった資料 最尤法とその計算アルゴリズム 収束のモード 大数の法則と中心極限定理 指数分布族モデルにおける最
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く