このとき、測定値の標本平均は$$\bar{T}=\frac{1}{N}\sum_iT_i=2.00\,\text{s}$$、標本不偏分散は$$s^2=\frac{1}{N-1}\sum_i(T_i-\bar{T})^2=1\times10^{-3}\,\text{s}^2$$、標準不確かさ6をタイプA評価すると、$$\frac{s}{\sqrt{N}}=1\times10^{-2}\,\text{s}$$である(ただし以下$N=10$)。学生がこの実験レポートを書くとき、こう記述することになるだろう。 $$T=2.00(1)\,\text{s}$$ 数理モデルの世界 このとき、次のような数理モデルを考える。 仮定0 :$x_1,\dots,x_N$は平均$\mu$の独立同分布に従う確率変数の実現値である。 仮定1 :$x_1,\dots,x_N$が従う分布は正規分布である。 仮定2 :$N
政党は、この15年でどう変わったのか。2度の政権交代を経て政策の立ち位置はどう動いたか。朝日新聞と東大谷口研究室が、政党の「現在地」を探った。
はじめに 今回は、RとExploratoryを使って、傾向スコアを用いた統計的因果推論(Causal Effects)を行ってみようと思います。想定読者層は、統計的因果推論を学び始めた人や私のようなExploratoryユーザーの方です。 この分析記事では統計的因果推論の詳細な説明や数理的な側面については扱いません。ごめんなさい。「Exploratoryで行う統計的因果推論」なので、この後利用するロジスティック回帰分析(Logistic regression)、傾向スコア(Propensity Score)、逆確率重みつき推定法(Inverse probability weighting)、また、これらに関連する諸々の概念も詳しくは扱いません。 数理的な側面を知りたい方は、個人的に知っている範囲の紹介にとどまりますが、星野先生、津川先生、林先生、清水先生、KRSK先生などのブログを読んだり
ちょっと前に「ワインの味わいとデータサイエンス」というお題で話してきたわけですが。 実は「単変量モデルという名の還元主義」vs.「多変量モデルに基づくデータサイエンス」というテーマを一貫して置いていたのですが、あまりそこにスポットライトが当たることはなかったなぁという印象を壇上では抱いていたのでした。ということで、ここでは改めてブログ記事の形で少し詳細に論じてみようかと思います。 なお今回使うデータは面倒なので先にRワークスペースとしてGitHubに置いてあります。DLしてきてお手元のワーキングディレクトリに置いてロードしておきましょう。 ここでは基本的に赤ワインのデータを見たいので、"winequality_red_blog.RData"を使います。白ワインのデータが別にありますが、こちらは以下のアプローチをお読みになった後で皆さん自身で試してもらえればと思います。 定量的に科学するとい
2019年1月4日 9:30頃 追記 同ブログ記事に対して黒木さんからTwitterにて以下のようなご指摘をいただきました(ごく一部のツイートだけを抜粋). #統計 もう一度書くと、 * 予測分布の予測性能の比較→AIC, WAIC, LOOCVなど * モデルによるサンプル生成の確率分布がサンプルの真の分布にどれだけ近いかを比較→自由エネルギー, BIC, WBICなど — 黒木玄 Gen Kuroki (@genkuroki) January 3, 2019 ありがとうございます. ご指摘通り,このブログ記事では(最近の統計モデリングにおける特徴のひとつとして)予測性能の評価のほうしか取り上げておらず,特にAICしか触れていません. 特異モデルでも妥当であると言われているWAICへの言及ができなかったのは,私がまったく理解していないだけからです.ニューラルネットワークやベイズモデルなど
以前から同様の指摘は様々な分野から様々な人々が様々な形で出してきていましたが、アメリカ統計学会が以下のような明示的な声明をこの3月7日(現地時間)に発表したということで注目を集めているようです。 AMERICAN STATISTICAL ASSOCIATION RELEASES STATEMENT ON STATISTICAL SIGNIFICANCE AND P-VALUES Provides Principles to Improve the Conduct and Interpretation of Quantitative Science https://www.amstat.org/newsroom/pressreleases/P-ValueStatement.pdf The ASA's statement on p-values: context, process, and p
なんと、首位攻防戦の10カードで負け越し無し。下位が混戦の時は、一気にBクラスまで押し返したこともあります。 勝率を見てみると、 首位攻防戦 20勝 5敗 1分 の .800 その他の試合 35勝28敗 1分 の .555 と、首位攻防戦にめっぽう強いことが分かります。 せっかくなので、フィッシャー検定をしてみましょう。 > fisher.test(matrix(c(20,5,35,28), ncol=2, byrow=T)) Fisher's Exact Test for Count Data data: matrix(c(20, 5, 35, 28), ncol = 2, byrow = T) p-value = 0.04972 alternative hypothesis: true odds ratio is not equal to 1 95 percent
今回は統計学で有名な「シンプソンのパラドックス」という問題について紹介したいと思います。簡単にいえば、同じデータでも分析の仕方によって全く矛盾したように見える結果が得られるというお話です。データだけ見ると、信じがたいような直感に反する現象がおきるので頭の体操としてとても面白いです。 あまりに有名なパラドックスであるため日本語でも解説がいくつか出ていますが、人によって言っていることが違っていたり、不完全であったりします。多くはシンプソンによるオリジナルの論文を読んでないことから起因するのだと思います。 例えばシンプソンのパラドックスを交絡の問題だと捉える人は多いですが、個人的に不完全だと思います(間違いではない)。このように誤解が広まった歴史的背景も含めて、詳しく書いていきたいと思います。ちなみにアニメのシンプソンズはこの問題と全く無関係です。 そもそもシンプソンのパラドックスとは? シンプ
男女比,平均年齢,掛け持ち――ログデータから明かされるゲームアプリの姿。JOGA「オンラインゲーム・マーケティングセミナー」をレポート ライター:箭本進一 一般社団法人 日本オンラインゲーム協会(JOGA)は2018年6月26日,東京都内にて「オンラインゲーム・マーケティングセミナー」を開催した。ゲームビジネスに特化したマーケティングリサーチを行うゲームエイジ総研のキーマンが登壇し,さまざまなデータからゲーム業界やアプリの実情を伝えた。 (左)ゲームエイジ総研 代表取締役 光井誠一氏 (右)ゲームエイジ総研 ストラテジスト 堀 浩也氏 国内のゲームユーザーは3400万人超。ゲーム機とスマホ・PCの比率は1:3 まずは国内ゲーム市場の動向について,ゲームエイジ総研 代表取締役の光井誠一氏から解説が行われた。なお,本稿で扱われるデータは2018年5月時点のもので,いずれもゲームエイジ総研調べに
ラジラジ言っている北海道の心理学者PsycheRadio氏と話をしていたときに、「心理学で(他の学問でも)統計的検定や推測統計学への批判が高まって以前ほど使われなくなりつつある」と言われたが、違和感がある。少なくとも社会科学分野で使われなくなったとは聞かない。話の流れにあわせて誤魔化されている気がするので確認してみた。 1. 確かに統計的仮説検定は非難されている PsycheRadio氏が全く無根拠な話をしているわけではない。統計的仮説検定によって、胡散臭い統計手法で有意性を捻り出してしまうこと(p-hacking)などが問題になっており、また統計モデルと研究上の仮説の相違を理解しない運用もある。アメリカ統計学会(ASA)が統計的仮説検定に対する注意を喚起する声明を出したぐらいだ。実際に、統計的仮説検定を禁止された雑誌もある。氏が例に挙げたBasic and Applied Social
かつての偉大な研究者の発見である中心極限定理や一般化中心極限 定理に触れた時、とても美しく素晴らしい内容だと思いましたが、一方で、 現実のデータに適応するには少々数学的な制約が厳しいと感じたの がこの研究の始まりでした。ビッグデータの時代と言われる昨今、べき 則に従うデータは数多く観測されており、この研究が、 そういった世の中に遍在するべき則を分析するための一助になれば と思っています。 概要 世界はべき則で溢れています。金融市場の株価変動や為替変動といった価格変動分布、地震が起こる間隔などの確率統計分布、そしてインターネットのトラフィックなど世界中の様々なビッグデータが、べき則であらわされることがデータ解析によりわかってきました。ただ、なぜ、べき則が、異なる現象に普遍的に現れるのかといった基本的問題が、未解決なまま残されていました。最近では金融取引の自動化が進み、株価や為替変動の高頻度化
483 化学と生物 Vol. 51, No. 7, 2013 セミナー室 研究者のためのわかりやすい統計学-3 統計検定を理解せずに使っている人のために III 池田郁男 東北大学大学院農学研究科 34 34 484 化学と生物 Vol. 51, No. 7, 2013 35 36 * 35 * 485 化学と生物 Vol. 51, No. 7, 2013 * 37 36 * 486 化学と生物 Vol. 51, No. 7, 2013 * 38 * 38 * * 37 487 化学と生物 Vol. 51, No. 7, 2013 39 * 40 * 39 40 * * 488 化学と生物 Vol. 51, No. 7, 2013 * 41 42 41 * 489 化学と生物 Vol. 51, No. 7, 2013 43 42 43 490 化学と生物 Vol. 51, No. 7, 2
408 化学と生物 Vol. 51, No. 6, 2013 15 μ σ μ σ μ σ 16 セミナー室 研究者のためのわかりやすい統計学-2 統計検定を理解せずに使っている人のために II 池田郁男 東北大学大学院農学研究科 15 16 409 化学と生物 Vol. 51, No. 6, 2013 μ σ σ σ μ σ * 17 μ σ μ σ * μ μ μ Z n 1 1 = − ( ) X µ σ σ 18 μ σ σ σ σ σ μ σ μ μ μ σ / n σ / n σ / n σ / n * * 17 18 σ 410 化学と生物 Vol. 51, No. 6, 2013 t u n 1 1 = − ( ) X µ σ σ σ σ σ μ t X 1 1 = − ( ) µ SE 19 μ μ μ μ μ 20 μ σ μ μ σ μ μ u n / 19 20 4
318 化学と生物 Vol. 51, No. 5, 2013 セミナー室 研究者のためのわかりやすい統計学-1 統計検定を理解せずに使っている人のために I 池田郁男 東北大学大学院農学研究科 319 化学と生物 Vol. 51, No. 5, 2013 1 1 320 化学と生物 Vol. 51, No. 5, 2013 2 μ σ σ 3 * 2 3 * 321 化学と生物 Vol. 51, No. 5, 2013 4 * 5 * 6 σ 4 5 6 σ * * 322 化学と生物 Vol. 51, No. 5, 2013 μ μ μ μ μ σ 7 σ σ σ σ σ σ σ σ σ σ 8 8 9 7 σ 323 化学と生物 Vol. 51, No. 5, 2013 9 10 11 * σ σ * * * * 10 11 * * * * 324 化学と生物 Vol. 51, No.
2019年10⽉1⽇ 統計科学のための電子図書システムは 統計数理研究所の機関リポジトリに移行しました。 移行後のページ
ベイズ推測を使う人はもちろんのこと、嫌う人にもぜひ一読をすすめたい書籍です。ただし、メインの定理の証明の部分は、代数幾何学の特異点解消定理を使いますし、その他にも複素関数論・経験過程といった知識を要求されます。これらの事前知識に詳しくないと、3,4章の定理ひいてはWAICがなにやら抽象的で納得ができないといった事態になると思います。いつかp.93 例4のような特異点解消定理を使った例をいくつかこなして、さらに数値実験をして感覚をつかめたらと思います。渡辺先生は「もちろん『代数幾何学を知らなければWAICを使うことはできない』ということはありません。 WAICは簡単に計算できますので誰でも使うことができます。」とおおらかにおっしゃってくれていますので(web)現段階でも使います。 また書籍には、ベイズ推測のユーザーとして参考になる「注意」「例」、各章の最後にある「質問と回答」のコーナー、さら
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く