日時:2020年11月7日(土) 14:00 - 16:00 講演者:大塚淳(京都大学) 関連書籍 https://www.unp.or.jp/ISBN/ISBN978-4-8158-1003-0.html
因果推論とは,因果効果を識別するための仮定を満たすような工夫や戦略のことを意味する.因果推論については,すでに膨大な理論と方法が提起されている.ただし,因果推論が必ずしも具体的な方法と対応しているわけではないため,因果推論といった時にイメージする理論と方法は分野間で大きく異なる.本稿では,社会科学のみならず様々な分野の視点を考慮し,因果推論の理論と方法を体系的にレビューする.さらに,因果推論の限界と可能性について,今日でも繰り広げられている論争を紹介する.
今月はモデルナワクチンの2回目接種*1やら仕事でも負荷の高い分析業務やら、はたまた執筆*2やらでネタ切れなのもあってあまりブログ記事を書けていなかったので、最近話題になった件について簡単に論じてみようかと思います。元ネタはこちらです。 これはイスラエルで公表されたCOVID-19ワクチンの重症化防止効果に関する統計について、いわゆる「シンプソンのパラドックス」が見られるのでそれを補正する必要があると指摘するブログ記事です。この件について僕が引用しながらボソッと放言したところ、思いの外大きな反響があったのでした。 イスラエルで起きている、「ワクチンが効いていないように見える」シンプソンのパラドックス。年齢で調整するとこうなるという分かりやすい解説https://t.co/gQrATCNzS7 pic.twitter.com/JI8Gq8h0Lk— TJO (@TJO_datasci) 202
「なぜ統計学では釣り鐘型の分布が使われ、物理現象では右肩下がりの分布が使われるのでしょうか」 という疑問を、統計学や物理学の有識者に会うたびごとに質問するが、こんな基本的なことに誰も答えられない -- データの見えざる手 [矢野和夫](思想社) P.32 より. 釣り鐘型の分布とは、正規分布(ガウス分布)のこと。 右肩下がりの分布とは、指数分布(ボルツマン分布、上の書籍内では「U分布」)のことです。 ここに2つのグラフがあります。 1つは全国17歳学童の身長の分布、もう1つは二人以上の世帯の貯蓄額の分布です。 見ての通り、身長は釣り鐘型の正規分布で、貯蓄額は右肩下がりの指数分布です(近似的には)。 * 学校保健統計調査 平成27年度 全国表 > 身長の年齢別分布 >> http://www.e-stat.go.jp/SG1/estat/List.do?bid=000001070659&cy
みなさまは"The Causal Revolution" (因果革命)という言葉を聞いたことがあるでしょうか? 私は今月(2021年6月)に初めて知りました。Google Trendsでもデータ不足によりトレンドが表示されません。 つまりまだ全然マイナーな概念で、聞いたことがないほうが自然かと思われますが、これは「来る」と確信したため本記事を投稿しました。この確信の根拠の箇所を記事中で太字で書いた他、最後にもまとめたため、本記事を読む価値がありそうかの判断には先にそちらを読んでもらってもいいかもしれません。しかしながら、因果革命ないし統計的因果推論は学ぶ価値のある分野です。本記事を読まなくても下記に挙げた書籍を未読の方はぜひ一読してみてください。Qiitaでも因果推論についての記事はいくつもあります。しかし、私が感動した点を明示化した記事は見当たらなかったため本記事を投稿しました。 この記
台湾・桃園市 (Photo by Walid Berrazeg/Anadolu Agency via Getty Images) 筆者は、前々回まで本邦、韓国、台湾のCOVID-19統計と予測の比較と本邦統計の異常を論じてきました。そして前回は、宮城県で起きているエピデミックSpikeについてその緊急性から統計をもとに論じました。宮城県では、既に本邦最悪の感染拡大状況となり、漸くGo To Eatの中止*をはじめとした独自の緊急事態宣言**が泥縄式に発表されましたが、これらは3/15、3/18発表なのでその効果が統計に表れるのは4/1前後となります。 〈*GoToイート再停止 村井知事「再開で気の緩み」 2021/03/16 河北新報〉 〈**宮城県と仙台市、独自の緊急事態宣言 4月11日まで 2021/03/19 河北新報〉 令和の牟田口廉也である村井嘉浩宮城県知事は、「気の緩み」と第四
測りすぎ――なぜパフォーマンス評価は失敗するのか? 作者: ジェリー・Z・ミュラー,松本裕出版社/メーカー: みすず書房発売日: 2019/04/27メディア: 単行本この商品を含むブログを見る僕の本業はWebプログラマで、こうした職業としてはありがちなこととして何社も転々としながら(時にフリーで)仕事をしているのだが、極少人数の企業をのぞけばだいたい「どうやって社員の成果を評価するか」といったところで試行錯誤している。 メンター的な存在が評価するようなケースもあれば、成果をできるだけ定量的・客観的に評価しようとするところもありと様々だが、やはりIT界隈ということもあり後者の機運の方が高い。より納得感のある評価制度があれば会社側も勤めている側もウィンウィンなので、定量的・客観的な評価が「本当に」できるのであればそれは良いことなのだけれども、あんまり「こりゃうまくいっている!」というところは
科学における統計の誤用を扱った『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に、実際に統計の誤用を防ぐために読むと良い本について紹介する。 はじめに この記事では、科学研究における統計の誤用を扱った『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に、実際に統計の誤用を防ぐ方法を学ぶために役立つと思われる書籍を紹介する。主に、統計的仮説検定で間違いを犯さないようにする場合に役立つ書籍を紹介するが、それ以外の分野の書籍についても紹介する。 なお、『ダメな統計学――悲惨なほど完全なる手引書』は、科学の世界での統計の誤用について説明した本で、私が日本語訳に当たった。2017年1月27日から販売された。この本の詳しい紹介は、「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事に書いたので、そちらもご参照願いたい。 アレックス・ラインハート〔著〕・西原史暁〔訳〕.(201
ランダムサンプリング(random sampling: 無作為標本抽出)とは被験者をある母集団からランダム(無作為)に抽出(サンプリング)するということを意味しており,ランダム割付とは被験者を各要因・各水準に割り当てる操作である。例えば,宮教大の学生(母集団)の生活実態を調べたいときに,全員を調べ上げる(全数調査)ことは大変なので,宮教大の学生の中から無作為に被調査者を選ぶような手法(標本調査)がランダムサンプリングとなっている。ただし,調査目的が日本の大学生(母集団)の生活実態調査であるならば,上記の標本データより示された結果には一般的妥当性の問題が生じる可能性もある(キーワード:世界,母集団,標本)。 このような場合は,ランダムサンプリングではなく便宜的なサンプリングと呼ぶべきである。 近代統計学の基本的な考えは, 母集団と標本を区別することにあるといわれている。 標本にもとづいて計算
「統計的に有意差がないため、2つのデータには差がない」──こんな結論の導き方は統計の誤用だとする声明が、科学者800人超の署名入りで英科学論文誌「Nature」に3月20日付で掲載された。調査した論文の約半数が「統計的有意性」を誤用しており、科学にとって深刻な損害をもたらしていると警鐘を鳴らす。 「統計的に有意差がない=違いがない」は間違い 例えば、ある薬の効能を調べたいとする。統計学では一般的に「仮説検定」を行って薬を与えたグループとそうでないグループを比較し、薬効の指標となる何らかのパラメータに統計的有意差があるかどうかを見る。仮説検定は、2つの事象の差異が偶然生じたものかどうかを統計的に結論付けるものだ。 もし、統計的有意差がある(薬を与えた群のパラメータの方が有意に大きい)なら「薬には効能がある」という結論を導けるが、有意差がなかった場合はどうだろうか。 「統計的有意差がある=薬効
結構ブログ記事ではゴリゴリ統計学や機械学習の話を記事にしている私ですが、実は生粋の文系でして、数学も大学入学時点で数学ⅠAⅡBまでしかやっていませんでした。 今回はそんな私が一体どんな本を読んで勉強してきたら、こんな記事を書くまでになったのかを振り返るとともに、その際使った統計学・数学本を紹介していきたいと思います。 スポンサーリンク 【大学入学時】 能力的には数学ⅠAⅡBはある程度分かっているというレベルでした。数ⅢCは知りません。 まず、そんな状態でやったのはこれです。個人的にはド定番だと思ってます。 ・コアテキスト コア・テキスト統計学 (ライブラリ経済学コア・テキスト&最先端 別巻 1) 作者:大屋 幸輔 新世社 Amazon 文系高校生レベルの数学的な知識のみで読みきることが出来て、かつ具体的にどう使うのかといった方面に着目した本です。大屋先生という日本でも有数の計量経済学者が書
以前のエントリにも書いたけど、マイクロアレイ発現解析は基本的に2つのグループ間での発現量の比較をします。例えば「病気の人 v.s. 健康な人」とか「薬を飲んだ人 v.s. 飲んでない人」とかです。こういうときは2群間検定(t検定とか)を使えば発現量の差が有意な遺伝子を特定できます。 しかし、たまに癌のグレード(重症度)とかのデータでコントロール(健常者)のデータが無いときがあります。このとき比較したいのは「グレード1 v.s. グレード2 v.s. グレード3」という、3つのグループ間で発現量を比較することになります。 3つのグループ間での発現量を比較するときは、t検定のような2群間比較の手法を「グループ1 v.s. グループ2」「グループ2 v.s. グループ3」「グループ3 v.s. グループ1」のように複数回行えばできるのですが、検定には間違う確率が常に付きまとうので、何度も検定を繰
Tweet Pocket 私は30年以上のトレーダー歴がありますが「米国経済指標」を活用したトレードが非常に効果的であると強く実感しています。 そもそも各国に数々の経済指標がありますが、中でもマーケットに大きな影響を与えるのが米国の経済指標だと言われています。 例えば、こちらの動画は以前の米国経済指標発表のタイミングを狙ってトレードをした時の映像です。 見ていただいて分かる通り、米国経済指標発表時は大きく動くタイミングであり、上手く活用することさえできれば大きな利益を生み出すチャンスとなります。 米国経済指標発表後には、通貨の価格が100pip~200pipもの動きを見せる指標もあります。このタイミングを上手に捉え、活用することでトレードの精度を高め、利益をぐんとあげるきっかけを掴むことができるでしょう。 そこで今回は、そのチャンスをトレードに活かせる米国経済指標を7つ抜粋し、その重要性や
分析の本|データ分析や統計分析を学ぶ目的別おすすめ書籍13冊|入門書から名著まで このページに辿り着いたあなたなら、何らかの理由で「データ分析や統計分析を学べるおすすめの本」を探していることだろう。 このブログ「Mission Driven Brand」は、外資系コンサルティングファームと広告会社の両方のキャリアを持つ筆者が、ブランディングやマーケティング・ビジネスにおける「できない、わからない」の課題解決を目指しているブログだ。 このブログを運営していると「おすすめの本を紹介して欲しい」という問い合わせを頂くことが多い。 各解説記事でもおすすめのマーケティング本やブランディング本を紹介しているが、今回はそのベースとなる「データ分析・統計分析が学べる本」を入門書から専門書まで13冊紹介しよう。どれも、本ブログの筆者であるk_birdが「ぜひ読むべき」と考える分析関連の名著だ。 関連記事 ビ
社会学の中でも質的調査と量的調査の間には壁がある!? 生活史を中心とした質的調査を行っている岸政彦氏と、計量を使った量的調査が専門の筒井淳也氏が「ずっと前から内心思っていたこと」をぶつけ合う。遠慮なしのクロスオーバートーク。(構成/山本菜々子) 筒井 ぼくと岸さんはなかなか、普段は会う機会が少なくて、こうして二人で話をするのははじめてですね。たぶんパーソナリティも違うし。 岸 同じ社会学の中でも、ぼくは生活史を中心とした質的調査、筒井さんは計量を使った量的調査をしています。 普段はあまり交流のない二つの分野ですが、今日は、お互いに思っていることを遠慮なく話し合ってみたいと思います。社会調査は質的調査と量的調査に分かれていると、筒井さんは感じていますか。 筒井 分かれているんじゃないでしょうか。「あなたは質的の人? 量的の人?」という聞き方をしますよね。もちろん、共通点はありますが、質的と量
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く