東京大学・株式会社Nospareの菅澤です. 今回は状態空間モデルによる時系列予測手法を用いた因果効果の推定手法であるCausalImpactについて紹介します. CausalImpactとは CausalImpactはGoogleによって開発された因果効果推定の方法です.手法の詳細はBrodersen et al. (2015, AoAS)に記載されており,手法を実装したRパッケージも公開されています. CausalImpactは,ある介入が時間変化するアウトカムにどのような影響を与えるかを推定(推測)するための手法です.時間変化するアウトカム(時系列データ)に対して因果効果を推定する有名な方法としてDifference-in-Difference (DID)がありますが,DIDよりも緩い仮定のもとで時間変化する因果効果を推定できる方法として知られています. CausalImpactのコ
近年の統計科学では、原因と結果の因果関係を正確に知ろうとするアプローチが盛んであり、これらのアプローチは一般に因果推論と呼ばれている。本書で扱う傾向スコアも、因果推論を主眼とする方法の一つである。一般的に、処置の有無をランダムに割り当てることのできない調査観察データでは、処置群と統制群の間に属性の違いが生じる。傾向スコアとは処置の有無に影響を与える複数の情報を集約した要約指標であり、この要約指標を用いて、あたかもランダム化実験が行われたかのように、処置群と統制群の元々の属性の違いを調整する。 本書では、第1章で傾向スコアの基礎となる方法や仮定をレビューし、第2章で傾向スコアのモデリングと評価の概要について説明する。また一般的な傾向スコア法(マッチング、層別化、逆確率加重、共変量調整)をレビューし、第3章では、これらの手法のうちいずれの方法を採用すべきなのかを検討する。さらに、第4章では、処
Tweet 因果推論の先へ―機械学習で因果効果を予測する『反実仮想機械学習(Counterfactual Machine Learning)』入門 はじめに ARISE analytics の近藤です。本記事では、次世代の意思決定技術として注目されている反実仮想機械学習(Counterfactual Machine Learning:CFML)を紹介します。 本記事は、CFMLを日本語で体系的に整理し、初学者の理解を手助けすることをねらいとして執筆しました。本記事の理解促進につながるように、ベースとなった勉強会資料を記載します。こちらも併せて閲覧いただくことで理解の助けになれば幸いです。 目次 ・ はじめに ・ Counterfactual Machine Learning(CFML) ・ Off-Policy Evaluation(OPE) ・ CFMLを支える技術(オープンデータとツー
独学で因果推論を学ぼうと思うと、どの解説も難しく感じます。 ある程度勉強している私がそのような日本語の解説をみても難しく感じる程なので、初学者にはかなりハードルが高いかも知れません。 このシリーズ、誰でもわかるように、かなり噛み砕いて疫学や因果推論のコンセプトを解説します。 今回の記事では、「counterfactual」「consistency」「exchangeability」という、因果推論の根本となる概念の説明です。 因果推論特有の数式にも慣れましょう。 Counterfactual(反事実現実)を理解する 因果推論をざっくりというと、「もし〇〇が起こっていなかったら☓☓となっていたか」を知ること。 今心筋梗塞だとして、もし飲酒をしてなかったら、心筋梗塞になっていなかったのかどうか でもこんなのはわかりませんよね。 *よく教科書に「タイムマシンがなきゃわからないですよね」ってありま
因果推論の科学 「なぜ?」の問いにどう答えるか 作者:ジューディア・パール,ダナ・マッケンジー文藝春秋Amazonこの『因果推論の科学』は、その名の通り因果推論について、その先駆者の著者が書いた一般向けのサイエンス本である。とはいえ、大半の人の反応は「因果推論ってなんなんだ」であろう。僕も何もわからぬまま読み始めたが、著者がこれは「科学の世界の革命」であると自賛するだけのことはある概念であることはすぐにわかった。 その一方、相当に難しい、とっつきづらい概念でもあり、いかな一般向けの著作といえども本書を読んで理解するハードルは他のサイエンス本と比べても高いといえるだろう。数式も出てくるし、統計学の用語もぽこぽこ出てくるので、素人がスルスルと読み通せる本ではない。とはいえ根気強く読んでいけば理解できるように書かれているし(数式自体は別に読み飛ばしても問題はない)、理解すれば因果推論の科学がいか
この記事について電通デジタルでデータサイエンティストをしている中嶋です。今回の記事では統計的仮説検定における検出力や効果量の概念及び、それらを考慮した事前のサンプルサイズ設計について説明します。読者層としては、既に統計的仮説検定の基本的な使い方を理解している方を主な対象としていますが、そうでない方にもわかるように最初に簡単な復習をします。 統計的仮説検定について 概要 統計的仮説検定(以下、仮説検定)とは、性質の異なるグループ間で平均や分散など各グループを代表するような数値を比較する際に、その差が偶然生じたものか、そうでなく何かしら必然性がありそうかを検証するための統計手法です。例えば比較分析したい2つの群(ex. ユーザーグループ)があった時にある指標(ex. 各群の年齢の平均値)を比較して、統計的に偶然ではないレベルで差異が生じているかを判定したいときに仮説検定を使うことができます。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く