世の中の事象における真の因果関係は神のみぞが知り、それに抗うために多くの因果推論テクニックが作られてきました。その中でも傾向スコアというのは、ランダム化検証ができない事象でも、データをゴニョゴニョすることで、理論上ランダム化に等しいことができてしまうという夢のようなテクニックです。 www.medi-08-data-06.work 今回はそんな傾向スコアが前提としている仮定や、傾向スコアを使う際の注意点、RとPython使っての解析方法などについて書いていきます。 解析方法を手っ取り早く知りたいという方は後半からご覧ください。 今回のデータ 簡単に回帰分析 CMとプレイ時間の関係に影響を及ぼすのは? 全ての変数を調整することはできない 傾向スコアマッチング マッチング後は分布を確認 マッチングの結果は? 傾向スコアマッチングの注意点(重要) 傾向スコアを変数として使う Rでの実践 Pyth