タグ

2019年3月3日のブックマーク (2件)

  • 【傾向スコア-後編】犠牲バントの「本当の効果」を分析するための傾向スコア使い方 - Np-Urのデータ分析教室

    記事は下の記事の続きとなります。まだご覧になっていない方は、是非お読みください! www.randpy.tokyo 前編では、現実世界のデータから施策の評価をしたいときに、よく起こる問題点について述べました。 そしてその問題点を解決する手法の一つが傾向スコアです。 傾向スコアの理論的に詳しいところは、こちらの論文を読んでもらうのが良いかと思います。 https://www.niph.go.jp/journal/data/55-3/200655030007.pdf かなり詳しく書いてありますので、ちゃんと知りたい方はこちらの論文と論文内で紹介されている各論文を読んでもらうのがベストです。 ただやっぱり読むのに時間はかかりますし、ちょい難しいところも含んでいるので前提知識が足りないと厳しい箇所も含んでいます。 そこで記事では、なるべーーく直観的に理解ができるように説明していきたいと思います

    【傾向スコア-後編】犠牲バントの「本当の効果」を分析するための傾向スコア使い方 - Np-Urのデータ分析教室
  • 【傾向スコア-前編】現実のデータを扱う上での問題点とその対策について - Np-Urのデータ分析教室

    突然ですが、施策の効果をきちんと測定することは、実はとても難しいのです。 ここでいう施策の効果とは、例えばあるクラスの生徒への特別な教育の効果であったり、ある病気にかかった人々への薬の処方の効果であったり、プロ野球のある場面で犠牲バントを行う効果だったり...のことを指しています。 どうして難しいのか?そしてその困難をどのようにして回避するのか? 次の章から説明していきます。 RCTと傾向スコアどうしてこれらの効果を測定することが難しいのか、犠牲バントの例をもう少し掘り下げてながら考えてみましょう。 プロ野球の試合のデータから、得られるものは 犠牲バントが発生した時のデータ(その後実際に得点が入ったかなど) 犠牲バントが発生していない時のデータ(その後実際に得点が入ったかなど) しかありません。 この2つのデータを比較して、「犠牲バントをしたときの方が得点が入ることが分かった!」→ 「じゃ

    【傾向スコア-前編】現実のデータを扱う上での問題点とその対策について - Np-Urのデータ分析教室