並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 9 件 / 9件

新着順 人気順

傾向スコアの検索結果1 - 9 件 / 9件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

傾向スコアに関するエントリは9件あります。 因果推論統計Python などが関連タグです。 人気エントリには 『傾向スコアを用いた因果推論入門~理論編~ - 下町データサイエンティストの日常』などがあります。
  • 傾向スコアを用いた因果推論入門~理論編~ - 下町データサイエンティストの日常

    0. はじめに 1. 因果推論~施策の本当の効果~ 1.1 TVのCMを見るとアプリのプレイ時間が短くなる!? 1.2じゃぁ理想的な比較方法は? 1.3 背景要因を揃えた比較が難しい問題 1.4 反実仮想:仮に「xxxしたら / しなかったら」の効果算出 2. 傾向スコアを用いた効果測定 2.1 絶対にこの条件は守ろう ~ 「SUTVA」/「強く無視できる割り当て条件」~ 2.1.1 SUTVA 2.1.2 強く無視できる割り当て条件 2.1.3 どうやって条件が成り立ってるか確認するの? 2.2 傾向スコアとは 3. 傾向スコア算出 3.1モデリング 3.2モデルの評価 4. 傾向スコアを用いたマッチング 4.1 マッチングのお気持ち 4.2 様々なマッチング手法 4.3 マッチングのメリット / デメリット 4.4 マッチングの評価 4.5 そもそも傾向スコアをマッチングに用いるべ

      傾向スコアを用いた因果推論入門~理論編~ - 下町データサイエンティストの日常
    • 傾向スコアを用いた因果推論入門~実装編~ - 下町データサイエンティストの日常

      0. はじめに 1. 対象データ 2. 先に各手法の結果を確認 3.準備 4. 基礎集計~CMを見た人と見ていない人での目的変数の差~ 5. 因果推論の流れのおさらい 6. 傾向スコアモデリング 6.1 モデリング 6.2 テスト / コントロールの傾向スコアの可視化 6.3Rでの傾向スコアモデリングの実装 7. 傾向スコアマッチング 7.1 結構面倒なpython 7.2 R (Matchingライブラリ) 7.3マッチングの評価 8.IPW 9. ダブルロバスト 9.1 回帰モデル 9.2ダブルロバスト 10.Proximityマッチング 11.改めて、各種手法による推定因果効果のまとめ 12.まとめ 0. はじめに 理論編に引き続き、実装を行なっていきます。 pira-nino.hatenablog.com 実装はpythonとRの両方で行いました。 作業用のコードは以下のgithu

        傾向スコアを用いた因果推論入門~実装編~ - 下町データサイエンティストの日常
      • BigQueryで傾向スコア分析|Dentsu Digital Tech Blog|note

        電通デジタルで機械学習エンジニアをしている今井です。 本記事では、BigQueryで傾向スコア分析を行うための方法について紹介します。 広告効果ってあったの?広告効果とは、広告に接触した場合と接触していない場合とのその後のコンバージョン(例えば、購入金額や継続期間など)の差である、と言えます。 しかしながら、同一ユーザーにおいて、広告に接触した場合と接触していない場合とを同時に観測することはできません。 これを反実仮想(counterfactual)と呼びます。 そこで提案されたのが平均処置効果(average treatment effect, ATE)です。 広告に接触したユーザー群(𝑤=1)と接触していないユーザー群(𝑤=0)とのその後のコンバージョン(𝑦 )の差を広告効果とするものです。 ここで、介入(広告に接触する)の有無以外の条件が公平になるようにユーザー郡が分かれていれ

          BigQueryで傾向スコア分析|Dentsu Digital Tech Blog|note
        • BigQueryで傾向スコア分析 ~Doubly Robust推定量~|Dentsu Digital Tech Blog|note

          電通デジタルで機械学習エンジニアをしている今井です。 本記事では、BigQueryを用いて二重頑健(doubly robust)推定量による効果検証を行うための方法について紹介します。 この記事は過去記事[1]の続編となります。 IPW推定量による効果検証 因果効果とは、仮に介入があった場合のコンバージョン値(例えば購入金額など)と、介入がなかった場合のコンバージョン値の差です。 当然ながら、同一ユーザーにおいてこれらを同時に観測することはできません。 そこで提案されたのが、実際に介入があったTreatment群のコンバージョン値の平均と介入がなかったControl群のコンバージョン値の平均の差分が因果効果である、という平均処置効果(average treatment effect, ATE)です。 しかしながら、現実には交絡因子と呼ばれる介入とコンバージョン値のいずれにも影響を与える要因

            BigQueryで傾向スコア分析 ~Doubly Robust推定量~|Dentsu Digital Tech Blog|note
          • 傾向スコアを用いたOverlap weighting - 統計学入門一歩先へ

            はじめに 傾向スコアを用いた解析の代表的な方法の一つとして、個人ごとの傾向スコアの推定値*1による重み付け解析があります。 重み付け解析としては、傾向スコア推定値の逆数で重み付けを行う「逆確率重み付け法(Inverse probability of treatment weighting; IPTW)」が有名で広く利用されていますが、この方法は傾向スコアの推定値に0または1に近いものがあった場合(つまり、重みが非常に大きくなる場合)に、推定のバラツキが大きくなってしまうという難点があります。そのため、例えば極端な重みの値を持つ個人を解析から除外する「トリミング(Trimming)」などの方策がこれまでにも提案されてきました。 一方で最近では、新しいタイプの重み付け手法である「Overlap weighting」が提案されています。この方法については、Liらの2018年の論文(参考資料[1]

              傾向スコアを用いたOverlap weighting - 統計学入門一歩先へ
            • 因果関係の推定 〜Pythonによる傾向スコアマッチングとIPW〜 - 見習いデータサイエンティストの隠れ家

              中学生のときに目がよく合うと感じた人がいたら、それは自分に絶大な好意を持っているからだと思い込んでいましたよね。しかし、現実は思い出のままでした。それは、「よく目が合う」ことと「好意を持つ」ことは相関しているかもしれませんが、因果の関係とまでは言えないからです。自分の隣の人をガン見していたついでに自分を見ていただけかもしれません。まさに想いの交絡です。 正常な話に戻すと、因果を見つけることは大事です。因果がわかると次に何が起きるかを間違えることなく予測できます。まさに、預言者です。相関と因果は違うというのは頭ではわかっています。しかし、相関の壁を飛び越えていける人はごく僅かです。そこで今回は、因果関係を定量的に測定する統計的因果推定をPythonを使って行います。先人の方々が同じような内容をすでに書いていますが、傾向スコアマッチングとIPWの結果が異なっているという結論が多かったので、IP

                因果関係の推定 〜Pythonによる傾向スコアマッチングとIPW〜 - 見習いデータサイエンティストの隠れ家
              • 傾向スコア・マッチング - Wikipedia

                傾向スコア・マッチング(プロペンシティ・スコア・マッチング、propensity score matching、PSM)は、観察データの統計分析の分野において、治療を受けることを予測する共変量を考慮して、処置(treatment)、方針、その他介入の効果を推定しようとするマッチング手法。処置を受けた人々と受けなかった人々の結果を単純に比較して治療効果を推定すると交絡変数によるバイアス(偏り)が発生する。このバイアスを軽減するための手法が傾向スコア・マッチングであり、1983年、ポール・ローゼンバウムとドナルド・ルービンが発表した [1]。 処置群とコントロール群(非処置群)の処置結果(平均処置効果など)の違いは、処置そのものではなく処置を予測する要因によって引き起こされる可能性があり、その場合はバイアスが発生する。ランダム化比較試験では、無作為割り付けによってバイアスなく処置効果を推定する

                • 傾向スコアを用いたIPW(IPTW)法の概要 - 医療統計学を学ぶ大学生のブログ

                  先日は傾向スコアを用いたマッチングについての記事をまとめましたが、同じ傾向スコアを使う方法つながりとして、今回はIPW法についてまとめていこうと思います。 傾向スコアマッチングでは、マッチングという作業が入ってしまう分どうしても解析対象となるサンプルサイズが減少してしまうという問題がありました。これに対して後述するIPW法では、そのサイズが減らない、むしろ膨らませるという点で、変な話ですが医師の方などにはウケがいいなと個人的には感じています。 しかし、IPWには一つ重大な問題があり、詳しくは記事中でまとめますが、傾向スコアが極端に小さい値を持つ個人が推定に対して非常に大きな影響を与えてしまうというものです。まあなにはともあれ、中身を見てみないと話は進まないかなと思うのでまとめのほうに進んでいきます。 傾向スコアの復習 IPW(IPTW)推定量について IPW推定量 ATT、ATUを推定する

                    傾向スコアを用いたIPW(IPTW)法の概要 - 医療統計学を学ぶ大学生のブログ
                  • サンプル数が不均衡な観察データを傾向スコアで調整できるか - Qiita

                    それぞれのデータセットは、以下の状況を想定して、データが収集されたものとします。 オリジナルのデータセットは、cm_dummy が4対6くらいで、ある程度ABテストが計画されて施策が打たれた 不均衡なデータセットは、cm_dummy が1対9で、施策のターゲットのほぼ全数に向けて施策を打った バランスの取れたデータセットは、cm_dummyが5:5で、不均衡なデータセットからサンプリングした やや処置群に偏ったデータセットは、cm_dummyが3:7で、オリジナルのデータセットから対照群のみサンプリングした やや対照群に偏ったデータセットは、cm_dummyが7:3で、オリジナルのデータセットから対照群のみサンプリングした import numpy as np import pandas as pd SEED = 42 # 1. オリジナル[6:4] df_original = pd.re

                      サンプル数が不均衡な観察データを傾向スコアで調整できるか - Qiita
                    1

                    新着記事