タグ

ブックマーク / www.krsk-phs.com (5)

  • 「教科書が教えてくれない『交絡』の話」の講義資料を公開しました - Unboundedly

    先日オンラインセミナーで交絡に関するレクチャーをしました。 合計1000人以上に参加していただき、ありがとうございました。 当日の講義資料を公開します。 交絡とは何か、どうやって調整変数を選ぶか、(観察データ分析をする限り必ず生じる)未調整交絡があるというシチュエーションでどのように結果を解釈するかなどについて話しました。 大学の授業で習う教科書的な知識と、実際のデータ分析を行ううえで直面する問題とのギャップを埋めるような実践的な知識をご提供するべく、意識したプレゼンテーションです。 そのほかにも因果推論に関係する講義資料を公開しています。 合わせてご参照ください。

    「教科書が教えてくれない『交絡』の話」の講義資料を公開しました - Unboundedly
  • データの質が分析結果に与える影響について:「誰から」「なにを」「どのように」測定したのか? - Unboundedly

    データ分析に関する議論では「データをどのように分析するか」「どうやって、どのような統計的手法を用いるか」といった話題が中心です。 例えば統計的因果推論のための分析方法に関する書籍やブログ記事はたくさんありますが、「どうやって傾向スコアを使うのか」「数式上、なぜ傾向スコアを使うと(仮定のもとで)効果が検証できるのか」といったテクニカルな議論は多いものの、「分析の対象となるデータの特徴が結果にどのような影響を与えるのか」といった議論は少ないです。 巷のデータ分析に関する議論には、「使用しているデータが完璧である」という仮定のもとに成り立っているものも少なくありません。 ところが現実世界のデータは非常に汚い、完璧とは程遠いということは実際にデータ分析に関わったことがある人ならわかると思います。 そこで今回は、 データが誰から得られたのか なんのデータがどのように測定されたのか という2つの視点か

    データの質が分析結果に与える影響について:「誰から」「なにを」「どのように」測定したのか? - Unboundedly
  • Target trial emulationの講義資料を公開します - Unboundedly

    近々トークがあるので作成した資料を公開します(諸事情で今回は英語で作成しました)。 テーマは「Target trial emulation」というもの。 疫学界隈でじわじわ流行り出しているフレームワークで、評価したい因果効果をみるのに理想的なRCT(target trial)をイメージして、できるだけそれに近づけるように観察データ分析をデザインしていくというものです。 因果推論の話題はいわゆる交絡の問題、Randomizationに近い状態をどのように得るかが中心的な話題になりがちです。 それ以外の諸問題について系統的に考えることを強制するフレームワークとして有用で、取り入れることで研究デザインの質を簡単にあげてくれると思います。 英語でいうところのlow-hanging fruitです。 以前ブログでも簡単にまとめました。 おそらくこれからもっと広まっていく考え方だと思います。 ご参考ま

    Target trial emulationの講義資料を公開します - Unboundedly
  • "矢印"をつかって因果関係を視覚的に整理する:因果ダイアグラム(DAG)入門①〜なぜDAGが必要なのか〜 - Unboundedly

    今回はDirected Acyclic Graph(DAG)と呼ばれるものについて書いてみようと思います。「ダグ」と読みます。日語では「非巡回有向グラフ」とかいうなんだか難しそうな名前で呼ばれているようです。DAGが何かを一言で説明するとすれば「いろいろな要因を矢印で結んで、それらの間の因果関係について整理するためのツール」といったところでしょうか。シリーズは以下の三つのテーマに分けて書いていきます。 1.そもそもなぜDAGが必要なのか(記事) 2.DAGの基的なルール・書き方と読み方 3.DAGによる様々なバイアスの視覚的な整理 それでは今回はDAGが必要とされる理由について整理してみます。 なぜDAGが必要なのか?どう有用? 1.まず前提の確認 2.多くのデータ分析では因果関係を見つけることに興味がある 3.目の前の「関連」は「因果関係」か? 4.ここでついにDAGの登場! 5

    "矢印"をつかって因果関係を視覚的に整理する:因果ダイアグラム(DAG)入門①〜なぜDAGが必要なのか〜 - Unboundedly
  • 傾向(プロペンシティ)スコアの各使用法の仮定・解釈の違いを比較してみた - Unboundedly

    観察データを用いた因果推論のための分析手法として非常に人気の「傾向スコア(Propensity Score)」法。 「傾向スコアを用いた分析」と言っても、マッチングや重み付けなどその使い方は様々あります。 巷にある因果推論に関する書籍では、傾向スコアを”どうやって使うのか”という視点で各手法の紹介がされていることが多いですよね。 ところが実際にマッチングや重み付けをしてみると、傾向スコアの使い方によって結果が大きく異なることも少なくありません。 このとき、「どちらの手法から得た答えが正しいのか?」と疑問に思うのは自然です。 それに傾向スコアの使い方はたくさんあるので、「そもそも結局どの使い方が一番いいの?」と思う人も多いでしょう。 この記事を読み終わるころには、「そもそもベストな傾向スコアの使い方、正しい使い方はない」ということがわかると思います。 ・傾向スコアという考え方の導入 ・傾向ス

    傾向(プロペンシティ)スコアの各使用法の仮定・解釈の違いを比較してみた - Unboundedly
  • 1