前回、前編・後編と2回に傾向スコアの考え方について学びました。 www.randpy.tokyo www.randpy.tokyo 今回は傾向スコアを使って実際に分析をしていきます。 これまでの実践編記事では、主にスクレイピングを使ってデータを集めていました。 今回は趣向を変えて、公開されているオープンソースデータを使って傾向スコアの実践をしていきます。 なお、こちらの記事のPython編も公開しました。 Pythonの方が興味あるぜ!って方はこちらご覧ください。 www.randpy.tokyo 扱うデータの説明 Rにはもともと傾向スコアを計算する用のlalondeというデータセットがあるのですが、それを使った記事が多く見られたので別のデータを使ってみることにしました。 http://biostat.mc.vanderbilt.edu/wiki/Main/DataSets こちらのサイト