「調査観察データの統計科学」 http://www.amazon.co.jp/dp/4000069721/ の2.2節「欠測のメカニズム」にあった、例2.3「ランダムな欠測としての選抜効果」の例をRで試してみた。 本書P31の定数の決め方だと、P32のグラフのようにならないので、を求めるときの切片は無視してみた。 ソースは以下の通り。 # データの設定 N <- 1000 theta1 <- 50 theta2 <- 0.8 sigma <- 49 C <- 60 set.seed(1) y1 <- theta1 + rnorm(N, 0, sqrt(100)) y2 <- theta2 * y1 + rnorm(N, 0, sqrt(sigma)) pcol <- ifelse(y1 >= C, "navy", "grey") data <- data.frame("y1" = y1,