標本選択バイアス (sample selection bias)† 統計では,標本はランダムに選択されたと仮定することが多い.しかし,現実には,電話調査で電話に出ない人のパターンはランダムではないといった問題によって,そうした調査が難しい場合もある.このように標本がランダムではない,なんらかの偏りのことを標本選択バイアス (sample selection bias)という. そこで,Heckman は,標本選択バイアスがある場合での,回帰分析の補正方法を示した (基本文献).この研究に対して2000年にノーベル経済学賞を授与されている. 機械学習の分野では,分類問題について標本選択について論じた(文献1)が著名なので,この文献を紹介する. 普通の分類問題の事例は入出力の対 \((\mathbf{x},y)\).さらに,母集団からサンプルされるなら \(s=1\),でなければ \(0\)