調査を行うときは全数調査を行えば統計的な推測を行う必要はありませんが、どうしてもサンプリングして部分集団の解析で全体を推測したいという場合があります。 例えば国や県単位の統計を出したいけど全数調査は無理だとか、データは全てあるけどPCのスペック上一度に解析できないとか。 そんなときのサンプリング方法として次のようなものがあります。 ランダムサンプリング(標本の重複なし) ブートストラップサンプリング(標本の重複あり) 層別サンプリング バランスサンプリング(cube model) SASではproc surveyselectが用意されており、Rではsamplingライブラリがあります(SASのヘルプはここにあります)。 SASの場合はmethodで方法を指定できて、例えばmethod=ursでブートストラップサンプリング、またstrataを指定することで層別サンプリングをします。 Rのsa