Data Stream Management という本に出てくる Reservoir Sampling(溜池サンプリング)という手法をシミュレーションしてみたい. これはサイズ N の母集団(N は未知でもよい)からサイズ n()のランダム標本を非復元抽出で取ってくるアルゴリズムで, 大きすぎるデータからリサンプリングしたいときや, センサーなどから逐次的に流れてくるようなデータからランダム標本を得たいときに使えそう. Data Stream Management: Processing High-Speed Data Streams (Data-Centric Systems and Applications) 作者: Minos Garofalakis,Johannes Gehrke,Rajeev Rastogi出版社/メーカー: Springer発売日: 2016/07/22メディア