低確率で発生する事象は、その稀にしか発生しないという性質上、それの発生確率を正確に知ろうとすると非常に多くの試行回数が必要です。低確率で発生しつつ、かつ、その発生確率を正確に知ることが重要なものとして、例えば、オンライン広告のクリック率(CTR)やコンバージョン率(CVR)などがあり、発生確率の正確な推定が重要な事が稀に良くあります。 例えば、事象の発生確率のときに回試行したときの平均を以下に示します。5回実行して試行回数が少ないとばらつきが大きい(平均値があてにならない)ことがよくわかると思います。また、1000回ほど試行しても収束しきってないことがわかります。 では、一体どのぐらいの試行回数の時にどのぐらいの信頼性で真の事象発生確率を推定できるのでしょうか? (どのぐらいのであれば上図の各実行のばらつきが小さくなり、安心して評価できる事象発生確率の推定値になるのでしょうか?) 簡単に計