ブックマーク / cl-www.msi.co.jp (1)

  • ロバスト統計:外れ値を含むデータの扱い方

    以下のような10個の観測値を得たとする。 2.773, 3.183, 2.969, 2.883, 3.229, 3.080, 3.204, 3.171, 2.798, 2.900 これらは標平均 = 3.019、標標準偏差 = 0.175であり、正規分布を仮定すれば95%信頼区間は [3.019 - 1.96 × 0.175, 3.019 + 1.96 × 0.175] = [2.676, 3.362] となる。実際このデータは平均 = 3、標準偏差 = 0.2 の正規乱数であるが、各統計量は良好な値を示している。しかしデータ収集時の記載ミスなどにより最後の値だけ小数点の位置がずれてしまったとすると、 2.773, 3.183, 2.969, 2.883, 3.229, 3.080, 3.204, 3.171, 2.798, 29.00 標平均 = 5.629、標標準偏差 = 8.

  • 1