タグ

統計と外れ値に関するkoma_gのブックマーク (1)

  • 4-3. 外れ値検出のある箱ひげ図 | 統計学の時間 | 統計WEB

    箱ひげ図にはいくつかのタイプがあり、4‐2章で紹介した「ひげの上端と下端が最大値や最小値の箱ひげ図」とは異なるものもあります。よく用いられるものとして、ひげの長さを四分位範囲(IQR)の1.5倍を上下限とするものがあります。このとき、「第一四分位数-1.5×IQR」がひげの下限、「第三四分位数+1.5×IQR」がひげの上限となり、ひげの下端より小さい値やひげの上端より大きい値を「外れ値」として扱います。 外れ値とは、データの分布において、他の観測値から大きく外れた値のことです。外れ値は、測定ミスによる場合や実際に何か異常があって観測された場合など、様々な原因によって起こりえます。外れ値が存在すると、データの解釈が難しくなる場合があり、扱いには注意が必要です。 次の図は同じデータから作成した、外れ値のない箱ひげ図(左)と、外れ値のある箱ひげ図(右)です。この箱ひげ図では、外れ値が「×」印で表

    4-3. 外れ値検出のある箱ひげ図 | 統計学の時間 | 統計WEB
  • 1