タグ

K-Sに関するteddy-gのブックマーク (2)

  • 1.3.5.16. Kolmogorov-Smirnov Goodness-of-Fit Test

    The Kolmogorov-Smirnov test (Chakravart, Laha, and Roy, 1967) is used to decide if a sample comes from a population with a specific distribution. The Kolmogorov-Smirnov (K-S) test is based on the empirical distribution function (ECDF). Given N ordered data points Y1, Y2, ..., YN, the ECDF is defined as \[ E_{N} = n(i)/N \] where n(i) is the number of points less than Yi and the Yi are ordered from

    teddy-g
    teddy-g 2016/03/01
    K-S検定の丁寧な説明。二つの確率分布の最大距離を統計量Dとして得る。p値が低いほど二つの分布は異なっている。
  • 相関係数の有意性を確かめる方法について -相関係数について1歩踏み込む- - Data Science by R and Python

    相関係数とは? 相関係数については、8月のエントリーを参照してもらうと良いかと思います。 「相関係数」ってなんですか? -意味と利点と欠点をわかりやすく- - Data Science by R and Python 簡単に説明しておくと、相関というのは「2つの変数の間に存在する、直線的関係」を指しています。相関係数というのは、その直線度合いを0~1の数字で表したものと言えます。ただし、値には大小関係しかありません(相関係数0.8は、相関係数0.4のときよりも2倍相関が強いという意味ではないので注意してください)。 さて、データの分析・解析に関わらず、いくつかの変数があるデータでは、相関係数を計算して、変数の間に関係があるかをチェックするのが一般的です。前のエントリーにもあるようにこれは「直線的な関係」しか調べられないですし、色々と制約もあり、いちいち確認するのは面倒ですが、それでも使い勝

    相関係数の有意性を確かめる方法について -相関係数について1歩踏み込む- - Data Science by R and Python
    teddy-g
    teddy-g 2016/03/01
    相関係数が有意かどうかを調べるためにK-S検定を使う。∵有意なら正規分布に沿ってるから。他にヒストグラム作ってビジュアルに確認する、Q-Qプロットを描くという手法も。
  • 1