タグ

2013年4月15日のブックマーク (2件)

  • Python:時系列分析(その1) : 分析技術とビジネスインテリジェンス

    Python pandasとstatsmodelsを用いた時系列分析についてまとめる。pandasは欠損値の処理や移動平均の算出に、statsmodelsはARIMAなど時系列解析の実施に用いるとよさそう。以下の内容について順次取り上げていきたい。 ●単純移動平均 ●自己相関関数(ACF:Auto Correlation Function) ●偏自己相関関数(PACF:Partial Auto Correlation Function) ●自己回帰過程:AR(p) ●自己回帰移動平均過程:ARMA(p, q) ●自己回帰和分移動平均過程:ARIMA(p, q, d) ●多変量自己回帰過程:VAR(p) ●状態空間モデル ARIMAまでがひとつの系列のみを対象とした分析。VARはARの多変量版で、ある系列を予測するのに他の系列のデータも活用する。状態空間モデルは、観測方程式と状態方程式(真の

  • F検定 (等分散の検定)

    F検定(等分散の検定) まず「等分散とは?」であるが、漢字を見て分けるとおり等しく分散しているということである。つまり、それぞれの群の分布の形が似ているということである。 下にいくつかの例を示す。 独立2群の差の検定の場合、二標t検定には「正規分布である」「等分散である」の二つの条件が必要である。そのため、たとえ正規分布していても等分散でなければ二標t検定を使ってはいけない。 この等分散かどうかを調べるためにF検定がある。二標t検定をする前にF検定をして等分散であることを確認する必要がある。 もし、F検定で「等分散でない」と検定されたなら二標t検定ではなくてWelch法やMann-Whitney検定で検定しなくてはならない。 ・仮説の設定 帰無仮説(H0):「2群間の分散に差がない(等分散である)」と仮定する。 対立仮説(H1):「2群間の分散に差がある(等分散でない)」と仮定する