タグ

統計学に関するurza358のブックマーク (5)

  • http://www.ias.tokushima-u.ac.jp/linguistik/nlp/gengoProject/node4.html

  • C4.5 - Wikipedia

    C4.5はロス・キンランが開発した決定木を生成するためのアルゴリズムである。C4.5はキンランのID3アルゴリズムの拡張である。C4.5が生成する決定木はクラス分けのために使うことができ、このため、C4.5はしばしば統計学的クラス分類器とみなされている。 アルゴリズム[編集] C4.5はID3と同じ方法で情報エントロピーの概念を用いて教師データのセットから決定木を生成する。教師データはすでにクラス分けがされているサンプルである。それぞれのサンプルは属性や特徴を表現するベクトルである。教師データはそれぞれのサンプルが属するクラスを表現しているベクトル で拡張される。 C4.5はそれぞれのデータの属性はデータを更に小さな部分集合に分割する決定に使用できるという事実を利用している。C4.5はデータを分割するための属性を選択した結果による正規化されたインフォメーション・ゲイン(エントロピーの違い)

  • 無相関検定(相関係数の有意性検定)について

    無相関検定について −英語教育学研究におけるよりよい統計処理のために− キーワード 無相関検定 相関係数の検定 有意な相関 Since 2004.5.25. Last Modified 2004.5.25. なんとなく,まとめてみました。 Q 相関が有意かどうか調べる方法があると聞いたのですが? A  個人的には好きではないのですが,無相関検定,もしくは,相関係数の検定,というやつですね。 Q 好みの問題はおいといて,どんなものなんですか? A  おっしゃるように,得られた相関係数が,統計的に有意かどうか調べるということです。つまり,「相関がゼロだと言える確率」がどのくらいか調べてみて低かったら,「相関がゼロだといえる確率」が低いのだから,相関がゼロだと言えることはないだろう,と推論するものですね。 Q 有意だったら,相関があるということになるんですよね? A  そんなことはないです。有

  • 相関係数の検定の仕方

    1.母相関係数の検定 データから得られた相関係数は統計量なので、母集団の相関係数(母相関係数)をこれから推定・検定することができます。 2.母相関係数がわかっているときの標の相関係数の分布 母相関係数ρ=0のときは、標の相関係数rは次のtについて、自由度n-2のt分布をします。

  • ピアソンの積率相関係数の有意性検定

    ピアソンの積率相関係数の有意性検定     Last modified: Nov 08, 2002 「母相関係数が 0 以外の特定の値の場合の検定」は,別途用意されている。 例題: 「標の大きさが 24,ピアソンの積率相関係数が 0.476 のとき,母相関係数が 0 であるかどうか検定しなさい。」 検定手順: 前提 帰無仮説 $H_0$:「母相関係数 $= 0$」。 対立仮説 $H_1$:「母相関係数 $\ne 0$」。 有意水準 $\alpha$ で両側検定を行う(片側検定も定義できる)。 標の大きさ(データの組数)を $n$,標相関係数を $r$ とする。 例題では,$n = 24$,$r = 0.476$ である。 次式で検定統計量 $t_{0}$ を計算する。 \[ t_0 = \frac{|\ r\ | \ \sqrt{n-2}} {\sqrt{1-r^2}} \] 例題で

  • 1