タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

統計学とwikipediaに関するurza358のブックマーク (1)

  • C4.5 - Wikipedia

    C4.5はロス・キンランが開発した決定木を生成するためのアルゴリズムである。C4.5はキンランのID3アルゴリズムの拡張である。C4.5が生成する決定木はクラス分けのために使うことができ、このため、C4.5はしばしば統計学的クラス分類器とみなされている。 アルゴリズム[編集] C4.5はID3と同じ方法で情報エントロピーの概念を用いて教師データのセットから決定木を生成する。教師データはすでにクラス分けがされているサンプルである。それぞれのサンプルは属性や特徴を表現するベクトルである。教師データはそれぞれのサンプルが属するクラスを表現しているベクトル で拡張される。 C4.5はそれぞれのデータの属性はデータを更に小さな部分集合に分割する決定に使用できるという事実を利用している。C4.5はデータを分割するための属性を選択した結果による正規化されたインフォメーション・ゲイン(エントロピーの違い)

  • 1