最近、RandomForestという手法が データ分類アルゴリズムとして注目されています。 アルゴリズム自体はバークレー大学のLeoBreiman氏が考案したものです。 http://www.stat.berkeley.edu/users/breiman/RandomForests/ 中でニ分木の生成にGINI係数を使っていますが、 これはイタリアのジニ氏が考案したものです。 アルゴリズムの大まかな流れは以下。 -------------------------------------------- ①元のDataは独立変数をM列、種別を1列持つものとし、DataはN行とする。 (サンプルtable :data5件、独立変数4列、種別1列 【アヤメのがくとへんから種別を割り出す木を作る】 param1 param2 param3 param4 param