ZOZOテクノロジーズ新卒のむーさん(@murs313)です! ジニ不純度、知らない子なので戯れる。 決定木で同じように使われているエントロピー(情報量)と比べていきます。 名前 ジニ不純度、ジニ分散指標、ジニ多様性指標等と呼ばれている。英語ではGini’s Diversity Index。 コッラド・ジニ(Corrado Gini)が同じく考案したジニ係数とは違うもの。(ジニ係数のアイデアが基になっているそう。) 使われているところ 決定木のアルゴリズムは複数あり、CARTというアルゴリズムでジニ不純度を指標にして決定木を構築することが多いようです。 他のアルゴリズムであるID3,C4.5,C5.0は、エントロピーを指標にして決定木を構築しています。 こちらのアルゴリズムが使われているところをあまり見ないのですが、アルゴリズムが簡単なので決定木を習う際によく取り上げられるのではないでしょ