タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

ジニ係数に関するsimakawaのブックマーク (6)

  • 決定木入門編 「ウォーリーを探せ」から考える不純度の考え方 - Np-Urのデータ分析教室

    機械学習の分野でよく使われる決定木について今回は説明していきます。 決定木は、回帰、分類問題に対して、非常によく使われる手法の一つで、あらゆる現場でよく使われているのではないかと思います。 アルゴリズム自体はとてもシンプルですし、R,Pythonにおいてパッケージも豊富というところもあり、 何よりも結果の可読性の高さが人気の一つの理由かと思います。 今回の進め方としては、以下のように進めていきます。 決定木って何?(ざっくり図から理解) 分割規則(不純度について) 決定木の理論面については、「はじめてのパターン認識」を参考にしていただくといいかと思います。 はじめてのパターン認識 作者: 平井有三出版社/メーカー: 森北出版発売日: 2012/07/31メディア: 単行(ソフトカバー)購入: 1人 クリック: 7回この商品を含むブログ (5件) を見る 決定木とは 決定木は、条件分岐によ

    決定木入門編 「ウォーリーを探せ」から考える不純度の考え方 - Np-Urのデータ分析教室
  • 総合広告代理店アイクリック

    あなたの想いを私たちが伝える。 あなたと誰かがつながっていく。 そこには共感がうまれ、 双方に新しい喜びと感動がひろがっていく。 そんな幸せなコミュニケーションをつくること、 それが、私たちアイクリックの使命です。 このシンボルマークは 従業員はもちろん全ての関係者へ感謝の気持ちを込め、 広告という仕事を通して伝えていかなければならない「感動・興奮・強調・驚き」を表す エクスクラメーションマークと、アイクリックの「i」を組み合わせ、 人と人の繋がりをイメージしてつくられたものです。

    総合広告代理店アイクリック
  • 2-6. ジニ係数の求め方 | 統計学の時間 | 統計WEB

    次の図のローレンツ曲線から「ジニ係数」を求めてみます。ジニ係数は完全平等線((0,0)と(1,1)を結ぶ線:図中の黒破線)とローレンツ曲線との間の面積(橙色部分)を2倍した値です。

  • 2-5. ジニ係数 | 統計学の時間 | 統計WEB

    2つの累積相対度数を用いて描かれたローレンツ曲線を使うと、「偏り=不均等さ」を確認できます。 例えば、次の各都道府県内にある映画館のスクリーン数のデータから作成したローレンツ曲線の赤い矢印をたどると、約80%の都道府県内で全国のすべてのスクリーン数の40%強があるということが分かります。逆に、残りの約20%の都道府県内には60%弱ものスクリーン数があるということなので、スクリーンの分布は不均等であることが分かります。 この「偏り」や「不均等さ」を数値で表したものが「ジニ係数」です。ジニ係数は完全平等線((0,0)と(1,1)を結ぶ線:図中の黒破線)とローレンツ曲線との間の面積(次の図の橙色部分)を2倍した値になります。ジニ係数は0から1までの値をとり、1に近いほど偏りが大きく、0に近いほど偏りが小さいことを表します。 ■ジニ係数が0の場合 不均等さが全くない場合、ローレンツ曲線は次の図のよ

  • ジニ係数

    貧富の格差を測る指標に,ジニ係数がある.ジニ係数は、0から1までの値をとり、分布が平等であれば0に近づき、不平等であれば1に近づく係数であり、値の大きさが不平等度を測る指標として用いられている。例えば、5世帯の所得が、少ない順に10万円、20万円、30万円、40万円、100万円の場合のジニ係数をもとめてみよう. 世帯数の累積相対度数を横軸に、所得の累積相対度数を縦軸にとり、原点と各点を結んだ線をローレンツ曲線という。ローレンツ曲線は、所得の分布が平等であれば、原点を通過する45度線に近づき、不平等であれば45度線から右下に離れる傾向がある。 表 ローレンツ曲線と45度線で囲まれる面積の2倍した値をジニ係数と呼ぶ。この場合,ローレンツ曲線と45度線で囲まれる面積は,0.2であり,ジニ係数は0.4である. 図 ローレンツ曲線とジニ係数

  • 1