タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

pythonと統計学に関するatm_09_tdのブックマーク (1)

  • ランダムフォレストの評価と変数別寄与度 : 分析技術とビジネスインテリジェンス

    1月6 ランダムフォレストの評価と変数別寄与度 カテゴリ:分析技術 今回はランダムフォレストによるモデル構築と変数別の寄与度の表示方法をまとめる。高い予測精度が期待され、多数の説明変数が扱え並列処理が可能、そして各変数の予測への寄与度がわかると言われれば素敵な手法と思えてくる。 自分はCRMの中でも顧客行動理解を主戦場にしているので、精度追求よりも各変数の予測モデルへの寄与度を利用することが多い。もちろん回帰でも可能だが、カテゴリカル変数、連続変数を問わず定量化してくれるのは有難い。 特徴選択そのものだけだと、変数を除去した影響、つまり何かしらの問題の予測モデルの説明力がどこまで残っているのかを知るには別途作業をしなければいけない。そういう手間が省けるということもある。 以下にOrangeを用いたランダムフォレストの評価、各変数の寄与度の表示をまとめた。参考として分類は通常の決定木(ランダ

  • 1