タグ

ブックマーク / hayataka2049.hatenablog.jp (1)

  • 【python】ランダムフォレストのチューニングにOOB誤り率を使う - 静かなる名辞

    一般的な機械学習のアルゴリズムでは、パラメタチューニングにはグリッドサーチ・交差検証を組み合わせて使うのが割と普通だと思います。sklearnにはそれ専用のGridSearchCVというクラスまで用意されています。 実際問題としては、GridSearchは良いとしても交差検証をやったのでは計算コストをたくさんいます。なので、他の方法で代替できるなら、そうしたいところです。 そして、RandomForestはOOB誤り率という、いかにも強そうなスコアを計算できます。これの良いところは一回fitしただけで計算でき、交差検証と同じ(ような)結果が得られることです。 なので、OOB誤り率を使ったパラメタチューニングを試してみたいと思います。 OOB誤り率とはなんぞ? OOB誤り率、OOBエラー、OOB error等と呼ばれます。これを理解するためにはランダムフォレストの学習過程を(少なくとも大雑

    【python】ランダムフォレストのチューニングにOOB誤り率を使う - 静かなる名辞
  • 1