2015年12月29日のブックマーク (1件)

  • Stackingに関して (1) - 東京に棲む日々

    予測モデルのコンペで使われているStackingという手法に関して。 モデルをEnsembleしまくって、マルチステージモデルにして予測精度を高めるときに使われる手法とのこと。 実務家な私も、業務でマルチステージモデル(2ステージ)を組む必要があったので、そのためのメモ。 kaggleなどで発明され、まだ教科書にはなっていない方法論のようで、以下を参照。 KAGGLE ENSEMBLING GUIDE 具体的には以下のような課題(データ)があった。 目的変数y(0,1のBinomial)、説明変数rとXでモデルを作りたい。 rは個々のセールスマンを示すようなカテゴリカルデータで、変量効果として扱いたい。 Xは営業日誌のようなテキストデータから単語抽出して、TF-IDF変換した横長なデータ。 混合モデル(Logistic GLMM)を作成したいが、横長なXをそのままロジスティックモデルの変数

    Stackingに関して (1) - 東京に棲む日々