最終更新:2018-04-02 はじめに スタッキング(stacking)といえば、複数の分類器を組み合わせて強い分類器を作る系の手法である。単なるvotingやsoft votingより強い。 誤解を恐れずにざっくり言ってしまうと、分類器の出力(複数)と真の出力の関係を機械学習する手法である。どうしてそれが強いのかというと、きっと分類器のクセや、出力の相関を機械学習していることが有効なのだろう、という気がする。 「この分類器は基本的にイケてねーんだけど、このラベルだけは正しく分類するんだよな」 「この分類器がこう言ってるときは、こっちのこいつの結果もそれなりに当てになるんだよな」 こういうシチュエーションは色々考えられるので、そういったものに対して効いているのだろう。 とはいえ、具体的にどんな実装になってるのかは割とよくわかってなかったので、実装してみることにした。実装にあたってはこちら