文献Rich Caruana, Nikos Karampatziakis, Ainur YessenalinaICML2008,2013/05/23 読了STATLOGプロジェクトで色々なデータに対する色々な判別・回帰手法の性能が評価された.その後もSTATLOGプロジェクト以降に流行った手法を用いた評価は続けられたが,いずれにせよ最近は高次元データを扱う必要が増えてきて,色々な手法の精度がデータ次元の増大とともにどのように振る舞うかを系統的に評価することが重要である.ということで,10個の判別手法を10くらいのデータに適用.次元は大体750次元から680000次元まで.Boosted decision treeが4000次元くらいまでは割りとよい.高次元はやっぱりRF. 正直苦手なタイプの研究だけど大事といえば大事.特に評価方法は勉強になる.真似しろといわれるときついけど.