http://sucrose.hatenablog.com/entry/2013/04/19/001748 http://d.hatena.ne.jp/repose/20130419/1366375616 結果が微妙な上に既に上位陣が記事を書いているのでいまさらな感じもあるが記録として。 やってることそんなに変わらなかったなーという感想。 使用言語 Pythonのpandasとscikit-learnの両ライブラリで通した。 Rの方が慣れているんだけど、Pythonをがっつり勉強する良い機会なのでPythonしばりとした。 ただ、不均衡データの調整についてはRのDMwRライブラリのSMOTEを用いた(最終的には使わなかった)。 http://d.hatena.ne.jp/sfchaos/20111202/p1 特徴量 基本的にアクションカウント。月単位、曜日単位、時間単位等。アクションのバ