はじめに 過去に参加したKaggleの情報をアップしていきます. ここでは,Predicting Red Hat Business Valueのデータ紹介とフォーラムでの目立った議論をピックアップします. コンペ優勝者のコードに関しては,Kaggleまとめ:RedHat(後編)にまとめており,こちらは概要,ディスカッション,サンプルコードのまとめになります. (現在作成中) 本記事はPython2.7, numpy 1.11, scipy 0.17, scikit-learn 0.18, matplotlib 1.5, seaborn 0.7, pandas 0.17を使用しています. jupyter notebook上で動作確認済みです.(%matplotlib inlineは適当に修正してください) サンプルスクリプトを実行した際にエラー等あった場合は,コメントいただけると助かります.