[B! 機械学習][kaggle] odan3240のブックマーク

Kaggle Blog – Medium

Kaggle BlogOfficial Kaggle Blog ft. interviews from top data science competitors and more!

odan3240 2017/07/30

リンク

いかにしてkaggleを解くか | threecourse's memo

Walmart2015については、CrowdFlowerのSolutionを参考にしながら、いろいろと考えながらやってました。結局xgboostとneural netのstackingくらいしかできませんでしたが。。(38th/1047) その中で、kaggleの問題に対して”解”を出すのにあたって、どういうポイントがあり、どのように進めていくべきかの”構造”を考えてみました。 kaggle masterだけど機械学習は素人なので、突っ込みどころはいっぱいあると思います。ご指摘やこんな資料があるなど、教えていただければ助かります。 1 – 特徴量作成・管理何だかんだいっても特徴量作成は重要で、重要な特徴量を逃すと勝ち目はないでしょう。逆に適切な特徴量が作れれば、xgboostだけで勝てることもあるようです。(cf. Rossmann) 特徴量はN * M（N:ID, M:要素数）の数

odan3240 2017/07/15

リンク

stacked generalization - puyokwの日記

[概要] 最近のkaggle のコンペのwinning solution で、stacked generalization がよく使われています。これの元になった論文は、1992 年のWolpert さんによるものです。 triskelion さんのブログKaggle Ensem bling Guide | MLWave の中でもこの手法についての説明があります。様々な学習器を上手く組み合わせて、より精度の良いモデルを作ろうというのが基本的な考え方です。具体的には次の図のような感じです。 level 0 は、元となるデータです。またこの場合における各学習器はgeneralizer と呼ばれています。level 0 のデータにgeneralizer を適用して生成されたデータがlevel 1 のデータとなります。その後も、同様に名づけられています。 [過去のコンペ] まずは、多層パーセプト

odan3240 2017/07/08

リンク

はてなブックマーク

タグ

関連タグで絞り込む (2)

機械学習とkaggleに関するodan3240のブックマーク (3)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス