[B! kaggle] odan3240のブックマーク

odan3240 id:odan3240

kaggleに関するodan3240のブックマーク (7)

How to Use Kaggle
odan3240 2017/08/30
kaggle
リンク
Kaggle Blog – Medium
Kaggle BlogOfficial Kaggle Blog ft. interviews from top data science competitors and more!
odan3240 2017/07/30
kaggle

機械学習
リンク
Kaggle Blog – Medium
Kaggle BlogOfficial Kaggle Blog ft. interviews from top data science competitors and more!
odan3240 2017/07/29
stacking

kaggle
リンク
GitHub - kaz-Anova/StackNet: StackNet is a computational, scalable and analytical Meta modelling framework
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
odan3240 2017/07/29
GitHub

kaggle

machine learning
リンク
Kaggleで使われた特徴量エンジニアリングとアルゴリズムまとめ – かものはしの分析ブログ
都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーターほしいものリスト Kaggleにおいて、人によってはソリューションを書いてくれているものがあります。特徴量エンジニアリングやアルゴリズムなど業務での参考になるだろうと思われるので、仕事で関わりそうなデータという観点から4つほどですが事例を集めてみました。このような事例のまとまった本とかあったらいいのですが。基本的に各事例ごとに・目的・どんなデータセット・どんな特徴量エンジニアリング・どんなアルゴリズム・リンクを記していきます。 Walmart Recruiting – S
odan3240 2017/07/24
kaggle
リンク
いかにしてkaggleを解くか | threecourse's memo
Walmart2015については、CrowdFlowerのSolutionを参考にしながら、いろいろと考えながらやってました。結局xgboostとneural netのstackingくらいしかできませんでしたが。。(38th/1047) その中で、kaggleの問題に対して”解”を出すのにあたって、どういうポイントがあり、どのように進めていくべきかの”構造”を考えてみました。 kaggle masterだけど機械学習は素人なので、突っ込みどころはいっぱいあると思います。ご指摘やこんな資料があるなど、教えていただければ助かります。 1 – 特徴量作成・管理何だかんだいっても特徴量作成は重要で、重要な特徴量を逃すと勝ち目はないでしょう。逆に適切な特徴量が作れれば、xgboostだけで勝てることもあるようです。(cf. Rossmann) 特徴量はN * M（N:ID, M:要素数）の数
odan3240 2017/07/15
kaggle

機械学習

あとで読む
リンク
stacked generalization - puyokwの日記
[概要] 最近のkaggle のコンペのwinning solution で、stacked generalization がよく使われています。これの元になった論文は、1992 年のWolpert さんによるものです。 triskelion さんのブログKaggle Ensem bling Guide | MLWave の中でもこの手法についての説明があります。様々な学習器を上手く組み合わせて、より精度の良いモデルを作ろうというのが基本的な考え方です。具体的には次の図のような感じです。 level 0 は、元となるデータです。またこの場合における各学習器はgeneralizer と呼ばれています。level 0 のデータにgeneralizer を適用して生成されたデータがlevel 1 のデータとなります。その後も、同様に名づけられています。 [過去のコンペ] まずは、多層パーセプト
odan3240 2017/07/08
機械学習

kaggle

stacking
リンク
1