[B! kaggle] gandenのブックマーク

Kaggleで使われた特徴量エンジニアリングとアルゴリズムまとめ – かものはしの分析ブログ

都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーターほしいものリスト Kaggleにおいて、人によってはソリューションを書いてくれているものがあります。特徴量エンジニアリングやアルゴリズムなど業務での参考になるだろうと思われるので、仕事で関わりそうなデータという観点から4つほどですが事例を集めてみました。このような事例のまとまった本とかあったらいいのですが。基本的に各事例ごとに・目的・どんなデータセット・どんな特徴量エンジニアリング・どんなアルゴリズム・リンクを記していきます。 Walmart Recruiting – S

ganden 2017/07/27

リンク

Kaggleまとめ:BOSCH(kernels) - Qiita

はじめに過去に参加したKaggleの情報をアップしていきます．ここでは，BOSCHのカーネルで公開されていた便利なコードをピックアップします．コンペ概要や優勝者のコードに関しては，Kaggleまとめ:BOSCH(intro+forum discussion)，Kaggleまとめ:BOSCH(winner)にまとめており，こちらはサンプルコードを交えたデータの解析結果をまとめたものになります．本記事はPython2.7, numpy 1.11, scipy 0.17, scikit-learn 0.18, matplotlib 1.5, seaborn 0.7, pandas 0.17を使用しています． jupyter notebook上で動作確認済みです．(%matplotlib inlineは適当に修正してください) サンプルスクリプトを実行した際にエラー等あった場合は，コメント

ganden 2016/11/24

リンク

国内外のトップランカーが語るデータマイニングコンペの勝ち方～PyData.Tokyo Meetup #6、7イベントレポート

こんにちは、PyData.Tokyoオーガナイザーのシバタです。ボストンに向かう飛行機の中でこの記事を書き始めました。私事ですが、昨年12月よりDataRobot,Inc（下記「データロボット社」）という会社で働き始めました。今回は昨年10月に行われたPyData.Tokyo Meetup #6と今年2月に行われたPyData.Tokyo Meetup #7でのデータマイニングコンペをテーマに行った勉強会の様子をお伝えしたいと思っています。実はデータロボット社は多数のコンペ入賞者が働いていることで知られており、2つの勉強会に非常に関連の深い会社です。 DataRobot,Inc PyData.Tokyo Meetup #6 PyData.Tokyo Meetup #7 PyDataではこれまで機械学習や深層学習などデータ分析関連技術をテーマ別に扱ってきましたが、今回のテーマは、技術というよ

ganden 2016/04/13

リンク

Kaggleのコンペティションで公開されている手法・ソースコードのリンクをまとめてみた Part2 - のんびりしているエンジニアの日記

皆さんこんにちはお元気ですか。私は元気です。今日は前回の以下のページからだいぶ更新が立ち、Kaggleのコンペ的にも多くの開催がありました。そこで、新しいページでリンクを纏めてみました。中にはインタビューやフォーラム、githubなど様々なものが混合しているのはお許し下さい。 nonbiri-tereka.hatena blog.com Prudential Life Insurance Assessment 1st - 1st place solution - Prudential Life Insurance Assessment | Kaggle 2nd - Solution -- 2nd place - Prudential Life Insurance Assessment | Kaggle Homesite Quote Conversion 3rd- Homesite Q

ganden 2016/03/16

リンク

General Tips for participating Kaggle Competitions

The slides of a talk at Spark Taiwan User Group to share my experience and some general tips for participating kaggle competitions. Read less

ganden 2016/03/10

リンク

Kaggle – Airbnb New User Bookingsのアプローチについて(Kaggle Tokyo Meetup #1 20160305)

This document discusses various methods for calculating Wasserstein distance between probability distributions, including: - Sliced Wasserstein distance, which projects distributions onto lower-dimensional spaces to enable efficient 1D optimal transport calculations. - Max-sliced Wasserstein distance, which focuses sampling on the most informative projection directions. - Generalized sliced Wasser

ganden 2016/03/05

kaggle

リンク

Workflow, Serialization &� Docker for Kaggle

Kohei's slide for Kaggle Tokyo Meetup #1. (written in Japanese)

ganden 2016/03/05

リンク

Santa's Stolen Sleigh | Kaggle

♫ Alarm bells ring, are you listening? Santa's sleigh has gone missing ♫

ganden 2016/01/12

kaggle
tsp

リンク

いかにしてkaggleを解くか | threecourse's memo

Walmart2015については、CrowdFlowerのSolutionを参考にしながら、いろいろと考えながらやってました。結局xgboostとneural netのstackingくらいしかできませんでしたが。。(38th/1047) その中で、kaggleの問題に対して”解”を出すのにあたって、どういうポイントがあり、どのように進めていくべきかの”構造”を考えてみました。 kaggle masterだけど機械学習は素人なので、突っ込みどころはいっぱいあると思います。ご指摘やこんな資料があるなど、教えていただければ助かります。 1 – 特徴量作成・管理何だかんだいっても特徴量作成は重要で、重要な特徴量を逃すと勝ち目はないでしょう。逆に適切な特徴量が作れれば、xgboostだけで勝てることもあるようです。(cf. Rossmann) 特徴量はN * M（N:ID, M:要素数）の数

ganden 2016/01/12

リンク

Microsoft Word - Thesis_Ying_without_matrikelnummer.docx

Beating Kaggle the easy way Studienarbeit Ying Dong Wirtschaftsinformatik I Ying Dong Studiengang: Master Wirtschaftsinformatik Studienarbeit Thema: " Beating Kaggle the easy way" Eingereicht: 22. Juli 2015 Betreuer: Dr. Frederik Janssen Prof. Dr. Johannes Fürnkranz Fachgebiet Knowledge Engineering Group Fachbereich Informatik Technische Universität Darmstadt Hochschulstraße 10 64289 Darmstadt I C

ganden 2015/08/25

リンク

リクルート、世界最大のデータサイエンティストコミュニティ"Kaggle"と日本企業初の共催となるデータ予測コンペティション「RECRUIT Challenge - Coupon Purchase Prediction」開催を決定 | リクルートホールディングス

Home プレスルームホールディングスのプレスリリースリクルート、世界最大のデータサイエンティストコミュニティ"Kaggle"と日本企業初の共催となるデータ予測コンペティション「RECRUIT Challenge - Coupon Purchase Prediction」開催を決定株式会社リクルートホールディングス（本社：東京都千代田区、代表取締役社長　兼　CEO：峰岸真澄、以下リクルート）の人工知能（AI）の研究機関であるRecruit Institute of Techno logy（以下、RIT）は、世界最大のデータサイエンティストコミュニティであるKaggle（https://www.kaggle.com）において、日本企業として初の共催となるデータ予測コンペティション「RECRUIT Challenge - Coupon Purchase Prediction」を開催いたしま

ganden 2015/07/16

kaggle

リンク

Kaggle Ensembling Guide | MLWave

Model ensem bling is a very powerful technique to increase accuracy on a variety of ML tasks. In this article I will share my ensem bling approaches for Kaggle Competitions. For the first part we look at creating ensem bles from submission files. The second part will look at creating ensem bles through stacked generalization/blending. I answer why ensem bling reduces the generalization error. Finally I

ganden 2015/06/15

リンク

はてなブックマーク

タグ

関連タグで絞り込む (10)

kaggleに関するgandenのブックマーク (14)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス