こんにちは!Facebookチームです。 今日は、Indeedのスターソフトウェアエンジニアの小巻 千洋さんを紹介したいと思います♫...

はじめに 「kaggleって何?」という人が、 kaggleがなにかわかる(話が合わせられる) kaggleコンペに参加してみる(ノリ気になる) ためのお手軽説明です(`・ω・´) Agenda kaggleとは? データ分析のトレンドの変化 kaggleの仕組み なぜkaggleをやるの? やってみた(`・ω・´) 1. kaggleとは? 世界最大の機械学習・データ分析のコンペを主催するプラットフォーム つまり データサイエンティストの世界最強を決める大会 kaggleの規模 ユーザ数: 50万以上 国: 190カ国以上 らしい(`・ω・´) 2. データ分析トレンドの変化 理論(theory) ↓ 実践(practice) 昔 理解するのが大事(theory) 今 実践・役立つのが大事(practice) 実践を重視している具体例 kaggle コンペ ノウハウの共有(コード・ディス
Kaggle Meetupのネタにでも、ふわっとした文章を書いてみる。 個人の意見です&ここ1-2年の状況変化は追えていないかも。 (追記:タイトルは「月刊競技プログラミングは役に立たない」という競プロ方面のネタから来ています) どうでもいい技術、どうでもいくない技術 Kaggleで勝つための技術を書き連ねてみる: Python, R, ライブラリの使い方 特徴量の作成 データについての考察、EDA モデルの使い方、パラメータチューニング 評価指標についての考察 DiscussionやWinner’s interviewを読む英語力 柔軟に作業や分析を回すためのクラス・ワークフロー・ログなどの実装 GCP, AWS, BigQueryといったサービスの運用 論文を読んで手法を参考にしたり実装したりする力 折れない心 改めてまとめてみると普通に学んで損のないものばかりな気がしてきた。 ただ、
はじめに IOI 2013 オーストラリア大会に Art Class という問題があります。 この問題は、画像データが与えられるのでその画像が 様式1(新造形主義の現代芸術) 様式2(印象派の風景画) 様式3(表現派のアクション・ペインティング) 様式4(カラーフィールド・ペインティング) のいずれであるかを判定する問題です。 正答率が 0.9 以上になると満点が得られます。 IOI にしては珍しい機械学習的な問題であることと、ジャッジが壊れて結果が返ってこなくなったことなどで有名なので、知っている人も多いかもしれません。 問題文やデータは、 http://www.ioinformatics.org/locations/ioi13/contest/ から手に入ります。 普通の解法 例えば 3x3 と 65x65 の大きさの窓を作って分散を計算して、それらを使って手で決定木を作るなどすると解
今日は#pyhack & Kaggleに初参加してみました。 Kaggleとは? Kaggleは企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォーム及びその運営会社である。 bywikipedia とりあえず今日の目標は、機械学習とか全くわからないけど、とりあえず何か提出してみよう、という感じです。 挑戦するのはDigit Recognizerという、手書きの数字の画像から数字を判別するチュートリアルコンテストです。 データは実際には画像ではなくて、28*28の0~255の数字で用意されています。 まずは適当にやってみる 誰かの記事なんかに沿ってやってくのは難しいしよくわからないし、ワクワクしないので、とりあえず最初に自分で考えたしょぼい方法でどこまでできるかやってみます。 機械学習(教師あり)は一切知識がない
Home プレスルーム ホールディングスのプレスリリース リクルート、世界最大のデータサイエンティストコミュニティ"Kaggle"と日本企業初の共催となるデータ予測コンペティション「RECRUIT Challenge - Coupon Purchase Prediction」開催を決定 株式会社リクルートホールディングス(本社:東京都千代田区、代表取締役社長 兼 CEO:峰岸真澄、以下リクルート)の人工知能(AI)の研究機関であるRecruit Institute of Technology(以下、RIT)は、世界最大のデータサイエンティストコミュニティであるKaggle(https://www.kaggle.com)において、日本企業として初の共催となるデータ予測コンペティション「RECRUIT Challenge - Coupon Purchase Prediction」を開催いたしま
2015/5/13 にランキングシステムが変更された。 新旧ポイント計算式 A: チームメンバー数 B: 順位 C: 参加チーム数 D: min(コンペ終了からの期間(年), 2) t: コンペ終了からの期間(日) 新 旧 詳しくは以下を参照 ランキングの定義 https://www.kaggle.com/wiki/UserRankingAndTierSystem 変更の経緯 Improved Kaggle Rankings | No Free Hunch 変更に対する反応 Improved Kaggle Rankings 次にKaggleのランキングに関するツイートを紹介する。すべてシステム変更前のものだが、ランキングの現状をよく表している。 Beatbenchmark:コンペ参加者がForumに投稿した予測作成コード Beat the bencnmark .. というタイトルであること
今年はいろいろ開催されたのに全然参加できなかった 目標に「kaggleに参加する」とか書いてた気がするんだけど…… 画像認識系だとまったく手が出ないのもなんとかしたい 機械学習のコンペは、訓練データが与えられてそれで何かしら予測モデルを作って予測結果を提出するっていう形式が多いです 途中のランキング用のデータと最終評価用のデータが別にあってうまく予測できているかを競います 賞金付きなのが結構多く、学生限定とかの出場制限もあまりありません ちなみに素性エンジニアリングとかをがんばるのなら時間がある方が有利かなと思うので学生の人におすすめです(?) コンペが開催されてるサイト kaggle(英語) 一番の大手。参加者が多くて相手が強すぎる感じもする 終了後にフォーラムとかブログとかで手法が公開されていることが多いので参考になる no free hunch | the sport of data
マラソンマッチというのは10日間ぐらいの期間で問題を分析しコードを書いてスコアを競う競技です。 今回ので3回めのマラソンマッチ参加。 序盤は上位にいられたのですが、終盤は失速してしまいましたorz 順位表 http://community.topcoder.com/longcontest/stats/?module=ViewOverview&rd=15876 問題の説明 AlleleClassifier 問題の内容は与えられたデータ点(\(x, y\)の2次元の値)の6つのラベルへの分類でした。 与えられたデータ点はいくつかのマップごとに与えられています。 ラベルは'0'、'0 or 1'、'1'、'1 or 2'、'2'、'>2'となっていて、マップ内のデータ点は\(z = x - y\)の値の昇順に6つのラベルに分けられています。 問題文にも書いてあるのですが、マップごとに大きく値とラ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く