タグ

Kaggleに関するwakame1367のブックマーク (10)

  • SPAでKaggleするために回った施設を独断と偏見で紹介する - 俵言

    【2019/12/28 追記】 RAKU SPA 鶴見は 2019/12/9-2019/12/13に行われた改装に伴い環境が大きく変わってしまいました。よってこの記事で述べている情報は古いです。ご注意ください。 こちらの記事は kaggle その2 Advent Calendar 2019 の2日目の記事となります。 はじめに この記事を読もうと開いた方は SPA Kaggle (あるいは spaggle) という言葉を見聞きしたことがある、かもしれない。可能性はゼロではないはず...*1 別に明確に定義されているわけでは無いですが、文字通り SPA に行って kaggle 関連の作業をしつつ、合間合間で休憩がてら温泉サウナでリフレッシュすることだと僕は思ってます*2。 僕自身がこの spaggle をするようになったのは Twitter 上でちらほら「SPA で Kaggle してる」

    SPAでKaggleするために回った施設を独断と偏見で紹介する - 俵言
    wakame1367
    wakame1367 2019/12/03
    SPAでKaggleするだけでこんなに文章書けるのすごい
  • atmaCup#2 インターン生参加記録 #atmaCup - atma-inc__blog

    はじめに はじめまして、atmaでインターンをしている植田 (@tellmoogry)と申します 今回のatmaCup#2では一般参加者として参加させていただきました 記事は1参加者目線からみたコンペの参加記事となります はじめに コンペ概要 コンペ中に取り組んだこと 結果 参加して良かった点 コンペ概要 今回のタスクは"睡眠データをもとにその人の睡眠の質を予測する"というものでした。 データはユーザーごとにtrain, testで連続した時系列データが与えられました。 目的変数はユーザーが入力した[1,2,3]の3段階で与えられ、値が小さいほどその人の睡眠の質が低いことを表します。 評価指標はRMSEでした。*1 public, private*2の中身については事前に以下のような説明がありました。 private/public は時系列によって分割されています。具体的には特定のユーザ

    atmaCup#2 インターン生参加記録 #atmaCup - atma-inc__blog
    wakame1367
    wakame1367 2019/11/26
    こんな使ったデータセットの中身に突っ込んでいいのですね
  • データ分析コンペで役に立つ特徴量管理方法と学習・推論パイプライン【コネヒトマルシェLT書き起こし】 - コネヒト開発者ブログ

    こんにちは!MLエンジニアの野澤(@takapy0210)です! 気づけば2019年の営業日も残り20日強ですね。年始に立てた個人的な目標が1/5しか達成できていないことに先日気付いたので、残りの期間で1つくらいは達成できると良いですね、という他人行儀な振る舞いをしたくなっている今日この頃です。 さて今回は、11月5日に開催した(コネヒトマルシェ)でLTした内容の全文書き起こしです。参考資料とあわせてご紹介できればと思います。 全文書き起こしは初の試みなので「ふ〜ん。なるほど〜」ぐらいのお気持ちで見ていただければと思います。 発表資料はこちらです。 Kaggleとは Kaggleと書いて「カグル」と読みます。日でも最近は定着してきましたが、Kaggleに参加している方を「カグラー(Kaggler)」とも呼びます。 「The Home of Data Science & Machine L

    データ分析コンペで役に立つ特徴量管理方法と学習・推論パイプライン【コネヒトマルシェLT書き起こし】 - コネヒト開発者ブログ
    wakame1367
    wakame1367 2019/11/15
    いい取り組みだなと想います
  • 営業マンが1年でSEになって機械学習エンジニアに転職する話 - かえるのプログラミングブログ

    こんばんは、かえるるる(@kaeru_nantoka)です。 先日、10ヶ月勤めたSES企業に辞意を伝えました。 そして4月からは、ストックマーク株式会社(https://stockmark.ai/ )にて、NLPを応用した機械学習エンジンを開発する機械学習エンジニアとして参画することになりました。 ちょうどいい人生の節目なので、流行っている転(退)職エントリを描いてみようと思います。 概要 ・営業職だけど趣味で始めたプログラミングにハマったよ ・未経験だけど第二新卒的なアレでプログラマーになるぞ ・ひょんなことから kaggle にハマったぞ ・なんか上京することになったよ ・なんで私がエクセル職人に!? ・なんとかソロ銅メダル取れたぞ ・kaggle 強くなりたいからもう一度転職するぞ! 筆者のスペック ・経済学部卒 ・プログラミング歴1年ちょい(2017年12月~) ・kaggle(

    営業マンが1年でSEになって機械学習エンジニアに転職する話 - かえるのプログラミングブログ
    wakame1367
    wakame1367 2019/02/11
    就業時間外でkaggleやれる時間がとれるというのは確かに参考になる情報ですね / kaggler が満足して働けている会社はいい会社です。
  • ランダムフォレストと検定を用いた特徴量選択手法 Boruta - 学習する天然ニューラルネット

    特徴量選択とは Borutaとは とりあえず使ってみる ベースラインの判別 Borutaの判別 Borutaのアイデアの概要 Borutaのアルゴリズム 1. 判別に寄与しないはずの偽の特徴量を作る。 2. 偽の特徴量と一緒にランダムフォレストを訓練。 3. 各特徴量の重要度と偽の特徴量の特徴量を比較。 4. 複数回比較し検定を行うことで、当に重要な特徴量のみを選択。 検定について 1. 棄却したい帰無仮説と受容したい対立仮説を用意する。 2. 観測値から検定統計量Tを定める。 3. 帰無仮説が正しいとしてTの分布を求める。 4. 十分小さい有意水準αを定め、帰無仮説が正しいときにとなる領域を棄却域とする。 5. 観測されたTがに入っていたら対立仮説を受容し、入っていなければ帰無仮説を受容する。 まとめ 補足 使う際のTips等 2019/01/06追記 参考 特徴量選択とは 特徴量選択

    ランダムフォレストと検定を用いた特徴量選択手法 Boruta - 学習する天然ニューラルネット
    wakame1367
    wakame1367 2019/01/05
    現行のkaggleコンペで試してみます
  • kaggleに初挑戦したお話 - 情弱大学生の独り言

    はじめに この記事では、具体的な解法は書いておりませんのでご了承を。 基的には、初挑戦した感想を書いております。 アドバイス等ございましたらぜひ@katsura_jpまでご教授お願いいたします。 初参戦したコンペ概要 初挑戦コンペはTGS Salt Identification Challengeでした。 どんなものかというと、地震画像(sesmic image)から塩分が含まれている箇所をセマンティックセグメンテーションしようという内容です。 あらかじめ報告しておくと、ゴールド圏内に入ることができました。 参加するきっかけ まず、なぜ参加しようと決めたのかというお話からしたいと思います。 私自身、Kaggleは1年ほど前に存在を知り、なんとなくアカウントを作成していました。 しかし、自信もなく、具体的に何から始めればいいの?と感じていました。 しかし、今回参加することを決めたのは、一つ

    kaggleに初挑戦したお話 - 情弱大学生の独り言
    wakame1367
    wakame1367 2018/10/21
    初メダルおめでとうございます!
  • Kaggleで世界11位になったデータ解析手法~Sansan高際睦起の模範コードに学ぶ|ハイクラス転職・求人情報サイト AMBI(アンビ)

    Kaggleで世界11位になったデータ解析手法~Sansan高際睦起の模範コードに学ぶ Kaggleの上位入賞者であるKaggle Grandmasterを獲得した、Sansan株式会社のデータサイエンティスト高際睦起さん。模範となるソースコードをもとに考え方や解析手法を教えていただきました。 「Porto Seguro’s Safe Driver Prediction」とは? 【技法1】前処理 【技法2】特徴抽出 【技法3】予測モデルの作成 Kaggle初心者は何から始めるべき? データサイエンティストを目指す若き人たちへ 世界中のデータサイエンティストたちが集まり、企業や研究者が投稿したデータに対する高精度なモデルを競い合うプラットフォーム・Kaggle。メンバーは100万人を超えており、良問の多さや参加者のレベルの高さゆえに、機械学習を学ぶ者にとって優れた研鑽(けんさん)の場となって

    Kaggleで世界11位になったデータ解析手法~Sansan高際睦起の模範コードに学ぶ|ハイクラス転職・求人情報サイト AMBI(アンビ)
    wakame1367
    wakame1367 2018/08/26
    Q: Kaggle初心者は何から始めるべき? A: 日本のKagglerが参加している「kaggler-ja」というSlackがあるので、まずはそれに入ってみるといいと思います。
  • https://crash.academy/class/239

    https://crash.academy/class/239
    wakame1367
    wakame1367 2018/06/27
    気になってたコンペのアプローチ、動画で見れる
  • 技術書典4のkaggle本関連エントリーのまとめ - カレーちゃんブログ

    データリファインメントでは、技術書典4で「kaggleのチュートリアル」を頒布しました。 技術書典4について書きたいことはだいたい書いたので、一旦まとめておいて、さらに書きたいことがあったらここに追記します。 色々なことをはてなブログとnote.muとtwitterで書いているので、自分でもなにをどこに書いたかまとめておかないと忘れてしまうんで、自分用のまとめでもあります。 販売ページ、サポートページ 販売ページ サポートページ の目次 試し読み 第1部(1章から3章) 4章 結果 商業出版 アクセス数、フォロワー数等 その他 販売ページ、サポートページ 販売ページ note.mu サポートページ www.currypurin.com GitHub - currypan/tb4-datarefinement: 技術書典4、kaggleのサポートページ(予定地) の目次 第1部 第1章

    技術書典4のkaggle本関連エントリーのまとめ - カレーちゃんブログ
  • 社内でKaggleの布教活動をやっている話 - yasuhisa's blog

    最近、社内勉強会で機械学習についてエンジニアに説明する機会があり、その際にKaggleについても説明しました。一方で うーん、「Kaggler はパラメータチューニングやアンサンブル等の自明でインクリメンタルな改善『しか』できない」というような誤解はどうやって解いていけばいいんだろう。— im132nd (@im132nd) 2018年4月4日 という話もあり、(特にデータサイエンティスト以外の職種の人が)Kaggleをやる意義/メリットについてまとめてみました。ガッと勢いで書いたので、項目に結構被りがあります。なお、書いている人はKaggleほぼ初心者であまり説得力がないです。Kaggle Masterの人がもっといいエントリを書いてくれるのを期待しています、議論の叩き台エントリです!! Kaggleをやる意義/メリット 様々なデータセットを触ることができる kernelでデータ分析

    社内でKaggleの布教活動をやっている話 - yasuhisa's blog
  • 1