ブックマーク / tawara.hatenablog.com (3)

  • 黒魔術への招待:Neural Network Stacking の探求 - 俵言

    この記事は Kaggle Advent Calendar 2020 の16日目の記事です。去年ネタ記事*1を書いたので今年は真面目なやつにしました。 はじめに Kaggler はコンペにおいてあらゆる手段を用いて評価指標の改善を目指します。特徴量エンジニアリング、モデルや学習手法の試行錯誤、特殊な前処理・後処理の考案、はたまた Leakage の利用に至るまで、ルールを破らない範囲であれば何でもする*2のが Kaggler です。今挙げた例はそのコンペ固有の性質(データの生成過程・分布、評価指標、... etc.)に着目することで大きな効果をもたらす場合が多いのですが、一方でいずれのコンペにおいても一定の効果が得られる手法があります。それは複数のモデルの予測結果を統合して予測を行う Ensemble です。Ensemble は統合するモデルに多様性があるほど性能が向上すると一般に知られてお

    黒魔術への招待:Neural Network Stacking の探求 - 俵言
  • 効果検証入門 1章の個人的最難関だった t 検定の話 - 俵言

    はじめに 巷で話題になっているアイツを僕も読み始めてます。(他のも読まないといけないのに) 効果検証入門〜正しい比較のための因果推論/計量経済学の基礎 作者:安井 翔太出版社/メーカー: 技術評論社発売日: 2020/01/18メディア: 単行(ソフトカバー) 初歩的な所から理解したいという気持ちで輪講で1章の担当になり資料を作っていたのですが、有意差検定のあたりで頭がバグったので t 検定の復習をして行間を埋めることになりました。 これのせいもあって1.3節だけスライドのボリュームが多い— 俵 (@tawatawara) February 20, 2020 おそらく1章で一番( 無駄に*1 )頑張ってしまったので、その内容を備忘録がてら書くことにします*2。統計全然わからんので、変なこと言っててもつよつよ勢はどうかヤサシクシテホシイ.... 介入(ガチ勢からのいいね)によって急激に書

    効果検証入門 1章の個人的最難関だった t 検定の話 - 俵言
  • Kaggle と出会ってから Master になるまで、そしてこれから。 - 俵言

    はじめに 以下の Tweet で言っている"長い旅路"の詳細です。完全にポエムかつ長文*1、しかも自己陶酔を多分に含んだ自分語りです。 暇かつ心に余裕があって何でも寛大に許せそうな場合にお読みください。 奇跡の solo gold を獲得し、遂に Kaggle Master になりました! Kaggle と出会ってから4年半、一念発起して分析コンペに気で取り組み始めてから1年半、長い旅路でした。 今までチームを組んだり議論したりして下さった皆さん、当にありがとうございました!これからもよろしくお願い致します! pic.twitter.com/IzWin2rioa— 俵 (@tawatawara) 2020年3月18日 話をしよう。あれは2年... いや5年くらい前の話だったか... といった感じの、むかーしむかしからの話*2。Kaggle と出会ってからの人生(の一部)の紹介みたいなも

    Kaggle と出会ってから Master になるまで、そしてこれから。 - 俵言
  • 1