タグ

2018年11月18日のブックマーク (2件)

  • 世界一のデータサイエンティストを目指して 〜Kaggle参加レポート5〜 - Kysmo’s Tech Blog

    こんにちは!株式会社キスモのKaggler 大越です。 またまた嬉しい報告があります! Kaggleで開かれていた、データ分析の世界大会”Home Credit Default Risk”で、史上最多の7198チームが参加する中で2位に入り、再びゴールドメダルを獲得しました。またそれに伴い、Kaggle Master※になりました!! ※Kaggle Master : メダルの数に応じて付与される称号の中で、最上位のGrandmasterに次ぐ2番目の称号のこと。 前回はAvitoでゴールドメダルを取った後に報告をさせていただきましたが、今回もまたまた良い報告ができ嬉しいです。 さて、今回のブログではそんなKaggleで開かれたKaggle insight challengeの内容を試したので、それをブログにします。 Kaggle insight challengeとは? 9月末に4日間の

    世界一のデータサイエンティストを目指して 〜Kaggle参加レポート5〜 - Kysmo’s Tech Blog
  • 仮説と可視化から新しい特徴量を作る Kaggleのタイタニックを例に - u++の備忘録

    記事では、Kaggleのタイタニックを例に、仮説と可視化から新しい特徴量を作る過程についてまとめます。 仮説と可視化から新しい特徴量を作る 予測精度に寄与する新しい特徴量を作成するに当たっては、仮説と可視化を繰り返す過程が大事です。 予測精度に寄与しそうな仮説を立てる 可視化を実施する 予測精度に寄与する仮説を見つけるため 仮説が正しいかを検証するため 個々人や問題によって、どちらが起点になるかが変わってきます。 ケース1)ドメイン知識がある場合 例えば自分が詳しい、つまりドメイン知識を持っている分野の問題に取り組む場合、最初から仮説がいくつかあると思います。その場合は仮説を検証するような可視化を実施し、当に予測精度に寄与するかを確認します。その可視化の結果によっては、改めて仮説を立てることになるかもしれません。 ケース2)ドメイン知識がない場合 ドメイン知識がない場合は、まずは仮説を

    仮説と可視化から新しい特徴量を作る Kaggleのタイタニックを例に - u++の備忘録