タグ

ブックマーク / qiita.com/jun40vn (1)

  • KaggleチュートリアルTitanicで上位2%以内に入るノウハウ - Qiita

    1.はじめに 機械学習を勉強し始めたので、なにはともあれ Kaggleの初心者向けチュートリアル、タイタニックにトライしてみました。 最初は、日語のWeb情報を参考に、自分なりに特徴量を色々いじってみたわけですが、学習データでは良い精度が出ても、テストデータをSubmitすると、思った様に精度は上がらず、なかなか80%の壁を破れず悶々としていました。 そうした中で、英文なので取っ付き難いですが、Kaggle/TaitanicのNotebookにある先人の知恵を拝借して、やっと上位2%に入れたので、特に参考になった点を中心に備忘録として残します。 では、コードに沿って説明して行きます。 1.データの読み込み まず、データセットを読み込みます。trainとtestを別々に扱うと、2回同じ処理をする必要があるので、合体させdfとします。 import numpy as np import pa

    KaggleチュートリアルTitanicで上位2%以内に入るノウハウ - Qiita
  • 1