本記事のコード/ご参照 ・本記事の全体のコードのnotebookを以下にアップしております。あわせてご参照くださいませ。 “Kaggle titanic_tutorial_code” ・本記事含むKaggleやデータ分析初学者向けのチュートリアル解説本を執筆しました。あわせてご参照くださいませ。 ※本記事のコードや環境構築の詳細手順を記載した書籍となります。 『Pythonで動かして学ぶ!Kaggleデータ分析入門』 ※はじめに 本記事は2020年の上記書籍発売に合わせて内容を加筆・修正しました。そのため執筆当初と内容が異なる箇所がございます。またKaggleあるいはデータ分析における最初のチュートリアルとしてtitanicは長らく親しまれておりましたが、下記3点の現状があることをご認識いただいた上で取り組まれるのが良いかと思います。 ・データ数が少なくOverfit(過学習)しやすい ・
![Kaggleのtitanic問題で上位10%に入るまでの環境構築とデータ分析 - mirandora.com](https://cdn-ak-scissors.b.st-hatena.com/image/square/93fd5a8aa67c22c6fab88620d198f70c90109188/height=288;version=1;width=512/https%3A%2F%2Fwww.mirandora.com%2Fwp-content%2Fuploads%2Ftitanic.jpg)