データセット手にしたら、数理モデルを作ったりする前に、通常はEDA(探索的データ分析)を実施します。 端的に言うと、データと仲良くなるための会話です。 ざっくり次のような流れになります。 データコンディションチェック(欠測値や基本統計量など) 単変量の分析(各変数の分布など) 多変量の分析(変数間の関係性など) 正直、EDA(探索的データ分析)はほぼ半分は似たような分析を実施します。 そこで、EDA(探索的データ分析)の中で似たような分析は自動化しようということで幾つかのライブラリーがあります。 今回は、「データセット手にしたら、Pythonでサクッと半自動EDA(探索的データ分析)をしよう」というお話しをします。 Rに関しては「Rでシンプル半自動EDA(探索的データ分析)」で紹介しています。 半自動EDAライブラリー 色々な半自動EDAライブラリーがあります。 今回紹介するのは、以下の3