エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
KaggleでEDAをやろうと思った時に見る記事 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
KaggleでEDAをやろうと思った時に見る記事 - Qiita
記事を書いた目的 Kaggleコンペに参加する時、まず最初にやるべしと言われるのがEDA(Explanatory Data A... 記事を書いた目的 Kaggleコンペに参加する時、まず最初にやるべしと言われるのがEDA(Explanatory Data Analysis=探索的データ分析)です。ただ、何をやれば良いのかあまりまとまったものがないと思ったので、備忘のためにもまとめてみました。PythonとJupyter Notebookを使って数値予測のテーブルデータコンペへ参加する前提です。 こちらのKernelを参考にしました。 間違っている点や追加した方が良い点など、アドバイスをコメントで頂けると大変ありがたいです。 EDAでやること ・データのカラム名と意味の確認 ・データの大きさとデータ型の確認 ・欠損値チェック ・カラムごとの基礎統計量確認 ・ヒストグラムによる分布の可視化 ・散布図や箱ひげ図を用いた目的変数と、説明変数の関係の可視化 ・時系列データであれば、時系列トレンドの可視化 ・外れ値の確認 あたりで