ブックマーク / zenn.dev/y0 (1)

  • 「Kaggleで勝つデータ分析の技術」から見る実用的な機械学習の知見

    はじめに 機械学習に関する実用的な知見を知るために、「Kaggleで勝つデータ分析技術」を読んだので、Kaggle以外の場面でも活用できる話題をまとめてみた。書は機械学習の基的な内容も含んでいるが、この記事では機会学習に関する一通りの知識を持ち、実問題に利用している読者を想定してまとめた。従って、勾配ブースティング木の仕組みや、回帰タスクの評価方法等、基的な内容については解説しない。記事では、評価の落とし穴や、モデルを改善するための特徴量の工夫、チューニングのTipsについて紹介する。 特徴量 Tips 1: 欠損値の扱い データにはしばしば欠損値が含まれている。欠損値は、そもそも値が存在していない場合の他に、ユーザが意図して入力していない場合や、観測器のエラーによって取得できていない場合等、様々な理由によって生じる。欠損がランダムに発生していない限り、欠損しているという事実が何

    「Kaggleで勝つデータ分析の技術」から見る実用的な機械学習の知見
  • 1