タグ

ブックマーク / upura.hatenablog.com (1)

  • 仮説と可視化から新しい特徴量を作る Kaggleのタイタニックを例に - u++の備忘録

    記事では、Kaggleのタイタニックを例に、仮説と可視化から新しい特徴量を作る過程についてまとめます。 仮説と可視化から新しい特徴量を作る 予測精度に寄与する新しい特徴量を作成するに当たっては、仮説と可視化を繰り返す過程が大事です。 予測精度に寄与しそうな仮説を立てる 可視化を実施する 予測精度に寄与する仮説を見つけるため 仮説が正しいかを検証するため 個々人や問題によって、どちらが起点になるかが変わってきます。 ケース1)ドメイン知識がある場合 例えば自分が詳しい、つまりドメイン知識を持っている分野の問題に取り組む場合、最初から仮説がいくつかあると思います。その場合は仮説を検証するような可視化を実施し、当に予測精度に寄与するかを確認します。その可視化の結果によっては、改めて仮説を立てることになるかもしれません。 ケース2)ドメイン知識がない場合 ドメイン知識がない場合は、まずは仮説を

    仮説と可視化から新しい特徴量を作る Kaggleのタイタニックを例に - u++の備忘録
  • 1