[B! 適応の技術・技法][調査] slay-tのブックマーク

slay-t id:slay-t

適応の技術・技法と調査に関するslay-tのブックマーク (1)

序盤に試すテーブルデータの特徴量エンジニアリング
この記事はKaggle Advent Calendar 2021の4日目の記事です．はじめにこの記事ではテーブルデータコンペティションにおいて，主に数値データ，カテゴリデータをもとに特徴量を作成する方法をまとめました．発展的な内容というより，初めてコンペに参加する方でも使える汎用的な特徴量エンジニアリングを紹介します．特徴量エンジニアリング！...そのまえにモデルについて特徴量エンジニアリングはモデルによって処理が変わることがあります．例えば勾配ブースティング決定木(GBDT)といった決定木はスケーリングする必要がなく，またLightGBMなどは欠損値をそのまま扱うことができます．一方でニューラルネットワーク(NN)や線形回帰モデルはスケーリングおよび欠損値補完をする必要があります．このこと以外にも，決定木は各特徴量間で差や比率を表現することが苦手であるために明示的に作る必要
slay-t 2021/12/06
データ

適応の技術・技法

調査
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx