サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
WWDC25
qiita.com/Shun_PI
こうすると、例えば「中央値と利用金額の比率が10以上」とかで分割することで、不正利用かどうかを判定できることがわかります。 上記は極端な例でしたが、このように**「あるグループにおける特徴量の傾向」**を特徴量として与えたい場合に、集約特徴量が役に立つ可能性があります。 特徴量の削減(選択) 「学習に役立たない余計な特徴量」の存在は、学習時間やメモリ使用量を悪化させます。場合によっては、スコアを悪化させる可能性があります20。したがって、そういった特徴量は削減すべきです。 どの特徴量が余計かを判定するための手法として現在主流のものに、「Permutation Importance」という手法が存在します。 簡単に言うと、「ある特徴量をバリデーションデータ全体でシャッフルした場合に、どれだけCVスコアが悪くなるか(場合によっては良くなることも)」を見ることで、その特徴量の重要度を判定するとい
このページを最初にブックマークしてみませんか?
『qiita.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く