scikit-learnのモジュール内には特徴量選択のクラスがあるのですが,どのような原理で動作して、どういうときに何のクラスを使えばよいかわからなかったので少しまとめてみました。 そもそも特徴量選択とは何か 特徴量選択 (feature selection) とは、データにある特徴量の集合から、部分集合を選択するプロセスのことを指します。1 元の特徴量や生データから新しく特徴量を作り出す行為は特徴抽出 (feature extraction) と呼ばれ、別モノのようです。 特徴量選択は主に、以下の3つのカテゴリに分類できます。 wrapper method 特徴量の部分集合を取り出し、それらを使ってモデルを訓練し、そのモデルで予測をした誤差を評価していき最適な部分集合を決める 部分集合を取り出すときに、以下のfilter methodのfilterを使うこともあるようです。 例: RFE
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く