特徴量選択(変数選択)は、機械学習系の予測モデルなどを構築するとき、最初に行う重要なステップの1つです。 予測に寄与しない特徴量(説明変数)を取り除くことで、よりシンプルな予測モデルを構築を目指します。 色々な考え方や手法、アプローチ方法があります。 今回は、「基本となる3つの特徴選択手法とPythonでの実装」というお話しです。 基本となる3つの考え方 幾つかやり方がありますが、基本となるのは次の3つ考え方です。 フィルター法(Filter Method) ラッパー法(Wrapper Method) 埋め込み法(Embedded Method) フィルター法(Filter Method) フィルター法は最もシンプルなアプローチです。 ある基準をもとに、必要な特徴量選択(変数選択)していくからです。 最も簡単なのは、相関係数を利用した方法です。 各特徴量(説明変数)に対し目的変数との相関係