特徴量選択(変数選択)は、機械学習系の予測モデルなどを構築するとき、最初に行う重要なステップの1つです。 予測に寄与しない特徴量(説明変数)を取り除くことで、よりシンプルな予測モデルを構築を目指します。 色々な考え方や手法、アプローチ方法があります。 今回は、「基本となる3つの特徴選択手法とPythonでの実装」というお話しです。 基本となる3つの考え方 幾つかやり方がありますが、基本となるのは次の3つ考え方です。 フィルター法(Filter Method) ラッパー法(Wrapper Method) 埋め込み法(Embedded Method) フィルター法(Filter Method) フィルター法は最もシンプルなアプローチです。 ある基準をもとに、必要な特徴量選択(変数選択)していくからです。 最も簡単なのは、相関係数を利用した方法です。 各特徴量(説明変数)に対し目的変数との相関係
![基本となる3つの特徴選択手法とPythonでの実装](https://cdn-ak-scissors.b.st-hatena.com/image/square/1b7c7438492fcc6f8e5afed516db0780835cc775/height=288;version=1;width=512/https%3A%2F%2Fwww.salesanalytics.co.jp%2Fwp-content%2Fuploads%2F2023%2F04%2F37850e8e00b31d601ebf70d3891537ed.png)