1. 特徴量抽出とは 特徴量抽出(Feature Engineering)は機械学習の実応用において重要な工程です。 機械学習分野の大家であるAndrew Ng先生は次のように仰ったそうです(出典が見つからないので本当かは分かりません)。 "Coming up with feature is difficult, time-consuming, requires expert knowledge. 'Applied machine learning' is basically feature engineering." 実際に、Kaggleでも良い特徴量を見つけられるかどうかが順位を左右することがあるそうです。 しかしながら、特徴量抽出はアカデミックな研究対象ではないので、網羅的な解説が中々見つかりません。 そんな中で良い資料がありましたので、この内容を簡単にまとめます。 ただし、前半のカ
![特徴量抽出 - カテゴリ変数と数値変数の取り扱い方 - 川雲さんの分析ブログ](https://cdn-ak-scissors.b.st-hatena.com/image/square/7f8bceee6ef9ab5be4da3fbec3a4fe4502dbed04/height=288;version=1;width=512/https%3A%2F%2Fimages-fe.ssl-images-amazon.com%2Fimages%2FI%2F61D0XQc0fwL._SL160_.jpg)