7. 前処理のニーズ • データフォーマットの変換 – 生データを学習器が読み込めるVector型に変換する • JSONから値を引きずり出す • 画像をベクトル化、グラフを処理してベクトル化 – 異なるデータソースを手動join • 特徴量チューニングによる精度改善 – 利用する変数の取捨選択、欠損値の対応、異常値の除外 – 変数のクリッピング(最大値、最小値) – 変数のログスケール変換(負の値の対応) – 変数を演算して、線形分離しやすい新しい変数を作る • 正規化、足し算、引き算、割り算、分散 – bool値を0,1に変換 – ラベル変数を0,1に変換