機械学習の前処理とは AIは生のデータから学習すると思っていたけれども、実施はデータの前処理が必要になるケースが多々あるようです。 Should I standardize the input variables (column vectors)? 上のサイトによると、機械学習への寄与が入力の大きさに影響するようなので、使用する機械学習のアルゴリズムごとに、入力を適切にスケーリング (標準化) することが必要らしいです。 (理解が間違っていなければ、、、) Scikit learnによる前処理 PythonのライブラリのScikit learnでは、この前処理を一括で行う関数が用意されています。下記のサイトにも、具体例が載っていますが、具体例で使用されている3x3行列では、いまいちイメージが沸かなかったので、どのような前処理が行われているのか、試してみました。 処理の対象とする行列の作成
