連載目次 用語解説 一般的に正規化(Normalization)とは、さまざまな大きさや単位の情報/データを、比べやすく考えやすくするために、共通の基準やルールに合わせること、つまりデータを「普通の(Normal)」状態にする作業のことを指す。例えば走った距離を比較する際に、メートル(m)単位とキロメートル(km)単位が混在していると理解しづらいため、共通の単位に合わせる(例えば全てをkmに統一する)ことで情報が扱いやすくなる。 「正規化」や「標準化」という用語はさまざまな分野で用いられており、各分野で意味も異なる場合がある。例えばデータベース設計の「正規化」は、同じテーブル内のデータの重複をなくすなどの目的で、データを複数のテーブルに分割したりして整理することを指す。以下では「数学/統計学/機械学習における正規化」について説明している。
![正規化(Normalization)/標準化(Standardization)とは?](https://cdn-ak-scissors.b.st-hatena.com/image/square/0b3a817f4eace33732e8086cfcff3672de08618d/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fait%2Farticles%2F2110%2F07%2Fcover_news027.png)