分散(Variance)/標準偏差(SD:Standard Deviation)とは?:AI・機械学習の用語辞典 用語「分散」「標準偏差」について説明。いずれもデータの広がり具合を表す統計量。分散は、各データに対して「平均値との差」(=偏差)の二乗値を計算し、その総和をデータ数で割った値(=平均値)を表す。標準偏差は、分散に対する平方根の値を表す。 連載目次 用語解説 数学/統計学/機械学習における分散(variance)とは、データ(観測値)がどれくらい広がっているか、より厳密には「データが平均値からどれくらい離れているか」(=バラツキ具合)を表す統計量である。分散は、各データに対して「(全データから計算した)平均値との差」(=「偏差:deviation」と呼ぶ)の二乗値を計算し、その二乗値の総和をデータ数で割ること(つまり全二乗値の平均値)で求まる(数式は後述)。 標準偏差(SD:St