統計学の勉強を始めて最初のほうでつまづく分かりにくい概念が「自由度」である。1つの例が、母平均・母分散が不明な母集団から標本を抜き出した場合に、母分散の推定値となる「不偏分散」を求める場合である。 まず、標本分散と不偏分散の定義的および数式的な違いを理解しておく必要がある。標本分散は、文字通り「標本の分散」であるから、偏差平方和(平均と実測値との差の総和)を標本数(n)で割る。いってみれば、標本値における偏差(標本平均からのずれ)の平均値である。これに対して、不偏分散は、母分散の不偏推定量(バイアスがない推定値)であるという意味であり、偏差平方和を(n-1)で割った値になる。 ここで素人的には「なぜ不偏分散を求めるときはnではなく(n-1)で割るのだろうか」という疑問が出てきてしまうのである。さらにいうと「(n-1)の1に意味があるのだろうか。2とか3ではダメなのか」というような疑問が出て