感度試験があまりにもしんどかったので、ちょっと一息。

統計の勉強をしている人はみんな、
「自由度って何?なんで1を引くの?」
と悩みます。
本を調べても、「自由度という概念」とか書いてあって、説明になっていませんね。

私は以下のように解釈しています。今のところこれで困ったことはありません。
もしこれでわかってくれる人がいれば光栄です。

まず、データが一つだけあったとしましょう。
一点だけなので、ばらつきはありません。0個です。
データ一つでは、ばらつきの計算ができないのです。

自由度0

次にデータを二つにしましょう。
二点あるので、ばらつきが1個測れます。やっとばらつきの計算ができます。

自由度1

さらにデータを三つにしましょう。
三点あるので、ばらつきは1個増えて、2個になります。
3個じゃないの?と思われるかもしれませんが、③=①+②なので、③は①と②さえあれば計算できる値です。独立と従属という言葉で表現すれば、従属ですね。
独立したばらつきは実質①と②の2個分になるのです。

自由度2

それでは、ここで3点の平均値を取ってみましょう。
各点から平均値を引いたものが3つできるはずです。
統計の世界ではこういう式がよく出てきます。
この時のばらつきの数はいくつ分でしょうか?

自由度2b

答えは2個分。
平均値は3つの点から計算した値なので従属。独立したデータが増えた訳ではありません。
二つ上の図と同じように、データが3つだからばらつきは実質2個分なのです。

このように、計算上扱う独立したばらつきが実質何個分なのかを表現しているのが「自由度」で、計算方法は、データの数-1となります。

それでは、ばらつきは平均いくつなの?という計算をする時には
1. ばらつきの偏差平方和を取って、
2. (実質的なばらつきの個数である)自由度で割るのです。
これが(不偏)分散です。

QC検定3級ぐらいで出てくる内容です。
私たちの仕事では2級ぐらいは取ってほしい所です。
がんばって勉強勉強。