もう一つコラム。

ばらつきを扱う計算を教えていると多いのが、
「なんで標準偏差を二乗するの?」
「分散の加法性ってどういうこと?なんで標準偏差足しちゃいけないの?」
という、ごく自然の疑問。
高校数学で計算のやり方だけ丸暗記で覚えちゃってたんだと思います。

私がよく使う例え話はこんなものです。

「『ばらつき』には、『形』があるので、図形と同じ扱いをするんですよ」

分散の形

「ばらつきは図形とよく似た性質を持っているんですよ。
形を無視して大きさだけを表したのが、図形では『面積』、ばらつきでは『分散』です。」

「ばらつきの大きさを『標準偏差』で表すことが多いけど、
ばらつきの基本的な統計量は『分散』という二次元の数字なんですよ。
図形で言うと『面積』に相当するんです。
『標準偏差』は『分散』の√をとって一次元にした数字にすぎないんですよ。
そうすることで『長さ』と同じように比較できるようにしているのです。」

面積と分散

「ばらつき(の大きさ)を足すというのは、図形で言えば『面積』を足すと言うこと。
つまり足せるのは『面積」に相当する『分散』の方です。
この事を『分散の加法性』と言っているのですよ。」

分散の加法性

二次元の数字を扱うというのは、数学の世界ではごく当たり前に行われていること。
三平方の定理とか、二次元の足し算です。
ベクトルとか行列では3次元、4次元…という計算も行えます。
プログラミングの世界では、PythonのNumpyが得意で、機械学習に応用されています。

私たちにも異分野の技術を扱う時代が来ている、と最近よく思うのです。
そのために基礎をしっかり教えておこうと工夫しているのです。