2189 統計:標準偏差とは

統計について、軽く勉強したので自分のメモ代わりにブログに書いておく。
数式を使わずに、分散、標準偏差の本質と思われることをまとめてみました。

平均 m ※わかっているので説明省略

偏差 x-m (平均との差)

偏差は+も-もあり、偏差の平均を出すと当然0になってしまう。(そうなる値が平均だから)
これでは偏差の傾向、平均からの散らばり具合がわからない。どうしよう。

対策1
絶対値を使う →実際には使われない→なぜ?
→(憶測)0より大きいか否かの判断が入るからでは?
処理の道筋が分岐するのはアルゴリズム的に避けたい。しかもそれをデータの数だけ行うのは大変。

対策2
2乗する →これなら 偏差が+でも-でも2乗すれば+になる。
これの平均を求めればよい。これが分散だ。

ただし分散(偏差の2乗を平均したもの)では、測定値と次元が違う(2乗になっている)ので比べにくい。
そこでこれを√する。 
ただしこうなると偏差の平均っぽい(代表値に使えそう)けど、「偏差の平均」とは違うもの。(偏差の平均は0のはず)
→「平均」とは違う、全データを代表しそうな言葉「標準」をつけて標準偏差とよぼう。

コメント

タイトルとURLをコピーしました