この方法でもう絶対忘れん‼️〜分散・標準偏差の公式を!

AI学習ダイアリー
定番の一品、豚肉のレモンステーキ!(『悪魔のレシピ』より)

『改訂版 統計のはなし』で、

著者が語りかけてきて、ぐいぐい読める!

著者の大村平は、

統計的なものの見方、ものの考え方ができなければ、それは、社会人としては失格だ

と、統計学の必要性を述べている。

おっしゃるとおりなのだが、
統計学を学習しようとして、
何度挫折したことか(泣)
(本棚に統計学の本の屍がいっぱい・・・)

しかし、今回学習中の
『マンガでわかる統計学』は、

最初の一冊はこれで決まり!

第1章 平均・分散・標準偏差
第2章 正規分布
第3章 いろいろな分布(二項分布とポアソン分布)
第4章 推測統計
第5章 仮説検定

という章立てで
ひととおり統計学の基本を網羅しているうえに、
ほぼ数式なしで平易なため、
一週間もあれば完走できる!

第1章では、

平均・分散・標準偏差は、ヒストグラムをつくり、
一峰性でなければ、役立たずなだけではなく誤解のもとである
データの散らばりを表す分散は、
平均からどのくらいずれているかを評価するもの
各データの平均とのズレを標準偏差で割った値(*1)が、
データの評価として重要

ということを学んだ。

*1 本書では、平均点70標準偏差12.99の国語と、平均点80標準偏差4の数学で、両方とも90点取った場合、どちらがすごいことなのかを、この値(スゴイ度と名付けている)で判断する例が載っている。(p66〜68)

Excelで、
分散(VARiance)「VAR.P関数」で、
標準偏差は、その値を「SQRT関数」に代入すればすぐ求められる。

Excelでは式も意味もわからずともOKだが・・・

大切なのは、

平均からの距離が大きいものがたくさんあると、バラバラ散らばってる感じがする=分散が大きい‼️

というイメージをつかんだうえで、
分散の計算方法を理解することだ。

1.データの平均(μ:ミュー)を求める。
2.すべてのデータについてμとの差(平均からの距離)を取る。
3.2をそれぞれ2乗する(*2)
4.ぜんぶ足して、データ数で割る。

つまり、

平均は、データを、ぜんぶ足してデータ数で割る
分散は、データと平均の差を2乗したものを、ぜんぶ足してデータ数で割る(分散って、データの散らばりの平均!)

ということだ。
これで絶対、分散の計算方法、忘れん‼️

*2 各データと平均との差の総和は必ず0になるので、こういう工夫をする。なお、絶対値を使う「絶対偏差」という指標もあるが、数学上の処理をしにくいのであまり使われない。

さあ、これで、第1章は終了〜!

Follow me!

PAGE TOP