世の中は正規分布であふれてる〜統計学の基本「正規分布」とは?

AI学習ダイアリー
朝ウォークの途中で。浅野川(2021/4/3)

平均を頂点とし、
標準偏差を左右の広がりの度合いとして分布するデータを、
正規分布という。

たとえば、
男子の身長のデータをたくさん集めたら、
多分、
平均170cmくらいが最頻値(頂点)で、
データのばらつき(左右の広がり具合)は、
±6cmくらい(164cm〜176cm)になるだろう。

また、
50mmサイズのネジを機械で生産する場合、
50mmより少し大きかったり小さかったりするものもあるが、
25mmとか極端に大きく外れたものはめったに生じず(いっぱいあれば、機械が壊れている)
グラフを描けば、
50mmを頂点として、
左右対称な上に凸型のグラフになるだろう。

このように、
世の中には、正規分布に従うデータが多いのだ。

で、
その基本となる正規分布のグラフを
Excelで描いてみた。

(訂正)E列は確率変数ではなく確率

手順はかんたんで、以下の通り。

1.乱数を発生させる
B列に、NORM.INV関数で、200個の乱数をつくる(これが確率変数)
それをD列に値コピーして、確定させる。
例) B2:= NORM.INV(RAND(), 0, 1) 、B201までコピペ。
2.確率変数に応じた正規分布確率を算出する
E列に、NORM.DIST関数で、D列の確率変数に対する確率を算出する。
例) E2:= NORM.DIST(D2, 0, 1, FALSE)、D201までコピペ。
3.グラフを描く
まず、X軸となるD列(確率変数)を昇順に並べ替える。
そのあと、挿入タブから「散布図(平滑線とマーカー)」を選べば、
できあがり!

いまつくったのは、
平均が0、標準偏差が1の正規分布で、
これを「標準正規分布」と呼び、

この数表(*)さえあれば、
どんな正規分布もこれに当てはめれば計算が楽チン!

というスグレモノなのだ。
標準正規分布表といい、統計学の本の巻末に必ず収録されている。)

でも、

正規分布の計算ってなんなん?

当てはめれば、ってどうすんのん?

という数学的な話は、次回!

通勤路(富山)は桜の名所・松川。満開の桜も散り始め!

Follow me!

PAGE TOP