二項分布の近似は、超かんたん!〜記述統計学、これにて終了!

AI学習ダイアリー
インスタントラーメンに海苔を立ててみた!

前回、こんな話をした。

カラー設定は「クラフト風のカジュアルカラー」

たとえば、

サイコロを720回投げて、6の目が150回以上出る確率は?

という問題。

Wordで作成(数学記号書けないので)

というとんでもないことになるので、
正規分布で近似する。

*個数が大きくなれば、というが、サイコロなら30個以上が目安だそう。
(『マンガでわかる統計学』より)

6の目が出る確率は1/6なので、
720回投げれば120回(720 × 1/6)くらい、
6の目が出るだろう(平均120)。

公式より、
分散は、100。
標準偏差は、10になる。

* 分散=120 × 5/6、標準偏差=√100
なお、分散の公式の導出方法は秘密(てか、覚えなくていいそうだ。)

なので、
150回を標準化すると、
z = (150-120) / 10 =

標準正規分布表より、

150回以上になる確率は、0.13%

と、かんたんに算出できる!

一方、
交通事故の発生率のような特殊な場合は、
ポアソン分布で近似する。

*特殊とは、
1.試行回数がやたらと大きい、2.生起確率がやたらと小さい、という場合。

ポアソン分布とは、

平均λ(ラムダ)発生するイベントがk回起こる確率で、
公式にλkを代入するだけ。
Excel ならPOISSON関数で一発で出る。

ビジネスでもよく使う分布!

1ヵ月で平均λ回コンバージョンする広告を使って得られる今月のコンバージョン数

とか、

1日平均λ個の不良品が発生する工場で、今日発生する不良品の個数

などを計算するのに使われる
汎用性の高い分布だ。

さて、

1.正規分布
2.二項分布
3.ポアソン分布

と出そろって、
これで「記述統計学」分野は終了だ!(*)

次回から、
いよいよ統計学の本丸、
「推測統計学」(の基礎)に入る。

* 統計学は大きく、
1.記述統計学(古典統計学)
2.推測統計学
3.ベイズ統計学
に分けられる。

Follow me!

PAGE TOP