「10分おきに出るバスがある。さて、何分待つ?」
という問題を、前回学んだ「確率分布」を使って考えてみる。
これを1分後、2分後、・・・、10分後と、
サイコロの目のようにとびとびの変数で考え、
1分待つ確率は1/10? 5分なら1/2?
と思いついたが、
ちょっと待て!
1分10秒とか、1分12秒とか・・・。
そう、
時間は連続したもので、
サイコロの目のように1、2、3、4、5、6と、とびとびの数字ではなく(「離散確率変数」という(*))、
「無限」に分割できるのだ。(「連続確率変数」という)(**)
それではどうやって確率を求めるのか?
そこで、どこかの天才が、
確率を面積で表そう!
と考えついたそうな。
0〜10分までをすべての値が一様な可能性で出るとしてグラフを描くと、
次のようになる。
すべての場合が網羅されるように、
ちょうどこの青い部分の面積が1になる(=)ように描かれているのだ。
(1/10X10=1)
この高さ1/10に当たるものを「確率密度」という。
そして、
連続確率変数の確率は、
「確率密度X確率変数の範囲」で求められる面積
に相当する。
たとえば、
ちょうど1分後にバスが来る確率は0だが、
1分以内にバスが来る確率は1/10となる(***)。
先ほど
5分なら1/2?
といったが、
正確には、
5分以内なら1/2
ということだ(これは実感に合う)。
このように、
ある範囲に値が含まれている可能性という考え方は、
統計学では広く用いられている概念だそうだ。
覚えておこう。
そして、
連続型確率変数が、ある値をとるという事象の確率密度を記述する方法を、
「確率密度関数」という。
これも大切な概念だ。
覚えておこう。