ベストセラーの『マンガでわかる統計学』で、
統計の基礎を学びたい。
まずは、
1.Excelで、ヒストグラムを描く!
「統計は基本的に一峰性のヒストグラムに対して組み立てられた学問」なので、
「データからヒストグラムをつくり、一峰性かどうかを判断するのを、絶対にサボってはいけない」
のだ(最重要ポイント❗️)(*1)
*1 じゃあ山が2つあったらどうするの?、という話は本書に詳しい。
それでは、Excelを立ち上げ、
さっそく始めよう。
手順は、
① 140以上190未満のデータを100こつくる。〜 RANDBETWEEN関数で乱数を100こ生成。
② 度数分布表をつくる。 〜 データを昇順に並べ、区間(区切り)を決め、その個数(度数という)を数える。
③ヒストグラムをつくる。〜 棒グラフをつくり、棒の間隔を0にする。
② 度数分布表をつくる。 〜 データを昇順に並べ、区間(区切り)を決め、その個数(度数という)を数える。
③ヒストグラムをつくる。〜 棒グラフをつくり、棒の間隔を0にする。
ここで手こずったのが、
②の表をつくるときの「度数の数え方」。
140以上150未満のデータを数えるのに、
COUNTIF関数の条件指定にAND関数を使うのでは?
と思ってやってみたが、あえなく玉砕。
ググって
COUNTIFS関数を使ってできたのだが、
「=COUNTIFS($A$1:$A$101, “ >=140”, $A$1:$A$101, “<150” ) 」
という長ったらしい式で、美しくない。([A1:A101]にデータがある)
さらにググると、
FREQUENCY関数を使うことが分かったのだが、
何度試しても度数が合わない。
あきらめかけたが、
なんということでしょう、
本書の29ページにヒントが載っていて、
見事解決!
FREQUENCY関数の範囲指定が、
「○○超xx以下」
というあり得ない設定になっていたのだ。
なので、
全データに1を加えたダミーデータをつくれば、
「○○以上xx未満」を数えられる!
問題を機械的に解くだけではなく、
Excelを使って、
数学を「実験」する
のはおもしろい!
時間はかかるが、
「趣味」なので、
のんびりやっていこう。
コメント
[…] 第1回 数学は「実験だ!」〜Excelで統計学基礎を学び直し1 第2回 ヒストグラムから確率分布へ!〜『確率思考の戦略論』 第3回 バスの待ち時間の確率は?〜数式なしで確率密度関数を理解する❗️ 第4回(今回) この方法でもう絶対忘れん‼️〜分散・標準偏差の公式を! […]