度数分布表とは?
データについて調べるとき、データをただ並べただけでは、そのデータがどのような性質をもつデータ群なのかわかりません。
例えば、以下のデータを見て下さい。
平成31年10月ある町の最高気温(単位 ℃)
26.8 21.4 26.8 23.5 24.3 19.9 23.5 28.4 29.0 28.5
28.8 22.7 19.5 21.2 18.9 16.2 16.6 20.2 16.4 18.7
18.2 17.6 18.9 18.2 20.4 22.7 24.0 18.0 18.9 15.7 18.2
このように、ただのデータを羅列しているだけでは何もわかりません。
データを整理してみましょう。
| 気温の階級 | 度数 |
| 15℃以上17℃未満 | 4 |
| 17℃以上19℃未満 | 10 |
| 19℃以上21℃未満 | 4 |
| 21℃以上23℃未満 | 3 |
| 23℃以上25℃未満 | 4 |
| 25℃以上27℃未満 | 2 |
| 27℃以上29℃未満 | 3 |
| 29℃以上31度未満 | 1 |
| 計 | 31 |
この表では、15℃から31℃までを3℃ごとの区間に分けて整理しました。
このような区間のことを階級と言い、その中に入っているデータの数を度数と言います。
そして、その階級の区間を階級の幅といい、その平均を階級値といいます。
これらをまとめた表が、度数分布表です。
| 気温の階級 | 階級値 | 階級の幅℃ | 度数 |
| 15℃以上17℃未満 | 16 | 2 | 4 |
| 17℃以上19℃未満 | 18 | 2 | 10 |
| 19℃以上21℃未満 | 20 | 2 | 4 |
| 21℃以上23℃未満 | 22 | 2 | 3 |
| 23℃以上25℃未満 | 24 | 2 | 4 |
| 25℃以上27℃未満 | 26 | 2 | 2 |
| 27℃以上29℃未満 | 28 | 2 | 3 |
| 29℃以上31度未満 | 30 | 2 | 1 |
| 計 | ――― | ――― | 31 |
例えば、15℃以上17℃未満という「階級」の場合、「階級値」は15と17の平均をとって16、「階級の幅」は15と17の差をとって2です。
そして、その階級に入っているデータは4つなので、「度数」が4になります。
階級と度数を対応させたものを「度数分布」といいますが、それをどのように表現するかはいろいろな方法があります。
度数分布を表で表すと「度数分布表」、棒グラフで表すと「ヒストグラム」といいます。
ヒストグラムは以下のようになります。

さらにもう一つ、「相対度数」について考えます。
相対度数は、その階級に何割程度のデータが集まっているかを表します。
例えば、先の15度以上17℃未満の階級の相対度数は、4÷31で計算できます。
全体のデータに対して、その階級がどれくらいの割合を占めるかを計算するわけです。
相対度数は度数分布表に合わせて書き込むこともあり、以下のようになります。
| 気温の階級 | 階級値 | 階級の幅℃ | 度数 | 相対度数 |
| 15℃以上17℃未満 | 16 | 2 | 4 | 0.129 |
| 17℃以上19℃未満 | 18 | 2 | 10 | 0.323 |
| 19℃以上21℃未満 | 20 | 2 | 4 | 0.129 |
| 21℃以上23℃未満 | 22 | 2 | 3 | 0.096 |
| 23℃以上25℃未満 | 24 | 2 | 4 | 0.129 |
| 25℃以上27℃未満 | 26 | 2 | 2 | 0.065 |
| 27℃以上29℃未満 | 28 | 2 | 3 | 0.097 |
| 29℃以上31度未満 | 30 | 2 | 1 | 0.032 |
| 計 | ――― | ――― | 31 | 1.000 |
資料の整理は用語がたくさんでてきて混乱しやすいので、しっかり把握しておきましょう。
関連記事








コメント