SSブログ

第1回 資料の整理 [ネコ騙し数学]

第1回 資料の整理


§1 資料の整理


度数分布表

右の図のように、資料をいくつかの階級(区間)に分け、階級ごとの度数を表にしたもの。

ここでの階級010は0以上10未満であり、階級の幅は10である。


s-tab-01-01.png

ヒストグラム

横軸に資料の数値、縦軸に度数をとり、階級の幅を1辺、その階級の度数を高さとする長方形を書き、度数の分布を表したグラフ。

長方形の面積は、度数に比例する。


statics-graph-01-01.png


度数分布多角形

ヒストグラムの各長方形の城辺の頂点を順に結び、両端では階級の幅の半分だけ外側に点をとって結んだもの。

各長方形の面積の和と度数多角形の面積の和は等しい。


相対度数

  


累積度数

各階級までの度数の和を、その階級の累積度数という。


statics-graph-01-02.png


§2 代表値


階級値

階級の中央の値

上の度数分布表の階級10–20の場合、

(1) 10≦x≦19と考えると

  

(2)10≦x<20と考えると

  

の2通りが考えられる。

(2)を採用することにする。


平均値

資料の値の総和を資料の総数で割った値

N個の値があるとき、平均値m

  

である。


s-tab-01-02.png度数分布表から平均値を求めるには、階級値と度数を用いて

  

と計算する。

モード(最頻値)

度数分布表で最も階級値が大きい階級値


上の例だと、度数が最も大きい階級は40〜50だから、その階級値である45がモードになる。


メディアン(中央値)

資料を大きさの順にならべたとき、中央にくる数値。

資料の個数が偶数個のとき、中央の2つの値の平均値とする。


例えば、資料が

  

が5個の場合、3番目の21がメディアン(中央値)になる。

また、

  

と資料の数が6個で偶数の場合、3番目の21と4番目の22の平均値

  

がメディアンになる。


例えば、右s-tab-01-01.pngの表の場合、資料の個数は100だから、中央の2つの値は、資料の値の順にならべた、50番と51番目の値。

累積度数を見ると、これは階級40〜50に属するので、メディアンはその階級値である45になる。
 ――この値は中学数学レベルの話!!――


私が高校時代に使っていた(受験参考書)にしたがうと、以下のように求める。


総数100100÷2=50

累積度数を見ると、これは4050の階級に属する。

この区間幅は10で、この階級に属する資料の数は22個だから、階級4050では40から一様にずつ得点が上昇していると考え、

  

をメディアンと定める。

資料の数が100で偶数だから50番目と51番目の真ん中を50.5番目と考え、

  

とするほうがいいのでしょう。
ちなみに、この度数分布表を作成するにあたって用いたデータ

――平均値50、標準偏差20の正規分布もどき――

の50番目と51番目の値は45。

中学数学レベルのメディアンの値が元のデータと一致している!!


また、度数分布表から計算した平均値は47.2であるが、元の資料の平均値は46.68で一致しない。

(2)ではなく(1)の階級値を採用すると、平均値は46.7となり、この資料の場合、(1)の階級値を採用したほうが精度は高いようだ。

s-tab-01-05.png

s-tab-01-04.png


s-tab-01-03.png問題 右の表から平均値、モード、メディアンを求めよ。

【解】

右の表を元に、次の表を作る。


s-tab-01-05.png

すると、平均値は58点。

モード(最頻値)は55点。

資料の個数は40なので、中央の値は20番目と21番目の値の平均値。

これは階級値55に属するので、(中学数学の)メディアン(中央値)は55点。

高校数学レベルのメディアンは

  

または、

  

(解答終了)

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。