2018年(平成30年)度に福岡県で行われた公立高校入試の数学第3問の解説です。
問3は資料の整理・活用問題の相対度数と代表値に関する問題ですが良い復習になるのでまとめておきます。
問題自体は簡単なのですが長い文章で代表値を確認している問題です。
問題は福岡県の公式サイトにもあります。
度数分布表と平均値のデータの関係
\(\large{\color{black}{\fbox{ 3 }}}\)
問題に表1の度数分布表と表2の平均値が与えられています。
表1の度数分布表
\(\begin{array}{|c|c|c|} \hline
階級(冊) & \mathrm{A}中学校 & \mathrm{B}中学校 \\ \hline
0 ~ 5\hspace{2pt} & 21 & 5 \\ \hline
\hspace{2pt}5 ~ 10\hspace{6pt} & 64 & 11\\ \hline
10 ~ 15\hspace{6pt} & 89 & 23\\ \hline
15 ~ 20\hspace{6pt} & 86 & 12\\ \hline
20 ~ 25\hspace{6pt} & 54 & 11\\ \hline
25 ~ 30\hspace{6pt} & 36 & 5\\ \hline
30 ~ 35\hspace{6pt} & 0 & 0\\ \hline
35 ~ 40\hspace{6pt} & 0 & 0\\ \hline
40 ~ 45\hspace{6pt} & 0 & 0\\ \hline
45 ~ 50\hspace{6pt} & 0 & 3\\ \hline
計 & 350 & 70 \\ \hline
\end{array}\)
表2の平均値
\(\begin{array}{|c|c|c|} \hline
学校名 & \mathrm{A}中学校 & \mathrm{B}中学校 \\ \hline
平均値(冊) & 15.3 & 16.0 \\ \hline
\end{array}\)
この2つの表から
どちらの中学校の生徒がよく本を読んでいるか
を比べたいということです。
たったそれだけです。
多くの文字が書いてあるだけで、あきらめてはダメです。笑
ところで、計算はしなくて良いですが、
平均値は度数分布表から計算される平均値と一致しているので、
\(\,420\,\)人全員のデータをそのまま使っているのではなさそうです。
⇒ 代表値とは?度数分布表の平均値,中央値の求め方と最頻値の答え方
代表値のほとんどすべてを説明しています。
相対度数
問題に入りましょう。
(1)「相対度数を比べるとよいのはどのような場合か?」
「たとえば、」と花さんが説明してくれています。
\(\,\mathrm{A}\,\)中学校の方が\(\,\mathrm{B}\,\)中学校より大きい。
相対度数とは、
\(\displaystyle \color{red}{相対度数=\frac{ 度数 }{ 度数合計 }}\)
なので\(\,0\,\)冊以上\(\,5\,\)冊未満の階級の相対度数は
\(\,\mathrm{A}\,\)中学校の相対度数は
\(\displaystyle \frac{21}{350}=0.06\)
\(\,\mathrm{B}\,\)中学校の相対度数は
\(\displaystyle \frac{5}{70}≒0.07\)
と、度数は\(\,\mathrm{A}\,\)中学校の方が多いですが、相対度数は\(\,\mathrm{B}\,\)中学校の方が大きくなっています。
これは度数合計が違うので割合で見ないと比べられないということです。
例えば、
\(\,10000\,\)人中\(\,20\,\)人
という場合と
\(\,100\,\)人中\(\,20\,\)人
というのでは、度数は同じでも割合は全然違いますよね。
なので単純に度数だけでは比較はできないということです。
(1)の答えは「\(\,\underline{ 度数合計が違う場合 }\,\)」
代表値
代表値は3つあります。
\(\color{red}{\fbox{ 平均値 }}\) \(\color{red}{\fbox{ 中央値 }}\) \(\color{red}{\fbox{ 最頻値 }}\)
の3つです。
この3つをどれを使えばどちらの学校がよく本を読んでいるかを比べようとしています。
それをキャラクター付きで説明してくれているのだがこの問題で、
文字が大きいので読みやすいです。
平均値
浩さんは平均値を見ると\(\,\mathrm{B}\,\)中学校の方が本をよく読んでいると言って、
花さんに反論されています。笑
というのは、
\(\,\mathrm{B}\,\)中学校には他の生徒に比べて異様に多くの本を読んでいる生徒が\(\,3\,\)人いるので、
それで平均値が大きくなっているからです。
例えば、\(\,5\,\)人でテストを受けて
\(\,4\,\)人が\(\,0\,\)点、\(\,1\,\)人が\(\,100\,\)点
だったとき、
\(\displaystyle \frac{0+0+0+0+100}{5}=20\)
平均点は\(\,20\,\)点ですが、これって全体の比較として良いのか?ということです。
最頻値
度数分布表での最頻値は、
最も度数の多い階級の「階級値」
になります。
この度数分布表では最も度数が多いのは
\(\,\mathrm{A}\,\)中学校は\(\,10\,\)冊以上\(\,15\,\)冊未満の階級なので
最頻値は \(\,12.5\,\)冊
\(\,\mathrm{B}\,\)中学校も\(\,10\,\)冊以上\(\,15\,\)冊未満の階級なので
最頻値は \(\,12.5\,\)冊
で同じです。
これは問題になっていません。
中央値
中央値は資料(データ)を小さい順、大きい順に並べたとき、
真ん中の順番にくる「値」です。
\(\,\mathrm{A}\,\)中学校の生徒は\(\,350\,\)人なので真ん中は\(\,175\,\)番目、
ではなくて、
\(\,175\,人 | 175\,人\,\)
と分けられるので、度数が偶数のときは、
真ん中2つのデータの平均
が中央値になります。
\(\cdots \,,\,\color{red}{175番目}\,,\,\color{red}{176番目}\,,\,\cdots\)
\(\,中央値=\displaystyle \frac{ 175番目+176番目 }{2}\,\)
\(\,\mathrm{A}\,\)中学校の累積度数を見ていくと
(累積度数は度数を小さい階級ごとに足していった度数合計の数字です。)
⇒ 代表値とは?度数分布表の平均値,中央値の求め方と最頻値の答え方
\(\begin{array}{|c|c|c|} \hline
階級(冊) & \mathrm{A}中学校 & 累積度数 \\ \hline
0 ~ 5\hspace{2pt} & 21 & 21 \\ \hline
\hspace{2pt}5 ~ 10\hspace{6pt} & 64 & 85\\ \hline
10 ~ 15\hspace{6pt} & 89 & 174\\ \hline
15 ~ 20\hspace{6pt} & 86 & \color{blue}{260}\\ \hline
20 ~ 25\hspace{6pt} & 54 & 314\\ \hline
25 ~ 30\hspace{6pt} & 36 & 350\\ \hline
30 ~ 35\hspace{6pt} & 0 & \\ \hline
35 ~ 40\hspace{6pt} & 0 & \\ \hline
40 ~ 45\hspace{6pt} & 0 & \\ \hline
45 ~ 50\hspace{6pt} & 0 & \\ \hline
計 & 350 & \\ \hline
\end{array}\)
\(\,175\,\)番目と\(\,176\,\)番目の人はどちらも
\(\,\color{blue}{15\,冊以上\,20\,冊未満の階級}\)にいるので
\(\,\color{blue}{中央値は\,17.5\,冊}\,\)
\(\,\mathrm{B}\,\)中学校の累積度数を見ていくと
\(\begin{array}{|c|c|c|} \hline
階級(冊) & \mathrm{B}中学校 & 累積度数 \\ \hline
0 ~ 5\hspace{2pt} & 5 & 5\\ \hline
\hspace{2pt}5 ~ 10\hspace{6pt} & 11& 16\\ \hline
10 ~ 15\hspace{6pt} & 23 & \color{magenta}{39} \\ \hline
15 ~ 20\hspace{6pt} & 12 & 51\\ \hline
20 ~ 25\hspace{6pt} & 11 & 62\\ \hline
25 ~ 30\hspace{6pt} & 5 & 67\\ \hline
30 ~ 35\hspace{6pt} & 0 & 67\\ \hline
35 ~ 40\hspace{6pt} & 0 & 67\\ \hline
40 ~ 45\hspace{6pt} & 0 & 67\\ \hline
45 ~ 50\hspace{6pt} & 3 & 70\\ \hline
計 & 70 & \\ \hline
\end{array}\)
\(\,\mathrm{B}\,\)中学校は\(\,70\,\)人なので\(\,35\,\)番目と\(\,36\,\)番目の人の冊数の平均になりますが、
どちらも
\(\,\color{magenta}{10\,冊以上\,15\,冊未満の階級}\)にいるので
\(\,\color{magenta}{中央値は\,12.5\,冊}\,\)
中央値を見ると\(\,\mathrm{A}\,\)中学校の方がよく本を読んでいるということができます。
これが(2)です。
「中央値を比べると、\(\,\mathrm{A}\,\)中学校の生徒の方がよく本を読んでいるといえる。」
というのが正しい理由を中央値がふくまれる階級を示して説明します。
(答え)
\(\,\mathrm{A}\,\)中学校の中央値を含む階級は\(\,15\,\)冊以上\(\,20\,\)冊未満
\(\,\mathrm{B}\,\)中学校の中央値を含む階級は\(\,10\,\)冊以上\(\,15\,\)冊未満
なので、中央値を比べると\(\,\mathrm{A}\,\)中学校の方が大きいから。
この問題は長いですが、度数分布表の中央値の求め方を知っていますか?
ということを聞いているだけですよ。
ここまで詳しく解説する問題でもありません。
それでも、復習のつもりで書いておきましたが、問題の答えだけを過去問に求める人たちにはムダですね。
先に行きましょう。
⇒ 2018年福岡県公立高校入試 数学問4の1次関数問題の解説
\(\color{black}{\fbox{ 4 }}\)は1次関数の問題です。
連立方程式を解きますが1次関数の交点問題です。
⇒ 福岡県公立高校入試問題2018(平成30年度)の数学の過去問解説
問1からここのページで解説した問3までで\(\,60\,\)点満点中\(\,33\,\)点、半分以上が配点されています。