センター試験の数学ⅠAでデータの分析は必修になります。
過去問でみると、H28、H29年度と2年連続でやりにくい解き方が必要な問題が続いているのですが、理解出来ない人が多いので別の解き方で解説します。
難しい定理は使いません。中学生でも解ける方法で解説してみます。
センター試験数学ⅠAの「データの分析」過去問傾向
過去2年データの分析問題で学校では習わない定理を利用すると簡単に答が出る問題が続きました。
その場で関係式を導こうとするとかなり難しく感じたのではありませんか?
例えば、平成29年度センター試験数学ⅠA第2問[2]中の(2)です。
分かり易い前後の問題は省略しますが問題は探しておいてください。
以下は問題の一部です。
得点Xは、飛距離Dから次の計算式によって算出される。
\( X=1.80\times (D-125.0)+60.0\)
(中略)
Xは飛距離による得点、Dは飛距離、Yは空中姿勢の得点を表しています。
(中略)
・Xの分散は、Dの分散の \(\fbox{ソ}\) 倍になる。
・XとYの共分散は、DとYの共分散の \(\fbox{タ}\) 倍になる。ただし、
共分散は、2つの変量のそれぞれにおいて平均値からの偏差を求め、
偏差の積の平均値として定義される。
・XとYの相関係数は、DとYの相関係数の \(\fbox{チ}\) 倍である。
実はここは前後の問題とは無関係とはいいませんが、単独で考えられる別問題といっても良いくらいです。
しかも、共分散の定義は書いてくれているのに、問題の背景には統計が潜んでいるという問題です。
解答を見ても意味が分からない人も多いようです。
これだけ続くと予備校でも予想問題集でも対策はしてくると思いますが、センター試験の問題作成者側も得点を落とすのに必死ですね。
というより意地が悪い、というべきか。
でも、全国一斉に行われるセンターなので公平ではあります。
で、3年続くとなると「問題作成者も芸がない」というしかありません。
ただ、過去問を見てデータの分析はあきらめようと思う人が出てくるかもしれないので、普通とはちょっと違った中学生でも解ける方法で解いてみます。
(さすがに3年連続はありませんでした。)
分散や標準偏差を用いた式で説明しても分からないという人に説明するので、ここでは一般的な解法は示しませんよ。
記述解答の数学を解くようにきっちりした解答を仕上げたい人は過去問の解答例を参考にして下さい。
ただし、分からないからといってあきらめないで下さいね。
確認しておくべき基本事項
中学生でも解けるとはいっても教科書にある基本は覚えている必要があります。
「データの分析はセンター直前に復習しておくように!」
といっているくらい基本用語は覚えておかないと通用しない単元です。
および
⇒ データの分析問題(分散、標準偏差と共分散、相関係数を求める公式)
確認しておいてください。
ここでは必要な部分だけを示しておきます。
変量 \( x\) のデータが \( n\) 個あるときの分散 \( s^2\) は、
平均値を \( \bar x\) とすると、
\( s^2=\displaystyle \frac{1}{n}\{(x_1-\bar x)^2+(x_2-\bar x)^2+\cdots +(x_n-\bar x)^2\}\)
または
\( s^2=\overline{x^2}-(\bar x)^2\)
分散 \( s^2\) の「正の平方根 \( s\) 」 が標準偏差です。
\( s=\sqrt{\displaystyle \frac{1}{n}\{(x_1-\bar x)^2+(x_2-\bar x)^2+\cdots +(x_n-\bar x)^2\}}\)
または
\( s=\sqrt{\overline{x^2}-(\bar x)^2}\)
公式と言うより定義ですが、共分散を式で示すと、
\( c_{xy}=\displaystyle \frac{1}{n}\{(x_1-\bar x)(y_1-\bar y)+(x_2-\bar x)(y_2-\bar y)+\cdots +(x_n-\bar x)(y_n-\bar y)\}\)
(データ \( x\) と \( y\) の偏差をかけて、和したものの平均)
これはH29年度のセンター試験では問題の中で定義してありました。
データ \( x\) と \( y\) における標準偏差を \( s_x , s_y\) とし、
共分散を \( c_{xy}\) とすると、相関係数 \( r\) は
\(\displaystyle \color{red}{\large{r=\frac{c_{xy}}{s_x\cdot s_y}}}\)
これらが覚えられていない場合は次の説明は無意味です。
簡単に過去問の答を出す方法
問題の条件と基本用語を組み合わせて処理しようとすると、かなりややこしいと思えるでしょう。
数学が得意な人からすればこんなのどうってことない、と思えるのでしょうが、数学が得意とはいえない私にはややこしいと思えます。
センターで満点取れてもややこしいものはややこしいのです。
ということで、
この問題を統計の知識がなくても、数学の才能がなくても答が出せる方法で解いてみます。
真面目な人は見なくて良いですよ。
ただ、上の分散、標準偏差、共分散、相関係数の求め方は覚えておきましょう。
さて、この問題を読んで何か感じませんでしたか?
これって前のデータは必要なのか?
58個ものデータがあるけど具体的な数値聞いてないやん。
問題は比だけを聞いているし、「一般的なこと」じゃないのか?
だから、
「具体的な数値で計算してみたら同じにならないとおかしい」
と感じただけです。
まあ、数学には良くあるけど、
具体的 ⇒ 一般的 ⇒ 公式化
ですよ。
でも一般的に成り立つなら、具体的なものにもなり立たないとおかしいですよね?
そこで、ここからが本題です。
2、3人のデータをでっち上げましょう。
でっち上げるというと変かもしれませんが、具体的なデータは1つも無いと言っても良いので、「かまわない」と思い切り「いい加減」にデータをつくります。
\( (D,X,Y)\)
の順に2人のデータを並べると、(3人より2人の方が楽。笑)
\( (D,X,Y)=(135,78,55),(115,42,53)\)
このデータについて必要な計算をします。
(このデータは計算しやすいように想像でつくったデータです。)
(平均)
\( \overline{D}=\displaystyle \frac{135+115}{2}=125\)
\( \overline{X}=\displaystyle \frac{78+42}{2}=60\)
\( \overline{Y}=\displaystyle \frac{55+53}{2}=54\)
(分散)
\( S_D^2=\displaystyle \frac{(135-125)^2+(115-125)^2}{2}=10^2\)
\( S_X^2=\displaystyle \frac{(78-60)^2+(42-60)^2}{2}=18^2\)
\( S_Y^2=\displaystyle \frac{(55-54)^2+(53-54)^2}{2}=1^2\)
(標準偏差)
\( S_D=\sqrt{10^2}=10\)
\( S_X=\sqrt{18^2}=18\)
\( S_Y=\sqrt{1^2}=1\)
(共分散)
XYの共分散
\( C_{XY}=\displaystyle \frac{(78-60)(55-54)+(42-60)(53-54)}{2}=18\)
DYの共分散
\( C_{DY}=\displaystyle \frac{(135-125)(55-54)+(115-125)(53-54)}{2}=10\)
(相関係数)
XYの相関係数
\( r_{XY}=\displaystyle \frac{C_{XY}}{S_X\cdot S_Y}=\displaystyle \frac{18}{18\times 1}=1\)
DYの相関係数
\( r_{DY}=\displaystyle \frac{C_{DY}}{S_D\cdot S_Y}=\displaystyle \frac{10}{10\times 1}=1\)
この数値を出すのに平方根を取る必要があるので小学生にはできませんが、中学生なら具体的な数値を式に入れるだけなのでできますよね?
上の問題の答は出ませんか?
これで答が違うなら、一般的にも答の比は違うはずです。
これはセンター試験の特長、「答が入れば勝ち」が利用出来る方法です。
記述式では分散、標準偏差、共分散、相関係数の式を変形しながら導く必要がありますからご注意ください。
「解答見ても無理」という人がちょっと多かったので、悪あがきの方法を示してみました。
きれいに解こうなんて思わなくても良いです。
できる限りのことをやり尽くしましょうよ。
数学において「具体的に調べる」というのは、一般的な解法を見つけるための準備運動みたいなものですよ。
必修分野だけあって必ず出ます。
復習は必ずしておきましょう。
センター試験数学の全般的な復習
共通テストになってもやることは同じです。