1、=【 ;精品教育资源文库 】 = 课时分层训练 (六十一 ) 变量间的相关关系与统计案例 A 组 基础达标 一、选择题 1如图 942 对变量 x, y 有观测数据 (xi, yi)(i 1,2, ? , 10),得散点图 (1);对变量 u,v 有观测数据 (ui, vi)(i 1,2, ? , 10),得散点图 (2)由这两个散点图可以判断 ( ) (1) (2) 图 942 A变量 x 与 y 正相关, u 与 v 正相关 B变量 x 与 y 正相关, u 与 v 负相关 C变量 x 与 y 负相关, u 与 v 正相关 D变量 x 与 y 负相关, u 与 v 负相关 C 由题图 (1
2、)可知 y 随 x 的增大而减小,各点整体呈下降趋势,故变量 x 与 y 负相关,由题图 (2)知 v 随 u 的增大而增大,各点整体呈上升趋势,故变量 v 与 u 正相关 2四名同学根据各自的样本数据研究变量 x, y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论: y 与 x 负相关且 y 2.347x 6.423; y 与 x 负相关且 y 3.476x 5.648; y 与 x 正相关且 y 5.437x 8.493; y 与 x 正相关且 y 4.326x 4.578. 其中一定不正确的结论的序号是 ( ) A B C D D 由回归直线方程 y bx a,知当 b 0
3、时, y 与 x 正相关;当 b 0 时, y 与 x 负相关所以 一定错误故选 D. 3 (2018 石家庄一模 )下列说法错误的是 ( ) A回归直线过样本点的中心 (x , y ) B两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于 1 C对分类变量 X 与 Y,随机变量 2的观测值 k 越大,则判断 “ X 与 Y 有关系 ” 的把握程度越小 =【 ;精品教育资源文库 】 = D在回归直线方程 y 0.2x 0.8 中,当解释变量 x 每 增加 1 个单位时,预报变量 y平均增加 0.2 个单位 C 根据相关定义分析知 A, B, D 正确; C 中对分类变量 X 与 Y 的
4、随机变量 2的观测值 k 来说, k 越大,判断 “ X 与 Y 有关系 ” 的把握程度越大,故 C 错误,故选 C. 4 (2017 山东高考 )为了研究某班学生的脚长 x(单位:厘米 )和身高 y(单位:厘米 )的关系,从该班随机抽取 10 名学生,根据测量数据的散点图可以看出 y 与 x 之间有线性相关关系设其回归直线方程为 y bx a.已知 10i 1xi 225, 10i 1yi 1 600, b 4.该班某学生的脚长为 24,据此估计其身高为 ( ) 【导学号: 79140334】 A 160 B 163 C 166 D 170 C 10i 1xi 225, x 11010i 1
5、xi 22.5. vyi 1 600, y 11010i 1yi 160. 又 b 4, a y b x 160 422.5 70. 回归直线方程为 y 4x 70. 将 x 24 代入上式得 y 424 70 166. 故选 C. 5通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由 2 n(ad bc)2(a b)(c d)(a c)(b d), 算得 2 110 (4030 2020 )260506050 7.8. 附表: P( 2 k0) 0.050 0.010 0.
6、001 k0 3.841 6.635 10.828 参照附表,得到的正确结论是 ( ) A在犯错误的概率不超过 0.1%的前提下,认为 “ 爱好该项运动与性别有关 ” B在犯错误的概率不超过 0.1%的前提下,认为 “ 爱好该项运动与性别无关 ” =【 ;精品教育资源文库 】 = C有 99%以上的把握认为 “ 爱好该项运动与性别有关 ” D有 99%以上的把握认为 “ 爱好该项运动与性别无关 ” C 根据独立性检验的定义,由 27.8 6.635,可知我们在犯错误的概率不超过 0.01的前提下,即有 99%以上的把握认为 “ 爱好该项运动与性别有关 ” 二、填空题 6某车间为了规定工时定额,
7、需要确定加工零件所花费的时间,为此进行了 5 次试验根据收集到的数据 (如下表 ),由最小二乘法求得回归方程 y 0.67x 54.9. 零件数 x(个 ) 10 20 30 40 50 加工时间 y(min) 62 75 81 89 现发现表中有一个数据看不清,请你推断出该数据的值为 _ 68 由 x 30,得 y 0.6730 54.9 75. 设表中的 “ 模糊数字 ” 为 a, 则 62 a 75 81 89 755 ,即 a 68. 7某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 H0: “ 这
8、种血清不能起到预防感冒的作用 ” ,利用 22 列联表计算得 23.918 ,经查临界值表知 P( 23.841)0.05.则下列结论中,正确结论的序号是 _ 有 95%的把握认为 “ 这种血清能起到预防感冒的作用 ” ; 若某人未使用该血清,那么他在一年中有 95%的可能性得感冒; 这种血清预防感冒的有效率为 95%; 这种血清预防感冒的有效率为 5%. 2 3.9183.841 ,而 P( 23.814)0.05 ,所以有 95%的把握认为 “ 这种血清能起到预防感冒的作用 ” 要注意我们检验的是假是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆 8 (2017 长沙
9、雅礼中学质检 )某单位为了了解用电量 y(度 )与气温 x() 之间的关系,随机统计了 某 4 天的用电量与当天气温,并制作了对照表: 气温 () 18 13 10 1 用电量 (度 ) 24 34 38 64 由表中数据得回归直线方程 y bx a 中的 b 2,预测当气温为 4 时,用电量为_度 68 根据题意知 x 18 13 10 ( 1)4 10, y 24 34 38 644 40,因为回归直线过样本点的中心,所以 a 40 ( 2)10 60,所以当 x 4 时, y ( 2)( 4) 60 68,所以用电量为 68 度 =【 ;精品教育资源文库 】 = 三、解答题 9 (201
10、8 合肥二检 )某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查现从高一年级学生中随机抽取 180 名学生,其中男生 105 名;在这180 名学生中选择社会科学类的男生、女生均为 45 名 . 【导学号: 79140335】 (1)试问:从高一年级学生中随机抽取 1 人,抽到男生的概率约为多少? (2)根据抽取的 180 名学生的调查结果,完成下面的 22 列联表并判断能否在犯错误的概率不超过 0.025 的前提下认为科类的选择与性别有关? 选择自然科学类 选择社会科学类 总计 男生 女生 总计 附: 2 n(ad bc)2(a b)(c d)(a c)(b d)
11、,其中 n a b c d. P( 2 k0) 0.500 0.400 0.250 0.150 0.100 0.050 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 解 (1)从高一年级学生中随机抽取 1 人 ,抽到男生的概率约为 105180 712. (2)根据统计数据,可得 22 列联表如下: 选择自然科学类 选择社会科学类 总计 男生 60 45 105 女生 30 45 75 总计 90 90 180 则 2 180 (6045 3045 )2105759
12、090 367 5.142 9 5.024, 所以能在犯错误的概率不超过 0.025 的前提下认为科类的选择与性别有关 10 (2016 全国卷 ) 如图 943 是我国 2008 年至 2014 年生活垃圾无害化处理量 (单位:亿吨 )的折线图 图 943 注:年份代码 1 7 分别对应年份 2008 2014. =【 ;精品教育资源文库 】 = (1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明; (2)建立 y 关于 t 的回归方程 (系数精确到 0.01),预测 2016 年我国生活垃圾无害化处理量 附注 参考数据: 7i 1yi 9.32, 7i 1t
13、iyi 40.17, 7i 1(yi y )2 0.55, 72.646. 参考公式:相关系数 rni 1(ti t )(yi y )ni 1(ti t )2ni 1(yi y )2,回归方程 y a bt 中斜率和截距的最小二乘估计 公式分别为 bni 1(ti t )(yi y )ni 1(ti t )2, a y b t . 解 (1)由折线图中的数据和附注中的参考数据得 t 4, 7i 1(ti t )2 28, 7i 1(yi y )2 0.55, 7i 1(ti t )(yi y ) 7i 1tiyi t 7i 1yi 40.17 49.32 2.89, r 2.8922.6460
14、.55 0. 99. 因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当高,从而可以用线性回归模型拟合 y 与 t 的关系 (2)由 y 9.327 1.331 及 (1)得 b7i 1(ti t )(yi y )7i 1(ti t )2 2.8928 0.103 , a y b t 1.331 0.10340.92. 所以 y 关于 t 的回归方程为 y 0.92 0.10t. 将 2016 年对应的 t 9 代入回归方程得 y 0.92 0.109 1.82. 所以预测 2016 年我国生活垃圾无害化处理量将约为 1.82 亿吨 B 组 能力提升 11下列说
15、法错误的是 ( ) A自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系 B在线性回归分析中,相关系数 r 的值越大,变量间的相关性越强 =【 ;精品教育资源文库 】 = C在残差图中,残差点分布的带状区域的宽度越狭窄,其模 型拟合的精度越高 D在回归分析中, R2为 0.98 的模型比 R2为 0.80 的模型拟合的效果好 B 根据相关关系的概念知 A 正确;当 r 0 时, r 越大,相关性越强,当 r 0 时, r越大,相关性越弱,故 B 不正确;对于一组数据拟合程度好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好;二是 R2越大,拟合效果越好,所以 R2为 0.98 的模型比 R2为 0.80 的模型拟合的效果好, C, D 正确,故选 B. 12 2017 年 9 月 18 日那天,某市物价部门对本市的 5 家商场的