1、金版教程金版教程20212021高考科学复习创新方案高考科学复习创新方案- -理数理数 (创新版)(创新版) 【精品课件精品课件】 第第3 3讲讲 变量间的相关关系与统计案变量间的相关关系与统计案 例例 第九章 统计与统计案例 考纲解读 1.会作两个相关变量的数据的散点图,会利用散点图认识变量 间的相关关系;根据最小二乘法求出回归直线方程(重点) 2了解独立性检验(只要求 22 列联表)的基本思想、方法及其初步应用 考向预测 从近三年高考情况来看,本讲是高考中的一个热点考查内 容预测 2021 年将会考查:回归直线方程的判断、求解及相关系数的意 义,并用其解决实际问题;独立性检验思想在实际问题
2、中的应用试题 以解答题的形式呈现,难度为中等此外,也可能出现在客观题中,此时 试题难度不大,属中、低档题型. 1 基础知识过关基础知识过关 PART ONE 1.相关关系与回归方程 (1)相关关系的分类 正相关: 从散点图上看, 点散布在从01 _到02 _的区 域内,如图 1; 负相关:从散点图上看,点散布在从03 _到04 _的区 域内,如图 2. 左下角 右上角 左上角 右下角 (2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在 05 _附近,则称这两个变量之间具有线性相关关系,这条直线叫 做06 _ (3)回归方程 最小二乘法:使得样本数据的点到回归直线的07 _ 最小的
3、方法叫做最小二乘法 一条直线 回归直线 距离的平方和 回归方程:两个具有线性相关关系的变量的一组数据(x1,y1),(x2, y2),(xn,yn),其回归方程为y b xa ,则b i1 n xi x yi y i1 n xi x 2 i1 n xiyin x y i1 n x2 in x 2 ,a y b x .其中,b 是回归方程的08 _,a 是在 y 轴上 的09 _, x 1 n n i1x i, y 1 n n i1y i,10 _称为样本点的中心 斜率 截距 ( x , y) 说明:回归直线y b xa 必过样本点的中心( x , y),这个结论既是检 验所求回归直线方程是否准
4、确的依据,也是求参数的一个依据 (4)样本相关系数 r i1 n xi x yi y i1 n xi x 2 i1 n yi y 2 ,用它来衡量两个变量间的线性相关关 系 当 r0 时,表明两个变量11 _; 当 r0.75 时,认为两个变量有很强的线性相关关系 正相关 负相关 越强 2残差分析 (1)残差:对于样本点(x1,y1),(x2,y2),(xn,yn),它们的随机误差 为 eiyibxia, i1,2, , n, 其估计值为e iyiy iyib xia , i1,2, , n,e i称为相应于点(xi,yi)的残差 (2)残差平方和为 n i1 (y iy i) 2. (3)相
5、关指数:R2101 _. n i1 y iy i 2 n i1 y i y 2 3独立性检验 (1)分类变量:变量的不同“值”表示个体所属的01 _,像这 类变量称为分类变量 不同类别 (2)列联表:列出两个分类变量的02 _,称为列联表假设有两 个分类变量 X 和 Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数 列联表(称为 22 列联表)为 22 列联表 y1 y2 总计 x1 a b ab x2 c d cd 总计 ac bd abcd 构造一个随机变量 K203 _,其中 n 04 _为样本容量 频数表 nadbc2 abcdacbd abcd (3)独立性检验 利用随机变
6、量05 _来判断“两个分类变量06 _”的方法称 为独立性检验 K2 有关系 答案 (1) (2) (3) (4) (5) 答案答案 1概念辨析 (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关 系( ) (2)“名师出高徒”可以解释为教师的教学水平与学生水平成正相关关 系( ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值( ) (4)事件 X,Y 关系越密切,则由观测数据计算得到的 K2的观测值越 大( ) (5)由独立性检验可知,有 99%的把握认为物理成绩优秀与数学成绩有 关,某人数学成绩优秀,则他有 99%的可能物理优秀( ) 2小题热身 (1)设回归方程为
7、y 35x,则变量 x 增加一个单位时( ) Ay 平均增加 3 个单位 By 平均减少 5 个单位 Cy 平均增加 5 个单位 Dy 平均减少 3 个单位 解析 因为5 是斜率的估计值,说明 x 每增加一个单位,y 平均减少 5 个单位故选 B. 答案答案 解析解析 (2)在下列各图中,两个变量具有相关关系的图是( ) A B C D 解析 为函数关系;显然成正相关;显然成负相关;没有明 显相关性 答案答案 解析解析 (3)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的 二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了 100 位育龄 妇女,结果如表 非一线 一线 总计 愿
8、生 45 20 65 不愿生 13 22 35 总计 58 42 100 算得 K210045222013 2 58423565 9.616. 附表: P(K2k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 参照附表,得到的正确结论是( ) A在犯错误的概率不超过 0.1%的前提下,认为“生育意愿与城市级 别有关” B在犯错误的概率不超过 0.1%的前提下,认为“生育意愿与城市级 别无关” C有 99%以上的把握认为“生育意愿与城市级别有关” D有 99%以上的把握认为“生育意愿与城市级别无关” 解析 因为 K29.6166.635,所以有 99%以上的
9、把握认为“生育意愿 与城市级别有关” 答案答案 解析解析 (4)已知变量 x, y 具有线性相关关系, 它们之间的一组数据如下表所示, 若 y 关于 x 的回归方程为y 1.3x1,则 m_. x 1 2 3 4 y 0.1 1.8 m 4 解析 由已知得 x 1 4(1234)2.5, y 1 4(0.11.8m4) 1 4(5.9m) 因为( x , y)在直线y 1.3x1 上, 所以 y 1.32.512.25, 所以1 4(5.9m)2.25,解得 m3.1. 3.1 解析解析 2 经典题型冲关经典题型冲关 PART TWO 1下列两变量中不存在相关关系的是( ) 人的身高与视力;曲
10、线上的点与该点的坐标之间的关系;某农 田的水稻产量与施肥量;某同学考试成绩与复习时间的投入量;匀速 行驶的汽车的行驶距离与时间;商品的销售额与广告费 A B C D 题型一题型一 相关关系的判断相关关系的判断 解析 根据相关关系的定义知,中两个变量不存在相关关系 答案答案 解析解析 2下列命题中正确的为( ) A线性相关系数 r 越大,两个变量的线性相关性越强 B线性相关系数 r 越小,两个变量的线性相关性越弱 C残差平方和越小的模型,模型拟合的效果越好 D用相关指数 R2来刻画回归效果,R2越小,说明模型的拟合效果越 好 解析 线性相关系数 r 的绝对值越接近于 1,两个变量的线性相关性越
11、强,故 A,B 错误;残差平方和越小,相关指数 R2越大,越接近于 1,拟 合效果越好,故 C 正确,D 错误 答案答案 解析解析 3对四组数据进行统计,获得如图所示的散点图,关于其相关系数的 比较,正确的是( ) Ar2r40r3r1 Br4r20r1r3 Cr4r20r3r1 Dr2r40r1r3 答案答案 解析 易知题中图与图是正相关,图与图是负相关,且图 与图中的样本点集中分布在一条直线附近,则 r2r40r30 时,正相关;r0 时,正相关;b 0 时,y 与 x 正相关,当b 0 时,y 与 x 负相关,一定错误 解析解析 角度 1 线性回归方程及应用 1某汽车的使用年数 x 与所
12、支出的维修总费用 y 的统计数据如表: 使用年数 x/年 1 2 3 4 5 维修总费用 y/万元 0.5 1.2 2.2 3.3 4.5 根据上表可得 y 关于 x 的线性回归方程y b x0.69,若该汽车维修总 费用超过 10 万元就不再维修,直接报废,据此模型预测该汽车最多可使用 (不足 1 年按 1 年计算)( ) A8 年 B9 年 C10 年 D11 年 答案答案 题型二题型二 回归分析回归分析 解析 由y关于x的线性回归直线y b x0.69过样本点的中心(3,2.34), 得b 1.01,即线性回归方程为y 1.01x0.69,令y 1.01x0.6910,得 x10.6,所
13、以预测该汽车最多可使用 11 年故选 D. 解析解析 2(2019 东北三省三校三模)现代社会,“鼠标手”已成为常见病一 次实验中,10 名实验对象进行 160 分钟的连续鼠标点击游戏,每位实验对 象完成的游戏关卡一样,鼠标点击频率平均为 180 次/分钟,实验研究人员 测试了实验对象使用鼠标前后的握力变化,前臂表面肌电频率(sEMG)等指 标 (1)10 名实验对象实验前、后握力(单位:N)测试结果如下: 实验前:346,357,358,360,362,362,364,372,373,376. 实验后:313,321,322,324,330,332,334,343,350,361. 完成茎叶
14、图,并计算实验后握力平均值比实验前 握力的平均值下降了多少 N? (2)实验过程中测得时间 t(分)与 10 名实验对象前臂表面肌电频率 (sEMG)的中位数 y(Hz)的九组对应数据(t,y)为(0,87),(20,84),(40,86), (60,79),(80,78),(100,78),(120,76),(140,77),(160,75)建立 y 关于时间 t 的线性回归方程; (3)若肌肉肌电水平显著下降,提示肌肉明显进入疲劳状态,根据(2)中 9 组数据分析,使用鼠标多少分钟就该进行休息了? 参考数据: 9 i1 (t it)(yi y )1800; 参考公式:回归方程y b ta
15、中斜率和截距的最小二乘估计公式分别 为:b n i1 t ityi y n i1 t it 2 ,a y b t 解 (1)根据题意得到茎叶图如下图所示: 解解 由图中数据可得 x 1 1 10(346357358360362362364 372373376)363, x 2 1 10(313321322324330332334343350361) 333, x 1 x236333330(N), 故实验前后握力的平均值下降了 30 N. 解解 (2)由题意得t1 9(020406080100120140160)80, y 1 9(878486797878767775)80, 9 i1 (t i
16、t) 2(080)2(2080)2(4080)2(6080)2(8080)2 (10080)2(12080)2(14080)2(16080)224000, 又 9 i1 (t it)(yi y )1800, b 9 i1 t ityi y 9 i1 t it 2 1800 24000 0.075, a y b t80(0.075)8086, y 关于时间 t 的线性回归方程为y 0.075t86. 解解 (3)九组数据中 40 分钟到 60 分钟 y 的下降幅度最大,提示 60 分钟时肌 肉已经进入疲劳状态,故使用鼠标 60 分钟就该休息了 解解 角度 2 非线性回归模型的应用 3(2019
17、莆田二模)某芯片公司为制定下一年的研发投入计划,需了解 年研发资金投入量 xi(单位:亿元)对年销售额 yi(单位:亿元)的影响该公 司对历史数据进行对比分析,建立了两个函数模型:yx2,y ex t,其中 ,t 均为常数,e 为自然对数的底数 现该公司收集了近 12 年的年研发 资金投入量 xi和年销售额 yi的数据, i1,2,12,并对这些数据作了初 步处理,得到了如下的散点图及一些 统计量的值 令 uix2,viln yi(i1,2,12),经计算得如下数据: x y i1 12 (xi x )2 i1 12 (yi y )2 u v 20 66 770 200 460 4.20 i1
18、 12 (ui u )2 i1 12 (ui u ) (yi y) i1 12 (vi v )2 i1 12 (xi x ) (v i v ) 3125000 21500 0.308 14 (1)设ui和yi的相关系数为 r1,xi和vi的相关系数为 r2,请从相关 系数的角度,选择一个拟合程度更好的模型; (2)根据(1)的选择及表中数据,建立 y 关于 x 的回归方程(系数精确到 0.01); 若下一年销售额 y 需达到 90 亿元,预测下一年的研发资金投入量 x 是多少亿元? 附:相关系数 r i1 n xi x yi y i1 n xi x 2 i1 n yi y 2 , 回归直线y
19、a b x 中斜率和截距的最小二乘估计公式分别为b i1 n xi x yi y i1 n xi x 2 ,a y b x ; 参考数据:308477, 909.4868,e4.499890. 解 (1)由题意,r1 i1 12 ui u yi y i1 12 ui u 2 i1 12 yi y 2 21500 3125000200 21500 25000 43 500.86, 解解 r2 i1 12 xi x v i v i1 12 xi x 2 i1 12 vi v 2 14 7700.308 14 770.2 10 110.91, 则|r1|r2|,因此从相关系数的角度,模型 yex t
20、 的拟合程度更好 解解 (2)先建立 v 关于 x 的线性回归方程, 由 yex t,得 ln ytx,即 vtx; 由于 i1 12 xi x vi v i1 12 xi x 2 14 7700.018, t v x4.200.018 203.84, 所以 v 关于 x 的线性回归方程为v 0.02x3.84, 所以 ln y 0.02x3.84, 则y e0.02x 3.84. 解解 下一年销售额 y 需达到 90 亿元,即 y90, 代入y e0.02x 3.84,得 90e0.02x3.84, 又 e4.499890,所以 4.49980.02x3.84, 所以 x4.49983.84
21、 0.02 32.99, 所以预测下一年的研发资金投入量约是 32.99 亿元 解解 1利用线性回归方程时的关注点 (1)正确理解计算b ,a 的公式和准确的计算是求线性回归方程的关键 (2)回归直线方程y b xa 必过样本点中心( x , y)见举例说明 1. (3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定 两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回 归方程来估计和预测 2非线性回归方程的求法 (1)根据原始数据(x,y)作出散点图 (2)根据散点图选择恰当的拟合函数 (3)作恰当的变换,将其转化成线性函数,求线性回归方程 (4)在(3)的基础上通过
22、相应变换,即可得非线性回归方程见举例说明 3. 1(2019 南宁二模)一汽车销售公司对开业 4 年来某种型号的汽车“五 一”优惠金额与销售量之间的关系进行分析研究并做了记录,得到如下资 料 日期 第 1 年 第 2 年 第 3 年 第 4 年 优惠金额 x(千元) 10 11 13 12 销售量 y(辆) 22 24 31 27 经过统计分析(利用散点图)可知 x,y 线性相关 (1)用最小二乘法求出 y 关于 x 的线性回归方程y b xa ; (2)若第 5 年优惠金额为 8.5 千元,估计第 5 年的销售量 y(辆)的值 参考公式:b i1 n xi x yi y i1 n xi x
23、2 i1 n xiyin x y i1 n x2 in x 2 ,a y b x . 解 (1)由题意,得 x 11.5, y26, i1 4 xiyi1211, i1 4 x2 i534, b i1 4 xiyi4 x y i1 4 x2 i4 x 2 1211411.526 534411.52 15 5 3, 则a y b x 26311.58.5.y 3x8.5. (2)当 x8.5 时,y 17,第 5 年优惠金额为 8.5 千元时,销售量估计 为 17 辆 解解 2对某地区儿童的身高与体重的一组数据,我们用两种模型ybx a,ycedx拟合,得到回归方程分别为y (1) 0.24x8
24、.81,y (2) 1.70e0.022x,作残差分析,如下表: 身高 x(cm) 60 70 80 90 100 110 体重 y(kg) 6 8 10 14 15 18 e (1) 0.41 0.01 1.21 0.19 0.41 e (2) 0.36 0.07 0.12 1.69 0.34 1.12 (1)求表中空格内的值; (2)根据残差比较模型的拟合效果,决定选择哪个模型; (3)若残差大于 1 kg 的样本点被认为是异常数据,应剔除,剔除后对(2) 所选择的模型重新建立回归方程(结果保留到小数点后两位) 附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线y
25、b x a 的斜率和截距的最小二乘估计分别为b n i1 x i x yi y n i1 x i x 2 , a y b x . 解 (1)根据残差分析, 把x80代入y (1)0.24x8.81中, 得y (1)10.39. 1010.390.39, 表中空格内的值为0.39. (2)模型残差的绝对值的和为 0.410.010.391.210.190.41 2.62, 模型残差的绝对值的和为 0.360.070.121.690.341.123.7. 2.623.7, 模型的拟合效果比较好,选择模型. 解解 (3)残差大于 1 kg 的样本点被剔除后,剩余的数据如下表: 身高 x(cm) 60
26、 70 80 100 110 体重 y(kg) 6 8 10 15 18 e (1) 0.41 0.01 0.39 0.19 0.41 由公式b n i1 x i x yi y n i1 x i x 2 ,a y b x , 得回归方程为y 0.24x8.76. 解解 1假设有两个分类变量 X 和 Y 的 22 列联表如下: Y X y1 y2 总计 x1 a 10 a10 x2 c 30 c30 总计 60 40 100 对同一样本,以下数据能说明 X 与 Y 有关系的可能性最大的一组为 ( ) Aa45,c15 Ba40,c20 Ca35,c25 Da30,c30 题型三题型三 独立性检验
27、独立性检验 答案答案 解析 根据 22 列联表与独立性检验可知,当 a a10与 c c30相差越大 时,X 与 Y 有关系的可能性越大,即 a,c 相差越大, a a10与 c c30相差越 大故选 A. 解析解析 2 (2019 南昌三模)某校高三文科(1)班共有学生 45 人, 其中男生 15 人, 女生 30 人在一次地理考试后,对成绩作了数据分析(满分 100 分),成绩 为 85 分以上的同学称为“地理之星”,得到了如下列联表: 地理之星 非地理之星 合计 男生 7 女生 合计 如果从全班 45 人中任意抽取 1 人,抽到“地理之星”的概率为1 3. (1)完成“地理之星”与性别的
28、 22 列联表, 并回答是否有 90%以上的 把握认为获得“地理之星”与“性别”有关? (2)若已知此次考试中获得“地理之星”的同学的成绩平均值为 90,方 差为 7.2,请你判断这些同学中是否有得到满分的同学,并说明理由(得分 均为整数分) 参考公式:K2 nadbc2 abcdacbd,其中 nabcd. 临界值表: P(K2k0) 0.10 0.05 0.010 0.005 0.001 k0 2.706 3.841 6.635 7.879 10.828 解 (1)根据题意知“地理之星”总人数为 451 315,填写列联表如 下: 地理之星 非地理之星 合计 男生 7 8 15 女生 8
29、22 30 合计 15 30 45 根据表中数据,计算 K24572288 2 15301530 1.840 3 7.2,不符合题意 若恰有 1 个满分,为使方差最小,则其他分值需集中分布在平均数 90 的附近,且为保证平均值为 90,则有 10 个得分为 89,其余 4 个得分为 90,此时方差取得最小值, s2 min 1 15(10090) 24(9090)210(8990)222 3 7.2, 与题 意方差为 7.2 不符合, 所以这些同学中没有得满分的同学 解解 独立性检验的一般步骤 (1)根据样本数据列出 22 列联表; (2)计算随机变量 K2的观测值 k,查表确定临界值 k0;
30、 (3)如果 kk0,就推断“X 与 Y 有关系”,这种推断犯错误的概率不超 过 P(K2k0);否则,就认为在犯错误的概率不超过 P(K2k0)的前提下不能 推断“X 与 Y 有关系” 1学生会为了调查学生对 2018 年俄罗斯世界杯的关注是否与性别有 关,抽样调查 100 人,得到如下数据: 不关注 关注 总计 男生 30 15 45 女生 45 10 55 总计 75 25 100 根据表中数据,通过计算统计量 K2 nadbc2 abcdacbd,并参考以下临界数据: P(K2k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.0
31、01 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 若由此认为“学生对 2018 年俄罗斯世界杯的关注与性别有关”,则此 结论出错的概率不超过( ) A0.10 B0.05 C0.025 D0.01 答案答案 解析 由题意可得 K210030101545 2 45557525 3.0302.706, 由此认 为“学生对 2018 年俄罗斯世界杯的关注与性别有关”出错的概率不超过 0.10.故选 A. 解析解析 2(2018 全国卷)某工厂为提高生产效率,开展技术创新活动,提出 了完成某项生产任务的两种新的生产方式
32、为比较两种生产方式的效率, 选取 40 名工人,将他们随机分成两组,每组 20 人,第一组工人用第一种 生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作 时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求 40 名工人完成生产任务所需时间的中位数 m, 并将完成生产任务 所需时间超过 m 和不超过 m 的工人数填入下面的列联表: 超过 m 不超过 m 第一种生产方式 第二种生产方式 (3)根据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有 差异? 附:K2 nadbc2 abcdacbd, P(K2k0) 0
33、.050 0.010 0.001 k0 3.841 6.635 10.828 解 (1)第二种生产方式的效率更高理由如下: 由茎叶图可知:用第一种生产方式的工人中,有 75%的工人完成生 产任务所需时间至少 80 分钟,用第二种生产方式的工人中,有 75%的工人 完成生产任务所需时间至多 79 分钟因此第二种生产方式的效率更高 由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的 中位数为 85.5 分钟,用第二种生产方式的工人完成生产任务所需时间的中 位数为 73.5 分钟因此第二种生产方式的效率更高 由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时 间高于 80 分钟;用第
34、二种生产方式的工人完成生产任务平均所需时间低于 80 分钟,因此第二种生产方式的效率更高 解解 由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分 布在茎 8 上的最多,关于茎 8 大致呈对称分布;用第二种生产方式的工人 完成生产任务所需时间分布在茎 7 上的最多,关于茎 7 大致呈对称分布, 又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以 认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成 生产任务所需的时间更少,因此第二种生产方式的效率更高 (以上给出了 4 种理由,考生答出其中任意一种或其他合理理由均可) 解解 (2)由茎叶图知 m7981 2 8
35、0.列联表如下: 超过 m 不超过 m 第一种生产方式 15 5 第二种生产方式 5 15 (3)由于 K2的观测值 k40151555 2 20202020 106.635,所以有 99% 的把握认为两种生产方式的效率有差异 解解 3 课时作业课时作业 PART THREE 1变量 X 与 Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4), (13,5);变量 U 与 V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2), (13,1)r1表示变量 Y 与 X 之间的线性相关系数,r2表示变量 V 与 U 之间的 线
36、性相关系数,则( ) Ar2r10 B0r2r1 Cr200;对于变量 V 与 U 而言,V 随 U 的增大而减小,故 V 与 U 负相关, 即 r23.841,即 k 3x 2 x 6 x 6 5x 6 x 3 2 x x 2 x 2 x 3x 8 3.841,解得 x10.243. 因为x 6, x 2为整数,所以若有 95%的把握认为是否喜欢韩剧和性别有关, 则男生至少有 12 人 解析解析 5(2018 全国卷)下图是某地区 2000 年至 2016 年环境基础设施投资 额 y(单位: 亿元)的折线图 为了预测该地区 2018 年的环境基础设施投资额, 建立了 y 与时间变量 t 的两
37、个线性回归模型 根据 2000 年至 2016 年的数据 (时间变量 t 的值依次为 1,2,17)建立模型:y 30.413.5t;根据 2010 年至 2016 年的数据(时间变量 t 的值依次为 1,2,7)建立模型:y 9917.5t. (1)分别利用这两个模型, 求该地区 2018 年的环境基础设施投资额的预 测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由 解 (1)利用模型,该地区 2018 年的环境基础设施投资额的预测值为 y 30.413.519226.1(亿元) 利用模型,该地区 2018 年的环境基础设施投资额的预测值为 y 9917.59256.5(亿元)
38、解解 (2)利用模型得到的预测值更可靠 理由如下: ()从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散 布在直线 y30.413.5t 上下, 这说明利用 2000 年至 2016 年的数据建立 的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应 的点位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变 化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型y 9917.5t 可以较好地描述 2010 年以后的环境基础设施投资额的
39、变化趋势, 因此利用模型得到的预测值更可靠 解解 ()从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元, 由模型得到的预测值 226.1 亿元的增幅明显偏低, 而利用模型得到的预 测值的增幅比较合理,说明利用模型得到的预测值更可靠(以上给出了 2 种理由,考生答出其中任意一种或其他合理理由均可) 解解 B组组 能力关能力关 1某职称晋级评定机构对参加某次专业技术考试的 100 人的成绩进行 了统计,绘制了频率分布直方图(如图所示),规定 80 分及以上者晋级成功, 否则晋级失败(满分为 100 分) (1)求图中 a 的值; (2)估计该次考试的平均分 x (同一组中的数据
40、用该组的区间中点值代 表); (3)根据已知条件完成下面的 22 列联表, 并判断能否有 85%的把握认 为“晋级成功”与性别有关 晋级成功 晋级失败 合计 男 16 女 50 合计 参考公式: P(K2k0) 0.40 0.25 0.15 0.10 0.05 0.025 k0 0.780 1.323 2.072 2.706 3.841 5.024 K2 nadbc2 abcdacbd,其中 nabcd. 解 (1)由频率分布直方图中各小长方形的面积总和为 1,可知(2a 0.0200.0300.040)101,故 a0.005. (2)由频率分布直方图知各小组的区间中点值分别为 55,65,
41、75,85,95,对 应的频率分别为 0.05,0.30,0.40,0.20,0.05, 故可估计平均数 x 550.05650.3750.4850.2950.05 74. 解解 (3)由频率分布直方图知,晋级成功的频率为 0.200.050.25, 故晋级成功的人数为 1000.2525,故填表如下: 晋级成功 晋级失败 合计 男 16 34 50 女 9 41 50 合计 25 75 100 K21001641349 2 25755050 2.6132.072, 所以有 85%的把握认为“晋级成功”与性别有关 解解 2(2019 银川一中模拟)某餐厅通过查阅了最近 5 次食品交易会参会人
42、数 x(万人)与餐厅所用原材料数量 y(袋),得到如下统计表: 第一次 第二次 第三次 第四次 第五次 参会人数 x(万人) 13 9 8 10 12 原材料 y(袋) 32 23 18 24 28 (1)根据所给 5 组数据,求出 y 关于 x 的线性回归方程 yb xa ; (2)已知购买原材料的费用 C(元)与数量 t(袋)的关系为 C 400t20,0t36tN, 380t,t36tN, 投入使用的每袋原材料相应的销售收入为 700 元, 多余的原材料只能无偿返还, 据悉本次交易大会大约有 15 万人参加 根 据(1)中求出的线性回归方程,预测餐厅应购买多少袋原材料,才能获得最 大利润
43、,最大利润是多少?(注:利润 L销售收入原材料费用) 参考公式:b i1 n xi x yi y i1 n xi x 2 i1 n xiyin x y i1 n x2 in x 2 , a y b x . 参考数据: i1 5 xiyi1343, i1 5 x2 i558, i1 5 y2 i3237. 解 (1)由所给数据,得 x 13981012 5 10.4, y 3223182428 5 25, b i1 5 xiyi5 x y i1 5 x2 i5 x 2 1343510.425 558510.42 2.5,a y b x 25 2.510.41,则 y 关于 x 的线性回归方程为y
44、 2.5x 1. 解解 (2)由(1)中求出的线性回归方程知,当 x15 时,y36.5,即预计需要 原材料 36.5 袋, 因为 C 400t20,0t36,tN, 380t,t36,tN, 所以当 t36 时,利润 L700t(400t20)300t20, 当 t35 时,利润 L300352010520; 当 t36 时,利润 L700t380t, 当 t36 时,利润 L700363803611520, 因为预计需要原材料 36.5 袋,且多余的原材料只能无偿返还,所以当 t37 时,利润 L70036.53803711490. 综上所述,餐厅应该购买 36 袋原材料,才能使利润获得最大,最大利 润为 11520 元 解解 本课结束本课结束