1、考点考点1 1 变量间的相关关系变量间的相关关系 1.(2020课标,5,5分)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关 系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,20)得到下面的散点图: 由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方 程类型的是( ) A.y=a+bx B.y=a+bx2 C.y=a+bex D.y=a+bln x 答案答案 D 本题考查回归方程及一次函数、二次函数、指数型函数、对数型函数的图象. 观察题中散点图可知,散点图用光滑曲线连接起来比较接近对数型函数的
2、图象,故选D. 2.(2020课标,18,12分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为 调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样 的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,20),其中xi和yi分别表示第i个样区的植 物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200,(xi-)2=80,(yi-)2 =9 000,(xi-)(yi-)=800. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量 的平均数乘地块数);
3、(2)求样本(xi,yi)(i=1,2,20)的相关系数(精确到0.01); (3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种 野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由. 附:相关系数r=,1.414. 20 1i 20 1i 20 1i x 20 1i y 20 1i xy 1 22 11 ( - )( - ) ( - )( - ) n ii i nn ii ii x x y y x xy y 2 解析解析 (1)由已知得样本平均数=yi=60,从而该地区这种野生动物数量的估计值为60200=1 2 000. (2)样本(
4、xi,yi)(i=1,2,20)的相关系数 r=0.94. (3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样. 理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植 物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保 持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量 更准确的估计. y 1 20 20 1i 20 1 2020 22 11 ( - )( - ) ( - )( - ) ii i ii ii x x y y x xy y 800 80 9 00
5、0 2 2 3 3.(2018课标,18,12分)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据 2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:=-30.4+13.5t;根据2010年 至2016年的数据(时间变量t的值依次为1,2,7)建立模型:=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; y y (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 解析解析 (1)利用模型,该地区201
6、8年的环境基础设施投资额的预测值为=-30.4+13.519=226.1 (亿元). 利用模型,该地区2018年的环境基础设施投资额的预测值为=99+17.59=256.5(亿元). (2)利用模型得到的预测值更可靠. 理由如下: (i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这 说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化 趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于 一条直线的附近,这说明从2010年开始环境基础设施投资额的变
7、化规律呈线性增长趋势,利用2010 年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资 额的变化趋势,因此利用模型得到的预测值更可靠. (ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元 的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可 靠. 以上给出了2种理由,答出其中任意一种或其他合理理由均可. y y y 4.(2016课标,18,12分)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码17分别对应20082014
8、. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:yi=9.32,tiyi=40.17,=0.55,2.646. 7 1i 7 1i 7 2 1 ( - ) i i y y 7 参考公式:相关系数r=, 回归方程=+t中斜率和截距最小二乘估计公式分别为: =,=-. 1 22 11 ( - )( - ) ( - )( - ) n ii i nn ii ii t t y y t ty y y a b b 1 2 1 ( - )( - ) ( - ) n
9、ii i n i i t t y y t t a y bt 解析解析 (1)由折线图中数据和附注中参考数据得 =4,(ti-)2=28,=0.55, (ti-)(yi-)=tiyi-yi=40.17-49.32=2.89,r0.99.(4分) 因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y 与t的关系.(6分) (2)由=1.331及(1)得=0.10,=-=1.331-0.1040.93. 所以y关于t的回归方程为=0.93+0.10t.(10分) 将2016年对应的t=9代入回归方程得:=0.93+0.109=1.83. 所以预测2016年
10、我国生活垃圾无害化处理量约为1.83亿吨.(12分) t 7 1i t 7 2 1 ( - ) i i y y 7 1i ty 7 1i t 7 1i 2.89 0.55 2 2.646 y 9.32 7 b 7 1 7 2 1 ( - )( - ) ( - ) ii i i i t t y y t t 2.89 28 a y bt y y 5.(2017课标,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产 线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的 尺寸: 经计算得=xi=9.97,s= =0.212,
11、 抽取次 序 1 2 3 4 5 6 7 8 零件尺 寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 抽取次 序 9 10 11 12 13 14 15 16 零件尺 寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 x 1 16 16 1i 16 2 1 1 ( - ) 16 i i x x 16 22 1 1 -16 16 i i xx? 16 2 1 ( -8.5) i i 18.439,(xi-)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,16. (1)求(xi,i)(i
12、=1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的 进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大 或变小); (2)一天内抽检零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认为这条生产线在这一天的 生产过程可能出现了异常情况,需对当天的生产过程进行检查. (i)从这一天抽检的结果看,是否需对当天的生产过程进行检查? (ii)在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的 均值与标准差.(精确到0.01) 附:样本(xi,yi)(i=1,2,n)的相关系数 r=.
13、 0.09. 16 1i x xx xx 1 22 11 ( - )( - ) ( - )( - ) n ii i nn ii ii x x y y x xy y 0.008 解析解析 本题考查统计问题中的相关系数及样本数据的均值与方差. (1)由样本数据得(xi,i)(i=1,2,16)的相关系数为r= =-0.18. 由于|r|0,b0,b0 C.a0,b0 D.a0 x 3 4 5 6 7 8 y 4.0 2.5 -0.5 0.5 -2.0 -3.0 y 答案答案 A 由题中数据知,b0, =, =, =b+a,a=-b. 又b0,故选A. x 345678 6 11 2 y 4.02.
14、5-0.50.5-2.0-3.0 6 1 4 1 4 11 2 1 4 11 2 4.(2015课标,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千 元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2, 8)数据作了初步处理,得到下面的散点图及一些统计量的值. (xi-)2 (wi-)2 (xi-)(yi- ) (wi-)(yi- ) 46.6 563 6.8 289.8 1.6 1 469 108.8 xyw 8 1i x 8 1i w 8 1i x y 8 1i w y 表中wi=,=wi. (1
15、)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类 型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题: (i)年宣传费x=49时,年销售量及年利润的预报值是多少? (ii)年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线v=+u的斜率和截距的最小二乘估计分别为 =,=- . i xw 1 8 8 1i x 1 2 1 ( - )( - ) ( -
16、 ) n ii i n i i u u v v u u v u 解析解析 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2 分) (2)令w=,先建立y关于w的线性回归方程. 由于=68, =- =563-686.8=100.6, 所以y关于w的线性回归方程为=100.6+68w, 因此y关于x的回归方程为=100.6+68.(6分) (3)(i)由(2)知,当x=49时,年销售量y的预报值 =100.6+68=576.6, 年利润z的预报值 =576.60.2-49=66.32.(9分) (ii)根据(2)的结果知,年利润z的预报值 =0.2(100.6
17、+68)-x=-x+13.6+20.12. 所以当=6.8,即x=46.24时,取得最大值. x x d 8 1 8 2 1 (- )( - ) (- ) ii i i i w w y y w w 108.8 1.6 c y dw y y x y 49 z z xx x 13.6 2 z 故年宣传费为46.24千元时,年利润的预报值最大.(12分) 5.(2014课标,19,12分)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下 表: (1)求y关于t的线性回归方程; (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,
18、并预 测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为: =,=-. 年 份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收 入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 b 1 2 1 ( - )( - ) ( - ) n ii i n i i t t y y t t a y bt 解析解析 (1)由所给数据计算得 =(1+2+3+4+5+6+7)=4, =(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, (ti-)2=9+4+1+0+1+4
19、+9=28, (ti-)(yi-)=(-3)(-1.4)+(-2)(-1)+(-1)(-0.7)+00.1+10.5+20.9+31.6=14, =0.5, =-=4.3-0.54=2.3,所求回归方程为=0.5t+2.3. (2)由(1)知,=0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0. 5千元. 将2015年的年份代号t=9代入(1)中的回归方程,得=0.59+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元. t 1 7 y 1 7 7 1i t 7 1i ty b 7 1 7 2 1 ( - )( - ) ( - )
20、 ii i i i t t y y t t 14 28 a y bt y b y 考点考点2 2 独立性检验独立性检验 1.(2020课标,18,12分)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某 公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次 空气质量等级 0,200 (200,400 (400,600 1(优) 2 16 25 2(良) 5 10 12 3(轻度污染) 6 7 8 4(中度污染) 7 2 0 人次400 人次400 空气质量好 空气质量不好 (1)分别估计该市一天的空气质量等级为1,2,3,4的概率; (2)求一天中到该公园锻炼的平均人次的
21、估计值(同一组中的数据用该组区间的中点值为代表); (3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称 这天“空气质量不好”.根据所给数据,完成下面的22列联表,并根据列联表,判断是否有95%的把 握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 附:K2=, . 2 (-) ()()()() n ad bc ab cd ac bd 解析解析 (1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表: (2)一天中到该公园锻炼的平均人次的估计值为(10020+30035+50045)=350. (3)根据所给数据,可得22
22、列联表: 根据列联表得K2=5.820. 由于5.8203.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 空气质量等级 1 2 3 4 概率的估计值 0.43 0.27 0.21 0.09 人次400 人次400 空气质量好 33 37 空气质量不好 22 8 1 100 2 100 (33 8-22 37) 55 45 70 30 2.(2020新高考,19,12分)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调 研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:g/m3),得下表: (1)估计事件“该市一天空气中PM2.5浓度不超
23、过75,且SO2浓度不超过150”的概率; (2)根据所给数据,完成下面的22列联表: SO2 PM2.5 0,50 (50,150 (150,475 0,35 32 18 4 (35,75 6 8 12 (75,115 3 7 10 SO2 PM2.5 0,150 (150,475 0,75 (75,115 (3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关. 附:K2=, . 2 (-) ()()()() n ad bc ab cd ac bd 解析解析 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过15
24、0的天数为3 2+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为 =0.64. (2)根据抽查数据,可得22列联表: (3)根据(2)的列联表得K2=7.484. 由于7.4846.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关. SO2 PM2.5 0,150 (150,475 0,75 64 16 (75,115 10 10 64 100 2 100 (64 10-16 10) 80 20 74 26 3.(2019课标,17,12分)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对
25、 该商场的服务给出满意或不满意的评价,得到列联表: (1)分别估计男、女顾客对该商场服务满意的概率; (2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K2=. . 满意 不满意 男顾客 40 10 女顾客 30 20 2 (-) ()()()() n ad bc ab cd ac bd 解析解析 本题通过对概率与频率的关系、统计案例中两变量相关性检验考查学生的数据处理能力, 重点考查数据分析、数学运算的核心素养;倡导学生关注生活,提高数学应用意识. (1)由调查数据,男顾客中对该商场服务满意的比率为=0.8,因此男顾客对该商场服务满意的概 率的估计值为0.8. 女顾客中对
26、该商场服务满意的比率为=0.6,因此女顾客对该商场服务满意的概率的估计值为0. 6. (2)K2=4.762. 由于4.7623.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异. 40 50 30 50 2 100 (40 20-10 30) 50 50 70 30 4.(2017课标,19,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随 机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: (1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率; (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产
27、量与养殖方法有关; 箱产量6.635,故有99%的把握认为箱产量与养殖方法有关. (3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养 殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖 法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧 养殖法. 箱产量6.635,所以有99%的把握认为两种生产方式的效率有差异. 超过m 不超过m 第一种生产方式 15 5 第二种生产方式 5 15 2 40 (15 15-5 5) 20202020 思路分析思路分析 (1)根
28、据茎叶图中的数据大致集中在哪个茎,作出判断; (2)通过茎叶图确定数据的中位数,按要求完成22列联表; (3)根据(2)中22列联表,将有关数据代入公式计算得K2的值,借助临界值表作出统计推断. 方法总结方法总结 解决此类问题的步骤: (1)审清题意:弄清题意,理顺条件和结论; (2)找数量关系:把图形语言转化为数字,找关键数量关系; (3)建立解决方案:找准公式,将22列联表中的数值代入公式计算; (4)作出结论:依据数据,借助临界值表作出正确判断. 解后反思解后反思 独立性检验问题的常见类型及解题策略: (1)已知分类变量的数据,判断两个分类变量的相关性,可依据数据及公式计算K2,然后作出
29、判断; (2)独立性检验与概率统计的综合问题,关键是根据独立性检验的一般步骤,作出判断,再根据概率 统计的相关知识求解. 以下为教师用书专用 1.(2014江西,7,5分)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机 抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) A.成绩 B.视力 C.智商 D.阅读量 答案答案 D =, 令=m, 则=82m,同理, =m(420-1216)2=1122m, =m(824-812)2=962m, =m(1430-62)2=4082m,则与性别有关联的可能性 最大的变量是阅读量,故选D. 2 1
30、 2 52 (6 22-10 14) 16 36 20 32 52 16 36 20 32 2 1 2 2 2 3 2 4 2 4 2 2 2 3 2 1 2.(2014安徽,17,12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每 周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本 数据(单位:小时). (1)应收集多少位女生的样本数据? (2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样 本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10
31、,12.估计该校学生每周平均体育运动时间超 过4小时的概率; (3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间 与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”. 附:K2= 2 (-) ()()()() n ad bc ab cd ac bd P(K2k0) 0.10 0.05 0.010 0.005 k0 2.706 3.841 6.635 7.879 解析解析 (1)300=90,所以应收集90位女生的样本数据. (2)由频率分布直方图得1-2(0.100+0.025)=0.75,所以该校学生每周平均体育运
32、动时间超过4小时 的概率的估计值为0.75. (3)由(2)知,300位学生中有3000.75=225人的每周平均体育运动时间超过4小时,75人的每周平均 体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每 周平均体育运动时间与性别列联表如下: 每周平均体育运动时间与性别列联表 4 500 15 000 男生 女生 总计 每周平均体育运动时 间不超过4小时 45 30 75 每周平均体育运动时 间超过4小时 165 60 225 总计 210 90 300 结合列联表可算得K2=4.7623.841.所以,有95%的把握认为“该校学 生的每周平均体育运
33、动时间与性别有关”. 2 300 (45 60-30 165) 75 225 210 90 100 21 评析评析 本题考查抽样方法、用样本的频率分布估计总体的频率分布及独立性检验等知识,同时考 查处理图表的能力和运算能力. 考点考点1 1 变量间的相关关系变量间的相关关系 A A组组 考点基础题组考点基础题组 1.(2020陕西铜川二模,5)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归 直线方程,分别得到以下四个结论: y与x负相关且=2.347x-6.423; y与x负相关且=-3.476x+5.648; y与x正相关且=5.437x+8.493; y与x正相关且=-
34、4.326x-4.578. 其中不正确的结论的序号是( ) A. B. C. D. y y y y 答案答案 D y与x负相关且=2.347x-6.423,此结论不正确,由线性回归方程知,两变量的关系是正 相关.y与x负相关且=-3.476x+5.648,此结论正确,由线性回归方程知,两变量的关系符合负相关 的特征.y与x正相关且=5.437x+8.493,此结论正确,由线性回归方程知,两变量的关系符合正相 关的特征.y与x正相关且=-4.326x-4.578,此结论不正确,由线性回归方程知,两变量的关系是负 相关.综上判断,是不正确的.故选D. y y y y 2.(2020中原名校质量考评
35、,7)根据最小二乘法,由一组样本点(xi,yi)(其中i=1,2,300)求得的回归方 程是=x+,则下列说法正确的是( ) A.至少有一个样本点落在回归直线=x+上 B.若所有样本点都在回归直线=x+上,则变量间的相关系数为1 C.对所有的解释变量xi(i=1,2,300),xi+的值一定与yi有误差 D.若回归直线=x+的斜率0,则变量x与y正相关 y b a y b a y b a b a y b a b 答案答案 D 本题主要考查线性回归方程的性质,意在考查学生对该知识的理解掌握水平和分析推 理能力. 回归直线必过样本点的中心,但样本点可能全部不在回归直线上故A错误; 所有样本点都在回
36、归直线=x+上,则变量间的相关系数为1,故B错误; 若所有的样本点都在回归直线=x+上,则xi+的值与yi相等,故C错误; 相关系数r与符号相同,若回归直线=x+的斜率0,则r0,样本点分布从左到右是上升的,即 变量x与y正相关,故D正确.故选D. y b a y b a b a b y b a b 3.(2019陕西西安陕师大附中等八校联考,6)设两个变量x和y之间具有线性相关关系,它们的相关系 数为r,y关于x的回归直线方程为=kx+b,则( ) A.k与r的符号相同 B.b与r的符号相同 C.k与r的符号相反 D.b与r的符号相反 y 答案答案 A 相关系数r为正,表示正相关,回归直线上
37、升,r为负,表示负相关,回归直线下降,k与r 的符号相同.故选A. 4.(2019贵州遵义联考一,4)已知x、y取值如下表: 画散点图分析可知y与x线性相关,且求得回归方程为=x+1,则m的值(精确到0.1)为( ) A.1.5 B.1.7 C.1.8 D.1.9 x 0 1 4 5 6 y 1.3 m 3m 5.6 7.4 y 答案答案 B 由题可得=3.2,将=3.2代入回归方程=x+1,可得=4.2,则4m=6.7,解得m=1.675,精确 到0.1后m的值为1.7,故选B. xx y y 5.(2020辽宁辽阳一模,18)某公司A产品生产的投入成本x(单位:万元)与产品销售收入y(单位
38、:十万 元)存在较好的线性关系,下表记录了该公司最近8次该产品的相关数据,且根据这8组数据计算得 到y关于x的线性回归方程为=x+0.760 4. (1)求的值(结果精确到0.000 1),并估计公司A产品投入成本30万元后产品的销售收入(单位:元); (2)该公司B产品生产的投入成本u(单位:万元)与产品销售收入v(单位:十万元)也存在较好的线性 关系,且v关于u的线性回归方程为=0.15u+0.5. (i)估计该公司B产品投入成本30万元后的毛利率; (ii)判断该公司A,B两个产品都投入成本30万元后,哪个产品的毛利率更大. x(单位: 万元) 6 7 8 11 12 14 17 21
39、y(单位: 十万元) 1.2 1.5 1.7 2 2.2 2.4 2.6 2.9 y b b v - 100% 收入 成本 毛利率 收入 解析解析 本题考查线性回归方程的应用,考查分析问题、解决问题的能力,考查学生的数据分析能 力、逻辑推理能力. (1)=12,=2.062 5,2.062 5=12+0.7 604, 解得0.108 5. 当x=30时,=0.108 530+0.760 4=4.0154,故公司A产品投入成本30万元后产品的销售收入约为401 540元. (2)(i)当u=30时,=5,B产品毛利率为100%=40%. (ii)当x=30时,=4.015 4,A产品的毛利率为1
40、00%=100%25.29%3.841,参照题目中的数值表,可得在犯错误的概率不 超过5%的前提下,认为“爱好该运动与性别有关”.故选C. 2.(2019广东湛江高考测试(二),5)有人认为在机动车驾驶技术上,男性优于女性.这是真的吗?某社 会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通 违法事件发生,得到下面的列联表: 附:K2= 男 女 合计 无 40 35 75 有 15 10 25 合计 55 45 100 2 (-) ()()()() n ad bc ab cd ac bd P(K2k0) 0.50 0.40 0.25 0.15 0.10 k0
41、 0.455 0.708 1.323 2.072 2.706 据此表,可得( ) A.认为机动车驾驶技术与性别有关的可靠性不足50% B.认为机动车驾驶技术与性别有关的可靠性超过50% C.认为机动车驾驶技术与性别有关的可靠性不足60% D.认为机动车驾驶技术与性别有关的可靠性超过60% 答案答案 A 由题表中数据,计算得K2=0.336 710.828,断定秃头与患有心脏病有关,那么 这种判断出错的可能性不超过( ) 附表: A.0.1 B.0.05 C.0.01 D.0.001 有心脏病 无心脏病 秃头 20 300 不秃头 5 450 P(K2k0) 0.15 0.10 0.05 0.0
42、25 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828 2 775 (20 450-5 300) 25 750 320 455 答案答案 D 由于K210.828,所以根据附表可断定“秃头与患有心脏病有关”出错的可能性不超过 0.001,故选D. 4.(2020广西玉林、南宁一模,17)水稻是人类重要的粮食作物之一,耕种与食用的历史都相当悠久, 目前我国南方农户在播种水稻时一般有直播、撒播两种方式.为比较在两种不同的播种方式下水 稻产量的区别,某市红旗农场于2019年选取了200块农田,分成两组,每组100块,进行试
43、验.其中第一 组采用直播的方式进行播种,第二组采用撒播的方式进行播种.得到数据如表: 约定亩产超过900斤(含900斤)为“产量高”,否则为“产量低”. (1)请根据以上统计数据估计100块直播农田的平均产量(同一组中的数据用该组区间的中点值代 表); (2)请根据以上统计数据填写下面的22列联表,并判断是否有99%的把握认为“产量高”与“播 种方式”有关? 产量(单位:斤) 播种方式 840,860) 860,880) 880,900) 900,920 920,940 直播 4 8 18 39 31 散播 9 19 22 32 18 产量高 产量低 合计 直播 散播 合计 附K2=. P(K
44、2k0) 0.10 0.010 0.001 k0 2.706 6.635 10.828 2 (-) ()()()() n ad bc ab cd ac bd 解析解析 (1)估计100块直播农田的平均产量为8500.04+8700.08+8900.18+9100.39+9300.31=9 07(斤).(5分) (2)22列联表如下: (8分) K2=8.3336.635, 有99%的把握认为“产量高”与“播种方式”有关.(12分) 产量高 产量低 合计 直播 70 30 100 散播 50 50 100 合计 120 80 200 2 200 (70 50-50 30) 100 100 120
45、 80 一、选择题(每小题5分,共30分) B B组组 专题综合题组专题综合题组 (时间:60分钟 分值:70分) 1.(2020吉林桦甸四中、磐石一中等4月模拟,9)在某研究所做的一次试验中,得到了大量试验数据 (x,y),剔除掉一些不合理数据后,得到了四组数据(2,3.7),(3,4.2),(5,4.9),(6,5.5),则由这四组数据,可以 得到y与x之间的回归方程为( ) A.=-0.2x+5.375 B.=0.5x+2.575 C.=-0.5x+3.575 D.=x+2.575 y y y y 答案答案 B =4,=4.575, 线性回归方程经过样本点的中心(4,4.575). 排除
46、C,D,又x与y成正相关,排除A.故选B. x 2356 4 y 3.74.24.95.5 4 2.(2020陕西榆林三模,3)如图所示,给出了样本容量均为7的A,B两组样本数据的散点图,已知A组样 本数据的相关系数为r1,B组数据的相关系数为r2,则( ) A.r1=r2 B.r1r2 D.无法判定 答案答案 C 根据A、B两组样本数据的散点图知,A组样本数据几乎在一条直线上,且成正相关,相 关系数r1应更接近1.B组数据分散在一条直线附近,也成正相关, 相关系数r2满足r210.828,根据临界值表,可得有99.9%的把握认为“日落云里走是否出现”与 “当晚是否下雨”有关,故C判断正确,D
47、判断错误.故选D. 2525 100 1 2 25 2545 5 14 并计算得到K219.05,下列小波对地区A天气判断不正确的是 ( ) A.夜晚下雨的概率约为 1 2 4.(2020甘肃兰州一诊,7)近五年来某草场羊只数量与草场植被指数两变量间的关系如表所示,绘制 相应的散点图,如图所示: 年份 1 2 3 4 5 羊只数量(万只) 1.4 0.9 0.75 0.6 0.3 草地植被指数 1.1 4.3 15.6 31.3 49.7 根据表及图得到以下判断: 羊只数量与草场植被指数成减函数关系; 若利用这五组数据得到的两变量间的相关系数为r1,去掉第一年数据后得到的相关系数为r2,则|r 1|r2|; 可以利用回归直线方程,准确地得
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。