1、考点规范练57变量间的相关关系、统计案例基础巩固1.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为6.635,则在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系,因此在100个吸烟的人中必有99个患有肺病B.由独立性检验知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系时,我们说某人吸烟,则他有99%的可能患肺病C.若从统计量中求出在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确2.某公司某型号无人机以其小巧轻便、高效机动、影像清晰、智能化、用途广等突出特点,得到广大用户
2、的青睐,该型号无人机近5年销售量数据统计如表所示.年份20172018201920202021年份代码x01234年销量y/万件1015203035根据表中的数据用最小二乘法求得y关于x的线性回归方程为y=6.5x+t,则可以预测2022年该型号无人机的销量大约为()A.40万件B.41.5万件C.45万件D.48万件3.(2021河北张家口模拟)某组织为研究爱好跑步是否与性别有关进行了一个调查,得到如下列联表,若这两个变量没有关系,则a的值可能为()单位:人是否爱好跑步性别合计男女爱好100a100+a不爱好120600720合计220600+a820+aA.720B.500C.300D.2
3、004.某市2020年4月至2021年3月每月最低气温与最高气温(单位:)的折线统计图如图所示.已知每月最低气温与最高气温的线性相关系数r=0.83,则下列结论错误的是()A.每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关B.月温差(月最高气温-月最低气温)的最大值出现在10月C.912月的月温差相对于58月,波动性更大D.每月最高气温与最低气温的平均值在49月逐月增加5.(2021全国)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:机床产品质量合计一级品二级品甲机床150502
4、00乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否在犯错误的概率不超过0.01的前提下认为甲机床的产品质量与乙机床的产品质量有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2k0)0.0500.0100.001k03.8416.63510.8286.(2021广西梧州模拟预测)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据(xi,yi)(i=1,2
5、,20),其中xi和yi分别表示第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得i=120xi=80,i=120yi=4 000,i=120(xi-x)2=80,i=120(yi-y)2=8 000,i=120(xi-x)(yi-y)=700.(1)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合;(2)求y关于x的线性回归方程,用所求回归方程预测该市10万人口的县城年垃圾产生总量约为多少吨?参考公式:相关系数r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2,对于一组具有线性相关关系的数据(xi,yi)(i=1,2,3,
6、n),其回归直线y=bx+a的斜率和截距的最小二乘估计分别为b=i=1n(xi-x)(yi-y)i=1n(xi-x)2,a=y-bx.能力提升7.某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁、9岁、12岁、15岁、18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出散点图和回归直线l如图所示.根据图中数据,下列对该样本描述错误的是()A.根据样本数据,估计该地区青少年身高与年龄成正相关B.所抽取数据中,5 000名青少年平均身高约为145 cmC.直线l的斜率的值近似等于样本中青少年平均身高每年的增量D.从这5种年龄的青少年中各取一人的身高数据,由这5人的
7、平均年龄和平均身高数据作出的点一定在直线l上8.已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=bx+a,则以下结论正确的是()A.bb,aaB.bb,aaC.baD.bb,a6.635.所以在犯错误的概率不超过0.01的前提下认为甲机床的产品质量与乙机床的产品质量有差异.6.解(1)由题意知,相关系数r=i=120(xi-x)(yi-y)i=120(xi-x)2i=120(yi-y)2=700808000=78=0.875.因为y与x的相关系数接近1,所以y与
8、x之间具有较强的线性相关关系,可用线性回归模型进行拟合.(2)由题意可得,b=i=120(xi-x)(yi-y)i=120(xi-x)2=70080=8.75,a=y-bx=400020-8.758020=200-8.754=165,所以y=8.75x+165.当x=10时,y=8.7510+165=252.5,所以该市10万人口的县城年垃圾产生总量约为252.5吨.7.D解析在给定范围内,随着年龄的增加,年龄越大,身高越高,该地区青少年身高与年龄成正相关,故A正确;用样本数据估计总体可得平均身高约是145cm,故B正确;根据直线斜率的意义可知斜率的值近似等于样本中青少年平均身高每年的增量,故
9、C正确;各取一人具有随机性,根据数据作出的点只能在直线附近,不一定在直线上,故D错误,故选D.8.C解析由题意可知,b=2,a=-2,b=i=16(xi-x)(yi-y)i=16(xi-x)2=57.a=y-bx=136-5772=-13,则ba,故选C.9.解(1)应该选择模型.由于模型残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型带状宽度窄,所以模型的拟合精度更高,回归方程的预报精度相应就会越高,故选模型比较合适.(2)令z=lny,z与温度x可以用线性回归方程来拟合,则z=a+bx,b=i=18(zi-z)(xi-x)i=18(xi-x)2=48.481680.29,a=z
10、-bx=2.89-0.2925-4.36,则z关于x的线性回归方程为z=0.29x-4.36.于是有lny=0.29x-4.36,产卵数y关于温度x的回归方程为y=e0.29x-4.36.当x=34时,y=e0.2934-4.36=e5.50245(个).在气温为34 时,一个红铃虫的产卵数的预报值为245个.10.解(1)时间的平均数为x=1+2+3+4+55=3,报名人数的平均数为y=3+6+10+13+185=10,所以b=i=15xiyi-5xyi=15xi2-5x2=187-531055-59=3710=3.7,a=y-bx=10-3.73=-1.1,所以线性回归方程为y=3.7x-1.1.把x=7代入得y=24.825,所以第7天的报名人数约为25.(2)由列联表数据可得k=100(4520-530)275255050=12,因为1210.828,所以在犯错误的概率不超过0.001的条件下认为“中学生对航空航天的兴趣爱好和性别有关系”.9