1、章末复习课第9章统计一、变量的相关性二、线性回归方程三、独立性检验内容索引知识网络随堂演练知识网络一、变量的相关性1.变量的相关关系与相关系数是学习线性回归模型的前提和基础,前者可借助散点图从直观上分析变量间的相关性,后者从数量上准确刻化了两个变量的相关程度.2.在学习该部分知识时,体会直观想象和数学运算的素养.例1(1)某次考试,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩对应如下表:学生编号12345678数学成绩x6065707580859095物理成绩y7277808488909395绘出散点图如右.根据以上信息,判断下列结论:根据此散点图,可以判断数学成绩与物理
2、成绩具有线性相关关系;根据此散点图,可以判断数学成绩与物理成绩具有一次函数关系;甲同学数学考了80分,那么,他的物理成绩一定比数学只考了60分的乙同学的物理成绩要高.其中正确的个数为A.0 B.3 C.2 D.1解析对于,根据此散点图知,各点都分布在一条直线附近,可以判断数学成绩与物理成绩具有较强的线性相关关系,正确;对于,根据此散点图,可以判断数学成绩与物理成绩具有较强的线性相关关系,不是一次函数关系,错误;对于,甲同学数学考了80分,他的物理成绩可能比数学只考了60分的乙同学的物理成绩要高,所以错误.综上,正确的命题是,只有1个.(2)在一次试验中,测得(x,y)的四组值分别为(1,2),
3、(2,0),(4,4),(1,6),则y与x的相关系数为_.1方法二观察四个点,发现其在一条单调递减的直线上,故y与x的相关系数为1.跟踪训练1(1)(多选)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,下列选项中,正确的是A.0r1r21B.0r2r11C.1r1r20D.1r2r10解析由散点图得两个变量呈负相关关系,所以r10,r20,因为剔除点(10,21)后,剩下点的数据更具有线性相关性,|r|更接近1,所以1r2r10.故选D.二、线性回归方程1.主要考查两个变量线性相关的判定,以及利用最小二乘法求线性回归方程.2.掌握求线性回归方程的方法和步骤,提升
4、数学运算、数据分析素养.例2如图所示的是某企业2014年至2020年污水净化量(单位:吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y和t的关系,请用相关系数加以说明;y与t之间存在较强的正相关关系.(2)建立y关于t的线性回归方程,预测2021年该企业污水净化量.预测2021年该企业污水净化量约为57吨.跟踪训练2二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:右面是z关于x的折线图:使用年数x234567售价y201286.44.43zln y3.002.482.081.861.481.10(1)由折线图可以看出,可以用线
5、性回归模型拟合z与x的关系,请用相关系数加以说明;解由题意,计算所以z与x的相关系数大约为0.99,说明z与x的线性相关程度很高.又zln y,令x9,解得ye0.3693.621.46,即预测某辆A型号二手车当使用年数为9年时售价约1.46万元.(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?解当y0.711 8时,e0.36x3.620.711 8eln 0.711 8e0.34,所以0.36x3.620.34,解得x11,因此预测在收购该型号二手车时车辆的使用年数不得超过11年.三、独立性检验1
6、.主要考查根据样本制作22列联表,由22列联表计算2,查表分析并判断相关性结论的可信程度.2.通过计算2的值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养.例3海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;解记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”,由P(A)P(BC)P(B)P(C),则旧养殖法的箱
7、产量低于50 kg的频率为(0.0120.0140.0240.0340.040)50.62,故P(B)的估计值为0.62,新养殖法的箱产量不低于50 kg的频率为(0.0680.0460.0100.008)50.66,故P(C)的估计值为0.66,则事件A的概率估计值为P(A)P(B)P(C)0.620.660.409 2,A发生的概率为0.409 2.(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.箱产量6.635,故有99%的把握认为箱产量与养殖方法有关.箱产量50 kg箱产量50 kg合计旧养殖法6238100新养殖法3466100合计96104200跟
8、踪训练3户外运动已经成为一种时尚运动,某单位为了了解员工喜欢户外运动是否与性别有关,决定从本单位全体650人中采用分层抽样的办法抽取50人进行问卷调查,得到了如下列联表:喜欢户外运动不喜欢户外运动合计男性5 女性10 合计50(1)请将上面的列联表补充完整;喜欢户外运动不喜欢户外运动合计男性20525女性101525合计302050(2)求该公司男、女员工各多少人;解该公司男员工人数为2550650325(人),则女员工有325人.(3)试问:喜欢户外运动与性别是否有关?所以有99%的把握认为喜欢户外运动与性别有关.随堂练习1.下列两个量之间的关系是相关关系的为A.匀速直线运动的物体时间与位移
9、的关系B.学生的成绩和体重C.路上酒后驾驶的人数和交通事故发生的多少D.水的体积和重量1234解析A选项,匀速直线运动的物体时间与位移的关系是函数关系;B选项,成绩与体重之间不具有相关性;C选项,路上酒后驾驶的人数和交通事故发生的多少是相关关系;D选项,水的体积与重量是函数关系.2.如图所示,给出了样本容量均为7的A,B两组样本数据的散点图,已知A组样本数据的相关系数为r1,B组样本数据的相关系数为r2,则1234A.r1r2 B.r1r2 D.无法判定解析根据A,B两组样本数据的散点图知,A组样本数据几乎在一条直线上,且成正相关,相关系数r1应最接近1,B组样本数据分散在一条直线附近,也成正
10、相关,相关系数r2满足r2r2,故选C.12343.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i1,2,20)得到散点图如图所示.由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是A.yabx B.yabx2C.yabex D.yabln x1234解析由散点图可以看出,随着温度x的增加,发芽率y增加到一定程度后,变化率越来越慢,符合对数型函数的图象特征.12344.某销售部门为了研究具有相关大学学历和能按时完成销售任务的关系,对本部门200名销售人员进行调查,所得数据如下表所示:能按时完成销售任务不能按时完成销售任务合计具有相关大学学历574299不具有相关大学学历3665101合计93107200根据上述数据能得出结论:有_以上的把握认为“销售人员具有相关大学学历与能按时完成销售任务是有关系的”.99%1234因为9.676.635,所以有99%以上的把握认为“销售人员具有相关大学学历与能按时完成销售任务是有关系的”.谢谢观看