1、8.1成对数据的统计相关性 8.2一元线性回归模型及其应用8.3.1分类变量与列联表8.3.2独立性检验 P59章末复习 P104激趣诱思知识点拨你知道“乌鸦叫,没好兆”这样的迷信说法的原因吗?日常生活中类似这样的谚语,如“名师出高徒”“龙生龙,凤生凤,老鼠的孩子会打洞”又能说明什么样的相关关系呢?激趣诱思知识点拨一、变量的相关关系1.相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.2.散点图:将样本中的每一个序号下的成对样本数据都用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.3.正相关与负相关:如果从整体上看,当一个变量的值
2、增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.激趣诱思知识点拨4.线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.5.非线性相关:一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.激趣诱思知识点拨微练习下列两个变量具有相关关系的是()A.角度和它的余弦值B.正方形的边长和面积C.人的年龄与身高 D.人的身高和体重解析:A,B具有确定性的函数关系;C无相关关系;一般地,身高越高,体重越重,
3、是相关关系.故选D.答案:D激趣诱思知识点拨微思考相关关系与函数关系有什么异同点?提示:相同点:两者均是指两个变量的关系.不同点:函数关系是一种确定的关系,如圆的面积S与半径r的关系,它可以用函数关系式S=r2来表示;相关关系是一种非确定的关系,如人的体重y与身高x有关,一般来说,身高越高,体重越重,但不能用一个函数关系式来严格地表示它们之间的关系.函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量之间的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.激趣诱思知识点拨二、样本相关系数对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),
4、(x2,y2),(xn,yn),其中x1,x2,xn和y1,y2,yn的均值分别为我们称r为变量x和变量y的样本相关系数.激趣诱思知识点拨名师点析样本相关系数r的性质(1)当r0时,称成对数据正相关;当r0时,称成对数据负相关.(2)当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱.(3)样本相关系数r的取值范围为-1,1.激趣诱思知识点拨微练习对于样本相关系数r,叙述正确的是()A.|r|(0,+),|r|越大,相关程度越强,反之,相关程度越弱B.r(-,+),r越大,相关程度越强,反之,相关程度越弱C.|r|1,|r|越接近于1,相关程度越强;
5、|r|越接近于0,相关程度越弱D.以上说法都不对解析:由样本相关系数的性质知,r-1,1,排除A,B;|r|越接近于1,相关程度越强,|r|越接近于0,相关程度越弱,故选C.答案:C激趣诱思知识点拨三、一元线性回归模型 我们称该式为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.激趣诱思知识点拨四、一元线性回归模型参数的最小二乘估计1.经验回归方程激趣诱思知识点拨2.残差与残差分析对于响应变量Y,通过观测得到的数
6、据称为观测值,通过经验回归方程得到的 称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分差.3.在残差图中,当残差比较均匀地分布在横轴的两边,说明残差比较符合一元线性回归模型的假定,是均值为0、方差为2的随机变量的观测值.可见,通过观察残差图就可以直观判断模型是否满足一元线性回归模型的假设.激趣诱思知识点拨激趣诱思知识点拨微思考在回归分析中,利用经验回归方程求出的值一定是真实值吗?为什么?提示:不一定是真实值.利用经验回归方程求出的值,在很多时候只是预测值,例如,人的体重与身高存
7、在一定的线性相关关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.激趣诱思知识点拨微练习(1)如果记录了x,y的几组数据分别为(0,1),(1,3),(2,5),(3,7),那么y关于x的经验回归直线必过点()A.(2,2)B.(1.5,2)C.(1,2)D.(1.5,4)经验回归直线必过点(1.5,4).答案:D激趣诱思知识点拨(2)若一个样本的总偏差平方和为80,残差平方和为60,则R2为.答案:0.25 探究一探究二探究三探究四素养形成当堂检测样本相关系数的应用样本相关系数的应用例1现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的
8、数学成绩y如下表:学生号12345678910 x120 108 117 104 103 110 104 105 99108y84648468696869465771请问:这10名学生的两次数学成绩是否具有线性相相关关系?探究一探究二探究三探究四素养形成当堂检测探究一探究二探究三探究四素养形成当堂检测由此可看出这10名学生的两次数学成绩线性相关.探究一探究二探究三探究四素养形成当堂检测反思感悟 利用样本相关系数判断线性相关的求解策略先计算样本相关系数r的值,再用|r|与0或1比较,进而对变量x与变量y的相关关系作出判断.探究一探究二探究三探究四素养形成当堂检测变式训练1已知两个变量x和y的七组
9、数据如下表:x21232527293235y711212466115325试判断x与y之间是否具有线性相关关系.探究一探究二探究三探究四素养形成当堂检测探究一探究二探究三探究四素养形成当堂检测求经验回归方程求经验回归方程例2某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,建立y关于x的经验回归方程;(3)试根据求出的经验回归方程,预测记忆力为9的同学的判断力.探究一探究二探究三探究四素养形成当堂检测解:(1)散点图如图:探究一探究二探究三探究四素养形成当堂检测探究一探究二探究三探究四素养形成当堂
10、检测反思感悟 1.求经验回归方程:2.利用经验回归方程进行预测:把经验回归方程看作一次函数,求函数值.3.利用经验回归方程判断正、负相关:决定正相关还是负相关的是探究一探究二探究三探究四素养形成当堂检测变式训练2随着我国经济的发展,居民储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20152016201720182019时间代号t12345储 蓄 存 款y/千亿元567810(1)建立y关于t的经验回归方程;(2)用所求经验回归方程预测该地区的居民2020年(t=6)的人民币储蓄存款.探究一探究二探究三探究四素养形成当堂检测解:(1)根据数据画出散点图(略),由散点图
11、可知y与t线性相关.列表计算如下:探究一探究二探究三探究四素养形成当堂检测探究一探究二探究三探究四素养形成当堂检测回归分析回归分析例3某运动员训练次数x与成绩y的数据如下:次数x3033353739444650成绩y3034373942464851(1)作出散点图;(2)建立成绩y关于次数x的经验回归方程;(3)作出残差图;(4)计算R2,并用R2说明拟合效果的好坏.探究一探究二探究三探究四素养形成当堂检测解:(1)该运动员训练次数x与成绩y之间的散点图如图所示,由散点图可知,它们之间具有线性相关关系.探究一探究二探究三探究四素养形成当堂检测探究一探究二探究三探究四素养形成当堂检测(3)某运动
12、员训练次数与成绩之间的数据及相应的残差数据为 残差图如图所示.由图可知,残差比较均匀地分布在横轴的两边,说明选用的模型比较合适.探究一探究二探究三探究四素养形成当堂检测(4)计算得R20.985 5.说明拟合效果较好.反思感悟 1.解答本类题目应先通过散点图来分析两个变量是否线性相关,再利用求经验回归方程的公式求解经验回归方程,并利用残差图或R2来分析模型的拟合效果.2.“R2、残差图”在回归分析中的作用:(1)R2是用来刻画回归效果的,由R2=1-,可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果越好.(2)残差图也是用来刻画回归效果的,判断依据是:残差比较均匀地分布在横轴的两边,
13、说明残差比较符合一元线性回归模型的假定.探究一探究二探究三探究四素养形成当堂检测变式训练3在一段时间内,某种商品的价格x(单位:元)和需求量y(单位:件)之间的一组数据如下:x/元1416182022y/件1210753已知x与y线性相关,求出y关于x的经验回归方程,并用R2说明拟合效果的好坏.探究一探究二探究三探究四素养形成当堂检测探究一探究二探究三探究四素养形成当堂检测探究一探究二探究三探究四素养形成当堂检测求非线性经验回归方程求非线性经验回归方程例4某地区六年来轻工业产品利润总额y(单位:亿元)与年次x的数据如下:年次x123456利润总额y/亿元 11.35 11.85 12.44 1
14、3.07 13.59 14.41由经验知,年次x与利润总额y(单位:亿元)近似有如下关系:y=abxe0.其中a,b均为正数,求y关于x的经验回归方程.探究一探究二探究三探究四素养形成当堂检测解:对y=abxe0两边取自然对数,得ln y=ln ae0+xln b.令z=ln y,则z与x的数据如下表:x123456z2.432.472.522.572.612.67由z=ln ae0+xln b及最小二乘法,得ln b0.049 1,ln ae02.371,探究一探究二探究三探究四素养形成当堂检测反思感悟 非线性经验回归方程的求法 探究一探究二探究三探究四素养形成当堂检测变式训练4某展会一天上
15、午9点半到下午2点的即时参观人数如下表:时间9.51010.51111.51212.51313.514人数y/万12.39 20.02 25.57 30.26 35.77 37.57 40.23 40.95 41.73 43.71已知时间与参观人数具有很强的相关关系,试求出这段时间内即时参观人数关于时间的经验回归方程.探究一探究二探究三探究四素养形成当堂检测解:根据题表中的数据画出散点图如图所示.由图可以看出,样本点分布在某条对数型函数曲线y=a+bln x的周围.令z=ln x,则y=a+bz,故y与z具有线性相关关系.可知y与z的数据如下表:探究一探究二探究三探究四素养形成当堂检测z2.2
16、52.302.352.402.442.482.532.562.602.64人数y/万12.39 20.02 25.57 30.26 35.77 37.57 40.23 40.95 41.73 43.71由表中数据可得y关于z的经验回归方程为 探究一探究二探究三探究四素养形成当堂检测方法优化方法优化求经验回归方程的方法和技巧求经验回归方程的方法和技巧典例某地粮食需求量逐年上升,部分统计数据如下表:年份20112013201520172019需求量/万吨236246257276286(1)利用所给数据求年需求量y关于年份x的经验回归方程;(2)利用(1)中所求出的经验回归方程预测该地2021年的粮
17、食需求量.探究一探究二探究三探究四素养形成当堂检测解:(1)由所给数据看出,年需求量与年份之间具有线性相关关系.下面来求经验回归方程,先将数据处理如下:年份-2015-4-2024需求量-257-21-1101929探究一探究二探究三探究四素养形成当堂检测由上述计算结果,可知所求经验回归方程为(2)利用所求得的经验回归方程,可预测2021年的粮食需求量为6.5(2 021-2 015)+260.2=6.56+260.2=299.2(万吨).探究一探究二探究三探究四素养形成当堂检测方法点睛 求经验回归方程时,重点考查的是计算能力.若本题用一般方法去解,则计算比较烦琐(如年份、需求量不做如上处理)
18、,所以平时训练时遇到数据较大时要考虑有没有更简便的方法解决.探究一探究二探究三探究四素养形成当堂检测跟踪训练某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,根据试验数据得到如图所示的散点图,其中x表示零件的个数,y表示加工时间,则y关于x的经验回归方程是.探究一探究二探究三探究四素养形成当堂检测探究一探究二探究三探究四素养形成当堂检测1.(2020陕西西安高三模拟)北极冰融是近年来最引人注目的气候变化现象之一,白色冰面融化变成颜色相对较暗的海冰,被称为“北极变暗”现象.21世纪以来,北极的气温变化是全球平均水平的2倍,被称为“北极放大”现象.若北极年平均海冰面积(单位:
19、106 km2)与年平均CO2(单位:ppm)浓度图如图所示,则下列说法正确的是()探究一探究二探究三探究四素养形成当堂检测A.北极年海冰面积逐年减少B.北极年海冰面积减少速度不断加快C.北极年海冰面积与年平均二氧化碳浓度大体成负相关D.北极年海冰面积与年平均二氧化碳浓度大体成正相关探究一探究二探究三探究四素养形成当堂检测解析:由统计图可知北极年海冰面积既有增加又有减少,故选项A,B错误;由统计图可知随着年平均二氧化碳浓度增加,北极年海冰面积总体呈下降趋势,所以北极年海冰面积与年平均二氧化碳浓度大体成负相关,故选项C正确,选项D错误.故选C.答案:C探究一探究二探究三探究四素养形成当堂检测2.
20、已知甲、乙、丙、丁四位同学在建立变量x,y的模型时,分别选择了4种不同模型,计算它们的R2分别如下表:学生甲乙丙丁R20.980.780.500.85则建立的模型拟合效果最好的是()A.甲B.乙C.丙 D.丁解析:因为R2的值越大,模型拟合效果越好,所以甲的拟合效果最好.答案:A探究一探究二探究三探究四素养形成当堂检测3.已知一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等),若所有样本点(xi,yi)(i=1,2,n)都在直线y=x+1上,则这组样本数据的样本相关系数为.解析:根据样本相关系数的定义可知,当所有样本点都在一条直线上时,样本相关系数为1
21、.答案:1探究一探究二探究三探究四素养形成当堂检测4.某课题组调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元)的情况,调查结果显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y关于x的经验回归方程为=0.254x+0.321.由经验回归方程可知,家庭年收入每增加1万元,年饮食支出平均约增加万元.解析:设年收入为x1万元,对应的年饮食支出为y1万元,家庭年收入每增加1万元,则年饮食支出平均增加答案:0.254 探究一探究二探究三探究四素养形成当堂检测5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x/个12
22、45加工的时间y/小时2356已知零件的个数x与加工的时间y具有线性相关关系.(2)试预测加工10个零件需要多少时间.探究一探究二探究三探究四素养形成当堂检测8.3.1分类变量与列联表8.3.2独立性检验激趣诱思知识点拨有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和健康之间有因果关系吗?每一个吸烟者的健康问题都是由吸烟引起的吗?“如果你认为健康问题不一定是由吸烟引起的,那么可以吸烟”的说法对吗?要回答这个问题,我们先一起来学习本课时的知识吧!激趣诱思知识点拨一、分类变量与列联表1.分类变量:为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量
23、称为分类变量.2.列联表:在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存.这种形式的数据统计表称为22列联表.22列联表给出了成对分类变量数据的交叉分类频数.激趣诱思知识点拨名师点析制作22列联表的基本步骤第一步,合理选取两个变量,且每一个变量都可以取两个值;第二步,抽取样本,整理数据;第三步,画出22列联表.激趣诱思知识点拨微练习在研究某种药物对“H1N1”病毒的治疗效果时,进行动物试验,得到以下数据:对150只动物服用药物,其中132只动物存活,18只动物死亡,对150只动物进行常规治疗,其中114只动物存活,36只动物死亡.请根据以上数
24、据建立一个22列联表.解:22列联表如下:类别存活数死亡数合计药物治疗13218150常规治疗11436150合计24654300激趣诱思知识点拨二、独立性检验1.22列联表XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d上表是关于分类变量X和Y的抽样数据的22列联表:最后一行的前两个数分别是事件Y=0和Y=1的频数;最后一列的前两个数分别是事件X=0和X=1的频数;中间的四个数a,b,c,d是事件X=x,Y=y(x,y=0,1)的频数;右下角格中的数n是样本容量.激趣诱思知识点拨2.2统计量的计算公式 3.独立性的判断方法 0.10.050.010.00
25、50.001x2.7063.8416.6357.87910.828基于小概率值的检验规则是:当2x时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;当2x时,我们没有充分证据推断H0不成立,可以认为X和Y独立.激趣诱思知识点拨4.独立性检验利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验,读作“卡方独立性检验”,简称独立性检验.激趣诱思知识点拨微练习某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:态度积极支持企业改革 不太赞成企业改革合计工作积极 544094工作一般 326395合计
26、86103189对于人力资源部的研究项目,依据小概率=0.005的独立性检验,分析企业员工工作积极性和对待企业改革态度是否有关联.激趣诱思知识点拨解:零假设为H0:企业的员工工作积极性和对待企业改革的态度无关联.从题表中的数据可知:a=54,b=40,c=32,d=63,a+b=94,c+d=95,a+c=86,b+d=103,n=189,代入公式得依据小概率值=0.005的独立性检验,我们推断H0不成立,即认为员工工作积极性与对待企业改革的态度有关联.探究一探究二素养形成当堂检测独立性检验独立性检验例1某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
27、类型喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100试根据小概率值=0.05的独立性检验,分析南方学生和北方学生在选用甜品的饮食习惯方面是否有差异.探究一探究二素养形成当堂检测解:零假设为H0:南方学生和北方学生在选用甜品的饮食习惯方面无差异.将22列联表中的数据代入公式计算,得依据小概率值=0.05的独立性检验,我们推断H0不成立,即认为南方学生和北方学生在选用甜品的饮食习惯方面有差异.探究一探究二素养形成当堂检测反思感悟 独立性检验的具体做法(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;(2)根据抽样数据整理出22列联表,计算2的值,并与临界值
28、x比较;(3)根据检验规则得出推断结论;(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.探究一探究二素养形成当堂检测变式训练1某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个22列联表;(2)试根据小概率值=0.01的独立性检验,分析对新课程教学模式的赞同情况与教师年龄是否有关联
29、.探究一探究二素养形成当堂检测解:(1)22列联表如下:教师类型赞同不赞同合计老教师101020青年教师24630合计341650(2)零假设为H0:对新课程教学模式的赞同情况与教师年龄无关联.依据小概率值=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为对新课程教学模式的赞同情况与教师年龄无关联.探究一探究二素养形成当堂检测独立性检验的综合应用独立性检验的综合应用例2海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:探究一探究二素养形成当堂检测(1)设两种养殖方法的箱产
30、量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计事件A的概率;(2)填写下面列联表,并依据=0.01的独立性检验,分析箱产量与养殖方法是否有关联;类型箱产量50 kg箱产量50 kg合计旧养殖法新养殖法合计探究一探究二素养形成当堂检测(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:0.0500.0100.001x3.8416.63510.828探究一探究二素养形成当堂检测解:(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.由题意知P(A)=P(BC)
31、=P(B)P(C).旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)5=0.66.故P(C)的估计值为0.66.因此,事件A的概率估计值为0.620.66=0.409 2.探究一探究二素养形成当堂检测(2)零假设为H0:箱产量与养殖方法无关联.根据箱产量的频率分布直方图得如下列联表:类型箱产量50 kg箱产量50 kg合计旧养殖法6238100新养殖法3466100合计96104200根据列联表中的数据,经计算
32、得到 依据=0.01的独立性检验,我们推断H0不成立,即认为箱产量与养殖方法有关联.探究一探究二素养形成当堂检测(3)因为在新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+0.044)5=0.340.5,故新养殖法箱产量的中位数的估计值为反思感悟 两个分类变量相关关系的判断通过22列联表,先计算2的值,再借助2的取值判断两个分类变量是否有关联.探究一探究二素养形成当堂检测变式训练2为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查,并得到了如下的22列联表:性别喜爱打篮球不喜爱打篮球合计男生6女生10合计48已知在全班48人中随机抽
33、取1人,抽到喜爱打篮球的学生的概率为探究一探究二素养形成当堂检测(1)请将上面的22列联表补充完整(不用写计算过程).(2)依据=0.05的独立性检验,能否认为喜爱打篮球与性别有关联?说明你的理由.(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值.探究一探究二素养形成当堂检测解:(1)列联表补充如下:性别喜爱打篮球 不喜爱打篮球合计男生22628女生101020合计321648(2)零假设为H0:喜爱打篮球与性别无关联.根据列联表中的数据,经 依据=0.05的独立性检验,我们推断H0不成立,即认为喜爱打篮球与性别有关联.探究一探究二素养形成当堂检测(3)喜
34、爱打篮球的女生人数X的可能取值为0,1,2.其概率分别为故X的分布列为 探究一探究二素养形成当堂检测独立性检验与统计的综合应用独立性检验与统计的综合应用典例某校为了探索一种新的教学模式,进行了一项课题实验,乙班为实验班,甲班为对比班,甲、乙两班均有50人,一年后对两班进行测试,成绩如下表(总分:150分):甲班成绩80,90)90,100)100,110)110,120)120,130)人数42015101乙班 成绩80,90)90,100)100,110)110,120)120,130)人数11123132探究一探究二素养形成当堂检测(1)现从甲班成绩位于90,120)内的试卷中抽取9份进行
35、试卷分析,请问用什么抽样方法更合理,并写出最后的抽样结果.(2)根据所给数据可估计在这次测试中,甲班的平均分是101.8分,请你估计乙班的平均分,并计算两班平均分的差距.(3)完成下面22列联表,并依据=0.05的独立性检验,分析这两个班在这次测试中成绩的差异与实施课题实验是否有关联,并请说明理由.班别成绩小于100分成绩不小于100分合计甲班a=2650乙班12d=50合计3664100探究一探究二素养形成当堂检测解:(1)用分层随机抽样的方法更合理.甲班成绩位于90,120)内的试 探究一探究二素养形成当堂检测(3)补全列联表如下:班别成绩小于100分成绩不小于100分合计甲班a=2426
36、50乙班12d=3850合计3664100零假设为H0:这两个班在这次测试中成绩的差异与实施课题实验无关联.由表中的数据,依据=0.05的独立性检验,我们推断H0不成立,即认为这两个班在这次测试中成绩的差异与实施课题实验有关联.探究一探究二素养形成当堂检测方法点睛 1.由90,120)内的三组数据存在差异确定抽样方法,从而确定各区间抽样份数.2.累加各组的组中值与频率的积,并计算乙班的平均分,从而得到两班平均分的差.3.根据所给的数据得到22列联表,由列联表中的数据求出2,结合临界值表得出结论.探究一探究二素养形成当堂检测1.(2019天津高二期中)在吸烟与患肺病这两个分类变量中,零假设为H0
37、:吸烟与患肺病无关联.下列说法正确的是()依据=0.05的独立性检验认为吸烟与患肺病有关联时,我们说某人吸烟,他一定患有肺病;从统计量中得知依据=0.05的独立性检验认为吸烟与患肺病有关联,是指不超过0.05的概率使得推断出现错误;如果由2的值得到依据=0.05的独立性检验认为吸烟与患肺病有关联,那么在100个吸烟的人中必有95人患有肺病.A.B.C.D.解析:根据=0.05的独立性检验认为吸烟与患肺病有关联时,指的是不超过0.05的概率使得推断出现错误,故正确;可知错误.故选B.答案:B探究一探究二素养形成当堂检测2.(2019重庆巴蜀中学高二期末)在对人们休闲方式的一次调查中,根据数据建立
38、如下的22列联表:性别看书运动合计男82028女161228合计243256附:0.050.01x3.8416.635A.0.99B.0.95 C.0.01D.0.05 探究一探究二素养形成当堂检测解析:零假设为H0:休闲方式与性别无关联.结合题意和独立性检验的结论,由24.6673.841=x0.05,根据=0.05的独立性检验,我们推断H0不成立,即认为休闲方式与性别有关联.故选D.答案:D 探究一探究二素养形成当堂检测3.(2020湖北高二期末)手机给人们的生活带来便捷,但同时也对中学生的生活和学习造成了严重的影响.某校高一几个学生成立研究性学习小组,就使用手机对学习成绩的影响随机抽取了
39、该校100名学生的期末考试成绩并制成下表,则下列说法正确的是()类别成绩优秀成绩不优秀合计不用手机401050使用手机54550合计45551000.010.0050.001x6.6357.87910.828探究一探究二素养形成当堂检测A.依据=0.001的独立性检验认为使用手机与学习成绩有关联B.依据=0.001的独立性检验认为使用手机与学习成绩无关联C.依据=0.005的独立性检验认为使用手机对学习成绩无影响D.依据=0.01的独立性检验认为使用手机对学习成绩有影响解析:零假设为H0:使用手机与学习成绩无关联.因为 所以依据=0.001的独立性检验,我们推断H0不成立,即认为使用手机与学习
40、成绩有关联.故选A.答案:A 探究一探究二素养形成当堂检测4.(2020广东高三月考)2019年10月18日到27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下表所示:满意度男性运动员 女性运动员 合计对主办方表示满意200220420对主办方表示不满意503080合计250250500探究一探究二素养形成当堂检测现有如下说法:在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为 ;依据=0.01的独立性检验认为对主办方表示
41、满意与运动员的性别有关联;依据=0.01的独立性检验认为对主办方表示满意与运动员的性别无关联.其中正确的个数为()0.10.050.010.001x2.7063.8416.63510.828A.0B.1C.2D.3 探究一探究二素养形成当堂检测答案:B 探究一探究二素养形成当堂检测5.(2019北京师大附中高考模拟)已知某企业有职工5 000人,其中男职工3 500人,女职工1 500人.该企业为了丰富职工的业余生活,决定新建职工活动中心.为此,该企业工会采用分层随机抽样的方法,随机抽取了300名职工每周的平均运动时间(单位:h),汇总得到频率分布表(如表所示),并据此来估计该企业职工每周的运
42、动时间.平均运动时间频数频率0,2)150.052,4)m0.24,6)450.156,8)7550.258,10)900.310,12)pn合计3001探究一探究二素养形成当堂检测(1)求抽取的女职工的人数;(2)根据频率分布表,求出m,n,p的值,补全如图所示的频率分布直方图,并估计该企业职工每周的平均运动时间不低于4 h的概率;运动时间男职工女职工合计平均运动时间低于4 h平均运动时间不低于4 h合计若在样本数据中,有60名女职工每周的平均运动时间不低于4 h,请完成以下22列联表,并说明依据=0.05的独立性检验,能否认为该企业职工每周的平均运动时间不低于4 h与性别有关联.探究一探究
43、二素养形成当堂检测0.250.150.100.050.025x1.3232.0722.7063.8415.024探究一探究二素养形成当堂检测(2)n=1-0.05-0.2-0.15-0.25-0.3=0.05,p=3000.05=15,m=300-15-45-75-90-15=60.频率分布直方图如图:探究一探究二素养形成当堂检测估计该企业职工每周的平均运动时间不低于4 h的概率为P=0.15+0.25+0.3+0.05=0.75=22列联表如下所示:运动时间男职工女职工合计平均运动时间低于4 h453075平均运动时间不低于4 h16560225合计21090300探究一探究二素养形成当堂检
44、测零假设为H0:该企业职工每周的平均运动时间不低于4 h与性别无关联.根据列联表中的数据,经计算得到依据=0.05的独立性检验,我们推断H0不成立,即认为该企业职工每周的平均运动时间不低于4 h与性别有关联.章末复习专题一回归分析 例1某地收集到的新房屋的销售价格y和房屋的面积x的数据如下表:房屋面积x/m211511080135105销售价格y/万元24.821.618.429.222(1)画出数据对应的散点图;(2)若y与x线性相关,建立y关于x的经验回归方程;(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.解:(1)数据对应的散点图如图所示.方法技巧 经验回归方程的求法及
45、应用 变式训练1已知某连锁经营公司的5个零售店某月的销售额和利润额资料如下表:商店名称ABCDE销售额x/千万元35679利润额y/千万元23345(1)画出散点图;(2)根据如下的参考公式与参考数据,建立利润额y与销售额x的经验回归方程;(3)若该公司还有一个零售店某月销售额为10千万元,试估计它的利润额是多少.解:(1)散点图如下.专题二一元线性回归模型分析 例2在研究弹簧伸长长度y(单位:cm)与拉力x(单位:N)的关系时,对不同拉力的6根弹簧进行测量,测得如下表中的数据:x/N51015202530y/cm7.258.128.959.9010.911.8若依据散点图可知x与y线性相关,
46、且由最小二乘法求出的经验回归方程为 =0.18x+6.34,求R2,并利用R2说明拟合效果.解:列表求值如下:方法技巧 一元线性回归模型拟合问题的求解策略在一元线性回归模型中,R2与相关系数r都能刻画模型拟合数据的效果.|r|越大,R2就越大,用模型拟合数据的效果就越好.变式训练2关于x与y有以下数据:x24568y3040605070专题三独立性检验 例3为了调查胃病是否与生活规律有关联,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.(1)根据以上数据列出22列联表
47、;(2)依据=0.005的独立性检验,能否认为40岁以上的人患胃病与生活规律有关联?解:(1)由题意可列22列联表如下:类型患胃病未患胃病合计生活规律20200220生活不规律60260320合计80460540(2)零假设为H0:40岁以上的人患胃病与生活规律无关联.根据列联表得依据=0.005的独立性检验,我们推断H0不成立,即认为40岁以上的人患胃病和生活规律有关联.方法技巧 独立性检验的一般步骤(1)根据样本数据制成22列联表;(2)根据公式计算2;(3)比较2与临界值x的大小关系,得到推断结论.变式训练3为了解某班学生喜爱打篮球是否与性别有关联,对本班50人进行问卷调查得到了如下的列联表:性别喜爱打篮球不喜爱打篮球合计男生5女生10合计50已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为0.6.(1)请将上面的列联表补充完整(不用写计算过程).(2)依据=0.01的独立性检验,能否认为喜爱打篮球与性别有关联?说明你的理由.解:(1)依题意可知喜爱打篮球的学生的人数为500.6=30.列联表补充如下:性别喜爱打篮球不喜爱打篮球合计男生20525女生101525合计302050(2)零假设为H0:喜爱打篮球与性别无关联.根据列表中的数据,经计性检验,我们推断H0不成立,即认为喜爱打篮球与性别有关联.