2020版高考数学大一轮复习第十一章统计与统计案例11.3变量间的相关关系、统计案例课件.pptx

上传人(卖家):三亚风情 文档编号:2548212 上传时间:2022-05-03 格式:PPTX 页数:95 大小:3.44MB
下载 相关 举报
2020版高考数学大一轮复习第十一章统计与统计案例11.3变量间的相关关系、统计案例课件.pptx_第1页
第1页 / 共95页
2020版高考数学大一轮复习第十一章统计与统计案例11.3变量间的相关关系、统计案例课件.pptx_第2页
第2页 / 共95页
2020版高考数学大一轮复习第十一章统计与统计案例11.3变量间的相关关系、统计案例课件.pptx_第3页
第3页 / 共95页
2020版高考数学大一轮复习第十一章统计与统计案例11.3变量间的相关关系、统计案例课件.pptx_第4页
第4页 / 共95页
2020版高考数学大一轮复习第十一章统计与统计案例11.3变量间的相关关系、统计案例课件.pptx_第5页
第5页 / 共95页
点击查看更多>>
资源描述

1、11.3变量间的相关关系、统计案例第十一章统计与统计案例ZUIXINKAOGANG最新考纲1.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.通过对典型案例的探究,了解独立性检验的基本思想、方法及其初步应用.4.通过对典型案例的探究,进一步了解回归分析的基本思想、方法及简单应用.NEIRONGSUOYIN内容索引基础知识 自主学习题型分类 深度剖析课时作业1基础知识 自主学习PART ONE(1)正相关在散点图中,点散布在从_到_

2、的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从_到_的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在_,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.1.两个变量的线性相关知识梳理ZHISHISHULIZHISHISHULI左下角右上角左上角右下角一条直线附近2.回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的_的方法叫做最小二乘法.(2)回归方程距离的平方和最小3.回归分析(1)定义:对具有_的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关

3、系的数据(x1,y1),(x2,y2),(xn,yn),其中( )称为样本点的中心.(3)相关系数当r0时,表明两个变量_;当r0时,正相关;当r0时,正相关;当 0时,负相关.思维升华跟踪训练1(1)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线y x1上,则这组样本数据的样本相关系数为A.1 B.0 C. D.1解析完全的线性关系,且为负相关,故其相关系数为1,故选A.(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为_.x,y是负相关关系;在该相关关系中,若用y拟合时

4、的相关指数为,用 拟合时的相关指数为,则;x,y之间不能建立线性回归方程.21ec xc解析在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故正确;x,y之间可以建立线性回归方程,但拟合效果不好,故错误.21ec xc题型二回归分析命题点1线性回归分析多维探究多维探究例2下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码17分别对应年份20112017.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.解

5、由折线图中数据和附注中参考数据得(2)建立y关于t的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.附注:所以预测2019年我国生活垃圾无害化处理量约为1.83亿吨.命题点2非线性回归例3某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.46.65636.8289.81.61 469108.8(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判

6、断即可,不必说明理由)解由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型.(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?解由(2)知,当x49时,根据(2)的结果知,年利润z的预报值故年宣传费为46.24千元时,年利润的预报值最大.回归分析问题的类型及解题方法(1)求回归方程根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关.利用公式,求出回归系数 .待定系数法:利用

7、回归直线过样本点的中心求系数 .(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数 .(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.思维升华跟踪训练2(2018全国)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型: 30.413.5t;根据2010年至2016年的数据(时间变量t

8、的值依次为1,2,7)建立模型:9917.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;解利用模型,可得该地区2018年的环境基础设施投资额的预测值为 30.413.519226.1(亿元).利用模型,可得该地区2018年的环境基础设施投资额的预测值为 9917.59256.5(亿元).(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解利用模型得到的预测值更可靠.理由如下:()从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资

9、额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型 9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠.题型三独立性检验师生共研师生共研例4(2017全国)海水养殖场进行某水

10、产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;解旧养殖法的箱产量低于50 kg的频率为(0.0120.0140.0240.0340.040)50.62.因此,事件A的概率估计值为0.62.(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50 kg箱产量50 kg旧养殖法 新养殖法 解根据箱产量的频率分布直方图得列联表如下:箱产量6.635,故有99%的把握认为箱产量与养殖方法有关.(3)根据箱产量的频率分布直

11、方图,对两种养殖方法的优劣进行比较.附:P(K2k0)0.0500.0100.001k03.8416.63510.828解箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.(1)比较几个分类变量有关联的可能性大小的方法通过计算K2的大小判断:K2越大,两变量有关联的可能性越大.通过计算|adbc|的大小判断:|adbc|越大,两变量有关联的可能性越大.(2)独

12、立性检验的一般步骤根据样本数据制成22列联表.比较k与临界值的大小关系,做统计推断.思维升华跟踪训练3微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中有 是青年人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出22列联表:青年人中年人总计经常使用微信 不经常使用微信 总计 解由已知可得

13、,该公司员工中使用微信的有20090%180(人).经常使用微信的有18060120(人),使用微信的人中青年人有18075%135(人),故22列联表如下:青年人中年人总计经常使用微信8040120不经常使用微信55560总计13545180(2)根据22列表中的数据利用独立性检验的方法判断是否有99.9%的把握认为“经常使用微信与年龄有关”?P(K2k0)0.0100.001k06.63510.828由于13.33310.828,所以有99.9%的把握认为“经常使用微信与年龄有关”.数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,形成知识的过程.主要包括

14、:收集数据、整理数据、提取信息、构建模型对信息进行分析、推断、获得结论.核心素养之数据分析HEXINSUYANGZHISHUJUFENXIHEXINSUYANGZHISHUJUFENXI线性回归方程及其应用例某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20062008201020122014需求量/万吨236246257276286解由所给数据看出,年需求量与年份之间近似直线上升,下面来求线性回归方程,先将数据处理如下表.年份201042024需求257211101929(2)利用(1)中所求出的线性回归方程预测该地2019年的粮食需求量.解利用所求得的线性回归方程,可预测2019

15、年的粮食需求量大约为6.5(20192010)260.26.59260.2318.7(万吨).素养提升例题中利用所给数据求回归方程的过程体现的就是数据分析素养.3课时作业PART THREE1.已知变量x和y满足关系 0.1x1,变量y与z正相关.下列结论中正确的是A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关基础保分练12345678910111213141516所以x与z负相关.故选C.123456789101112131415162.(2018湖南省五市十校联考)下表提供了某工厂节能降耗技术改造后,一种产品的产

16、量x(单位:吨)与相应的生产能耗y(单位:吨)的几组对应数据:根据上表提供的数据,求得y关于x的线性回归方程为 0.7x0.35,那么表格中t的值为A.3 B.3.15 C.3.25 D.3.5x/吨3456y/吨2.5t44.512345678910111213141516解得t3.123456789101112131415163.(2018广东省百校联盟联考)下表是我国某城市在2017年1月份至10月份期间各月最低温度与最高温度(单位:)的数据一览表.已知该城市的各月最低温与最高温具有相关关系,根据该一览表,则下列结论错误的是A.最低温度与最高温度为正相关B.每月最高温度与最低温度的平均值

17、在前8个月逐月增加C.月温差(最高温度减最低温度)的最大值出现在1月D.1月至4月的月温差(最高温度减最低温度)相对于7月至10月,波动性更大月份12345678910最高温度/59911172427303121最低温度/123127171923251012345678910111213141516解析将最高温度、最低温度、温差列表如下:由表格可知,最低温度大致随最高温度的升高而升高,A正确;每月最高温度与最低温度的平均值在前8个月不是逐月增加,B错误;月温差的最大值出现在1月,C正确;1月至4月的月温差相对于7月至10月,波动性更大,D正确.月份12345678910最高温度/5991117

18、2427303121最低温度/1231271719232510温差度/1712813107876114.对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i1,2,8),其线性回归方程是 ,且x1x2x3x82(y1y2y3y8)6,则实数 的值是123456789101112131415165.(2018惠州调研)某商场为了了解毛衣的月销售量y(单位:件)与月平均气温x(单位:)之间的关系,随机统计了某4个月的销售量与当月平均气温,其数据如下表:由表中数据算出线性回归方程 中的 2,气象部门预测下个月的平均气温为6 ,据此估计该商场下个月毛衣销售量为A.46 件 B.40 件 C.

19、38 件 D.58 件12345678910111213141516月平均气温x/171382月销售量y/件24334055123456789101112131415166.(2018开封模拟)下列说法错误的是A.回归直线过样本点的中心( )B.线性回归方程对应的直线 至少经过其样本数据点(x1,y1),(x2,y2), ,(xn,yn)中的一个点C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好1234567891011121314151612345678910111213141516解析回归直线必过

20、样本点的中心,A正确;由残差分析可知残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,C正确;在回归分析中,R2越接近于1,模拟效果越好,D正确;但不一定经过样本的数据点,所以B错误,故选B.7.某市居民20102014年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_相关关系.(填“正”或“负”)12345678910111213141516年份20102011201220132014收入x11.512.11313.315支出y6.88.89.8101213正解析中位数是13.由

21、相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系.123456789101112131415168.某公司为确定明年投入某产品的广告支出,对近5年的年广告支出m与年销售额t(单位:百万元)进行了初步统计,得到下列表格中的数据:经测算,年广告支出m与年销售额t满足线性回归方程 6.5m17.5,则p_.年广告支出m24568年销售额t3040p507060123456789101112131415169.以下四个命题,其中正确的序号是_.从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机

22、变量相关性越强,则相关系数的绝对值越接近于1;在线性回归方程 0.2x12中,当解释变量x每增加一个单位时,预报变量 平均增加0.2个单位;对分类变量X与Y的统计量K2来说,K2越小,“X与Y有关系”的把握程度越大.解析是系统抽样;对于,统计量K2越小,说明两个相关变量有关系的把握程度越小.1234567891011121314151610.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示22列联表:理科文科总计男131023女72027总计20305095%因为4.8443.841,所以有95%的把握认为选修文科与性别有关.123456789101112131

23、415161234567891011121314151611.某地区2009年至2015年农村居民家庭人均纯收入y(单位:千元)的数据如下表:(1)求y关于t的线性回归方程;年份2009201020112012201320142015年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9123456789101112131415161234567891011121314151612345678910111213141516(2)利用(1)中的线性回归方程,分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入.12

24、345678910111213141516故2009年至2015年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.故预测该地区2019年农村居民家庭人均纯收入为7.8千元.12.某省会城市地铁将于2019年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:12345678910111213141516月收入(单位:百元)15,25)25,35)35,45)45,55)55,65)65,75赞成定价者人数123534认为价格偏高者人数4812521(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”

25、与“认为价格偏高者”的月平均收入的差异是多少(结果保留2位小数);12345678910111213141516解“赞成定价者”的月平均收入为“认为价格偏高者”的月平均收入为“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1x250.5638.7511.81(百元).(2)由以上统计数据填下面22列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.12345678910111213141516月收入不低于55百元的人数月收入低于55百元的人数总计认为价格偏高者 赞成定价者 总计 P(K2k0)0.050.01k03.8416.6351234567891

26、0111213141516解根据条件可得22列联表如下:没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.月收入不低于55百元的人数月收入低于55百元的人数总计认为价格偏高者32932赞成定价者71118总计104050技能提升练1234567891011121314151613.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下: 性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;12345678910111213141516123456789101112131

27、41516(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?因为9.9676.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.12345678910111213141516(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:P(K2k0)0.0500.0100.001k03.8416.63510.82812345678910111213141516解由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在

28、调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样方法更好.1234567891011121314151614.如图是某企业2010年至2016年的污水净化量(单位:吨)的折线图.注:年份代码17分别对应年份20102016.(1)由折线图看出,可用线性回归模型拟合y和t的关系,请用相关系数加以说明;解由折线图中的数据得,因为y与t的相关系数近似为0.94,说明y与t的线性相关程度相当大,所以可以用线性回归模型拟合y与t的关系.12345678910111213141516(2)建立y关于t的回归方程,预测2019年该企业的污水净化量;所以

29、预测2019年该企业污水净化量约为58.5吨.12345678910111213141516(3)请用数据说明回归方程预报的效果.1234567891011121314151612345678910111213141516所以“污水净化量的差异”有87.5%是由年份引起的,这说明回归方程预报的效果是良好的.拓展冲刺练1234567891011121314151612345678910111213141516解析令tx2,则曲线的回归方程变为线性的回归方程,1234567891011121314151616.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的 ,男生喜欢韩剧的人数占男生人数的 ,女生喜欢韩剧的人数占女生人数的 .若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有_人.P(K2k0)0.0500.0100.001k03.8416.63510.8281812345678910111213141516解设男生人数为x,由题意可得列联表如下:喜欢韩剧不喜欢韩剧总计男生x女生总计若有95%的把握认为是否喜欢韩剧和性别有关,则k3.841,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中 > 数学 > 高考专区 > 一轮复习
版权提示 | 免责声明

1,本文(2020版高考数学大一轮复习第十一章统计与统计案例11.3变量间的相关关系、统计案例课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|