2021新高考数学二轮复习:专题六 6.4.1 统计与统计案例.pptx

上传人(卖家):小豆芽 文档编号:942643 上传时间:2020-12-11 格式:PPTX 页数:60 大小:3.34MB
下载 相关 举报
2021新高考数学二轮复习:专题六 6.4.1 统计与统计案例.pptx_第1页
第1页 / 共60页
2021新高考数学二轮复习:专题六 6.4.1 统计与统计案例.pptx_第2页
第2页 / 共60页
2021新高考数学二轮复习:专题六 6.4.1 统计与统计案例.pptx_第3页
第3页 / 共60页
2021新高考数学二轮复习:专题六 6.4.1 统计与统计案例.pptx_第4页
第4页 / 共60页
2021新高考数学二轮复习:专题六 6.4.1 统计与统计案例.pptx_第5页
第5页 / 共60页
点击查看更多>>
资源描述

1、6.4.16.4.1 统计与统计案例统计与统计案例 第三部分第三部分 2021 内 容 索 引 01 02 必备知识必备知识 精要梳理精要梳理 关键能力关键能力 学案突破学案突破 必备知识必备知识 精要梳理精要梳理 1.变量间的相关关系变量间的相关关系 (1)如果散点图中的点从整体上看大致分布在一条直线的附近如果散点图中的点从整体上看大致分布在一条直线的附近,那么我们说那么我们说 变量变量x和和y具有线性相关关系具有线性相关关系. (2)线性回归方程线性回归方程:若变量若变量x与与y具有线性相关关系具有线性相关关系,有有n个样本数据个样本数据 (xi,yi)(i=1,2,n),则回归方程为 =

2、 b x+ , 其中 = =1 (-)(-) =1 (-)2 = =1 - =1 2-2 , = . (3)相关系数:r= ,当r0时,表示两个变量正相关;当 r0时,表示两个变量负相关.|r|越接近1,表明两个变量相关性越强;当|r|接近 0时,表明两个变量几乎不存在相关性. =1 - ( =1 2-2)( =1 2-2) 2.独立性检验独立性检验 对于取值分别是对于取值分别是x1,x2和和y1,y2的分类变量的分类变量X和和Y,其样本频数列联表是其样本频数列联表是: y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d n 随机变量 K2= (-)2 (+)(

3、+)(+)(+),其中 n=a+b+c+d. 关键能力关键能力 学案突破学案突破 热点一热点一 样本的数字特征的应用样本的数字特征的应用 【例1】(2019全国,文19)某行业主管部门为了解本行业中小企业的生 产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一 季度产值增长率y的频数分布表. y的分组 -0.20,0) 0,0.20) 0.20,0.40) 0.40,0.60) 0.60,0.80) 企业数 2 24 53 14 7 (1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长 的企业比例; (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中

4、的数据用 该组区间的中点值为代表).(精确到0.01) 附: 748.602. 解 (1)根据产值增长率频数分布表得,所调查的 100 个企业中产值增长率不 低于40%的企业频率为14+7 100 =0.21.产值负增长的企业频率为 2 100=0.02.用样本 频率分布估计总体分布得这类企业中产值增长率不低于 40%的企业比例为 21%,产值负增长的企业比例为 2%. (2) = 1 100(-0.102+0.1024+0.3053+0.5014+0.707)=0.30, s2= 1 100 =1 5 ni(yi-y)2= 1 100(-0.40) 22+(-0.20)224+0253+0.

5、20214+0.4027 =0.029 6,s= 0.029 6=0.02 74 0.17. 所以,这类企业产值增长率的平均数与标准差的估计值分别为 30%,17%. 解题心得(1)在预测总体数据的平均值时,常用样本数据的平均值估计,从 而做出合理的判断. (2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕 平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定. 【对点训练1】(2020辽宁辽南协作校二模,18)数据的收集和整理在当今 社会起到了举足轻重的作用,它用统计的方法来帮助人们分析以往的经验 数据,进而指导人们接下来的行动.某支足球队的主教练打算从预备球员

6、甲、 乙两人中选一人为正式球员,他收集了甲、乙两名球员近期5场比赛的传 球成功次数,如下表: 场次 第一场 第二场 第三场 第四场 第五场 甲 28 33 36 38 45 乙 39 31 43 39 33 (1)根据这两名球员近期5场比赛的传球成功次数,完成茎叶图(茎表示十位, 叶表示个位);分别在平面直角坐标系中画出两名球员的传球成功次数的散 点图; (2)求出甲、乙两名球员近期5场比赛的传球成功次数的平均值和方差; (3)主教练根据球员每场比赛的传球成功次数分析出球员在场上的积极程 度和技术水平,同时根据多场比赛的数据也可以分析出球员的状态和潜力. 你认为主教练应选哪位球员?并说明理由.

7、 解 (1)茎叶图如图 散点图如图: (2)甲= 28+33+36+38+45 5 =36, 乙= 39+31+43+39+33 5 =37, 甲 2 = 1 5(28-36) 2+(33-36)2+(36-36)2+(38-36)2+(45-36)2=1 5(64+9+0+4+81) =158 5 =31.6, 乙 2 = 1 5(39-37) 2+(31-37)2+(43-37)2+(39-37)2+(33-37)2=1 5(4+36+36+4+16) =96 5 =19.2. (3)选乙比较好,理由如下:由(2)可知,甲 乙 2 ,说明乙在场上的积 极程度和技术水平高于甲,且比较稳定,所

8、以选择乙比较好. 热点二热点二 线性回归分析线性回归分析 【例2】改革开放以来,我国经济持续高速增长.如图给出了我国2003年至 2012年第二产业增加值与第一产业增加值的差值(以下简称为:产业差值) 的折线图,记产业差值为y(单位:万亿元). 注:年份代码 110 分别对应年份 20032012 (1)求出y关于年份代码t的线性回归方程; (2)利用(1)中的回归方程,分析2003年至2012年我国产业差值的变化情况, 并预测我国产业差值在哪一年约为34万亿元; (3)结合折线图,试求出除去2007年产业差值后剩余的9年产业差值的平均 值及方差(结果精确到0.1). 附:回归直线的斜率和截距

9、的最小二乘法估计公式分别为: = i=1 n (-)(-) =1 (-)2 , = . 样本方差公式:s2=1 =1 (yi-)2. 参考数据: = 1 10 =1 10 yi=10.8, =1 10 (ti-)(yi-)=132, =1 10 (yi-)2=211.6. 解 (1) = 1 10(1+2+3+9+10)=5.5, =1 10 (ti-t)2=(t1-t)2+(t10-t)2=(1-5.5)2+(2-5.5)2+(10-5.5)2 =2(4.52+3.52+2.52+1.52+0.52)=82.5, b = =1 10 (-)(-) =1 10 (-)2 = 132 82.5=

10、1.6, = =10.8-1.65.5=2, 所以回归方程 =1.6t+2. (2)由(1)知 =1.60,故 2003 年至 2012 年我国产业差值逐年增加,平均每年增 加 1.6 万亿元.令 1.6t+2=34,解得 t=20.故预测在 2022 年我国产业差值为 34 万亿元. (3)结合折线图,2007 年产业差值为 10.8 万亿元,除去 2007 年(t=5 时)产业差 值外的 9 年的产业差值平均值为1 9 (1010.8-10.8)=10.8.又因为 =1 10 (yi-)2=211.6,所以除去2007年(t=5时)产业差值外的9年的产业差值的方 差为1 9 211.6-(

11、10.8-10.8)223.5. 解题心得线性回归分析问题的类型及解题方法 1.求回归直线方程: 2.对变量值预测对变量值预测: (1)若已知回归直线方程若已知回归直线方程(方程中无参数方程中无参数),进而预测时进而预测时,可以直接将数值代入可以直接将数值代入 求得特定要求下的预测值求得特定要求下的预测值; (2)若回归直线方程中有参数若回归直线方程中有参数,则根据回归直线一定经过点则根据回归直线一定经过点( ),求出参数求出参数 值值,得到回归直线方程得到回归直线方程,进而完成预测进而完成预测. , 【对点训练2】(2020河北石家庄模拟,19)下表是我国大陆地区从2013年 至2019年国

12、内生产总值(GDP)近似值(单位:万亿元人民币)的数据表格: 年份 2013 2014 2015 2016 2017 2018 2019 年份代号x 1 2 3 4 5 6 7 中国大陆地区 GDP:y(单位:万 亿元人民币) 59.3 64.1 68.6 74.0 82.1 90.0 99.1 以 x 为解释变量,y 为预报变量,若以 y=b1x+a1为回归方程,则相关指数 1 20.980 8;若以 y=a2+b2ln x 为回归方程,则相关指数220.845 7. (1)判断y=b1x+a1与y=a2+b2ln x哪一个更适宜作为国内生产总值(GDP)近 似值y关于年份代号x的回归方程,

13、并说明理由; (2)根据(1)的判断结果及表中数据,求出y关于年份代号x的回归方程(系数 精确到0.01); (3)党的十九大报告中指出:从2020年到2035年,在全面建成小康社会的基 础上,再奋斗15年,基本实现社会主义现代化.若到2035年底我国人口增长 为14.4亿人,假设到2035年世界主要中等发达国家的人均国民生产总值的 频率直方图如图所示. 以(2)的结论为依据,预测我国在2035年底人均国民生产总值是否可以超过 假设的2035年世界主要中等发达国家的人均国民生产总值平均数的估计 值. 参考数据: =1 7 yi=537.2, i=1 7 xiyi=2 333.5. 参考公式:回

14、归方程 = x+ 中斜率和截距的最小二乘估计公式分别为: = =1 (-)(-) =1 (-)2 = =1 - =1 2-2 , = . 解 (1)由 0.980 80.845 7,可得 y=b1x+a1更适宜作为 x 为解释变量 y 为预报 变量的回归方程. (2) = 1+2+3+4+5+6+7 7 =4, = 2 333.5-74537.2 7 140-112 = 2 333.5-2 148.8 28 = 184.7 28 6.60, a = 537.2 7 184.7 28 4=352.5 7 50.36,所以以 x 为解释变量 y 为预报变量的回归 方程为 =6.60 x+50.36

15、. (3)到2035年底对应的年份代号为23,由(2)的回归方程 =6.60 x+50.36得我 国国内生产总值约为6.6023+50.36=202.16(万亿元人民币),又14.04,所以 到2035年底我国人均国民生产总值约为14.04万元人民币,由直方图,假设 的2035年世界主要中等发达国家的人均国民生产总值平均数的估计值为 7.50.3+12.50.35+17.50.2+22.50.1+27.50.05=13.75,又 13.750.75,所以 y 与 x 具有较强的线性相关关系. (2)由(1)得b = 6 20=0.3, =4-0.35=2.5,所以线性回归方程为 =0.3x+2

16、.5.当 x=7 时, =0.37+2.5=4.6,即当 A 指标为 7 时,B 指标的估计值为 4.6. (3)由题得(-3s,+3s)=(-1,11),因为 1311,所以该城市的交通管理部门需要 进行治理. 热点五热点五 独立性检验独立性检验 【例5】(2020河北衡水中学高三调研,19)某城市先后采用甲、乙两种方 案治理空气污染各一年,各自随机抽取一年(365天)内100天的空气质量指 数API的检测数据进行分析,若空气质量指数值在0,300内为合格,否则为 不合格.表1是甲方案检测数据样本的频数分布表,如图是乙方案检测数据 样本的频率分布直方图. 表1: API值 0,50 (50,

17、100 (100,150 (150,200 (200,250 (250,300 大于 300 天数 9 13 19 30 14 11 4 (1)将频率视为概率,求乙方案样本的频率分布直方图中a的值,以及乙方案 样本的空气质量不合格天数; (2)求乙方案样本的中位数; (3)填写下面22列联表(表2),并根据列联表判断是否有90%的把握认为该 城市的空气质量指数值与两种方案的选择有关. 表2: 甲方案 乙方案 合计 合格天数 不合格天数 合计 附:K2= (-)2 (+)(+)(+)(+) P(K2k) 0.10 0.05 0.025 k 2.706 3.841 5.024 解 (1)由频率分布

18、直方图知,(0.001 0+0.003 0+0.004 0+0.005 0+0.003 0 +0.001 8+a)50=1,解得a=0.002 2, 乙方案样本中不合格天数为0.002 250100=11(天); (2)根据题中的频率分布直方图,得(0.001 0+0.003 0+0.004 0)50=0.4, 又0.005 050=0.25,0.4+0.25=0.65,中位数在(150,200之间,设中位 数为x,则0.4+(x-150)0.005 0=0.5,解得x=170,乙方案样本的中位数为 170; (3)由题意填写22列联表如下, 甲方案 乙方案 合计 合格天数 96 89 185

19、 不合格天数 4 11 15 合计 100 100 200 由表中数据,计算 K2的观测值 k=200(9611-894) 2 10010018515 3.532, 3.5322.706,有90%的把握认为该城市的空气质量指数值与两种方案 的选择有关. 解题心得有关独立性检验的问题解题步骤:(1)作出22列联表;(2)计算随 机变量K2的值;(3)查临界值,检验作答. 【对点训练5】(2020山东,19)为加强环境保护,治理空气污染,环境监测部 门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓 度(单位:g/m3),得下表: SO2 PM2.5 0,50 (50,150

20、 (150,475 0,35 32 18 4 (35,75 6 8 12 (75,115 3 7 10 (1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150” 的概率; (2)根据所给数据,完成下面的22列联表: SO2 PM2.5 0,150 (150,475 0,75 (75,115 (3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5 浓度与SO2浓度有关? 附:K2= (-)2 (+)(+)(+)(+), P(K2k) 0.050 0.010 0.001 k 3.841 6.635 10.828 解 (1)根据抽查数据,该市100天空气中PM2.5浓度不超过75,且SO2浓度 不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不 超过75,且SO2浓度不超过150的概率的估计值为 64 100=0.64. (2)根据抽查数据,可得22列联表: SO2 PM2.5 0,150 (150,475 0,75 64 16 (75,115 10 10 (3)根据(2)的列联表得 K2的观测值 k=100(6410-1610) 2 80207426 7.484. 由于7.4846.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓 度有关.

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中 > 数学 > 高考专区 > 二轮专题
版权提示 | 免责声明

1,本文(2021新高考数学二轮复习:专题六 6.4.1 统计与统计案例.pptx)为本站会员(小豆芽)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|