8.1成对数据的统计相关性8.2一元线性回归模型及其应用(教学课件)-高中数学人教A版(2019)选择性必修第三册.ppt

上传人(卖家):四川天地人教育 文档编号:1667884 上传时间:2021-08-20 格式:PPT 页数:58 大小:2.70MB
下载 相关 举报
8.1成对数据的统计相关性8.2一元线性回归模型及其应用(教学课件)-高中数学人教A版(2019)选择性必修第三册.ppt_第1页
第1页 / 共58页
8.1成对数据的统计相关性8.2一元线性回归模型及其应用(教学课件)-高中数学人教A版(2019)选择性必修第三册.ppt_第2页
第2页 / 共58页
8.1成对数据的统计相关性8.2一元线性回归模型及其应用(教学课件)-高中数学人教A版(2019)选择性必修第三册.ppt_第3页
第3页 / 共58页
8.1成对数据的统计相关性8.2一元线性回归模型及其应用(教学课件)-高中数学人教A版(2019)选择性必修第三册.ppt_第4页
第4页 / 共58页
亲,该文档总共58页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、8.1成对数据的统计相关性 8.2一元线性回归模型及其应用 本资料分享自千人教师 QQ群483122854,期待 你的加入与分享 你知道“乌鸦叫,没好兆”这样的迷信说法的原因吗?日常生活中类 似这样的谚语,如“名师出高徒”“龙生龙,凤生凤,老鼠的孩子会打洞” 又能说明什么样的相关关系呢? 一、变量的相关关系 1.相关关系:两个变量有关系,但又没有确切到可由其中的一个去精 确地决定另一个的程度,这种关系称为相关关系. 2.散点图:将样本中的每一个序号下的成对样本数据都用直角坐标 系中的点表示出来,由这些点组成的统计图叫做散点图. 3.正相关与负相关:如果从整体上看,当一个变量的值增加时,另一 个

2、变量的相应值也呈现增加的趋势,我们就称这两个变量正相关; 如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势, 则称这两个变量负相关. 4.线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而 且散点落在一条直线附近,我们就称这两个变量线性相关. 5.非线性相关:一般地,如果两个变量具有相关性,但不是线性相关, 那么我们就称这两个变量非线性相关或曲线相关. 微练习 下列两个变量具有相关关系的是() A.角度和它的余弦值B.正方形的边长和面积 C.人的年龄与身高 D.人的身高和体重 解析:A,B具有确定性的函数关系;C无相关关系;一般地,身高越高, 体重越重,是相关关系.故选D.

3、答案:D 微思考 相关关系与函数关系有什么异同点? 提示:相同点:两者均是指两个变量的关系. 不同点:函数关系是一种确定的关系,如圆的面积S与半径r的关系, 它可以用函数关系式S=r2来表示;相关关系是一种非确定的关系, 如人的体重y与身高x有关,一般来说,身高越高,体重越重,但不能用 一个函数关系式来严格地表示它们之间的关系.函数关系是两个非 随机变量的关系,而相关关系是非随机变量与随机变量之间的关 系.函数关系是一种因果关系,而相关关系不一定是因果关系,也 可能是伴随关系. 二、样本相关系数 对于变量x和变量y,设经过随机抽样获得的成对样本数据为 (x1,y1),(x2,y2),(xn,y

4、n),其中x1,x2,xn和y1,y2,yn的均值分别为 我们称r为变量x和变量y的样本相关系数. 名师点析样本相关系数r的性质 (1)当r0时,称成对数据正相关;当r0时,称成对数据负相关. (2)当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时, 成对数据的线性相关程度越弱. (3)样本相关系数r的取值范围为-1,1. 微练习 对于样本相关系数r,叙述正确的是() A.|r|(0,+),|r|越大,相关程度越强,反之,相关程度越弱 B.r(-,+),r越大,相关程度越强,反之,相关程度越弱 C.|r|1,|r|越接近于1,相关程度越强;|r|越接近于0,相关程度越弱 D.

5、以上说法都不对 解析:由样本相关系数的性质知,r-1,1,排除A,B;|r|越接近于1,相 关程度越强,|r|越接近于0,相关程度越弱,故选C. 答案:C 三、一元线性回归模型 我们称该式为Y关于x的一元线性回归模型.其 中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型 的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随 机误差.如果e=0,那么Y与x之间的关系就可用一元线性函数模型来 描述. 四、一元线性回归模型参数的最小二乘估计 1.经验回归方程 2.残差与残差分析 对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方 程得到的 称为预测值,观测值

6、减去预测值称为残差.残差是随机 误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果, 以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分 差. 3.在残差图中,当残差比较均匀地分布在横轴的两边,说明残差比较 符合一元线性回归模型的假定,是均值为0、方差为2的随机变量 的观测值.可见,通过观察残差图就可以直观判断模型是否满足一 元线性回归模型的假设. 微思考 在回归分析中,利用经验回归方程求出的值一定是真实值吗?为什 么? 提示:不一定是真实值.利用经验回归方程求出的值,在很多时候只 是预测值,例如,人的体重与身高存在一定的线性相关关系,但体重 除了受身高的影响外,还受其他因素的

7、影响,如饮食、是否喜欢运 动等. 微练习 (1)如果记录了x,y的几组数据分别为(0,1),(1,3),(2,5),(3,7),那么y关于 x的经验回归直线必过点() A.(2,2) B.(1.5,2) C.(1,2) D.(1.5,4) 经验回归直线必过点(1.5,4). 答案:D (2)若一个样本的总偏差平方和为80,残差平方和为60,则R2为 . 答案:0.25 样本相关系数的应用样本相关系数的应用 例1现随机抽取了某中学高一10名在校学生,他们入学时的数学成 绩x与入学后第一次考试的数学成绩y如下表: 学生号12345678910 x120 108 117 104 103 110 10

8、4 105 99108 y84648468696869465771 请问:这10名学生的两次数学成绩是否具有线性相相关关系? 由此可看出这10名学生的两次数学成绩线性相关. 反思感悟 利用样本相关系数判断线性相关的求解策略 先计算样本相关系数r的值,再用|r|与0或1比较,进而对变量x与变量 y的相关关系作出判断. 变式训练1已知两个变量x和y的七组数据如下表: x21232527293235 y711212466115325 试判断x与y之间是否具有线性相关关系. 求经验回归方程求经验回归方程 例2某研究机构对高三学生的记忆力x和判断力y进行统计分析,得 下表数据: x681012 y235

9、6 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,建立y关于x的经验回归方程; (3)试根据求出的经验回归方程,预测记忆力为9的同学的判断力. 解:(1)散点图如图: 反思感悟 1.求经验回归方程: 2.利用经验回归方程进行预测:把经验回归方程看作一次函数,求函 数值. 3.利用经验回归方程判断正、负相关:决定正相关还是负相关的是 变式训练2随着我国经济的发展,居民储蓄存款逐年增长.设某地区 城乡居民人民币储蓄存款(年底余额)如下表: 年份20152016201720182019 时间代号t12345 储 蓄 存 款 y/千亿元 567810 (1)建立y关于t的经验回归方程;

10、(2)用所求经验回归方程预测该地区的居民2020年(t=6)的人民币储 蓄存款. 解:(1)根据数据画出散点图(略),由散点图可知y与t线性相关.列表计 算如下: 回归分析回归分析 例3某运动员训练次数x与成绩y的数据如下: 次数x3033353739444650 成绩y3034373942464851 (1)作出散点图; (2)建立成绩y关于次数x的经验回归方程; (3)作出残差图; (4)计算R2,并用R2说明拟合效果的好坏. 解:(1)该运动员训练次数x与成绩y之间的散点图如图所示,由散点 图可知,它们之间具有线性相关关系. (3)某运动员训练次数与成绩之间的数据及相应的残差数据为 残差

11、图如图所示. 由图可知,残差比较均匀地分布在横轴的两边,说明选用的模型比 较合适. (4)计算得R20.985 5.说明拟合效果较好. 反思感悟 1.解答本类题目应先通过散点图来分析两个变量是否线 性相关,再利用求经验回归方程的公式求解经验回归方程,并利用 残差图或R2来分析模型的拟合效果. 2.“R2、残差图”在回归分析中的作用: (1)R2是用来刻画回归效果的,由R2=1- ,可知R2越大,意味 着残差平方和越小,也就是说模型的拟合效果越好. (2)残差图也是用来刻画回归效果的,判断依据是:残差比较均匀地 分布在横轴的两边,说明残差比较符合一元线性回归模型的假定. 变式训练3在一段时间内,

12、某种商品的价格x(单位:元)和需求量y(单 位:件)之间的一组数据如下: x/元1416182022 y/件1210753 已知x与y线性相关,求出y关于x的经验回归方程,并用R2说明拟合效 果的好坏. 求非线性经验回归方程求非线性经验回归方程 例4某地区六年来轻工业产品利润总额y(单位:亿元)与年次x的数据 如下: 年次x123456 利润总额y/亿元 11.35 11.85 12.44 13.07 13.59 14.41 由经验知,年次x与利润总额y(单位:亿元)近似有如下关系:y=abxe0. 其中a,b均为正数,求y关于x的经验回归方程. 解:对y=abxe0两边取自然对数,得ln y

13、=ln ae0+xln b.令z=ln y,则z与x 的数据如下表: x123456 z2.432.472.522.572.612.67 由z=ln ae0+xln b及最小二乘法,得 ln b0.049 1,ln ae02.371, 反思感悟 非线性经验回归方程的求法 变式训练4某展会一天上午9点半到下午2点的即时参观人数如下 表: 时间9.51010.51111.51212.51313.514 人数 y/万 12.39 20.02 25.57 30.26 35.77 37.57 40.23 40.95 41.73 43.71 已知时间与参观人数具有很强的相关关系,试求出这段时间内即时 参观

14、人数关于时间的经验回归方程. 解:根据题表中的数据画出散点图如图所示. 由图可以看出,样本点分布在某条对数型函数曲线y=a+bln x的周 围.令z=ln x,则y=a+bz,故y与z具有线性相关关系.可知y与z的数据如 下表: z2.252.302.352.402.442.482.532.562.602.64 人数 y/万 12.39 20.02 25.57 30.26 35.77 37.57 40.23 40.95 41.73 43.71 由表中数据可得y关于z的经验回归方程为 方法优化方法优化求经验回归方程的方法和技巧求经验回归方程的方法和技巧 典例某地粮食需求量逐年上升,部分统计数据如

15、下表: 年份20112013201520172019 需求量/万吨236246257276286 (1)利用所给数据求年需求量y关于年份x的经验回归方程; (2)利用(1)中所求出的经验回归方程预测该地2021年的粮食需求量. 解:(1)由所给数据看出,年需求量与年份之间具有线性相关关系.下 面来求经验回归方程,先将数据处理如下: 年份-2015-4-2024 需求量-257-21-1101929 由上述计算结果,可知所求经验回归方程为 (2)利用所求得的经验回归方程,可预测2021年的粮食需求量为 6.5(2 021-2 015)+260.2=6.56+260.2=299.2(万吨). 方法

16、点睛 求经验回归方程时,重点考查的是计算能力.若本题用一 般方法去解,则计算比较烦琐(如年份、需求量不做如上处理),所以 平时训练时遇到数据较大时要考虑有没有更简便的方法解决. 跟踪训练某车间为了规定工时定额,需要确定加工零件所花费的时 间,为此做了四次试验,根据试验数据得到如图所示的散点图,其中x 表示零件的个数,y表示加工时间,则y关于x的经验回归方程是 . 1.(2020陕西西安高三模拟)北极冰融是近年来最引人注目的气候变 化现象之一,白色冰面融化变成颜色相对较暗的海冰,被称为“北极 变暗”现象.21世纪以来,北极的气温变化是全球平均水平的2倍,被 称为“北极放大”现象.若北极年平均海冰

17、面积(单位:106 km2)与年平 均CO2(单位:ppm)浓度图如图所示,则下列说法正确的是() A.北极年海冰面积逐年减少 B.北极年海冰面积减少速度不断加快 C.北极年海冰面积与年平均二氧化碳浓度大体成负相关 D.北极年海冰面积与年平均二氧化碳浓度大体成正相关 解析:由统计图可知北极年海冰面积既有增加又有减少,故选项A,B 错误; 由统计图可知随着年平均二氧化碳浓度增加,北极年海冰面积总体 呈下降趋势,所以北极年海冰面积与年平均二氧化碳浓度大体成负 相关,故选项C正确,选项D错误. 故选C. 答案:C 2.已知甲、乙、丙、丁四位同学在建立变量x,y的模型时,分别选择 了4种不同模型,计算

18、它们的R2分别如下表: 学生甲乙丙丁 R20.980.780.500.85 则建立的模型拟合效果最好的是() A.甲B.乙C.丙 D.丁 解析:因为R2的值越大,模型拟合效果越好,所以甲的拟合效果最好. 答案:A 3.已知一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相 等),若所有样本点(xi,yi)(i=1,2,n)都在直线y= x+1上,则这组样 本数据的样本相关系数为. 解析:根据样本相关系数的定义可知,当所有样本点都在一条直线 上时,样本相关系数为1. 答案:1 4.某课题组调查了某地若干户家庭的年收入x(单位:万元)和年饮食 支出y(单位:万元)的情况,调查结果显示年收入x与年饮食支出y具 有线性相关关系,并由调查数据得到y关于x的经验回归方程为 =0.254x+0.321.由经验回归方程可知,家庭年收入每增加1万元,年 饮食支出平均约增加万元. 解析:设年收入为x1万元,对应的年饮食支出为y1万元,家庭年收入每 增加1万元,则年饮食支出平均增加 答案:0.254 5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此 做了四次试验,得到的数据如下: 零件的个数x/个1245 加工的时间y/小时2356 已知零件的个数x与加工的时间y具有线性相关关系. (2)试预测加工10个零件需要多少时间.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中 > 数学 > 高考专区 > 一轮复习
版权提示 | 免责声明

1,本文(8.1成对数据的统计相关性8.2一元线性回归模型及其应用(教学课件)-高中数学人教A版(2019)选择性必修第三册.ppt)为本站会员(四川天地人教育)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|