8.2.2一元线性回归模型参数的最小二乘估计ppt课件-2022新人教A版(2019)《高中数学》选择性必修第三册.ppt

上传人(卖家):Q123 文档编号:3588377 上传时间:2022-09-21 格式:PPT 页数:40 大小:3.83MB
下载 相关 举报
8.2.2一元线性回归模型参数的最小二乘估计ppt课件-2022新人教A版(2019)《高中数学》选择性必修第三册.ppt_第1页
第1页 / 共40页
8.2.2一元线性回归模型参数的最小二乘估计ppt课件-2022新人教A版(2019)《高中数学》选择性必修第三册.ppt_第2页
第2页 / 共40页
8.2.2一元线性回归模型参数的最小二乘估计ppt课件-2022新人教A版(2019)《高中数学》选择性必修第三册.ppt_第3页
第3页 / 共40页
8.2.2一元线性回归模型参数的最小二乘估计ppt课件-2022新人教A版(2019)《高中数学》选择性必修第三册.ppt_第4页
第4页 / 共40页
8.2.2一元线性回归模型参数的最小二乘估计ppt课件-2022新人教A版(2019)《高中数学》选择性必修第三册.ppt_第5页
第5页 / 共40页
点击查看更多>>
资源描述

1、 8.2.2 一元线性回归模型 参数的最小二乘估计 高二数学选择性必修 第三册 第八章 成对数据的统计分析学习目标1.通过用数学方法刻画散点与直线接近的程度,体会一元线性回归模型参数的最小二乘估计原理,能推导参数估计公式;2.通过对残差和残差图的分析,能用残差判断一元线性回归模型的有效性.3.核心素养:直观想象、数据分析、数学运算.一、回顾旧知1.一元线性回归模型2,()0,().YbxaeE eD e 2.一元线性回归模型与函数模型的区别Y称为因变量或响应变量x称为自变量或解释变量e是Y与bx+a之间的随机误差a称为截距参数b称为斜率参数二、探究新知1.问题1.为了研究两个变量之间的相关关系

2、,我们建立了一元线性回归模型表达式 刻画的是变量Y与变量x之间的线性相关关系,其中参数a和b未知,我们能否通过样本数据估计参数a和b?2,()0,().YbxaeE eD e 与函数不同,回归模型的参数一般是无法精确求出的,只能通过成对样本数据估计这两个参数.参数a和b刻画了变量Y与变量x的线性关系,因此通过成对样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近.2问题2.我们怎样寻找一条“最好”的直线,使得表示成对样本数据的这些散点在整体上与这条直线最“接近”?从成对样本数据出发,用数学的方法刻画“从整体上看,各散点与直线最接近”利用点到直

3、线y=bx+a的“距离”来刻画散点与该直线的接近程度,然后用所有“距离”之和刻画所有样本观测数据与该直线的接近程度.父亲身高/cm180175170165160160165 170 175 180 185 190儿子身高/cm 185 父亲身高/cm180175170165160160165 170 175 180 185 190儿子身高/cm 185 我们设满足一元线性回归模型的两个变量的n对样本数据为(x1,y1),(x2,y2),(xn,yn)父亲身高/cm180175170165160160165 170 175 180 185 190儿子身高/cm 185(1,2,3,-).iiii

4、iiiiiiiybxae inybxaeexyxbxa由),得(显然越小,表示点,与点,的距离越小,0,.iiix y即样本数据点离直线y=bx+a的竖直距离越小,如上图特别地,当e时,表示点在这条直线上1-)niiiybxa因此可用(来刻画各样本观测数据与直线y=bx+a的整体接近程度.iixy,y=bx+aiixbxa,1|()|niiiybxa21(,)()niiiQ a bybxa残差平方和:求a,b的值,使Q(a,b)最小1111,nniiiixx yynn记221122112112()()()()(,)()()()()()2()()()nniiiiiinniiiiiiniiinii

5、iybxaybxaybxayyyyb xQ a by bxy bxb xxy bxayyb xxn y baabxxyx1111()()()()()()()()()()()()0nniiiiiinniiiiyyb xxy bxay bx ayyb xxy bx ayybxxy bx any nyb nx nx221()()(,)niiiyyb xxQ an ybxab2(,)()0=Q a bn ybxaa ybx当取最小时,取最小值,即21112122(,)()(2()()()=b()nnniiiiiniiiiiQ a bxyyb xxxxyxbyyy此时,上式是关于b的二次函数,因此要使Q

6、取得最小值,当且仅当b的取值为121()()()niiiniixxyybxxybxa .,的最小二乘估计叫做求得abab(,).x y经验回顾直线必经过符号相同与rb3.最小二乘法 我们将 称为Y 关于x 的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫最小二乘法ybxa 1122211()()()nniiiiiinniiiixxyyx ynxybxxxnx aybx 4.问题2:依据用最小二乘估计一元线性回归模型参数的公式,求出儿子身高Y关于父亲身高x的经验回归方程.儿子的身高不一定会是177cm,这是因为还有其他影响儿子身高的因素,回归模型

7、中的随机误差清楚地表达了这种影响,父亲的身高不能完全决定儿子的身高,不过,我们可以作出推测,当父亲的身高为176cm时,儿子身高一般在177cm左右.1).当x=176时,,如果一位父亲身高为176cm,他儿子长大后身高一定能长到177cm吗?为什么?177y 0 83928 957 y.x.0.83928.957yx的意义?b2).根据经验回归方程 中斜率的具体含义,高个子的父亲一定生高个子的儿子吗?同样,矮个子的父亲一定生矮个子的儿子吗?根据经验回归方程 中斜率0.839可以解释为父亲身高每增加1cm,其儿子的身高平均增加0.839cm.由模型可以发现,高个子父亲x=185(cm),则0.

8、83928.957yx184.172 cm.y 我们可以通过残差 来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.12,neee(1)残差的定义,eabxY一元线性回归模型,Yy对于通过观测得响应到的数据 称量为变观测值,y通过经验回归方程得到称为预报值的.eyy残观测值减去预报值称为即差5.判断模型拟合的效果:残差分析作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据或体重估计值等,这样作出的图形称为残差图 从上面的残差图可以看出,残差有正有负,残差点比较均匀地分布在横轴的两边,可以判断样本数据基本满足一元线性回归模型对于随机误差的假设.所以,通过观察

9、残差图可以直观判断样本数据是否满足一元线性回归模型的假设,从而判断回归模型拟合的有效性.6.问题3:儿子身高与父亲身高的关系,运用残差分析所得的一元线性回归模型的有效性吗?一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析.借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.所以,只有图(4)满足一元线性回归模型对随机误差的假设图(1)显示残差与观测时间有线性关系,应将时间变量纳入模型;图(2)显示残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分;图(3)说明残差的方差不是一个常数,随观测时间变大而变大根据一元线性回归模型中对随机误差的

10、假定,残差应是均值为0,方差为 的随机变量的观测值.27.观察以下四幅残差图,你认为哪一个残差满足一元线性回归模型中对随机误差的假定?1.残差等于观测值减预测值;2.残差的平方和越小越好;3.原始数据中的可疑数据往往是残差绝对值过大的数据;4.对数据刻画效果比较好的残差 图特征:残差点比较均匀的集中在水平带状区域内1.关于残差图的描述错误的是()A.残差图的横坐标可以是样本编号 B.残差图的横坐标也可以是解释变量或预报变量 C.残差点分布的带状区域的宽度越窄相关指数越小 D.残差点分布的带状区域的宽度越窄残差平方和越小C三、巩固新知2.根据如下样本数据:得到的经验回归方程为 ,则则()A.0,

11、0A.0,0B.0,0,0 C.0 C.0D.0,0D.0,0 x23456Y42.5-0.5-2-3aaaabbbbybxaB 5.5,0.25xy25.51.417.5b 61()()24.5iiixx yy 21()17.5niixx7 95 abxy.3.某种产品的广告支出费用x(单位:万元)与销售额Y(单位:万元)的数据如表:已知Y关于x的经验回归方程为 =6.5x+17.5,则当广告支 出费用为5万元时,残差为_.x x2 24 45 56 68 8Y Y30304040606050507070yy当x=5时,=6.55+17.5=50,表格中对应y=60,于是残差为60-50=1

12、0.104.已知变量x,Y之间具有线性相关关系,其散点图如图所示,则其经验回归方程可能为()A.=1.5x+2 B.=-1.5x+2C.=1.5x-2 D.=-1.5x-2yyyyB编号123456胸径/cm18.120.122.224.426.028.3树高/m18.819.221.021.022.122.1编号789101112胸径/cm29.632.433.735.738.340.2树高/m22.422.623.024.323.924.71).例1.经验表明,对于同一树种,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径

13、预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如下表所示,试根据这些数据建立树高关于胸径的经验回归方程.5.一元线性回归模型的应用dh解:以胸径为横坐标,树高为纵坐标作散点图如下:散点大致分布在一条从左下角到右上角的直线附近,表明两个变量线性相关,并且是正相关,因此可以用一元线性回归模型刻画树高与胸径之间的关系.0.249314.84hd 用d表示胸径,h表示树高,根据据最小二乘法,计算可得经验回归方程为0.249314.84hd编号胸径/cm树高观测值/m 树高预测值/m残差/m118.1 18.8 19.4-0.6 220.1 19.2 19.9-0.7 322.2

14、21.0 20.4 0.6 424.4 21.0 20.9 0.1 526.0 22.1 21.3 0.8 628.3 22.1 21.9 0.2 729.6 22.4 22.2 0.2 832.4 22.6 22.9-0.3 933.7 23.0 23.2-0.2 1035.7 24.3 23.7 0.6 1138.3 23.9 24.4-0.5 1240.2 24.7 24.9-0.2 根据经验回归方程,由胸径的数据可以计算出树高的预测值(精确到0.1)以及相应的残差,如下表所示.以胸径为横坐标,残差为纵坐标,作残差图,得到下图.30252015-1.0 -0.5 0.0 0.5 1.0残

15、差/m 35 40 45 胸径/cm编号12345678年份18961912192119301936195619601968记录/s11.8010.6010.4010.3010.2010.1010.009.952).例2.人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程 将经验回归直线叠加到散点图,得到下图:76913031.4902033743.01ty 用Y表示男子短跑100m的世界纪录,t表示纪录产生的年份,利用一元线性回归模型

16、来刻画世界纪录和世界纪录产生年份之间的关系.根据最小二乘法,由表中的数据得到经验回归方程为:从图中可以看到,经验回归方程较好地刻画了散点的变化趋势,请再仔细观察图形,你能看出其中存在的问题吗?世界纪录所对应的散点经验回归直线,并且的散点都在经验回归直线的,时间段的散点都在经验回归直线的 这说明散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相关的特征.回顾已有的函数知识,可以发现函数y=-lnx的图象具有类似的形状特征你能对模型进行修改,以使其更好地反映散点的分布特征吗?仔细观察右图,可以发现散点更趋向于落在中间下凸且递减的某条曲

17、线附近.注意到100m短跑的第一个世界纪录产生于1896年,因此可以认为散点是集中在曲线y=f(t)=c1+c2ln(t-1895)的周围,其中c1、c2为未知参数,且c20.y=f(t)=c1+c2ln(t-1895)令x=ln(t-1895),则 Y=c2x+c1编号12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29记录/s 11.80 10.60 10.40 10.30 10.20 10.10 10.009.95这是一个非线性经验回归函数,如何利用成对数据估计参数c1、c2对数据进行变

18、化可得下表:得到散点图如下:由表中的数据得到经验回归方程为:8012653.114264398.02xy 8012653.114264398.02xy上图表明,经验回归方程对于成对数据具有非常好的拟合精度.将经验回归直线叠加到散点图,得到下图:将x=ln(t-1895)8012653.114264398.02xy8012653.11)1895ln(4264398.02ty 对于通过创纪录时间预报世界纪录的问题,我们建立了两个回归模型,得到了两个回归方程,你能判断哪个回归方程拟合的精度更好吗?8012653.114264398.02xy20.4264398 ln(1895)11.8012653y

19、t 我们发现,散点图中各散点都非常靠近的图象,表明非线性经验回归方程对于原始数据的拟合效果远远好于经验回归方程.(1).直接观察法.在同一坐标系中画出成对数据散点图、非线性经验回归方程的图象(蓝色)以及经验回归方程的图象(红色).28212811,QQ()0.004)0.669iiiieu8012653.114264398.02xy20.4264398 ln(1895)11.8012653yt(2).残差分析:残差平方和越小,模型拟合效果越好.Q2明显小于Q1,说明非线性回归方程的拟合效果要优于线性回归方程.R2越大,表示残差平方和越小,即模型的拟合效果越好R2越小,表示残差平方和越大,即模型

20、拟合效果越差.21212()11()niiniiiyyyyR 残差平方和。总偏差平方和和的R2分别为0.7325和0.9983(3).利用决定系数R2刻画回归效果.8012653.114264398.02xy20.4264398 ln(1895)11.8012653yt 显然0R21,R2越接近1,则线性回归刻画的效果越好.在一元线性回归模型中 R2=r2,即决定系数R2等于响应变量与解释变量的样本相关系数r的平方.在使用经验回归方程进行预测时,需注意以下问题1.回归方程只适用于我们所研究的样本的总体;2.我们所建立的回归方程一般都有时间性;3.样本采集的范围会影响回归方程的适用范围;4.不能

21、期望回归方程得到的预报值就是预报 变量的精确值.事实上,它是预报变量的可取 值的平均值.(1)确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量(2)画出解释变量与响应变量的散点图,观察它们之间的关系 (如是否存在线性关系等)(3)由经验确定回归方程的类型(4)按一定规则(如最小二乘法)估计经验回归方程中的参数.(5)得出结果后需进行线性回归分析.残差平方和越小,模型的拟合效果越好.决定系数R2取值越大,说明模型的拟合效果越好.注意:若题中给出了检验回归方程是否理想的条件,则根据题意进行分析检验即可.6.建立线性回归模型的基本步骤7.一只药用昆虫的产卵数y与一定范围内的温度x有关,现收集

22、了6组观测数据列于表中:温度x/212324272932产卵数y/个61120275777经计算得:268.06051(-)236,64,3167.iiiyye66622111(-)(-)557,(-)84,(y-y)3930,iiiiiiix xyyx x线性回归残差的平方和:其中 分别为观测数据中的温度和产卵数,1,2,3,4,5,6.iixy,=i(1)若用线性回归模型拟合,求y关于x的回归方程 (精确到0.1);ybxa (2)若用非线性回归模型拟合,求得y关于x回归方程为 且相关指数R20.9522 0 23030 06e e.x y.,试与(1)中的线性回归模型相比较,用R2说明哪

23、种模型的拟合效果更好?用拟合效果好的模型预测温度为35时该种药用昆虫的产卵数.(结果取整数).附:相关系数 21212()1).(niiniiiyyyRy 解:661116,26,33,iiiinxxyy由题意得,66211(-)(-)557,(-)84,iiiiix xyyx x121()()557=6.6336.626138.6.84()niiiniixxyybaxx,6 6138 6-y.x.所以y关于x的经验回归方程为 2662112(y-y)3930,(-)236,64iiiiiy y对于线性回归模型,21212()236.641=10.9398.3930()niiiniiyRyyy

24、 相关系数0.93980.9522 非线性回归模型的回归方程 比线性回归方程为:y6.6x-139.4拟合的拟合效果更好 0 23030 06e e.x y.,0.06e0.2303x 0.06e0.2303350.06e8.060531670.06190(个)预测温度为35时该种药用昆虫的产卵数为190个y四、课堂小结21(,)()niiiQ a bybxa1.残差平方和:1122211()()()nniiiiiinniiiixxyyx ynxybxxxnxaybx 2.最小二乘法 将 称为Y 关于x 的经验回归方程,ybxa 3.判断模型拟合的效果:残差分析21212()11()niiniiiyyyRy 决定系残差平方和。总偏差平方和数R2越大,表示残差平方和越小,即模型的拟合效果越好R2越小,表示残差平方和越大,即模型拟合效果越差.作业:课本P121 习题8.2 4题

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中 > 数学 > 人教A版(2019) > 选择性必修 第三册
版权提示 | 免责声明

1,本文(8.2.2一元线性回归模型参数的最小二乘估计ppt课件-2022新人教A版(2019)《高中数学》选择性必修第三册.ppt)为本站会员(Q123)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|