3.1.1回归分析的基本思想及其初步应用(一)(优秀经典公开课比赛课件)..ppt

上传人(卖家):三亚风情 文档编号:2447243 上传时间:2022-04-19 格式:PPT 页数:27 大小:1.27MB
下载 相关 举报
3.1.1回归分析的基本思想及其初步应用(一)(优秀经典公开课比赛课件)..ppt_第1页
第1页 / 共27页
3.1.1回归分析的基本思想及其初步应用(一)(优秀经典公开课比赛课件)..ppt_第2页
第2页 / 共27页
3.1.1回归分析的基本思想及其初步应用(一)(优秀经典公开课比赛课件)..ppt_第3页
第3页 / 共27页
3.1.1回归分析的基本思想及其初步应用(一)(优秀经典公开课比赛课件)..ppt_第4页
第4页 / 共27页
3.1.1回归分析的基本思想及其初步应用(一)(优秀经典公开课比赛课件)..ppt_第5页
第5页 / 共27页
点击查看更多>>
资源描述

1、3.1回归分析的基本思想及回归分析的基本思想及其初步应用(一)其初步应用(一)1. 画散点图画散点图2. 了解最小二乘法的思想了解最小二乘法的思想3. 求回归直线方程求回归直线方程 ybxa4. 用回归直线方程解决应用问题用回归直线方程解决应用问题问题问题1:正方形的面积:正方形的面积y与正方形的边长与正方形的边长x之间之间 的的函数关系函数关系是是y = x2确定性关系确定性关系问题问题2:某水田水稻产量:某水田水稻产量y与施肥量与施肥量x之间是否之间是否 有一个确定性的关系?有一个确定性的关系?例如:在例如:在 7 块并排、形状大小相同的试验田上块并排、形状大小相同的试验田上 进行施肥量对

2、水稻产量影响的试验,得进行施肥量对水稻产量影响的试验,得 到如下所示的一组数据:到如下所示的一组数据:施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455复习复习 变量之间的两种关系变量之间的两种关系10 20 30 40 50500450400350300施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy施化肥量施化肥量水稻产量水稻产量 自变量取值一定时,因变量的取值带有一定自变量取值一定时,因变量的取值带有一定随机性的两个

3、变量之间的关系叫做随机性的两个变量之间的关系叫做相关关系相关关系。1、定义、定义: 1):相关关系是一种不确定性关系;):相关关系是一种不确定性关系;注注对具有相关关系的两个变量进行统计对具有相关关系的两个变量进行统计分析的方法叫分析的方法叫回归分析回归分析。2):): 现实生活中存在着大量的相关关系。现实生活中存在着大量的相关关系。探索:水稻产量探索:水稻产量y与施肥量与施肥量x之间大致有何规之间大致有何规律?律?10 20 30 40 50500450400350300发现:图中各点,大致分布在某条直线附近。发现:图中各点,大致分布在某条直线附近。探索探索2:在这些点附近可画直线不止一条,

4、哪条直:在这些点附近可画直线不止一条,哪条直线最能代表线最能代表x与与y之间的关系呢?之间的关系呢?施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy散点图散点图施化肥量施化肥量水稻产量水稻产量10 20 30 40 50500450400350300 xy施化肥量施化肥量水稻产量水稻产量yx探究探究对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据1122( ,),(,),.,(,),nnx yxyxy我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:我们知道其回归方程的截距和斜率的最小二

5、乘估计公式分别为:1122211()(),.(2)()nniiiiiinniiiixxyyxnxybxxxnxy,.(1)aybx1111,.nniiiixx yynn其中( , )x y称为样本点的中心。称为样本点的中心。你能推导出这个公式吗?你能推导出这个公式吗?1122( ,),(,),.,(,)nnx yxyxy假设我们已经得到两个具有相关关系的变量的一组数据假设我们已经得到两个具有相关关系的变量的一组数据 且回归方程是:且回归方程是:y=bx+a,(1,2,., )ix in()iiiiyyybxa其中,其中,a,b是待定参数。当变量是待定参数。当变量x取取 时时 它与实际收集到的它

6、与实际收集到的 之间的偏差是之间的偏差是iyoxy11( ,)x y22(,)xy( ,)iix yiiyy易知,截距易知,截距 和斜率和斜率 分别是使分别是使取最小值时取最小值时 的值。由于的值。由于( ,)()iiiiQyyyx ab, 21( ,)()()niiiQyxyxyx 221()2() () () niiiiiyxyxyxyxyxyx2211()2() ()() ,nniiiiiiyxyxyxyxyxn yx11() ()()()nniiiiiiyxyxyxyxyxyx注意到,11()()nniiiiyxyxn yx()()0,yxnyn xn yx221( ,)()()nii

7、iQyxyxn yx 因此,2222111()2()()()()nnniiiiiiixxxxyyyyn yx2222211221111()()()()()()()()()nniiiinniiiinniiiiiixxyyxxyyn yxxxyyxxxx121()()()niiiniixxyyxxyx这正是我们所要推导的公式。这正是我们所要推导的公式。在上式中,后两项和在上式中,后两项和 无关,而前两项为非负无关,而前两项为非负数,因此要使数,因此要使Q取得最小值,当且仅当前两项的值取得最小值,当且仅当前两项的值均为均为0,即有,即有, 1、所求直线方程叫做、所求直线方程叫做回归直线方程回归直线方

8、程; 相应的直线叫做相应的直线叫做回归直线回归直线。2、对两个变量进行的线性分析叫做、对两个变量进行的线性分析叫做线性回归分析线性回归分析。1122211()(),()nniiiiiinniiiixx yyxnxybxxxnxay bxy 1、回归直线方程、回归直线方程nn( x- x ) ( y- y )xy-n x yiiiii= 1i= 1b =,nn222( x- x )x-n xiii= 1i= 1 a = y -b x .nn11x =x,y =y.iinni= 1i= 1其其 中中最小二乘法:最小二乘法:ybxa( , )x y称为样本点的中心称为样本点的中心。2、求回归直线方程

9、的步骤:、求回归直线方程的步骤:1111(1),nniiiixxyynn求211(2),.nniiiiixx y求(3)代入公式)代入公式1122211()(),(),.(1)nniiiiiinniiiixx yyxnxybxxxnxa y bxy (4)写出直线方程为)写出直线方程为y=bx+a,即为所求的回归直线方程。即为所求的回归直线方程。例例1 1、观察两相关量得如下数据、观察两相关量得如下数据: :x -1-2-3-4-55 3 4 2 1y -9-7-5-3-11 5 3 7 9101010221110,0,110,3 01 0.3 ,1iiiiiiixyyyxx求两变量间的回归方

10、程求两变量间的回归方程. .解:列表:解:列表:i1234567910 xi-1-2-3-4-55321yi-9-7-5-3-11579xiyi914151255151491011022110110100111010010iiiiix ybyxxx000aybxb.yx所求回归直线方程为所求回归直线方程为例例2:已知:已知10只狗的血球体积及血球的测量值如下:只狗的血球体积及血球的测量值如下:x45424648423558403950y6.53 6.30 9.52 7.506.995.90 9.49 9.20 6.55 8.72x(血球体积血球体积,mm), y(血球数,百万血球数,百万)(1

11、)画出上表的散点图;)画出上表的散点图;(2)求出回归直线并且画出图形;)求出回归直线并且画出图形;(3)回归直线必经过的一点是哪一点?)回归直线必经过的一点是哪一点?3 3、利用回归直线方程对总体进行线性相关性的检验、利用回归直线方程对总体进行线性相关性的检验 例例3 3、炼钢是一个氧化降碳的过程,钢水含碳量的多少、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼钢水含碳量和冶炼时间的关系。如果已测得炉料熔化完毕时,钢水的含碳时间的关系。如果已测得炉料熔化完毕时,钢水的含碳量量x与冶炼时间与冶炼时间y(从炉料熔化完毕到

12、出刚的时间)的一(从炉料熔化完毕到出刚的时间)的一列数据,如下表所示:列数据,如下表所示:x(0.01%)104180 190 177 147134 150 191 204 121y(min)100200 210 185 155135 170 205 235 125(1 1)y y与与x x是否具有线性相关关系;是否具有线性相关关系;(2 2)如果具有线性相关关系,求回归直线方程;)如果具有线性相关关系,求回归直线方程;(3 3)预测当钢水含碳量为)预测当钢水含碳量为160160个个0.01%0.01%时,应冶炼多少分时,应冶炼多少分钟?钟?(1)(1)列出下表列出下表, ,并计算并计算i12

13、345678910 xi104180190177147134150191204121yi100200210185155135170205235125xiyi1040036000399003274522785180902550039155479401512510101022111159.8,172,265448,312350,287640iiiiiiixyyyxx1011010222211100.9906.(10)(10)iiiiiiix yx yrxxyy于是,10110221101.26710iiiiixybyxxx30.51.aybx 所以回归直线的方程为所以回归直线的方程为 =1.267

14、x-30.51 y(3)(3)当当x=160 x=160时时, 1.267.160-30.51=172, 1.267.160-30.51=172 y(2)设所求的回归方程为设所求的回归方程为ybxa例题例题4 4 从某大学中随机选出从某大学中随机选出8 8名女大学生,其身名女大学生,其身高和体重数据如下表:高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359求根据一名女大学生的身高预报她的体重的求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为回归方程,并预报一名身高为172172的女的女大学生的体重。大

15、学生的体重。172.85849. 0 xy分析:由于问题中分析:由于问题中要求根据身高预报要求根据身高预报体重,因此选取身体重,因此选取身高为自变量,体重高为自变量,体重为因变量为因变量学学身身高高172cm女172cm女大大生生体体重重y = 0.849y = 0.849172-85.712 = 60.316(kg)172-85.712 = 60.316(kg)2.2.回归方程:回归方程:1. 散点图;散点图;n(x -x)(y -y)iii=1r=nn22(x -x)(y -y)iii=1i=1相关系数相关系数正相关;负相关通常,正相关;负相关通常,r0.75,认为两个变量有很强的相关性,

16、认为两个变量有很强的相关性本例中本例中,由上面公式由上面公式r=0.7980.75探究?探究?身高为身高为172172的女大学生的体重一定的女大学生的体重一定是是60.316kg60.316kg吗吗?如果不是?如果不是, ,其原因是什其原因是什么么? ?如何描述两个变量之间线性相关关系的强弱?如何描述两个变量之间线性相关关系的强弱? 在在数学数学3中,我们学习了用相关系数中,我们学习了用相关系数r来衡量两个变量来衡量两个变量之间线性相关关系的方法。之间线性相关关系的方法。相关系数相关系数r12211()().()()niiinniiiixxyyxxyy0.751, 1, 0.75, 0 25,0.25,rrr 当, 表明两个变量正相关很强;当表明两个变量负相关很强;当.表明两个变量相关性较弱。相关关系的测度相关关系的测度(相关系数取值及其意义)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(3.1.1回归分析的基本思想及其初步应用(一)(优秀经典公开课比赛课件)..ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|