线性回归方程(1)分析课件.ppt

上传人(卖家):晟晟文业 文档编号:2848398 上传时间:2022-06-03 格式:PPT 页数:30 大小:695.50KB
下载 相关 举报
线性回归方程(1)分析课件.ppt_第1页
第1页 / 共30页
线性回归方程(1)分析课件.ppt_第2页
第2页 / 共30页
线性回归方程(1)分析课件.ppt_第3页
第3页 / 共30页
线性回归方程(1)分析课件.ppt_第4页
第4页 / 共30页
线性回归方程(1)分析课件.ppt_第5页
第5页 / 共30页
点击查看更多>>
资源描述

1、2.3 变量间的相关关系变量间的相关关系 有些教师常说:有些教师常说:“如果你的数学成绩好,那如果你的数学成绩好,那么你的物理学习就不会有什么大问题么你的物理学习就不会有什么大问题” 按照这种按照这种说法,似乎学生的物理成绩与数学成绩之间也存说法,似乎学生的物理成绩与数学成绩之间也存在着某种关系。你如何认识它们之间存在的关系?在着某种关系。你如何认识它们之间存在的关系?物理成绩物理成绩 数学成绩数学成绩 学习兴趣学习兴趣 学习时间学习时间 其他因素其他因素结论:变量之间除了函数关系外,还有结论:变量之间除了函数关系外,还有 。问题引入:问题引入:思考:考察下列问题中两个变量之间的关系:思考:考

2、察下列问题中两个变量之间的关系:(1 1)商品销售收入与广告支出经费;)商品销售收入与广告支出经费;(2 2)粮食产量与施肥量;)粮食产量与施肥量;(3 3)人体内的脂肪含量与年龄;)人体内的脂肪含量与年龄;(4 4)圆的面积与半径;)圆的面积与半径;(5 5)匀速直线运动中的时间与路程)匀速直线运动中的时间与路程。(1 1)函数关系:)函数关系:当自变量取值一定时,因变量取值由它唯一确定当自变量取值一定时,因变量取值由它唯一确定 正方形面积正方形面积S S与其边长与其边长x x之间的函数关系之间的函数关系S=xS=x2 2 , 一块农田的水稻产量与施肥量之间的关系一块农田的水稻产量与施肥量之

3、间的关系 。1.1.两变量之间的关系两变量之间的关系 (2)相关关系:)相关关系: 当自变量取值一定时,因变量的取值带有一定的随机当自变量取值一定时,因变量的取值带有一定的随机性性对自变量边长的每一个确定值,都有唯一确定的面积的值对自变量边长的每一个确定值,都有唯一确定的面积的值与之对应。与之对应。确定关系确定关系水稻产量并不是由施肥量唯一确定,在取值上带有随机性水稻产量并不是由施肥量唯一确定,在取值上带有随机性不确定关系不确定关系(1 1)相关关系与函数关系的异同点:)相关关系与函数关系的异同点: 相同点:均是指两个变量的关系相同点:均是指两个变量的关系 不同点:不同点:函数关系是一种确定的

4、关系函数关系是一种确定的关系 相关关系是一种非确定关系;相关关系是一种非确定关系;函数关系是一种因果关系,而相关关系不一定是因果关函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是随机关系系,也可能是随机关系.(2)函数关系与相关关系之间有着密切联系:)函数关系与相关关系之间有着密切联系: 在一定的条件下可以相互转化在一定的条件下可以相互转化.而对于具有线性相关关系而对于具有线性相关关系的两个变量来说,当求得其回归直线方程后,又可以用的两个变量来说,当求得其回归直线方程后,又可以用一种确定性的关系对这两个变量间的取值进行估计:一种确定性的关系对这两个变量间的取值进行估计:1.下列关系

5、中下列关系中,是带有随机性相关关系的是是带有随机性相关关系的是 .正方形的边长与面积的关系正方形的边长与面积的关系;水稻产量与施肥量之水稻产量与施肥量之间的关系间的关系;人的身高与年龄之间的关系人的身高与年龄之间的关系;降雪量与降雪量与交通事故发生之间的关系交通事故发生之间的关系.2. 下列两个变量之间的关系哪个不是函数关系下列两个变量之间的关系哪个不是函数关系()()A角度和它的余弦值角度和它的余弦值B. 正方形边长和面积正方形边长和面积C正边形的边数和它的内角和正边形的边数和它的内角和 D. 人的年龄和身高人的年龄和身高D年龄年龄2323272739394141454549495050脂肪

6、脂肪9 95 517178 821212 225259 927275 526263 328282 2年龄年龄5353545456565757585860606161脂肪脂肪29296 630302 231314 430308 833335 535352 234346 6根据上述数据,人体的脂肪含量和年龄之间有怎样的关根据上述数据,人体的脂肪含量和年龄之间有怎样的关系?系?在一次对人体的脂肪含量和年龄关系的?在一次对人体的脂肪含量和年龄关系的? 下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作出各个点,称该图为系,作出各个点,称该图为散点图散

7、点图.如图:如图:O202530 35 4045 505560 65年龄年龄脂肪含量脂肪含量5101520253035401 1、散点图:将样、散点图:将样本中本中n n个数据点个数据点(xixi,yi)yi)(i i1 1,2,n n)描在平)描在平面直角坐标系中,面直角坐标系中,以表示具有相关关以表示具有相关关系的两个变量的一系的两个变量的一组数据的图形叫做组数据的图形叫做散点图散点图. .由散点图支持了我们从数据表中得出如下结论:由散点图支持了我们从数据表中得出如下结论:a. a. 如果所有的样本点如果所有的样本点都落在某一函数曲线上都落在某一函数曲线上,就用,就用 该该函数函数来描述变

8、量之间的关系。来描述变量之间的关系。b.b.如果所有的样本点都落在如果所有的样本点都落在某一函数曲线附近某一函数曲线附近,变,变量之间就有量之间就有相关关系相关关系。c.c.如果所有的样本点都落在如果所有的样本点都落在某一直线附近某一直线附近,变量之,变量之间就有间就有线性相关关系线性相关关系。 从刚才的散点图发现:年龄越大,体内脂肪含量从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从越高,点的位置散布在从左下角到右上角左下角到右上角的区域的区域. . 称称它们成它们成正相关正相关. 但有的两个变量的相关,如下图所示:但有的两个变量的相关,如下图所示: 如高原含氧量与海拔高度如

9、高原含氧量与海拔高度的相关关系,海平面以上,的相关关系,海平面以上,海拔高度越高,含氧量越少海拔高度越高,含氧量越少. . 作出散点图发现,它作出散点图发现,它们散布在从们散布在从左上角到右下角左上角到右下角的区域内。又如汽车的载重的区域内。又如汽车的载重和汽车每消耗和汽车每消耗1 1升汽油所行升汽油所行使的平均路程,称它们成使的平均路程,称它们成负负相关相关. .O5 5个学生的数学和物理成绩如下表个学生的数学和物理成绩如下表:ABCDE数学8075706560物理7066686462画出散点图画出散点图,解:解:数学成绩数学成绩由散点图可见,两者之间具有正相关关系。由散点图可见,两者之间具

10、有正相关关系。有一个同学家开了一个小卖部,他为了研究气有一个同学家开了一个小卖部,他为了研究气温对热饮销销售的影响,经过统计,得到一个温对热饮销销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:卖出的热饮杯数与当天气温的对比表:摄氏温度摄氏温度 26 18 13 10 4 -1 热饮杯数热饮杯数 20 24 34 38 50 64(1)(1)画出散点图;画出散点图;(2)(2)从散点图中发现气温与热饮销售杯数之间从散点图中发现气温与热饮销售杯数之间关系的一般规律;关系的一般规律;解解: (1): (1)散点图散点图(2)(2)气温与热饮杯数成负相关气温与热饮杯数成负相关, ,即气

11、温越高,卖出即气温越高,卖出去的热饮杯数越少。去的热饮杯数越少。温度温度热饮杯数热饮杯数人体脂肪含量百分比与年龄散点图02040020406080年龄脂肪含量散散点点图图回归直线:如果散点图中点的分布回归直线:如果散点图中点的分布从从整体整体上看上看大致在大致在一条直线附近,我们就称这两个变量之间具有一条直线附近,我们就称这两个变量之间具有线性相线性相关关系关关系,这条直线就叫做,这条直线就叫做回归直线回归直线。 这条回归直线的方程,简称为回归方程这条回归直线的方程,简称为回归方程。1.1.回归方程被样本数据惟一确定,各样本点大致回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近分布在

12、回归直线附近. .对同一个总体,不同的样本对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有数据对应不同的回归直线,所以回归直线也具有随机性随机性. . 2.2.对于任意一组样本数据,利用上述公式都可以对于任意一组样本数据,利用上述公式都可以求得求得“回归方程回归方程”,如果这组数据不具有线性相,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的关关系,即不存在回归直线,那么所得的“回归回归方程方程”是没有实际意义的是没有实际意义的. .因此,对一组样本数据,因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再应先作散点图,在具有线性相关关系的前提下再求回

13、归方程求回归方程. .方案一:采用测量的方法:先画一条直线,测方案一:采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程。斜率和截距,就得到回归方程。脂肪010203040020406080脂肪方案二、在图中选取两点画直线,使得直线两方案二、在图中选取两点画直线,使得直线两侧的点的个数基本相同。侧的点的个数基本相同。脂肪010203040020406080脂肪方案三、在散点图中多取几组点,确定几条直方案三、在散点图中多取几组点,

14、确定几条直线的方程,分别求出各条直线的斜率和截距的线的方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率平均数,将这两个平均数作为回归方程的斜率和截距。和截距。脂肪010203040020406080脂肪设已经得到具有线性相关关系的变量的一组数据:设已经得到具有线性相关关系的变量的一组数据: (x x1 1,y y1 1),(),(x x2 2,y y2 2),),(,(x xn n,y yn n)设所求的回归直线方程为设所求的回归直线方程为Y=bx+aY=bx+a,其中其中a a,b b是待定是待定的系数。当变量的系数。当变量x x取取x x1 1,x x2 2,x

15、 xn n时,可以得到时,可以得到 Y Yi i=bx=bxi i+a+a(i=1i=1,2 2,n n)它与实际收集得到的它与实际收集得到的y yi i之间偏差是之间偏差是 y yi i-Y-Yi i=y=yi i-(bx-(bxi i+a)+a)(i=1i=1,2 2,n n)(x1,y1)(x2,y2)(xi ,yi )yi-Yiy x这样,用这这样,用这n n个偏差的和来刻画个偏差的和来刻画“各点与此直线的整体偏差各点与此直线的整体偏差”是比较合适的。是比较合适的。上述三种方案均有一定的道理,但可靠性不强,我们上述三种方案均有一定的道理,但可靠性不强,我们回到回归直线的回到回归直线的定

16、义定义。(yi-Yi)的最小值的最小值ni=1|yi-Yi|的最小值的最小值ni=1(yi-Yi)2的最小值的最小值ni=1Q=(y1-bx1-a) 2+(y2-bx2-a) 2+(yn-bxn-a) 2当当a,b取什么值时,取什么值时,Q的值最小,即总体偏差最小的值最小,即总体偏差最小1221,niiiniixyn x ybxn xayb x(xi-x)()(yi-y)ni=1b=(xi-x)ni=1a=y-bx计算回归方程的斜率和截距的一般公式:计算回归方程的斜率和截距的一般公式: xbyaxnxyxnyxxxyyxxbniiniiiniiniii,)()(1221121其中,其中,b是回

17、归方程的斜率,是回归方程的斜率,a是截距。是截距。注:对具有线性相关关系的两个变量,其回归直线一定注:对具有线性相关关系的两个变量,其回归直线一定通过样本点的中心通过样本点的中心,yx求样本数据的线性回归方程,可按下列步骤进行:求样本数据的线性回归方程,可按下列步骤进行:第一步,计算平均数第一步,计算平均数 , , xy1niiix y21niix第二步,求和第二步,求和 , , 1122211()(),()nniii iiinniiiixx yyxynx ybay bxxxxnx 第三步,计算第三步,计算 ybxa第四步,写出回归方程第四步,写出回归方程 例例1 1:假设某设备的使用年限x(

18、年)和所支出的维修费用y(万元)有如下统计资料:使用年限使用年限x x( (年年) )2 23 34 45 56 6维修费用维修费用y y( (万元万元) )2.22.23.83.85.55.56.56.57.07.0由资料知 y对 x呈线性关系,试求:;,) 1 (的值中的回归直线方程ababxy(2)估计使用年限是10年时,维修费用估计是多少?解解:(1) 制表:制表:i12345合计合计xi2345620yi2.23.85.56.57.025xi24916253690 xi yi4.411.422.032.542.0112.3. 3 .112,90, 5, 4:51512iiiiiyxx

19、yx于是有23. 1103 .1245905453 .1122b08.0423.15xbya(2)回归直线方程是.08. 023. 1xy(2)估计使用年限是10年时,维修费用估计是多少?)(4 .1238.1208. 01023. 1,10万元时当yx答:估计使用10年时,维修费用估计是12.4万元。练习练习某种产品是的广告费支出某种产品是的广告费支出x x(单位:百万元)(单位:百万元)与销售额与销售额y y(单位:百万元)之间有如下对(单位:百万元)之间有如下对应数据应数据(1 1)画出散点图;)画出散点图;(2 2)如果)如果x x与与y y具有相关关系,求回归具有相关关系,求回归直线

20、方程,并说明直线方程,并说明b b的意义的意义解(1)散点图如图所示:1735910305080销售额(百万元)广告费(百万元)(2)由散点图可知:X与Y具有相关关系515215501380145iiiiixyx yx 51522156.517.55iiiiix yx ybaybxxx故可得故可得:所求回归直线方程为6.517.5yxb表示广告每增加100万元,销售量平均增加650元4,5,xy211112.3,90,nniiiiix yx1.230.081.230.08yx巩固练习巩固练习: :;)()(1221121xbyaxnxyxnyxxxyyxxbniiniiiniiniii,4.7

21、5257yx2对于回归方程对于回归方程 当当x=28x=28时时,y,y的估计值是的估计值是390(0 0),( 0)x,(0 ) y,()x y,3 3线性回归方程表示的直线线性回归方程表示的直线 必定过必定过()().22.5yx4 4设有一个回归方程设有一个回归方程, 变量变量x x 增加增加1 1个单位个单位长度时,变量长度时,变量y y()()平均增加平均增加2.52.5个单位长度个单位长度 平均增加平均增加0.50.5个单位长度个单位长度平均减少平均减少2.52.5个单位长度个单位长度 平均减少平均减少0.50.5个单位长度个单位长度yabxDC课堂总结课堂总结1 1、两种相关关系:正相关、负相关、两种相关关系:正相关、负相关2 2、线性回归方程、线性回归方程:回归直线所在方程的斜率与截距的一般公式回归直线所在方程的斜率与截距的一般公式: :1122211()(),().nniiiiiinniiiixxyyx ynxybxxxnxaybx ybxaybxa

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(线性回归方程(1)分析课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|