苏教版高中数学选修2-3线性回归课件.ppt

上传人(卖家):晟晟文业 文档编号:4362250 上传时间:2022-12-02 格式:PPT 页数:15 大小:2.87MB
下载 相关 举报
苏教版高中数学选修2-3线性回归课件.ppt_第1页
第1页 / 共15页
苏教版高中数学选修2-3线性回归课件.ppt_第2页
第2页 / 共15页
苏教版高中数学选修2-3线性回归课件.ppt_第3页
第3页 / 共15页
苏教版高中数学选修2-3线性回归课件.ppt_第4页
第4页 / 共15页
苏教版高中数学选修2-3线性回归课件.ppt_第5页
第5页 / 共15页
点击查看更多>>
资源描述

1、 对于两个变量之间的关系,我们以前学过函数关系是一对于两个变量之间的关系,我们以前学过函数关系是一种确定性关系例如正方形的面积种确定性关系例如正方形的面积 S S 与边长与边长 x x 之间的关之间的关系系 S S=x x2 2 就是一种确定性关系,即对于自变量边长的每一就是一种确定性关系,即对于自变量边长的每一个确定的值,都有唯一确定的面积的值与之对应个确定的值,都有唯一确定的面积的值与之对应 两个变量之间的关系还有另外一种情况我们来看看一两个变量之间的关系还有另外一种情况我们来看看一块农田的水稻产量与施肥量之间的关系在这个问题里,块农田的水稻产量与施肥量之间的关系在这个问题里,水稻产量不仅

2、受到施肥量的影响,还受到其他不少因素水稻产量不仅受到施肥量的影响,还受到其他不少因素(诸如气候情况、浇水、除虫等)的影响因此,当施肥(诸如气候情况、浇水、除虫等)的影响因此,当施肥量一定时,水稻产量在取值上带有一定的量一定时,水稻产量在取值上带有一定的随机性随机性像这种像这种自变量取值一定时,因变量的取值带有一定随机性的两个自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系变量之间的关系叫做叫做相关关系相关关系 与函数关系不同,与函数关系不同,相关关系相关关系是一种是一种非确定性关系非确定性关系在现实生活中存在着大量的相关关系人的身高与年龄、在现实生活中存在着大量的相关关系人的身

3、高与年龄、产品的成本与生产数量、商品的销售额与广告费、家庭的产品的成本与生产数量、商品的销售额与广告费、家庭的支出与收入等都是相关关系支出与收入等都是相关关系相关关系相关关系函数函数相同点相同点不同点不同点对具有相关关系的两个变量进行统计分析的方法叫对具有相关关系的两个变量进行统计分析的方法叫回归分析回归分析 均是指两个变量的关系均是指两个变量的关系 非确定关系非确定关系 非随机变量与随机变量的关系非随机变量与随机变量的关系确定的关系确定的关系两个非随机变量的关系两个非随机变量的关系二二 散点图及线性回归散点图及线性回归为了得到变量为了得到变量x x、y y之间的关系之间的关系,在直角坐标系中

4、在直角坐标系中,标出每一标出每一组观测值组观测值(x,y),(x,y),得到表示具有相关关系的两个变量之间关得到表示具有相关关系的两个变量之间关系的图形系的图形,称为称为散点图散点图.举例:举例:XY施化肥量施化肥量1515202025253030353540404545水稻产量水稻产量330330345345365365405405445445450450455455散点图的作用在于:形象散点图的作用在于:形象反映各对数据的密切程度。反映各对数据的密切程度。对于图中的各个点,你对于图中的各个点,你发现有什么特点么发现有什么特点么?施化肥量施化肥量15152020252530303535404

5、04545水稻产量水稻产量330330345345 365365 405405 445445 450450 455455通过观察可以发现图表中的各个点大致分布在一条通过观察可以发现图表中的各个点大致分布在一条直线的附近。直线的附近。两个变量两个变量x x和和y y之间的散之间的散点图如果大致分布在一点图如果大致分布在一条直线的附近,通过求条直线的附近,通过求此直线的方程,找出两此直线的方程,找出两者之间的大致关系式者之间的大致关系式.从而估计两个变量的大从而估计两个变量的大致关系致关系,那就是那就是线性回线性回归问题归问题.思考:思考:在这些点附近可画直在这些点附近可画直线不止一条,哪条直线最

6、能线不止一条,哪条直线最能代表代表x与与y之间的关系呢?之间的关系呢?一般地,设一般地,设x x与与y y是具有相关关系的两个变量,且相应于是具有相关关系的两个变量,且相应于n n个观测值的个观测值的n n个点大致分布在一条直线的附近,我们来求个点大致分布在一条直线的附近,我们来求在整体上与这在整体上与这n n个点最接近的一条直线。个点最接近的一条直线。设所求的直线的方程是设所求的直线的方程是:yb xa(1,2,.,)iiybxa inix,b a其中其中 是待确定的参数,于是,当变量是待确定的参数,于是,当变量x x 取一组数值取一组数值 时,相应地时,相应地(在一般统计书中,习惯用在一般

7、统计书中,习惯用b b表示一次项系数,用表示一次项系数,用a a表表示常数项,这正好与我们表示一次函数的习惯相反示常数项,这正好与我们表示一次函数的习惯相反)于是得到各个偏差于是得到各个偏差y yi i i i=y yi i(bxbxi i+a a)(i i1,21,2,,n n)y.(1,2,.,)iiybxain各偏差为:各偏差为:().(1,2,.,)iiiiyyybxain 偏差偏差 的符号有正有负,相加相互抵消,所以和不能的符号有正有负,相加相互抵消,所以和不能代表几个点与相应直线在整体上的接近程度代表几个点与相应直线在整体上的接近程度.iiyy 为解决这一问题,我们采用为解决这一问

8、题,我们采用n个偏差的平方和个偏差的平方和 2221122()().()nnQybxaybxaybxa表示表示n n个点与相应直线在整体上的接近程度个点与相应直线在整体上的接近程度 记记作作 niiiabxyQ12)(niiiiiiiniiiniiiaabxxbayybxyabxyyyQ122221221)222()()(于是我们的问题是,如何求得系数于是我们的问题是,如何求得系数a a,b b,使使Q Q取得最小值取得最小值(Q Q用用来表示来表示n n个点个点与相应直线在整体与相应直线在整体上的上的接近程度接近程度。)。)直线方程直线方程:abxy 叫做叫做回归直线方程回归直线方程 .)(

9、)(2121121xbyaxnxxynyxxxyyxxbniiniiiniiniii niiniiynyxnx111,1其中其中相应的直线叫做相应的直线叫做回归直线回归直线,而对这两个变量所进行的,而对这两个变量所进行的统计分析则叫做统计分析则叫做线性回归分析线性回归分析借助这种方法,我们借助这种方法,我们就可以获得对两个变量之间整体关系的了解。就可以获得对两个变量之间整体关系的了解。利用配方法可以导出使利用配方法可以导出使Q Q取得最小值的取得最小值的a a、b b的求值公式的求值公式(此处略去不提)(此处略去不提)91 90 89 81 73 69 66 y 9 8 7 6 5 4 3 x

10、例例1:某个体服装店经营某种服装在某周获纯利某个体服装店经营某种服装在某周获纯利y(元元)与该周每天销与该周每天销 售这种服装件数售这种服装件数x之间有如下一组数据之间有如下一组数据:已知已知 (1)求求 (2)求纯利求纯利y与每天销售件数与每天销售件数x之间的回归方程之间的回归方程.3487,45309,28071712712iiiiiiiyxyx;,yx解解:(1).86.79)916966(61;6)943(71yx(2)设回归方程为设回归方程为.abxy.36.51,75.46728086.79673487772271271xbyaxxyxyxbiiiii练习练习1:1:针对某工厂某产

11、品与单位成本的资料进行线性回归分析针对某工厂某产品与单位成本的资料进行线性回归分析:月份月份 产量产量 (千件千件)x)x 单位成本单位成本 (元元/件件)y)y x x2 2 xyxy 1 1 2 2 7373 4 4 146146 2 2 3 3 7272 9 9 216216 3 3 4 4 7171 1616 284284 4 4 3 3 7373 9 9 276276 5 5 4 4 6969 1616 217217 6 6 5 5 6868 2525 340340 合计合计 2121 426426 7979 14811481解析解析:设回归直线方程为设回归直线方程为:,abxy,3

12、6.77621)8182.1(71,8182.1)621(6797162161481:,1481,79,716426,621261612abyxxyxiiiii从而可得故设回归直线方程为故设回归直线方程为:;82.136.77xy由于回归系由于回归系数数b b为为-1.82,-1.82,由回归系数由回归系数b b的意义可的意义可知知:产量每产量每增加增加10001000件件,单位成本下单位成本下降降1.821.82元元.下图下图是一组观测值的散点图我们看到,图中的各点并是一组观测值的散点图我们看到,图中的各点并不集中在一条直线的附近,但是按照上面的方法,同样不集中在一条直线的附近,但是按照上面

13、的方法,同样可以就这组数据求得一个回归直线方程这显然是毫无可以就这组数据求得一个回归直线方程这显然是毫无意义的于是提出一个意义的于是提出一个 问题:所求得的回归直线方程,在问题:所求得的回归直线方程,在 什么情况下才能对相应的一组观测什么情况下才能对相应的一组观测 值具有代表意义呢?值具有代表意义呢?12211()()()()niiinniiiixxyyrxxyy1222211即()()niiinniiiix ynxyrxnxyny对于变量对于变量y y与与x x的一组观测值来说,我们把的一组观测值来说,我们把 叫做变量叫做变量y y与与x x之间的之间的样本相关系数样本相关系数,(简称,(简

14、称相关系数相关系数),),用它来衡量它们之间的线性相关程度用它来衡量它们之间的线性相关程度例例在在7块并排、形状大小相同的试验田上进行施化肥量对水稻块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下产量影响的试验,得数据如下(单位:单位:kg)施化肥量施化肥量x15202530354045水稻产量水稻产量y330345365405445450455求变量求变量 y 与与 x 之间的相关系数之间的相关系数 7171222271)7)(7(7iiiiiiiyyxxyxyxr)3.39971132725)(3077000(3.3993078717522 0.9733 可以证明

15、,可以证明,|r r|1|1,且,且|r r|越接近于越接近于1 1,相关程度越大;,相关程度越大;|r r|越接近于越接近于0 0,相关程度越小,相关程度越小 一般地,当一般地,当|r r|与与1 1接近到什么程度才表明接近到什么程度才表明 y y与与 x x之间具有线之间具有线性相关关系呢?为明确这一点,通常采用对相关系数性相关关系呢?为明确这一点,通常采用对相关系数r r进行进行显显著性检验著性检验(简称相关性检验)的方法其中待检验的(简称相关性检验)的方法其中待检验的统计假统计假设是两个变量不具有线性相关关系设是两个变量不具有线性相关关系,检验的步骤如下,检验的步骤如下 1 1在附表在

16、附表3(P.59)3(P.59)中查出与显著性水平中查出与显著性水平0.050.05与自由度与自由度n n2 2(n n为观测值组数)相应的相关系数临界值为观测值组数)相应的相关系数临界值r r0.050.05。2根据公式计算根据公式计算r的值的值 3检验所得结果检验所得结果 如果如果|r r|r r0.050.05,那么可以认为,那么可以认为y y与与x x之间的线性相关关系不显著,从之间的线性相关关系不显著,从而接受统计假设而接受统计假设如果如果|r r|r r0.050.05,表明一个发生的概率不到,表明一个发生的概率不到5 5的事件在一次试验中竟的事件在一次试验中竟发生了这个小概率事件

17、的发生使我们有理由认为发生了这个小概率事件的发生使我们有理由认为y y与与x x之间不具有线之间不具有线性相关关系的假设是不成立的,拒绝这一统计假设,也就是表明可以性相关关系的假设是不成立的,拒绝这一统计假设,也就是表明可以认为认为y y与与x x之间具有线性相关关系之间具有线性相关关系 按照上述步骤,我们来检验一下第按照上述步骤,我们来检验一下第3636页水稻产量与施化肥页水稻产量与施化肥量之间是否存在线性相关关系量之间是否存在线性相关关系 1 1在附表在附表3 3中查出与显著性水平中查出与显著性水平0.050.05和自由度和自由度7 72 2相应的相相应的相关系数临界值关系数临界值r r0

18、.050.05=0.632=0.632 2 2前面已求得前面已求得r r0.9840.984 3 3因为因为r r r r0.050.05,这说明水稻产量与施化肥量之间存在着,这说明水稻产量与施化肥量之间存在着线性相关关系线性相关关系 这个结论表明,前面求得的关于这两个变量之间的回归这个结论表明,前面求得的关于这两个变量之间的回归直线方程是有意义的直线方程是有意义的 又如,在第又如,在第3838页产品月总成本与月产量关系的例子中,页产品月总成本与月产量关系的例子中,查得相应于显著性水平查得相应于显著性水平0.050.05和自由度和自由度12122 2的的r r0.050.05为为0.5760.

19、576,又算得又算得r r=0.998=0.998,由,由r r r r0.050.05,可知,可知,y y与与x x之间存在显著的之间存在显著的线性相关关系线性相关关系3 3、另外通过本节课的学习,我们看到,由部分观测另外通过本节课的学习,我们看到,由部分观测值得到的回归直线,可以对两个变量间的线形相关值得到的回归直线,可以对两个变量间的线形相关关系进行估计;关系进行估计;4 4、函数关系是一种理想的关系模型,而相关关系是函数关系是一种理想的关系模型,而相关关系是一种更一般的情况。一种更一般的情况。5 5、通常,在尚未确定两个变量之间是否具有线性相通常,在尚未确定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认其关关系的情况下,应先进行相关性检验,在确认其具有线性相关关系后,再求其回归直线方程。具有线性相关关系后,再求其回归直线方程。1 1、本节课我们学习了线形回归的几个基本概念:两、本节课我们学习了线形回归的几个基本概念:两个变量之间的相关关系,回归分析,散点图,回归个变量之间的相关关系,回归分析,散点图,回归直线方程,回归直线,线性回归分析;直线方程,回归直线,线性回归分析;2 2、共同探讨了已知各对数据如何求回归直线方程。共同探讨了已知各对数据如何求回归直线方程。其推导方法是利用配方法;其推导方法是利用配方法;

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中 > 数学 > 其他版本
版权提示 | 免责声明

1,本文(苏教版高中数学选修2-3线性回归课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|