第八章相关与回归分析课件.ppt

上传人(卖家):晟晟文业 文档编号:4907866 上传时间:2023-01-24 格式:PPT 页数:80 大小:1.91MB
下载 相关 举报
第八章相关与回归分析课件.ppt_第1页
第1页 / 共80页
第八章相关与回归分析课件.ppt_第2页
第2页 / 共80页
第八章相关与回归分析课件.ppt_第3页
第3页 / 共80页
第八章相关与回归分析课件.ppt_第4页
第4页 / 共80页
第八章相关与回归分析课件.ppt_第5页
第5页 / 共80页
点击查看更多>>
资源描述

1、第8章 回归分析1第八章 相关与回归分析 下一页返回目录第8章 回归分析2主要内容主要内容相关分析回归分析第8章 回归分析3第一节、相关分析的意义和任务 一、相关分析的概念 二、相关分析的种类 上一页下一页返回本章首页第8章 回归分析4一、相关分析的概念现实世界中现象之间存在着两种关系现实世界中现象之间存在着两种关系函数关系函数关系 它反映现象之间存在着严格的依存关系,在这种关系中,对于某一变量的每一个数值,都有另一个变量的确定值与之相对应,并且这种关系可以用一个数学表达式反映出来。上一页下一页返回本节首页第8章 回归分析5上一页下一页返回本节首页第8章 回归分析6相关关系相关关系它反映现象之

2、间确实存在的,但关系数值不固定的相互依存关系。这一概念表明:(1)相关关系是指现象之间确实存在数量上的相互依存关系。(2)现象之间数量依存关系的具体关系值不是固定的。上一页下一页返回本节首页第8章 回归分析7第8章 回归分析8相关关系与函数关系的联系和区别相关关系与函数关系的联系和区别由于有观察或测量误差等原因,函数关系在由于有观察或测量误差等原因,函数关系在实际中往往通过相关关系表现出来。在研究实际中往往通过相关关系表现出来。在研究相关关系时,又常常要使用函数关系的形式相关关系时,又常常要使用函数关系的形式来表现,以便找到相关关系的一般数量表现来表现,以便找到相关关系的一般数量表现形式。形式

3、。2 2、相关关系是统计学的研究范围;、相关关系是统计学的研究范围;函数关系是数学的研究范围。函数关系是数学的研究范围。第8章 回归分析9二、相关分析的种类根据相关因素的多少划分根据相关因素的多少划分 单相关:只涉及两个变量。单相关:只涉及两个变量。复相关:涉及三个或三个以上的变复相关:涉及三个或三个以上的变量。量。3.偏相关偏相关:在涉及到三个或三个以上的在涉及到三个或三个以上的变量时,假定其它变量维持不变,只研变量时,假定其它变量维持不变,只研究其中两个变量的相关关系,这种相关究其中两个变量的相关关系,这种相关关系叫偏相关关系叫偏相关上一页下一页返回本节首页第8章 回归分析10根据相关的形

4、式不同划分根据相关的形式不同划分 线性相关(直线相关):当一个变线性相关(直线相关):当一个变量变动时,另一个变量也相应地成比例量变动时,另一个变量也相应地成比例地变动。地变动。非线性相关(曲线相关):当一个非线性相关(曲线相关):当一个变量变动时,另一个变量也相应发生变变量变动时,另一个变量也相应发生变动,但这种变动不是成比例的。动,但这种变动不是成比例的。第8章 回归分析11根据相关关系的方向划分根据相关关系的方向划分 正相关:两个变量之间的变化方正相关:两个变量之间的变化方向一致,都是增长趋势或下降趋势。向一致,都是增长趋势或下降趋势。负相关:两个变量变化趋势相反,负相关:两个变量变化趋

5、势相反,一个下降而另一个上升,或一个上一个下降而另一个上升,或一个上升而另一个下降。升而另一个下降。上一页下一页返回本节首页第8章 回归分析12各类相关关系的表现形态图各类相关关系的表现形态图 第8章 回归分析13第二节相关分析方法 一、散点图和相关表 二、相关系数上一页下一页返回本章首页第8章 回归分析14一、散点图和相关表例例 近年来国家教育部决定将各高校的后近年来国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为勤社会化。某从事饮食业的企业家认为这是一这是一 个很好的投资机会,他得到十组个很好的投资机会,他得到十组高校人数与周边饭店的季销售额的数据高校人数与周边饭店的季销售额的

6、数据资料,并想资料,并想 据此决策其投资规模。据此决策其投资规模。上一页下一页返回本节首页第8章 回归分析15操作过程:操作过程:上一页下一页返回本节首页输入数据,如下图所示。输入数据,如下图所示。相关表是一种反映变量之间相关关系的统计表。第8章 回归分析16从从“插入插入”菜单中选择菜单中选择“图表图表”选项,打开选项,打开“图表向导图表向导”对话框如下图所示。在对话框如下图所示。在“图表图表类型类型”列表中选择列表中选择XY散点图,单击散点图,单击“下一步下一步”按钮。按钮。上一页下一页返回本节首页第8章 回归分析17在数据区域中输入在数据区域中输入B2:C11,选择,选择“系列产系列产生

7、在生在列列”,如下图所示,单击,如下图所示,单击“下一步下一步”按钮。按钮。上一页下一页返回本节首页第8章 回归分析18打开打开“图例图例”页面,取消图例,省略标题,如页面,取消图例,省略标题,如下图所示。下图所示。上一页下一页返回本节首页第8章 回归分析19单击单击“完成完成”按钮,便得到按钮,便得到XY散点图如下图散点图如下图所示。所示。050100150200250051015202530上一页下一页返回本节首页第8章 回归分析20相关关系的测度(相关系数)1.对变量之间关系密切程度的度量2.对两个变量之间线性相关程度的度量称为简单相关系数3.若相关系数是根据总体全部数据计算的,称为总体

8、相关系数,记为 4.若是根据样本数据计算的,则称为样本相关系数,记为 r第8章 回归分析21nyyxxyxnyyynxxxxyxx)()()(222的协方差:、的标准差:的标准差:复习:第8章 回归分析22上一页下一页返回本节首页yxxynyynxxnyyxxyyxxyyxxr22222)()()()()()(相关系数的涵义:相关系数是用来说明变量之间在直线相关条件下相关关系密切程度和方向的统计分析指标。第8章 回归分析23相关系数公式的涵义理解相关系数公式的涵义理解(1)两个变量之间的相关程度和方向,取决于两个变量离差乘积之和 ,当它为0时,为0;当它为正时,为正;当它为负时,为负。(2)相

9、关程度的大小与计量单位无关。为了消除积差中两个变量原有计量单位的影响,将各变量的离差除以该变量数列的标准差,使之成为相对积差,即 ,所以相关系数是无量纲的数量。)(yyxxrrryxyyxx和第8章 回归分析24yyxxxyyyxxxyLLLrLynyyyLxnxxxLyxnxyyyxxyyxxyyxxr22222222)(1)()(1)(1)()()()(由于:第8章 回归分析25)()()()(1)()(1(1)()()(22222222222yynxxnyxxynynyxnxyxnxyyyxxyyxxLLLrryyxxxyyxxy的计算公式:总结相关系数第8章 回归分析26相关系数的意义

10、相关系数的意义(1)r的取值在-1到+1之间。(2)r=+1,为完全正相关;r=-1为完全负相关。表明变量之间为完全线性相关,即函数关系。(3)r=0,表明两变量无线性相关关系。(4)r0,表明变量之间为正相关;r0,表明变量之间为负相关。(5)r的绝对值越接近于1,表明线性相关关系越密切;r越接近于0,表明线性相关关系越不密切。第8章 回归分析27相关程度可分为以下几种情况:相关程度可分为以下几种情况:,为无线性相关;0.3 0.5,为低度线性相关;0.5 0.8,为显著线性相关;0.8,一般称为高度线性相关。以上说明必须建立在相关系数通过显著性检验的基础之上。3.0rrrr相关系数的显著性

11、检验 相关系数是根据样本数据计算的,具有一定随机性,能否真实地表现变量总体的相关情况受到随机因素和样本容量大小的影响。故需要对其进行检验。样本相关系数的检验包括两类检验:(1)对总体相关系数是否等于0进行检验;(2)对总体相关系数是否等于某一给定的不为0的数值进行检验。对总体相关系数是否等于对总体相关系数是否等于0的检验的检验 总体相关系数的检验统计上用t检验。其步骤如下:第一步,提出原假设和备择假设。假设样本相关系数r是抽自具有零相关的总体,即第二步,规定显著性水平,并依据自由度(n-2)确定临界值;第三步,计算检验的统计量:212rnrT第四步,做出判断。将计算的统计量与临界值对比,若统计

12、量大于或等于临界值,表明变量间线性相关在统计上是显著的,若统计量小于临界值,则说明相关关系在统计上并不显著。第8章 回归分析31例题:相关系数的计算与检验:用计算器计算相关系数例 上一页下一页返回本节首页11.262228633.18043.81105511566.113277.2135881606.4544,880,10421454.207,4.36,822xyyxnyx9697.0104214854.20788804.366.454488804.36222222yyxxnnyxxynr第8章 回归分析32用计算机计算相关系数选取“工具”-“数据分析”选“相关系数”选“确定”输入“输入区域”

13、输入“输出区域”在“分组方式”中选“逐列”选“标志位于第一行”确定出现结果如下:上一页下一页xyx1.0000y0.96971.0000返回本节首页(三)相关系数检验 提出原假设和备择假设。取显著性水平 ,根据自由度 查 分布表得 =2.4469计算检验的统计量:=9.723605.062nt025.02/tt229697.01289697.012rnrT由于 ,则拒绝 ,表明变量间线性相关在统计上是显著的。即产品产量与生产费用之间的相关系数是显著的。2/tT 0H第8章 回归分析35第三节回归分析 一、回归分析的概念 二、直线回归 三、曲线回归 上一页下一页返回本章首页第8章 回归分析36一

14、、回归分析的概念 回归分析:回归分析就是对具有相关关系的变量之间数量变化的一般关系进行测定,确定一个相关的数学表达式,以便于进行估计或预测的统计方法。回归分析的种类:按自变量x的多少,可以分为一元回归和多元回归;按y与x曲线的形式,可以分为直线回归和曲线回归。上一页下一页返回本节首页回归分析按回归变量个数分按回归形式分一元回归多元回归线形回归非线性回归第8章 回归分析38二、直线回归简单直线回归方程的确定简单直线回归分析的特点(1)在变量之间,必须根据研究目的具体确定哪些是自变量,哪个是因变量。(2)回归方程的作用在于,在给定自变量的数值情况下来估计因变量的可能值。一个回归方程只能做一种推算。

15、推算的结果表明变量之间具体的变动关系。上一页下一页返回本节首页第8章 回归分析39(3)直线回归方程中,自变量的系数为回归系数。回归系数的符号为正时,表示正相关;回归系数的符号为负时,表示负相关。(4)确定回归方程时,只要求因变量是随机的,而自变量是给定的数值。上一页下一页返回本节首页第8章 回归分析40简单直线回归方程的确定设(x,y)为实际值,yc为估计值,采用普通最小二乘法,设拟合的直线为:根据最小二乘原理:上一页下一页返回本节首页bxayc为最小yycQ2第8章 回归分析41xbyanyxxynbxx22可以解得:上一页下一页返回本节首页0)()(2Q0)1()(2Q)()(22xbx

16、aybbxayabxayyyQc令:为最小为使第8章 回归分析42上一页下一页返回本节首页。试建立其线性回归方程,例:现有数据资料如下第8章 回归分析43上述资料可绘制如下折线图:上述资料可绘制如下折线图:图1生产费用与产量散点图0501001502000246810生产费用(万元)y上一页下一页返回本节首页第8章 回归分析44解:方法一:用计算器计算:110,55.4,6.4544,880,10421454.207,4.36,822yxxyyxnyx31.5155.49.121109.124.3654.20788804.366.45448222xbyanyxxynbxx故直线方程为yc=51

17、.31+12.9x第8章 回归分析45方法二:用Excel计算:先作散点图,然后添加趋势线。先作散点图,然后添加趋势线。用鼠标激活散点图,把鼠标放在用鼠标激活散点图,把鼠标放在任一数据点上,单击鼠标右键,打开菜任一数据点上,单击鼠标右键,打开菜单,在菜单栏里选择单,在菜单栏里选择“添加趋势线添加趋势线”选选项。项。上一页下一页返回本节首页第8章 回归分析46图2上一页下一页返回本节首页第8章 回归分析47打开打开“类型类型”页面,选择页面,选择“线性线性”选项,选项,Excel将显示一条拟合数据点的直线。将显示一条拟合数据点的直线。打开打开“选项选项”页面如下图所示,在对话框下部页面如下图所示

18、,在对话框下部选择选择“显示公式显示公式”和和“显示显示R平方根平方根”选项,选项,单击单击“确定确定”按钮,便得到回归图如下图所示。按钮,便得到回归图如下图所示。生产费用与产量散点图y=12.896x+51.323R2=0.94030501001502000246810生产费用(万元)y线性(生 产 费用(万元)y)上一页下一页返回本节首页第8章 回归分析48多元线性回归回归方程为xbxbyac2211要估计参数a、b1、b2手工计算较繁,可以用EXCEL数据分析功能完成。上一页下一页返回本节首页第8章 回归分析49例 某地区玻璃销售量与汽车产量、建筑业产值资料如左,试建立回归模型。上一页下

19、一页返回本节首页第8章 回归分析50操作过程在Excel中输入数据。在“工具”菜单中选择“数据分析”选项,打开“数据分析”对话框如下图所示。上一页下一页返回本节首页第8章 回归分析51在“分析工具”列表中选择“回归”选项,单击“确定”按钮,打开“回归”对话框如下图所示。上一页下一页返回本节首页第8章 回归分析52在Y值输入区域中输入B1:B19。在X值输入区域中输入C1:D19。选择“标志”,置信度选择95%。在“输出选项”中选择“输出区域”,在其右边的位置输入“E1”,单击“确定”按钮。输出结果如下图所示。上一页下一页返回本节首页第8章 回归分析53上一页下一页返回本节首页回归方程的显著性检

20、验回归方程的显著性检验 对于回归方程进行显著性检验基于以下两点:第一,在根据样本数据拟合回归方程时,我们首先假设变量 与 变量之间存在着线性关系,但这种假设是否成立?就必须通过检验才能证实;第二,样本回归方程 中的参数是对总体回归方程中参数 的最小二乘估计值,样本回归系数 能否作为总体回归系数 的估计值,还需要对总体回归系数的显著性进行检验。回归方程的检验一般包括两个方面的内容:一是线性关系的检验;二是回归系数的检验。第8章 回归分析56一、离差平方和的分解1.因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面由于自变量 x 的取值不同造成的除 x 以外的其他因素(如x

21、对y的非线性影响、测量误差等)的影响2.对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示第8章 回归分析57离差平方和的分解(图示)y第8章 回归分析58离差平方和的分解(三个平方和的关系)2.两端平方后求和有第8章 回归分析59离差平方和的分解(三个平方和的意义)1.总平方和总平方和(TSS)反映因变量的 n 个观察值与其均值的总离差2.回归平方和回归平方和(RSS)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和3.残差平方和残差平方和(ESS)反映除 x 以外的其他因素对

22、y 取值的影响,也称为不可解释的平方和或剩余平方和第8章 回归分析60统计量与二、拟合优度22RrTSSRSSTSSRSSTSSTSSESSr12总体平方和回归平方和的特点:2r;10)1(2 r;,回归方程拟合得越好值越接近1)2(2r度的影响。的不足:没有考虑自由2)3(r)1(n总体平方和:自由度为k回归平方和:自由度为)1(kn残差平方和:自由度为数。不含常数项的自变量个样本容量;:kn总体平方和残差平方和1第8章 回归分析61)1/()1/(1/12nTSSknRSSR自由度总体平方和自由度残差平方和作为拟合优度指标。用的不足,在实际应用中为克服22Rr:R2拟合优度指标第8章 回归

23、分析62回归方程的显著性检验(线性关系的检验)1.检验自变量和因变量之间的线性关系是否显著2.具体方法是将回归离差平方和(RSS)同剩余离差平方和(ESS)加以比较,应用F检验来分析二者之间的差别是否显著如果是显著的,两个变量之间存在线性关系如果不显著,两个变量之间不存在线性关系第8章 回归分析63回归方程的显著性检验(检验的步骤)1.提出假设H0:线性关系不显著第8章 回归分析64Excel的回归分析工具计算简便,但内容丰富,计算结果共分为三个模块:回归统计表 方差分析表回归参数 回归分析工具的输出解释上一页下一页返回本节首页第8章 回归分析66回归统计表包括以下几部分内容:Multiple

24、 R(复相关系数R):R2的平方根,又称为相关系数,它用来衡量变量x和y之间相关程度的大小。上节例中:R为0.9468,表示解释变量与被解释变量之间的关系是:高度正相关。.回归统计表上一页下一页返回本节首页第8章 回归分析67R Square(决定系数R2):用来说明用自变量解释因变量变差的程度,以衡量对观测值的拟合效果。上例中:决定系数为0.9731,表明用自变量可解释因变量变差的97.31%。TSSRSSyyyyTSSESSRyyyyyyRSSESSTSSiiiiii1)()()()()()()()(222222总平方和回归平方和残差平方和回归平方和总平方和第8章 回归分析68Adjust

25、ed R Square(调整的决定系数R2):仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型。上一页下一页返回本节首页)1/(1/12nTSSknRSSR)(调整的第8章 回归分析69标准误差:又称为标准回归误差或叫估计标准误差,它用来衡量拟合程度的大小,也用于计算与回归有关的其他统计量,此值越小,说明拟合程度越好。1)(12knyyniii第8章 回归分析70观测值:是指用于估计回归方程的数据的观测值个数。方差分析表方差分析表的主要作用是通过F检验来

26、判断回归模型的回归效果。上一页下一页返回本节首页)1/(/knRSSkESSF)1,()1/(/knkFknRSSkESSF第8章 回归分析71)1,(knkF1)1,(knkFF若则方程显著成立)1,(knkFF若能通过。则方程的显著性检验不椐样本计算查表分布示意图为:则分布的概率密度函数为设FxfF),()(xfx第8章 回归分析72(3)回归参数表Intercept:截距0第二、三行:0(截距)和1(斜率)的各项指标。第二列:回归系数0(截距)和1(斜率)的值。第三列:回归系数的标准误差第四列:根据原假设Ho:0=1=0计算的样本统计量t的值。第五列:各个回归系数的p值(双侧)第六列:0

27、和195%的置信区间的上下限。上一页下一页返回本节首页第8章 回归分析73t统计量)1(2kntctiiii12knRSS其中75.15338.55.14666.636.10119.543.9909.3X如:右上方的资料:个元素。主对角线上的第iXXcii1)(:yx1x22803.9099.43281.55.11910.36337.56.66614.5404.55.33815.75第8章 回归分析74x)(xf221)1(2knt)1(2kntt若过。则变量的显著性检验通)1(2 kntt若椐样本计算查表检验t有通过。则变量的显著性检验没第8章 回归分析75故直线方程为:yc=19.16+3

28、5.68x1+10.86x2上一页下一页返回本节首页第8章 回归分析76销售额销售额x 流通费率流通费率y1.51.5 7 74.5 4.84.5 4.87.57.5 3.6 3.610.510.5 3.1 3.113.513.5 2.7 2.716.516.5 2.5 2.519.519.5 2.4 2.422.522.5 2.3 2.325.525.5 2.2 2.2引例:有下列数据,试分析引例:有下列数据,试分析y与的与的x关系,关系,并预测当并预测当x=28时的时的y值。值。三、曲线回归上一页下一页返回本节首页第8章 回归分析77作散点图如下,作散点图如下,y与与x是曲线关系。是曲线关

29、系。流通费率y02468051015202530流通费率y上一页下一页返回本节首页第8章 回归分析78在在“图表图表”中选中选“添加趋势线添加趋势线”选曲线类型选曲线类型在在“选项选项”中选中选“显示公式显示公式”和和“显示显示R平方值平方值”确定确定上一页下一页返回本节首页第8章 回归分析79经试验不同模型,曲线方程如下:经试验不同模型,曲线方程如下:线性线性:y=0.165x+5.6275 R2=0.7351对数对数 y=-1.713lnx+7.3979 R2=0.9733 二次函数二次函数y=0.0132x2-0.5225x+7.246 R2=0.9537幂函数幂函数y=8.5173x-0.4259 R2=0.9928指数函数指数函数y=5.6852e-0.0437x R2=0.8502幂函数效果最好。幂函数效果最好。上一页下一页返回本节首页第8章 回归分析80 预测预测双击趋势线双击趋势线,打开打开“趋势线格式趋势线格式”,单击单击“选项选项”若预测若预测x=28x=28时时y y值值,在在“前推前推”中设置中设置2.52.5确定确定在图表中可以找到在图表中可以找到x=28x=28对应的对应的y y值值,约为约为2 2。上一页下一页返回本节首页

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第八章相关与回归分析课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|