第八章-相关分析与回归分析课件.ppt

上传人(卖家):ziliao2023 文档编号:5767444 上传时间:2023-05-07 格式:PPT 页数:54 大小:2.58MB
下载 相关 举报
第八章-相关分析与回归分析课件.ppt_第1页
第1页 / 共54页
第八章-相关分析与回归分析课件.ppt_第2页
第2页 / 共54页
第八章-相关分析与回归分析课件.ppt_第3页
第3页 / 共54页
第八章-相关分析与回归分析课件.ppt_第4页
第4页 / 共54页
第八章-相关分析与回归分析课件.ppt_第5页
第5页 / 共54页
点击查看更多>>
资源描述

1、第一节第一节 相关分析相关分析第二节第二节 回归分析回归分析第三节第三节 用用ExcelExcel计算相关系数和回归分析计算相关系数和回归分析 【学习目标学习目标】了解相关分析的基本概念了解相关分析的基本概念;掌握相关分析的主要方法掌握相关分析的主要方法;了解回归分了解回归分析的基本概念析的基本概念;了解相关分析及回归分析之间的关系了解相关分析及回归分析之间的关系;掌握相关分析的掌握相关分析的主要方法主要方法;掌握最小平方原理在回归分析中的简单应用。掌握最小平方原理在回归分析中的简单应用。【章前导读章前导读】通过本章学习,要对客观现象之间相互依存、相互制约的关系加通过本章学习,要对客观现象之间

2、相互依存、相互制约的关系加以分析,分析它们之间存在什么样的关系,相关关系的密切程度,并以分析,分析它们之间存在什么样的关系,相关关系的密切程度,并且用一定的数量表现出来。要掌握这种分析方法并能应用于实际。要且用一定的数量表现出来。要掌握这种分析方法并能应用于实际。要掌握回归分析的概念及一元线性回归的分析方法。掌握回归分析的概念及一元线性回归的分析方法。【本章重点本章重点】:相关关系的概念及相关系数的计算:相关关系的概念及相关系数的计算;回归分析的概念及回归分析的概念及一元线性回归分析的方法一元线性回归分析的方法;相关分析与回归分析的区别与联系。相关分析与回归分析的区别与联系。下一页下一页返回返

3、回引子引子:俗语中的相关,你知道吗俗语中的相关,你知道吗?人们在长期的实践生活中,总结出了很多俗语来形象地说明事物之间人们在长期的实践生活中,总结出了很多俗语来形象地说明事物之间的相关关系,比如的相关关系,比如“名师出高徒名师出高徒”,“强将手下无弱兵强将手下无弱兵”,“虎父无犬虎父无犬子子”,“龙生龙,凤生凤龙生龙,凤生凤”等。而现代统计学上的等。而现代统计学上的“相关相关”和和“回归回归”的的概念是高尔顿第一次使用的。概念是高尔顿第一次使用的。18861886年,高尔顿在研究人类身高的遗传时,搜集了年,高尔顿在研究人类身高的遗传时,搜集了10781078对父亲及其儿对父亲及其儿子的身高数据

4、。他发现这些数据的散点图大致呈直线状态,也就是说,总子的身高数据。他发现这些数据的散点图大致呈直线状态,也就是说,总的趋势是父亲的身高增加时,儿子的身高也倾向于增加。但是,高尔顿对的趋势是父亲的身高增加时,儿子的身高也倾向于增加。但是,高尔顿对试验数据进行了深入的分析,发现了一个很有趣的现象试验数据进行了深入的分析,发现了一个很有趣的现象回归效应。因为回归效应。因为当父亲高于平均身高时,他们的儿子身高比他更高的概率要小于比他更接当父亲高于平均身高时,他们的儿子身高比他更高的概率要小于比他更接的概率的概率;下一页下一页返回返回上一页上一页 父亲矮于平均身高时,他们的儿子身高比他更矮的概率要小于比

5、他更高的父亲矮于平均身高时,他们的儿子身高比他更矮的概率要小于比他更高的概率。它反映了一个规律,即后代的身高,有向他们父辈的平均身高回归概率。它反映了一个规律,即后代的身高,有向他们父辈的平均身高回归的趋势,这就是统计学上最初出现的趋势,这就是统计学上最初出现“回归回归”时的含义。高尔顿还引进了回时的含义。高尔顿还引进了回归直线、相关系数的概念,创始了回归分析。归直线、相关系数的概念,创始了回归分析。那么相关分析、回归分析到底是什么意思,它们对我们的生活又有哪那么相关分析、回归分析到底是什么意思,它们对我们的生活又有哪些帮助呢些帮助呢?一切客观事物都是相互联系和相互制约的。客观现象之间的相互联

6、系,一切客观事物都是相互联系和相互制约的。客观现象之间的相互联系,可以通过一定的数量关系反映出来。相关分析的含义可分为函数关系和相可以通过一定的数量关系反映出来。相关分析的含义可分为函数关系和相关关系。关关系。函数关系是指现象之间存在的严格依存的、确定的数量关系。例如,函数关系是指现象之间存在的严格依存的、确定的数量关系。例如,圆的面积与半径之间的关系,圆的面积与半径之间的关系,S=S=下一页下一页返回返回上一页上一页2R 一、相关关系的概念和特点一、相关关系的概念和特点1.1.相关关系的概念。相关关系,即现象之间存在着不完全确定的依存关系。相关关系的概念。相关关系,即现象之间存在着不完全确定

7、的依存关系。也就是说,当一个现象发生数量变化时,另一个也发生数量变化,但是这种也就是说,当一个现象发生数量变化时,另一个也发生数量变化,但是这种数量关系是不确定的,不是唯一的。例如,人们对消费品的需求量与人们的数量关系是不确定的,不是唯一的。例如,人们对消费品的需求量与人们的收入水平存在一定关系,收入越高,人们的消费量越大收入水平存在一定关系,收入越高,人们的消费量越大;收入越低,人们的消收入越低,人们的消费量越低,但同时消费量还受其他因素的影响,如消费习惯、消费预期等。费量越低,但同时消费量还受其他因素的影响,如消费习惯、消费预期等。2.2.相关关系的特点相关关系的特点 (1)(1)现象之间

8、确实存在数量上的相互依存关系。现象之间数量上的相互依存现象之间确实存在数量上的相互依存关系。现象之间数量上的相互依存关系表现在一个现象发生数量上的变化,另一个与之相联系的现象也会相应关系表现在一个现象发生数量上的变化,另一个与之相联系的现象也会相应地发生数量上的变化。例如,播种面积与收获量之间,播种面积越大,收获地发生数量上的变化。例如,播种面积与收获量之间,播种面积越大,收获量越大量越大;相反收获量越大,种植面积相应也较大。相反收获量越大,种植面积相应也较大。下一页下一页返回返回上一页上一页 在相互依存的两个变量中,可以根据研究的目的,把其中一个确定为自在相互依存的两个变量中,可以根据研究的

9、目的,把其中一个确定为自变量,一般用变量,一般用x x表示表示;把另外一个对应变化的变量确定为因变量,一般用把另外一个对应变化的变量确定为因变量,一般用y y来表来表示。比如,播种面积量作为自变量,则收获量就是因变量示。比如,播种面积量作为自变量,则收获量就是因变量;把收获量作为自变把收获量作为自变量,则播种面积就是因变量。量,则播种面积就是因变量。(2)(2)现象之间数量上的关系是不确定的。即一个变量虽受另一个现象之间数量上的关系是不确定的。即一个变量虽受另一个(或一组或一组)变量变量的影响,却并不由这一个的影响,却并不由这一个(或一组或一组)变量完全确定。如,体重与身高之间存在变量完全确定

10、。如,体重与身高之间存在一定的依存关系,但身高为一定的依存关系,但身高为1.701.70米的人,其体重有许多个值米的人,其体重有许多个值;体重为体重为6060千克的千克的人,其身高也有许多个值。身高与体重之间没有完全确定的数量关系存在。人,其身高也有许多个值。身高与体重之间没有完全确定的数量关系存在。相关关系和函数关系虽是两种不同类型的变量关系,但它们之间并无严格的相关关系和函数关系虽是两种不同类型的变量关系,但它们之间并无严格的界限。因测量误差的存在,确定的函数关系往往通过相关关系表现出来界限。因测量误差的存在,确定的函数关系往往通过相关关系表现出来;相反相反当人们对事物内部关系了解的越深刻

11、,相关关系就有可能转化为确定关系。当人们对事物内部关系了解的越深刻,相关关系就有可能转化为确定关系。下一页下一页返回返回上一页上一页 二、相关关系的种类二、相关关系的种类 现象之间的相关关系从不同的角度可以区分为不同类型。现象之间的相关关系从不同的角度可以区分为不同类型。1.1.按相关关系的方向划分按相关关系的方向划分 (1)(1)正相关。正相关是指两个变量之间的变化方向一致,即当一个变量的正相关。正相关是指两个变量之间的变化方向一致,即当一个变量的值增加,另一个变量值也相应地增加值增加,另一个变量值也相应地增加;当一个变量的值减少,另一个变量当一个变量的值减少,另一个变量值也随之减少。例如,

12、工人劳动生产率提高,产品产量也随之增加值也随之减少。例如,工人劳动生产率提高,产品产量也随之增加;居民居民的消费水平随个人所支配收入的增加而增加。正相关如的消费水平随个人所支配收入的增加而增加。正相关如图图8-18-1所示。所示。(2)(2)负相关。负相关是指两个变量的变化趋势相反,即当一个变量的值增负相关。负相关是指两个变量的变化趋势相反,即当一个变量的值增加或减少时,另一个变量的值反而减少或增加加或减少时,另一个变量的值反而减少或增加(图图8-28-2)。例如,商品流转。例如,商品流转额越大,商品流通费用越低额越大,商品流通费用越低;利润随单位成本的降低而增加。利润随单位成本的降低而增加。

13、下一页下一页返回返回上一页上一页2.2.按相关形式的不同划分按相关形式的不同划分 (1)(1)线性相关。又称直线相关,是指当一个变量变动时,另一变量随之发生线性相关。又称直线相关,是指当一个变量变动时,另一变量随之发生大致均等的变动。如大致均等的变动。如图图8-38-3所示,观察点的分布近似地表现为一条直线。所示,观察点的分布近似地表现为一条直线。(2)(2)非线性相关非线性相关(曲线相关曲线相关)。当一个变量变动时,另一变量也随之发生变动,。当一个变量变动时,另一变量也随之发生变动,但这种变动是不均等的。例如,工人加班时间在一定数量界限内,产量增但这种变动是不均等的。例如,工人加班时间在一定

14、数量界限内,产量增加,但一旦超过一定限度,产量反而可能下降,这就是一种非线性关系。加,但一旦超过一定限度,产量反而可能下降,这就是一种非线性关系。如如图图8-48-4所示,观察点的分布近似地表现为一条曲线。所示,观察点的分布近似地表现为一条曲线。3.3.按相关程度划分按相关程度划分 (1)(1)完全相关。当一个变量的数量变化完全由另一个变量的数量变化所唯一完全相关。当一个变量的数量变化完全由另一个变量的数量变化所唯一确定时,这两个变量之间的关系为完全相关。在这种情况下,相关关系实确定时,这两个变量之间的关系为完全相关。在这种情况下,相关关系实际就是函数关系,所以函数关系是相关关系的一种特殊情况

15、。际就是函数关系,所以函数关系是相关关系的一种特殊情况。下一页下一页返回返回上一页上一页 在价格不变的条件下,销售额与销售量之间的函数关系即为完全相关,此时在价格不变的条件下,销售额与销售量之间的函数关系即为完全相关,此时相关关系便成为函数关系,如相关关系便成为函数关系,如图图8-58-5所示。所示。(2)(2)不相关。如果两个变量彼此的数量变化相互独立,没有关系,这种关系不相关。如果两个变量彼此的数量变化相互独立,没有关系,这种关系称为不相关。例如,股票价格的高低与气温的高低一般情况下是不相关的,称为不相关。例如,股票价格的高低与气温的高低一般情况下是不相关的,不相关关系如不相关关系如图图8

16、-68-6所示。所示。(3)(3)不完全相关。它指的是两个变量之间的关系介于完全相关和不相关之间。不完全相关。它指的是两个变量之间的关系介于完全相关和不相关之间。大多数相关关系属于不完全相关,如大多数相关关系属于不完全相关,如图图8-78-7所示,就属于不完全相关关系。所示,就属于不完全相关关系。4.4.按自变量的多少划分按自变量的多少划分 (1)(1)单相关。只反映一个自变量和一个因变量之间的相关关系。单相关。只反映一个自变量和一个因变量之间的相关关系。(2)(2)复相关。反映两个或者两个以上的自变量同一个因变量的相关关系。例复相关。反映两个或者两个以上的自变量同一个因变量的相关关系。例如,

17、商品销售额与居民收入、商品价格之间的相关关系。如,商品销售额与居民收入、商品价格之间的相关关系。下一页下一页返回返回上一页上一页 三、相关关系的判定三、相关关系的判定 (一一)表格法表格法 表格法是一种反映变量之间相关关系的统计表。将某一变量按其取值表格法是一种反映变量之间相关关系的统计表。将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便可得到的大小排列,然后再将与其相关的另一变量的对应值平行排列,便可得到简单的相关表。简单的相关表。例例8-1 8-1 某地区某企业近某地区某企业近8 8年产品产量与生产费用的相关情况见年产品产量与生产费用的相关情况见表表8-l8-l

18、。从表从表8-18-1可以看出,产品产量与生产费用之间存在一定的正相关关系。可以看出,产品产量与生产费用之间存在一定的正相关关系。(二二)相关图。相关图又称散点图,它是将相关表中的观测值在平面直角坐相关图。相关图又称散点图,它是将相关表中的观测值在平面直角坐标系中用坐标点描绘出来,以表明相关点的分布状况。通过相关图,可以标系中用坐标点描绘出来,以表明相关点的分布状况。通过相关图,可以大致看出两个变量之间有无相关关系以及相关的形态、方向和密切程度。大致看出两个变量之间有无相关关系以及相关的形态、方向和密切程度。下一页下一页返回返回上一页上一页 例例8-2 8-2 以表以表8-18-1为例,用为例

19、,用ExcelExcel绘制相关图,其产品产量与生产费用的相关绘制相关图,其产品产量与生产费用的相关情况如情况如图图8-88-8所示。所示。通过相关散点图的形状,大概可以判断变量之间是否具有相关关系,通过相关散点图的形状,大概可以判断变量之间是否具有相关关系,以及相关方向、相关程度的强弱,但并不能得知其相关的确切程度。为精以及相关方向、相关程度的强弱,但并不能得知其相关的确切程度。为精确了解变量间的相关程度,还需作进一步统计分析。在统计上,一般通过确了解变量间的相关程度,还需作进一步统计分析。在统计上,一般通过计算相关系数来测定两种现象的相关程度。计算相关系数来测定两种现象的相关程度。(三三)

20、相关系数相关系数1.1.相关系数的意义相关系数的意义 相关系数是在直线相关的条件下,说明两个现象之间相关密切程度的相关系数是在直线相关的条件下,说明两个现象之间相关密切程度的统计分析指标,通常用统计分析指标,通常用r r来表示。相关系数来表示。相关系数r r的取值范围在的取值范围在-1-1和和+1+1之间,即之间,即-1 1r r1 1。正负号表明两变量间变化的方向。正负号表明两变量间变化的方向;|r|;|r|表明两变量间相关的程度,表明两变量间相关的程度,下一页下一页返回返回上一页上一页 即即r0r0表示正相关,表示正相关,-r0-r0表示负相关,表示负相关,r=0r=0表示无直线相关。表示

21、无直线相关。|r|r|越接近于越接近于1 1,表明两变量相关程度越高,它们之间的关系越密切。表明两变量相关程度越高,它们之间的关系越密切。r=r=1 1,表示两个变量完,表示两个变量完全直线相关。如果全直线相关。如果r=0r=0,则表示两个变量之间不是直线相关。这里要特别注意,则表示两个变量之间不是直线相关。这里要特别注意的是,的是,r r仅表示两个变量的直线相关密切程度,当仅表示两个变量的直线相关密切程度,当r r很小甚至等于零时,并不很小甚至等于零时,并不一定表不两个变量之间就不存在其他非直线类型的相关关系。为了在判断时一定表不两个变量之间就不存在其他非直线类型的相关关系。为了在判断时有个

22、标准,现在介绍一种相关关系密切程度的划分方法,见有个标准,现在介绍一种相关关系密切程度的划分方法,见表表8-28-2。2.2.相关系数的计算相关系数的定义公式为相关系数的计算相关系数的定义公式为下一页下一页返回返回上一页上一页2222222/yynxxnyxxynnyynxxnyyxxryxxy 式中式中:n:n为资料项数为资料项数;表示表示x x变量的标准差变量的标准差;表示表示y y变量的标准差变量的标准差;表示表示x x,y y变量数列的协方差。变量数列的协方差。在实际应用中,如果依据原始资料计算相关系数,数据计算过于复杂,在实际应用中,如果依据原始资料计算相关系数,数据计算过于复杂,因

23、此经常用下面的简化公式进行计算的。因此经常用下面的简化公式进行计算的。下一页下一页返回返回上一页上一页nxxx2nyyy2nyyxxxy/22222yynxxnyxxynr 例例8-3 8-3 计算计算1010个企业生产性固定资产价值与其工业增加值之间的相关系数。个企业生产性固定资产价值与其工业增加值之间的相关系数。资料见资料见表表8-38-3。将表将表8-38-3中的数据代人相关系数计算公式得中的数据代人相关系数计算公式得 上述计算结果表明,生产性固定资产价值和工业增加值之间存在高度的正上述计算结果表明,生产性固定资产价值和工业增加值之间存在高度的正相关关系。相关关系。返回返回上一页上一页9

24、918.03151087710664901031566230510222222yynxxnyxxynr 一、回归分析的概念和种类一、回归分析的概念和种类 回归分析是在相关分析的基础上,考察变量之间的数量变化规律,回归分析是在相关分析的基础上,考察变量之间的数量变化规律,并通过一定的数学表达式描述它们之间的关系,进而确定一个或几个变并通过一定的数学表达式描述它们之间的关系,进而确定一个或几个变量的变化对另一个特定变量的影响程度。相关分析旨在测度变量之间的量的变化对另一个特定变量的影响程度。相关分析旨在测度变量之间的密切程度,它所使用的测度工具就是相关系数密切程度,它所使用的测度工具就是相关系数;

25、而回归分析则侧重于考察而回归分析则侧重于考察变量之间的数量变化规律,其所使用的数学工具就是配合回归模型。变量之间的数量变化规律,其所使用的数学工具就是配合回归模型。回归分析有线性回归分析与非线性回归分析之分,其中线性回归分回归分析有线性回归分析与非线性回归分析之分,其中线性回归分析是我们研究的重点。在线性回归分析中,又有一元线性回归分析与多析是我们研究的重点。在线性回归分析中,又有一元线性回归分析与多元线性回归分析,后者指三个或者三个以上变量之间的回归分析。一元元线性回归分析,后者指三个或者三个以上变量之间的回归分析。一元线性回归分析是多元线性回归分析的基础,多元线性回归分析是一元线线性回归分

26、析是多元线性回归分析的基础,多元线性回归分析是一元线性回归分析的拓展。在本章只介绍一元线性回归分析。性回归分析的拓展。在本章只介绍一元线性回归分析。下一页下一页返回返回 二、回归分析和相关分析的关系二、回归分析和相关分析的关系1.1.相关分析与回归分析的区别相关分析与回归分析的区别(1)(1)相关分析所研究的两个变量是对等关系,回归分析所研究的两个变量不是相关分析所研究的两个变量是对等关系,回归分析所研究的两个变量不是对等关系,必须根据研究目的,先确定其中一个是自变量,另一个是应变量对等关系,必须根据研究目的,先确定其中一个是自变量,另一个是应变量 (2)(2)对两个变量对两个变量x x和和y

27、 y来说,相关系数反映的是两个变量之间相关的密切程度,来说,相关系数反映的是两个变量之间相关的密切程度,因此在计算相关系数时,改变因此在计算相关系数时,改变x x和和y y的地位不会影响相关系数的数值的地位不会影响相关系数的数值;回归分析回归分析有时可以根据研究目的的不同分别建立两个不同的回归方程。以有时可以根据研究目的的不同分别建立两个不同的回归方程。以x x为自变量,为自变量,y y为因变量,可以得出为因变量,可以得出y y对对x x的回归方程的回归方程;以以y y为自变量,为自变量,x x为因变量,可得出为因变量,可得出x x对对y y的回归方程。的回归方程。(3)(3)相关分析对资料的

28、要求是,两个变量都必须是随机变量,而回归分析对资相关分析对资料的要求是,两个变量都必须是随机变量,而回归分析对资料的要求是,自变量是可以控制的变量或给定的变量,因变量是随机变量。料的要求是,自变量是可以控制的变量或给定的变量,因变量是随机变量。下一页下一页返回返回上一页上一页2.2.相关分析与回归分析的联系相关分析与回归分析的联系 (1)(1)相关分析是回归分析的基础和前提。只有通过相关分析,确定客观相关分析是回归分析的基础和前提。只有通过相关分析,确定客观现象之间确实存在数量上的依存关系,而且其关系值又不确定的情况下,现象之间确实存在数量上的依存关系,而且其关系值又不确定的情况下,再进行分析

29、,在此基础所上建立的回归分析才有实际意义。假如对所研再进行分析,在此基础所上建立的回归分析才有实际意义。假如对所研究的客观现象不进行相关分析,直接进行回归分析,这样建立的回归方究的客观现象不进行相关分析,直接进行回归分析,这样建立的回归方程可能没有实际意义。程可能没有实际意义。(2)(2)回归分析是相关分析的深入和继续。对所研究的现象只做相关分析,回归分析是相关分析的深入和继续。对所研究的现象只做相关分析,研究它们之间相关的密切程度是不够的,统计上进行相关分析的目的是研究它们之间相关的密切程度是不够的,统计上进行相关分析的目的是为了进行回归分析,通过回归分析将有依存关系的变量间的不确定的数为了

30、进行回归分析,通过回归分析将有依存关系的变量间的不确定的数量关系加以确定,然后由已知自变量值推算未知自变量值,只有这样,量关系加以确定,然后由已知自变量值推算未知自变量值,只有这样,相关分析才会具有实际意义。相关分析才会具有实际意义。下一页下一页返回返回上一页上一页 三、简单直线回归模型三、简单直线回归模型1.1.简单直线回归模型的概念简单直线回归模型的概念 简单直线回归模型又称一元线性回归模型,它是根据两个变量的成对简单直线回归模型又称一元线性回归模型,它是根据两个变量的成对数据,配合直线方程式,并根据自变量的变动,来推算因变量的估计值的数据,配合直线方程式,并根据自变量的变动,来推算因变量

31、的估计值的一种统计分析方法。对于所要考察的变量一种统计分析方法。对于所要考察的变量y y来讲,若其主要影响因素只有来讲,若其主要影响因素只有一个变量一个变量x x,且,且y y与与x x呈线性相关关系,则可在变量呈线性相关关系,则可在变量y y与与x x之间建立数学模型之间建立数学模型 式中式中:为因变量为因变量y y的估计理论值的估计理论值;x;x为自变量的实际值为自变量的实际值;a,ba,b为待定参数,为待定参数,a a表表T T直线在直线在y y轴上的截距,轴上的截距,b b表示直线的斜率,又称为表示直线的斜率,又称为y y对对x x的回归系数,它的回归系数,它的实际意义即表示,当的实际

32、意义即表示,当x x每变化一个单位时,每变化一个单位时,y y的平均变化量。若的平均变化量。若x x前为前为“+”+”,表示当,表示当x x每增加一个单位时,每增加一个单位时,y y平均增加平均增加b b个单位个单位;下一页下一页返回返回上一页上一页bxayy 若若x x前为前为“-”-”,表不当,表不当x x每增加一个单位时,每增加一个单位时,y y平均减少平均减少b b个单位。个单位。x x前的前的“+”+”、“-”-”还分别表示还分别表示x x与与y y之间是正相关、负相关。之间是正相关、负相关。2.2.拟合简单直线回归模型的条件拟合简单直线回归模型的条件 (1)(1)两个变量之间确实存

33、在显著的相关关系。在进行回归分析之前进行相关分两个变量之间确实存在显著的相关关系。在进行回归分析之前进行相关分析,确定两变量的相关系数值,若两项变量之间确实具有显著相关关系时,析,确定两变量的相关系数值,若两项变量之间确实具有显著相关关系时,这样拟合的简单直线回归模型才有实际意义这样拟合的简单直线回归模型才有实际意义;相反若两变量之间没有相关关系相反若两变量之间没有相关关系或相关程度较低时,则拟合的回归模型就没有实际意义。或相关程度较低时,则拟合的回归模型就没有实际意义。(2)(2)两个变量之间确实存在着直线相关关系。若两个变量的成对数据绘成散点两个变量之间确实存在着直线相关关系。若两个变量的

34、成对数据绘成散点图,当这些散点近似于直线时,才能拟合简单直线回归模型。图,当这些散点近似于直线时,才能拟合简单直线回归模型。(3)(3)应用最小二乘法应用最小二乘法(又称最小平方法又称最小平方法)的原理拟合简单直线回归模型。应用最的原理拟合简单直线回归模型。应用最小平方法配合直线,其基本要求是实际值与估计理论值的离差平方和为最小小平方法配合直线,其基本要求是实际值与估计理论值的离差平方和为最小下一页下一页返回返回上一页上一页 用公式表示为用公式表示为:3.3.简单直线回归模型的参数估计。由拟合简单直线回归模型的条件可知,若简单直线回归模型的参数估计。由拟合简单直线回归模型的条件可知,若自变量与

35、因变量对应的散布点近似为直线,且计算出的相关系数具有显著的自变量与因变量对应的散布点近似为直线,且计算出的相关系数具有显著的相关关系,则可应用最小平方法拟合一条简单直线回归模型。具体方法如下相关关系,则可应用最小平方法拟合一条简单直线回归模型。具体方法如下:设简单直线回归模型为设简单直线回归模型为 ,其中,其中a,ba,b为待定参数,为待定参数,y y对对 的离差的离差平方和为平方和为Q Q,由最小平方法知,由最小平方法知:要使要使Q Q达到最小值,其必要条件是它对达到最小值,其必要条件是它对a a和和b b的一阶偏导,并令偏导等于零,即的一阶偏导,并令偏导等于零,即下一页下一页返回返回上一页

36、上一页最小。2;0yyyybxayy 值最小22Qbxayyy02Qbxaya 整理得整理得:解方程式,得到解方程式,得到:下一页下一页返回返回上一页上一页02Qxbxayb2xbxaxyxbnay 2222xxyxxyxxnyxxynbxbynxbnya 例例8-4 8-4 某地区某地区1010个同类工业企业生产性固定资产价值与工业增加值资料见个同类工业企业生产性固定资产价值与工业增加值资料见表表8-38-3,具体说明求解,具体说明求解a,ba,b值和建立简单直线回归方程的步骤和方法。值和建立简单直线回归方程的步骤和方法。(1)(1)设计求解参数设计求解参数a,ba,b的计算表及计算有关数据

37、。的计算表及计算有关数据。由例由例8-38-3可知两变量的相关系数为可知两变量的相关系数为0.99180.9918,得知二者之间存在高度的,得知二者之间存在高度的正相关关系,由此可建立正相关关系,由此可建立y y对对x x的直线回归方程。根据的直线回归方程。根据表表8-48-4的资料求出所的资料求出所需的有关数据。需的有关数据。(2)(2)将上述数据代人有关公式,求解将上述数据代人有关公式,求解a a和和b b的数值。的数值。下一页下一页返回返回上一页上一页 11.4106615.41031515.45442260435649010315662035102222nxbnyaxxyxxyxxny

38、xxynb (3)(3)将将a a和和b b的数值代人公式,得出工业增加值对生产性固定资产价值的直的数值代人公式,得出工业增加值对生产性固定资产价值的直线回归方程。线回归方程。其中,其中,a=4.11a=4.11,是回归直线在,是回归直线在y y轴上的截距轴上的截距;b=4.15;b=4.15,表示生产性固定资产,表示生产性固定资产每增加一个单位每增加一个单位(百万元百万元),工业增加值平均增加,工业增加值平均增加4.154.15百万元。百万元。(4)(4)利用回归直线模型进行预测。如某企业下一年生产性固定资产预计可利用回归直线模型进行预测。如某企业下一年生产性固定资产预计可达达4 4百万元,

39、在其他条件相对稳定时,可预测其工业增加值为百万元,在其他条件相对稳定时,可预测其工业增加值为 注意注意:一个直线回归方程只能作一种推算,不能相反进行另一种推算。一个直线回归方程只能作一种推算,不能相反进行另一种推算。即只能以自变量即只能以自变量x x推算因变量推算因变量y y,而不能以,而不能以y y推算推算x x。如上例所配合的直线回。如上例所配合的直线回归方程,只能在给定生产性固定资产价值时,来推算工业增加值,不可给归方程,只能在给定生产性固定资产价值时,来推算工业增加值,不可给定工业增加值来推算固定资产价值。定工业增加值来推算固定资产价值。下一页下一页返回返回上一页上一页xy15.411

40、.4百万元71.20415.411.4y 四、估计标准差四、估计标准差 建立回归方程的一个主要作用在于根据自变量的已知数据推算因变建立回归方程的一个主要作用在于根据自变量的已知数据推算因变量的估计值量的估计值 ,这个估计值,这个估计值 与与y y值可能相同,也可能不同,这就产生了值可能相同,也可能不同,这就产生了估计值的代表性问题。观察表估计值的代表性问题。观察表8-48-4中的数据,因变量的估计值中的数据,因变量的估计值 与实际观与实际观察值察值y y是不等的,其估计误差为是不等的,其估计误差为y-y-,且存在着一系列的估计误差。如何,且存在着一系列的估计误差。如何反映这些误差的大小呢反映这

41、些误差的大小呢?估计值的代表性到底如何呢估计值的代表性到底如何呢?一般可通过估计标一般可通过估计标准误差来测定,估计标准误差是用来说明回归方程代表性大小的统计指准误差来测定,估计标准误差是用来说明回归方程代表性大小的统计指标。其计算原理与标准差基本上相同,计算公式为标。其计算原理与标准差基本上相同,计算公式为 式中式中:SySy为估计标准误差为估计标准误差;n-2;n-2为自由度,因在一元线性回归方程中,计算为自由度,因在一元线性回归方程中,计算了了a,ba,b两个参数,即失去了两个自由度两个参数,即失去了两个自由度;下一页下一页返回返回上一页上一页y y y 2S2nyyy y y为因变量的

42、实际值,为因变量的实际值,是根据回归方程推算出来的因变量的估计值。是根据回归方程推算出来的因变量的估计值。在回归分析中,估计标准误差越小,表明实际值与估计值的估计误在回归分析中,估计标准误差越小,表明实际值与估计值的估计误差越小,也就是实际值越靠近估计值,则所拟合的回归模型的代表性越差越小,也就是实际值越靠近估计值,则所拟合的回归模型的代表性越高高;反之,估计标准误差越大,表明实际值与估计值的估计误差越大,也反之,估计标准误差越大,表明实际值与估计值的估计误差越大,也就是实际值越远离估计值,则所拟合的回归模型的代表性越低。就是实际值越远离估计值,则所拟合的回归模型的代表性越低。实际计算中,估计

43、标准误差用简化公式实际计算中,估计标准误差用简化公式下一页下一页返回返回上一页上一页2S2nxybyayyy 例例8-5 8-5 沿用例沿用例8-48-4的有关资料,说明回归标准误差的计算方法。的有关资料,说明回归标准误差的计算方法。经过有关计算已知经过有关计算已知n-2=8,n-2=8,=10877,y=315,xy=2305,x=4.11=10877,y=315,xy=2305,x=4.11b=4.15b=4.15 其结果表明,其结果表明,1010个企业工业增加值的估计理论值与实际值的平均误个企业工业增加值的估计理论值与实际值的平均误差为差为1.441.44百万元。由此可见,只有把回归估计

44、值与估计的标准误差结合百万元。由此可见,只有把回归估计值与估计的标准误差结合起来分析运用,才更具有实际意义。起来分析运用,才更具有实际意义。返回返回上一页上一页百万元44.18230515.431511.4108772S2nxybyayy2y 一、实训项目一、实训项目 用用ExcelExcel计算相关系数和回归分析。计算相关系数和回归分析。二、实训目的与要求二、实训目的与要求 掌握掌握ExcelExcel在相关与回归中的作用,熟练运用在相关与回归中的作用,熟练运用ExcelExcel进行相关分析和进行相关分析和回归分析。回归分析。三、实训资料三、实训资料 某班某班1010名学生的身高和体重的情

45、况见名学生的身高和体重的情况见表表8-58-5。要求用。要求用ExcelExcel对身高和对身高和体重进行相关分析和回归分析。体重进行相关分析和回归分析。下一页下一页返回返回 四、操作步骤四、操作步骤 启动启动Excel 2003Excel 2003,新建一个工作簿,新建一个工作簿Book 1Book 1。第一步,将实训资料中的数据输入到工作表中,如第一步,将实训资料中的数据输入到工作表中,如图图8-98-9所示。所示。第二步,对这第二步,对这1010名学生的身高和体重进行相关分析和回归分析。名学生的身高和体重进行相关分析和回归分析。1.1.相关分析相关分析 用用ExcelExcel计算相关分

46、析有两种方法计算相关分析有两种方法:一种是利用相关系数函数,另一种是一种是利用相关系数函数,另一种是利用相关分析宏。利用相关分析宏。(1)(1)利用相关系数函数计算相关系数。在利用相关系数函数计算相关系数。在ExcelExcel中,提供了计算两个变量间中,提供了计算两个变量间相关系数的方法,即相关系数的方法,即CORREICORREI函数和函数和PERSONPERSON函数,这两个函数计算的原理是函数,这两个函数计算的原理是相同的。这里只介绍利用相同的。这里只介绍利用CORRELCORREL函数计算相关系数。函数计算相关系数。下一页下一页返回返回上一页上一页 首先,选择任一空白单元格,单击首先

47、,选择任一空白单元格,单击“插入插入”菜单,选择菜单,选择“函数函数”选项,打选项,打开开“插入函数插入函数”对话框。在对话框。在“选择类别选择类别”中选择中选择“统计统计”,在,在“选择函数选择函数”中选择中选择CORREICORREI,如,如图图8-108-10所示。所示。其次,单击其次,单击“确定确定”按钮后,出现按钮后,出现CORREICORREI对话框,在对话框,在ArraylArrayl中输入中输入“B2:Bll”B2:Bll”,在,在Array2Array2中输入中输入“C2:C11”C2:C11”,此时,在该对话框的下方显示,此时,在该对话框的下方显示出计算结果出计算结果0.8

48、5430.8543,即为这,即为这1010名学生身高与体重的相关系数,如名学生身高与体重的相关系数,如图图8-118-11。(2)(2)利用相关系数宏计算相关系数。首先,单击利用相关系数宏计算相关系数。首先,单击“工具工具”菜单,选择菜单,选择“数据数据分析分析”选项,在选项,在“数据分析数据分析”选项中选择选项中选择“相关系数相关系数”,如,如图图8-128-12所示。所示。其次,单击其次,单击“确定确定”按钮后,出现按钮后,出现“相关系数相关系数”对话框。在对话框。在“输入区域输入区域”中输入中输入“$B$1:$C$11”,“$B$1:$C$11”,“分组方式分组方式”中选择中选择“逐列逐

49、列”,同时勾选,同时勾选“标志位标志位于第一行于第一行”,在,在“输出区域输出区域”输入输入“$D$1”$D$1”,如,如图图8-138-13所示。所示。下一页下一页返回返回上一页上一页 然后单击然后单击“确定确定”按钮,输出结果如按钮,输出结果如图图8-148-14所示。所示。在图在图8-148-14中的输出结果中,身高和体重的自相关系数均为中的输出结果中,身高和体重的自相关系数均为1 1,身高和,身高和体重的相关系数为体重的相关系数为0.85430.8543,与利用函数计算的相关系数是一致的。,与利用函数计算的相关系数是一致的。2.2.回归分析回归分析 首先,单击首先,单击“工具工具”菜单

50、,选择菜单,选择“数据分析数据分析”选项,出现选项,出现“数据分析数据分析”对对话框,在话框,在“分析工具分析工具”中选择中选择“回归回归”选项,如选项,如图图8-158-15所示。所示。其次,单击其次,单击“确定确定”按钮,弹出按钮,弹出“回归回归”对话框。在对话框。在“Y Y值输入区域值输入区域”输输入入“$C$2:$C$11”$C$2:$C$11”,在,在“X X值输入区域值输入区域”输入输入“$B$2:$B$11”$B$2:$B$11”,在,在“输输出区域出区域”中选择中选择“新工作表组新工作表组”,如,如图图8-168-16所示。最后,单击所示。最后,单击“确定确定”按按钮,即得到回

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第八章-相关分析与回归分析课件.ppt)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|