1、中级经济师中级经济师经济基础知识经济基础知识:经济学基础经济学基础第第23章相关与回归分析章相关与回归分析12022-10-3一、相关关系的概念一、相关关系的概念(一)函数关系与相关关系(一)函数关系与相关关系1.函数关系函数关系 函数关系指变量之间具有的严格的确定性的函数关系指变量之间具有的严格的确定性的依存关系。当一个或几个变量取一定的值时,依存关系。当一个或几个变量取一定的值时,另一个变量有确定值与之相对应。另一个变量有确定值与之相对应。函数关系的例子函数关系的例子某种商品的销售额某种商品的销售额与销售量与销售量之间的关系可表示为之间的关系可表示为为单价为单价圆的面积圆的面积与半径与半径
2、 之间的关系可表示为之间的关系可表示为企业的原材料消耗额企业的原材料消耗额与产量与产量单位产量消耗单位产量消耗原材料价格原材料价格之间的关系可表示为之间的关系可表示为2022-10-3(1 1)变量之间数值是一一对应的确定关系)变量之间数值是一一对应的确定关系,可用可用一个数学表达式表示。一个数学表达式表示。(2 2)设有两个变量)设有两个变量x x和和y y,变量,变量y y 随变量随变量x x 一起一起变化,并完全依赖于变化,并完全依赖于x x,当变量,当变量x x取某个数取某个数值时,值时,y y 依确定的关系取相应的值,则称依确定的关系取相应的值,则称y y是是x x的函数,记为的函数
3、,记为y y=f f(x x),其中,其中x x称为自变称为自变量,量,y y称为因变量称为因变量;(3 3)各观测点落在一条线上。)各观测点落在一条线上。函数关系的特点:函数关系的特点:2022-10-32.相关关系相关关系 指客观现象之间确实存在的但数量上不是严格指客观现象之间确实存在的但数量上不是严格对应的依存关系。即变量间关系不能用函数关系对应的依存关系。即变量间关系不能用函数关系精确表达,当变量精确表达,当变量x x取某个值时,变量取某个值时,变量y y的取值可的取值可能有几个。能有几个。相关关系的例子相关关系的例子商品的消费量商品的消费量与居民收入与居民收入之间的关系之间的关系商品
4、销售额商品销售额与广告费支出与广告费支出之间的关系之间的关系粮食亩产量粮食亩产量与施肥量与施肥量降雨量降雨量温度温度之间的关系之间的关系收入水平收入水平与受教育程度与受教育程度之间的关系之间的关系2022-10-3相关关系的特点:相关关系的特点:(1 1)变量间关系不能用函数关系精确表达;)变量间关系不能用函数关系精确表达;(2 2)一个变量的取值不能由另一个变量唯一)一个变量的取值不能由另一个变量唯一确定;确定;(3 3)当变量)当变量 x x 取某个值时,变量取某个值时,变量 y y 的取值的取值可能有几个;可能有几个;(4 4)各观测点分布在直线附近。)各观测点分布在直线附近。2022-
5、10-3函数关系与相关关系的联系函数关系与相关关系的联系函数关系往往通过相关关系表现出来。把影响因变量变动的因素全部纳入函数关系往往通过相关关系表现出来。把影响因变量变动的因素全部纳入方程,这时的相关关系就有可能转化为函数关系。方程,这时的相关关系就有可能转化为函数关系。相关关系经常可以用一定的函数形式去近似地描述。相关关系经常可以用一定的函数形式去近似地描述。2022-10-3例:有数据显示世界各国平均每人拥有电视机数例:有数据显示世界各国平均每人拥有电视机数x x及居民预期寿命及居民预期寿命y y之间有很之间有很强的正相关,可否认为电视机很多的国家,居民预期寿命比较长?强的正相关,可否认为
6、电视机很多的国家,居民预期寿命比较长?有人测试出火灾现场的消防员人数和该场火灾造成的损害之间有很强的正有人测试出火灾现场的消防员人数和该场火灾造成的损害之间有很强的正相关相关 ,可否认为派出的消防员越多造成的损害越大,可否认为派出的消防员越多造成的损害越大?(二)相关关系与因果关系(二)相关关系与因果关系因果关系因果关系相关关系;相关关系;现象之间是因果关系同时是相关关系,但是相关关系不一定是因果关系。现象之间是因果关系同时是相关关系,但是相关关系不一定是因果关系。统计只能说明现象间有无数量上的关系,不能说明谁因谁果。统计只能说明现象间有无数量上的关系,不能说明谁因谁果。确定因果关系的方法确定
7、因果关系的方法定性分析。定性分析。2022-10-3自变量:是引起某种结果变化的原因,它是可以控制、给定的值,常用自变量:是引起某种结果变化的原因,它是可以控制、给定的值,常用x表表示;示;因变量:是自变量变化的引起结果量,它是不确定的值,常用因变量:是自变量变化的引起结果量,它是不确定的值,常用y表示。表示。它们的表现形式有:它们的表现形式有:一种原因引起一种结果;一种原因引起一种结果;多种原因引起一种结果;多种原因引起一种结果;还有变量之间是互为因果的关系。还有变量之间是互为因果的关系。相关分析时,一般不区分原因和结果。相关分析时,一般不区分原因和结果。自变量与因变量自变量与因变量2022
8、-10-3二、相关关系的种类二、相关关系的种类 1.1.按相关的程度分按相关的程度分完全相关完全相关:当一个变量的变化完全由另一个变量所:当一个变量的变化完全由另一个变量所决定时,称变量间的这种关系为为完全相关关系,这决定时,称变量间的这种关系为为完全相关关系,这种严格的依存关系实际上就是函数关系。种严格的依存关系实际上就是函数关系。不相关不相关:当两个变量的变化相互独立、互不影响时:当两个变量的变化相互独立、互不影响时,称这两个变量不相关(或零相关)。,称这两个变量不相关(或零相关)。不完全相关不完全相关:当变量之间存在不严格的依存关系时:当变量之间存在不严格的依存关系时,称为不完全相关。,
9、称为不完全相关。不完全相关关系是现实当中相关关系的主要表现形式不完全相关关系是现实当中相关关系的主要表现形式,是相关分析的主要研究对象。,是相关分析的主要研究对象。2022-10-32.2.按相关的方向按相关的方向正相关正相关:当一个变量随着另一个变量的增加当一个变量随着另一个变量的增加(减少)而增加(减少),即两者同向变化时,(减少)而增加(减少),即两者同向变化时,称为正相关。称为正相关。如家庭收入与家庭支出之间的关系。如家庭收入与家庭支出之间的关系。负相关负相关:当一个变量随着另一个变量的增加当一个变量随着另一个变量的增加(减少)而减少(增加),即两者反向变化时,(减少)而减少(增加),
10、即两者反向变化时,称为负相关。称为负相关。如产品产量与单位成本之间的关系,单位成本如产品产量与单位成本之间的关系,单位成本会随着产量的增加而减少。会随着产量的增加而减少。2022-10-33 3、按相关的形式按相关的形式线性相关线性相关:当变量之间的依存关系大致呈现为当变量之间的依存关系大致呈现为线性形式,即当一个变量变动一个单位时,另一线性形式,即当一个变量变动一个单位时,另一个变量也按一个大致固定的增(减)量变动,就个变量也按一个大致固定的增(减)量变动,就称为线性相关。称为线性相关。非线性相关非线性相关:当变量间的关系不按固定比例变当变量间的关系不按固定比例变化时,就称之为非线性相关。化
11、时,就称之为非线性相关。2022-10-34.4.按研究变量的多少按研究变量的多少单相关单相关:两个变量之间的相关,称为单相关。两个变量之间的相关,称为单相关。复相关复相关:一个变量与两个或两个以上其他变量一个变量与两个或两个以上其他变量之间的相关,称为复相关。之间的相关,称为复相关。偏相关偏相关:在复相关的研究中,假定其他变量不在复相关的研究中,假定其他变量不变,专门研究其中两个变量之间的相关关系时变,专门研究其中两个变量之间的相关关系时称其为偏相关。称其为偏相关。注意:并非所有的变量之间都存在相关关系,因此需要用相关分析方法来识注意:并非所有的变量之间都存在相关关系,因此需要用相关分析方法
12、来识别和判断。别和判断。一、变量之间的相关关系一、变量之间的相关关系13分类标准分类标准类别类别内含内含相关的相关的程度程度完全相关一个变量的取值变化完全由另一个变量的取值变化所确定。称这两个变量完全相关。如价格不变的条件下,某种商品的销售总额由其销售量决定。不完全相关介于完全相关和不相关之间。大部分相关现象均属于不完全相关。不相关两个变量的取值变化彼此互不影响。如股票的价格与气温的高低。相关的相关的方向方向正相关一个变量的取值由小变大,另一个变量的取值也相应的由小变大。(两个变量同方向变化)。负相关一个变量的取值由小变大,另一个变量的取值由大变小(两个变量反方向变化)相关的相关的形形式式线性
13、相关两个相关变量之间的关系大致呈现为线性关系。非线性相关两个相关变量之间的关系不表现直线的关系,而近似于某种曲线方程的关系。2022-10-3相关分析的主要内容相关分析的主要内容1.1.确定现象之间有无关系确定现象之间有无关系?2.2.有什么样的关系?有什么样的关系?3.3.关系的强弱?关系的强弱?5.5.是否伪关系?是否伪关系?4.4.总体也有这种关系吗?总体也有这种关系吗?2022-10-3定性分析定性分析定量分析定量分析相关分析的方法相关分析的方法2022-10-3(一)相关表(一)相关表相关表是一种反映变量之间相关关系的统计表。对于两个基本变量相关表是一种反映变量之间相关关系的统计表。
14、对于两个基本变量x x和和y y,通过观察和实验,我们可以得到关于通过观察和实验,我们可以得到关于x x和和y y的若干组数据,记为的若干组数据,记为(,)(i=1)(i=1,2 2,n)n)。将这些数据按的值由小到大(或由大到小)。将这些数据按的值由小到大(或由大到小)以序列表表示,即构成相关表。以序列表表示,即构成相关表。ixiy某地区居民人均收入水平(某地区居民人均收入水平(x x)与食品支出占生活费支出的比重)与食品支出占生活费支出的比重(y)(y)之间之间具有相关关系,编制相关表如下表:具有相关关系,编制相关表如下表:人均收入水平人均收入水平 (x x)/)/元元 280340390
15、5306506707908809101050食品支出占生活食品支出占生活费支出的比重费支出的比重 (y y)/%)/%68.367.566.264.956.760.254.449.050.543.62022-10-3用直角坐标系的横轴代表变量用直角坐标系的横轴代表变量x x,纵轴代表变量,纵轴代表变量y y,将两个变量间相对应的变,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。45505560657020040060080010001200XY(二)散点图(相关图)(二)散点图(相关图)2022-10-
16、3(a)正相关直线相关(b)负相关直线相关(c)正相关曲线相关x x与与y y关系散点图的主要类型关系散点图的主要类型2022-10-3(d)负相关曲线关系(e)负相关直线相关(相关程度较小)(f)不相关2022-10-3(三)相关系数(三)相关系数(相关关系的测度)(相关关系的测度)相关系数的意义:相关系数的意义:(1)对变量之间关系密切程度的度量;)对变量之间关系密切程度的度量;(2)若相关系数是根据总体全部数据计算的,称为总体相关系数,记为)若相关系数是根据总体全部数据计算的,称为总体相关系数,记为;若是根据样本数据计算的,则称为样本相关系数,记为若是根据样本数据计算的,则称为样本相关系
17、数,记为 r;(3)对两个变量之间线性相关程度的度量称为简单相关系数;)对两个变量之间线性相关程度的度量称为简单相关系数;(4)将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线)将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。复判定系数等。2022-10-3n1 1、由未分组资料计算相关系数公式、由未分组资料计算相关系数公式:积差法积差法以两个变量与各自均值的离差为基础,通过两个离差相乘来反映变量之以两个变量与各自均值的离差为基础,通过两
18、个离差相乘来反映变量之间相关程度。间相关程度。基本公式:基本公式:yxxyr2其中,其中,nxxx2)(nyyy2)(x x和和y y的协方差的协方差x x的标准差的标准差y y的标准差的标准差nyyxxxy)(2相关系数的计算:相关系数的计算:2022-10-322)()()(yyxxyyxxr上述公式还可以变换为其它形式,如:nxxxnxxnxnnxxxnxxx22222222)(222)(yynyy22)(nyxxyyyxx)()2()(222xxxxxx2022-10-32222)(1)(11ynyxnxyxnxyr2222)()(yynxxnyxxynr 2222)()(jjjjji
19、iiiijjiiijjiijfyfyffxfxffyfxfyxfrn2 2、由变量数列资料计算相关系数公式、由变量数列资料计算相关系数公式:2022-10-33、相关系数取值及其意义相关系数取值及其意义相关系数的值介于相关系数的值介于1与与+1之间,即之间,即1r+1。2022-10-3(1 1)当)当r0r0时,表示两变量正相关,时,表示两变量正相关,r0r0时,两变量为负相关时,两变量为负相关;(2 2)当)当|r|=1|r|=1时,表示两变量为完全线性相关,即为函数关系时,表示两变量为完全线性相关,即为函数关系;(3 3)当)当r=0r=0时,表示两变量间无线性相关关系,它并不意味着与之
20、间时,表示两变量间无线性相关关系,它并不意味着与之间不存在其他类型的关系不存在其他类型的关系;(4 4)当)当0|r|10|r|0 0,说明两变量之间正线性相关;,说明两变量之间正线性相关;2 2)所有相关点都为负相关,则)所有相关点都为负相关,则 0 0,说明两变量之间负线性相关;,说明两变量之间负线性相关;3 3)在全部相关点中,既有正相关、又有负相关和零相关,这时计算协方)在全部相关点中,既有正相关、又有负相关和零相关,这时计算协方差时就会出现正负抵消。抵消的结果为正数,为正相关;为负数就是负相差时就会出现正负抵消。抵消的结果为正数,为正相关;为负数就是负相关。关。2xy2xy2xy20
21、22-10-3【例例】根据上述资料,计算人均消费与人均国内生产总值的直线相关系根据上述资料,计算人均消费与人均国内生产总值的直线相关系数。数。2022-10-39938.02873494547496961395433057667928734613952022998529222222 yynxxnyxxynr将上表计算结果代入公式为:将上表计算结果代入公式为:相关系数较大,这说明人均消费额与人均国内生产总值高度相关。相关系数较大,这说明人均消费额与人均国内生产总值高度相关。2022-10-3四、相关分析中应注意的问题四、相关分析中应注意的问题(一)相关系数是说明变量之间线性联系程度的(一)相关系
22、数是说明变量之间线性联系程度的,相关系数很小的变量间可能存在非线性联系,相关系数很小的变量间可能存在非线性联系。(二)相关系数不能解释两变量间的因果关系,(二)相关系数不能解释两变量间的因果关系,警惕虚假相关导致的错误结论。警惕虚假相关导致的错误结论。(三)不要在相关关系据以成立的数据范围以外,(三)不要在相关关系据以成立的数据范围以外,推论这种相关关系仍然保持。推论这种相关关系仍然保持。第二节第二节 回归分析回归分析v【本节考点】【本节考点】1.回归分析的概念2.一元线性回归模型30 相关分析与回归分析的联系相关分析与回归分析的联系共同的研究对象:都是对变量间相关关系的分析只有当变量间存在相
23、关关系时,用回归分析去寻求相关的具体数学形式才有实际意义相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析 相关分析中相关系数的确定建立在回归分析的基础上相关分析与回归分析相关分析与回归分析回归的古典意义回归的古典意义:高尔顿遗传学的回归概念高尔顿遗传学的回归概念 父母身高与子女身高的关系父母身高与子女身高的关系:无论高个子或低个子的子女无论高个子或低个子的子女 都有向人的平均身高回归的都有向人的平均身高回归的 趋势趋势回归的现代意义回归的现代意义一个因变量对若干解释变量依存关系的研究回归的目的目的(实质)(实质):由固定的自变量去估计因变量的平均值由固定的
24、自变量去估计因变量的平均值估计因变估计因变量平均值量平均值regression model回归分析与相关分析的关系回归分析与相关分析的关系v(一)联系(一)联系v1.它们具有共同的研究对象具有共同的研究对象。v2.在具体应用时,常常必须互相补充。v相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有高度相关时,进行回归分析寻求其相关的具体只有高度相关时,进行回归分析寻求其相关的具体形式才是有意义的。形式才是有意义的。39回归分析与相关分析的关系回归分析与相关分析的关系v(二)区别(二)区别v相关分析与回归分析在相关分析与回归分析在
25、研究目的和方法上具有明显的区别研究目的和方法上具有明显的区别v1、相关分析研究变量之间相关的方向和相关的程度。v2、回归分析是研究变量之间相关关系的具体形式,、回归分析是研究变量之间相关关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定相关的数学方程式,根据这个数学方程式可以从已知量来推测未知量可以从已知量来推测未知量,从而为估算和预测提供了一个重要方法。40二、一元线性回归模型二、一元线性回归模型v1、一元线性回归模型、一元线性回归模型v一元线性回归模型,是研究两个变量之间相关关系的最简单的回归模型。为模型的参数;即误差项,是一个随机变量。vX为自变量。v一元线性回归只涉及一
26、个自变量一元线性回归只涉及一个自变量。描述因变量如何依赖自变量和误差项的方程称为回归模型。v在现实中,模型的参数在现实中,模型的参数 都是未知的,需要利用样本数据去估计,采用的采用的估计方法是最小二乘法。估计方法是最小二乘法。最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计 的方法。41二、一元线性回归模型二、一元线性回归模型v2、回归模型的拟合效果分析、回归模型的拟合效果分析v一般情况下,使用估计的回归方程之前,需要对模型进行检验,其内容包括:v(1)结合经济理论和经验分析回归系数的经济含义是否合理;v(2)对模型进行假设检验。42二、一元线性回归模型二、一元线性回归模型v
27、(3)分析估计的模型对数据的拟合效果如何(用决定系数来测度)(用决定系数来测度)v决定系数,也称为决定系数,也称为R2,可以测度回归直线对样本数据的拟合程度,可以测度回归直线对样本数据的拟合程度。v决定系数的取值在决定系数的取值在0到到1之间之间,大体说明了回归模型所能解释的因变量变化占因变量总变化的比例。决定系数越接近决定系数越接近1,回归直线的拟合效果越,回归直线的拟合效果越好。好。vR2=1,说明回归直线可以解释因变量的所有变化。,说明回归直线可以解释因变量的所有变化。vR2=0,说明回归直线无法解释因变量的变化,因变量的变化与自变量无,说明回归直线无法解释因变量的变化,因变量的变化与自
28、变量无关。关。43因变量y与自变量x之间为线性关系x10y xy1001010最小niiniieyyQ121210)(),(011最小二乘法最小二乘法(图示)(图示)xy10011xyxxnyxyxnniniiiniiniiniii10121211110n从从 的计算公式可以看出其分母大于的计算公式可以看出其分母大于0。的正负取的正负取决于分子,且分子与相关系数决于分子,且分子与相关系数r的分子相同。的分子相同。0时,时,表示表示x每增加一个单位每增加一个单位y值平均增加的数量,即值平均增加的数量,即x与与y正相关;正相关;0时,表示时,表示x每增加一个单位每增加一个单位y值平均减值平均减少的
29、数量,即少的数量,即x与与y负相关。负相关。111122286.5452638.073077.98652638.061538.5735.1282777.160733231374575.1282799.91561731301021011020040060080010001200140005001000150020002500人均消费与人均国民收入的回归人均消费与人均国民收入的回归【例例】对对求某求某大型商业银行大型商业银行不良贷不良贷款对贷款余额的回归方程款对贷款余额的回归方程8295.0268.120037895.0728.3037895.07.300637.516543252.937.300614.17080250211不良贷款对贷款余额回归方程的图示不良贷款对贷款余额回归方程的图示不良贷款对贷款余额的回归直线不良贷款对贷款余额的回归直线-2024681012140100200300400贷款余额不良贷款