1、 第第1212章章 自相关性自相关性 误差项相关会怎么样误差项相关会怎么样?第第2 2 篇篇放宽经典模型的假定放宽经典模型的假定一、一、自自相关性相关性概念概念二、二、实际经济问题中的实际经济问题中的自自相关性相关性 三、三、自自相关性的产生原因及后果相关性的产生原因及后果四、四、自自相关性的检验相关性的检验五、五、案例案例第十二章第十二章 自相关性自相关性 一、自相关性概念一、自相关性概念 如果对于不同的样本点,随机误差项之间如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认不再是不相关的,而是存在某种相关性,则认为出现了为出现了序列相关性序列相关性(Serial
2、Correlation)。对于模型对于模型 Yi=0+1X1i+2X2i+k X ki+i i=1,2,n随机项互不相关的基本假设表现为随机项互不相关的基本假设表现为 Cov(i,j)=0 i j,i,j=1,2,n2112)()()()(nnEEECov2112nnI22或或在其他假设仍成立的条件下,在其他假设仍成立的条件下,序列相关序列相关即意味着即意味着0)(jiE称为称为一阶列相关一阶列相关,或,或自相关自相关(autocorrelation)其中:其中:被称为被称为自协方差系数自协方差系数(coefficient of autocovariance)或或一阶自相关系数一阶自相关系数(
3、first-order coefficient of autocorrelation)如果仅存在如果仅存在 E(i i-1)0 i=1,2,n 自相关自相关往往可写成如下形式往往可写成如下形式:i=i-1+i -1 1 0)(iE,2)var(i,0),cov(sii 0s 由于序列相关性经常出现在以时间序列为由于序列相关性经常出现在以时间序列为样本的模型中,因此,本章将用下标样本的模型中,因此,本章将用下标t代表代表i。i是满足以下标准是满足以下标准OLS假定的随机干扰项:假定的随机干扰项:二、实际经济问题中的自相关性二、实际经济问题中的自相关性 大多数经济时间数据都有一个明显的特点大多数经
4、济时间数据都有一个明显的特点:惯惯性性,表现在时间序列不同时间的前后关联性。,表现在时间序列不同时间的前后关联性。由于由于消费习惯消费习惯的影响被包含在随机误差项中,则的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关可能出现序列相关性(往往是正相关 )。)。例如,例如,居民总消费函数模型居民总消费函数模型:Ct=0+1Yt+t t=1,2,n1.1.经济变量固有的惯性经济变量固有的惯性2.2.模型设定的偏误模型设定的偏误 所谓模型所谓模型设定偏误设定偏误(Specification error)是指是指所设定的模型所设定的模型“不正确不正确”。主要表现在模型中丢掉。主要表现在模型
5、中丢掉了重要的解释变量或模型函数形式有偏误。了重要的解释变量或模型函数形式有偏误。例如例如,本来应该估计的模型为,本来应该估计的模型为 Yt=0+1X1t+2X2t+3X3t+t但在模型设定中做了下述回归:但在模型设定中做了下述回归:Yt=0+1X1t+1X2t+vt又如又如:现期消费水平(:现期消费水平(C Ct t)往往受到其上一期的往往受到其上一期的影响,即存在自相关。影响,即存在自相关。因此,因此,vt=3X3t+t,如果如果X3确实影响确实影响Y,则出则出现序列相关。现序列相关。又如又如:如果真实的边际成本回归模型为:如果真实的边际成本回归模型为:Yt=0+1Xt+2Xt2+t 其中
6、:其中:Y=边际成本,边际成本,X=产出。产出。但建模时设立了如下模型:但建模时设立了如下模型:Yt=0+1Xt+vt 因此,由于因此,由于vt=2Xt2+t,,包含了产出的平方对包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。随机项的系统性影响,随机项也呈现序列相关性。3.3.数据的数据的“编造编造”例如:例如:季度数据来自月度数据的简单平均,这种季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。干扰项出现序列相关。在实际经济问题中,有些数据是通过已知在实际经济问题中,有些数据是通过已
7、知数据生成的。数据生成的。因此,新生成的数据与原数据间就有了内在因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。的联系,表现出序列相关性。三、自相关性的后果三、自相关性的后果 从一般经验上讲,对于采用时间序列数据作样本的从一般经验上讲,对于采用时间序列数据作样本的计量经济学问题,由于在不同样本点上解释变量以外的计量经济学问题,由于在不同样本点上解释变量以外的其他因素在时间上的连续性,带来它们对被解释变量的其他因素在时间上的连续性,带来它们对被解释变量的影响的连续性,所以往往存在序列相关性。影响的连续性,所以往往存在序列相关性。计量经济学模型一旦出现序列相关性,如果仍计量经济学模
8、型一旦出现序列相关性,如果仍采用采用OLSOLS法估计模型参数,会产生下列不良后果:法估计模型参数,会产生下列不良后果:1.1.参数估计量非有效参数估计量非有效 因为,在有效性证明中利用了因为,在有效性证明中利用了 E(uu)=2I即同方差性和互相独立性条件。即同方差性和互相独立性条件。而且,在大样本情况下,参数估计量虽然具而且,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。有一致性,但仍然不具有渐近有效性。2.变量的显著性检验失去意义变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机
9、误差数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。项具有同方差性和互相独立性时才能成立。如果存在自相关如果存在自相关,估计参数的方差变大估计参数的方差变大,t,t检检验就失去意义验就失去意义 其他检验也是如此。其他检验也是如此。3.模型的预测失效模型的预测失效 区间预测与参数估计量的方差有关,在方差区间预测与参数估计量的方差有关,在方差(标准差)有偏误的情况下,使得预测估计不准确,(标准差)有偏误的情况下,使得预测估计不准确,预测精度降低。预测精度降低。所以,所以,当模型出现序列相关性时,它的预测功当模型出现序列相关性时,它的预测功能失效。能失效。然后,通过分
10、析这些然后,通过分析这些“近似估计量近似估计量”之间的相关性,以判之间的相关性,以判断随机误差项是否具有序列相关性。断随机误差项是否具有序列相关性。自相关性自相关性检验方法有多种,但基本思路相同:检验方法有多种,但基本思路相同:基本思路基本思路:四、自相关性的检验四、自相关性的检验首先首先,采用,采用OLS法估计模型,以求得随机误差项的法估计模型,以求得随机误差项的“近似估计量近似估计量”,用用 ei表示:表示:lsiiiYYe0)(检验方法多:如图示法、游程检验,检验方法多:如图示法、游程检验,DW检验、布检验、布劳殊戈劳殊戈弗弗雷()检验等雷()检验等1.1.图示法图示法几种常用检验方法:
11、几种常用检验方法:2.2.回归检验法回归检验法 tttee1tttteee2211 t=2,nt=3,n对方程估计参数并作显著性检验。对方程估计参数并作显著性检验。以以te为被解释变量,以各种可能的相关量,诸如以为被解释变量,以各种可能的相关量,诸如以1te、2te、2te等为解释变量,建立各种方程:等为解释变量,建立各种方程:如果存在某一种函数形式,使得方程显如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。著成立,则说明原模型存在序列相关性。回归检验法回归检验法的的优点优点是:(是:(1)能够确定)能够确定序列相关的形式,(序列相关的形式,(2)适用于任何类型序)适用于
12、任何类型序列相关性问题的检验。列相关性问题的检验。游程检验:见书游程检验:见书4364363.3.德宾德宾沃森(沃森(Durbin-WatsonDurbin-Watson)检验法检验法 D-W检验是德宾(检验是德宾(J.Durbin)和和沃森沃森(G.S.Watson)(G.S.Watson)于于19511951年提出的一种检验序列自年提出的一种检验序列自相关的方法。相关的方法。该方法的假定条件是该方法的假定条件是:(1 1)解释变量)解释变量X非随机;非随机;(2)随机误差项)随机误差项 i为一阶自回归形式:为一阶自回归形式:i=i-1+i(3)回归模型中不应含有滞后因变量作为解释)回归模型
13、中不应含有滞后因变量作为解释变量,即不应出现下列形式:变量,即不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项回归含有截距项针对原针对原假设:假设:H0:=0,即即 不具有一阶自相关形式不具有一阶自相关形式 对立假设:对立假设:H1:0 即即 具有一阶自相关形式具有一阶自相关形式 为为 的自相关系数的自相关系数,且,且 1构造如下统计量:构造如下统计量:D.W.统计量统计量:该统计量该统计量的分布与出现在给定样本中的的分布与出现在给定样本中的X值值有复杂的关系,因此其有复杂的关系,因此其精确的分布很难得到精确的分布很难得到。但是但是,他们他们成功地导出了临界值的
14、下限成功地导出了临界值的下限dL和和上限上限dU,且这些上下限只与样本的容量且这些上下限只与样本的容量n和解释和解释变量的个数变量的个数k有关,而与解释变量有关,而与解释变量X的取值无关。的取值无关。nttnttteeeWD12221)(.展开展开D.W.统计量统计量:nttntntnttttteeeeeWD1222212122.(*)1(2)1(2.1221nttnttteeeWD D.W检验步骤检验步骤:(1)计算)计算DW值值(2)给定显著性水平)给定显著性水平,由,由n和和k的大小查的大小查DW分分 布表,得临界值的下限布表,得临界值的下限dL和上限和上限dU(3)比较、判断:比较、判
15、断:若若 0D.W.dL 存在正自相关存在正自相关(否定(否定H0)dLD.W.dU 不能确定不能确定 dU D.W.4dU 无自相关无自相关(接受(接受H0)4dU D.W.4 dL 不能确定不能确定 4dL D.W.2(p),拒绝原假设,表明可能存在拒绝原假设,表明可能存在直到直到p阶的序列相关性。阶的序列相关性。实际检验中,可从实际检验中,可从1阶、阶、2阶、阶、逐次向更高阶检验。逐次向更高阶检验。11011tktttptkpteee(一)对伪自相关(一)对伪自相关 1。由经济理论找出被略去的解释变量,将其放回模型中。由经济理论找出被略去的解释变量,将其放回模型中。2。修正模型形式,找出
16、正确的函数关系。修正模型形式,找出正确的函数关系。(二)对真正自相关(二)对真正自相关 在排除在排除“伪自相关伪自相关”后,经自相关检验,后,经自相关检验,u仍自相关,则仍自相关,则是是“真正自相关真正自相关”。如果模型被检验证明存在序列相关性,则需要发展新的方如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。法估计模型。最常用的方法是最常用的方法是广义最小二乘法广义最小二乘法(GLS:Generalized least squares)和和广义差分法广义差分法(Generalized Difference)。五、自相关的补救五、自相关的补救 1.1.广义最小二乘法广义最小二乘法G
17、LS是最具有普遍意义的最小二乘法,是最具有普遍意义的最小二乘法,OLS和和WLS是其特例。是其特例。对于模型:对于模型:Y=X+如果存在序列相关,同时存在异方差,即有如果存在序列相关,同时存在异方差,即有 是一对称正定矩阵,存在一可逆矩阵是一对称正定矩阵,存在一可逆矩阵D,使得使得 =DD,22212222111221)()Cov(nnnnnE变换原模型:变换原模型:D-1Y=D-1X +D-1 即即 Y*=X*+*(*)(*)式的式的OLS估计估计:该模型具有同方差性和随机误差项互相独立性该模型具有同方差性和随机误差项互相独立性:IDDDDDDDEDDDEE21121211111*)()()
18、(这就是原模型的这就是原模型的广义最小二乘估计量广义最小二乘估计量(GLS estimators),是是无偏无偏的、的、有效有效的估计量。的估计量。如何得到矩阵如何得到矩阵?对对 的形式进行特殊设定后,才可得到其估计值。的形式进行特殊设定后,才可得到其估计值。*1*)(YXXXYXXXYDDXXDDX1111 1111)()(1000001000000100000100000121D如设定随机扰动项为如设定随机扰动项为一阶序列相关形式一阶序列相关形式 i=i-1+i 则则221)(),(ssttsttuuEuuCovssttuuCor),(2221)()(ttuEuVar22121221111
19、),(nnnnuuCov2.2.广义差分法广义差分法 广义差分法广义差分法是将原模型变换为满足是将原模型变换为满足OLS法的法的差分模型,再进行差分模型,再进行OLS估计。估计。广义差分法就是上述广义最小二乘法,但是却损失广义差分法就是上述广义最小二乘法,但是却损失了部分样本观测值。了部分样本观测值。如:一阶序列相关的情况下如:一阶序列相关的情况下,广义差分是估计广义差分是估计tktktkttttXXXXYY)()()1(1111101ikikiiiXXXY22110ttt1 该模型为广义差分模型,不存在序列相关问题。该模型为广义差分模型,不存在序列相关问题。可进行可进行OLS估计。估计。这相
20、当于:这相当于:1000001000000100000100000121D去掉第一行后左乘原模型去掉第一行后左乘原模型Y=X+。即运用即运用了了GLS法,但第一次观测值被排除了。法,但第一次观测值被排除了。可以将原模型变换为可以将原模型变换为:)()1(1111111011ltlttlltlttXXXYYYtlktlktktkXXX)(11该模型为该模型为广义差分模型广义差分模型,不存在序列相关问题。可进行,不存在序列相关问题。可进行OLS估计。估计。.如果原模型如果原模型ikikiiiXXXY22110 存在存在tltlttt22113.3.随机误差项相关系数的估计随机误差项相关系数的估计
21、应用应用广义最小二乘法广义最小二乘法或或广义差分法广义差分法,必须已知随机误,必须已知随机误差项的相关系数差项的相关系数 1 1,2 2,p p。实际上,人们并不知道它们的具体数值,所以必须首实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。先对它们进行估计。常用的估计方法有:常用的估计方法有:科克伦科克伦-奥科特(奥科特(Cochrane-Orcutt)迭代法迭代法 德宾(德宾(durbin)两步法两步法(1 1)科克伦)科克伦-奥科特迭代法奥科特迭代法 以一元线性模型为例:以一元线性模型为例:首先首先,采用,采用OLS法估计原模型法估计原模型 Yi=0+1Xi+i 得到的得到
22、的 的的“近似估计值近似估计值”,并以之作为观,并以之作为观测值使用测值使用OLS法估计下式法估计下式 i=1 i-1+2 i-2+L i-L+iilln12,ililiilliliiXXXYYY)()1(1111011得到得到$,$,$12l,作为随机误差项的相关系,作为随机误差项的相关系数数 12,l的的第一次估计值第一次估计值。求出求出 i新的新的“近拟估计值近拟估计值”,并以之作为样本并以之作为样本观测值,再次估计观测值,再次估计:i=1i-1+2i-2+Li-L+i 类似地,可进行第三次、第四次迭代。类似地,可进行第三次、第四次迭代。关于迭代的次数,可根据具体的问题来定。关于迭代的次
23、数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次一般是事先给出一个精度,当相邻两次 1,2,L的估计值之差小于这一精度时,迭代终止。的估计值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,就可得到较满实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为意的结果。两次迭代过程也被称为科克伦科克伦奥科奥科特两步法特两步法。(2 2)德宾)德宾(durbindurbin)两步法两步法 该方法仍是先估计该方法仍是先估计 1,2,l,再对差分模型再对差分模型进行估计。进行估计。第一步第一步,变换差分模型为下列形式:,变换差分模型为下列形式:ililiilliliiXX
24、XYYY)()1(1111011illn12,进行进行OLS估计,得各估计,得各Yj(j=i-1,i-2,i-l)前的系数前的系数 1,2,l的估计值的估计值于是:于是:)1(1*00l,*11采用采用 OLS 法估计,得到参数法估计,得到参数110),1(l的的估计量,记为估计量,记为*0,*1。第二步第二步,将估计的,将估计的l,21代入差分模型代入差分模型ililiilliliiXXXYYY)()1(1111011 illn 12,应用软件中的广义差分法应用软件中的广义差分法 在在Eviews/TSP软件包下,广义差分采用了科软件包下,广义差分采用了科克伦克伦-奥科特奥科特(Cochra
25、ne-Orcutt)迭代法估计迭代法估计。在解释变量中引入在解释变量中引入AR(1)、AR(2)、,即可即可得到参数和得到参数和1、2、的估计值。的估计值。其中其中AR(m)表示随机误差项的表示随机误差项的m阶自回归。阶自回归。在估计过程中自动完成了在估计过程中自动完成了1、2、的迭代。的迭代。如果能够找到一种方法,求得如果能够找到一种方法,求得或或各序列相关系各序列相关系数数 j j的估计量,使得的估计量,使得GLS能够实现,则称为能够实现,则称为可行的可行的广义最小二乘法广义最小二乘法(FGLS,Feasible Generalized Least Squares)。)。FGLS估计量,也
26、称为估计量,也称为可行的广义最小二乘估计量可行的广义最小二乘估计量(feasible general least squares estimators)注意:注意:4.4.虚假序列相关问题虚假序列相关问题 由于随机项的序列相关往往是在模型设定中由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为有误,这种情形可称为虚假序列相关虚假序列相关(false autocorrelation)(伪自相关伪自相关),应在模型设定,应在模型设定中排除。中排除。避免产生虚假序列相关性的措施是在开始时避免产生虚假序列相关性
27、的措施是在开始时建立一个建立一个“一般一般”的模型,然后逐渐剔除确实不的模型,然后逐渐剔除确实不显著的变量。显著的变量。五、案例:中国商品进口模型五、案例:中国商品进口模型 经济理论指出,商品进口主要由进口国的经经济理论指出,商品进口主要由进口国的经济发展水平,以及商品进口价格指数与国内价格济发展水平,以及商品进口价格指数与国内价格指数对比因素决定的。指数对比因素决定的。由于无法取得中国商品进口价格指数,我们由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。主要研究中国商品进口与国内生产总值的关系。(下表)。(下表)。表表 4 4.2 2.1 1 19782001
28、 年年中中国国商商品品进进口口与与国国内内生生产产总总值值 国内生产总值 GDP(亿元)商品进口 M(亿美元)国内生产总值 GDP(亿元)商品进口 M(亿美元)1978 3624.1 108.9 1990 18547.9 533.5 1979 4038.2 156.7 1991 21617.8 637.9 1980 4517.8 200.2 1992 26638.1 805.9 1981 4862.4 220.2 1993 34634.4 1039.6 1982 5294.7 192.9 1994 46759.4 1156.1 1983 5934.5 213.9 1995 58478.1 13
29、20.8 1984 7171.0 274.1 1996 67884.6 1388.3 1985 8964.4 422.5 1997 74462.6 1423.7 1986 10202.2 429.1 1998 78345.2 1402.4 1987 11962.5 432.1 1999 82067.46 1657 1988 14928.3 552.7 2000 89442.2 2250.9 1989 16909.2 591.4 2001 95933.3 2436.1 资料来源:中国统计年鉴(1995、2000、2002)。1.1.通过通过OLSOLS法建立如下中国商品进口方程法建立如下中国商品
30、进口方程 ttGDPM02.091.152 (2.322.32)(20.1220.12)2.2.进行序列相关性检验进行序列相关性检验 DW检验检验 取取=5%,由于,由于n=24,k=2(包含常数项包含常数项),查表得:,查表得:dl=1.27,du=1.45由于由于 DW=0.628 20.05(2)故故:存在正自相关存在正自相关3阶滞后:阶滞后:321032.0819.0108.10003.0692.6tttteeeGDPe (0.22)(-0.497)(4.541)(-1.842)(0.087)R2=0.6615=0.6615 于是,于是,LM=(24-3)0.6614=13.89取取=
31、5%,2分布的临界值分布的临界值 20.05(3)=7.815 LM 20.05(3)表明表明:存在正自相关;但存在正自相关;但 t-3t-3的参数不显的参数不显著,说明不存在著,说明不存在3 3阶序列相关性。阶序列相关性。3.运用广义差分法进行自相关的处理运用广义差分法进行自相关的处理(1)采用德宾两步法估计)采用德宾两步法估计 第一步第一步,估计模型,估计模型 2121054.0096.0055.0469.0938.009.78ttttttGDPGDPGDPMMM(1.76)(6.64)(-1.76)(5.88)(-5.19)(5.30)tttttttGDPGDPGDPMMM2*31*2*
32、12211*0第二步第二步,作差分变换:,作差分变换:)469.0938.0(21*ttttMMMM)469.0938.0(21*ttttGDPGDPGDPGDP则M*关于GDP*的OLS估计结果为:*020.018.86ttGDPM (2.76)(16.46)取取=5%,DW du=1.43(样本容量样本容量24-2=22)表明:已不存在自相关表明:已不存在自相关162.300.469)0.938-/(186.18)1/(21*00于是原模型为:于是原模型为:ttGDPM020.030.162与与OLS估计结果的差别只在估计结果的差别只在截距项截距项:ttGDPM02.091.152(2 2
33、)采用科克伦)采用科克伦-奥科特迭代法估计奥科特迭代法估计 在在Eviews软包下,软包下,2阶广义差分的结果为:阶广义差分的结果为:取取=5%,DWdu=1.66(样本容量样本容量:22)表明表明:广义差分模型已不存在序列相关性。广义差分模型已不存在序列相关性。2801.0 1 108.1020.032.169ARARGDPMtt (3.81)(18.45)(6.11)(-3.61)可以验证可以验证:仅采用仅采用1阶广义差分,变换后阶广义差分,变换后的模型仍存在的模型仍存在1阶自相关性;阶自相关性;采用采用3阶广义差分,变换后的模型不再阶广义差分,变换后的模型不再有自相关性,但有自相关性,但AR3的系数的的系数的t值不显著。值不显著。