1、 Econometrics 20051第六章第六章 自相关自相关 Econometrics 20052本章主要内容本章主要内容1.自相关的定义和产生原因;2.自相关的影响;3.自相关的检验;4.自相关的补救;Econometrics 200536.1 自相关的定义、类型、产生原因自相关的定义、类型、产生原因6.1.1 自相关(autocorrelation)定义:在古典线性回归模型中,我们假定随机扰动项序列的各项之间不相关。如果这一假定不满足,则称之为自相关。即用符号表示为:常见于时间序列数据。cov(,)()0ijijEij 存在 Econometrics 20054简单记号简单记号),co
2、v(),cov(),cov()var(),cov(22110sttstttttttuuruuruuruuur Econometrics 20055定义:自相关系数定义:自相关系数00220110 ,)var()var(),cov(rrrrrrrruuuussstststst Econometrics 200566.1.2 6.1.2 类型:一阶自相关类型:一阶自相关)即为白噪声序列,(其中一阶线性自相关则称若进一步,有一阶自相关:2111)(),(0),(,0)(1|,;0),(tstttttttttVarstCovEuuuuuCovr Econometrics 20057一阶自回归一阶自回归
3、ttt1t为随机变量且满足经典假设0,正自相关:自相关系数 Econometrics 20058类型:高阶自相关类型:高阶自相关则称为是高阶自相关。若,类似一阶自相关的定义2,0),(suuCovrstts Econometrics 200596.1.3 产生自相关的原因产生自相关的原因在相关性。随机扰动项之间也就存之间若存在相关性,则可见,若因变量观测值可以证明互依赖的。相继的观测值可能是相都呈现一定的连续性。就业和失业等时间序列格指数、生产、商业、的惯性。众所周知,价个明显的特点,就是它大多数时间序列都有一一、惯性),cov(),cov(jijiuuYY Econometrics 2005
4、10计量经济学家的话计量经济学家的话 没有普遍有效的方法能够没有普遍有效的方法能够防止把回归函数的错误设防止把回归函数的错误设定误解为自相关的出现!定误解为自相关的出现!Econometrics 200511二、设定偏误二、设定偏误1:应含而未含变量的情形:应含而未含变量的情形从而出项自相关。系统模式:则,随机扰动项会出现归时用的是:回和猪肉价格。但是在做牛肉价格、消费者收入为需求量,解释变量分别其中,因变量表示牛肉形式为:如果真实的回归方程的例如ttttttttttttuXvvXXYuXXXY44332214433221,Econometrics 200512三、设定偏误三、设定偏误2 2:
5、不正确的函数形式:不正确的函数形式例如:如果真实的回归方程形式为:其中,因变量为边际成本,解释变量为产出及产出的平方。如果作回归是选用的是:则会出现自相关,其形式为:212233ttttYXX122tttYXv232tttvX Econometrics 200513四、蛛网现象四、蛛网现象 许多农产品的供给表现出一种所谓的蛛网现象。例如,供给价格的反应要滞后一个时期。今年种植的作物是受去年流行的价格影响的,因此,相关的函数形式是:这时我们就不能期望扰动项是无自相关的。121tttSP Econometrics 200514五、滞后效应五、滞后效应 例如:在消费支出对收入的时间序列分析中,当期的
6、消费支出除了依赖于其他变量外,还依赖于前期的消费支出。即:如果作回归是选用的是:则会出现自相关。12tttCIttttuIIC1221 Econometrics 200515六、六、数据的数据的“编造编造”1.在经验分析中,许多数据是经过加工而成的。例如,在用到季度数据的时间序列回归中,季度数据通常由月度数据加总而成。2.这种平均的计算减弱了每月的波动而引进了数据的匀滑性。Econometrics 200516时间序列数据存在序列相关性时间序列数据存在序列相关性自相关也可能出现在横截面数据中,但更一般自相关也可能出现在横截面数据中,但更一般出现在时间序列数据中。出现在时间序列数据中。1.被解释
7、变量除了受制于模型中的解释变量的影响而外,还受到其他因素的作用,如果这种作用具有连续性,一定也会带给被解释变量连续性的影响,即样本点的前后相关。2.这是因为被解释变量与随机误差项具有相同的分布(只有数学期望不同而已)。若被解释变量相关,那么随机误差项的前后期之间也必定相关。变量自身前后期间的相关,故称作自相关。3.模型设计时,将对被解释变量有影响的因素并入到随机误差项之中,如果这些被遗漏的解释变量的作用成为误差项的主要成分,它们会产生出系统性的、一贯性的作用,从而造成即随机误差项前后期之间存在相关性。Econometrics 200517 为什么会出现序列相关性?下面通过两个例子加以说明。例如
8、,建立行业生产函数模型,以产出量为被解释变量,资本、劳动、技术为解释变量,选择时间序列数据作为样本观测值。于是有:t=1,2,n在该模型中,政策因素等,没有包括在解释变量中,但它们对产出量是有影响的,该影响被包含在随机误差项中。如果该影响构成随机误差项的主要部分,则可能出现序列相关性。如果政策因素对前一年产出量的影响是正的,后一年的该影响往往也是正的。于是在不同的样本点之间,随机误差项出现了相关性,这就产生了序列相关性。实例实例tttttTLKfQ,Econometrics 200518再如,以绝对收入假设为理论假设、以时间序列数据再如,以绝对收入假设为理论假设、以时间序列数据作样本建立居民总
9、消费函数模型:作样本建立居民总消费函数模型:CIttt01 t=1,2,n消费习惯没有包括在解释变量中,其对消费量的影响被消费习惯没有包括在解释变量中,其对消费量的影响被包含在随机误差项中。如果该项影响构成随机误差项的包含在随机误差项中。如果该项影响构成随机误差项的主要部分,可能出现序列相关性。因为消费习惯对消费主要部分,可能出现序列相关性。因为消费习惯对消费量的影响是具有内在联系的。前一年是正的影响,后一量的影响是具有内在联系的。前一年是正的影响,后一年往往也是正的影响。于是在不同的样本点之间,随机年往往也是正的影响。于是在不同的样本点之间,随机误差项出现了相关性,这就产生了序列相关性。误差
10、项出现了相关性,这就产生了序列相关性。Econometrics 2005196.2 自相关的后果自相关的后果1.OLS估计得到的虽然仍为线性、无偏估计2.参数估计量非有效性3.即使在大样本下仍不具有渐进有效性4.变量的显著性检验失效5.模型预测失败 Econometrics 2005206.3 自相关的检验自相关的检验6.3.1 图解法图解法时间序列图(Time Sequence plot):将残差对时间描点。如图(a)所示,扰动项的估计值呈循环形,并不频繁地改变符号,而是相继若干个正的以后跟着几个负的。表明存在正自相关。tt1t(a)t Econometrics 200521(b)如(如(b
11、)图所示,扰动项的估计值呈锯齿状,随时间)图所示,扰动项的估计值呈锯齿状,随时间逐次改变符号,表明存在负相关。逐次改变符号,表明存在负相关。自相关的检验:图解法自相关的检验:图解法tt1tt Econometrics 2005226.3.2 自相关的检验:自相关的检验:DW检验检验DW检验(检验(Durbin-Watson)DW检验是检验自相关的最著名的、最常用的方法。检验是检验自相关的最著名的、最常用的方法。1、使用条件、使用条件(1)、)、回归模型中含有截距项;回归模型中含有截距项;(2)、解释变量是非随机的(因此与随机扰动项不)、解释变量是非随机的(因此与随机扰动项不相关)相关)(3)、
12、)、随机扰动项是一阶自相关随机扰动项是一阶自相关;(4)、回归模型中)、回归模型中无滞后因变量做解释变量无滞后因变量做解释变量;(5)、没有缺落数据,样本比较大。)、没有缺落数据,样本比较大。Econometrics 200523DW检验检验01211222211122121:0,:0,2)2(1)nnttttttnnttttntttnttHHd 检验步骤()、提出假设即不存在一阶自相关;即存在一阶自相关。()构造统计量(定义为样本的一阶自相关系数,作为 的估计量。Econometrics 2005242(1)11,04dd则 又,所 以,dL244-dL0dU4-dU正相关无自相关负相关自相
13、关的检验:自相关的检验:DW检验(续)检验(续)d Econometrics 200525DW检验:检验:检验判断检验判断对给定样本大小和给定解释变量个数找出临界值,按照上面的图做出决策。例:查DW表,对于31个观测值和一个解释变量,我们得到dL=1.363和dU=1.496(5%的显著水平)Econometrics 200526 D.W.0时,模型存在完全一阶正相关 D.W.4时,模型存在完全一阶负相关 当D.W.值在2左右时,模型不存在一阶自相关总结总结 Econometrics 200527若 0D.W.dl 则存在正自相关 dlD.W.du 不能确定 duD.W.4-du 无自相关 4
14、-duD.W.4-dl 不能确定 4-dlD.W.4 存在负自相关 Econometrics 200528 (1)从判断准则看到,存在两个不能确定的)从判断准则看到,存在两个不能确定的D.W.值区域,这是这种检验方法的一大缺陷。值区域,这是这种检验方法的一大缺陷。(2)D.W.检验虽然只能检验一阶自相关,但在检验虽然只能检验一阶自相关,但在实际计量经济学问题中,一阶自相关是出现最多实际计量经济学问题中,一阶自相关是出现最多的一类序列相关(即是自相关,在这里看成是等的一类序列相关(即是自相关,在这里看成是等价的);价的);(3)经验表明,如果不存在一阶自相关,一般)经验表明,如果不存在一阶自相关
15、,一般也不存在高阶序列相关。也不存在高阶序列相关。所以在实际应用中,对于序列相关问题一般所以在实际应用中,对于序列相关问题一般只进行只进行D.W.检验。检验。注意:注意:Econometrics 200529 Econometrics 2005306.4 自相关的补救自相关的补救1:(已知)广义差分法已知)广义差分法2121112111121121121)1(OLS3)3()()()1(:)2()1()2()1()1(,的估计值,进而算出和估计,得到)运用对(已知:若为例。以双变量回归模型和ttttttttttttttttttuuXXYYuXYuXYuuuXYAR Econometrics 2
16、00531 未知时,未知时,自相关的补救:方法自相关的补救:方法2、3:德宾两步法方法文档)体步骤见无自相关时为止。(具值,或者直到个更好的通过反复迭代后求得一):科克伦奥克特法(方法计。义差分法对模型进行估然后再用前面所讲的广求出统计量:利用方法43,2/1)1(22wordOrcuttCochraneddWD Econometrics 200532 Econometrics 200533迭代法:停止条件迭代法:停止条件0:;0:)3()2(10211021 )1()(1042)(2)1(2)(1)1(1)()1()(2)2(2)1(2)0(2)(1)2(1)1(1)0(1)()2()1()0(HHDWrrrrrrlllllllll检验:数迭代次数:固定迭代次等等,或,设置允许误差的值此三种任选一种迭代停止条件 Econometrics 2005344.德宾两步法德宾两步法第一步:求出自相关系数 的估计值tttttXXbbYY)()1(1101tttttXbXbYbY11110)1(差分形式121100)1(bababatttttXaXaYaY12110应用最小二乘法,求出 的估计值第二步:利用 进行广义差分变换,对差分模型用OLS估计参数值 Econometrics 200535举例举例P256