1、九章分布滞后和自回归模型 前言前言n前面各章基本上没有区别所用的数据究竟是时间序列数据还是截面数据。但这两类数据在计量经济分析中还是有明显差异的。n时间序列数据是经济运动动态过程的数量记录,包含不同于横截面数据的特殊信息,可以进行动态计量分析,但时间序列数据的内在联系也可能给计量经济分析带来问题和困难。n本章介绍利用时间序列数据进行动态计量分析的几个专题。下一章我们将对时间序列数据计量分析的一些问题进行分析。本章结构本章结构 第一节 分布滞后模型 第二节 自回归模型 第三节 因果关系检验 第一节 分布滞后模型一、经济中的滞后效应和分布滞后模型二、分布滞后模型参数估计(一)经济中的滞后效应(一)
2、经济中的滞后效应n由于信息滞后、交易周期和心理因素等多方面的原因,经济行为、政策的作用,经济变量之间相互影响的效果,常常不是立即体现出来,而是有时间延滞性或持续作用,会在以后一个时期内逐步体现出来。n这种现象就是滞后效应。滞后效应在经济问题中是普遍存在的。n例如人们获得后通常不会立即全部花掉,而是会在以后一个阶段分次花费,因此收入对人们消费的影响往往有时间滞后和持续的影响。n滞后效应对经济问题的影响非常重要。要准确把握经济关系,特别是长期动态关系,避免预测和决策偏差,必须重视这种滞后效应。n滞后效应可以直接通过滞后作用的描述来反映。n例如若某地消费者平均来说在获得20000元收入后,会在当年消
3、费掉8000元,下一年消费6000元,再下一年又消费4000元,余下2000元储蓄起来以备不时之需,那么意味着当年收入一般对当年消费会产生40%的作用,对下年消费会产生30%的作用,对再下年消费则有20%的作用。n为了横向比较方便等原因,滞后效应也可以通过滞后期长度、短期效应、中期相应、半效应长度等进行衡量。n例如上述收入对消费滞后效应的滞后期长度,也就是滞后效应的持续时间,总滞后效应完全实现的时间,为2年。滞后的短期效应(当年效果)为4/9,中期效应(当年加次年效果)为7/9。半效应长度,也就是滞后效应过半的时间长度,则在1年之内。n从另一个角度,滞后效应也可以反过来理解为当期某指标受上期、
4、再上期其他某指标的影响。n例如上述消费滞后效应也可理解为,当年消费不仅受到当年收入(40%)的影响,而且受到上年收入(30%)、再上年收入(20%)的影响。用公式表示就是:212.03.04.0ttttIIICn当然,消费者的消费行为一般不可能满足严格函数关系,必然会因素随机因素干扰而有波动。n此外人们有维持消费水平相对稳定的倾向,在收入很低时也会设法保持基本的生活水平,因此会有不受收入直接影响的基本消费。n但上述公式反映了滞后效应的主要特征,只要进一步了解了基本消费,以此为基础就可以对消费发展的趋势和收入政策效果等作出有效的预测和分析。(二)分布滞后模型n已知存在滞后效应以及滞后效应的时间长
5、度和结构时,对滞后作用的分析预测是比较简单的。n但现实中的问题常常是只知道可能存在滞后效应,滞后效应是否确实存在,滞后效应的持续长度,及其结构模式都是未知的。n例如消费滞后效应问题可能是:或:模型中的 是反映基本消费的常数,等是反映滞后效应结构的系数,这些参数的数值,是否显著都是未知的,需要根据收入和消费数据通过计量分析估计。n有时反映滞后期长度的K也是未知的,也需要通过分析确定。tttttIcIcIccC231210tKtKttttIcIcIcIccC12312100c1cn这种模型正是分析判断滞后效应的存在性及其模式,研究经济行为、经济关系中滞后作用的基本模型,称为“分布滞后模型”。n理论
6、上可以考虑有无限多滞后项的分布滞后模型:n这种分布滞后模型通常称为“无限分布滞后模型”,相比之下,只有有限个滞后项的分布滞后模型则称为“有限分布滞后模型”。tttttIcIcIccC231210n一般可采用下列标准化表达式分别表示有限分布滞后模型和无限分布滞后模型:n无限分布滞后模型:有无限多滞后项n有限分布滞后模型:有限个滞后项 tKtKttttXXXXY22110tttttXXXY22110n此外,在考虑一个解释变量对被解释变量的影响和滞后作用(如收入对消费)以外,还可以同时考虑其他解释变量对被解释变量的影响,甚至同时考虑多个解释变量作用的滞后效应等。n分布滞后模型形式上是含有解释变量滞后
7、项的多元回归模型。n但分布滞后模型主要用来研究经济变量作用的时间滞后效应、长期影响,以及经济变量之间的动态影响关系,可用于评价经济政策的中长期效果,属于动态计量分析的范畴。二、分布滞后模型参数估计n用分布滞后模型研究滞后效应,进行预测分析和评估政策效果之前,先要估计模型中的未知参数。n分布滞后模型形式上与一般的多元线性回归相似,但因为引进多个滞后变量和滞后期长度难以确定,分布滞后模型的参数估计与一般多元线性回归模型有所不同。n分布滞后模型的参数估计首先要解决的问题是滞后长度确定,或者如何在未知滞后长度时估计参数。(一)现式估计法n现式估计法适用滞后长度不确定的分布滞后模型。n为了解决滞后长度不
8、定的困难,可以依次估计有滞后效应变量的一期滞后、两期滞后,当发现滞后变量(加入的最多期滞后)的回归系数在统计上开始变得不显著,或至少有一个变量的系数改变符号(由正变负或由负变正)时,就不再增加滞后期,把此前一个模型作为分布滞后模型的形式,相应参数估计作为模型的参数估计。n这种分布滞后模型的参数估计方法就是现式估计法。这种参数估计方法只是普通最小二乘估计的重复应用,易于掌握。n但现式估计法也有问题。首先滞后长度的确定没有明确的标准、根据;其次是引进较多期滞后会降低自由度,回归分析的有效性会降低;第三是滞后变量之间的相关性可能引发共线性问题;此外被认为有数据开采的嫌疑。(二)先验约束估计n分布滞后
9、模型参数估计的另一类方法,是利用某种先验信息和经验设定分布滞后模型的滞后模式,从而简化分布滞后模型的函数形式,方便参数估计。这类方法称为“参数约束法”。n最重要的参数约束法是阿尔蒙多项式法和考伊克方法。1.阿尔蒙多项式法n适用于已知滞后长度,但滞后长度较长的有限分布滞后模型。n这类模型的主要困难是参数数量较多,导致估计困难。n基本思想:以滞后期i 的一个适当次数的多项式,模拟分布滞后模型的系数。n可分别模拟单调下降、先升后降,以及循环变化等不同的滞后效应类型。n设一个有限分布滞后模型为:n也可以写成:n阿尔蒙认为可以用如下i 的多项式模拟 的变化:tKtKtttXXXY110tKiititXY
10、0immiiaiaiaa2210n当 时,即:n当 时,即:等。其余依次类推。n不难看出,阿尔蒙多项式所设定的滞后参数变化模式,根据所选择的多项式次数m的不同,分别对应线性变化(衰减),先增后减的二次函数变化,以及较复杂的高次曲线变化等。衰减速度则取决于 、等参数。1m2miaai102210iaiaai0a1an反过来说,当我们通过对具体问题滞后效应的分析,初步判断滞后效应的变化模式符合上述线性变化,先增后减二次曲线变化,或其他高次曲线形态变化时,就可以选定相应的m和滞后参数多项式。n一般来说,常见的滞后参数变化模式的m在1到4之间。n确定了滞后参数多项式以后,将这些多项式代入分布滞后模型进
11、行变换。n以m2的情况为例。n把 代入前述分布滞后模型,可得:2210iaiaaiKitittXiaiaaY02210)(tKiitKiitKiitXiaiXaXa0220100n若令 ,n则模型变为:n很显然,上述 、和 只是 及其各期滞后的线性组合,因此仍是非随机的或与误差项无关。n因此可用OLS法对该式进行参数估计,得到估计值 KiittXZ00KiittiXZ01KiittXiZ022tttttZaZaZaY221100tZ01tZtZ2tXn最后,只需要把这些估计值代入滞后参数多项式,就可以得到得到各个滞后参数的估计值:00a2101aaa210242aaa2210aKaKaKn阿尔
12、蒙多项式法可以把需要估计的参数数量减少到有限的几个,是解决滞后效应较长的分布滞后模型参数较多困难的有效方法。n但这种方法也有局限性。首先运用阿尔蒙多项式法必须先知道分布滞后模型的滞后长度,因为X变量变换为变量Z时K必须是已知的。n其次是滞后效应的模式,对应于m,也必须预先知道,这就很难以避免判断的主观偏差。n最后上述变量变换会缩短样本长度,因此并不能完全解决分布滞后模型参数估计的自由度问题。n当样本容量并不是很大,滞后期长度较长时,仍然无法得到有效的估计结果。2.考伊克方法 n考伊克方法在一定程度上可以弥补阿尔蒙多项式法的不足,解决其部分问题。n考伊克方法形式上是针对无限分布滞后模型:n但由于
13、一般来说随着滞后期的增加滞后效应总是不断减小,滞后期很大的项非常接近0。因此无限分布滞后模型与滞后长度较长的有限分布滞后模型并没有很大差别,考伊克方法也可处理有限分布滞后模型,特别是滞后长度较长的有限分布滞后模型。tttttXXXY22110n思路是:假设分布滞后模型中的未知参数 都有相同的符号,并按照几何级数 衰减。其中 。n这种 函数有以下基本特点:(1)不变号;(2)是k的减函数;(3)越小,衰减速度越快,称为衰减率(4)长期乘数有限。kkk010kk0kk图9.2 考伊克方法参数衰减模式4/32/14/1滞后时间kn考伊克方法模型设定的滞后参数模型,与现实经济中许多滞后效应变化规律确实
14、是一致的,因此有重要的价值。n有了上述滞后参数变化模式,就可以对分布滞后模型进行变换。n首先作考伊克变换,即把 代入模型,得到:kk0tttttXXXY220100n该模型仍然含有无限多项,但其中的参数已经只有3个了。只要我们再把模型滞后一期得:n进一步得:n整理得:132020101tttttXXXY)()1(101tttttXYY)1(10ttttYXY1tttn这就得到了一个比较简单的,只有两个解释变量,三个未知参数的多元回归模型。n只要先把这三个未知参数估计出来,再代回滞后系数函数,就可以得到原模型所有参数的估计值,从而克服无限分布滞后模型参数估计的困难。n不过,上述模型中出现了一个新
15、的问题,那就是被解释变量的滞后变量 作为解释变量的情况,而且因为模型的误差项改变后肯定与 有关,因此普通最小二乘估计不再适用,必须用工具变量法等进行估计。n其实,存在被解释变量的滞后变量作为解释变量的模型,也是我们要专门讨论的,称为“自回归模型”。1tY1tY考伊克方法的优劣性n考伊克方法通过引进特定的滞后结构,把包含无穷多参数的无限分布滞后模型,转化为仅含三个未知参数的线性回归模型,并能最大限度地降低共线性等问题,因此在一定程度上是比阿尔蒙多项式法更好的一种方法。n不过,考伊克方法仍然有自身的弱点和局限性。因为这种方法中所设定的滞后结构模式也有主观性,而且只能反映所有系数同号,滞后系数单调下
16、降,按几何级数下降的滞后效应,对于其他情况则无法反映。n此外把无限分布滞后模型转化为自回归模型,实际上又会引起新的问题,需要进一步的克服解决方法。n例91。详见Eviews演示。第二节第二节 自回归模型自回归模型一、自回归效应和自回归模型 二、自回归模型的理论导出三、自回归模型参数估计四、自回归模型的误差序列相关检验一、自回归效应和自回归模型n上一节运用考伊克方法解决无限分布滞后模型参数估计问题时,得到了一个含有被解释变量一阶滞后变量的模型。n其实,被解释变量的滞后变量作为模型解释变量的情况,在时间序列数据计量分析中经常会涉及到。这种特定经济变量自身的跨期影响称为“自回归效应”。n考虑这种影响
17、,把被解释变量的滞后变量作为解释变量的回归模型,通常称为“自回归模型”。n自回归模型对我们来说其实并也不是全新的概念,因为前面讨论的线性回归模型的误差序列相关就是误差项的自回归模型。n经济变量之间的自回归效应并不是只有在变量的相邻两期水平之间存在,相隔较远的时期之间也可能存在。这时候就是带更多阶滞后项的自回归模型,例如:ttttYYY22110tttttXYYY22110n 一般地,可以考虑带S期滞后被解释变量和K个其他解释变量的自回归模型:n此外,如果我们考虑同时存在自回归效应和分布滞后效应,则模型可进一步发展为:n这种模型也可以称为“自回归分布滞后模型”。自回归分布滞后模型一般都可以通过适
18、当方法转变为纯粹的自回归模型,或完全的分布滞后模型。tKtKtStSttXXYYY11110tKtKtStSttXXYYY11110二、自回归模型的理论导出n这里我们以适应性预期理论的计量经济模型为例,来说明这种自回归模型的建模途径。n根据预期理论,人们的经济行为很大程度上与人们对经济变量未来水平的预期有关,甚至有些情况下完全取决于这种预期。n这可以通过下列预期模型反映:n其中 即人们在t 时期对X变量t+1时期水平的预期。tttXY*10*tXn运用这种模型必须先解决一个问题,那就是模型中的预期变量无法观测的问题。n解决这个问题的通常方法是设定预期形成(或修正)的模式,代入预期模型从而设法消
19、除模型中的预期变量。n常见的预期模式有理性预期和适应性预期两种,这里采用其中的适应性预期。n适应性预期可以用下列公式来表示:n其中 和 分别是当期和前期对后一期X水平的预期,是t 时期X的实际水平,称为“预期系数”。n该预期模型的意义是,人们形成新预期的方式,是在前期预期的基础上,根据前期预期的偏差作适当的修正。)(*1*1*ttttXXXX*tX*1tXtXn为了用这种适应性预期解决预期模型中预期变量无法观测的问题,首先把适应性预期模型改写为:n将该式代入前述预期模型得:*1*)1(tttXXXttttXXY)1(*110tttXX*1110)1(n为了进一步消去模型中预期变量的滞后变量 ,
20、将原预期模型滞后一期得:n进一步得到:n这个模型中不包含任何预期变量,是一个带一阶自回归项的自回归模型。*1tX1*1101tttXY1110)1()1(tttttYXY)1(110tttYX三、自回归模型参数估计n一般自回归模型中考虑的自回归效应长度,也就是被解释变量的滞后期长度,不象分布滞后模型的滞后期那么长。n而且一阶自回归效应占很大比重,因此自回归模型的参数估计一般不存在参数数量方面的困难。n但自回归模型的参数估计仍然可能存在问题。n因为自回归模型的自回归项,也就是被解释变量的滞后变量,必然是随机变量。n如果这些自回归项与误差项有关,那么普通最小二乘估计就不适用,必须采用工具变量法或其
21、他方法进行参数估计。n我们先用两变量线性回归模型介绍工具变量法。n设模型为:其中解释变量X不仅是随机变量,而且与误差项有强相关性。n工具变量法的思路是利用既与X相关性较强,又与误差项没有相关性或渐近不相关的一个“工具”变量Z,构造模型参数的一致估计量。XY10n首先对模型作离差变换:n两边再乘 的离差 并求和,得n然后两边除以 ,有:iiiXXYY1iZZZiiiiiiiiiiZZXXZZYYZZ1XXZZiiiXXZZZZXXZZYYZZiiiiiiiiiiii1n由于Z与X的相关性强,而与误差项渐近不相关,因此当样本容量增大时上式最后一项越来越小,其概率极限为0。n因此把上式左边取作 的估
22、计量,一定是 的一致估计量。这个估计量称为 的“工具变量法估计”,记作:111XXZZYYZZiiiiiiIV1n用“工具变量法”称这种参数估计方法的原因是,变量Z本身并不是影响Y的解释变量,只是在估计 的过程中起“工具”作用。n得到 的工具变量法估计以后,的估计仍然可以利用 的估计得到:n我们也称它为 的工具变量法估计。1110XYIVIV100n多元线性回归分析同样可以用工具变量法进行参数估计,方法同样是用一组工具变量的离差乘模型的离差形式求和,再取概率极限后求解方程组。n每个与误差项有强相关性的解释变量都要找一个工具变量,与误差项相关性不强的解释变量则可以作自己的工具变量。n工具变量的选
23、择是很有讲究的。n一般原则是工具变量必须与所“替代”的解释变量相关性较强,而与模型误差项相关性弱。n要符合这样的要求,必须对变量的性质,及它们与模型全体变量的关系等有较多的了解。并要特别注意避免引起多重共线性问题。n上述自回归模型通常用解释变量的相应滞后变量作被解释变量滞后变量的工具变量,或者先对原模型进行回归以后,用被解释变量的理论值(内插检验值)的相应滞后作工具变量。n工具变量法参数估计量的具体计算实际上也可以由计量软件完成。在EViews中工具变量法估计的功能,包含在两阶段最小二乘估计中。n例92。详见Eviews演示。四、自回归模型的误差序列相关检验n自回归模型中随机变量作解释变量遇到
24、的另一个问题是,对模型误差项的误差序列自相关性检验。自回归模型的特点表明,这一类模型存在误差序列相关问题的可能性很大。n要保证估计的有效性,必须进行误差序列相关性检验。n但问题是自回归模型必然有随机解释变量,而对于有随机解释变量的模型,通常检验误差序列自相关性的DW检验是不适用的。n杜宾提出了一种适用检验这种模型一阶自相关性的H 统计量,也称为“杜宾H 检验”。n这种H统计量的计算公式为 其中 为模型误差项的一阶自回归系数估计量。)(12cVarnnHn可以用DW 值计算:nn为样本容量,为模型中一阶自回归项 系数估计量的方差。n杜宾证明在不存在误差序列相关时,上述H统计量服从标准正态分布,可
25、以根据正态分布表进行H的显著性检验,而H的显著性检验则可以代表误差序列一阶自相关存在性的检验。21DW)(2cVar1tYn杜宾H检验具体方法如下:给定显著性水平 ,查正态分布表得临界值 。若 ,认为模型存在一阶自相关;若 ,则认为不存在一阶自相关。hhH hH 第三节第三节 因果关系检验因果关系检验一、经济变量之间的因果性问题二、格兰杰因果性检验一、经济变量之间的因果性问题n经济变量的因果性其实是很复杂的问题,理论上存在因果关系的变量现实中并不一定存在因果关系,有因果关系的变量之间谁为因谁为果也并不容易清楚。n由于没有因果关系的变量之间常常有很好的回归拟合,把回归模型的解释、被解释变量倒过来
26、常常也能够拟合得很好,因此回归分析本身不能检验因果关系的存在性,也无法识别因果关系的方向。n通过对变量关系更深入、细致的分析,排除因果关系的误设,加强对回归模型中变量间因果关系的信心,是解决上述因果关系疑问的方法之一。n采用联立方程组模型也是解决上述因果关系疑问的一种方法。因为联立方程组模型中可包含不同变量相互作为原因和结果的情况,可以在一定程度上回避确定经济变量之间究竟谁为因谁为果的困难。n解决上述因果关系疑问的第三种方法是忽略计量回归模型的因果性隐含,前提是可以进行有效的预测。经济变量间因果关系的疑问,往往导致计量回归分析的基础和价值受到影响。n当然,如果能够对经济变量之间的因果性进行检验
27、,为理论上的因果关系寻找统计、实证方面的支持和根据,对于计量经济回归分析价值显然是有力的支持。二、格兰杰因果性检验n格兰杰检验就是运用统计技术检验经济变量因果性的方法。n基本原理是利用经济关系发挥作用的时间差和滞后效应,根据经济变量各自的前期指标(滞后变量反映)相互在解释、影响对方指标中的显著程度,来判断因果关系的存在性和方向。n格兰杰检验的特点决定了它只能适用于时间序列数据模型的因果性检验,无法检验横截面数据变量间的因果性,并且必然用到分布滞后、自回归模型。n这里用比较简单的X、Y两变量关系说明格兰杰因果性检验的具体方法。n因为因果性检验是针对因果关系不清楚或有疑问的变量,因此一般格兰杰检验
28、总是进行双向的检验,即同时检验X是Y的原因还是Y是X的原因。n为了检验X 的前期水平是否对Y 的后期水平产生影响,格兰杰因果性检验通常采用如下的分布滞后模型进行检验:n上述模型中X 的分布滞后项正是要考察的是否对Y 当前水平有影响的因素,它们的系数反映了这种影响,也就是因果性的存在。n而其中Y 的各阶自回归项则是为了排除把自回归效应误作分布滞后效应,得出错误结论的可能性。ytptyptyptyptyytXXYYY11110n在该模型的基础上检验X对Y的因果性,就是检验如下假设:n该假设一般通过构造如下的F统计量来检验的:n其中 是 下的误差平方和,为备择假设下 的误差平方和,p是滞后长度。0:
29、210ypyyH)12/(/)(110pTRSSpRSSRSSS0RSS0H1RSS1H(,21)F p Tpn有了上述F分布统计量,可以根据F分布的临界值表,判断原假设 是否成立,从而选择是拒绝还是接受存在X 影响Y 的因果性的结论。n反过来,如果要检验Y影响X的因果性,事实上方法也是相同的。n只要用模型:进行回归,并构造出相应的F统计量,检验假设:即可。ytqtxptxqtxptxxtYYXXY111100H0:210 xqxxH需要注意的问题n值得注意的是,格兰杰因果性检验的结论只是统计意义上的因果性,而不一定是真正的因果关系。n虽然可以作为真正因果性的一种支持,但不能作为肯定或否定因果性的最终根据。n当然,即使格兰杰因果性不等于实际因果关系,也并不妨碍其参考价值。因为统计意义上的因果性也是有意义的,对于经济预测等仍然能起很大的作用。n上述格兰杰因果性检验还有一个需要注意的问题,即回归模型中分布滞后、自回归项滞后长度p和q的选择问题。n一般来说这两个滞后长度的选择是任意的,但有时不同的滞后长度会导致检验的结果发生变化,这时候对于因果性判断的结果就要比较谨慎。