1、第十章第十章 时间序列数据的基本回归分析时间序列数据的基本回归分析10.1 时间序列数据的性质我们应该怎样认识时间序列数据的随机性?回答:很明显,经济时间序列满足作为随机变量结果所要求的直观条件,这些变量的结果都无法事先预料到。(例如,我们今天不知道道琼斯工业指数在下一个交易日收盘时会是多少,我们也不知道加拿大下一年的年产出增长会是多少。)规范地,一个标有时间脚标的随机变量序列被称为一个随机过程随机过程(stochastic process)或时间序列过程时间序列过程(time series process)。10.2 时间序列回归模型的例子1 1、静态模型、静态模型我们将有两个变量(例如y和
2、z)的时间序列数据标注相同的时期,将这样的y和z联系起来即为一个静静态模型态模型(static model):“静态模型”的名称来源于我们正在模型化y和z的同期关系的事实。在一个静态回归模型中也可以有几个解释变量。2 2、有限分布滞后模型、有限分布滞后模型在有限分布滞后模型(finite distributed lag model,FDL)中,我们容许一个或多个变量对y的影响有一定时滞。ntuzyttt, 2 , 1,10考察一个二阶FDL:(1)当z发生一个暂时性的提高时, 则表示z在t时期提高一个单位所引起y的即期变化。 通常被称作冲击倾向冲击倾向(impact propensity)或冲
3、击乘冲击乘数数(impact multiplier)。(注意: 分别表示这一暂时变化发生后,下一时期、两个时期、j个时期后y的变化如图10.1)(2)当z从t期开始永久性提高,一期后y提高了 ,两期后y提高了 。 这表明,z的当期和滞后系数之和 ,等于z的永久性提高导致y的长期变化,它被称为长期倾向长期倾向(long-run propensity, LRP)或长期乘数长期乘数(long-run multiplier)。tttttuzzzy22110000j,2110210210一个q阶有限分布滞后模型可写成:静态模型是上式的一种特例,当 都为0即可。冲击倾向总是同期z的系数 。长期倾向便是所有
4、变量 的系数之和。tqtqtttuzzzy1100q,210jtzqLRP1010.3 经典假设下OLS的有限样本性质假定假定 TS.1TS.1(线性于参数)假定假定 TS.2TS.2(无完全共线性):在样本中,没有任何自变量是恒定不变的,或者是其他自变量的一个完全线性组合。假定假定 TS.3TS.3(零条件均值):假定假定 TS.4TS.4(同方差性):该假定意味着, 不能依赖于X(只要 和X相互独立就足够了满足TS.3即可),且在所有时期都保持不变。假定假定 TS.5 TS.5(无序列相关):【提问:我们为什么不假定不同横截面观测的误差是无关的呢?答:前述有随机抽样的假定,则以样本中所有解
5、释变量为条件,不同观测的误差是独立的。因此,就我们当前目的而言,序列相关只是时间序列和回归中的一个潜在问题。】假定假定 TS.6TS.6(正态性):误差 独立于X,且具有独立同分布ntXuEt, 2 , 1, 0)(ntuVarXuVartt, 2 , 1,)()(2stXuuCorrst , 0),()(XuVarttutu), 0(2Normal定理定理 10.1 10.1(OLS的无偏性) 在假定TS.1、TS.2和TS.3下,以X为条件,OLS估计量是无偏的,并因此下式也无条件地成立:定理定理10.210.2(OLS的样本方差) 在时间序列高斯-马尔可夫假定TS.1-TS.5下,以X为
6、条件, 的条件方差为: 其中, 是 的总平方和, 为由 对所有其他自变量回归得到的kjEjj, 1 , 0,)(jkjRSSTXVarjjj, 1,)1 ()(22jSSTtjx2jRjx2R定理定理10.310.3( 的无偏估计) 在假定TS.1-TS.5下,估计量 是 的一个无偏估计量,其中df=n-k-1定理定理10.410.4(高斯-马尔可夫定理) 在假定TS.1-TS.5下,以X为条件,OLS估计量是最优线性无偏估计量最优线性无偏估计量。定理定理10.510.5(正态抽样分布) 在时间序列的CLM假定TS.1-TS.6下,以X为条件,OLS估计量遵循正态分布。而且,在虚拟假设下,每个
7、t统计量服从t分布,F统计量服从F分布,通常构造的置信区间也是确当的。2dfSSR/22例例10.110.1 静态菲利普斯曲线研究失业和通货膨胀之间是否存在替代关系。 H0: H1:文件:PHILLIPS.RAW命令:reg inf unem结果: 上述方程并没有表明unem和inf之间存在替代关系(因为 )分析中可能存在的问题:(1)CLM假定不成立(12章);(2)静态菲利普斯曲线不是最佳模型(附加预期的菲利普斯曲线)010101例例10.2 10.2 通货膨胀和赤字对利率的影响1948-2003年数据。 i3:三月期国债利率; inf:据消费者价格指数得出的年通货膨胀率 def:联邦赤字
8、占GDP 的百分比文件:INTDEF.RAW命令:reg i3 inf def结果:Inf与def对于i3的影响在统计上十分显著,即通货膨胀上升或赤字相对规模的扩大都会提高短期利率。(但前提是CLM假定成立)10.4 函数形式、虚拟变量和指数在应用研究中经常出现具有恒定百分比效应的时间序列回归(自然对数形式)将对数函数对数函数形式用于分布滞后模型:方程中的冲击倾向 也被称为短期弹性短期弹性(short-run elasticity):它度量了GDP增长1%时货币供给的即期百分比变化;长期倾向 有时也被称为长期弹性长期弹性(long-run elasticity):它度量了GDP持久地增长1%,
9、4个月后货币供给的百分比变化。4100二值或虚拟自变量虚拟自变量在时间序列应用中也相当有用。既然观测单位是时间,所以虚拟变量代表某特定事件在每个时期是否发生。在事件研究事件研究(event study)中,二值变量是关键成分。事件研究的目标是为了确定某个特定的事件是否会影响到某项结果。讨论指数指数(index number)的概念: (1)基期、基值; (2)标准的经济产出都是用真实价值表示的;例例10.3 10.3 波多黎各的就业和最低工资研究美国的最低工资对波多黎各就业的影响。 prepopt:波多黎各第t年的就业率(就业人口占总人口的比例); usgnpt:美国的真实国民生产总值(以10
10、亿美元计) mincov:度量最低工资相对于平均最低工资的重要性。mincov=(avgmin/avgwage)*avgcov,其中,avgmin是平均最低工资,avgwage是总体平均工资,avgcov是平均工资覆盖率。文件:PRMINWGE.RAW命令: reg lprepop lmincov lusgnp结果:prepop对mincov的估计弹性是-0.154,而根据t=-2.37,它在统计上是显著的。因此,更高的最低工资降低了就业率,这与古典经济学的预言一样。例例10.4 10.4 个人税收豁免对生育率的影响总生育率(gfr)是每个1000个育龄妇女生育孩子的个数。对1913-1984
11、年这段时间,方程 pe:个人税收减免的实际美元金额; ww2:在1941-1945年间为1(第二次世界大战); pill:从避孕药开始用于控制生育的1963年后一直为1文件:FERTIL3.RAW命令:sum pe reg gfr pe ww2 pill结果:考虑生育率对pe变化的反应滞后,估计一个包含两期滞后的分布滞后模型命令:reg gfr pe ww2 pill pe_1 pe_2在这个回归中,我们只有70次观测,这是因为pe滞后两次减少了2次观测。pe变量的系数估计得很不准确,每一个变量都不是个别显著的。事实上,pet,pet-1和pet-2明显相关,这种多重共线性多重共线性使得估计每
12、个滞后的影响非常困难。1、pet,pet-1和pet-2是联合显著的,F统计量的p值为0.012。命令:test pe pe_1 pe_2因此,pe的确对gfr有影响,但我们并没有足够好的估计值判断这种影响是即期的,还是存在一期或者两期的滞后(或都有一些)。2、实际上, pet-1和pet-2不是联合显著的,因而我们使用静态模型还算合理。 命令:test pe_1 pe_2式(10.19)中估计的(命令:display _bpe+_bpe_1+_bpe_2) LRP=0.073-0.0058+0.034=0.101但我们从式(10.19)中无法得到这个估计值的标准误。为得到LRP估计值标准误的
13、技巧:令 表示LRP,并将 代入模型便得到21002100221100ttttpepepegfr22112100)(ttttpepepegfr)()(221100tttttpepepepepe基于上式,可通过将gfrt对pet,(pet-1-pe),(pet-2-pet),ww2t和pillt进行回归而得到 及其标准差。命令: gen dif1=pe_1-pe gen dif2=pe_2-pe reg gfr pe dif1 dif2 ww2 pill说明 在较小的显著性水平上异于0。本例说明:本例说明:即使 都不是个别显著的,但LRP非常显著。 _cons 9 95 5. .8 87 70
14、05 5 3 3. .2 28 81 19 95 57 7 2 29 9. .2 21 1 0 0. .0 00 00 0 8 89 9. .3 31 14 40 03 3 1 10 02 2. .4 42 27 7 pill - -3 31 1. .3 30 04 49 99 9 3 3. .9 98 81 15 55 59 9 - -7 7. .8 86 6 0 0. .0 00 00 0 - -3 39 9. .2 25 59 90 07 7 - -2 23 3. .3 35 50 09 91 1 ww2 - -2 22 2. .1 12 26 65 5 1 10 0. .7 73 31
15、 19 97 7 - -2 2. .0 06 6 0 0. .0 04 43 3 - -4 43 3. .5 56 66 60 08 8 - -. .6 68 86 69 91 19 96 6 dif2 . .0 03 33 38 82 26 68 8 . .1 12 26 62 25 57 74 4 0 0. .2 27 7 0 0. .7 79 90 0 - -. .2 21 18 84 40 01 13 3 . .2 28 86 60 05 55 5 dif1 - -. .0 00 05 57 77 79 96 6 . .1 15 55 56 66 62 29 9 - -0 0. .0
16、04 4 0 0. .9 97 70 0 - -. .3 31 16 67 75 52 2 . .3 30 05 51 19 92 29 9 pe . .1 10 00 07 71 19 91 1 . .0 02 29 98 80 02 27 7 3 3. .3 38 8 0 0. .0 00 01 1 . .0 04 41 11 18 81 14 4 . .1 16 60 02 25 56 68 8 gfr Coef. Std. Err. t P|t| 95% Conf. Interval Total 2 25 59 99 92 2. .4 43 32 29 9 6 69 9 3 37 76
17、 6. .7 70 01 19 92 26 6 Root MSE = 1 14 4. .2 27 7 Adj R-squared = 0 0. .4 45 59 94 4 Residual 1 13 30 03 32 2. .6 64 44 43 3 6 64 4 2 20 03 3. .6 63 35 50 06 67 7 R-squared = 0 0. .4 49 98 86 6 Model 1 12 29 95 59 9. .7 78 88 86 6 5 5 2 25 59 91 1. .9 95 57 77 72 2 Prob F = 0 0. .0 00 00 00 0 F( 5,
18、 64) = 1 12 2. .7 73 3 Source SS df MS Number of obs = 7 70 000j例例10.5 10.5 反倾销调查和化学产品进口在美国开展反倾销调查,而后制定反倾销生产条例的过程中,一些有意思的问题:(1)在反倾销调查前的一段时期进口量异常吗?(2)反倾销调查后进口有明显的变化吗?(3)有利于美国产业的决策执行后,进口究竟减少了多少?定义的3个虚拟变量:befile6:在开始调查前的六个月为1;affile6:表示开始调查后的六个月;afdec6:代表调查结束并确认构成倾销行为后的六个月;因变量chnimp:从中国进口的数量(取对数形式);解释变
19、量包括:(1)化工产量指标chempi;(2)石油产量gas;(3)汇率指标rtwex;(均使用对数形式)文件:BARIUM.RAW命令: reg lchnimp lchempi lgas lrtwex befile6 affile6 afdec6结果:计算出准确的百分比变化(决策执行后,进口减少的比率)命令:display 100*(exp(_bafdec6)-1)例例10.6 10.6 选举结果和经济形势费尔利用1916-1992年(每4年一次)的数据 得到的20次观测,解释了两党选举中民主党候选人获得选票的比例。估计费尔模型的一个简化形式:其中: demvote:两党选举中民主党候选人获
20、得选票的比例; partyWH:虚拟变量,民主党在白宫执政时取值为1, 共和党执政时取值为-1; incum:民主党在任总统参加竞选时定义为1,共和党在任总统参加竞选时定义为-1,其他情况为0; gnews:现任政府执政的前15个季度中,人均真实产出增长率超过2.9%的季度数; inf:本届政府前15个季度的年均通货膨胀率。gnewspartyWHincumpartyWHdemvote3210upartyWHinf4当当partyWH为为1时,时, 度度量了好的经济消息对执量了好的经济消息对执政党的影响;政党的影响; 度量了通度量了通货膨胀对执政党的影响。货膨胀对执政党的影响。34关注交互项哦
21、!关注交互项哦!文件:FAIR.RAW命令: reg demvote partyWH incum pWHgnews pWHinf if year|t| 95% Conf. Interval 趋势系数和标准误趋势系数和标准误(虽然不一定可靠)(虽然不一定可靠)揭示了上升趋势揭示了上升趋势 _cons - -. .1 18 88 83 38 86 6 . .0 01 10 05 51 12 21 1 - -1 17 7. .9 92 2 0 0. .0 00 00 0 - -. .2 20 09 96 63 31 18 8 - -. .1 16 67 71 14 40 01 1 t . .0 00
22、 04 44 41 17 73 3 . .0 00 00 04 42 25 59 9 1 10 0. .3 37 7 0 0. .0 00 00 0 . .0 00 03 35 55 56 65 5 . .0 00 05 52 27 78 81 1 lprice Coef. Std. Err. t P|t| 95% Conf. Interval 现在结论大不相同:估计现在结论大不相同:估计出的价格弹性是负的,而出的价格弹性是负的,而且在统计上也非显著异于且在统计上也非显著异于0。因而前一回归方程为因而前一回归方程为invpc和和price之间的谬误关系。之间的谬误关系。在有些情形中,若自变量和
23、因变量有不同类型自变量和因变量有不同类型的趋势(比如一个向上而另一个向下),增加一个时间趋势可使关键解释变量更显著更显著,但自变量围绕其趋势线的变动会导致因变量偏离其趋势线的变动。以例10.8来解释。例例10.8 10.8 生育方程(基于例10.4的FERTIL3.RAW)(1)在生育方程中添加一个线性时间趋势线性时间趋势:命令:reg gfr pe ww2 pill t(2)采用二次趋势(观察总生育率在1913-1984年间表现出先上升后下降的趋势。)命令:reg gfr pe ww2 pill t tsq(1)、()、(2)中)中pe系数的估计值不系数的估计值不断增大,并且更加断增大,并且
24、更加显著显著对包含时间趋势回归的除趋势解释对包含时间趋势回归的除趋势解释在回归模型中引进时间趋势,相当于在回归分析中,在使用原始数据之前,便将它们除趋势除趋势(detrending)对于拟合方程 中的 和 可通过如下除趋势化的步骤得到:(1)将yt、xt1和xt2分别对常数项和时间趋势t回归,并记录残差 、 和 ,t=1,2,n。例如,对于 和 的解释与此类似。(2)做 对 和 的回归。这个回归得出的 和 与前式中相同。这意味着,我们最感兴趣的系数估计值( 和 )来自于一个没有时间趋势的回归,在这个回归中,我们首先除去了因变量和所有自变量的趋势。txxyttt32211012ty 1tx 2t
25、x tyytt10 1tx 2tx ty 1tx 2tx 1212例例10.9 10.9 波多黎各的就业(基于例10.3的PRMINWGE.WAGE)加入一个线性趋势,估计结果为:log(usgnp)的系数发生了显著变化:从不显著的-0.012提高到非常显著的1.06。最低工资的系数只发生微小变化,然而标准误明显变小了,而标准误的变小使log(mincov)比以前更加显著。因变量有趋势时因变量有趋势时R R2 2的计算的计算当因变量含有趋势时,时间序列回归中的普通或调整R2可能会认为地变大。为解决这一问题,我们首先做yt对t的回归,得到残差 。然后, 将 对xt1,xt2,t回归这一回归中的R
26、2能够更好地反应出xt1,xt2能在多大程度上解释yt,因为它过滤掉了时间趋势的影响。ty ty 例例10.10 10.10 住房投资(基于例10.7的HSEINV.RAW)除去log(invpc)中的趋势,并将得到的变量对log(price)和t做回归:predict linvpch, resreg linvpch lprice t对比除趋势之前的回归结果:reg linvpc lprice t Total . .8 81 11 11 17 73 30 07 72 2 4 41 1 . .0 01 19 97 78 84 47 70 09 9 Root MSE = . .1 14 43 36
27、 64 4 Adj R-squared = - -0 0. .0 04 42 29 9 Residual . .8 80 04 46 67 74 49 93 38 8 3 39 9 . .0 02 20 06 63 32 26 69 91 1 R-squared = 0 0. .0 00 08 80 0 Model . .0 00 06 64 49 98 81 13 34 4 2 2 . .0 00 03 32 24 49 90 06 67 7 Prob F = 0 0. .8 85 54 48 8 F( 2, 39) = 0 0. .1 16 6 Source SS df MS Number
28、 of obs = 4 42 2 Total 1 1. .2 22 20 06 62 20 00 03 3 4 41 1 . .0 02 29 97 77 71 12 22 2 Root MSE = . .1 14 43 36 64 4 Adj R-squared = 0 0. .3 30 07 70 0 Residual . .8 80 04 46 67 74 49 92 27 7 3 39 9 . .0 02 20 06 63 32 26 69 9 R-squared = 0 0. .3 34 40 08 8 Model . .4 41 15 59 94 45 51 10 08 8 2 2
29、 . .2 20 07 79 97 72 25 55 54 4 Prob F = 0 0. .0 00 00 03 3 F( 2, 39) = 1 10 0. .0 08 8 Source SS df MS Number of obs = 4 42 2除趋势后的除趋势后的R2表明,表明,log(price)围绕围绕其趋势的变动,其趋势的变动,对对log(invpc)围围绕其趋势的变绕其趋势的变动实际上完全动实际上完全没有解释能力,没有解释能力,这与这与log(price)很小的很小的t统计量统计量相一致。相一致。季节性季节性很多公布的宏观经济时间序列都已经进行了季节调整,因此,需要我们自己去进
30、行季节调整的范围是很有限的。季节调整的方法:一组季节虚拟变量季节虚拟变量如一年中不同月份(只需要假设11个月份的变量) 一年中不同季度则只需要假设3个虚拟变量除季节性(与除趋势思路一致)ttkkttttttuxxdecaprmarfeby11113210例例10.11 10.11 反倾销调查的影响(基于例10.5)添加11个月份的虚拟变量,并检验它们的联合显著性。文件:BARIUM.RAW命令: reg lchnimp lchempi lgas lrtwex befile6 affile6 afdec6 feb mar apr may jun jul aug sep oct nov dec 联合显著性检验: test feb mar apr may jun jul aug sep oct nov dec Prob F = 0 0. .5 58 85 52 2 F( 11, 113) = 0 0. .8 86 6P值值=0.59,故季节,故季节虚拟变量不是联合虚拟变量不是联合显著的。显著的。