1、1时间序列专题时间序列专题第一节,自相关第一节,自相关一、自相关的概念一、自相关的概念对于模型 ikikiiiXXXY22110 i=1,2,n随机误差项互不相关的基本假设表现为: Covij(,) 0 ij,i,j=1,2,n 如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了自相关性。定义为:定义为:“按照按照时间或空间排列时间或空间排列的观察值的观察值之间的相关关系之间的相关关系。在其他假设仍成立的条件下,序列相关序列相关即意味着0)(jiE或nnTENNE11)(21121nnnE )()()()(21121nnnEEEE21121)()(nnnEE
2、2112)()(nnEE2I2 (2.5.1)称为一阶自相关一阶自相关,或自相关自相关(autocorrelation)。这是最常见的一种自相关问题。 自相关自相关往往可写成如下形式:如果仅存在 Eii()10 i=1,2,n-1 (2.5.2) ttt1 11 (2.5.3)其中:被称为自协方差系数(coefficient of autocovariance)或一阶自相关系数(first-order coefficient of autocorrelation)。经济模型中最常见的是一阶自回归形式。经济模型中最常见的是一阶自回归形式。即一阶线性自回归形式的自回归系数等于该两个变量的相关系数。
3、即一阶线性自回归形式的自回归系数等于该两个变量的相关系数。6o 一阶自相关系数定义和普通相关系数定义相同,其取值范围也在(-1,1)之间。o 一阶自相关与高阶自相关o 时序自相关与空间自相关7(1) 一阶自回归形式 当误差项ut只与其滞后一期值有关时,即 ut = f (ut - 1), 称ut具有一阶自回归形式。如:(2) 高阶自回归形式 当误差项ut的本期值不仅与其前一期值有关,而且与其前若干期的值都有关系时,即 ut = a1 ut 1+a2 ut 2 + vt 则称ut 具有高阶自回归形式。9二、自相关产生的原因自相关产生的原因经济系统的惯性数据处理造成的相关蛛网现象 模型设定偏误 大
4、多数经济时间数据都有一个明显的特点,就是大多数经济时间数据都有一个明显的特点,就是它的惯性。它的惯性。 GDP、价格指数、生产、就业与失业等时间序列都呈周期性,如周期中的复苏阶段,大多数经济序列均呈上升势,序列在每一时刻的值都高于前一时刻的值,似乎有一种内在的动力驱使这一势头继续下去,直至某些情况(如利率或课税的升高)出现才把它拖慢下来。思考:棘轮效应中的系统惯性。1、系统惯性112、设定偏误-模型中遗漏了显著的变量 例如:如果对牛肉需求的正确模型应为Yt=0+1X1t+2X2t+3X3t+t其中:Y=牛肉需求量,X1=牛肉价格,X2=消费者收入,X3=猪肉价格。 如果模型设定为:Yt= 0+
5、1X1t+2X2t+vt那么该式中的随机误差项实际上是:vt= 3X3t+t, 于是在猪肉价格影响牛肉消费量的情况下,这种模型设定的这种模型设定的偏误往往导致随机项中有一个重要的系统性影响因素,使其呈偏误往往导致随机项中有一个重要的系统性影响因素,使其呈自相关性。自相关性。 设定偏误-不正确的函数形式 例如:例如:如果边际成本模型应为: Yt= 0+1Xt+2Xt2+t其中:Y=边际成本,X=产出。 但建模时设立了如下模型: Yt= 0+1Xt+vt因此,由于vt= 2Xt2+t, ,包含了产出的平方对随机项的系统性影响,随机项也呈现自相关性。04812162024280.00.20.40.6
6、0.81.01.2YYF1YF2X-3-2-10123478808284868890929496980002RESID03、蛛网现象 例如,例如,农产品供给对价格的反映本身存在一个滞后期: 供给t= 0+1价格t-1+t意味着,农民由于在年度t的过量生产(使该期价格下降)很可能导致在年度t+1时削减产量,因此不能期望随机干扰项是随机的,往往产生一种蛛网模式。4、数据的“编造” 例如,例如,季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动而引进了数据中的匀滑性,这种匀滑性本身就能使干扰项中出现系统性的因素,从而出现自相关。 还有就是两个时间点之间的“内插”技术往往导致随机项的自
7、相关性。三、自相关的后果o1、参数估计量非有效o OLS参数估计量仍具无偏性o OLS估计量不具有有效性o 在大样本情况下,参数估计量仍然不具有渐近有效性,这就是说参数估计量不具有一致性o下面来看在存在自相关情况下的误差的期望和方差 OLS估计量具有无偏性18OLS估计量不具备有效性19 2、变量的显著性检验失去意义 在关于变量的显著性检验中,当存在自相关时,参数的OLS估计量的方差增大,标准差也增大,因此实际的 t 统计量变小,从而接受原假设i=0的可能性增大, 检验就失去意义。 采用其它检验也是如此。3、模型的预测失效 区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准
8、确,预测精度降低。所以,当模型出现自相关性时,它的预测功能失效。四、自相关检验o 基本思路o 自相关性检验方法有多种,但基本思路是相同o 首先采用普通最小二乘法估计模型,以求得随机误差项的“近似估计量”:( )eyyiiils0 然后,通过分析这些“近似估计量”之间的相关性,以达到判断随机误差项是否具有自相关性的目的。1、图示法由于残差ei可以作为i的估计,因此如果i存在序列相关, 必然会由残差项ei反映出来,因此可利用ei的变化图形来判断随机项的序列相关性。2425图示的数值试验图示的数值试验-正相关正相关tvuu1 - tt9 . 0),( 10NtvY0=1-6-4-20246-6-4-
9、20246X(-1)XUU(-1)-4-2024102030405060708090100X U-3-2-10123102030405060708090100U-6-4-20246102030405060708090100X U-6-4-20246-6-4-20246X(-1)XUU(-1)-4-2024-4-2024U(-1)UUU(-1)数值试验数值试验-负相关负相关tt-10.9tuuv ),( 10NtvY0=12、回归检验法以ei为被解释变量, 以各种可能的相关量,诸如以ei1、ei2、ei2等为解释变量,建立各种方程: eeiii1 i=2,n eeeiiii1122 i=3,n
10、o对各方程估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在自相关性o具体应用时需要反复试算。o 回归检验法的优点是: 一旦确定了模型存在自相关性,也就同时知道了相关的形式; 它适用于任何类型的自相关性问题的检验。3、杜宾-瓦森(Durbin-Watson)检验法o D-W检验是杜宾(J.Durbin)和瓦森(G.S. Watson)于1951年提出的一种检验序列自相关的方法o 该方法的假定条件是:(1)解释变量 X非随机;(2)随机误差项i为一阶自回归形式: i=i-1+i(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式: Yi=0+1X1i+
11、kXki+Yi-1+i(4)回归含有截距项;(5)没有缺落数据。Durbin 和 Watson 假设:0:0H, 即i不存在一阶自回归;0:1H, 即i存在一阶自回归并构如下造统计量: D Weeeiiiniin.()12221 (2.5.5)D.W.统计量3334o 该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。o 但是,Durbin和Watson成功地导出了临界值的下限dL和上限dU ,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。o 检验步骤 计算该统计量的值, 根据样本容量n和解释变量数目k查D.W.分布表,得到临界值dL
12、和dU, 按照下列准则考察计算得到的D.W.值,以判断模型的自相关状态。临界值与临界值与3个参数有关:个参数有关:(1)检验水平)检验水平 (2)样本容量)样本容量T (3)原回归模型中解)原回归模型中解释变量个数释变量个数k(不包括(不包括常数项)。常数项)。DW应用注意: (1)从判断准则看到,存在一个不能确定的D.W.值区域,这是这种检验方法的一大缺陷。 (2)D.W.检验虽然只能检验一阶自相关,但在实际计量经济学问题中,一阶自相关是出现最多的一类自相关; (3)经验表明,如果不存在一阶自相关,一般也不存在高阶自相关。 所以在实际应用中,对于自相关问题一般只进行D.W.检验。4、游程检验
13、38395、一般性检验:B-G检验4041o DW统计量只适用于一阶自相关检验,而对于高阶自相关检验并不适用。o 利用BG统计量可建立一个适用性更强的自相关检验方法,即,BG统计量既可检验一阶自相关,也可检验高阶自相关。 DW检验法与检验法与LM检验法的比较检验法的比较43四 自相关的补救 广义差分法 科克伦奥克特迭代法 其他方法简介 如果自相关是由于错误地设定模型的数学形式所致设定模型的数学形式所致,那么就应修改模型的数学形式。方法是用残差et 对解释变量的较高次幂进行回归。 如果自相关是由于模型中省略了重要解释变量造成的省略了重要解释变量造成的,那么解决办法就是找出略去的解释变量,把它做为
14、重要解释变量列入模型(怎样查明自相关是由于略去重要解释变量引起的?一种方法是用残差et对那些可能影响被解释变量,但又未单列入模型的解释变量回归,并作显著性检验)。 只有当以上两种引起自相关的原因都排除后,才能认为误差项只有当以上两种引起自相关的原因都排除后,才能认为误差项ut 真正存在自相真正存在自相关。关。 在这种情况下,解决办法是变换原回归模型,使变换后模型的随机误差项消除自相关,称作广义最小二乘法。前提:45广义差分(P已知)AutoRegressive46对于值的确定o 1、一阶差分法47o 2、48o 3、科克伦-奥科特迭代法49o 4、50o 5、51o 自相关案例附最后52第二节
15、动态经济模型:分布滞后模型一、概念一、概念54 在很多情形下,被解释变量Y,不仅受同期的解释变量X的影响,而且还明显依赖于X的滞后值。n例如:n人们的消费支出不仅与当前收入有关,还取决于过去的收入水平;n企业的产出是由现在的投资和过去的投资共同决定的。 描述这种现象的经济计量模型滞后变量模型滞后变量模型。 1、滞后效应产生的原因(1)、心理原因(习惯的影响、信息不充分) 经济活动离不开人的参与,人的心理因素对经济变量的变化有很大影响。一方面是心理定势及社会习惯的作用;另一方面是预期心理的影响。55 (2).客观原因(技术性原因、制度性原因) 在经济运行中,从生产到流通,每一个环节都需要一 段时
16、间,从而形成滞后现象。另外,现代社会中经济活动都是在一定制度下进行的,从而限制了对市场反应的灵活性。2、滞后变量模型一般形式为:56tqtqttststttuYYYXXXY 2211110 其中,s、q分别称为滞后解释变量和滞后被解释变量的滞后期长度。 若滞后期长度有限,称模型为有限滞后变量模型。 若滞后期长度为无限,称模型为无限分布滞后模型。分布滞后模型分布滞后模型形式为:形式为:57tststttuXXXY 110 ttttuXXY 110 其中第一式的最大滞后长度s是一个确定的数,因此是有限分布滞后模型。 而第二式没有规定最大滞后长度,是无限分布滞后模型。o 在分布滞后模型中,回归系数0
17、称为短期乘数或即期乘数,它表示解释变量 X 变化一个单位对同期被解释变量 Y 产生的影响。o 1,2,3称为延迟乘数或动态乘数,因为它们是测度以前不同时期 X 变化一个单位对 Y 的滞后影响; 582100ii 称为长期乘数或总分布乘数,它表示滞后效应对 Y 总的影响; 而而sii0或或自回归模型自回归模型形式为:形式为:59tqtqttttuYYYXY 22110 其中,q 称为自回归模型的阶数。 自回归模型分布滞后模型的估计难度 直接应用最小二乘法估计分布滞后模型会遇到很多困难。o 由于无限分布滞后模型中包含无限多个参数,我们无法用最小二乘法对其进行估计。o 对于有限分布滞后模型,最小二乘
18、法原则上是适用的,但在具体应用时会遇到很多困难。60二、 分布滞后模型的估计2.如果滞后期较长而样本较小时,就没有足够的自由度进行统计推断。 因为,每增加一个解释变量就会失去一个自由度。同时,滞后期每增加一期,可利用的数据就会减少一个。 611.有限分布滞后模型的最大滞后长度s 较难确定。其确定往往带有主观随意性。3. 时间序列资料中,大多存在序列相关问题(如Xt-1与Xt-2)。在分布滞后模型中,这种序列相关问题就转化为解释变量之间的多重共线性问题。 由于以上原因,在实践中很少用最小二乘法直接估计分布滞后模型。一般是对分布滞后模型施加约束条件,以便减少模型中的参数。 所谓经验加权估计法就是根
19、据经验对滞后变量的系数赋予一定的权数,利用这些权数构成各滞后变量的线性组合,形成新的变量,再利用最小二乘法进行估计。常见的滞后结构赋权类型有:(1)递减滞后结构;(2)不变滞后结构;(3) 倒U型滞后结构;621、经验加权估计法(1)优点o 简单易行、不损失自由度、避免多重共线性及参数估计具有一致性。(2)缺点o 权数的设置具有主观随意性。ttttttuXXXXY 3322110 63经验加权估计法的优缺点例如,考虑一个滞后3期的分布滞后模型权数分别设为;81,61,41,21)1(;41,41,41,41)2(.41,32,21,41)3(2、阿尔蒙Almon估计法 对于有限分布滞后模型对于
20、有限分布滞后模型64tststttuXXXY 110将参数i(i=0,1,2,s)看成是相应滞后期 i 的函数:)(ii 由美国经济学家Almon于1965年提出的。 65ii如果参数i(i = 0,1,2,s)的值近似落在一条光滑曲线上,则可以用一个关于 i 的次数较低的多项式表示参数。0132s 此式称为此式称为Almon多项式变换多项式变换。 多项式的阶数多项式的阶数 m 必须小于有限分布滞后模型的最必须小于有限分布滞后模型的最大滞后长度大滞后长度 s ,否则就达不到减少参数个数的目,否则就达不到减少参数个数的目的。在具体应用时,的。在具体应用时,m 一般取一般取 2 或或 3,不超过,
21、不超过 4。 具体列出来就是具体列出来就是:siiiimmi, 2 , 1 , 02210 66 mmsmmmmsss 22102210122100111000tststttuXXXY 110 stmtmtmtsttttstttttXsXXZsXXXZXXXXZ212112102267tmtmtttuZZZY 1100可得模型: 把它们代入:其中: 显然,只要随机误差项满足线性回归模型的假定,显然,只要随机误差项满足线性回归模型的假定,就可以用就可以用OLS估计得到估计得到,0,m的估计值的估计值后,再由后,再由tmtmtttuZZZY 1100 mmsmmmmsss 221022101221
22、0011100068 在上式中,解释变量不再是X,而是X的线性组合Z,多重共线性将因此而明显减弱。计算出i 的估计值。说 明1. 具体应用时,首先要确定有限分布滞后模型的最大滞后长度s。 确定滞后长度的一种简便方法就是根据调整后的判定系数确定滞后长度。 69knnRR 1)1(122做法:先用Yt对Xt,Xt-1回归,再用Yt对Xt, Xt-1, Xt-2 回归,直到调整后的判定系数的值达到最大为止。 2. 确定m 的方法:先给m一个较大的值(例如, 假定m = 4),然后用 t 检验逐步降低多项式的 阶数,直到m在统计上显著为止。 703、自回归方法o 有两种情形需要引入自回归模型,一是将无
23、限分布滞后模型通过变换转换为自回归模型;二是在模型中考虑了预期因素而导出自回归模型。o 这些模型主要有Koyck变换模型、自适应预期模型、局部调整模型。 71(1)库伊克Koyck模型 1 iiiiii 0221 72tttttuXXXY 22110 nKoyck提出了如下假定:参数按几何数列衰减,即 :i = 0,1,2, 或n上式中, 01, 称为分布滞后的衰减率,即随着滞后期的增加,滞后变量对被解释变量影响逐渐减弱。越小,衰减速度就越快。Koyck模型是L.M.Koyck于1954年提出的。对于无限分布滞后模型:73n由以上假定不难证明长期乘数为: 100210kktttttttttuX
24、XXuXXXY 22010022110k0k n这一模型仍然无法直接进行估计,因为它包含有无穷多个参数。 o 为了解决这个问题,为了解决这个问题,Koyck提出了一个十分巧提出了一个十分巧妙的解决办法。妙的解决办法。o 首先,将上式滞后一期,可得:首先,将上式滞后一期,可得:74132020101 tttttuXXXY 再将上式乘以,得到1330220101 tttttuXXXY )()1(101 tttttuuXYY o 整理后即有整理后即有:75)()1(110 tttttuuYXY n通过Koyck变换,无限分布滞后模型被简化为一个自回归模型,其中只有三个参数需要估计,它们分别是,0,。
25、n在新的模型中,一个解释变量Yt-1就代替了Xt-1,Xt-2,等所有X的滞后变量,因此可以避免多重共线性问题。nKoyck变换模型非常简洁,但它是单纯从代数过程得到的,缺少经济理论的支持。(2)自适应预期模型tttuXY * 76n这种模型建立在如下经济理论基础上:影响被解释变量 Yt 的因素不是 Xt ,而是关于Xt 的预期 X*t,即:o 这种经济行为是常见的。例如,当通货膨胀比较严重时,商品需求量往往取决于对未来价格水平的预期X*t ,而不是目前的实际价格水平Xt。o 再如,企业的生产计划取决于对未来销售状况的预期;投资取决于对未来利润的预期,等等。77tttuXY * o 由于X*t
26、 是一个无法直接观察的变量,需要对预期值的形成作出某种假设,例如假设:78)(*1*1*ttttXXrXX0r 1, 称为预期系数,(Xt Xt-1*)是预期误差。这一假设叫自适应预期假设。由上式可以看出,预期的形成是一个根据预期误差不断调整的过程,预期误差乘以 r 就是两个时期预 期的改变量,如果上一期预期偏高,即(Xt Xt-1*) 0,就有Xt* Xt-1*。 Example)(*1*1* ttttXXrXX79n例如,假定 Xt =120,Xt-1* =100,则预期误差为(120100)=20,于是新一期的预期调整为 Xt* = r*20 + 100由于 0 r 1, 故 Xt*大于
27、 100 小于 120。显然,r 的值越大,调整幅度也越大。 )(*1*1* ttttXXrXX80n还可以写成 : X*t = rXt +(1- r)Xt-1*或: X*t -(1- r)Xt-1* = rXtn 对 Yt = + X*t + ut 滞后一期并乘以 (1r), 有:1*11)1()1()1()1( ttturXrrYr 11)1 ()1 ( ttttturuXrrYrY 整理后得整理后得:81*1)1(ttttuYrXrrY 1*)1( ttturuu其其中中:自适应预期模型自适应预期模型adaptive expectation model(3)局部调整模型 82tttuXY
28、 *n例如:本期商品库存量的希望值(最佳库存量)取决于本期实际销售量;n固定资产投资的希望值(量佳投资额)取决于同期实际生产水平。 该模型基于如下假定:在时间 t,被解释变量的希望值(或称作最佳值) Yt*是同期解释变量 Xt 的线性函数。o 由于受到工艺技术水平、心理因素、制度因素等的影响,被解释变量的希望值在短期内是很难实现的,从而也是难以观测的。o 从而作出假设,希望值Yt*与实际值Yt之间的有如下关系 : Yt Yt-1 =(Yt*Yt-1) 式中 称为调整因子或调整系数,且 0183 Yt Yt-1 =(Yt*Yt-1) o 上式表示,被解释变量的实际变化Yt Yt-1 是被解释变量
29、的预期变动(希望变动) Yt*Yt-1 的一部分。这是因为要使Yt 到达到最佳水平需要进行调整,而调整需要时间。的数值表示调整速度,越大调整速度越快。o 例如,如果= 0.8,那么实际变化占希望变化的80%,即已经调整了80%;如果=1,则实际变化就是预期变化。 84把 Yt Yt-1 =(Yt*Yt-1) 改写成: Yt =Yt* + (1)Yt-1 把 Yt* =+Xt + ut 代入上式即得:85110)1()( ttttYuXY tttuYX 110)1(n这个模型就称为局部调整模型(partial adjustment model)。三个自回归模型,它们可统一写为三个自回归模型,它们
30、可统一写为:*1*1*0*ttttuYXY 861*1*0*)1(,1, ttturuurrr ttuur *1*0*,1,tttuuu *10*0*,),1((1)上述模型中解释变量都含有滞后被解释变量)上述模型中解释变量都含有滞后被解释变量Yt-1 它是随机变量,可能与随机误差项相关。它是随机变量,可能与随机误差项相关。(2)随机误差项可能自相关。)随机误差项可能自相关。*1*1*0*ttttuYXY 87假定原模型中随机误差项假定原模型中随机误差项ut满足古典假定:满足古典假定:0)( tuE2)( tuVar)(0),(jiuuCovji )(),(2111 ttttttuuuuEuu
31、Cov *1*1*0*ttttuYXY 88tttuuu *10*0*,),1()()()()(2121211 tttttttuuEuuEuEuuE 221)( tuE),(),(111 tttttuuYCovuYCov ),(),(111 ttttuYCovuYCov 0),(11 ttuYCov 0),(1 ttuuCov*1*1*0*ttttuYXY ttuur *1*0*,1,891*1*0*)1(,1, ttturuurrr 同理对自适应预期模型0),(1 ttuYCov而对局部调整模型0)()(),(1211 ttttttuuEuuEuuCov 0),(),(),(111 tttt
32、ttuYCovuYCovuYCov 因为Yt依赖于ut ,从而Yt-1依赖于ut-1,但由于ut 与ut-1不相关,所以Yt-1与误差项ut也不相关。(1)局部调整模型的估计)局部调整模型的估计90 当ut满足古典假定时,局部调整模型就满足古典假定,可以直接用最小二乘法来估计参数。(2)Koyck模型和自适应预期模型的估计 而Koyck变换模型与自适应预期模型中:随机误差项 ut* 存在自相关、解释变量 yt-1与 ut* 相关,如果用最小二乘法估计必然会导致错误结果。 因此需解决以上两个问题,对于处理自相关,比较复杂,这里省略。本节回顾1.滞后变量模型的含义及几个基本概念2.分布滞后模型的估
33、计: 经验加权法、 Almon法3.Koyck模型的数学变换过程4.自适应预期模型、局部调整模型的经济思想5. Koyck模型和自适应预期模型的估计: 工具变量法6.自回归模型中随机扰动项是否存在自相关 的诊断: 德宾 h 检验9192 案例案例自适应预期例子:Friedman的持久收入假说 1957年,弗里德曼对传统消费函数提出批评,提出了自己的消费模型。在他的模型中,第i个消费者在第t期的消费与持久性收入(permanent income)YitP有关,而不是与当期的收入Yit有关。持久性收入是一种长期收入概念,它表示在考虑了各种可能的波动的情况下,某人大体上可以依靠的收入。 持久收入是根
34、据最近的经验和有关未来的预期而主观决定的,由于是主观的,因而无法直接计量。任何一年中的实际收入可能高于或低于持久收入,取决于该年中的特别因素。实际收入和持久收入之差称为暂时性收入 (transitory income),记为YitT,我们有:)15(TitpititYYY93 他以同样方式区分了持久性消费,实际消费和暂时性消费的概念。持久性消费是与持久性收入的水平相对应的消费水平。实际消费可能与持久消费有差异,原因是出现了某些特殊的未预料到的情况(如未预料到的医疗费用),或者是冲动性购买的结果。二者之差称为暂时性消费,记为CitT: )16(TitpititCCC YitT和CitT被假定为具
35、有0均值和常数方差的随机变量,它们相互独立,且与YitP和CitP无关。弗里德曼进一步假定持久消费与持久收入成正比:)17(PitPitYC94 上式中持久收入YitP不可观测,为解决这一问题,弗里德曼假设持久收入遵从适应预期过程,也就是说,如果某人的现期收入高于(或低于)其先前的持久收入概念,则他将增加(或减少)后者,增加(或减少)的幅度是二者之差乘以:)18()(1PititPitYYY一般位于0和1之间。因此人们在实际收入增加时将调整他们的持久收入概念,但不会做全额调整,这是因为认识到实际收入的变动或许有一部分是由于收入的暂时分量变动的结果。将17带入16得21)17(PitPitYC)
36、16(TitpititCCC)21(TitPititCYC至此,我们得到了实际消费和持久收入之间的关系式,即消费函数的弗里德曼模型。式中CitT起着扰动项的作用95(18)式可改写为: 即 此式表明,在第t年,消费者将持久收入估计为实际收入和以前的持久性收入概念的加权平均。如果接近于1,则该消费者将绝大部分权重给了实际收入,YP迅速向Y调整,若接近0,则很小部分权重给了实际收入,调整过程将很缓慢。)19()(11PititPitPitYYYY)20()1 (1PititPitYYY96 为了估计这个模型,弗里德曼用(20)式(适应预期机制)将持久收入表示成实际收入的现期值和各期滞后值:Piti
37、tPitYYY1)1 (PitititYYY221)1 ()1 ( )22()1 ()1 ()1 (33221 ititititYYYY若00,样本自相关系数近似地服从以0为均值,1/n 为方差的正态分布,其中n为样本数。 也可检验对所有k0,自相关系数都为0的联合假设,这可通过如下QLB统计量进行: 该统计量近似地服从自由度为m的2分布(m为滞后长度)。 因此:如果计算的Q值大于显著性水平为的临界值,则有1-的把握拒绝所有k(k0)同时为0的假设。 例3: 序列Random1是通过一随机过程(随机函数)生成的有19个样本的随机时间序列。 mkkLBknrnnQ12)2(129o 序列序列1
38、1:容易验证:该样本序列的均值为0,方差为0.0789 (a) (b) -0.6-0.4-0.20.00.20.40.624681012141618RANDOM1-0.8-0.40.00.40.81.224681012141618RANDOM1AC 从图形看:它在其样本均值0附近上下波动,且样本自相关系数迅速下降到0,随后在0附近波动且逐渐收敛于0。 由于该序列由一随机过程生成,可以认为不存在序列相关性,因此该序列为一白噪声。该序列为一白噪声。o 根据Bartlett的理论:kN(0,1/19) 因此任一rk(k0)的95%的置信区间都将是 可以看出:k0时,rk的值确实落在了该区间内,因此可
39、以接受k(k0)为0的假设。 同样地,从QLB统计量的计算值看,滞后17期的计算值为26.38,未超过5%显著性水平的临界值27.58,因此,可以接受所有的自相关系数k(k0)都为0的假设。 因此,该随机过程是一个平稳过程。 4497. 0 ,4497. 019/196. 1 ,19/196. 1,025. 0025. 0ZZo 序列Random2是由一随机游走过程 Xt=Xt-1+t 生成的一随机游走时间序列样本。其中,第0项取值为0, t是由Random1表示的白噪声。 (a) (b) -1.0-0.8-0.6-0.4-0.20.00.20.424681012141618RANDOM2-0
40、.8-0.40.00.40.81.224681012141618RANDOM2AC 样本自相关系数显示样本自相关系数显示:r1=0.48,落在了区间-0.4497, 0.4497之外,因此在5%的显著性水平上拒绝1的真值为0的假设。 该随机游走序列是非平稳的。该随机游走序列是非平稳的。 图形表示出:该序列具有相同的均值,但从样本自相关图看,虽然自相关系数迅速下降到0,但随着时间的推移,则在0附近波动且呈发散趋势。134检验中国按照支出法计算的时间序列的平稳性135o 时间路径图上升,自相关系数缓慢下降136o 检验中国19811998年人均居民消费与人均o 国内生产总值这两时间序列:路径图与自
41、相关137o 注意注意: 确定样本自相关函数rk某一数值是否足够接近于0是非常有用的,因为它可检验对应的自相关系数的真值是否为0的假设。 Bartlett曾证明:如果时间序列由白噪声过程生成,则对所有的k0,样本自相关系数近似地服从以0为均值,1/n 为方差的正态分布,其中n为样本数。 也可检验对所有k0,自相关系数都为0的联合假设,这可通过如下QLB统计量进行:mkkLBknrnnQ12)2(该统计量近似地服从自由度为m的2分布(m为滞后长度)。 因此:如果计算的Q值大于显著性水平为的临界值,则有1-的把握拒绝所有k(k0)同时为0的假设。138 对于序列1:由于该序列由一随机过程生成,可以
42、认为不存在序列相关性,因此该序列为一白噪声。该序列为一白噪声。o 根据Bartlett的理论:kN(0,1/19) 因此任一rk(k0)的95%的置信区间都将是 可以看出:k0时,rk的值确实落在了该区间内,因此可以接受k(k0)为0的假设。 同样地,从QLB统计量的计算值看,滞后17期的计算值为26.38,未超过5%显著性水平的临界值27.58,因此,可以接受所有的自相关系数k(k0)都为0的假设。 因此,该随机过程是一个平稳过程。 4497. 0 ,4497. 019/196. 1 ,19/196. 1,025. 0025. 0ZZ139 样本自相关系数显示样本自相关系数显示:r1=0.4
43、8,落在了区间-0.4497, 0.4497之外,因此在5%的显著性水平上拒绝1的真值为0的假设。 该序列具有相同的均值,但从样本自相关图看,虽然自相关系数迅速下降到0,但随着时间的推移,则在0附近波动且呈发散趋势。从滞后从滞后18期的期的QLB统计量看:统计量看: QLB(18)=57.1828.86=20.05拒绝自相关系数在滞后一期后的全部为0的假设。序列非平稳140随机游走序列均值与自相关系数141 单位根检验单位根检验 对时间序列的平稳性除了通过图形直观判断外,运用统计量进行统计检验则是更为准确与重要的。 单位根检验(单位根检验(unit root test)是统计检验中普遍应用的一
44、种检验方法。1 1、DFDF检验检验我们已知道,随机游走序列 Xt=Xt-1+t非平稳的,其中t是白噪声。而该序列可看成是随机模型 Xt=Xt-1+t中参数=1时的情形。142单位根:单位根:我们对式Xt=Xt-1+t (1) 做回归,如果确实发现=1,就说随机变量Xt有一个单位根单位根。 o(1)式可变形式成差分形式: Xt=(1-)Xt-1+ t =Xt-1+ t (2)检验(1)式是否存在单位根=1,也可通过(2)式判断是否有 =0。143144 针对式 X Xt t= = + + X Xt-1t-1+ + t t 我们关心的检验为:零假设零假设 H0: =0。 备择假设备择假设 H1:
45、 0 上述检验可通过上述检验可通过OLS法下的法下的t检验完成。检验完成。 然而,在零假设(序列非平稳)下,即使在大样本下t统计量也是有偏误的(向下偏倚),通常的t 检验无法使用。 Dicky和Fuller于1976年提出了这一情形下t统计量服从的分布,即DF分分布布。145146o注意:在不同的教科书上有不同的描述,但是结果是相同的。注意:在不同的教科书上有不同的描述,但是结果是相同的。因此,可通过OLS法估计 Xt= + Xt-1+ t 并计算t统计量的值,与DF分布表中给定显著性水平下的临界值比较: 如果:如果:t临界值,则拒绝零假设临界值,则拒绝零假设H0: =0,认为时间序列不存在单
46、位根,是平稳的。认为时间序列不存在单位根,是平稳的。147 进一步的问题进一步的问题:在上述使用 X Xt t= = + + X Xt-1t-1+ + t t对时间序列进行平稳性检验中,实际上实际上假定了时间序列是由具有白噪假定了时间序列是由具有白噪声随机误差项的一阶自回归过程声随机误差项的一阶自回归过程AR(1)生成的生成的。 但在实际检验中但在实际检验中,时间序列可能由更高阶的自回归过程生成的,时间序列可能由更高阶的自回归过程生成的,或者随机误差项并非是白噪声或者随机误差项并非是白噪声,这样用OLS法进行估计均会表现出随法进行估计均会表现出随机误差项出现自相关机误差项出现自相关(autoc
47、orrelation),导致DF检验无效。 另外另外,如果时间序列包含有明显的随时间变化的某种趋势(如上升或下降),则也容易导致上述检验中的自相关随机误差项问题自相关随机误差项问题。 为了保证DF检验中随机误差项的白噪声特性,Dicky和Fuller对DF检验进行了扩充,形成了ADF(Augment Dickey-Fuller )检验检验。ADFADF检验检验148149150151同时估计出上述三个模型的适当形式,然后通过ADF临界值表检验零假设H0:=0。1)只要其中有一个模型的检验结果拒绝了零假设,就)只要其中有一个模型的检验结果拒绝了零假设,就可以认为时间序列是平稳的;可以认为时间序列
48、是平稳的;2)当三个模型的检验结果都不能拒绝零假设时,则认)当三个模型的检验结果都不能拒绝零假设时,则认为时间序列是非平稳的。为时间序列是非平稳的。这里所谓模型适当的形式模型适当的形式就是在每个模型中选取适当的滞后差分项,以使模型的残差项是一个白噪声(主要保证不存在自相关)。一个简单的检验过程:一个简单的检验过程:152检验19782000年间中国支出法GDP时间序列的平稳性。153154155156 随机游走序列 Xt=Xt-1+t经差分后等价地变形为 Xt=t 由于t是一个白噪声,因此差分后的序列差分后的序列 Xt是平稳的。是平稳的。二、协整时间序列二、协整时间序列157 一一般地,如果一
49、个时间序列经过般地,如果一个时间序列经过d次差分后变成平稳序列,则称次差分后变成平稳序列,则称原序列是原序列是d 阶单整(阶单整(integrated of d)序列,记为)序列,记为I(d)。 显然,I(0)代表一平稳时间序列。代表一平稳时间序列。现实经济生活中现实经济生活中:1)只有少数经济指标的时间序列表现为平稳的,如利率等只有少数经济指标的时间序列表现为平稳的,如利率等;2)大多数指标的时间序列是非平稳的,如一些价格指数常常是大多数指标的时间序列是非平稳的,如一些价格指数常常是2阶单阶单整的,以不变价格表示的消费额、收入等常表现为整的,以不变价格表示的消费额、收入等常表现为1阶单整。阶
50、单整。大多数非平稳的时间序列一般可通过一次或多次差分的形式变为平稳大多数非平稳的时间序列一般可通过一次或多次差分的形式变为平稳的。的。但也有一些时间序列,无论经过多少次差分,都不能变为平稳的。这但也有一些时间序列,无论经过多少次差分,都不能变为平稳的。这种序列被称为种序列被称为非单整的非单整的(non-integrated)。 1、单整:如果一个时间序列经过一次差分变成平稳如果一个时间序列经过一次差分变成平稳的,就称原序列是的,就称原序列是一阶单整一阶单整(integrated of 1)序列序列,记为,记为I(1)。1582、协整的概念引例:一个货币需求分析的例子。依照经典理论,一国或一地区