1、 计量经济学理论和应用张红霞张红霞Zhanghx_c126 时间序列数据的建模时间序列数据的建模n如何建立一个平稳时间序列模型,如何进如何建立一个平稳时间序列模型,如何进行预测行预测n不是以不同变量间的因果关系为基础,而不是以不同变量间的因果关系为基础,而是寻找时间序列自身的变化规律,是寻找时间序列自身的变化规律,不以任不以任何经济理论为基础何经济理论为基础主要内容主要内容n时间序列模型的基本概念及其适用性时间序列模型的基本概念及其适用性n随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件n随机时间序列模型的识别随机时间序列模型的识别n随机时间序列模型的估计随机时间序列模型的估计n随机时
2、间序列模型的检验随机时间序列模型的检验时间序列模型的基本概念及其适用性时间序列模型的基本概念及其适用性n基本概念基本概念n利用自身的过去预测自身的未来。一般形式 Xt=F(Xt-1,Xt-2,t)n具体模型的建立需要:n具体形式n滞后期n随机扰动项的结构 线性模型一期滞后白噪声tttXX1时间序列模型的基本概念及其适用性时间序列模型的基本概念及其适用性n基本概念基本概念上面的模型是一阶自回归过程AR(1)n一般的p阶自回归过程AR(p)为 Xt=1Xt-1+2Xt-2+pXt-p+t n如果随机扰动项是一个白噪声(t=t),则上式为一纯AR(p)过程(pure AR(p)process),记为
3、 Xt=1Xt-1+2Xt-2+pXt-p+t时间序列模型的基本概念及其适用性时间序列模型的基本概念及其适用性n基本概念基本概念n如果如果 t不是一个白噪声,通常认为它是一个不是一个白噪声,通常认为它是一个q阶的阶的移动平均(moving average)过程MA(q):t=t-1t-1-2t-2-qt-q 这是一个纯纯MA(q)过程(过程(pure MA(p)process)n注意:MA(q)也可记为qtpttt110时间序列模型的基本概念及其适用性时间序列模型的基本概念及其适用性n基本概念基本概念n纯AR(p)与纯MA(q)结合,得到一个一般的自回归自回归移动平均(移动平均(autoreg
4、ressive moving average)过程过程ARMA(p,q)Xt=1Xt-1+2Xt-2+pXt-p+t-1 t-1-2 t-2-q t-qn一个随机时间序列可以通过一个自回归移动平均过程生成,即该序列可以由其自身的过去或滞后值以及随机扰动项来解释n如果该序列是平稳的如果该序列是平稳的,即它的行为并不会随着时间的推移而变化,那么我们就可以通过该序列过去的行为那么我们就可以通过该序列过去的行为来预测未来。来预测未来。随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件nAR(p)模型的平稳性条件模型的平稳性条件n如果一个p阶自回归模型AR(p)生成的时间序列是平稳的,就说该AR(
5、p)模型是平稳的,否则,就说该AR(p)模型是非平稳的 对p阶自回归模型AR(p)Xt=1Xt-1+2Xt-2+pXt-p+t 引入滞后算子引入滞后算子 LXt=Xt-1,L2Xt=Xt-2,LpXt=Xt-p随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件变为变为(1-1L-2L2-pLp)Xt=t 记(L)=(1-1L-2L2-pLp)则多项式(z)=(1-1z-2z2-pzp)=0称为AR(p)的特征方程。n可以证明,如果AR(p)的特征方程的所有根都在单位圆外(模大于1),则AR(p)模型是平稳的随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件nAR(1)模型的平稳性条
6、件tttXX1)(2)()()(122122tttttXEEXEXE如果模型稳定,则有E(Xt2)=E(Xt-12),从而上式可变换为22201X稳定条件下,方差是一非负的常数,从而有|1 AR(1)的特征方程的特征方程随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件01)(zz根为 z=1/AR(1)稳定,即|1,意味着特征根z大于1。随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件nAR(2)模型的平稳性ttttXXX2211方程两边同乘以Xt,再取期望得:而 因此)(22110ttXE222211)()()()(tttttttEXEXEXE222110随机时间序列模型的平
7、稳性条件随机时间序列模型的平稳性条件同样有方差为 由平稳性的定义,该方差必须是一不变的正数,于是有 1+21,2-11,|2|10211212011)1)(1)(1()1(21212220随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件 这就是AR(2)的平稳性条件的平稳性条件,或称为平稳域平稳域。它是一顶点分别为(-2,-1),(2,-1),(0,1)的三角形。2 (0,1)11 模型的平稳域模型的平稳域(-2,-1)(2,-1)随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件AR(2)模型对应的特征方程对应的特征方程1-1-1 1z-z-2 2z z2 2=0=0 的两个根
8、的两个根z z1 1、z z2 2满满足:足:z z1 1z z2 2=-1/=-1/2 2 ,z z1 1+z+z2 2=-=-1 1/2 2解出1,2ttttXXX22112121zz21211zzzz 随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件由AR(2)的平稳性,|2|=1/|z1|z2|1,有于是|z2|1。由 2-1 1可推出同样的结果。1)11)(11(112121212121zzzzzzzz0)11)(11(21zz随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件 对高阶自回模型AR(p)来说,多数情况下没有必,多数情况下没有必要直接计算其特征方程的特征根
9、,但有要直接计算其特征方程的特征根,但有一些有用的规则可用来检验高阶自回归模型的稳定性:AR(p)模型稳定的必要条件是模型稳定的必要条件是:1+2+p1 由于i(i=1,2,p)可正可负,AR(p)模型稳定的充分条件是:|1|+|2|+|p|1 随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件nMA(q)模型的稳定性模型的稳定性Xt=t-1 t-1-2 t-2-q t-q 0)()()()(11qqtttEEEXE22111121322111122210),cov()(),cov()(),cov()1(varqqttqqqqttqqqttqtXXXXXXX 当滞后期大于q时,Xt的自协
10、方差系数为0。有限有限阶移动平均模型总是平稳的阶移动平均模型总是平稳的。随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件nARMA(p,q)模型的稳定性模型的稳定性 MA(q)模型总是平稳的,因此模型总是平稳的,因此ARMA(p,q)模型的平稳性模型的平稳性取决于取决于AR(p)部分的平稳性。部分的平稳性。当当AR(p)部分平稳时,则该部分平稳时,则该ARMA(p,q)模型是平稳的,模型是平稳的,否则,不是平稳的否则,不是平稳的.ttLXLQqtqttptptttXXXX112211随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件n一个平稳的时间序列总可以找到生成它的平稳的随机
11、过程或模型;n一个非平稳的随机时间序列通常可以通过差分的方法将它变换为平稳的,对差分后平稳的时间序列也可找出对应的平稳随机过程或模型随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件n如果一个非平稳时间序列通过d次差分,变为平稳的,然后用一个平稳的ARMA(p,q)模型作为它的生成模型,则我们就说该原始时间序列是一个自回归单整移动平均(autoregressive integrated moving average)时间序列,记为ARIMA(p,d,q)。n一个ARIMA(2,1,2)时间序列在它成为平稳序列之前先得差分一次,然后用一个ARMA(2,2)模型作为它的生成模型的。随机时间序
12、列模型的识别随机时间序列模型的识别n随机时间序列模型的识别,就是对于一个平稳的随机时间序列,找出生成它的合适的随机过程或模型,即判断该时间序列是遵循一纯AR过程、还是遵循一纯MA过程或ARMA过程n所使用的工具主要是时间序列的主要是时间序列的自相关函数(autocorrelation function,ACF)及及偏自相关函数(partial autocorrelation function,PACF)随机时间序列模型的识别随机时间序列模型的识别nAR(p)过程的识别过程的识别n自相关函数ACF 例 一阶自回归模型 Xt=Xt-1+t 其k阶滞后自协方差自协方差为AR(1)模型的自相关函数自相
13、关函数为 由由AR(1)的稳定性知的稳定性知|1,因此,因此,k k时,呈指数形衰时,呈指数形衰减,直到零减,直到零。这种现象称为拖尾拖尾或称AR(1)有无穷记忆有无穷记忆(infinite memory)。011)(kkttktkXXEkkk0随机时间序列模型的识别随机时间序列模型的识别nAR(p)过程的识别过程的识别例例 阶自回归模型阶自回归模型AR(2)Xt=1Xt-1+2Xt-2+tk k期滞后自协方差期滞后自协方差k k 阶自相关函数为阶自相关函数为 其中:1=1/(1-2),0=122112211)(kktttktkrXXXE2211kkk 如果如果AR(2)AR(2)稳定,则由稳
14、定,则由 1 1+2 211知知|k k|衰减趋于零,衰减趋于零,呈拖尾状。至于衰减的形式,要看呈拖尾状。至于衰减的形式,要看AR(2)AR(2)特征根特征根的实虚性,若为实根,则呈单调或振荡型衰减,的实虚性,若为实根,则呈单调或振荡型衰减,若为虚根,则呈正弦波型衰减。若为虚根,则呈正弦波型衰减。nAR(p)过程的识别过程的识别 p阶自回归模型AR(p)Xt=1Xt-1+2Xt-2+pXt-p+t 其k期滞后协方差为:自相关函数可见,无论无论k k有多大,有多大,k k的计算均与其到的计算均与其到p p阶滞后的自相阶滞后的自相关函数有关关函数有关,因此呈拖尾状呈拖尾状。如果如果AR(p)AR(
15、p)是稳定的,则是稳定的,则|k k|递减且趋于零递减且趋于零pkpkktptpttKtkXXXXE22112211)(pkpkkk2211事实上,自相关函数是一p阶差分方程,其通解为其中:1/zi是AR(p)特征方程(z)=0的特征根,由AR(p)平稳的条件知,|zi|p,Xt与Xt-k间的偏自相关系数为零。AR(p)的一个主要特征是:kp时,k*=Corr(Xt,Xt-k)=0 即 k*在p以后是截尾的。0),(2*2ttXCorrAR(p)随机时间序列的识别原则:随机时间序列的识别原则:若若XtXt的偏自相关函数在的偏自相关函数在p p以后截尾,即以后截尾,即kp时,时,k*=0=0,而
16、它的自相关函数,而它的自相关函数 k是拖尾的,则此序是拖尾的,则此序列是自回归列是自回归AR(p)AR(p)序列。序列。当当kp时,时,r rk k*不会全为不会全为0 0,而是在,而是在0 0的上下波动。但的上下波动。但可以证明,当可以证明,当kp时,时,r rk k*服从如下渐近正态分布服从如下渐近正态分布:rk*N(0,1/n)式中式中n n表示样本容量表示样本容量。nMA(q)过程的识别过程的识别 对对MA(1)过程过程 1tttX其自协方差系数:0)1(3221220于是,MA(1)过程的自相关函数自相关函数为:0)1(3221可见,当当k1时,时,k k=0,即,即Xt与与Xt-k
17、不相关,不相关,MA(1)自相关函数是截尾的。nMA(q)过程的识别过程的识别 MA(1)过程可以等价地写成t关于无穷序列Xt,Xt-1,的线性组合的形式:是一个AR()过程,它的偏自相关函数非截尾但却趋于零,因此MA(1)MA(1)的偏自相关函数是非截尾的偏自相关函数是非截尾但却趋于零的但却趋于零的221ttttXXXttttXXX221nMA(q)过程的识别过程的识别其自协方差系数为其自协方差系数为 q阶移动平均过程阶移动平均过程MA(q)qtqtttX11qkqkkXXErqkqkkqkttk当当当01)(0)1()(112222212相应的自相关函数自相关函数为 kkkkq kqqrr
18、kkqkq01112210110当当当()/()可见,当kq时,Xt与与Xt-k不相关,即存在截尾现象,因此,当当kq时,时,k k=0是是MA(q)的一个特征的一个特征。于是:可以根据自相关系数是否从某一点开始一直为可以根据自相关系数是否从某一点开始一直为0 0来判断来判断MA(q)MA(q)模型的阶。模型的阶。与与MA(1)相仿,可以验证相仿,可以验证MA(q)过程的偏自相关过程的偏自相关函数是非截尾但趋于零的。函数是非截尾但趋于零的。MA(q)模型的识别规则:模型的识别规则:若随机序列的自相关函数截尾,若随机序列的自相关函数截尾,即自即自q q以后,以后,k k=0=0(kqkq);而它
19、的偏自相关函数是拖);而它的偏自相关函数是拖尾的,则此序列是滑动平均尾的,则此序列是滑动平均MA(q)MA(q)序列序列同样需要注意的是同样需要注意的是:在实际识别时,由于样本自相关函数rk是总体自相关函数k的一个估计,由于样本的随机性,当kq时,rk不会全为0,而是在0的上下波动。但可以证明,当kq时,rk服从如下渐近正态分布:rkN(0,1/n)式中n表示样本容量。nARMA(p,q)过程的识别过程的识别 ARMA(p,q)的自相关函数,可以看作,可以看作MA(q)的自相关函的自相关函数和数和AR(p)的自相关函数的混合物。的自相关函数的混合物。当p=0时,它具有截尾性质;当q=0时,它具
20、有拖尾性质;当p、q都不为0时,它具有拖尾性质 从识别上看,通常:ARMA(p,q)过程的偏自相关函数(PACF)可能在p阶滞后前有几项明显的尖柱(spikes),但从p阶滞后项开始逐渐趋向于零;而它的自相关函数(ACF)则是在q阶滞后前有几项明显的尖柱,从q阶滞后项开始逐渐趋向于零。0k0*kpkk,0*qkk,0模型ACFPACF白噪声AR(p)衰减趋于零(几何型或振荡型)p阶后截尾:MA(q)p阶后截尾:衰减趋于零(几何型或振荡)ARMA(p,q)q阶后衰减趋于零(几何型或振荡型)p阶后衰减趋于零(几何型或振荡型)ACF PACF 模型模型1:tttXX17.00.00.20.40.60
21、.812345678ACF10.00.20.40.60.812345678PACF1 模型 2:tttXX17.0 模型 3:17.0tttX-0.8-0.6-0.4-0.20.00.20.40.612345678ACF2-0.8-0.6-0.4-0.20.012345678PACF2-0.5-0.4-0.3-0.2-0.10.012345678ACF3-0.5-0.4-0.3-0.2-0.10.012345678PACF3 模型 4:ttttXXX2149.07.0 模型 5:117.07.0ttttXX-0.4-0.20.00.20.40.612345678ACF4-0.4-0.20.00
22、.20.40.612345678PACF4-1.2-0.8-0.40.00.40.812345678ACF5-1.0-0.8-0.6-0.4-0.20.012345678PACF5随机时间序列模型的估计随机时间序列模型的估计n估计方法估计方法n最小二乘估计;最小二乘估计;n矩估计;矩估计;n利用自相关函数的直接估计利用自相关函数的直接估计。nAR(p)模型的模型的Yule Walker方程估计方程估计 在AR(p)模型的识别中,曾得到 pkpkkk2211利用k=-k,得到如下方程组:kppppppppp12112211211211nAR(p)模型的模型的Yule Walker方程估计方程估计
23、 此方程组被称为此方程组被称为Yule WalkerYule Walker方程组方程组。该方程组建立了该方程组建立了AR(p)AR(p)模型的模型参数模型的模型参数 1 1,2 2,p p与自相关函数与自相关函数 1 1,2 2,p p的关系。的关系。估计方法:估计方法:首先,求得自相关函数的估计值 然后利用然后利用Yule WalkerYule Walker方程组,求解模型参数的估计值方程组,求解模型参数的估计值12011102120112pppppp,12p 2 2的估计值的估计值 pjiijjitE1,022pjiijji1,02nMA(q)模型的矩估计模型的矩估计 将MA(q)模型的自
24、协方差函数中的各个量用估计量代替,得到:qkqkkqkqkkqk当当当01)(0)1(112222212 首先首先求得自协方差函数的估计值,上式是一个包含(q+1)个待估参数 221,q的非线性方程组,可以用直接法直接法或迭代法迭代法求解。常用的迭代方法有常用的迭代方法有线性迭代法线性迭代法和和Newton-Raphsan迭代法迭代法。MA(1)模型的直接算法1212120)1(于是 211021204或0212410有于是有解)411(22102)411(2211211由于参数估计有两组解,可根据可逆性条件|1|2以后,偏自相关函数是截尾的。一阶差分后的一阶差分后的GDPGDP满足满足AR(
25、2)AR(2)随机过程。随机过程。426.0222|*krn估计估计有如下Yule Walker 方程:解得ttttGDPDGDPDGDPD2211111622.0859.01859.0859.01121442.0,239.121n估计估计 最小二乘估计最小二乘估计 (7.91)(-3.60)r2=0.8469 R2=0.8385 DW=1.15 有时,在用回归法时,也可加入常数项。有时,在用回归法时,也可加入常数项。(1.99)(7.74)(-3.58)r2=0.8758 R2=0.8612 DW.=1.22ttttGDPDGDPDGDPD211653.01593.11ttttGDPDGDP
26、DGDPD211678.01495.159.9091n检验检验三模型的残差项的自相关系数及QLB检验值模型残差项的自相关系数及模型残差项的自相关系数及Q检验值检验值 模型1 模型2 模型3 K Resid-ACF Q Resid-ACF Q Resid-ACF Q 1 0.382 3.3846 0.258 1.5377 0.257 1.5263 2 0.014 3.3893-0.139 2.0077-0.040 1.5646 3-0.132 3.8427-0.246 3.5677-0.059 1.6554 4-0.341 7.0391-0.529 11.267-0.328 4.6210 5-0
27、.170 7.8910-0.300 13.908-0.151 5.2864 6 0.253 9.9097 0.271 16.207 0.345 9.0331 7 0.144 10.613 0.158 17.051 0.155 9.8458 8 0.057 10.730 0.116 17.541 0.076 10.059 9-0.019 10.745 0.097 17.914 0.011 10.064 10-0.146 11.685-0.036 17.969-0.123 10.728 11-0.233 14.329-0.136 18.878-0.230 13.319 12-0.049 14.46
28、1 0.064 19.104-0.012 13.328 用建立的用建立的AR(2)模型对中国支出法模型对中国支出法GDP进行外推预测进行外推预测模型模型1 1已知t-1、t-2、t-3期的GDP时,就可对第t期的GDP作出外推预测。)()(3222111ttttttGDPGDPGDPGDPGDPGDP3221211)()1(ttttGDPGDPGDPGDPn例:中国人均居民消费(例:中国人均居民消费(CPC)的随机时间序)的随机时间序列模型列模型人均居民消费人均居民消费CONSPCONSP1978395.81990797.119794371991861.41980464.11992966.61
29、981501.919931048.61982533.519941108.71983572.819951213.11984635.619961322.8198571619971380.91986746.519981460.61987788.319991564.41988836.420001690.8年份年份 中国人均居民消费(中国人均居民消费(CPCCPC)经过二次差分后的新序列记)经过二次差分后的新序列记为为CPCD2CPCD2 CPCD2 CPCD2 序列的自相关函数、偏自相关函数与序列的自相关函数、偏自相关函数与Q Q 统计量值统计量值 k ACF PACF Q k ACF PACF Q
30、1 0.125 0.125 0.269 7 0.196 0.014 6.286 2-0.294-0.314 1.882 8-0.218-0.335 8.067 3-0.034 0.060 1.906 9-0.010 0.024 8.072 4-0.213-0.350 2.919 10 0.102-0.147 8.650 5-0.258-0.193 4.576 11-0.071 0.001 9.025 6 0.131 0.017 5.057 12 0.006-0.119 9.029 在在5%5%的显著性水平下,通过的显著性水平下,通过Q Q统计量容易验证该统计量容易验证该序列本身就接近于一白噪声
31、,因此可考虑采用序列本身就接近于一白噪声,因此可考虑采用零阶零阶MA(0)MA(0)模型模型:由于k=2时,|r2|=|-0.29|因此,也可考虑采用下面的MA模型:ttCPCD214/1222tttCPCD 中国居民人均消费水平的中国居民人均消费水平的ARMAARMA模型模型 模型 a MA(2)MA(4)MA(5)MA(8)AR(1)R2 SSR AIC 1 24.57 0 93137.4 8.94 2 32.4-0.89 0.42 53699.9 8.54 (3.62)(-7.43)3 14.07-0.72-1.71 0.7 28128.8 8.03 (8.75)(-3.07)(-5.0
32、8)4 11.73-1.09-1.99-1.3 0.82 17480.8 7.7 (17.81)(-3.38)(-4.61)(-1.58)5 11.79-1.07-1.91-1.25-0.34 0.81 17402.7 7.84 (14.93)(-3.10)(-2.56)(-1.42)(-0.15)6 14.95-0.66-1.27 -1.99 0.75 22924.2 7.97 (5.16)(-2.14)(-1.77)(-1.29)7 214.25-2.53-2.45 -6.52 1.39 0.99 8943.7 7.06 (63.83)(-2.25)(-2.53)(-2.23)(98.26
33、)纯纯MAMA模型中,模型模型中,模型4 4具有较好的性质,但由于具有较好的性质,但由于MA(5)MA(5)的的t t检验偏小,因此可选取模型检验偏小,因此可选取模型3 3。通过模型通过模型3 3的外推预测的外推预测 t表示预测期的随机扰动项,它未知,可假设为0,于是t期的预测式为:为模型3中滞后2期与滞后4期的相应残差项的估计值42212111271.172.007.142)()(tttttttttttttCPCCPCCPCCPCCPCCPCCPCCPCCPCCPC422171.172.007.142ttttttCPCCPCCPC422171.172.007.142tttttCPCCPCCPC2t4t