1、数学建模时间序列方法9.2 9.2 随机时间序列分析模型随机时间序列分析模型一、时间序列模型的基本概念及其适用性一、时间序列模型的基本概念及其适用性二、随机时间序列模型的平稳性条件二、随机时间序列模型的平稳性条件三、随机时间序列模型的识别三、随机时间序列模型的识别四、随机时间序列模型的估计四、随机时间序列模型的估计五、随机时间序列模型的检验五、随机时间序列模型的检验数学建模时间序列方法 经典计量经济学模型与时间序列模型经典计量经济学模型与时间序列模型 确定性时间序列模型与随机性时间序列确定性时间序列模型与随机性时间序列模型模型数学建模时间序列方法一、时间序列模型的基本概念及其适用性一、时间序列
2、模型的基本概念及其适用性数学建模时间序列方法1 1、时间序列模型的基本概念、时间序列模型的基本概念 随机时间序列模型(随机时间序列模型(time series modeling)是指仅用它的过去值及随机扰动项所建立起来的模型,其一般形式为 Xt=F(Xt-1,Xt-2,t)建立具体的时间序列模型,需解决如下三个问题建立具体的时间序列模型,需解决如下三个问题:(1)模型的具体形式模型的具体形式 (2)时序变量的滞后期时序变量的滞后期 (3)随机扰动项的结构随机扰动项的结构 例如,取线性方程、一期滞后以及白噪声随机扰动项(t=t),模型将是一个1阶自回归过程阶自回归过程AR(1):Xt=Xt-1+
3、t这里,t特指一白噪声一白噪声。数学建模时间序列方法 一般的p阶自回归过程阶自回归过程AR(p)是 Xt=1Xt-1+2Xt-2+pXt-p+t (*)(1)如果随机扰动项是一个白噪声(t=t),则称(*)式为一纯纯AR(p)过程(过程(pure AR(p)process),记为 Xt=1Xt-1+2Xt-2+pXt-p+t (2)如果t不是一个白噪声,通常认为它是一个q阶的移动平均(移动平均(moving average)过程)过程MA(q):t=t-1t-1-2t-2-qt-q 该式给出了一个纯纯MA(q)过程(过程(pure MA(p)process)。数学建模时间序列方法 将纯AR(p
4、)与纯MA(q)结合,得到一个一般的自回归移动自回归移动平均(平均(autoregressive moving average)过程)过程ARMA(p,q):Xt=1Xt-1+2Xt-2+pXt-p+t-1t-1-2t-2-qt-q 该式表明:该式表明:(1)一个随机时间序列可以通过一个自回归移动平均过)一个随机时间序列可以通过一个自回归移动平均过程生成,程生成,即该序列可以由其自身的过去或滞后值以及随机扰动项来解释。(2)如果该序列是平稳的)如果该序列是平稳的,即它的行为并不会随着时间的推移而变化,那么我们就可以通过该序列过去的行为那么我们就可以通过该序列过去的行为来预测未来。来预测未来。这
5、也正是随机时间序列分析模型的优势所在。数学建模时间序列方法 经典回归模型的问题:经典回归模型的问题:迄今为止,迄今为止,对一个时间序列Xt的变动进行解释或预测,是通过某个单方程回归模型或联立方程回归模型进行的,由于它们以因果关系为基础,且具有一定的模型结构,因此也常称为结构式模型(结构式模型(structural model)。然而,然而,如果Xt波动的主要原因可能是我们无法解释的因素,如气候、消费者偏好的变化等,则利用结构式模型来解释Xt的变动就比较困难或不可能,因为要取得相应的量化数据,并建立令人满意的回归模型是很困难的。有时,有时,即使能估计出一个较为满意的因果关系回归方程,但由于对某些
6、解释变量未来值的预测本身就非常困难,甚至比预测被解释变量的未来值更困难,这时因果关系的回归模型及其预测技术就不适用了。2 2、时间序列分析模型的适用性、时间序列分析模型的适用性数学建模时间序列方法 例如例如,时间序列过去是否有明显的增长趋势时间序列过去是否有明显的增长趋势,如果增长趋势在过去的行为中占主导地位,能否认为它也会在未来的行为里占主导地位呢?或者时间序列显示出循环周期性行为时间序列显示出循环周期性行为,我们能否利用过去的这种行为来外推它的未来走向?随机时间序列分析模型,就是要通过序列过去的变随机时间序列分析模型,就是要通过序列过去的变化特征来预测未来的变化趋势化特征来预测未来的变化趋
7、势。使用时间序列分析模型的另一个原因在于使用时间序列分析模型的另一个原因在于:如果经济理论正确地阐释了现实经济结构,则这一结构可以写成类似于ARMA(p,q)式的时间序列分析模型的形式。在这些情况下,我们采用另一条预测途径在这些情况下,我们采用另一条预测途径:通过时间序列的历史数据,得出关于其过去行为的有关结论,进而对时间序列未来行为进行推断。数学建模时间序列方法 例如,例如,对于如下最简单的宏观经济模型:这里,Ct、It、Yt分别表示消费、投资与国民收入。Ct与与Yt作为内生变量,它们的运动是由作为外作为内生变量,它们的运动是由作为外生变量的投资生变量的投资It的运动及随机扰动项的运动及随机
8、扰动项 t的变化决定的变化决定的。的。tttCYC12110tttICY数学建模时间序列方法上述模型可作变形如下:两个方程等式右边除去第一项外的剩余部分可看成一个综合性的随机扰动项,其特征依赖于投资项It的行为。如果如果It是一个白噪声是一个白噪声,则消费序列Ct就成为一个1阶自回归过程阶自回归过程AR(1),而收入序列Yt就成为一个(1,1)阶的自回归移动平均过程阶的自回归移动平均过程ARMA(1,1)。ttttICC1111011211111tttttIIYY11121101121111111数学建模时间序列方法二、随机时间序列模型的平稳性条件二、随机时间序列模型的平稳性条件数学建模时间序
9、列方法 自回归移动平均模型(ARMA)是随机时间序列分析模型的普遍形式,自回归模型(AR)和移动平均模型(MA)是它的特殊情况。关于这几类模型的研究,是时间序列分析的重点内容时间序列分析的重点内容:主要包括主要包括模型的平稳性分析模型的平稳性分析、模型的识别模型的识别和和模型的估计模型的估计。1 1、AR(p)AR(p)模型的平稳性条件模型的平稳性条件 随机时间序列模型的平稳性随机时间序列模型的平稳性,可通过它所生成的随机时间可通过它所生成的随机时间序列的平稳性来判断序列的平稳性来判断。如果如果一个p阶自回归模型AR(p)生成的时间序列是平稳的,就说该AR(p)模型是平稳的,否则否则,就说该A
10、R(p)模型是非平稳的。数学建模时间序列方法考虑p阶自回归模型AR(p)Xt=1Xt-1+2Xt-2+pXt-p+t (*)引入滞后算子(滞后算子(lag operator)L:LXt=Xt-1,L2Xt=Xt-2,LpXt=Xt-p(*)式变换为 (1-1L-2L2-pLp)Xt=t 记(L)=(1-1L-2L2-pLp),则称多项式方程 (z)=(1-1z-2z2-pzp)=0为AR(p)的特征方程特征方程(characteristic equation)(characteristic equation)。可以证明,可以证明,如果该特征方程的所有根在单位圆外如果该特征方程的所有根在单位圆外
11、(根的模大于(根的模大于1 1),则),则AR(p)AR(p)模型是平稳的。模型是平稳的。数学建模时间序列方法 例例9.2.1 AR(1)模型的平稳性条件。对1阶自回归模型AR(1)tttXX1方程两边平方再求数学期望,得到Xt的方差)(2)()()(122122tttttXEEXEXE由于Xt仅与t相关,因此,E(Xt-1t)=0。如果该模型稳定,则有E(Xt2)=E(Xt-12),从而上式可变换为:22201X在稳定条件下,该方差是一非负的常数,从而有|1。数学建模时间序列方法 而AR(1)的特征方程01)(zz的根为 z=1/AR(1)稳定,即|1,意味着特征根大于1。例例9.2.2 A
12、R(2)模型的平稳性。对AR(2)模型 ttttXXX2211方程两边同乘以Xt,再取期望得:)(22110ttXE数学建模时间序列方法又由于222211)()()()(tttttttEXEXEXE于是 222110同样地,由原式还可得到0211212011于是方差为)1)(1)(1()1(21212220数学建模时间序列方法由平稳性的定义,该方差必须是一不变的正数,于是有 1+21,2-11,|2|1这就是AR(2)的平稳性条件的平稳性条件,或称为平稳域平稳域。它是一顶点分别为(-2,-1),(2,-1),(0,1)的三角形。2 (0,1)1 (-2,-1)(2,-1)图图 9.2.1 AR
13、(2)模模型型的的平平稳稳域域 数学建模时间序列方法对应的特征方程1-1z-2z2=0 的两个根z1、z2满足:z1z2=-1/2 ,z1+z2=-1/2 ttttXXX2211AR(2)模型解出1,22121zz21211zzzz 由AR(2)的平稳性,|2|=1/|z1|z2|1,有1)11)(11(112121212121zzzzzzzz0)11)(11(21zz于是|z2|1。由 2-1 1可推出同样的结果。数学建模时间序列方法 对高阶自回模型对高阶自回模型AR(p)来说来说,多数情况下没有必要直接计算其特征方程的特征根,但有一些有一些有用的规则可用来检验高阶自回归模型的稳定性用的规则
14、可用来检验高阶自回归模型的稳定性:(1)AR(p)模型稳定的必要条件是模型稳定的必要条件是:1+2+p1 (2)(2)由于i(i=1,2,p)可正可负,AR(p)模模型稳定的充分条件是:型稳定的充分条件是:|1|+|2|+|p|1 数学建模时间序列方法 对于移动平均模型MR(q):Xt=t-1t-1-2t-2-qt-q 其中t是一个白噪声,于是 2、MA(q)模型的平稳性模型的平稳性 0)()()()(11qqtttEEEXE22111121322111122210),cov()(),cov()(),cov()1(varqqttqqqqttqqqttqtXXXXXXX 当滞后期大于q时,Xt的
15、自协方差系数为0。因此:有限阶移动平均模型总是平稳的有限阶移动平均模型总是平稳的。数学建模时间序列方法 由于ARMA(p,q)模型是AR(p)模型与MA(q)模型的组合:Xt=1Xt-1+2Xt-2+pXt-p+t-1t-1-2t-2-qt-q 3、ARMA(p,q)模型的平稳性模型的平稳性 而而MA(q)模型总是平稳的,因此模型总是平稳的,因此ARMA(p,q)模型的平模型的平稳性取决于稳性取决于AR(p)部分的平稳性。部分的平稳性。当当AR(p)部分平稳时,则该部分平稳时,则该ARMA(p,q)模型是平稳的,模型是平稳的,否则,不是平稳的。否则,不是平稳的。数学建模时间序列方法 最后最后
16、(1 1)一个平稳的时间序列总可以找到生成它的平稳的随)一个平稳的时间序列总可以找到生成它的平稳的随机过程或模型;机过程或模型;(2 2)一个非平稳的随机时间序列通常可以通过差分的方)一个非平稳的随机时间序列通常可以通过差分的方法将它变换为平稳的,对差分后平稳的时间序列也可找出对法将它变换为平稳的,对差分后平稳的时间序列也可找出对应的平稳随机过程或模型。应的平稳随机过程或模型。因此,因此,如果我们将一个非平稳时间序列通过如果我们将一个非平稳时间序列通过d d次差分,将次差分,将它变为平稳的,然后用一个平稳的它变为平稳的,然后用一个平稳的ARMA(p,q)ARMA(p,q)模型作为它的模型作为它
17、的生成模型,则我们就说该原始时间序列是一个生成模型,则我们就说该原始时间序列是一个自回归单整移自回归单整移动平均(动平均(autoregressive integrated moving averageautoregressive integrated moving average)时)时间序列,记为间序列,记为ARIMA(p,d,q)ARIMA(p,d,q)。例如,例如,一个一个ARIMA(2,1,2)ARIMA(2,1,2)时间序列在它成为平稳序列之前时间序列在它成为平稳序列之前先得差分一次,然后用一个先得差分一次,然后用一个ARMA(2,2)ARMA(2,2)模型作为它的生成模模型作为它
18、的生成模型的。型的。当然,当然,一个一个ARIMA(p,0,0)ARIMA(p,0,0)过程表示了一个纯过程表示了一个纯AR(p)AR(p)平稳过平稳过程;一个程;一个ARIMA(0,0,q)ARIMA(0,0,q)表示一个纯表示一个纯MA(q)MA(q)平稳过程。平稳过程。数学建模时间序列方法三、随机时间序列模型的识别三、随机时间序列模型的识别数学建模时间序列方法 所谓随机时间序列模型的识别所谓随机时间序列模型的识别,就是对于一个平稳的随机时间序列,找出生成它的合适的随机过程或模型,即判断该时间序列是遵循一纯AR过程、还是遵循一纯MA过程或ARMA过程。所使用的工具所使用的工具主要是时间序列
19、的自相关函数自相关函数(autocorrelation function,ACF)及偏自相关函偏自相关函数数(partial autocorrelation function,PACF)。数学建模时间序列方法 1 1、AR(p)AR(p)过程过程 (1)(1)自相关函数自相关函数ACFACF 1阶自回归模型阶自回归模型AR(1)Xt=Xt-1+t 的k阶滞后自协方差自协方差为:011)(kkttktkXXE=1,2,因此,AR(1)模型的自相关函数自相关函数为 kkk0=1,2,由由AR(1)的稳定性知的稳定性知|1,因此,因此,k k时,呈指数形时,呈指数形衰减,直到零衰减,直到零。这种现象
20、称为拖尾拖尾或称AR(1)有无穷记忆有无穷记忆(infinite memory)。注意注意,0时,呈振荡衰减状。数学建模时间序列方法 Xt=1Xt-1+2Xt-2+t该模型的方差0以及滞后1期与2期的自协方差1,2分别为阶自回归模型阶自回归模型AR(2)2221100211212011类似地,可写出一般的一般的k期滞后自协方差期滞后自协方差:22112211)(kktttktkrXXXE(K=2,3,)于是,AR(2)的k 阶自相关函数阶自相关函数为:2211kkk(K=2,3,)其中:1=1/(1-2),0=1如果如果AR(2)AR(2)稳定,则由稳定,则由 1 1+2 211知知|k k|
21、衰减趋于零,呈拖尾状。衰减趋于零,呈拖尾状。至于衰减的形式,要看至于衰减的形式,要看AR(2)AR(2)特征根的实虚性,特征根的实虚性,若为实根,若为实根,则呈单调或振荡型衰减,若为虚根,则呈正弦波型衰减。则呈单调或振荡型衰减,若为虚根,则呈正弦波型衰减。数学建模时间序列方法一般地,p阶自回归模型阶自回归模型AR(p)Xt=1Xt-1+2Xt-2+pXt-p+tk期滞后协方差为:pkpkktptpttKtkXXXXE22112211)(从而有自相关函数:pkpkkk2211 可见,无论无论k k有多大,有多大,k k的计算均与其到的计算均与其到p p阶滞后阶滞后的自相关函数有关的自相关函数有关
22、,因此呈拖尾状呈拖尾状。如果如果AR(p)AR(p)是稳定的,则是稳定的,则|k k|递减且趋于零递减且趋于零。数学建模时间序列方法 其中:1/zi是AR(p)特征方程(z)=0的特征根,由AR(p)平稳的条件知,|zi|p,Xt与Xt-k间的偏自相关系数偏自相关系数为零。AR(p)的一个主要特征是的一个主要特征是:kp时,时,k*=Corr(Xt,Xt-k)=0 即即 k*在在p以后是截尾的。以后是截尾的。一随机时间序列的识别原则:一随机时间序列的识别原则:若若XtXt的偏自相关函数在的偏自相关函数在p p以后截尾,即以后截尾,即kp时,时,k*=0=0,而,而它的自相关函数它的自相关函数
23、k是拖尾的,则此序列是自回归是拖尾的,则此序列是自回归AR(p)AR(p)序序列。列。数学建模时间序列方法 在实际识别时,由于样本偏自相关函数rk*是总体偏自相关函数k*的一个估计,由于样本的随机性,当kp时,rk*不会全为0,而是在0的上下波动。但可以证明,当kp时,rk*服从如下渐近正态分布:rk*N(0,1/n)式中n表示样本容量。因此,如果计算的rk*满足 需指出的是需指出的是,我们就有95.5%的把握判断原时间序列在p之后截尾。nrk2|*数学建模时间序列方法 对MA(1)过程 2、MA(q)MA(q)过程过程 1tttX可容易地写出它的自协方差系数自协方差系数:0)1(322122
24、0于是,MA(1)过程的自相关函数自相关函数为:0)1(3221可见,当当k1时,时,k k0,即,即Xt与与Xt-k不相关,不相关,MA(1)MA(1)自自相关函数是截尾的。相关函数是截尾的。数学建模时间序列方法 MA(1)过程可以等价地写成过程可以等价地写成 t t关于无穷序列关于无穷序列X Xt t,X Xt-1t-1,的线性组合的形式:的线性组合的形式:221ttttXXX或ttttXXX221(*)(*)是一个AR()过程,它的偏自相关函数非截尾但却趋于零,因此MA(1)MA(1)的偏自相关函数是非截尾但却趋于零的偏自相关函数是非截尾但却趋于零的。的。注意注意:(*)式只有当|1时才
25、有意义,否则意味着距Xt越远的X值,对Xt的影响越大,显然不符合常理。因此,我们把把|1|q时,Xt与与Xt-k不相关,即存在截尾现象,因此,当当kq时,时,k k=0是是MA(q)的一个特征的一个特征。于是:可以根据自相关系数是否从某一点开始一直为可以根据自相关系数是否从某一点开始一直为0 0来判断来判断MA(q)MA(q)模型的阶。模型的阶。数学建模时间序列方法 与MA(1)相仿,可以验证MA(q)过程的偏自相关函数是非截尾但趋于零的。MA(q)模型的识别规则:模型的识别规则:若随机序列的自相关函数截若随机序列的自相关函数截尾,即自尾,即自q q以后,以后,k k=0=0(kqkq);而它
26、的偏自相关函数是拖);而它的偏自相关函数是拖尾的,则此序列是滑动平均尾的,则此序列是滑动平均MA(q)MA(q)序列。序列。同样需要注意的是同样需要注意的是:在实际识别时,由于样本自相关函数rk是总体自相关函数k的一个估计,由于样本的随机性,当kq时,rk不会全为0,而是在0的上下波动。但可以证明,当kq时,rk服从如下渐近正态分布:rkN(0,1/n)式中n表示样本容量。因此,如果计算的如果计算的r rk k满足:满足:nrk2|我们就有就有95.5%95.5%的把握判断原时间序列在的把握判断原时间序列在q q之后截尾之后截尾。数学建模时间序列方法 ARMA(p,q)的自相关函数的自相关函数
27、,可以看作MA(q)的自相关函数和AR(p)的自相关函数的混合物。当当p=0时,它具有截尾性质时,它具有截尾性质;当当q=0时,它具有拖尾性质;时,它具有拖尾性质;当当p、q都不为都不为0时,它具有拖尾性质时,它具有拖尾性质 从识别上看,通常:从识别上看,通常:ARMA(p,q)过程的偏自相关函数(过程的偏自相关函数(PACF)可能在可能在p阶滞阶滞后前有几项明显的尖柱(后前有几项明显的尖柱(spikes),但从),但从p阶滞后项开始逐渐阶滞后项开始逐渐趋向于零;趋向于零;而而它的自相关函数(它的自相关函数(ACF)则是在则是在q阶滞后前有几项明显阶滞后前有几项明显的尖柱,从的尖柱,从q阶滞后
28、项开始逐渐趋向于零。阶滞后项开始逐渐趋向于零。3 3、ARMA(p,q)ARMA(p,q)过程过程 数学建模时间序列方法 表表 9.2.1 ARMA(p,q)模模型型的的 ACF 与与 PACF 理理论论模模式式 模型 ACF PACF 白噪声 0k 0*k AR(p)衰减趋于零(几何型或振荡型)P 阶后截尾:0*k,kp MA(q)q阶后截尾:,0k,kq 衰减趋于零(几何型或振荡型)ARMA(p,q)q阶后衰减趋于零(几何型或振荡型)p阶后衰减趋于零(几何型或振荡型)数学建模时间序列方法 图图 9.2.2 ARMA(p,q)模型的模型的 ACF与与 PACF理论模式理论模式 ACF PAC
29、F 模型模型 1:tttXX17.00.00.20.40.60.812345678ACF10.00.20.40.60.812345678PACF1数学建模时间序列方法 模型 2:tttXX17.0 模型 3:17.0tttX-0.8-0.6-0.4-0.20.00.20.40.612345678ACF2-0.8-0.6-0.4-0.20.012345678PACF2-0.5-0.4-0.3-0.2-0.10.012345678ACF3-0.5-0.4-0.3-0.2-0.10.012345678PACF3数学建模时间序列方法 模型 4:ttttXXX2149.07.0 模型 5:117.07.
30、0ttttXX-0.4-0.20.00.20.40.612345678ACF4-0.4-0.20.00.20.40.612345678PACF4-1.2-0.8-0.40.00.40.812345678ACF5-1.0-0.8-0.6-0.4-0.20.012345678PACF5数学建模时间序列方法四、随机时间序列模型的估计四、随机时间序列模型的估计数学建模时间序列方法 AR(p)、MA(q)、ARMA(p,q)模型的估计方法较多,大大体上分为体上分为3类:类:(1)最小二乘估计;)最小二乘估计;(2)矩估计;)矩估计;(3)利用自相关函数的直接估计)利用自相关函数的直接估计。下面有选择地加
31、以介绍。结构阶数模型识别确定估计参数数学建模时间序列方法 AR(p)AR(p)模型的模型的Yule WalkerYule Walker方程估计方程估计 在AR(p)模型的识别中,曾得到 pkpkkk2211利用k=-k,得到如下方程组:kppppppppp12112211211211 此方程组被称为此方程组被称为Yule Walker方程组方程组。该方程组建该方程组建立了立了AR(p)AR(p)模型的模型参数模型的模型参数 1 1,2 2,p p与自相关函数与自相关函数 1 1,2 2,p p的关系,的关系,数学建模时间序列方法 利用实际时间序列提供的信息,利用实际时间序列提供的信息,首先首先
32、求得自相关函数的求得自相关函数的估计值估计值 然后然后利用利用Yule Walker方程组,求解模型参数的估计方程组,求解模型参数的估计值值,12p,12p12011102120112pppppp由于 ptptttXXX11于是 pjiijjitE1,022从而可得 2 2的估计值的估计值 pjiijji1,02在具体计算时,k可用样本自相关函数rk替代。数学建模时间序列方法 MA(q)MA(q)模型的矩估计模型的矩估计 将MA(q)模型的自协方差函数中的各个量用估计量代替,得到:qkqkkqkqkkqk当当当01)(0)1(112222212 首先首先求得自协方差函数的估计值,(*)是一个包
33、含(q+1)个待估参数(*)221,q的非线性方程组,可以用直接法直接法或迭代法迭代法求解。常用的迭代方法有常用的迭代方法有线性迭代法线性迭代法和和Newton-Raphsan迭代法迭代法。数学建模时间序列方法 (1 1)MA(1)MA(1)模型的直接算法模型的直接算法 对于MA(1)模型,(*)式相应地写成1212120)1(于是 211021204或0212410有于是有解)411(22102)411(2211211 由于参数估计有两组解,可根据可逆性条件|1|1的MA(q)模型,一般用迭代算法估计参数:由(*)式得 qkqkkkkq12211222102第一步第一步,给出的一组初值,比如
34、k,21202)0(0)0()0()0(21k代入(*)式,计算出第一次迭代值 02)1(0)1(kk(*)数学建模时间序列方法 第二步第二步,将第一次迭代值代入(*)式,计算出第二次迭代值)1()1()1()1()2()1()1(1/()2(11022102qkqkkkq 按此反复迭代下去,直到第m步的迭代值与第m-1步的迭代值相差不大时(满足一定的精度),便停止迭代,并用第m步的迭代结果作为(*)的近似解。数学建模时间序列方法 ARMA(p,q)ARMA(p,q)模型的矩估计模型的矩估计 在ARMA(p,q)中共有(p+q+1)个待估参数1,2,p与1,2,q以及2,其估计量计算步骤及公式
35、如下:第一步第一步,估计1,2,p 1211112112pqqqpqqqpqpqpqqqqp k是总体自相关函数的估计值,可用样本自相关函数rk代替。数学建模时间序列方法 第二步,第二步,改写模型,求1,2,q以及2的估计值 将模型 tptptttXXXX2211qtqtt2211 改写为:tptptttXXXX2211qtqtt2211令 ptpttttXXXXX2211于是(*)可以写成:(*)qtqttttX2211 构成一个MA模型。按照估计MA模型参数的方法,可以得到1,2,q以及2的估计值。数学建模时间序列方法 AR(p)AR(p)的最小二乘估计的最小二乘估计 假设模型AR(p)的
36、参数估计值已经得到,即有 tptptttXXXX2211 残差的平方和为:21221112)()(nptptptttnpttXXXXS(*)根据最小二乘原理,所要求的参数估计值是下列方程组的解:Sj 0即 0)(12211jtnptptptttXXXXXj=1,2,p (*)解该方程组,就可得到待估参数的估计值。数学建模时间序列方法 为了与AR(p)模型的Yule Walker方程估计进行比较,将(*)改写成:nptjttnptjtptpnptjttnptjttXXnXXnXXnXXn111221111j=1,2,p由自协方差函数的定义,并用自协方差函数的估计值 knpttktkXXn11代入
37、,上式表示的方程组即为:jpjpjj2211或 jpjpjjrrrr2211j=1,2,pj=1,2,p数学建模时间序列方法解该方程组,得到:pppppprrrrrrrrrrrr21102120111021即为参数的最小二乘估计。Yule Walker方程组的解12011102120112pppppp比较发现,当n足够大时,二者是相似的。2的估计值为:pnSpnnptt1221数学建模时间序列方法 需要说明的是,需要说明的是,在上述模型的平稳性、识别与估计的讨在上述模型的平稳性、识别与估计的讨论中,论中,ARMA(p,q)模型中均未包含常数项。模型中均未包含常数项。如果包含常数项,该常数项并不
38、影响模型的原有性质如果包含常数项,该常数项并不影响模型的原有性质,因为通过适当的变形,可将包含常数项的模型转换为不含常数项的模型。下面以一般的ARMA(p,q)模型为例说明。对含有常数项的模型 qtqttptpttXXX1111方程两边同减/(1-1-p),则可得到 qtqttptpttxxx1111其中piiXx11pttti,1,数学建模时间序列方法五、模型的检验五、模型的检验数学建模时间序列方法 由于ARMA(p,q)模型的识别与估计是在假设随机扰动项是一白噪声的基础上进行的,因此,如果估计的模如果估计的模型确认正确的话,残差应代表一白噪声序列型确认正确的话,残差应代表一白噪声序列。如果
39、通过所估计的模型计算的样本残差不代表一白噪如果通过所估计的模型计算的样本残差不代表一白噪声,则说明模型的识别与估计有误,需重新识别与估计。声,则说明模型的识别与估计有误,需重新识别与估计。在实际检验时,主要检验残差序列是否存在自相关在实际检验时,主要检验残差序列是否存在自相关。1 1、残差项的白噪声检验、残差项的白噪声检验 可用可用QLB的统计量进行的统计量进行 2检验检验:在给定显著性水平下,可计算不同滞后期的QLB值,通过与 2分布表中的相应临界值比较,来检验是否拒绝残差序列为白噪声的假设。若大于相应临界值,则应拒绝所估计的模型,需重新识别与估计。数学建模时间序列方法2 2、AICAIC与
40、与SBCSBC模型选择标准模型选择标准 另外一个遇到的问题是,在实际识别ARMA(p,q)模型时,需多次反复偿试,有可能存在不止一组(p,q)值都能通过识别检验。显然,增加增加p与与q的阶数,可增加拟合优度的阶数,可增加拟合优度,但却同时降低但却同时降低了自由度了自由度。因此,对可能的适当的模型,存在着模型的对可能的适当的模型,存在着模型的“简洁性简洁性”与模与模型的拟合优度的权衡选择问题。型的拟合优度的权衡选择问题。数学建模时间序列方法 其中,n为待估参数个数(p+q+可能存在的常数项),T为可使用的观测值,RSS为残差平方和(Residual sum of squares)。在选择可能的模
41、型时,在选择可能的模型时,AIC与与SBC越小越好越小越好 显然,如果添加的滞后项没有解释能力,则对显然,如果添加的滞后项没有解释能力,则对RSSRSS值值的减小没有多大帮助,却增加待估参数的个数,因此使的减小没有多大帮助,却增加待估参数的个数,因此使得得AICAIC或或SBCSBC的值增加。的值增加。需注意的是:需注意的是:在不同模型间进行比较时,必须选取相同的时间段。常用的模型选择的判别标准有:常用的模型选择的判别标准有:赤池信息法赤池信息法(Akaike information criterion,简记为简记为AIC)与施瓦兹贝叶斯法施瓦兹贝叶斯法(Schwartz Bayesian c
42、riterion,简记为简记为SBC):)ln()ln(2)ln(TnRSSTSBCnRSSTAIC数学建模时间序列方法 由第一节知:中国支出法GDP是非平稳的,但它的一阶差分是平稳的,即支出法GDP是I(1)时间序列。可以对经过一阶差分后的GDP建立适当的ARMA(p,q)模型。记GDP经一阶差分后的新序列为GDPD1,该新序列的样本自相关函数图与偏自相关函数图如下:-0.4-0.20.00.20.40.60.81.024681012141618GDPD1AC-0.6-0.4-0.20.00.20.40.60.81.024681012141618GDPD1PAC 例例9.2.3 中国支出法中
43、国支出法GDP的的ARMA(p,q)模型估计。模型估计。数学建模时间序列方法 图形:图形:样本自相关函数图形呈正弦线型衰减波,而偏自相关函数图形则在滞后两期后迅速趋于0。因此可初步判断该序列可初步判断该序列满足满足2 2阶自回归过程阶自回归过程AR(2)AR(2)。表表 9.2.2 中国中国 GDP一阶差分序列的样本自相关函数与偏自相关函数一阶差分序列的样本自相关函数与偏自相关函数kkr*krkkr*krkkr*kr10.8590.8597-0.034-0.25213-0.361-0.08620.622-0.4418-0.1120.01214-0.3630.07630.378-0.0659-0
44、.1750.0415-0.3080.04340.1910.06610-0.228-0.11716-0.216-0.02250.0870.07711-0.282-0.19217-0.128-0.04860.036-0.05112-0.32-0.0218-0.059-0.002426.0222|*kr 自相关函数自相关函数与偏自相关函数偏自相关函数的函数值:函数值:相关函数具有明显的拖尾性;偏自相关函数值在k2以后,可认为:可认为:偏自相关函数是截尾的。再次验证了一阶差分后的偏自相关函数是截尾的。再次验证了一阶差分后的GDPGDP满足满足AR(2)AR(2)随机过程。随机过程。数学建模时间序列方法
45、设序列GDPD1的模型形式为 ttttGDPDGDPDGDPD2211111有如下Yule Walker 方程:622.0859.01859.0859.01121解为:442.0,239.121用用OLSOLS法回归的结果为:法回归的结果为:ttttGDPDGDPDGDPD211653.01593.11 (7.91)(-3.60)r2=0.8469 R2=0.8385 DW=1.15数学建模时间序列方法 有时,在用回归法时,也可加入常数项有时,在用回归法时,也可加入常数项。本例中加入常数项的回归为:ttttGDPDGDPDGDPD211678.01495.159.9091 (1.99)(7.7
46、4)(-3.58)r2=0.8758 R2=0.8612 DW.=1.22 数学建模时间序列方法 模型检验模型检验 下表列出三模型的残差项的自相关系数及QLB检验值。模型1与模型3的残差项接近于一白噪声,但模型2存在4阶滞后相关问题,Q统计量的检验也得出模型2拒绝所有自相关系数为零的假设。因此:模型模型1 1与与3 3可作为描述中国支出法可作为描述中国支出法GDPGDP一阶差分序列的随机生成过程。一阶差分序列的随机生成过程。表表 9.2.3 模模型型残残差差项项的的自自相相关关系系数数及及 Q检检验验值值 模型1 模型2 模型3 K Resid-ACF Q Resid-ACF Q Resid-
47、ACF Q 1 0.382 3.3846 0.258 1.5377 0.257 1.5263 2 0.014 3.3893-0.139 2.0077-0.040 1.5646 3-0.132 3.8427-0.246 3.5677-0.059 1.6554 4-0.341 7.0391-0.529 11.267-0.328 4.6210 5-0.170 7.8910-0.300 13.908-0.151 5.2864 6 0.253 9.9097 0.271 16.207 0.345 9.0331 7 0.144 10.613 0.158 17.051 0.155 9.8458 8 0.057
48、 10.730 0.116 17.541 0.076 10.059 9-0.019 10.745 0.097 17.914 0.011 10.064 10-0.146 11.685-0.036 17.969-0.123 10.728 11-0.233 14.329-0.136 18.878-0.230 13.319 12-0.049 14.461 0.064 19.104-0.012 13.328 数学建模时间序列方法 用建立的用建立的AR(2)模型对中国支出法模型对中国支出法GDP进行外推预测。进行外推预测。模型模型1可作如下展开:)()(3222111ttttttGDPGDPGDPGDPG
49、DPGDP3221211)()1(ttttGDPGDPGDPGDP 于是,当已知t-1、t-2、t-3期的GDP时,就可对第t期的GDP作出外推预测。模型模型3的预测式与此相类似,只不过多出一项常数项。对对20012001年中国支出法年中国支出法GDPGDP的预测结果(亿元)的预测结果(亿元)预测值预测值 实际值实际值 误差误差 模型模型1 95469 95933 -0.48%1 95469 95933 -0.48%模型模型3 97160 95933 1.28%3 97160 95933 1.28%数学建模时间序列方法 由于由于中国人均居民消费(CPC)与人均国内生产总值(GDPPC)这两时间
50、序列是非平稳的,因此不宜直接建立它们的因果关系回归方程。但它们都是但它们都是I(2)I(2)时间序列时间序列,因此可以建立它们的ARIMA(p,d,q)模型。下面只建立下面只建立中国人均居民消费(中国人均居民消费(CPCCPC)的随机时间序列模的随机时间序列模型。型。中国人均居民消费(CPC)经过二次差分后的新序列记为CPCD2,其自相关函数、偏自相关函数及Q统计量的值列于下表:例例9.2.4 中国人均居民消费的中国人均居民消费的ARMA(p,q)ARMA(p,q)模型模型数学建模时间序列方法 在5%的显著性水平下,通过Q统计量容易验证该序列本身就接近于一白噪声,因此可考虑采用零阶考虑采用零阶