1、02004006008001000787980818283848586878889Y0.E+001.E+112.E+113.E+114.E+11808284868890929496980002GDP北京市社会商品零售额月度数据北京市社会商品零售额月度数据 香港香港GDP季度数据季度数据 我们在分析问题的时候何时应选取季度或者月度数据呢?我们在分析问题的时候何时应选取季度或者月度数据呢?季度时间序列、月度时间序列、周度时间序列等时间序列中往往存在着明显的周期性周期性变化,这种周期往往是由于季节性变化引起的,因此这种序列又称为季节性时间序列季节性时间序列。这种序列怎么建立模型?seasonal A
2、RIMA model,SARIMA multiplicative seasonal model 1、季节差分:消除季节单位根、季节差分:消除季节单位根 假设季节性序列的变化周期为假设季节性序列的变化周期为s,存在季节单位根即,存在季节单位根即yt=yt s+ut,则季节差分为则季节差分为yt-yt s.季节差分算子定义为,季节差分算子定义为,s=1-Ls 则对则对yt进行一次季节差分表示为进行一次季节差分表示为 s yt=(1-Ls)yt=yt-yt-s 若非平稳季节性时间序列存在若非平稳季节性时间序列存在D个季节单位根,则需要进行个季节单位根,则需要进行D次季次季节差分之后才能转换为平稳序列
3、。即节差分之后才能转换为平稳序列。即 s Dyt 与一般时间序列模型与一般时间序列模型对照来学习对照来学习 2、季节自回归算子与移动平均算子:描述、季节自回归算子与移动平均算子:描述季节相关性季节相关性 类比一般的时间序列模型,序列类比一般的时间序列模型,序列xt=sDyt中含有季节自相关和移动中含有季节自相关和移动平均成份意味着,平均成份意味着,即即 sDyt可以建立关于周期为可以建立关于周期为s的的P阶自回归阶自回归Q阶移动平均季节时间阶移动平均季节时间序列模型。序列模型。P(Ls)sDyt=Q(Ls)ut 其中其中 P(Ls)=(1-1 Ls-2 L2s-P LPs)称为季节自回归算子称
4、为季节自回归算子;Q(Ls)=(1+1Ls+2 L2s+Q LPs)称为季节移动平均算子称为季节移动平均算子1221221tt stsPt Pstt stst Qsxxxxuuuu 3、季节时间序列模型的一般形式:、季节时间序列模型的一般形式:乘积季节模型乘积季节模型 当当ut非平稳且存在非平稳且存在ARMA成分时,则可以把成分时,则可以把ut描述为描述为 p(L)dut=q(L)vt 其中其中vt为白噪声过程,为白噪声过程,p,q分别表示非季节自回归分别表示非季节自回归、移动平均算子的最移动平均算子的最大阶数,大阶数,d表示表示ut的一阶(非季节)差分次数。由上式得的一阶(非季节)差分次数。
5、由上式得 ut=p-1(L)-d q(L)vt 代入代入 P(Ls)sDyt=Q(Ls)ut 得到得到 p(L)P(Ls)(d sDyt)=q(L)Q(Ls)vt 其中下标其中下标P,Q,p,q分别表示季节与非季节自回归分别表示季节与非季节自回归、移动平均算子的最大滞后移动平均算子的最大滞后阶数,阶数,d,D分别表示非季节和季节性差分次数。上式称作分别表示非季节和季节性差分次数。上式称作(p,d,q)(P,D,Q)s 阶季节时间序列模型或乘积季节模型。阶季节时间序列模型或乘积季节模型。当协方差平稳序列当协方差平稳序列 d sDyt含有均值含有均值等确定性成分时(通常如此),上述模型等确定性成分
6、时(通常如此),上述模型表示为,表示为,p(L)P(Ls)(d sDyt-)=q(L)Q(Ls)vt 保证(保证(d sDyt)具有平稳性的条件是)具有平稳性的条件是 p(L)P(Ls)=0的所有根在单位圆外;保的所有根在单位圆外;保证(证(d sDyt)具有可逆性的条件是)具有可逆性的条件是 q(L)Q(Ls)=0的所有根在单位圆外。的所有根在单位圆外。当当P=D=Q=0时,时,SARIMA模型退化为模型退化为ARIMA模型;从这个意义上说,模型;从这个意义上说,ARIMA模型是模型是SARIMA模型的特例。当模型的特例。当P=D=Q=p=q=d=0时,时,SARIMA模型退化为白噪声模型。
7、模型退化为白噪声模型。例如,例如,(1,1,1)(1,1,1)12 阶月度阶月度SARIMA模型表达为模型表达为 (1-1 L)(1-1 L12)12 yt=(1+1 L)(1+1 L12)vt 则则 12 yt具有平稳性的条件是具有平稳性的条件是 1 1,1 1,12 yt具有可逆性的具有可逆性的条件是条件是 1 1,1 1。1、首先要确定、首先要确定d,D。存在一般单位根时相应相关图的呈缓。存在一般单位根时相应相关图的呈缓慢线性衰减。存在季节单位根的特征是相应的相关图中慢线性衰减。存在季节单位根的特征是相应的相关图中s整数倍时点上的值呈缓慢衰减。整数倍时点上的值呈缓慢衰减。2、如果相关图和
8、偏相关图在变化周期、如果相关图和偏相关图在变化周期s的整倍数时点上出现的整倍数时点上出现峰值或衰减变化。说明存在季节自回归或移动平均成份。同峰值或衰减变化。说明存在季节自回归或移动平均成份。同p和和q的识别一样,同样可以根据相关图偏相关图来识别的识别一样,同样可以根据相关图偏相关图来识别P和和Q。3、用对数的季节时间序列数据建模时通常、用对数的季节时间序列数据建模时通常D不会大于不会大于1,P和和Q不会大于不会大于3。乘积季节模型参数的估计、检验与前面介绍的估计、乘积季节模型参数的估计、检验与前面介绍的估计、检验方法相同。利用乘积季节模型预测也与上面介绍检验方法相同。利用乘积季节模型预测也与上
9、面介绍的预测方法类似。我们重点看一下的预测方法类似。我们重点看一下Eviews操作。操作。例,例,(1,1,1)(1,1,1)12 阶月度阶月度SARIMA模型表达为模型表达为 (1-1 L)(1-1 L12)12 yt=(1+1 L)(1+1 L12)vt 其中,其中,yt=ln(Yt),则,则 上式的上式的Eviews命令是,命令是,DLOG(Y,1,12)AR(1)SAR(12)MA(1)SMA(12)命令命令数学表达式数学表达式含义含义d(Y)(1-L)Y对对Y进行一次差分进行一次差分d(Y,n)(1-L)nY对对Y进行进行n次差分次差分d(Y,n,s)(1-L)n(1-L s)Y对对
10、Y进行进行n次差分和一次季节差分次差分和一次季节差分dlog(Y)(1-L)log(Y)对对Y取自然对数后进行一次差分取自然对数后进行一次差分dlog(Y,n)(1-L)n log(Y)对对Y取自然对数后进行取自然对数后进行n次差分次差分dlog(Y,n,s)(1-L)n(1-L s)log(Y)对对Y取自然对数后进行取自然对数后进行n次差分和一次次差分和一次季节差分季节差分 例,例,(0,1,1)(0,1,1)12 阶月度阶月度SARIMA模型表达为模型表达为 12 yt=(1+1 L)(1+1 L12)vt 上式的上式的EViews估计命令是估计命令是 DLOG(Y,1,12)MA(1)S
11、MA(12)上式还可以写为,上式还可以写为,12 yt=(1+1 L)(1+1 L12)vt =vt+1 L vt+1 L12vt+1 1 L13vt =vt+1 vt 1+1 vt 12+1 1 vt 13上式也可以用如下的上式也可以用如下的EViews命令估计命令估计DLOG(Y,1,12)MA(1)MA(12)MA(13)上述估计命令对应的模型表达式是上述估计命令对应的模型表达式是 12 yt=vt+1 vt 1+12 vt 12+13 vt 13区别在于前者区别在于前者等价于等价于约束约束 13=1 1 预测:预测:12 yt=vt+1 vt 1+1 vt 12+1 1 vt 13 1
12、2 yt=(yt yt-12)=yt yt-12 =yt yt-1 yt-12+yt 13 在这个例子中,综合上述两式,用于预测的模型形在这个例子中,综合上述两式,用于预测的模型形式是式是 yt=yt-1+yt-12 yt 13+vt+1 vt 1+1 vt 12 +1 1 vt 131、北京市社会商品零售额月度数据、北京市社会商品零售额月度数据(1978:11989:11)(file:5b2c3)02004006008001000787980818283848586878889Y4.55.05.56.06.57.0787980818283848586878889LNY Lnyt的相关图和偏相
13、关图的相关图和偏相关图-0.4-0.20.00.20.4787980818283848586878889DLNY-0.4-0.20.00.20.4787980818283848586878889D2LNY Lnyt一次差分即一次差分即 LnytLnyt二次差分二次差分 Lnyt的相关图和偏相关图的相关图和偏相关图-0.4-0.20.00.20.4787980818283848586878889SDLNYLnyt一次季节差分即一次季节差分即 12Lnyt 12 Lnyt的相关图和偏相关图的相关图和偏相关图-0.4-0.20.00.20.4787980818283848586878889DSDLN
14、Y12 Lnyt均值近似为零。均值近似为零。12 Lnyt的相关图和偏相关图的相关图和偏相关图估计估计yt 的的(1,1,1)(1,1,0)12阶季节时间序列模型阶季节时间序列模型(加入加入SMA(12)项发现其参数不显著项发现其参数不显著)EViews估计命令是估计命令是DLOG(Y,1,12)AR(1)SAR(12)MA(1)(1+0.5924 L)(1+0.4093 L12)12Lnyt=(1+0.4734 L)vt (-4.5)(-5.4)(2.9)R2=0.33,s.e.=0.146,Q36=15.5,20.05(36-2-1)=44模型平稳可逆,自回归部分有模型平稳可逆,自回归部分
15、有13个个特征根,移动平均部分有特征根,移动平均部分有1个特征根。个特征根。但是对序列但是对序列Lnyt来说,其实一共有来说,其实一共有26个个自回归部分的根,因此对于自回归部分的根,因此对于Lnyt序列序列一一共有共有 27个特征根。个特征根。试试看,有没有更好的模型?Eviews5的输出结果,Eviews6会有微小差别。模型残差的相关图、偏相关图模型残差的相关图、偏相关图样本内预测:选取静态预测方法样本内预测:选取静态预测方法 12 Lnyt的实际与预测序列的实际与预测序列 yt的实际与预测序列的实际与预测序列1.7341.7349.789对对1989年第年第12月份月份yt进行进行样本外
16、样本外1期预测期预测,结果如图。,结果如图。相对预测误差是相对预测误差是 =0.0762、香港、香港GDP季度数据季度数据 (1980:12019:3)file:HongKong0.E+001.E+112.E+113.E+114.E+11808284868890929496980002GDP24.024.525.025.526.026.527.0808284868890929496980002LnGDP LnGDPt的相关图和偏相关图的相关图和偏相关图-0.15-0.10-0.050.000.050.100.150.20808284868890929496980002DLOG(GDP)-0.2
17、-0.10.00.10.2808284868890929496980002DLOG(GDP,2)LnGDPt的相关图和偏相关图的相关图和偏相关图 LnGDPt 2LnGDPt-0.10.00.10.20.3808284868890929496980002DLOG(GDP,0,4)4LnGDPt-0.2-0.10.00.10.2808284868890929496980002DLOG(GDP,1,4)4 LnGDPt建立(2,1,2)(1,1,1)4 模型。EViews估计命令是:DLOG(GDP,1,4)C AR(1)AR(2)SAR(4)MA(1)MA(2)SMA(4)(1-1.20 L+0
18、.66 L2)(1-0.33 L4)(4 LnGDPt+0.0023)(14.4)(-8.8)(2.8)(-2.45)=(1-1.16 L+0.97 L2)(1-0.95 L4)vt (-55.9)(86.1)(-32.8)R2=0.57,F=16.1,Q36=19.3,20.05(36-3-3)=43.8说明残差通过了说明残差通过了36期的期的Q检验。检验。模型平稳可逆,自回归部分有模型平稳可逆,自回归部分有6个特征根,移动平均部分有个特征根,移动平均部分有6个特征根。个特征根。但是对序列但是对序列LnGDPt来说,其实一共有来说,其实一共有11个自回归部分的根,因此对于个自回归部分的根,因此对于Lnyt序序列列一共有一共有 17个特征根。个特征根。Eviews5的输出结果,Eviews6会有微小差别。样本内预测:选取静态预测方法样本内预测:选取静态预测方法 4 LnGDPt的实际与预测序列的实际与预测序列 GDPt的实际与预测序列的实际与预测序列1111111035.31035.31033.3对对2019年第年第4季度季度GDPt进行进行样本外样本外1期预测期预测,结果如下:,结果如下:相对预测误差是相对预测误差是 =0.006