1、第三章 平稳时间序列模型的建立n第一节 时间序列的采集、直观分析和特征分析n第二节 时间序列的相关分析n第三节 平稳时间序列的零均值处理n第四节 平稳时间序列的模型识别n第五节 平稳时间序列模型参数的矩估计n第六节 平稳时间序列模型的定阶n第七节 平稳时间序列模型的检验n第八节 平稳时间序列模型的建模方法 第一节第一节 采集、直观分析和特征分析采集、直观分析和特征分析时间序列的建模流程数据的采集直观分析特征分析相关分析随机分析确定性分析时间序列的预处理数据的采集n方法:n直接采样n累计采样n特征采样n阈值采样n原理:n采样间隔越小,采样值越多,信息损失就越小,数据处理量越大,处理时间、人力、财
2、力消耗越大.n采样间隔越大,采样值越少,信息损失就越多,数据处理的时间、人力、财力消耗越小.时间序列数据的预处理n预处理:n直观分析n特征分析n相关分析直观分析v直观分析包括:离群点的检验和处理,缺损值的补足,指标计算范围的统一等等.v离群点(outlier):指一个时间序列中远离序列一般水平的极端大值和极端小值。通常是由于系统外部干扰而形成的,可以根据序列值与平滑值两者间的差异来判断.v缺损值(missing value):指在采集时间序列时,由于仪器故障、操作失误、观察问题等种种原因引起在某些观测点上未能记录的观察值.特征分析v定义:特征分析就是在对数据序列进行建模之前,通过从时间序列中计
3、算出一些有代表性的特征参数,用以浓缩、简化数据信息,以利于数据的深入处理,或通过概率直方图和正态性检验分析数据的统计特征.v特征参数包括:位置特征参数,散度特征参数,分布特征参数位置特征参数v样本均值:v极小值:v极大值:11111minmaxNiiii NiNi NXXNXXXX 散度特征参数v极差:v样本方差:v样本标准差:12222112*222112*1111111111NNNNiiiiNNNiiiiNiiLXXSXXXXNNNSXXXXNNNSXXN分布特征参数v偏度:v峰度:v标准偏度系数:v标准峰度系数:3*14*131*142*111161324NikiNiiNiiNiiXXS
4、NSXXKNSXXgNSXXNgNS 第二节第二节 时间序列的相关分析时间序列的相关分析时间序列的相关分析n相关分析:n纯随机性检验n平稳性检验n正态性检验纯随机性检验n定义:纯随机性检验,又称白噪声检验,是检验时间序列观察值之间是否具有相关性.nBartlett定理:n如果一个时间序列是纯随机的,得到一个观察期数为n 的观察序列,那么该序列的延迟非零期的样本自相关系数n若 ,则自相关系数为零的可能性是95%,可认为数据是不相关的.1 0,0kNkn 1.962,0knnkv检验统计量:Q统计量:Box和Pierce共同推导出 v原假设:延迟期数小于或等于m的序列值之间相互独立v结论:当Q0.
5、05时,接受原假设;当p0.05时,拒绝原假设,Xt是平稳非白噪声序列,尝试建立ARMA模型。一般取k N/10 221kiiQNk1,0210mHm:纯随机性检验纯随机性检验纯随机性检验v时间序列的平稳性是时间序列建模的重要前提。v目的:检验相关序列值Xt之间是否是平稳的 v检验的对象:序列是否具有常数均值和常数方差?序列的自相关函数是否仅与时间间隔有关,而与时间的起止点无关?平稳性检验v常用的检验方法:数据图检验法自相关和偏相关系数图检验法特征根检验法参数检验法 逆序检验法游程检验法平稳性检验数据图检验法n以时间为横轴,变量Xt的取值为纵轴n平稳的特点n无明显的趋势性或周期性n在一直线附近
6、做小幅波动1990年12月19日-2008年11月6日上证A股指数日数据(除去节假日,共4386个数据)1994年-1995年香港环境数据序列(a)表示因循环和呼吸问题前往医院就诊的人数;(b)表示二氧化硫的日平均水平;(c)表示二氧化氮的日平均水平;(d)表示可吸入的悬浮颗粒物的日平均水平数据图检验法数据图检验法n优点:简单,方便,直观n缺点:主观性强n检验原理:n若序列Xt的样本自相关系数和偏相关系数既不截尾,又不拖尾,则可以肯定该序列是非平稳的。自相关和偏相关系数图检验法自相关和偏相关系数图检验法n尝试拟合AR(1)模型n尝试拟合MA(1)模型自相关和偏相关系数图检验法n尝试拟合AR(1
7、),MA(1),ARMA(1,1)模型自相关和偏相关系数图检验法自相关和偏相关系数图检验法特征根检验法n原理:n自回归部分特征方程的特征根在复平面的单位圆内n检验步骤:n先拟合适应性模型;n求出该模型自回归部分特征方程的特征根;n若特征根|i|F(s,N-r),则拒绝原假设,认为后面s个回归因子对因变量的影响是显著的,表明M1合适;若FF,则拒绝原假设,认为AR(p)合适;若FF,则拒绝原假设,模型阶数仍有上升的可能;若FF,则接受原假设,认为ARMA(p-1,q-1)合适。ARMA(p,q)模型定阶的F准则010,;1,1:0,0pqARMA p qQARMA pqQH残差平方和残差平方和1
8、0022,QQFFNpqQNpqv由于自相关函数(ACF)和偏相关函数(PACF)定阶法具有很强的主观性,是一种较为粗略的方法,而最佳准则函数定阶法则可以帮助我们在一些所选的模型中选择相对最优的模型。v最佳准则函数法,即确定出一个准则函数。建模时按照信息准则函数的取值确定模型的优劣,以决定取舍,使准则函数达到极小的是最佳模型。v分类:AIC准则法BIC准则法最佳准则函数法AIC准则v背景:AIC准则是日本统计学家赤池Akaike于1973年提出的,全称为最小信息量准则,或AIC准则(Akaike information criterion)。该准则确定出一个准则函数,既考虑拟合模型对原始数据的
9、拟合程度,也考虑模型中所含待定参数的个数,适用于ARMA模型的检验。vAIC准则函数:AIC=-2ln(模型的极大似然度)+2(模型的独立参数个数)AIC准则用于ARMA模型的定阶v对于中心化的ARMA(p,q)模型:N为样本容量v对于非中心化的ARMA(p,q)模型:211112,0,ln21ttptpttqt qtXXXWNAICNpq 2011112,0,ln22ttptpttqt qtXXXWNAICNpq AIC准则的说明v对于中心化的ARMA(p,q)模型:N为样本容量v说明:第一项:体现了模型拟合的好坏,它随着阶数的增大而减小;第二项:体现了模型参数的多少,它随着阶数的增大而变大
10、。211112,0,ln21ttptpttqt qtXXXWNAICNpq BIC准则vAIC准则是样本容量N的线性函数,在N时不收敛于真实模型,它通常比真实模型所含的未知参数要多,是过相容的。v为了弥补AIC准则的不足,Akaike于1976年提出BIC准则,而Schwartz在1978年根据Bayes理论也得出同样的判别标准,称为SC准则。理论上已证明,SC准则是最优模型的真实阶数的相合估计。AIC与BIC准则v对于中心化的ARMA(p,q)模型:N为样本容量 2111122,0,ln21lnln(1)ttptpttqt qtXXXWNAICNpqBICNNpq AIC与BIC准则 第七节
11、第七节 平稳时间序列模型的检验平稳时间序列模型的检验平稳序列的ARMA建模步骤 v模型识别:用自相关图和偏相关图识别模型形式(p=?q=?)v参数估计:确定模型中的未知参数v模型的定阶:用AIC和SC准则进行模型定阶v模型检验:模型的适应性检验参数的显著性检验v序列预测模型的适应性检验v目的检验模型的有效性-对信息的提取是否充分v判定原则一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列;反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效。v检验对象残差序列的纯随机性检验模型的适应性检验v即为残差序列
12、的纯随机性检验ARMA模型的检验ARMA模型的检验主要分为以下两个方面:n模型的适应性检验n整个模型对信息的提取是否充分n参数的显著性检验n模型结构是否最精简参数显著性检验v目的:检验模型的每一个未知参数是否显著非零,使模型更精简v假设条件:v构造检验统计量:一般服从t分布v结论:对于显著性水平当该检验统计量的p值小于时,拒绝原假设,认为该参数显著(不为零)。否则,认为该参数不显著。这时,应该剔除不显著参数所对应的自变量重新拟合模型,构造出新的、结构更精简的拟合模型。01:0:0HH参数显著性检验参数显著性检验 第八节第八节 平稳时间序列模型的建模方法平稳时间序列模型的建模方法平稳时间序列建模
13、v模型的特点:模型具有多样性;模型的参数应符合简约性原则v常用的建模方法:Box-Jenkins方法Pandit-Wu方法长阶自回归建模方法平稳时间序列建模vARMA建模的基本步骤:模型识别:用样本自相关图和偏相关图识别模型形式;初步定阶:利用上述不同的建模方法初步确定模型的阶数,可能会得到多个不同的模型;参数估计:对各个模型的未知参数进行估计;模型的最终定阶:利用AIC、SC值和剩余平方和,选择恰当的模型,确定最终的模型阶数;模型检验:对参数的显著性和模型的适应性进行检验;模型预测:利用所建模型,对序列进行预测。Box-Jenkins建模方法v基本步骤:先检验序列的纯随机性和平稳性;若序列为
14、平稳的非白噪声序列,判别所属的模型类别:AR模型,MA模型,ARMA模型;框定所属模型的最高阶数;然后采用ARMA(n,n-1)从低阶到高阶对模型进行拟合和检验;利用AIC和SC对不同的模型进行比较,以确定最适宜的模型;对选出的模型进行适应性检验和参数的显著性检验;利用所建模型进行预测。v1952年-1988年中国农业实际国民收入的一阶差分序列Box-Jenkins建模方法判断平稳性n 游程检验法 v1952年-1988年中国农业实际国民收入的一阶差分序列Box-Jenkins建模方法柱状统计图:n 特征统计量Box-Jenkins建模方法由相关图的特征,可尝试建立:n AR(1)n MA(1
15、)n ARMA(2,1)建立AR模型建立AR(1)模型:n 剩余平方和:2146.430;AIC:7.011233;SC:7.055671AR(1)模型的检验残差是纯随机序列,AR(1)是适应性模型建立MA模型建立MA(1)模型:n 剩余平方和:1920.463;AIC:6.925791;SC:7.013764残差是纯随机序列,MA(1)是适应性模型建立ARMA模型Box-Jenkins建模方法MA(1)和AR(1)都是适应性模型,但是MA(1)模型相对更优模型方程为:115.020.71ttsrPandit-Wu建模方法v背景:该方法是吴贤铭和Pandit在1977年提出的时间序列建模的新方法,称为动态数据系统方法或Pandit-Wu方法;该方法对Box-Jenkins方法进行了改进,选用ARMA(2n,2n-1)模型建模.v原理和基本步骤:见书本P90的流程图Pandit-Wu建模方法v尝试拟合ARMA(2,1)长阶自回归建模方法v原理:利用AR(2n)来拟合ARMA(n,n-1)模型v基本步骤:见书本P94的流程图长阶自回归建模方法v拟合AR(2n)