1、 时间序列分析时间序列分析 n一一.时间序列分析简介时间序列分析简介n二二.时间序列的趋势分析时间序列的趋势分析n三三. ARMA时间序列时间序列n引言引言n时间序列的定义时间序列的定义n时间序列分析方法简介时间序列分析方法简介 n时间序列分析软件时间序列分析软件1.1 引言引言n最早的时间序列分析可以追溯到最早的时间序列分析可以追溯到70007000年前的古埃年前的古埃及。及。q古埃及人把尼罗河涨落的情况逐天记录下来,就构成所古埃及人把尼罗河涨落的情况逐天记录下来,就构成所谓的时间序列。对这个时间序列长期的观察使他们发现谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。
2、由于掌握了尼罗河泛滥的规尼罗河的涨落非常有规律。由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,从而创建了埃及灿烂律,使得古埃及的农业迅速发展,从而创建了埃及灿烂的史前文明。的史前文明。 n按照时间的顺序把随机事件变化发展的过程记录按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。对时间序列进行观下来就构成了一个时间序列。对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。的走势就是时间序列分析。1.2 时间序列的定义时间序列的定义n随机序列随机序列:按时间顺序排列的一组随机变量按时间顺序排列的一组
3、随机变量n观察值序列观察值序列:随机序列的随机序列的 个有序观察值,称之为序个有序观察值,称之为序列长度为列长度为 的观察值序列的观察值序列n随机序列和观察值序列的关系随机序列和观察值序列的关系q观察值序列是随机序列的一个实现观察值序列是随机序列的一个实现q我们研究的目的是想揭示随机时序的性质我们研究的目的是想揭示随机时序的性质q实现的手段都是通过观察值序列的性质进行推断实现的手段都是通过观察值序列的性质进行推断,21tXXXtxxx,21nn1.3 时间序列分析方法简介时间序列分析方法简介 n描述性时序分析描述性时序分析 n统计时序分析统计时序分析 1.3.1 描述性时序分析描述性时序分析n
4、通过直观的数据比较或绘图观测,寻找序列中通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性蕴含的发展规律,这种分析方法就称为描述性时序分析时序分析 n描述性时序分析方法具有操作简单、直观有效描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第的特点,它通常是人们进行统计时序分析的第一步。一步。 例如例如n德国业余天文学家施瓦尔发现太阳黑子的活动具有德国业余天文学家施瓦尔发现太阳黑子的活动具有1111年左右的周期年左右的周期1.3.2 统计时序分析统计时序分析 n频域分析方法频域分析方法n时域分析方法时域分析方法时域分析方法时域分析方法n
5、原理原理q事件的发展通常都具有一定的惯性,这种惯性用统计的语言事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,这种相关关来描述就是序列值之间存在着一定的相关关系,这种相关关系通常具有某种统计规律。系通常具有某种统计规律。n目的目的q寻找出序列值之间相关关系的统计规律,并拟合出适当的数寻找出序列值之间相关关系的统计规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型预测序列未学模型来描述这种规律,进而利用这个拟合模型预测序列未来的走势来的走势n特点特点q理论基础扎实,操作步骤规范,分析结果易于解释,是时间理论基础扎实,操作步骤规范,分析结
6、果易于解释,是时间序列分析的主流方法序列分析的主流方法 时域分析方法的分析步骤时域分析方法的分析步骤n考察观察值序列的特征考察观察值序列的特征n根据序列的特征选择适当的拟合模型根据序列的特征选择适当的拟合模型n根据序列的观察数据确定模型的口径根据序列的观察数据确定模型的口径n检验模型,优化模型检验模型,优化模型n利用拟合好的模型来推断序列其它的统计性利用拟合好的模型来推断序列其它的统计性质或预测序列将来的发展质或预测序列将来的发展 1.4 时间序列分析软件时间序列分析软件n常用软件常用软件qS-plus,Matlab,Gauss,TSP,Eviews 和和SAS n推荐软件推荐软件SASq在在
7、SAS系统中有一个专门进行计量经济与时间序列分析系统中有一个专门进行计量经济与时间序列分析的模块:的模块:SAS/ETS。SAS/ETS编程语言简洁,输出功编程语言简洁,输出功能强大,分析结果精确,是进行时间序列分析与预测的能强大,分析结果精确,是进行时间序列分析与预测的理想的软件理想的软件q由于由于SAS系统具有全球一流的数据仓库功能,因此在进系统具有全球一流的数据仓库功能,因此在进行海量数据的时间序列分析时它具有其它统计软件无可行海量数据的时间序列分析时它具有其它统计软件无可比拟的优势比拟的优势 二二.时间序列的趋势分析时间序列的趋势分析n目的目的q有些时间序列具有非常显著的趋势,我们分析
8、的目有些时间序列具有非常显著的趋势,我们分析的目的就是要找到序列中的这种趋势,并利用这种趋势的就是要找到序列中的这种趋势,并利用这种趋势对序列的发展作出合理的预测对序列的发展作出合理的预测 n常用方法常用方法q趋势拟合法趋势拟合法q平滑法平滑法2.1 趋势拟合法趋势拟合法n趋势拟合法就是把时间作为自变量,相应的序趋势拟合法就是把时间作为自变量,相应的序列观察值作为因变量,建立序列值随时间变化列观察值作为因变量,建立序列值随时间变化的回归模型的方法的回归模型的方法 n分类分类q线性拟合线性拟合q非线性拟合非线性拟合2.1.1 线性拟合线性拟合n使用场合使用场合q长期趋势呈现出线形特征长期趋势呈现
9、出线形特征n模型结构模型结构2( )0,( )ttttxabtIE IVar I例例2.1 拟合拟合澳大利亚政府澳大利亚政府19811990年每季度的消年每季度的消费支出序列费支出序列 线性拟合线性拟合n模型模型n参数估计方法参数估计方法q最小二乘估计最小二乘估计n参数估计值参数估计值2)(, 0)(40,2 , 1,ttttIVarIEtIbtax12.89,69.8498ba拟合效果图拟合效果图2.1.2 非线性拟合非线性拟合n使用场合使用场合q长期趋势呈现出非线形特征长期趋势呈现出非线形特征 n参数估计指导思想参数估计指导思想q能转换成线性模型的都转换成线性模型,能转换成线性模型的都转换
10、成线性模型,用线性最小二乘法进行参数估计用线性最小二乘法进行参数估计q实在不能转换成线性的,就用迭代法进行实在不能转换成线性的,就用迭代法进行参数估计参数估计 常用非线性模型常用非线性模型模型变换变换后模型参数估计方法线性最小二乘估计线性最小二乘估计迭代法迭代法迭代法2ctbtaTt22tt 2ctbtaTtttabT aalntbaTtttbcaTtbcateTttbcaT1ttTTlnbbln例例2.2 对上海证券交易所每月末上证指数序列进行对上海证券交易所每月末上证指数序列进行模型拟合模型拟合 非线性拟合非线性拟合n模型模型n变换变换n参数估计方法参数估计方法q线性最小二乘估计线性最小二
11、乘估计n拟合模型口径拟合模型口径2ctbtaTt22tt 20952. 02517.502tTt 拟合效果图拟合效果图2.2 平滑法平滑法n平滑法是进行趋势分析和预测时常用的一平滑法是进行趋势分析和预测时常用的一种方法。它是利用修匀技术,削弱短期随种方法。它是利用修匀技术,削弱短期随机波动对序列的影响,使序列平滑化,从机波动对序列的影响,使序列平滑化,从而显示出长期趋势变化的规律而显示出长期趋势变化的规律 n常用平滑方法常用平滑方法q移动平均法移动平均法q指数平滑法指数平滑法2.2.1 移动平均法移动平均法n基本思想基本思想q假定在一个比较短的时间间隔里,序列值之间的差假定在一个比较短的时间间
12、隔里,序列值之间的差异主要是由随机波动造成的。根据这种假定,我们异主要是由随机波动造成的。根据这种假定,我们可以用一定时间间隔内的平均值作为某一期的估计可以用一定时间间隔内的平均值作为某一期的估计值值 n分类分类qn期中心移动平均期中心移动平均qn期移动平均期移动平均n期中心移动平均期中心移动平均为偶数,为奇数,nxxxxxnnxxxxxnxntnttntntntnttntntt)2121(1)(1212122211211212152112ttttttxxxxxx2tx1txtx1tx2tx 5期中心移动平均n期移动平均期移动平均)(111nttttxxxnx4tx3tx2tx1txtx512
13、34ttttttxxxxxx 5期移动平均移动平均期数确定原则移动平均期数确定原则n事件的发展有无周期性事件的发展有无周期性q以周期长度作为移动平均的间隔长度以周期长度作为移动平均的间隔长度 ,以消除周期效应的影响以消除周期效应的影响n对趋势平滑的要求对趋势平滑的要求q移动平均的期数越多,拟合趋势越平滑移动平均的期数越多,拟合趋势越平滑n对趋势反映近期变化敏感程度的要求对趋势反映近期变化敏感程度的要求 q移动平均的期数越少,拟合趋势越敏感移动平均的期数越少,拟合趋势越敏感例例2.3:病事假人数的移动平均病事假人数的移动平均时间病事假人数5项移动平均时间病事假人数5项移动平均时间病事假人数5项移
14、动平均1.143.1612.45.1312.41.273.2913.25.2911.61.389.63.31314.65.31010.81.4119.43.41714.25.41210.41.5189.63.52814.05.5209.62.1310.04.1413.66.119.02.2810.44.2813.46.258.62.31011.04.31112.66.378.22.41311.64.41612.46.4102.52111.84.52412.66.51805101520253014710131619222528时间病事假人数实际值预测值例例2.4年.季度时间销售额年.季度时间销售
15、额年.季度时间销售额1.111663.3112106.1213521.22523.4128606.2222801.331404.1133456.3232951.447334.2142036.4249302.152244.3152337.1253452.261144.4169227.2263202.371815.1173247.3273902.487535.2182247.4289783.192695.3192848.1294833.2102145.4208228.230320时间销售额y4项滑动平均时间销售额y4项滑动平均时间销售额y4项滑动平均1.11663.3210397.7506.135
16、2435.8751.2523.4860405.8756.2280450.7501.31402804.1345407.3756.3295463.3751.47332954.2203418.0006.4930467.5002.1224307.8754.3233423.1257.1345484.3752.2114315.5004.4922423.1257.2320502.2502.3181323.625 5.1324432.1257.3390525.5002.4753341.750 5.2224426.0007.4978542.7503.1269357.8755.3284417.0008.14833
17、.2214374.8755.4822427.0008.23200200400600800100012001591317212529时间销售额实际值预测值 移动平均作预测移动平均作预测预测公式:预测公式: 特别的当特别的当121()T lT lT lT l nyyyyn ,T l iT l iT l iyliyyli 1l 111TTTnTyyyyn 例例2.3n某一观察值序列最后某一观察值序列最后4期的观察值为:期的观察值为:5,5.5,5.8,6.2(1)使用)使用4期移动平均法预测期移动平均法预测 。(2)求在二期预测值)求在二期预测值 中中 前面的系前面的系数等于多少?数等于多少?2Tx
18、2TxTx(1)(2) 在二期预测值中在二期预测值中 前面的系数等于前面的系数等于 45. 548 . 54 . 556 . 5416 . 542 . 68 . 54 . 554121123211TTTTTTTTTTxxxxxxxxxx321212212112161165414141TTTTTTTTTTTTTTTTxxxxxxxxxxxxxxxxTx165 例例2.4 某产品的销售额如下:某产品的销售额如下: 试用移试用移动平均法(动平均法(N=4)对第)对第12个月的销售额进行预测个月的销售额进行预测。 解:解:N4,故预测值,故预测值为为 同时利用同时利用n期移动平均公式可得到期移动平均公
19、式可得到412月的平滑值序列为月的平滑值序列为【312.5 390 392.5 405 402.5 405 412.5 415 418.75】 2008-8-2Anna37月月份份12 34567 89101112销售额130380330410440390380400450420390111098124154yyyyy024681012100150200250300350400450加权移动平均作预测加权移动平均作预测 在计算滑动平均值时,若对各序列值不作同等看待,在计算滑动平均值时,若对各序列值不作同等看待,而是对每个序列值乘上一个加权因子,然后再作平均,则而是对每个序列值乘上一个加权因子,
20、然后再作平均,则称此为加权滑动平均,称下述预测值称此为加权滑动平均,称下述预测值 为加权滑动平均拟合值,为加权滑动平均拟合值, 为加权因子,满足为加权因子,满足1122ttNt NtwyyyyN11NiiN12,N 例如,当例如,当 时,时, 有有 滑动平均值与所选的时段长短有关,时段长时的滑动滑动平均值与所选的时段长短有关,时段长时的滑动平均值比时段短时的滑动平均值的反应速度慢,这是对平均值比时段短时的滑动平均值的反应速度慢,这是对于干扰的敏感性降低的结果。造成这种现象的原因,主于干扰的敏感性降低的结果。造成这种现象的原因,主要是参数滑动平均的数据一律平等对待,不分先后。实要是参数滑动平均的
21、数据一律平等对待,不分先后。实际上最新数据更能反映销售的趋势。因此,要特别强调际上最新数据更能反映销售的趋势。因此,要特别强调新数据的影响,突出新数据的作用;为达此目的,可采新数据的影响,突出新数据的作用;为达此目的,可采用加权滑动平均法用加权滑动平均法。3N 1231.5,1,0.51231.50.53ttttwyyyy 加权数的选择,涉及预测者的预测艺术加权数的选择,涉及预测者的预测艺术水平。一般的规律是对新数据加的权大,水平。一般的规律是对新数据加的权大,老数据加的权小,至于大到什么程度和老数据加的权小,至于大到什么程度和小到什么程度,完全靠预测者对序列做小到什么程度,完全靠预测者对序列
22、做全面的了解和分析全面的了解和分析。二次移动平均预测法二次移动平均预测法 以上已见到对有线性增长趋势的序列以上已见到对有线性增长趋势的序列应用移动平均应用移动平均法去作预测比用全体历史数据的平均法好。但是,必须法去作预测比用全体历史数据的平均法好。但是,必须指出,对于有线性增长(或减少)趋势的序列,运用滑指出,对于有线性增长(或减少)趋势的序列,运用滑动平均法去作预测,也不是最佳的预测,其预测值会明动平均法去作预测,也不是最佳的预测,其预测值会明显的滞后于观察值的现象。显的滞后于观察值的现象。 例如,线性趋势方程是例如,线性趋势方程是 这里这里 是常数。当上式增加一个单位时间时,是常数。当上式
23、增加一个单位时间时, 就就有一个增量为有一个增量为 它不会随时间它不会随时间 的改变而改变。的改变而改变。tyabt 11ttyyab tabtb,a btyt 因此,当时间从因此,当时间从 增至增至 时,序列值是时,序列值是 但是,采用滑动平均法计算的序列的拟合值是但是,采用滑动平均法计算的序列的拟合值是 比比 滞后了滞后了 为了消除上述滞后现象,对上述的滑动平均法应加以为了消除上述滞后现象,对上述的滑动平均法应加以改进,改进的办法是对已取得的滑动平均值,再进行一改进,改进的办法是对已取得的滑动平均值,再进行一次滑动平均,并称这种滑动平均为二次滑动平均。次滑动平均,并称这种滑动平均为二次滑动
24、平均。 其公式为其公式为ttNtNyabtNb101Nt Nt iiyyNt Ny12tNtNNyyb111,ttt NtyyyyNtN 假设假设 是有线性增长趋势的序列,是有线性增长趋势的序列, 为序列为序列 的移动的移动平均预测值,移动时段长为平均预测值,移动时段长为 。 假定已观察到时间假定已观察到时间 以前的序列值以前的序列值 ,要预测未来时,要预测未来时刻刻 的序列值。由于序列有线性增长趋势,假定预测方的序列值。由于序列有线性增长趋势,假定预测方程为程为 这里这里 依赖于依赖于 以前的以前的 的观察值。的观察值。 下面介绍运用二次移动平均法去确定下面介绍运用二次移动平均法去确定 的方
25、法。设的方法。设序列的二次移动平均值为序列的二次移动平均值为 。 二次移动平均是在一次滑二次移动平均是在一次滑动平均基础上求出的因此又比第一次移动平均产生了滞后,动平均基础上求出的因此又比第一次移动平均产生了滞后,滞后值滞后值1112tttNyyb tyty tyNttytTt TttyabT预,ttb atty,tta bty于是有于是有由此得由此得及及由于由于 是实际观察值,可作为预测的基础,故令是实际观察值,可作为预测的基础,故令由于由于 故由故由111112tttttNyyyyb1111()ttttyyyy112()1tttbyyNtyttay1tttyab得得从而从而这样也就给出了预
26、测公式中的参数这样也就给出了预测公式中的参数 的估计值的估计值1111ttttyyyy111tttttabyyy112ttttayyb,tta bn在介绍了的滑动平均和加权滑动平均预测法中均受到一定在介绍了的滑动平均和加权滑动平均预测法中均受到一定的限制,那就是必须使用的限制,那就是必须使用 n 个历史的观察值。这种方法个历史的观察值。这种方法受到两方面的约束,一是必须有受到两方面的约束,一是必须有 n 个历史数据,二是预测个历史数据,二是预测值仅包含了这值仅包含了这 n 个数据的信息,而不能反映更多的历史数个数据的信息,而不能反映更多的历史数据的信息。据的信息。n人们希望找出一种更理想的方法
27、,使预测值能较多地反映人们希望找出一种更理想的方法,使预测值能较多地反映最新观察值的信息,也能反映大量的历史资料的信息,但最新观察值的信息,也能反映大量的历史资料的信息,但计算量要尽可能的少,需要存储的历史数据也不多。这种计算量要尽可能的少,需要存储的历史数据也不多。这种方法就是指数平滑预测法。方法就是指数平滑预测法。n指数平滑法与滑动平均法不同,指数平滑使用已知的全部指数平滑法与滑动平均法不同,指数平滑使用已知的全部数据来决定一特别时间序列的平滑值。数据来决定一特别时间序列的平滑值。2.2.2 指数平滑法指数平滑法n指数平滑方法的基本思想指数平滑方法的基本思想q在实际生活中,我们会发现对大多
28、数随机事件在实际生活中,我们会发现对大多数随机事件而言,一般都是近期的结果对现在的影响会大而言,一般都是近期的结果对现在的影响会大些,远期的结果对现在的影响会小些。为了更些,远期的结果对现在的影响会小些。为了更好地反映这种影响作用,我们将考虑到时间间好地反映这种影响作用,我们将考虑到时间间隔对事件发展的影响,各期权重随时间间隔的隔对事件发展的影响,各期权重随时间间隔的增大而呈指数衰减。这就是指数平滑法的基本增大而呈指数衰减。这就是指数平滑法的基本思想思想 n分类分类q简单指数平滑简单指数平滑qHolt两参数指数平滑两参数指数平滑简单指数平滑简单指数平滑n基本公式基本公式n等价公式等价公式221
29、)1 ()1 (ttttxxxx1)1 (tttxxxn初始值的确定初始值的确定n平滑系数的确定平滑系数的确定q一般对于变化缓慢的序列,一般对于变化缓慢的序列, 常取较小的值常取较小的值q对于变化迅速的序列,对于变化迅速的序列, 常取较大的值常取较大的值q经验表明经验表明 的值介于的值介于0.050.05至至0.30.3之间,修匀效果比较之间,修匀效果比较好。好。10 xx 简单指数平滑预测简单指数平滑预测n一期预测值一期预测值n二期预测值二期预测值n 期预测值期预测值2211)1 ()1 (TTTTTxxxxx1111212)1 ()1 ()1 (TTTTTTTxxxxxxx2,1lxxTl
30、Tl例例2.5n对某一观察值序列对某一观察值序列 使用指数平滑法。使用指数平滑法。 已知已知 , ,平滑系数,平滑系数 (1) 求二期预测值求二期预测值 。 (2)求在二期预测值求在二期预测值 中中 前面的系数等于多少?前面的系数等于多少? 解:(解:(1) (2) 所以使用简单指数平滑法二期预测值中所以使用简单指数平滑法二期预测值中 前面的系数就等前面的系数就等于平滑系数于平滑系数 tx10Tx5 .101Tx25. 02Tx2TxTx3 .103 .1075. 025. 01211TTTTTTxxxxxx112)1 (TTTTxxxx25. 0Tx 例例2.6:某小商店用指数平滑滑动模型预
31、报下个月吸引新顾客人数。取某小商店用指数平滑滑动模型预报下个月吸引新顾客人数。取=0.3,则有如下的预报:,则有如下的预报:月月顾客数(顾客数(yt)0.3yt0.7ytyt+11257.517.5002309.017.50025.0003257.518.55026.5004329.618.23526.0505288.419.48527.8356247.219.51927.8857298.718.70326.7198216.319.18227.4039267.817.83825.48210329.617.94625.638113510.519.28227.546123811.420.84829
32、.782132.248二次指数平滑二次指数平滑 在指数平滑预测公式中,不论是一步预测还是多步预测都是同一公在指数平滑预测公式中,不论是一步预测还是多步预测都是同一公式,这对稳定序列是可行的。但是,用在上升或下降趋势明显的需求式,这对稳定序列是可行的。但是,用在上升或下降趋势明显的需求序列上就不够理想。二次指数平滑就是为弥补这种缺陷的一种方法,序列上就不够理想。二次指数平滑就是为弥补这种缺陷的一种方法,但它不是直接用于序列预测的方法,而是为计算有线性趋势的线性预但它不是直接用于序列预测的方法,而是为计算有线性趋势的线性预测方程的系数服务的。测方程的系数服务的。 所谓二次指数的平滑法,是对一次指数
33、平滑后的序列数据再作一所谓二次指数的平滑法,是对一次指数平滑后的序列数据再作一次指数的平滑,其平滑公式是次指数的平滑,其平滑公式是 其中其中 , 为二次指数平滑值,为二次指数平滑值, 为指为指数平滑常数。数平滑常数。 二次指数平滑公式的运用,同一次指数平滑公式一样,也涉及初始二次指数平滑公式的运用,同一次指数平滑公式一样,也涉及初始值的选取问题。但随着时间的推移,初始值的影响是很小的,因此可值的选取问题。但随着时间的推移,初始值的影响是很小的,因此可选取选取 。 21211tttSySySy 111ttttSyyyy 2tSy 21000SySyy 由于时间序列具有线性趋势,故设线性预测方程为
34、由于时间序列具有线性趋势,故设线性预测方程为 由指数平滑方法的基本定理可以证明:由指数平滑方法的基本定理可以证明: 由此得到预测公式由此得到预测公式 t TttyabT12122()1ttttttaSSbSS12(2)( )1 (1)( )1t TttttTyabTSyTSyHolt两参数指数平滑两参数指数平滑n使用场合使用场合q适用于对含有线性趋势的序列进行修匀适用于对含有线性趋势的序列进行修匀 n构造思想构造思想q假定序列有一个比较固定的线性趋势假定序列有一个比较固定的线性趋势 q两参数修匀两参数修匀1tttxxr1111)1 ()()(1 (ttttttttrxxrrxxxn平滑序列的初
35、始值平滑序列的初始值n趋势序列的初始值趋势序列的初始值10 xx nxxrn110Holt两参数指数平滑预测两参数指数平滑预测n 期预测值期预测值lTTlTrlxx例例2.7n对北京市对北京市1978197820002000年报纸发行量序列进行年报纸发行量序列进行HoltHolt两参数指数平滑。指定两参数指数平滑。指定5125910 xx4325231230 xxr15. 01 . 0平滑效果图平滑效果图 三三.ARMA时间序列时间序列 ARMA模型的全称是自回归移动平均模型,模型的全称是自回归移动平均模型,它是目前最常用的拟合它是目前最常用的拟合平稳序列平稳序列的模型。它又的模型。它又可细分
36、为可细分为AR模型,模型,MA模型和模型和ARMA模型三大模型三大类。类。 平稳时间序列平稳时间序列 平稳时间序列可分为严平稳时间序列和宽平稳时间平稳时间序列可分为严平稳时间序列和宽平稳时间序列。序列。 如果一个时间序列的概率分布与时间如果一个时间序列的概率分布与时间t 无关,则称无关,则称该序列为严格该序列为严格 的(狭义的)平稳时间序列。的(狭义的)平稳时间序列。 如果序列的一阶、二阶矩存在,而且对任意时刻如果序列的一阶、二阶矩存在,而且对任意时刻 t 满足:满足: (1) 均值为常数;均值为常数; (2)协方差)协方差 为时间间隔的函数为时间间隔的函数 ; 则该序列称为宽平稳时间序列(广
37、义平稳时间序列)。则该序列称为宽平稳时间序列(广义平稳时间序列)。)(无关的常数与tExtkkttrr, t t kr 我们以后所研究的时间序列主要是宽平稳时间序列。我们以后所研究的时间序列主要是宽平稳时间序列。平稳序列反应在图像上就是所有样本点都围绕某一水平平稳序列反应在图像上就是所有样本点都围绕某一水平直线上下随机波动。直线上下随机波动。 一类特殊的平稳序列一类特殊的平稳序列白噪声序列白噪声序列 它是指一列相互之间无关,其均值都为它是指一列相互之间无关,其均值都为0,方差都,方差都 为为 的随机变量序列。的随机变量序列。txt2在在ARMA模型中需要用到的一些统计量的估计。模型中需要用到的
38、一些统计量的估计。 延迟延迟K的自协方差函数的估计值的自协方差函数的估计值 总体方差的估计值总体方差的估计值 延迟延迟k自相关系数的估计值自相关系数的估计值 当延迟阶数远远小于样本容量时当延迟阶数远远小于样本容量时1()()( )n ktt ktxxxxknk21()(0)1nttxxn( )(0)kk121()(), 0()n ktt ktknttxxxxknxx 1niixxn偏自相关系数偏自相关系数,0kkkDknD 111212111kkkkD11121211kkkkD平稳序列的检验平稳序列的检验自相关图检验自相关图检验 平稳序列通常具有短期相关性,该性质用自平稳序列通常具有短期相关性
39、,该性质用自相关系数来描述就是随着延迟期数相关系数来描述就是随着延迟期数k的增加,平的增加,平稳序列的自相关系数稳序列的自相关系数 会很快衰减向零。反之会很快衰减向零。反之非平稳序列的自相关系数非平稳序列的自相关系数 衰减向零的速度通衰减向零的速度通常比较慢,这就是我们利用自相关图进行平稳性常比较慢,这就是我们利用自相关图进行平稳性判断的标准。判断的标准。kk例例 检验检验19491949年年19981998年北京市每年最高年北京市每年最高气温序列的平稳性气温序列的平稳性 AR模型模型具有如下结构的模型称为具有如下结构的模型称为 阶自回归模型阶自回归模型简记为简记为特别当特别当 时,称为中心化
40、时,称为中心化 模型。模型。通常会缺省上式中的限制条件而把通常会缺省上式中的限制条件而把 简记为简记为p)(pARtsExtsEVarExxxxtsstttptptpttt, 0, 0)(,)(0)(0222110,00)(pAR)(pAR01122tttptptxxxx MA模型模型 具有如下结构的模型称为具有如下结构的模型称为 阶移动平均模型,阶移动平均模型,简记为简记为 特别当特别当 时,称为中心化时,称为中心化 模型。模型。 通常会缺省上式中的限制条件而把通常会缺省上式中的限制条件而把 简记为简记为q112220( )0( ),()0,ttttqt qqtttsxEVarEst ,)(
41、qMA0)(qMA)(qMA1122ttttqt qx ARMA模型模型 具有如下结构的模型称为自回归移动平均模型,具有如下结构的模型称为自回归移动平均模型,简记为简记为 特别当特别当 时,称为中心化时,称为中心化 模模型。型。 通常会缺省上式中的限制条件而把通常会缺省上式中的限制条件而把 简记为简记为),(qpARMAtsExtsEVarExxxtsstttqpqtqttptptt, 0, 0)(,)(0)(00211110,),(qpARMA00),(qpARMA01111ttptpttqt qxxx ARMA模型相关性特征模型相关性特征拖尾拖尾: 系数始终有非零取值,不会在系数始终有非零
42、取值,不会在k大于某个常数大于某个常数之后就恒等于零(之后就恒等于零(截尾截尾),这个性质就是拖尾性。),这个性质就是拖尾性。模型模型自相关系数自相关系数偏自相关系数偏自相关系数AR(P)拖尾拖尾P阶截尾阶截尾MA(q)q阶截尾阶截尾拖尾拖尾ARMA(p,q)拖尾拖尾拖尾拖尾kkk 平稳序列建模步骤平稳序列建模步骤平平稳稳非非白白噪噪声声序序列列计计算算样样本本相相关关系系数数模型模型识别识别参数参数估计估计模型模型检验检验模模型型优优化化序序列列预预测测YN1.计算样本相关系数计算样本相关系数n样本自相关系数样本自相关系数n样本偏自相关系数样本偏自相关系数nttkntkttkxxxxxx12
43、1)()(DDkkk2.模型识别模型识别n基本原则基本原则选择模型拖尾P阶截尾AR(P)q阶截尾拖尾MA(q)拖尾拖尾ARMA(p,q)kkk模型定阶的困难模型定阶的困难 因为由于样本的随机性,样本的相关系数不会呈因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的现出理论截尾的完美情况,本应截尾的 或或 仍会呈现出小值振荡的情况仍会呈现出小值振荡的情况 由于平稳时间序列通常都具有短期相关性,随着由于平稳时间序列通常都具有短期相关性,随着延迟阶数延迟阶数 , 与与 都会衰减至零值附近作小都会衰减至零值附近作小值波动。值波动。 当当 或或 在延迟若干阶之后衰减为小值波动在
44、延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?零值附近作拖尾波动呢? kkkkkkkkkk 模型定阶的经验方法模型定阶的经验方法 如果样本如果样本(偏偏)自相关系数在最初的自相关系数在最初的d阶明显阶明显大于两倍标准差范围,而后几乎大于两倍标准差范围,而后几乎95的自相关的自相关系数都落在系数都落在2倍标准差的范围以内,倍标准差的范围以内,而且通常由而且通常由非零自相关系数衰减为小值波动的过程非常突非零自相关系数衰减
45、为小值波动的过程非常突然。然。这时,通常视为这时,通常视为(偏偏)自相关系数截尾,截自相关系数截尾,截尾阶数为尾阶数为d。例例 选择合适的模型选择合适的模型ARMA拟合拟合1950年年1998年北年北京市城乡居民定期储蓄比例序列。京市城乡居民定期储蓄比例序列。序列自相关图序列自相关图序列偏自相关图序列偏自相关图拟合模型识别拟合模型识别 1. 1.自相关图显示延迟自相关图显示延迟3阶之后,自相关系数全部衰减阶之后,自相关系数全部衰减到到2倍标准差范围内波动,这表明序列明显地短期相关。倍标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当但序列由显著非零的
46、相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾连续,相当缓慢,该自相关系数可视为不截尾 2.2.偏自相关图显示除了延迟偏自相关图显示除了延迟1阶的偏自相关系数显著阶的偏自相关系数显著大于大于2倍标准差之外,其它的偏自相关系数都在倍标准差之外,其它的偏自相关系数都在2倍标准差倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截波动的过程非常突然,所以该偏自相关系数可视为一阶截尾尾 ,所以可以考虑拟合模型为所以可以考虑拟合模型为AR(1)。例例 美国科罗拉多州某一加油
47、站连续美国科罗拉多州某一加油站连续57天的天的OVERSHORT序列序列 序列自相关图序列自相关图序列偏自相关图序列偏自相关图拟合模型识别拟合模型识别 1. 1.自相关图显示除了延迟自相关图显示除了延迟1阶的自相关系数阶的自相关系数在在2倍标准差范围之外,其它阶数的自相关系倍标准差范围之外,其它阶数的自相关系数都在数都在2倍标准差范围内波动。根据这个特点倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列自相关系数序列平稳。同时,可以认为该序列自相关系数1阶截尾阶截尾 2.2.偏自相关系数显示出典型非截尾
48、的性质。偏自相关系数显示出典型非截尾的性质。 3.3.综合该序列自相关系数和偏自相关系数的综合该序列自相关系数和偏自相关系数的性质,为拟合模型定阶为性质,为拟合模型定阶为MA(1) 例例 1880-19851880-1985全球气表平均温度改变值差分全球气表平均温度改变值差分序列序列 序列自相关图序列自相关图序列偏自相关图序列偏自相关图拟合模型识别拟合模型识别 1.自相关系数显示出不截尾的性质自相关系数显示出不截尾的性质 2.2.偏自相关系数也显示出不截尾的性质偏自相关系数也显示出不截尾的性质 3.3.综合该序列自相关系数和偏自相关系综合该序列自相关系数和偏自相关系数的性质,可以尝试使用数的性
49、质,可以尝试使用ARMA(1,1)模型模型拟合该序列。拟合该序列。3.参数估计参数估计 待估参数待估参数 个未知参数个未知参数 常用估计方法常用估计方法q矩估计矩估计q极大似然估计极大似然估计q最小二乘估计最小二乘估计2pq211, ,pq 矩估计矩估计n原理原理q样本自相关系数估计总体自相关系数样本自相关系数估计总体自相关系数q样本一阶均值估计总体均值,样本方差估计总体方样本一阶均值估计总体均值,样本方差估计总体方差差111111( ,)( ,)pqp qpqp q 1niixxn2221221211xqp例例3.10:求求AR(2)模型系数的矩估计模型系数的矩估计nAR(2)模型nYule
50、-Walker方程n矩估计(Yule-Walker方程的解)ttttxxx22112112121112121112121221例例3.11:求求MA(1)模型系数的矩估计模型系数的矩估计nMA(1)模型模型n方程方程n矩估计矩估计11tttx2201111220111(1)1 12112411例例3.12:求求ARMA(1,1)模型系数的矩估计模型系数的矩估计nARMA(1,1)模型模型n方程方程n矩估计矩估计1111ttttxx1111 112011 1211()(1)12 1122122112121,2,242,24,ccccccc对矩估计的评价对矩估计的评价n优点优点q估计思想简单直观估