1、分析分析时间序列分析n一女孩失恋后伤心哭泣,家人急忙劝慰,n老爸说:“吹了更好,那小子人品不好”。n老妈说:“他收入太低”。n姐姐说:“他长得不酷”。n哥哥说“他不仗义”。n女孩仍痛哭不止。n于是统计学家出现了:“想哭就哭吧,过一段时间就会好的,因为时间可以医治心灵的创伤”。时间序列分析n果然,一个月后,女孩又交上了新的男友。n看来有时寻找 n 个理由,构造 n 个变量,不如一个时间变量(t)解决问题。n本章教学目的是让学生掌握如何分析随时间变化的对象:时间序列分析方法。销售数据例题销售数据例题n下面看一个时间序列的数据例子。下面看一个时间序列的数据例子。n这是某企业从这是某企业从199019
2、90年年1 1月到月到20022002年年1212月的销售数据月的销售数据(tssales.sav)(tssales.sav)。n我们希望能够从这个数据找出一我们希望能够从这个数据找出一些规律,并且建立可以对未来的些规律,并且建立可以对未来的销售额进行预测的时间序列模型。销售额进行预测的时间序列模型。Sequence numberSEP 2002JAN 2002MAY 2001SEP 2000JAN 2000MAY 1999SEP 1998JAN 1998MAY 1997SEP 1996JAN 1996MAY 1995SEP 1994JAN 1994MAY 1993SEP 1992JAN 19
3、92MAY 1991SEP 1990JAN 1990SALES12010080604020销售数据例题销售数据例题n从这个点图可以看出:从这个点图可以看出:n总的趋势是增长的,但增长并不是单调上总的趋势是增长的,但增长并不是单调上升的;有涨有落。升的;有涨有落。n大体上看,这种升降不是杂乱无章的,和大体上看,这种升降不是杂乱无章的,和季节或月份的周期有关系。季节或月份的周期有关系。n当然,除了增长的趋势和季节影响之外,当然,除了增长的趋势和季节影响之外,还有些无规律的随机因素的作用。还有些无规律的随机因素的作用。时间序列的组成部分时间序列的组成部分n从该例可以看出,该时间序列可以有三部从该例可
4、以看出,该时间序列可以有三部分组成:趋势分组成:趋势(trend)(trend)、季节、季节(seasonal)(seasonal)成成分和无法用趋势和季节模式解释的随机干分和无法用趋势和季节模式解释的随机干扰扰(disturbance(disturbance)。)。n一般的时间序列还可能有循环或波动一般的时间序列还可能有循环或波动(Cyclic,or fluctuations)(Cyclic,or fluctuations)成分;循环模成分;循环模式和有规律的季节模式不同,周期长短不式和有规律的季节模式不同,周期长短不一定固定。比如经济危机周期,金融危机一定固定。比如经济危机周期,金融危机周
5、期等等。周期等等。n长期趋势(长期趋势(TrendTrend)n季节变动(季节变动(SeasonalSeasonal)n循环变动循环变动(Cyclic Cyclic)n随机波动(随机波动(fluctuationsfluctuations)长期趋势长期趋势(T)(T)n指客观社会经济现象在一个相当长指客观社会经济现象在一个相当长的时期内,受某种基本因素影响,的时期内,受某种基本因素影响,所呈现出的一种基本趋势。所呈现出的一种基本趋势。季节变动季节变动(S)(S):n指客观社会经济现象受季节更换等指客观社会经济现象受季节更换等因素的影响,在一年或更短的时间因素的影响,在一年或更短的时间内,随时间的
6、变化而呈现的周期性内,随时间的变化而呈现的周期性波动。波动。循环变动循环变动(C)(C)和不规则变动和不规则变动(I)(I)n循环变动循环变动(C)(C):指客观社会经济现象若:指客观社会经济现象若干年为周期的涨落起伏相同的波动。干年为周期的涨落起伏相同的波动。n不规则变动不规则变动(I)(I):指客观社会经济现象:指客观社会经济现象由于突发事件或偶然因素引起的无周期由于突发事件或偶然因素引起的无周期性的变动。性的变动。Sequence numberSEP 2002JAN 2002MAY 2001SEP 2000JAN 2000MAY 1999SEP 1998JAN 1998MAY 1997S
7、EP 1996JAN 1996MAY 1995SEP 1994JAN 1994MAY 1993SEP 1992JAN 1992MAY 1991SEP 1990JAN 1990120100806040200-20SALESError for SALES from SEASON,MOD_1 ADD Seas factors for SALES from SEASON,MOD_Trend-cycle for SALES from SEASON,MOD_1时间数列的分解时间数列的分解n如果要想对一个时间序列本身进行较深如果要想对一个时间序列本身进行较深入的研究,把序列的这些成分分解出来、入的研究,把序
8、列的这些成分分解出来、或者把它们过虑掉则会有很大的帮助。或者把它们过虑掉则会有很大的帮助。n如果要进行预测,则最好把模型中的与如果要进行预测,则最好把模型中的与这些成分有关的参数估计出来。这些成分有关的参数估计出来。n就例中的时间序列的分解,通过就例中的时间序列的分解,通过SPSSSPSS软软件,可以很轻而易举地得到该序列的趋件,可以很轻而易举地得到该序列的趋势、季节和误差成分。势、季节和误差成分。SPSSSPSS的实现的实现:时间序列数据的产生时间序列数据的产生nSPSSSPSS并不会自动把某些变量看成带有并不会自动把某些变量看成带有某些周期的时间序列;需要对某些周期的时间序列;需要对该变量
9、该变量的观测值附加上时间因素。的观测值附加上时间因素。n例数据例数据tasales.savtasales.sav原本只有一个变原本只有一个变量量salessales。这样就需要附加带有周期信。这样就需要附加带有周期信息的时间。息的时间。SPSSSPSS的实现的实现:时间序列数据的产生时间序列数据的产生n方法是通过选项:方法是通过选项:DataDataDefine DatesDefine Datesn然后在然后在Cases AreCases Are选择:选择:Years,months(Years,months(年月年月)n并指定第一个观测值(并指定第一个观测值(First Case First
10、Case IsIs)是)是19901990年年1 1月月 时间序列的分解实现过程时间序列的分解实现过程n对例对例tssales.savtssales.sav数据进行分解利用数据进行分解利用SPSSSPSS的选项:的选项:Analyze-Time Series-Seasonal Analyze-Time Series-Seasonal DecompositionDecompositionn然后在然后在Variable(s)(Variable(s)(变量变量)处选择处选择salessalesn在在ModelModel选择选择Additive(Additive(可加模型,可加模型,也可以试可乘模型也
11、可以试可乘模型Multiplicative)Multiplicative)时间序列的分解实现过程时间序列的分解实现过程最后得到四个附加变量,它们是:最后得到四个附加变量,它们是:n误差(误差(err_1err_1)n季节调整后的序列(季节调整后的序列(sas_1sas_1)n季节因素(季节因素(saf_1saf_1)n去掉季节后的趋势循环因素(去掉季节后的趋势循环因素(stc_1stc_1)SPSSSPSS的实现的实现:时间序列数据的点图时间序列数据的点图n对时间序列点图可以选择对时间序列点图可以选择 GraphsGraphsSequenceSequencen对本例选择对本例选择salessa
12、les为变量,为变量,monthsmonths为时间轴的标记即可。为时间轴的标记即可。Sequence numberSEP 2002JAN 2002MAY 2001SEP 2000JAN 2000MAY 1999SEP 1998JAN 1998MAY 1997SEP 1996JAN 1996MAY 1995SEP 1994JAN 1994MAY 1993SEP 1992JAN 1992MAY 1991SEP 1990JAN 1990Seas adj ser for SALES from SEASON,MOD_2 ADD EQU 1212010080604020Sequence numberSE
13、P 2002JAN 2002MAY 2001SEP 2000JAN 2000MAY 1999SEP 1998JAN 1998MAY 1997SEP 1996JAN 1996MAY 1995SEP 1994JAN 1994MAY 1993SEP 1992JAN 1992MAY 1991SEP 1990JAN 1990120100806040200-20Seas factors for SALES from SEASON,MOD_Trend-cycle for SALES from SEASON,MOD_2Sequence numberSEP 2002JAN 2002MAY 2001SEP 200
14、0JAN 2000MAY 1999SEP 1998JAN 1998MAY 1997SEP 1996JAN 1996MAY 1995SEP 1994JAN 1994MAY 1993SEP 1992JAN 1992MAY 1991SEP 1990JAN 1990120100806040200-20Trend-cycle for SALES from SEASON,MOD_2Error for SALES from SEASON,MOD_2 ADD 指数平滑模型指数平滑模型(exponential smoothing)(exponential smoothing)v应用范围应用范围:v纯粹时间序列,
15、不能用于含有独立变量纯粹时间序列,不能用于含有独立变量时间序列的研究变量时间序列的研究变量v指数平滑的原理为:当利用过去观测值指数平滑的原理为:当利用过去观测值的加权平均来预测未来的观测值时(这的加权平均来预测未来的观测值时(这个过程称为平滑),离得越近的观测值个过程称为平滑),离得越近的观测值要给以更多的权。要给以更多的权。指数平滑模型指数平滑模型(exponential smoothing)(exponential smoothing)n以简单的没有趋势和没有季节成分的纯粹以简单的没有趋势和没有季节成分的纯粹时间序列为例,指数平滑在数学上实际上时间序列为例,指数平滑在数学上实际上是一个几何
16、级数。是一个几何级数。n这时,如果用这时,如果用Y Yt t表示在表示在t t时间的平滑后的时间的平滑后的数据(或预测值),而用数据(或预测值),而用X X1 1,X X2 2,X Xt t表示原始的时间序列。表示原始的时间序列。n那么指数平滑模型为:那么指数平滑模型为:1011其中tttYXY指数平滑模型指数平滑模型n或者,等价于ktkktXY01这里的系数为几何级数。因此称之为这里的系数为几何级数。因此称之为“几何平滑几何平滑”比使人不解的比使人不解的“指数平指数平滑滑”似乎更有道理。似乎更有道理。指数平滑模型指数平滑模型n有关的教材中(如易丹辉编著的有关的教材中(如易丹辉编著的统计统计预
17、测预测方法与应用方法与应用,中国统计出版社,中国统计出版社,20012001)给出了各种实用的指数平滑模型)给出了各种实用的指数平滑模型的公式。这里就不再祥述的公式。这里就不再祥述SPSSSPSS的实现的实现:指数平滑指数平滑n以以tssales.savtssales.sav数据为例:数据为例:n选项选项AnalyzeAnalyzeTime SeriesTime SeriesExponential Exponential SmoothingSmoothing,n然后在然后在Variable(s)(Variable(s)(变量变量)处选择处选择salessales,n在在ModelModel选择
18、选择custom(custom(自选模型自选模型),n在在Trend ComponentTrend Component选选Exponential(Exponential(这主要这主要是因为看到序列原始点图趋势不象直线是因为看到序列原始点图趋势不象直线,其其实选实选LinearLinear也差不多也差不多)n在在Seasonal ComponentSeasonal Component选选Additive(Additive(这是可这是可加模型,也可以试选可乘模型:加模型,也可以试选可乘模型:MultiplicativeMultiplicative,细节可参看公式,细节可参看公式)SPSSSPSS的
19、实现的实现:指数平滑指数平滑n点击点击ParametersParameters来估计参数,在三个有关来估计参数,在三个有关参数选项上:参数选项上:General(Alpha)General(Alpha)、Trend(Gamma)Trend(Gamma)和和Seasonal(Delta)Seasonal(Delta)可均选可均选Grid SearchGrid Search(搜寻,这是因为不知道参数(搜寻,这是因为不知道参数是多少合适,参数意义参见后面公式)。是多少合适,参数意义参见后面公式)。n最后如果要预测新观测值,在主对话框点最后如果要预测新观测值,在主对话框点击击SaveSave,在,在P
20、redict CasesPredict Cases中选择中选择Predict Predict throughthrough下面的截止年月(这里选了下面的截止年月(这里选了20032003年年1212月)。月)。Sequence numberJUL 2003OCT 2002JAN 2002APR 2001JUL 2000OCT 1999JAN 1999APR 1998JUL 1997OCT 1996JAN 1996APR 1995JUL 1994OCT 1993JAN 1993APR 1992JUL 1991OCT 1990JAN 1990140120100806040200-20SALESFi
21、t for SALES from EXSMOOTH,MOD_2 EA A Error for SALES from EXSMOOTH,MOD_2 EA 输出的结果n结果中增加的变量有误差(结果中增加的变量有误差(err_1err_1)和)和拟合(预测)值拟合(预测)值fit_1fit_1。这在前面图中。这在前面图中绘出。绘出。n在在SPSSSPSS输出文件中还有那些估计的参输出文件中还有那些估计的参数值(三个参数加上季节因子)。数值(三个参数加上季节因子)。方程法方程法n在前面的回归分析的讨论中,我们阐述了在前面的回归分析的讨论中,我们阐述了如何利用一个或多个自变量来预测单个因如何利用一个或多
22、个自变量来预测单个因变量的值。变量的值。n因此,如果能够确定一系列相应的自变量因此,如果能够确定一系列相应的自变量和因变量的集合,就可以建立估计回归方和因变量的集合,就可以建立估计回归方程来预测时间序列。程来预测时间序列。方程法方程法n设:n则回归方程为:的值时期变量的值时期变量的值时期变量时期时间序列值k2121txtxtxtYkttttktktttxbxbxbbY22110方程法方程法n在上述方程中,可以将时间在上述方程中,可以将时间t t作为自变量,作为自变量,则回归方程就变为:则回归方程就变为:n当方程中只有一个自变量当方程中只有一个自变量t t时,这时就是直时,这时就是直线方程,否则
23、就是曲线方程,具体选择何线方程,否则就是曲线方程,具体选择何种方程还要根据实际情况确定。种方程还要根据实际情况确定。kkttbtbtbbY2210方程法方程法n例:已知1992年初至2002年底共11年我国激光唱机出口量月度数据,先对激光唱机出口量进行分析预测。n数据文件:时间数列(激光唱机出口)激光唱机出口趋势图时间127.00120.00113.00106.0099.0092.0085.0078.0071.0064.0057.0050.0043.0036.0029.0022.0015.008.001.00出口量80000006000000400000020000000曲线回归n由于该图中存
24、在上升的趋势,所以我们先利用二次曲线进行拟合:n可利用SPSS回归分析中的曲线回归方法进行拟合。2012tYbbtb t出口量时间14012010080604020080000006000000400000020000000-2000000ObservedQuadratic曲线回归n由输出结果可知,该序列中存在着自相关,因此要利用自回归的方法。Model Summaryb.925a.857.854675149.521.631Model1RR SquareAdjustedR SquareStd.Error ofthe EstimateDurbin-WatsonPredictors:(Consta
25、nt),时 间 二 次 项,时 间a.Dependent Variable:出 口 量b.Error for AMOUNTS with T from CURVEFIT,MOD_6 QUADRATICLag Number312927252321191715131197531ACF1.0.50.0-.5-1.0Confidence LimitsCoefficient自回归法自回归法n如果因变量为n自变量为n则建立的方程称为自回归方程:tY,21ttYYktktttYbYbYbbY22110时间127.00120.00113.00106.0099.0092.0085.0078.0071.0064.0
26、057.0050.0043.0036.0029.0022.0015.008.001.0080000006000000400000020000000-2000000出口量Fit for AMOUNTS from AREG,MOD_11Error for AMOUNTS from AREG,MOD_11Lag Number312927252321191715131197531ACF1.0.50.0-.5-1.0Confidence LimitsCoefficientn由于,该序列除具有曲线趋势、明显的季节性特征外,还有一个特征就是序列的波动幅度虽时间的推移越来越大。n这种波动必然会影响到模型的误差
27、序列,进而使其出现方差不平稳性。n消除方差非平稳性的方法可通过对序列数据取对数,然后再进行自回归分析。时间127.00120.00113.00106.0099.0092.0085.0078.0071.0064.0057.0050.0043.0036.0029.0022.0015.008.001.00LOGOUT7.06.56.05.55.04.5Error for LOGOUT from AREG,MOD_14Lag Number312927252321191715131197531ACF1.0.50.0-.5-1.0Confidence LimitsCoefficient时间127.00120.00113.00106.0099.0092.0085.0078.0071.0064.0057.0050.0043.0036.0029.0022.0015.008.001.007.06.56.05.55.04.5LOGOUTFit for LOGOUT from AREG,MOD_14