1、学习目标学习目标1.掌握时间序列数据及构成要素。2.掌握时间序列成分及组合形式,时间序列的类型。3.掌握时间序列数据的基本描述指标类别,水平指标及速度指标的含义。4.时间序列成分组合模型及如何选择。5.掌握平稳序列的分析与预测方法。6.掌握非平稳序列的分析与预测方法。7.了解随机时间序列分析的类型与基本过程。8.1 8.1 时间序列数据时间序列数据8.2 8.2 时间序列数据的基本描述分析时间序列数据的基本描述分析8.3 8.3 时间序列数据的成分分析时间序列数据的成分分析8.4 8.4 随机时间序列分析简介随机时间序列分析简介8.1.1 8.1.1 时间序列数据及构成要素时间序列数据及构成要
2、素将某一个研究的变量或指标在不同时间上的数值,按照时间的先后顺序排列而成。也称时间序列(动态数列、时间数列)。时间数列一般由两个基本要素组成,一个是观测值所属的时间,一个是反映客观现象特征的数值(观测值)8.1.2 8.1.2 时间序列成分及构成形式时间序列成分及构成形式通常将时间序列的构成成分区分为长期趋势、季节变动、循环变动和不规则变动四种。1.1.长期趋势长期趋势T T也称趋势,是时间序列在较长时期内朝着一定的方向持续上升或下降或停留在某一水平上的倾向,它反映了客观事物的主要变化趋势,2.2.季节变动季节变动S S指一年或更短的时间之内,由于受季节因素的影响而呈现出有规律的周期性波动。3
3、.3.循环变动循环变动C C常以若干年为周期(持续时间超过一年)、不具严格规则的周期性连续变动。通常循环常常与长期趋势影响合并,统称为趋势循环影响。4.4.不规则变动不规则变动I I由于偶然事件引起的变动,是不可预测的。四种成分与序列的关系为:乘法模型,Y Yi i=T Ti iS Si iC Ci iI Ii i 或者加法模型 ,Y Yi i=T Ti i+S+Si i+C+Ci i+I+Ii i 8.1.3 8.1.3 时间序列的类型时间序列的类型从基本分类看,时间序列分为平稳序列和非平稳序列。如果时间序列由不规则变动导致,即不含趋势、季节、和循环变动,那么该时间序列称为平稳序列平稳序列。
4、如果时间序列包含有趋势、季节、和循环变动,那么该时间序列称为非平稳序列非平稳序列。非平稳可能由其中的一个成分,或几个成分的组合构成。图形描述:为最基本手段,通常为线图或时序图。指标分析:通过计算一系列核心指标来反映所研究现象的动态特征。包括水平指标和速度指标。8.2.18.2.1 时间序列水平指标时间序列水平指标1.1.发展水平发展水平时间序列中每一个观测值都可以称为发展水平。通常把要研究的那个时间的发展水平称为报告期水平或计算期水平,把用来作为比较基础的时间的发展水平称为基期水平。2.2.平均发展水平平均发展水平将不同时期的发展水平加以平均得到的平均数称为平均发展水平,也称序时平均数或动态平
5、均数。(1)基于时期数据计算反映研究的现象在某一段时期内数据。(2)基于时点数据计算时点数据时点数据反映研究现象在某一时刻状态下总量水平,数值大小与时点间的间隔长短(登记和记录时间)无直接关系。时点数据数值直接相加得到的结果没有实际意义。间隔相等间隔不同3.3.增长量增长量指现象在一定时期内增长的绝对数量,用报告期发展水平减基期发展水平而得到。基期水平选择不同,有:逐逐期增长量期增长量=报告期水平-报告期的前一期水平累计增长量累计增长量=报告期水平-固定基期水平(通常为数据中的第一期)同比增长量同比增长量=报告期水平 去年同期水平4.4.平均增长量平均增长量说明研究现象在一段时期内平均每期增长
6、变化情况。1.1.发展速度发展速度表明被研究现象发展程度的相对指标,它是序列中两个不同时间发展水平相对比的结果。表达为:由于选择的基期不同,有定基发展速度和环比发展速度之分。如果基期选择为某一固定基期水平(通常为数据的第一期),对比的结果称为定基发展速度定基发展速度,有时也称总速度总速度(以年为单位)。如果基期选择为各报告期的前一期水平,对比的结果称为环环比发展速度比发展速度,表明研究现象逐期发展变化的情况。表达为:2.2.增长率增长率也称增长速度,增长率表明现象的增长程度,是增长量与其基期水平对比而得到的。表达为:根据基期选择不同,相应的也有定基增长率与环比增长率。环环比增长率比增长率=环比
7、发展速度-1(100%)定定基增长率基增长率=定基发展速度-1(100%)增长率也可能为负,说明报告期比基期降低的程度,即降低率。同比增长速度同比增长速度同比发展速度再减1或100%采用“同比”有利于消除季度因素,从而较为科学地反映现象的变化。3.3.平均增长率平均增长率平均速度是速度的分析中一种,包括平均发展速度与平均增长率(平均增长速度)。平均发展速度说明现象在一段较长时期内逐年平均发展变化的程度,平均增长率说明现象逐年平均增长变化的程度,也称平均增长速度。几何平均法表示为平均增长率:其中,R代表的是总速度。减1之前的结果均为平均发展速度。8.2.3 8.2.3 基本描述应注意的问题基本描
8、述应注意的问题1.1.图形。时间序列数据首选线图2.2.指标的分析。要根据研究现象的性质和特点,选择相应的分析公式。3.3.综合对现象分析和判断。不能就速度论速度,需要结合水平指标进行。增长率每增长一个百分点而增加的绝对数量。4.4.其他方面。当时间序列中的数据出现0或负数时,适宜直接用绝对数量进行说明和分析。8.3.1 8.3.1 时间序列成分及构成模型与评价方法时间序列成分及构成模型与评价方法1.1.时间序列成分及成分构成模型时间序列成分及成分构成模型长期趋势、季节变动、循环变动和不规则变动四种成分其常用乘法模型:Y Yi i=T Ti iS Si iC Ci iI Ii .i .2.2.
9、时间序列成分构成模型的选择时间序列成分构成模型的选择通过图形特点分析,分析出数据的构成成分,寻找适合的模型与分析方法。3.3.模型预测效果评价方法模型预测效果评价方法主要通过预测精度和预测结果的评价来反映。预测精度是通过测量与分析预测误差来进行的。预测误差预测误差是预测值同实际值之间的差异大小预测误差=实际值-预测值误差的不同的表现形式:百分误差、平均百分误差、平均绝对百分误差、平均误差、平均绝对误差、均方误差、均方根误差实际应用时,可从以上误差中选择使用。预测结果的评价预测结果的评价它是凭借对预测对象未来发展变化的认识,评价模型预测结果的可靠性。如果实际观测值均位于允许的置信区间内,则模型的
10、可靠性强,该模型可以接受;还必须与定性分析相结合。8.3.2 8.3.2 时间序列成分及分析预测方法时间序列成分及分析预测方法1.1.平稳序列的分析与预测方法平稳序列的分析与预测方法指不含有趋势的序列,其数据波动主要是随机成分所致;常用的主要方法包括简单平均,移动平均和指数平滑法等。常用的主要方法包括简单平均,移动平均和指数平滑法等。用已有的t期观察值计算平均值作为下一期预测值。(1 1)简单)简单平均法平均法(2 2)移动平均法)移动平均法对时间序列数据通过逐期移动,计算一系列扩大时间间隔后的序时平均数形成一个新的、派生的时间序列。适合于没有长期趋势的数据。将t期的移动平均值作为第t+1期的
11、简单移动平均预测值,有使用移动平均的方法有几点提示:一是,每次计算移动平均值时,需要选择移动的间隔(移动步长),移动间隔的选取应根据现象的特点和数据的情况来决定。二是,计算方法有简单移动平均法和加权移动平均法。三是,对移动平均结果的使用。计算出的移动平均值,其一是可以直接作为最近一期(第t+1期)的趋势值(预测值);其二,作为k期的中间一期的趋势值(即中心化移动平均)。四是,移动平均在实际中的应用。应用比较多的是在股市技术分析中。(3 3)指数平滑法)指数平滑法用过去的时间序列值的加权平均作为预测值,是加权移动平均一种特例。指数平滑方法较多,主要有单参数(一次)指数平滑、双参数指数平滑和三参数
12、指数平滑(Winters方法)。选择时应注意适用的序列,其中:单参数(一次)指数平滑单参数(一次)指数平滑一般用于不包含长期趋势和季节成分的平稳时间序列预测;双参数指数平滑(双参数指数平滑(HoltHolt方法方法)通常用于只包含长期趋势不包含季节成分的数据的非平稳时间序列预测;三参数指数平滑三参数指数平滑常适用于包含长期趋势和季节成分的非平稳时间序列预测。一次指数平滑一次指数平滑-简单模型预测简单模型预测方法方法适用于即无趋势也无季节成分的时间序列。表示平滑系数,01不同的会对预测结果产生不同的影响。当时间序列有较大的随机波动时,注重于近期的实际值时,宜选较大的;当时间序列比较平稳时,宜选较
13、小的;比较难以确定时,可选择几个取值,分别进行预测,再选择;在开始计算时,没有第1期的预测值,通常可以设等于第1期的实际观察值。进行指数平滑时,可以选择软件直接进行。2.2.非平稳序列的分析与预测方法非平稳序列的分析与预测方法如果是仅有趋势的序列,进一步区分是线性趋势(linear trend),还是非线性趋势如果是有季节变动的序列,按照季节变动的模型,用简单移动平均,或移动平均剔除法求解季节指数。如果是有复合成分的序列,有趋势和季节性成分,可以选择采用Winter指数平滑模型,及多元回归(引入季节哑变量)预测。如果是有复合成分的序列,有趋势、季节性成分和周期循环变动的复合型序列,也可采用分解
14、(decomposition)预测的方法。由于区分长期趋势和循环变动比较困难,有时对二者不做区分,而是把两项合在一起称为“趋势循环”成分(1 1)趋势成分的测定)趋势成分的测定线性趋势线性趋势。通常用时间回归方程法、Holt指数平滑模型(Holts model)描述其变化趋势。第一种方法:时间回归方程法时间回归方程法。t 时间变量(一般为时间标号);a趋势线在Y 轴上的截距 b斜率,表示时间 t 变动一个单位时观测值的平均变动量采用最小二乘法的原理和公式求解参数。更方便的是采用计算机或相应的软件帮助完成。当预测下一期时,t按顺序排序到多少,将其带入方程中计算即可。第二种方法:HoltHolt指
15、数平滑模型指数平滑模型法法查尔斯.霍尔特(Charles Holt)建立了预测具有线性趋势的时间序列的指数平滑形式,一般简称为Holt模型(Holts model),适合于含有趋势成分(或有一定的周期成分)序列的预测。Holt模型使用两个参数(平滑系数)和(取值均在0和1之间)和以下三个方程:Lt是t期时间序列水平的估计值或平滑值;bt是时间序列斜率的估计值;时间序列水平的平滑系数;时间序列斜率的平滑系数;Ft+k是向前k期的预测值;k是向前预测的期数。通常方法尝试用不同的和的取值组合,找到可以使误差平方和的均值(均方误差)最小的一个和的取值。目前可以使用软件得到最佳的结果。线性趋势除图形判断
16、外,可以使用一阶差分进行。如果一阶差分大致相等,说明现象的趋势呈直线。使用线性回归方程,还是Holt模型,除了考虑数据本身的特点,如是否含有季节等因素外,还取决于选择哪种误差作为衡量模型的精度。非线性趋势非线性趋势可利用spss软件回归分析,可以帮助我们选择模型的形式。非线性趋势有多种,其中有的非线性趋势可以通过变量代换,通过取对数等处理转换为线性的关系,可以使用如最小平方法等原理进行求解;也有的非线性趋势是不能转换的,如修正指数曲线,逻辑曲线等需要用其他方法如三和法求解。常用的趋势曲线模型:见公式(8.29)-(8.41)数据适合哪种模型呢?常有一些判断方法帮助我们判断。概括来讲:一是:图形
17、和经验判断;二是一些相关指标或数据的特征帮助判断;三是根据趋势,模拟几种模型,进行比较和检验,看那种模型更适合。(2 2)季节成分测定)季节成分测定也是时间序列的主要成分之一。季节成分测定一般通过季节指数(季节比率)来反映,通常用符号S(%)表示,其结果大于100%,为旺季,小于100%为淡季,没有季节影响,指数应为100%。季节指数季节指数是将时间序列各不同年份的同季(或同月)平均数与所有数据总平均数对比而得到的相对数。季节成分测定时,需根据数据所含成分不同,选择不同的方法。一般分为:第一种情况:不包含趋势时季节性变动的测定。采用的方法按季(月)平均法、季节模型法;第二种情况,包含长期趋势时
18、季节性变动及不规则变动的测定。主要采用趋势剔除法,通过乘法或加法模型进行。第一种情况-不包含趋势时季节变动的测定不包含趋势时季节变动的测定可以用采用按季(月)平均法,或者在多元回归方程中选用哑变量的方法。按季(月)平均法按季(月)平均法 -基本步骤为基本步骤为:1/计算同月(或同季)的平均数2/计算全部数据的总月(总季)平均数3./计算季节指数(S)如果季节指数之和不等于400%或月季节指数不等于1200%,就需要调整。调整系数:用调整系数分别乘以各月(或季)季节指数也可以选择多元回归方程选用哑变量的分析方法,进行季节测定。以季节分类变量作为自变量,销售量为因变量,建立多元回归方程。由于季节为
19、分类变量,应采用哑变量(或虚拟变量,二分变量)的方法。分类变量有k个水平,应该有k-1哑变量,比如销售量与季度的回归方程可以表示为:见表8-24,表8-25 ,表8-26 ,表8-27 ,表8-28 ,图8.18。第二种情况-包含长期趋势时季节变动的测定包含长期趋势时季节变动的测定主要选择采用的方法:趋势剔除法、模型分析法。趋势剔除法趋势剔除法-基本分析步骤为:【假定序列满足乘法模型Y=TSCI】第一步,对原时间序列(Y)进行N期(周期长度,通常为12月或4个季度)中心化移动平均;第二步,将原时间序列各观测值除以相应的中心化移动平均值,到不存在长期趋势的(SI);第三步,计算剔除长期趋势后的时
20、间序列的同期(同月或季度等)平均值,得到未调整的季节指数s。如果各季节指数之和不等于400(按季计算)或1200(按月计算),应当予以调整。第四步,用调整系数依次乘各季(或月)的季节指数s,季节指数的进一步使用与说明季节指数,除了可以用于分析季节变化规律,进行预测,便于安排生产和生活外,还可以用来调整原始序列,对时间序列季节变动影响进行消除使其成为不含有季节变动的时间序列。方法是:将原序列实际数值除以季节指数。模型分析法模型分析法:一种是将趋势和季节(采用虚拟变量)结合起来进行一种是将趋势和季节(采用虚拟变量)结合起来进行。模型形式为:另另一种是温特(一种是温特(WinterWinter)指数
21、平滑法,也称三参数指数平滑)指数平滑法,也称三参数指数平滑模型模型 Spss中选择季节性模型中的“Winter(冬季)乘法模型可以直接得到预测结果。时间序列数据是月度数据,其分析思路与方法类同季度数据。(3 3)循环变动的测定)循环变动的测定基本分析步骤:第一步,计算出季节指数(S);第二步,用原始数据Y除以季节指数S,得无季节变动数据TCI;第三步,根据无季节变动数据测定出长期趋势T 通过方程计算出各期的趋势值T第四步,用(TCI)除以T,得无季节、无长期趋势的数据(CI)。一般用CI%第五步,用移动平均法来消除I,得循环变动C,即循环变动指数.见表8-37。spss的“分析-预测-季节性分
22、解”可以直接进行趋势,季节成分的分解。再根据分解后的STC-1得到的趋势方程,并可以预测。8.4.18.4.1随机时间序列及模型与构建概述随机时间序列及模型与构建概述对一个随机时间序列分析,首先判断序列是否平稳即是平稳随机时间序列还是非平稳随机序列。方法可以通过时间序列图和自相关图进行判断。平稳序列时序图始终在一个常数值附近随机波动;平稳序列的自相关系数图很快的衰减向零;也可以通过序列的统计性质进行。直观简单理解是时间序列没有明显的长期趋势、循环变动和季节变动,其观测值的平均数不随时间的变化而变化。反之,不具有平稳性;其次,为了确定平稳序列是否值得继续研究,需要进行纯随机性检验。如果过去行为结
23、果对将来的发展没有任何的影响,这种序列称为纯随机序列纯随机序列,也称为白噪声序列。检验的方法是通过自相关系数及自相关图。如果自相关系数都非常小,且以一个很小的幅度随机波动,可以基本判断序列具有纯随机性。也可以通过检验统计量进行。1.1.平稳随机时间序列平稳随机时间序列ARMAARMA模型模型ARMA模型是最常用的拟合平稳序列的模型。它又细分为:(1 1)ARAR模型模型-自回归模型自回归模型如果时间序列yt可以表示为其过去值和一个随机干扰a t的线性函数,即:称为p阶自回归(Autoregressive)模型,简记为AR(p)模型。R模型判断的一个重要依据就是利用自相关系数和偏自相关系数。自相
24、关函数自相关函数(ACF)描述时间序列观测值与其过去的观测值之间的线性相关性,用自相关系数表示;偏偏自相关函数(自相关函数(PACF)描述在给定中间观测值的情况下,时间序列观测值与其过去的观测值之间的线性相关性,用偏自相关系数表示。两种系数都可以直接通过计算机软件算出,并通过图形表现出来,就是自相关函数图和偏自相关函数图,图形会呈现出拖尾状或截尾状。见图8.26(a),图8.26(b)(2 2)MAMA模型模型-滑动平均模型滑动平均模型如果时间序列yt可以表示为当期与过去的随机干扰a t的线性函数,即:称为q阶滑动(移动)平均模型,简记为MA(q)模型可以用自相关系数和偏自相关系数和图形判断是
25、否为MA模型。MA模型的图形特征是自相关系数截尾和偏自相关系数拖尾。(3 3)ARMAARMA模型模型-自回归滑动平均模型自回归滑动平均模型是由AR(p)模型和MA(q)模型混合而成的,简记为ARMA(p,q),表示为:ARMA模型的图形特征:自相关系数拖尾和偏自相关系数拖尾。ARMAARMA模型建模与分析的基本步骤模型建模与分析的基本步骤:(1)首先要求:时间序列必须是平稳的。可以通过图形进行判断。可通过差分进行平稳化处理。(2)即判断该序列所适合的模型类型。即要进行平稳性和纯随机性检验。主要是计算求出该时间序列的样本自相关函数(ACF)和偏自相关函数(PACF),并观察时间序列的自相关函数
26、ACF和偏自相关函数PACF的图形。三类平稳时间序列的自相关函数和偏自相关函数具有以下不同的统计特性如下:模型(序列)AR(p)MA(q)ARMA(p,q)自相关函数 拖尾 第q个后截尾 拖尾偏自相关函数 第p个后截尾 拖尾 拖尾通常,序列的自相关函数和偏自相关函数所呈现出的这些性质可帮助我们识别模型。但不是绝对的标准,也需结合研究者的经验还需结合一些准则函数,常用的AIC信息准则和BIC信息准则结合判断。模型选择之后,就是确定模型的阶数(p)和(q)。主要是计算自相关系数和偏自相关系数显著不为零的项(也就是峰值的个数),通过自相关图或偏自相关图更为直观看出,从而大致确定出模型的阶数。模型的选
27、择及阶数的确定开始时不一定非常明确,需要在AR、MA、ARMA基本模型中选择,并不断去试,选择各项检验指标中最优的。(3)模型进行初步识别后,需要估计出其中的参数。主要的参数估计方法有矩估计法、最小二乘估计法和极大似然估计法等,一般都由计算机软件完成。(4)模型的检验。包括模型的显著性,和模型参数的检验。模型的显著性主要是残差序列的白噪声检验,或者说独立性检验。如果残差序列的自相关函数不显著非零,可以认为残差序列是独立的,模型是显著的。可以通过LB统计量进行。如果不能拒绝原假设,说明拟合模型是有效的。实际中对于一个时间序列的建模过程,应根据时序图,尝试建立不同的模型,进行比较,不断尝试和改进,
28、最后从中选择最优或最满意的模型。(5)进行预测。一般可以由计算机完成。一般地,经济时间序列不满足平稳性,可以通过对数变换或差分变换来把时间序列平稳化。2.2.非平稳随机序列非平稳随机序列ARIMAARIMA模型模型序列都是非平稳的,呈现出明显的趋势性。这时需采用ARIMA模型进行分析。其基本分析步骤和方法:(1)对序列的平稳性进行识别。主要根据时序图、自相关函数和偏自相关函数图以一些检验等方法进行。对于非平稳序列,在选择模型之前要使其平稳化。办法之一就是差分差分。经过差分将序列变成平稳后,通常将模型称为单整自回归滑动平均模型,记为ARIMA(p,d,q)模型:“I”代表整合项或差分项;d表示差
29、分的阶数;p表示自回归(AR)的项数;q表示滑动平均(MA)的项数;对于包含季节成分的非平稳序列,需要将季节因素予以消除,采用季节差分。即用季节周期的长度作S为差分的滞后期的长度。如果季节差分后序列是平稳的,这时使用的模型表示为ARIMA(p,d,q)(P,D,Q)S。其中的(p,d,q)表示非季节部分;(P,D,Q)S表示季节部分,即季节自回归和季节移动平均部分,S为季节周期的长度,d和D的差分阶数就是d和D的取值。(2)识别模型的阶数。对时间序列所适合的ARMA模型进行初步识别,主要通过自相关函数和偏自相关函数呈现特征进行判断,如表现为截尾或拖尾。(3)需要估计出其中的参数。主要的参数估计
30、方法有矩估计法、最小二乘估计法和极大似然估计法等。(4)要诊断选择的模型是否正确。一种方法是:通过残差的自相关图,对残差序列独立性检验。应该是白噪声序列,残差序列的自相关图应该没有固定的模式。另一种方法采用是Box-Ljung统计量。它主要用来检验残差的自相关系数是否为0。(原假设是残差的自相关系数为0,即残差不存在自相关)。(5)通过检验后的模型才可以选择使用,进行预测。其基本过程主要通过计算机软件完成。见书例:沪深300行情中的市盈率分析过程8.4.2 8.4.2 应注意的问题应注意的问题对实际的经济时间序列分析,应根据研究的经济现象的发展变化,相关的理论,结合图形及其它一些检验指标等综合进行研判,尝试多建立不同的模型,比较不同模型的检验指标,最终判断选择适合的模型,并根据选择的模型进行预测。时间序列预测模型的建立是一个不断尝试和选择的过程实际中都可以借助计算机来完成。预测时还要遵守预测的一些原则,预测的未来与现象发展变化规律相一致。也必须与定性分析相结合才可能做到准确、科学、可靠。还必须考虑外部环境诸多动态因素的变化和影响。