1、应用时间序列,第一章 导论,第一节 关于时间序列分析,一、什么是时间序列 最常见的数据有两类,一类是截面数据,即就某一数量指标在同一时点上对不同个体的观察数据,另一类就是时间序列数据。所谓时间序列数据,是指对反映社会、经济、自然等现象的某一数量指标进行时间上的观察所得到的数据,而时间序列就是将这些观测数据按照时间的先后顺序排列起来所形成序列。,表1 中国1979-2009年国内生产总值GDP(单位:亿元)年度时间序列表,表1.2 上海股票市场综合指数周收盘时间序列表,时间序列的特点,1时间序列中数据的位置与时间有关 2时间序列是对相关指标变量在不同时间进行观察所得到的结果。 3时间序列中的数据
2、可以是一个时期内的数据也可能是一个时点上的数据。 4时间序列通常存在前后时间上的相依性,时间序列的分类,1按所研究对象的多少,有一元时间序列和多元时间序列。 2按观察时间的连续与否可将时间序列分为离散时间序列和连续时间序列。 3按时间序列的统计特性分,有平稳时间序列和非平稳时间序列两类。,二、时间序列分析的产生与发展,古埃及人就根据尼罗河泛滥的历史数据,通过绘图观测和数据比较寻找洪灾的规律 19世纪中后叶,德国天文学家施瓦贝(S.H.Schwabe)就采用描述性时间序列分析方法发现了太阳黑子的活动具有11年左右的周期 20世纪20年代英国统计学家尤尔引进了自回归和序列相关等重要概念,提出了用线
3、性自回归方程 。英国科学家沃克将序列相关分析方法运用于研究气象领域的厄尔尼诺-南半球摆动(ENSO)现象,并在Yule分析方法的基础上研究了衰减正弦的时间序列,得出了著名的Yule-Walker方程,奠定了时间序列分析的基础。 20世纪60年代,时间序列分析的理论和应用不断发展。1970年,统计学家G.E.P.Box和G.M.Jenkins在梳理、发展已有研究成果的基础上,联合出版了时间序列分析:预测和控制一书 。 20世纪70年代以后,时间序列分析的发展朝两个方向推进,一是为了分析两个或几个平稳时间序列之间的相互关系而建立起向量自回归(VAR)建模方法;二是为了分析非平稳时间序列而建立起自回
4、归条件异方差(ARCH)模型、协整(Cointegration)与误差校正(ECM)模型。,三、时间序列分析与经济预测,对经济现象进行预测的依据 一是经济系统结构的连贯性。经济系统内经济变量间存在结构关系,而且这种结构关系在短期内是相对稳定的,即存在结构的连贯性。 另一种连贯性是经济变量变化在时间上的贯性。 上述两点是经济预测中的主要依据。前者是依据因果关系进行预测,这主要属于计量经济分析的范畴;后者则属于时间序列分析的范畴。,四、时间序列分析与计量经济学的关系,在建模思想方面,计量经济学是“理论驱动型”的,而时间序列分析是“数据驱动型”的。 在使用样本数据方面,计量经济分析既可以使用截面数据
5、又可以使用时间序列数据,而时间序列分析面对的数据只能是时间序列数据。 在研究经济现象方面,经典的计量经济方法主要研究多变量之间的关系,而经典的时间序列分析方法是研究单变量自身动态规律 。,第二节 时间序列分析的一些基本概念,一、随机过程 定义:若对于每一特定的t(tT,T为一参数指标集),Yt为一随机变量,则称这一族随机变量Yt为一个随机过程。 参数指标集T可以是离散集,也可以是连续集。若T为一连续集,则Yt为一连续型随机过程。若T为离散集合,如T(0,1,2,)或T(,-2,-1,0,1,2,),则Yt为离散型随机过程,也称为随机序列。由于参数指标集T通常为时间,所以我们一般将具有离散型时间
6、指标集的随机序列称为时间序列。也就是说,时间序列是一类比较特殊的随机过程。,时间序列是一类特殊的随机过程,因此要认识时间序列的统计特性,也需要取得时间序列的“样本”。在经济分析中常用的时间序列数据都是经济变量随机序列的一个实现(或样本路径)。,二、随机过程的分布及其特征,3. 自协方差函数,4. 自相关函数(ACF),5. 偏自相关函数(PACF),三、几种重要的随机过程,1. 白噪声过程 2. 正态过程 若随机过程Yt的有限维分布都是正态分布,则称Yt为正态过程,有时也称为高斯过程。,3. 独立增量过程,设Yt为随机过程,若对任意n及tiT, i=1,2,n, t1t2t2tn,随机变量 相
7、互独立,则称Yt为独立增量过程。 设Yt为随机过程(t0),若Yt满足如下条件: Y0=0, Yt为独立增量过程, 对任意0st,Yt-Ys服从正态分布. 则称Yt为维纳过程(也称为布朗运动过程)。,4.维纳过程,四、随机过程的平稳性,严平稳:,如果对于时间t的任意n个值,和任意实数,,随机过程,的n维分布满足关系式:,则称为严平稳过程。,严平稳时序在实际观测中很难验证,但是它有一个很好的性质在实际工作中十分有用,这就是遍历性,或称各态历经性。,宽平稳:若随机过程的均值(一阶矩)和协方差存在,且满足,则称为宽平稳随机过程。,第三节 时间序列的主要特征,一、时间序列的相关性 变量的相关性特征有两
8、类,一类是不同变量之间的相关即静态相关;另外一类是同一变量在不同时点上的相关即动态相关。 在时间序列分析中,我们要分析序列的动态相关。因为随机时间序列是一类随机过程,大多数时间序列存在着前后依存的关系,即自相关性。时间序列的相关性可以通过自相关函数来加以反映 。,二、时间序列的平稳与非平稳性,平稳与非平稳是时间序列分析中的一个非常重要的概念。经典的时间序列模型主要针对平稳时间序列,并建立起一套识别、估计和检验方法。但是现实的经济金融活动中,有很大一部分间序列具有非平稳性,这样就不能用经典的时间序列建模方法进行分析,需要采用其他分析方法。因此,在时间序列分析,区分序列的平稳与非平稳,如何对非平稳
9、时间序列建模就成为分析问题的重要任务。,三、时间序列的波动聚集性,第四节 时间序列分析的基本步骤,应用,第五节 时间序列分析软件,目前有很多统计或计量经济软件可用于时间序列分析,例如Eviews、SAS、S-plus、Matlab、Gauss、R、SPSS等。不同的软件其侧重点和特点是不同的,对于经济管理类学生,我们推荐使用Eviews、SAS和R。在本书中我们主要使用Eviews软件,同时在部分例子中也给出R软件的程序 。,27,第二章 平稳时间序列模型及其特征,在本章,我们介绍平稳时间序列的三种主要类型的模型,AR模型、MA模型、ARMA模型,这三种模型都是线性模型,它们能用有限的参数刻画
10、时间序列的动态性。尽管线性关系的假定在解决实际问题时是一个比较苛刻的条件,但无疑它是理论研究的基础。这三种模型是最基本的时间序列模型之一,对这三种模型性质的研究有助于研究更为复杂的时间序列模型。,28,第一节 模型类型及其表示,一、预备知识,29,1.差分运算,一阶差分(相距一期的两个序列值之间的减法运算称为1阶差分运算) 阶差p分 步差k分,对1阶差分后序列再进行一次1阶差分运算称为2阶差分2xt=xt-xt-1 依此类推,对p-1阶差分后序列再进行一次1阶差分运算称为p阶差分,30,2.滞后算子,滞后算子类似于一个时间指针,当前序列值乘以一个滞后算子,就相当于把当前序列值的时间向过去拨了一
11、个时刻 记B为滞后算子,有,31,滞后算子的性质,,其中,32,3.线性差分方程,线性差分方程 齐次线性差分方程,33,齐次线性差分方程的解,特征方程 特征方程的根称为特征根,记作 齐次线性差分方程的通解 不相等实数根场合 有相等实根场合 复根场合,34,35,AR(p)模型 : MA(q)模型: ARMA(p,q)模型:,36,二、自回归模型,一阶自回归模型AR(1),37,38,AR(1)模型的特例随机游动,39,随机游动模型有以下特征: 1)模型有非常强的一期记忆性。 2)系统的一步超前预测 。 3)与AR(1)模型类似,随机游动模型可以写成 ,可以看出噪声对yt的影响并不随着时间的推移
12、而减弱。,40,一般自回归模型,模型的特点有:,41,三、 移动平均模型,一阶滑动平均模型MA(1) 用MA(1)模型作预测,那么得到的预测值仅仅取决于上期系统的随机扰动项。,42,q阶滑动平均模型MA(q),有限个白噪声的和总是平稳的,因此通常MA(q)模型是平稳的。 如果对该模型作向前一步预测,则有,43,四、自回归移动平均模型,44,45,当q=0时,ARMA(p,0)模型就是AR(p)模型,当p=0时,ARMA(0,q)模型就是MA(q)模型,因此自回归模型和移动平均模型都是ARMA(p,q)模型的特例 。,46,第二节 格林函数和平稳性,一、ARMA(p,q)的格林函数 (一)ARM
13、A(p,0)系统的格林函数 若一个系统被表示为yt= ,则系数 函数称为格林函数或记忆函数。,47,MA(q)过程格林函数为,AR(P),AR(P)过程格林函数为,48,ARMA(p,q)的格林函数,49,例2 求模型 的格林函数,对比等式左右两边有 因此模型的格林函数,50,51,二、系统的平稳性,(一)AR(p)系统的平稳性条件,平稳域:,52,例3 求一阶自回归模型 的平稳域,解:,即平稳域为:,53,例4 求二阶自回归模型 的平稳域,解: 特征方程 需满足: 即:,54,(二) ARMA(p,q)系统的平稳性条件,ARMA模型平稳性完全取决于模型中的AR部分,如果模型中的AR部分是平稳
14、的,则ARMA模型是平稳的。,55,第三节 逆函数和可逆性,一、MA(q)模型的可逆域 逆函数形式: I(B)称为逆函数,56,57,例5 判断MA(2) 模型 是否可逆,解:特征方程, 可逆域为: 满足可逆条件,因此可逆。,58,二、MA(q)模型的逆函数,59,例6 求模型 的逆函数,解:,60,三、ARMA(p,q)的可逆域与逆函数,61,第四节 平稳时间序列的统计特征,一、自相关函数,62,63,64,65,(二) MA(q)的自相关函数,66,67,二、偏相关函数,68,69,Yule-Wolker方程:,70,偏相关函数:,71,本章小结,1AR模型、MA模型和ARMA模型是三种基
15、本的线性时间序列模型,能够用有限的参数刻画系统的动态性。这三种模型属于随机差分方程,因此特征方程对研究三类模型的统计特性具有重要意义。 2AR模型的逆函数表示是指用无限阶的MA模型来表示有限阶的AR模型,格林函数就是无限阶MA模型的系数。AR模型平稳性条件是 的根在单位圆外或者特征方程的根在单位内,满足这个范围的自回归系数区域构成平稳域。 3将有限阶MA模型表示为无限阶AR模型,就得到MA模型的逆转形式。MA模型具有可逆性的条件是 的根在单位圆外或者特征方程的根在单位内。MA模型的格林函数与AR模型的格林函数在形式上是一致的。 4ARMA模型的平稳性取决于其中AR部分是否平稳,ARMA模型的可
16、逆性取决于模型中的MA部分是否可逆。 5AR模型的自相关函数拖尾,偏自相关函数截尾,MA模型的自相关函数截尾,偏自相关函数拖尾,ARMA(p,q)的自相关函数和偏自相关函数都是拖尾的。,72,第三章 平稳时间序列模型的建立,本章首先介绍利用时间序列的样本统计特征识别时间序列模型,然后分别介绍模型定阶、模型估计和模型检验的多种方法,对Box-Jenkins建模方法和Pandit-Wu建模方法归纳总结,最后给出实际案例。,73,第一节 模型识别与定阶,一、 自相关函数和偏自相关函数的估计 (一)自协方差函数和自相关函数的估计,74,75,1) 是平稳时间序列自协方差的无偏估计量; 则是平稳时间序列
17、自协方差的渐进无偏估计量。 2) 通常是正定的。,76,(二)偏自相关函数的估计,77,二、 模型的初步识别,(一) 截尾性的判断 若yt是一个真实MA(q)模型 ,,78,例1,某资产组合过去100个交易日收益率情况,79,80,81,(二)偏相关系数截尾性的判断 若yt是一个AR(p)过程 ,,82,83,(三) ARMA(p,q)模型识别,84,三、模型的定阶,1、残差的方差,85,残差方差小,相应的阶数合理。,86,87,88,2、ACF和PACF定阶法,89,90,91,92,两模型几乎没有差异。,93,(四)模型定阶的最佳准则函数法,1、基本思想:确定一个函数,该函数既要考虑用某一
18、模型拟合原始数据的接近程度,同时又考虑模型中所含参数的个数。当该函数取最小值时,就是最合适的阶数。 衡量模型拟合数据的接近程度的指标是残差方差。 2、最佳准则函数包括AIC、BIC等准则。,94,AIC准则是1973年由赤池(Akaike)提出,此准则是对FPE准则(用来判别AR模型的阶数是否合适)的推广,用来识别ARMA模型的阶数。该准则既适合于AR,也适合于ARMA模型。,95,96,97,98,第二节 模型参数的估计,一、模型参数的矩方法估计 二、最小二乘估计 三、极大似然估计,99,一、模型参数的矩估计 (一)AR(p)模型的矩估计,100,101,于是可得如下的Yule-Walk方程
19、:,102,于是可得到 的矩估计:,103,例1,AR(1)模型的矩估计,104,例2,AR(2)模型参数的矩估计,105,(三)MA(q)模型参数的矩估计 第四章已经推导出MA(q)的自协方差结果,将 代替 , 代替 (i=1,2q) , 得如下方程组:,上式是含有q+1个参数的非线性方程组,解此方程组,即 可以求出各参数: 方程组可以直接求解,也可以用迭代法求解。,106,例3. MA(1)模型参数的矩估计,107,108,例4. 求AR(2)模型系数的矩估计,AR(2)模型 Yule-Walker方程 矩估计,109,优点 估计思想简单直观 不需要假设总体分布 计算量小(低阶模型场合)
20、缺点 信息浪费严重 只用到了p+q个样本自相关系数信息,其他信息都被忽略 估计精度差 通常矩估计方法被用作极大似然估计和最小二乘估计迭代计算的初始值,110,二、最小二乘估计,111,112,对于ARMA模型或MA模型参数的估计,一般采用非线性最小二乘法,或极大似然估计法。,113,模型参数的极大似然估计,114,四、模型参数的最小平方和估计,115,第三节 模型的适应性检验,一、模型的适应性检验 二、模型的平稳性和可逆性分析,116,一、模型的适应性检验,若建立的模型恰当的描绘了已给数据数据序列的ARMA模型,那么模型拟合的残差应是白噪声序列,即均值为零、常数方差、彼此不相关。 ARMA模型
21、的适应性检验,主要就是检验残差是否为白噪声序列。,117,散点图法 估计相关系数法 F检验法 卡方检验法,118,F检验法,119,如果 ,则拒绝原假设,即认为ARMA(p,q)与ARMA(p-1,q-1)模型的拟合精度有显著性差异,降阶是不恰当的。反之,如果 ,则两个模型的拟合精度没有显著性差异,降阶是合理的。,120,卡方检验法 设 为估计出的残差序列,其样本自相关函数为:,通常用Q统计量检验原假设是否为白噪声。,121,122,例5 对某商场100天的销售金额取对数后进行一阶差分得到每日销售额增长率序列,123,124,125,126,127,128,从信息准则可见,AR(1)模型的信息
22、准则最小,因此初步认定是AR(1)模型。接下来对模型的残差是否存在相关性进行检验。,129,130,131,本章小结,1样本自相关和偏自相关函数是识别平稳时间序列模型的重要方法。由于样本自相关和偏自相关函数是随机变量,因此判断其是否截尾的方法是通过构造统计量进行统计检验。如果滞后若干期的样本自相关函数不显著,而偏自相关函数是统计显著异于零的,则可能是MA模型,反之则可能是AR模型,若二者均统计显著异于零,则可能是ARMA模型。 2模型阶数越高,往往残差方差越小,但待估参数增加,有效样本量随之也减小,因此在模型定阶时需要遵循“约减”原则,即当残差方差变化不大时,尽量选择阶数低的模型。此外,AIC
23、,BIC等信息准则考虑了模型残差与模型阶数之间的权衡关系,是重要的模型定阶准则。 3对于AR模型,参数估计比较简单,可以利用线性最小二乘方法。而MA和ARMA模型的参数估计相对困难,需要用到非线性最小二乘方法。对于ARMA模型,最小平方和估计和极大似然估计是两种重要的估计方法,从极大似然估计出发可以得到最小平方和估计。 4模型检验是建立时间序列模型的重要步骤。除了传统的系数显著性检验之外,时间序列模型还需要对参数是否冗余、残差是否还存在相关性进行检验。只有通过模型检验之后,时间序列模型才能最后确定。常用的参数冗余检验有F检验,残差相关性检验有卡方检验。 5Box-Jenkins方法是以序列的自
24、相关函数和偏自相关函数的统计特性为依据,找出序列可能适应的模型,然后对模型进行估计。对于非平稳时间序列往往通过差分使其平稳后建模。Pandit-Wu建模方法是从ARMA(n,n-1)模型出发,从n=1开始,逐步建立为ARMA(2n,2n-1),通过F检验确定ARMA模型的阶数。,132,第四章 平稳时间序列模型预测,时间序列分析预测的重要性 时间序列分析的一个重要的目的是预测其未来值,就是根据以往积累的数据进行分析,先确定其时序模型的形式,然后对未来可能出现的结果进行预测。 预测是计量经济分析的重要部分,对某些人来说也许是最重要的部分。 概括地说,在计量经济学中依据时间序列数据进行经济预测的方
25、法有四种:(1)单一方程回归模型;(2)联立方程回归模型;(3)自回归移动平均模型;(4)向量自回归模型。,133,第一节 预测准则,称 为 的预测值或 的h步预测值 怎样选取预测函数 呢?直观的想法是所选取的预测函数应能够使预测误差 尽可能的小。这就需要确定一种准则,使得依据这种准则能衡量采用某种预测函数所得的预测误差比采用别的预测函数所得的预测误差小。,134,一、 从几何角度提出预测问题,对在t+h的取值进行预测,我们所能利用的就是yt在t和以前时刻的取值 所提供的信息,也就是说 是 的函数,我们知道最简单的函数是的线性函数,设为 现在的问题是如何求出系数 使得 与 最接近。,135,图
26、4.1 在平面M上的投影 从几何图形来看,离yt+h最近的是向量yt+h在平面M上的投影。,136,二、求解正交投影,基于直到时刻t的信息集 对变量 取值的预测记为 ,为获得此预测必需指明相应的损失函数(loss function)。一个十分方便的结果是选取平方损失函数,即选取 ,使其均方误差达到最小。 容易知道, 关于 的条件期望 是 关于 的最小均方误差预测。 这种预测具有许多优良性质,但其计算比较复杂。在许多的实际应用问题,我们更感兴趣于在的线性函数类中寻求的预测。,137,例如 时,可选取: 假定我们已求得 之值,使得 预测误差 与 无关 即有 成立 则称(4.1)式为yt+1关于 的
27、线性投影。并记为,138,三、最小均方误差预测,设随机序列适合一个ARMA模型,即 在已知 的条件下,很自然会考虑到 的线性函数 这是一种比较容易处理而在使用中最有广泛意义的情形。作为一个好的预测值,应该满足预测的误差越小越好,于是问题转化为求 使 与 之间的误差最小。使预报的均方误差最小的称为线性最小均方预测。,139,综上可得,yt+h的线性最小均方误差预测为 称(4.5)式为线性最小均方误差预测的传递函数形式。我们知道这是可以实现的,因为一个系统的参数完全可以由其格林函数确定。 预测的残差为 预测误差方差为,140,第二节 ARMA模型预测,前面我们对最小均方预测的基本原理进行了讨论,所
28、有的结论都是在平稳的条件下得到的。下面我们求ARMA模型的最小均方预测。 一、AR(p)模型的预测 考虑一个AR(2)模型 其向前一步的预测为 一步预测的误差方差为,141,向前二步的预测为 注意到 故二步的预测误差的方差为,142,更一般的情形,遵从AR(p)的序列满足随机差分方程 由差分方程很容易得到AR(p)的最小均方误差预测公式为 再根据(4.9)式,AR(p)模型的递推预报公式为:,143,. 由上式可以看出,AR(p)模型的最小均方预测公式比较简单,只要知道 这p个历史值便可以得到任意步长的平稳线性最小均方预测。正是因为AR模型的建模与预测的简单性,所以它成为预测问题中应用得最为广
29、泛的时间序列模型。,144,二、MA(q)模型的最小均方预测,对于MA(q)模型 我们可以得到预测值的递推公式为 分析预测公式(4.11),可以看出MA模型的最佳预测具有以下两个特点:,(4.11),145,(1)MA(q)模型只能对未来进行q步预测,当hq时,预测值为零(时间序列均值为零);因此当模型阶数较低时,MA模型只能进行短期预测; (2)MA模型预测中使用的 ,其数据需要 的全部历史数据迭代计算,并需要设 的取值,由此可知这种处理比较繁琐,有一定主观性,故不便应用。,146,设有MA(2)模型 则有一步预测 因而 又由于 ,因此预测误差的方差等于 。 对于前两步预测 易知 预测误差为
30、,预测误差的方差为,147,类似可得三步预测的误差为 预测误差的方差为 与前三步预测相似,模型中已没有记忆对前四步预测有帮助。这时的预测值已经是这个系统的均值。即有 其预测误差的方差为 更一般的情况,对于一个MA(q)模型 h步预测公式为,148,h步预测残差的方差为 三、 ARMA(p,q)预测 对于一个ARMA模型, 仿照AR和MA模型同样的步骤可以推得关于ARMA(p,q)模型的预测公式, ,149, 分析上面的公式可知,ARMA(p,q)模型的最佳计算具有以下特点: (1)当 时,预测计算公式中包含了 , 这 q 个值,与MA模型的预测计算一 样,需要由 迭代计算出 ,因此ARMA 模
31、型的预测计算也非常繁琐; (2) 当hq时,预测计算中不包含MA部分,可由 进行递推计算;,150,(3) 当hq时,如果把 看成h的函数(记为 ), 则预测公式是一个关于 的齐次差分方程;因此,如同AR模型的最佳预测一样, 也可以 由齐次差分方程所确定。 根据上面的分析可知,ARMA模型的最佳预测计算远较AR模型复杂,同时其建模过程也是繁琐的。,151,第三节 案例分析,【例4.1】基于批发价格指数的美国通货膨胀研究 批发价格指数(Wholesale Price Index,简记为WPI)是通货膨胀测定指标的一种,它是根据大宗物资批发价格的加权平均价格编制而得的物价指数,反应不同时期生产资料
32、和消费品批发价格的变动趋势与幅度的相对数。包括在内的产品有原料、中间产品、最终产品与进出口品,但不包括各类劳务。批发价格是在商品进入零售,形成零售价格之前,有中间商或批发企业所订,其水平决定于出厂价格或收购价格,对零售价格有决定性影响。,152,所以有经济学家认为批发价格指数比消费物价指数具有更广泛的物价变动代表性,为此我们搜集了1960年第1季度至1990第4季度美国的WPI指数进行研究,数据来源于美国劳工统计局网站http:/stats.bls.gov/。 从1960年第1季度至1990第4季度的WPI共有124个数据,使用EViews命令 Plot WPI 可得其水平序列图如下,153,
33、图4.2 美国批发价格指数,154,在EViews中双击WPI这个序列,点击ViewDescriptive StatisticsHistogram and Stats, 则可以得到它基本描述统计特征图4.3。,155,从图4.3可以得知,WPI的平均值是62.7742,最大值是116.2000,最小值是30.5000,标准差是30.2436,并且这是一个服从双峰分布的变量。 为了判断时间序列模型的类型,我们要计算出自相关函数与偏相关函数值。在EViews中双击WPI这个序列,点击ViewCorrelogram,在弹出的对话框中选择Level,然后点击确定,可得WPI的自相关函数与偏相关函数图4
34、.4,156,图4.4 WPI的自相关函数与偏相关函数图 虽然偏相关函数是截尾的,但自相关函数衰减很慢(几乎不减少,所以不是拖尾的),因此WPI是一个非平稳序列。,157,如果非要认为自相关函数是拖尾的,则照第三章的标准,模型应该是AR(1)的,使用命令 LS WPI c AR(1)可得输出输出结果表4.1,158,从表4.1的最后一行的输出结果“Estimated AR process is nonstationary”,可看出这个AR(1)过程是非平稳的。所以下面我们依照博克斯詹金斯方法的思路:原始序列不平稳,但其差分序列可能是平稳的。所以下面我们对WPI的差分序列建模。 使用命令 gen
35、r Dwpi=D(WPI),生成WPI的差分序列。然后用命令Plot Dwpi 画出Dwpi的差分图形4.5。双击Dwpi这个序列,点击ViewCorrelogram,在弹出的对话框中选择Level,然后点击确定,可得WPI的自相关函数与偏相关函数图4.6,159,图4.5 WPI的差分序列图,160,从图4.5看出序列Dwpi是一个无趋势的序列;从图4.6可以看出序列Dwpi偏相关函数3阶以后是截尾的,但自相关函数是拖尾的。因此序列Dwpi是一个平稳序列,适合建立一个AR(3)的模型,使用命令 LS Dwpi c AR(1) AR(2) AR(3)可得输出输出结果表4.2,图4.6Dwpi的
36、自相关函数与偏相关函数图,161,表4.2 AR(3)模型的输出结果,162,从表4.2可以看出AR(2)的系数对应的 p值较大,所以统计上不显著。因此剔除AR(2)这一项以后,再对模型进行拟合可得表4.3,163,从表4.3可以看出,模型的三个参数都通过了t检验,所以这些变量选用是恰当的;且F统计量对应的p值较小,所以模型的整体拟合效果较好。在输出结果视图下,点击ViewResiduals Tests Correlogram-Q-Statistic,可得模型残差序列的自相关函数与偏相关函数图4.7,164,因为Q(3)Q(10)对应的p值都比0.05大,可以认为模型的残差序列为白噪声,这也说
37、明模型的拟合效果比较好。所以最终模型为 即 由于变量差分后损失了很多信息,所以差分序列的模型的R2不可能很高。还需要注意的是对输出结果解释,根据Wold分解定理EViews的输出格式表示的是:对序列(Dwpit-0.8280)建立剔除AR(2)这一项后的AR(3)模型,而不是对Dwpit建立AR(3)模型;,165,输出结果中的0.8280是Dwpit的均值,而不漂移项,它的经济学含义是41年间的WPI的季度平均净增值是0.8280。 上述案例分析中描述统计量、自相关函数、偏相关函数和ARMA模型的估计也可以用R软件来实现,下面我们给出相应的R程序。其中的中文是对下面各语句的文字说明,在运行中
38、可以去掉。 (读取数据) WPI.dat=read.table(“c:/WPI.txt“,header=T) attach(WPI.dat) WPI,166,(画图) plot(WPI,type=“l“) #画线图 hist(WPI) #画直方图 acf(WPI, type = “correlation“) #画自相关函数图 acf(WPI, type =“partial“) #画偏相关函数图 plot(diff(WPI),type=“l“) #画差分序列Dwpi线图 hist(diff(WPI) #画差分序列Dwpi直方图 acf(diff(WPI), type = “correlation
39、) #画差分序列 Dwpi自相关函数图 acf(diff(WPI), type =“partial“) #画差分序列Dwpi 偏相关函数图,167,(描述统计量) summary(WPI) #给出最小值、第一分位数、中位数、平均值、第三分位数、最大值 var(WPI) #给出方差 sd(WPI) #给出标准差 (估计模型) arima(WPI, order = c(1, 0, 0), method = “CSS”) #对WPI拟合AR(1)模型 fit=arima(diff(WPI), order = c(3, 0, 0), method = “CSS“) #对差分序列Dwpi拟合AR(3)模
40、型,168,resid=fit$residuals #给出AR(3)模型的残差 Box.test(resid,lag =3, type = “Ljung-Box”) #给出LjungBox检验统计量,检验残差是否还有自相关性 本章小结 1. 预测是计量经济分析的重要部分,对某些人来说也许是最重要的部分。预测是经济与管理决策中最普遍且重要的一环,唯有把握未来,才能做出正确的决策。 2. 博克斯詹金斯方法(Box-Jenkins)或者ARMA方法。这种方法的要点是:在“数据自己说话”的哲理指引下,着重于分析经济时间序列本身的概,169,率或随机性质,而不在意于构造单一方程抑或联立方程组模型。所以此
41、方法和传统的单一方程和联立方程模型是相对立的。 3.对于一个时间序列的预测,基本的博克斯詹金斯策略如下:(1)首先检验序列的平稳性,这可以通过自相关函数(ACF)与偏相关函数(PACF)或者通过以后学习的单位根检验来实现; (2)如果时间序列不平稳,将它差分一次或多次以获得平稳性;(3)然后计算此时间序列的ACF和PACF ,以判断序列是纯自回归还是纯移动平均的,或这二者的一种混合体; (4)然后估计此尝试模型;,170,(5)分析尝试模型的残差,看它是不是白噪声;如果是,则尝试模型也许是一个好的估计模型;如果不是,则要从头做起,因此博克斯詹金斯方法是一个反复的过程;(6)最后选定的模型便可用
42、于预测。 4. 最小均方误差准则是一种常用的统计准则。在此准则下,如果我们选择线性预测函数,则线性预测函数 事实上 是在空间上的正交投影。 5.AR(p)模型的最小均方预测公式比较简单,只要知道 这p个历史值便可以得到任意步长的平稳线性最小均方预测。,171,正是因为AR模型的建模与预测的简单性,它成为预测问题中应用得最为广泛的时间序列模型。 6. MA(q)模型只能对未来进行q步预测,当hq 时,预测值为零(时间序列均值为零);因此当模型阶数较低时,MA模型只能进行短期预测。MA(q)模型预测中使用的 , 其数据需要的全部历史数据yt迭代计算,并需要设定 的取值,由此可知这种处理比较繁琐,有
43、一定主观性,故不便应用。,172,当 时,ARMA(p,q)模型预测计算公式中包含了 这q个值,与MA模型的预测计算一样,需要由yt迭代计算出 ,因此ARMA模型的预测计算也非常繁琐。 当hq时,ARMA(p,q)模型预测计算中不包含MA部分,可由 ,进行递推计算。,第五章 传递函数模型 与干预变量分析,174,主要内容和要求,本章讨论多元的时间建模的相关问题。主要内容和要求: 1.定义传递函数模型的形式; 2.研究传递函数模型和脉冲响应函数的基本特征和性质,以及传递函数模型的稳定性; 3.介绍传递函数模型的识别、估计和诊断校验。 4.干预变量模型识别、估计和诊断校验。 要求学生掌握有关传递函
44、数模型的理论、脉冲响应函数与互相关函数的关系。传递函数建模过程和干预变量模型建模过程。,175,在前几章,我们讨论了单变量时间序列分析的建模、估计和诊断有关的问题。本章与前面几章不同的是,所涉及的变量在两个以上。实际上在很多场合,时间序列当期的表现,不仅受自己过去的影响,还与另一个或者多个时间序列相关联。例如销售变量可能与广告支出有关,每天用电支出可能与一定的天气变量,比如室外最高气温和相对湿度的序列有关。传递函数模型是分析一个输出变量与一个或多个输入变量有关的动态模型的一种方法。,第一节 传递函数模型的基本概念,176,一、模型的形式,设表示某种商品在一段时间的销售额Yt,由于经济时间序列通
45、常的有记忆性,可以用一个ARMA模型来描述其变化规律,假定其变化规律的表达式为,如果我们考虑广告费,广告费对销售额的影响不仅有即期影响,还具有一定的滞后效应,假定其滞后的影响是一期,那么在式中就应加入广告费的滞后一期值和即期值。,177,如果广告费的滞后一期值对销售额的影响效用是0.60,即期影响是0.55,则这个简单的输出和输入关系为,如果用后移算子B,模型的等价形式为,178,模型的基本原理是输入Xt通过传递函数算子 传递到输出Yt上,而随机扰动项通过算子 叠加到输出上,最终输出Yt。,179,一个输入变量的单输出的线性系统的形成机理可以由图5-1表示。,图5-1 动态系统图示,180,传
46、递函数模型的一般形式,其中(B)、(B)、(B)和(B)是后移算子的多项式,阶数分别为s、r、q及p。,(B)和(B)描述Xt 对Yt影响。 (B)和(B)描述随机干扰项对Yt影响。,b称为延迟参数,即Xt 的b期滞后值才开始对Yt产生影响Xt 。 at为随机干扰项。,为传递函数。,181,其中,182,传递函数模型形成机理,图5.2 一般传递函数模型形成过程,183,二、脉冲相应函数特征,传递函数是由B的多项式构成,即 所以,确定了其传递函数部分三个参数s、r和b,传递函数基本情况就了解了。传递函数的特征为传递函数的三个参数的的判定提供了依据。由于传递函数V(B)是有理函数,则V(B)可以表示为B的无穷阶的多项式。,184,传递函数的多项式形式为,V(B)的系数vj(j=1,2,)称为脉冲响应函数。 说明Xt的滞后变量是如何影响Yt。有,可以用待定系数法求V(B)的系数vj (j=1,