1、一 协整理论1 协整理论的产生背景2 协整的定义及应用步骤3 协整理论在国内外的应用4 协整理论当前研究和应用的热点问题1 协整理论的产生背景 Engle and Granger在1978年首先提出协整的概念,并将经济变量之间存在的长期稳定关系成为“协整关系”。 克莱夫格兰杰1934年生于英国威尔士的斯旺西。1955年获得诺丁汉大学颁发的首批经济学与数学联合学位,随后留校担任数学系统计学教师。1959年获诺丁汉大学统计学博士学位。1974年移居美国后,格兰杰在加州大学圣迭戈分校经济学院任教,是该学院经济计量学研究的开创者,现为该校的荣誉退休教授。格兰杰曾担任美国西部经济学联合会主席,并于200
2、2年当选为美国经济学联合会杰出资深会员。 格兰杰教授的研究兴趣主要集中在统计和经济计量学(尤其是时间序列分析)、预测、金融、人口统计学以及方法论等方面,其专著和论文几乎涵盖近40年来时间序列分析方面的所有重大进展。 格兰杰在协整理论、虚假回归、因果关系和谱分析等许多领域的研究工作都是开拓性的,协整概念就是由他在20世纪70年代首先提出来的。 在此之前很长的一段时间里,计量经济学家们在处理时间序列时,不得不采用平稳数据的分析方法,如最小二乘法、自回归移动平均法(ARMA)等。 协整理论从分析时间序列的非平稳性着手,探求两个或多个非平稳经济变量间蕴涵的长期稳定关系,从而为协整变量之间建立误差修正模
3、型奠定了理论基础。 任何时间序列数据都可以视为某个随机过程的一个(特殊)实现,这一方法允许研究者使用统计推断来构建和检验回归方程,导出经济变量之间的关系。传统的时间序列分析大量考察的是所谓平稳随机过程,即假定时间序列是平稳的,这保证了普通最小二乘法得到的估计量具有一致性和渐近正态性。 (注:如果一个随机过程的均值和方差在时间过程中都是常数,并且在任何两期之间的协方差值仅依赖于上述两期间的距离或滞后,不依赖于计算这一协方差的实际时间,就称它为平稳时间序列。在这个意义上,如果一个时间序列不是平稳的,就称它为非平稳时间序列。) 然而在实际中,大多数宏观经济和金融时间序列数据(比如国内生产总值、价格、
4、消费等)是非平稳性,(因为这些时间序列数据之间具有某种长期的均衡关系,但是短期内的变动又毫不相干 )它意味着经济变量并不具备回归到某个常数或某一线性趋势的显著倾向,因而假设这些时间序列数据由非平稳随机过程产生才比较恰当。 格兰杰和他的同事保尔纽博德(Cranger and Newbold 1974)证明,当经典的平稳随机过程理论和模型用于非平稳时间序列数据的分析时,往往会推断出毫不相关的变量在统计上却显著相关的结论,这一结论显然是不合理的。 这时,鉴于非平稳数据的特性,如何设计出能够排除短期波动干扰、揭示潜在长期关系的统计方法构成了对经济学家的巨大挑战。 长期以来,研究者常用的解决办法是对非平
5、稳序列数据进行差分,然后用差分项序列建模。但是,建立在差分基础上的计量模型往往丢失了数据中包含的长期信息,无法判断变量间的长期协方差变动情况。 格兰杰引入的协整理论能够把时间序列分析中短期与长期模型的优点结合起来,为非平稳时间序列的建模提供了较好的解决方法。在80年代发表的一系列重要论文中,格兰杰教授提出了单整阶数(degree of integration)概念,并证明若干非平稳时间序列(一阶单整)的特定线性组合可能呈现出平稳性,即它们之间存在“协整关系” 由此他归纳出著名的格兰杰表示定理(Granger Representation Theorem),证明用误差修正模型可以刻画非平稳协整变
6、量间的联合动态关系。 协整概念及其方法的提出对于用非平稳变量建立经济计量模型非常重要。当且仅当若干个非平稳变量具有协整关系时,由这些变量建立的回归模型才有意义,所以协整性检验也是区别真实回归和虚假回归(spurious regression)的有效方法。 在协整概念的基础上,1987年Engle 和 Granger建立了检验经济变量间存在协整关系的EG两步法理论以及检验向量的估计。 EG两步法可以得到一致的参数估计,主要适用于处理只存在一个协整向量的系统,特别适用于两变量的情形。此后,约翰森(Johansen)改进了协整关系的检验方法。 在与恩格尔及其他研究者的合作中,格兰杰对协整理论做了若干
7、拓展,研究了季节协整、门限协整和多重协整等问题,他还运用协整理论做了大量的实证研究。 1976年Dickey和Fuller建立了积分过程的检验方法DF检验,1979-1980年又对DF检验进行了拓展,提出了ADF检验。(前者只适用于一阶自回归过程AR(1) ,且不能保证回归模型中的 ut 为白噪声 ,而后者则适用于高阶自回归过程 AR(p) ,它是通过增加因变量 Yt 的滞后值来进行的。) 协整的作用在于正确的解释了经济现象和预测现象。2 协整的定义及应用步骤 GrangerGranger用一个简单的回归模型:用一个简单的回归模型: 其中,其中,YtYt是被解释变量,是被解释变量,XtXt是惟
8、一的外生变量,是惟一的外生变量, 是白噪声序列。同时,是白噪声序列。同时,GrangerGranger确立了变确立了变量的整合程度概念。在方程中,假定量的整合程度概念。在方程中,假定 Xt XtI(1)I(1),YtYtI(1)I(1),如果存在一个系数,如果存在一个系数,能够满足能够满足 I(0)I(0),那么变量,那么变量XtXt和和YtYt被称为是协整的。更一般地说,被称为是协整的。更一般地说,如果一组如果一组I I(1)(1)变量的线性组合是变量的线性组合是I(0)I(0),那么这些变量就,那么这些变量就是协整的。是协整的。01tttyaa xttyx 如果一组如果一组I(1)I(1)
9、变量的线性组合是变量的线性组合是I(0)I(0),那么这些变量就是协整的。那么这些变量就是协整的。= = 如果变量如果变量XtXt和和YtYt都不是都不是单位根平稳单位根平稳,同时它,同时它 们的线性组合具有们的线性组合具有单位根平稳性单位根平稳性,则定义,则定义XtXt和和YtYt是协整的。是协整的。 对协整的应用: 实际中对协整的检验有些困难,困难的主要原因是协整检验忽视了分量序列的尺度效应。然而协整的思想和金融研究是高度相关的。 协整理论应用的一般步骤:(1)单位根检验;(2)协整检验;(3)误差修正模型。 因此大部分有关协整的应用论文都是围绕着这三点展开:首先对几个时间变量进行非平稳性
10、的单位根检验(检验方法通常是ADF检验或PP检验),一旦确定了它们的单整阶数是相同的;那么接下来就对它们的协整关系进行检验(双变量通常用EG两步法,而多变量则用Johansen法);最后对具有协整关系的变量建立误差修正模型。 (1)单位根检验。对几个时间变量进行非平稳性的单位根检验,来确定它们的单整阶数是否相同 检验方法通常是ADFADF检验或检验或PP PP 检验检验(见文章(见文章比较比较DFDF、ADFADF和和PPPP检验)检验)时间序列单位根检验的方程为以下三种之一:不含常数项和时间趋势、仅含常数项、含常数项与时间趋势,以一阶自回归AR(1)过程表示AR(p)检验式中增加了 m个分部
11、滞后项 mi = 1iYt-i,分别有下列模型:(a) Yt =Yt - 1 + ut ;(b) Yt =+Yt - 1 + ut ;(c) Yt =+ vt +Yt - 1 + ut。其中,ut服从白噪声过程(均值为0 ,方差为常数)。对上式中的显著性检验 ,就是检验时间序列是否存在单位根的问题。根据检验式模型回归得到的临界值(为显著性水平),按照迪基 - 富勒用蒙特卡罗模拟方法得到了统计量的百分位数表判断序列是否是非平稳的(在一般的计量经济软件中,如 Eviews ,单位根检验均会给出临界值与几个常用显著性水平下的DF值或ADF值)。当(A)DF临界值时,认为时间序列服从单位根过程 ,即Y
12、t为非平稳序列;当(A)DF临界值时,认为具有显著性,即Yt为平稳系列。(2)协整检验。对协整关系进行检验 双变量通常用EG两步法 ,而多变量则用Johansen 法(见文章Johansen和Juselius协整检验应注意的几个问题) EG两步法的核心是对模型的残差进行单位根检验,确定残差的单整性,从而判断时间序列的协整关系。检验时间序列Yt,Xt 间的协整性,常用的做法是:第一步用OLS法估计协整回归方程Yt=+Xt+ut,得到残差序列为t = Yt -Xt,作为均衡误差的估计值。第二步,检验t的平稳性。若t为平稳的,即为I(0),则序列Yt,Xt具有协整性,反之,则不是协整的。 在这里 ,
13、所用统计量是EG和AEG统计量 ,其计算公式和检验方法与DF和ADF相同 ,由于临界值考虑到了对的估计 ,统计量的分布不同 ,不能用DF和ADF检验临界值 ,其临界值可从EG和AEG渐近临界值表中查到。(3)误差修正模型。最后对具有协整关系的变量建立误差修正模型。 如果非平稳变量之间存在着协整关系 ,那么这些变量之间就存在着长期均衡关系(围绕均值上下波动) ,但这种关系并不能反映经济变量间的短期动态 ,即短期而言它们可能是不均衡的。对此我们可以通过建立误差修正模型(ECM)将经济变量之间的关系表示成长期均衡关系与短期动态关系之和的形式 ,即当时间序列偏离了它们的均衡关系 ,就一定有外力(误差修
14、正过程)使它们回到均衡状态。 例如考虑两个汇率之间的关系,在短期内投资者对一种货币的偏爱可能会导致这种货币相对于其他货币升值。在其他时期 ,投资者可能会更关注另一种货币。在这两种情况下 ,货币将会偏离它们的长期均衡关系。但是经济力量会使它们恢复到长期均衡水平。 误差修正模型 设Yt与Zt之间具有CI(1,1)协整关系,其模型为: Tt =0 +1Zt +2Y(t-1)+3Z(t-1)+ut 进行变换为: Yt =0 +2Zt+(Y(t-1)-Z(t-1))+ut 其中, Yt=YtY(t1),Zt=Zt-Zt-1,=-(2+3)/1是长期参数。 2Zt 反映了短期动态关系 ,(Y(t1)Z(t
15、1)是误差修正项 ,反映了长期均衡关系 , =1 Z(t1),那么,前一期的 Y已超过了均衡水平,因为 0 ,误差修正项会把 Y拉回来 ,使它回到均衡水平;如果 Y(t1)0,b为整数。其中,被称为协整向量。 协整理论描述序列之间的线性均衡关系,这一线性关系可以通过协整向量来刻画,因此,这种协整关系又称作线性协整。TttZa Y 但是,在现实经济系统中,经济时间序列往往不是整数维的单整序列,而是分数维单整序列即d可以取分数在金融时间序列中是普遍存在的,它反映了金融市场的分形分形和非线性特性。同时,不同分量序列的分整阶数d往往是不相同的,分量序列之间的关系也不再是线性的,此时,线性协整理论不再适
16、用,解决这一问题的有效途径是非线性协整理论。非线性协整:对于向量时间序列 的分量序列称为非线性协整的,如果(1)Yit是依均值长记忆序列,i=1,2,n;(2)存在一个函数f(*),使得 是一个均值为零的依均值短记忆序列。其中,函数f(*)是非线性的,称作非线性协整函数。补充: 长期记忆性也称为长期相关性、长期依存性或持久性,它描述的是序列的高阶相关结构。长期记忆过程的相距甚远的观察值之间仍存在着某种稳定的依存关系,自相关函数衰减缓慢。 短记忆序列实际上是指随时间间隔h的增大,过去和现在对未来的影响衰减很快并趋于0,也即相关系数ht ,很快会减少到0,相当于以前的平稳序列。长记忆则相反,相当于
17、非平稳序列。我们要解决非线性协整问题,其关键是如何估计非线性协整函数f(*),这也是非线性协整研究中的重点和难点。国内外学者对此作了不少工作,总体来看,在处理非线性协整问题的方法上,有两个主导方向。 一是利用神经网络,或者小波神经网络,来对非线性协整问题进行建模;张喜彬,孙青华,张世英95将神经网络引入非线性协整研究,利用神经网络进行非线性协整的建模和检验; 二是利用经济时间序列中广泛存在的变结构特性,引入门限协整的概念,把非线性协整问题转化成若干个线性协整的组合,从而使整体的非线性问题转化成局部的线性问题进行解决。Balke和Fomby最早提出了门限协整的概念,Enders和Siklos讨论
18、了门限和协整的组合及相互匹配问题,Lo和Zivot通过引入门限协整来处理非线性协整问题,并对价格规律进行了门限协整的建模研究。 门限协整(Threshold Cointegration)对于向量时间序列 Yt的分量序列称为门限协整的,如果 (1)Yt在整个样本空间上不存在协整; (2)依据某一门限变量Zt ,把整个样本空间划分为m个互不重叠的门限子空间 j,j=1,2,m, 1 U2U . = , i j= (ij)。 (3)在每个子空间 j中,Yt 的分量序列都是线性协整或者是非线性协整的。我们把依据门限变量Z t划分为m个门限区间的门限协整,简称为m区间门限协整,简记为m-TVECM。门限
19、协整在金融中主要应用 Escribano( 1997年)研究非线性调整机制的1878年至1970年期间美国货币需求,Swanson(1999), Rothman,Van Dijk and Franses(2001)发现门限协整可以很好解释货币需求和供给之间存在的关系。Anderson (1997), Michael, Peel and Taylor (1997), Van Diik,and Franses and Lucas (2000),发现非传统的门限协整可以解释金融资产动态的存在的交易成本。特别是,安德森( 1997 )假定经济代理人是漠不关心所面临的不同类型的资产和相应市场。和价格的偏
20、离相比,其创造的价值平衡套利的机会,使提供的价格走向平衡。然而, 摩擦市场上暗示,这些调整偏差可不对称。2 门限自回归与门限协整的关系 单变量门限自回归模型(TAR)在许多经济时间序列如失业率,通货膨胀率以及利息率等的建模和预测中取得的广泛的应用,在门限自回归模型中,模型中的参数不是一成不变的,而是由门限区间决定,随着门限的变化而变化。最近,人们逐渐开始把注意力集中在多变量门限向量自回归模型(TVAR)上。基于门限理论和协整理论,Balke和Fomby(1997)把门限非线性性和协整理论融合到了一起,提出了所谓的双变量门限协整模型。 参考文献Threshold Cointegration be
21、tween Stock Returns: An application of STECM Models3 门限协整建模 建模思想 模型设置 建模步骤 模型检验 模型参数估计 (1) 建模思想建模思想 TVECM的建模实质上是一个分段建模问题,它主要是通过对整个数据集依某种准则进行分段,找出其中的门限临界点,然后以该门限临界点为界,分别行建模,不同门限区间内的模型可能是参数上的差异,也可能是模型基本形式差异。(2)门门限协协整的模型假设 n为任意正整数,根据门限变量 (d为门限延迟变量)可以把整个研究空间 可以分成m个互不重叠的门限子空间 (j=1, 2,m),则水平门限协整向量均衡校正模型(L
22、TVECM)的一般表达式为:其中 , 为第j个门限区间内的自回归滞后阶数 为k1阶向量, 为第j个门限区间内的协整向量t dzkRkjR,jjj2(0,)iidjpjp(3)(3)建模步骤建模步骤 第一步,对被研究的各个变量分别进行单整检验,考察其单整阶数。 第二步,协整存在性检验,检验被研究变量之间是否存在协整关系。 第三步,判断这种协整关系是线性的还是非线性的。 第四步,如果变量之间的协整关系不是线性的,我们就要考虑这种协整关系是否是门限协整的。 首先,假设协整变量是已知的,如果存在门限协整的话,在各个门限区间内,是不变的,这样我们就避免了许多与多变量门限协整模型相关的复杂问题。(4)门门
23、限检验检验 我们给出2-TVECM的表达式: 在上式中, 存在两个门限区间,并且,这两个门限区间由误差校正项 的值决定, 表示如果Xt 是p维的I(1)向量,但它与 的线性组合为I(0)的p维向量,也就是它们有协整的关系。( )tw(1)11( )(1,.)Ttttt lZwyy( )ttwx 如果存在门限,那么相应地,将会自然地满足如下条件 否则,模型将变成线性协整模型,基于此,我们对模型施加如下约束 在每个门限区间内,模型的系数矩阵分别为A1和A2。 零假设和被择假设之间的本质区别是A1和A2否相等,即: H0:A1=A2=A(线性协整)H1:A1A2(门限协整) Tsay提出过非参数非线
24、性检验,并且他分别把这种检验方法应用于单变量和多变量情况。但是,Balke和Fomby以及Lo和Zivot(2001)分别经过相关研究,都证明了Tsay的非参数检验方法的检验效果要比基于模型的检验方法差。 也可以将采用LM统计量,LM统计量便于计算;其它检验方法,像似然比检验、Wald检验等需要知道模型中各个参数的具体分布,但是现实情况往往是我们并不知道它们的分布。LM检验 原假设H0: 应使用线性误差修正模型拟合变量之间动态关系, 备择假设H1: 应用非线性误差修正模型 当和已知时,下式就是我们所求的检验统计量, 当和未知时,应该先在零假设( H0:A1=A2=A )下,对它们进行估计,但是
25、在零假设下,由于是线性协整的,不存在门限参数,无法对其估计,因此,我们就不能按照传统方法来定义LM统计量,需要我们用一种新的方法来定义。Davies(1987)提出了SupLM统计量, 在SupLM统计量中, 分别对应着式子中的和1- 在的数值的选择上,Andrew(1993)认为不应该太接近于零,因为,如果的值太接近零,将会降低检验效果。Andrew建议在0.05到0.15之间取值。 当协整向量已知时,即为一个已知的固定的向量,我们可以把直接代入 可以参考:Testing for two-regime threshold cointegration in vector error-corre
26、ction models,lu()滞后阶数j的确定: 对于自回归滞后阶数jp(j表示第j个门限区间),可以根据赤信息准则(AIC),Tsay(1998)建议把门限区间的个数m也加入到AIC中,滞后阶数也可以随着门限区间的变化而变化,这样就把门限区间的个数的估计和每个门限区间内的自回归滞后阶数Pj的确定统一起来, N为模型中变量的个数, 为第j个门限区间内的残方差估计矩阵,T j为第j个门限区间中的观测值的个数。(5)模型参数估计j ()门限值的确定 通过选择不同滞后阶数进行协整检验, 然后根据计算得出的AIC(赤信息准则)值与BIC(贝叶斯信息准则 )值进行比较, 选择最优的滞后阶数的模型,根
27、据最优的滞后阶数得出门限值和门限协整模型, 最后使用 Bootstrap 法对门限值进行检验。补充: Bootstrap方法 Bootstrap方法是一种在小样本分析中经常使用的再抽样统计方法,Boot st rap 方法的目的是用现有的小样本数据在数理统计方法基础上进行模拟未知分布 ,其本质是将小样本问题转化为大样本问题 ,它比较适用于小样本条件下的统计推断; Bootstrap方法实际上是一种重采样技术,重采样的次数通常取得较大,一般应在1000次以上。 Bootstrap方法的前提是假设观测数据是总体的代表 ,通过对观测数据重新抽样检验 ,模拟对总体的抽样检验过程(有论文)套利 套利套利
28、(英语:Arbitrage),就是在某种金融资产拥有两个价格的情况下,以较低的价格买进,较高的价格卖出,从而获取收益。 例如,某个股票同时在伦敦和纽约上市,同股同权,但是在纽约卖10美元,在伦敦却卖12美元,投资者就可以在纽约买进,到伦敦卖出。 在进行市场交易的时候,在考虑交易成本的情况下, 市场间当预期利润超过门限值时会有套利机会的存在; 在门限存在的前提下, 发现均衡误差不会连续地进行脱离均衡的动态调整; 只有当价差超过门限值时才会有调整的情况产生, 此时套利机会就存在。 下面将引用张世英的一篇文章来说明门限效应下市场的协整问题4 论文讲解 标题:能源消费与经济增长非线性关系分析:基于门限
29、协整系统 摘要: 学术界对经济增长与能源消费二者之间关系的研究, 主要以线性关系假设为前提。本文在非线性框架下,利用Hansen and Seo ( 2002) 最新发展的门限协整方法对中国的经济增长和能源消费两者之间的关系重新进行了检验。实证结果表明经济增长和能源消费两者之间存在非线性两机制门限协整, 当对均衡的偏离小于或等于门限值- 7.85时, 经济增长和能源消费倾向于不向均衡状态调整, 而当对均衡的偏离大于门限值- 7.85时, 他们都倾向于向均衡状态调整, 并且能源消费的调整速度大于经济增长调整的速度。实证结果与分析 1. 数据来源与处理:年度GDP ( 调整为1990年价格水平)
30、和一次能源消费量( 发电煤耗法) 为研究变量,分别记为gdp和eny序列, 样本为1953- 2006年间的54组年度数据。此外, 为了消除可能产生异方差的影响, 对年度GDP和一次能源消费量均取对数处理, 分别得到Lgdp和Leny序列。 2. 变量平稳性检验:使用ADF检验和PP检验对经济增长和能源消费及其一阶差分序列进行平稳性检验。两种检验均发现, 在5%显著水平下经济增长和能源消费为一阶差分平稳的。 3. 因果关系检验:使用比较可靠的VAR ( L+d) 方法检验两者之间Granger 因果关系。根据LR、AIC、FPE、SC和HQ准则确定拟合经济增长和能源消费关系的VAR模型的最佳滞
31、后阶数。分析发现各信息准则确定的最佳滞后阶数均为4 模型中检验经济增长与能源消费之间的Granger 因果关系, 说明在5%水平下, 经济增长和能源消费存在双向因果关系。 4. Johansen 协整检验:在5%显著水平下, “0 个协整向量”的假设都被拒绝, “至多有1 个协整向量”的假设被接受, 说明经济增长和消费之间存在1 个协整关系。 5. 门限协整模型估计和检验:经过反复计算, 门限协整模型的滞后阶数应取2, 所估计的门限值为- 7.85, 其中12%的样本落在 ( - 7.85) ; 88%的样本落在 ( - 7.85) , Bootstrap 次数取3000 次, 检验的结果为L
32、M统计量( 19.776) 小于固定模型中所获得的5%临界值( 21.265) , 对应的P 值为0.325, 即拒绝线性模型假设; 同时又大于Bootstrap法所获得的5%临界值( 18.424) , 对应的P值为0.046, 即接受非线性模型假设。1tw1tw LM=19.776 临界值 P值 线性模型 21.265 0.325 非线性模型 18.424 0.046 取值0.15可以得到两机制门限协整模型。 误差修正项调整系数在两个不同的门限中差异明显, 在第一门限机制( 典型机制) 中, 误差修正项调整速度缓慢, 是一个微调过程; 在第二门限机制( 极端机制)中, 误差修正项调整速度非
33、常快。 结论 我国的经济增长和能源消费在1953- 2006 年这个区间里, 呈现出一种非线性的协整形式他们对误差修正项的调整并不是连续的, 而是分阶段性, 误差修正项值不同, 调整的速度也不同。当误差修正项大于- 7.85时, 经济增长和能源消费对误差修正的反映都非常剧烈, 误差修改项对经济增长和能源消费都具有短期修正作用, 如果经济增长偏离能源消费的值过大, 那么误差修正项会对这种偏离进行修正,从而系统又快速达到均衡。而当误差修正项小于- 7.85时, 也就是说当经济增长一定时, 如果能源消费增长过大, 经济增长和能源消费对误差修正的反映基本上都不敏感, 因此, 通过误差修正项调整基本上不能回归到均衡状态。比如从2002- 2006年期间, 由于城市化和工业化进程的加速, 使得我国的能源强度连续几年出现不断的上升, 甚至超过了1, 也就是说误差修正项短期的调整并没起到作用, 如果调整作用明显的话, 能源强度连续上升的情况短期内很快就会降下来, 但事实上没有。这表明, 我们在制定政策时, 必须要针对不同的情况, 在对问题进行细化量化的基础上, 制定不同的策略, 才不会导致一些失误。Thank you!