1、时间序列计量经济学模型的理论与方法时间序列计量经济学模型的理论与方法第一节第一节 时间序列的平稳性及其检验时间序列的平稳性及其检验第二节第二节 随机时间序列模型的识别和估计随机时间序列模型的识别和估计第三节第三节 协整分析与误差修正模型协整分析与误差修正模型21.1 21.1 时间序列的平稳性及其检验时间序列的平稳性及其检验一、问题的引出:非平稳变量与经典回归一、问题的引出:非平稳变量与经典回归模型模型二、时间序列数据的平稳性二、时间序列数据的平稳性三、平稳性的图示判断三、平稳性的图示判断四、平稳性的单位根检验四、平稳性的单位根检验五、单整、趋势平稳与差分平稳随机过程五、单整、趋势平稳与差分平
2、稳随机过程一、问题的引出:非平稳变量与经典一、问题的引出:非平稳变量与经典回归模型回归模型常见的数据类型常见的数据类型到目前为止,经典计量经济模型常用到的数据有:到目前为止,经典计量经济模型常用到的数据有:时间序列数据时间序列数据(time-series data);截面数据截面数据(cross-sectional data)平行平行/面板数据面板数据(panel data/time-series cross-section data)时间时间序列数据是最常见,也是最常用到的数据序列数据是最常见,也是最常用到的数据。经典回归模型与数据的平稳性经典回归模型与数据的平稳性 经典回归分析经典回归分析
3、暗含暗含着一个重要着一个重要假设假设:数据是平稳的。数据是平稳的。数据非平稳数据非平稳,大样本下的统计推断基础,大样本下的统计推断基础“一致一致性性”要求要求被破怀。被破怀。经典回归分析的假设之一:解释变量经典回归分析的假设之一:解释变量X是非随机变是非随机变量量 放宽该假设:放宽该假设:X是随机变量,则需进一步要求:是随机变量,则需进一步要求:(1)X与随机扰动项与随机扰动项 不相关不相关 Cov(X,)=0nXXi/)(2QnXXPin)/)(2lim依概率收敛:依概率收敛:(2)第(2)条是为了满足统计推断中大样本下的“一致性”特性:)(limnPnxnuxxuxiiiiii/22Qnx
4、PnuxPPiiin0/lim/limlim2第(1)条是OLS估计的需要如果如果X是非平稳数据是非平稳数据(如表现出向上的趋势),(如表现出向上的趋势),则(则(2)不成立,回归估计量不满足)不成立,回归估计量不满足“一致性一致性”,基,基于大样本的统计推断也就遇到麻烦。于大样本的统计推断也就遇到麻烦。因此:注意:注意:在双变量模型中:在双变量模型中:表现在表现在:两个本来没有任何因果关系的变量,却两个本来没有任何因果关系的变量,却有很高的相关性有很高的相关性(有较高的R2):例如:例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现
5、出较高的可决系数。在现实经济生活中在现实经济生活中:情况往往是实际的时间序列数据是非平稳的实际的时间序列数据是非平稳的,而且主要的经济变量如消费、收入、价格往往表现为一致的上升或下降。这样,仍然通过经典的因果关仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。系模型进行分析,一般不会得到有意义的结果。数据非平稳,往往导致出现数据非平稳,往往导致出现“虚假回归虚假回归”问题问题 时间序列分析时间序列分析模型方法模型方法就是在这样的情况下,以通过揭示时间序列自身的变化规律为主线而发以通过揭示时间序列自身的变化规律为主线而发展起来的全新的计量经济学方法论展起来的全新的计量经济学方法论。时
6、间序列分析时间序列分析已组成现代计量经济学的重要内容,并广泛应用于经济分析与预测当中。二、时间序列数据的平稳性二、时间序列数据的平稳性 时间序列分析中首先遇到的问题首先遇到的问题是关于时间序列数据的平稳性平稳性问题。假定某个时间序列是由某一假定某个时间序列是由某一随机过程随机过程(stochastic process)生成的,即假定时间序列生成的,即假定时间序列Xt(t=1,2,)的每一个数值都是从一个概率分布中随机得到,如果的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:满足下列条件:1)均值)均值E(XE(Xt t)=)=是是与时间与时间t 无关的常数;无关的常数;2)方差)方
7、差Var(XVar(Xt t)=)=2 2是是与时间与时间t 无关的常数;无关的常数;3)协方差)协方差Cov(XCov(Xt t,X,Xt+kt+k)=)=k k 是是只与时期间隔只与时期间隔k有关,有关,与时间与时间t 无关的常数;无关的常数;则称该随机时间序列是则称该随机时间序列是平稳的平稳的(stationary),而该而该随机过程是一随机过程是一平稳随机过程平稳随机过程(stationary stochastic process)。)。平稳随机过程 某一随机过程的均值和方差都为与实践无关的常数,并且在任何两期之间的协方差值仅仅依赖于该两期间的距离和滞后,而不依赖于计算的时间,这一随机
8、过程就为平稳过程。简言之,若一个时间序列是平稳的,则不管在什么时间测量,它的均值、方差和(各种滞后的)自协方差都保持不变,即它们都不随时间而变化。平稳时间序列有回到其均值的趋势,可以称之为均值回复过程均值回复过程,围绕均值波动且有大致恒定的振幅。222()0()()0(0,)tttttEEEttN:零 均 值:同 方 差:无 自 相 关:满 足 上 述 三 个 条 件 的 随 机 过 程 为,白 噪 声 过 程 为 弱 平 稳 过 程。若 再 加 上 不 同 时 间 的 各 个是 独 立 的,即:,独 立,则 称 为。若 上 述 条 件 成 立,且:白 噪 声则过 程白 噪 声 过 程独 立
9、白 噪 声 过 程高 斯 白 噪称 该 过 程 为声 过 程。严平稳的定义 非平稳过程非平稳过程 若某一过程不满足上述平稳过程定义中的某一条性质,即均值、方差和协方差都随时间而变化,或者其一会随时间变化,都为非平稳过程 随机游走过程就是非平稳过程 随机游走过程分为:(1)不带漂移的随机游走(即不存在常数项或截距项)(2)带漂移的随机游走(出现常数项或截距项)21101212012333012300tttttttuYYuYYYuYYuYuuYYuYuuuYYu:假设:是均值为 和方差为的白噪声过程。则称 序列为随机游走过程。不带漂移项的随机游走过程(可以得出:不含 有截距项)002()()()v
10、ar()tttE YE YuE YYtYt期望:方差:可见,的均值等于初始值为一个常数。但是随着时间 的增加,其方差会随着时间而增大,因此违背了平稳性条件。因此,不带漂移的随机游走过程是非平稳的随机过程。随机游走过程中,随机冲击具有持久性,一个特定的冲击永远不会消失,随机游走过程会永远记住每次冲击,具有无限记忆性质。21110121201233301230023tttttttttttuYYuYYYuYYYuYYuYuuYYuYuuuYYtu:假 设:是 均 值 为 和 方 差 为的 白 噪 声 过 程。其 中为 漂 移 参 数。()根 据为 正 或带 漂 移 项 的 随 机 游 走 过 程(含
11、 有 截 距 项负 而 向 上 或 向 下 漂 移。可 以 得 出:)002()()var()tttE YE YtuYtYttY期望:方差:可见,随着时间 的增加,的均值和方差会随着时间而增大,因此违背了平稳性条件。因此,带漂移的随机游走过程也是非平稳的随机过程。1ttttYYYu 随机游走过程虽然是非平稳的,我们进行差分:()因此,一阶差分后的过程为平稳过程。通常,非平稳过程的差分过程会变为平稳过程,后面的单位根检验会详细讲述。后面将会看到后面将会看到:如果一个时间序列是非平稳的,如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列它常常可通过取差分的方法而形成平稳序列。事实上
12、,事实上,随机游走过程随机游走过程是下面我们称之为是下面我们称之为1 1阶自回阶自回归归AR(1)AR(1)过程过程的特例的特例 X Xt t=X Xt-1t-1+t 不难验证不难验证:1)|1|1时,该随机过程生成的时间序列是时,该随机过程生成的时间序列是发散的,表现为持续上升发散的,表现为持续上升(1)1)或持续下降或持续下降(-1)-1),因此是非平稳的,这种非平稳归因于过程中存在某因此是非平稳的,这种非平稳归因于过程中存在某种趋势;种趋势;只有当只有当-1-1 10,样本自相关系数近似地服从以样本自相关系数近似地服从以0为均值,为均值,1/n 为方差的正态分布,其中为方差的正态分布,其
13、中n为样本数。为样本数。也可检验对所有也可检验对所有k0k0,自相关系数都为自相关系数都为0 0的联合的联合假设,这可通过如下假设,这可通过如下Q QLBLB统计量进行:统计量进行:该统计量近似地服从自由度为m的2分布(m为滞后长度)。因此:如果计算的如果计算的Q Q值大于显著性水平值大于显著性水平为为 的临界值,则有的临界值,则有1-1-的把握拒绝所有的把握拒绝所有 k k(k0)(k0)同时为同时为0 0的假设。的假设。例例9.1.3:9.1.3:表表9.1.19.1.1序列序列Random1Random1是通过是通过一随机过程(随机函数)生成的有一随机过程(随机函数)生成的有1919个样
14、个样本的随机时间序列。本的随机时间序列。mkkLBknrnnQ12)2(表表 9 9.1 1.1 1 一一个个纯纯随随机机序序列列与与随随机机游游走走序序列列的的检检验验 序号 Random1 自相关系数 kr(k=0,1,17)LBQ Random2 自相关系数 kr(k=0,1,17)LBQ 1-0.031 K=0,1.000 -0.031 1.000 2 0.188 K=1,-0.051 0.059 0.157 0.480 5.116 3 0.108 K=2,-0.393 3.679 0.264 0.018 5.123 4-0.455 K=3,-0.147 4.216-0.191-0.0
15、69 5.241 5-0.426 K=4,0.280 6.300-0.616 0.028 5.261 6 0.387 K=5,0.187 7.297-0.229-0.016 5.269 7-0.156 K=6,-0.363 11.332-0.385-0.219 6.745 8 0.204 K=7,-0.148 12.058-0.181-0.063 6.876 9-0.340 K=8,0.315 15.646-0.521 0.126 7.454 10 0.157 K=9,0.194 17.153-0.364 0.024 7.477 11 0.228 K=10,-0.139 18.010-0.13
16、6-0.249 10.229 12-0.315 K=11,-0.297 22.414-0.451-0.404 18.389 13-0.377 K=12,0.034 22.481-0.828-0.284 22.994 14-0.056 K=13,0.165 24.288-0.884-0.088 23.514 15 0.478 K=14,-0.105 25.162-0.406-0.066 23.866 16 0.244 K=15,-0.094 26.036-0.162 0.037 24.004 17-0.215 K=16,0.039 26.240-0.377 0.105 25.483 18 0.1
17、41 K=17,0.027 26.381-0.236 0.093 27.198 19 0.236 0.000 容易验证:该样本序列的均值为该样本序列的均值为0 0,方差为,方差为0.07890.0789。(a)(b)-0.6-0.4-0.20.00.20.40.624681012141618RANDOM1-0.8-0.40.00.40.81.224681012141618RANDOM1AC 从图形看:它在其样本均值它在其样本均值0 0附近上下波动,且样本自相关附近上下波动,且样本自相关系数迅速下降到系数迅速下降到0 0,随后在,随后在0 0附近波动且逐渐收敛于附近波动且逐渐收敛于0 0。由于该
18、序列由一随机过程生成,可以认为不存在序列相关性,因此该序列为一白噪声。该序列为一白噪声。根据Bartlett的理论:kN(0,1/19)因此任一rk(k0)的95%的置信区间都将是 可以看出可以看出:k0k0时,时,r rk k的值确实落在了该区间内,的值确实落在了该区间内,因此可以接受因此可以接受 k k(k0)k0)为为0 0的假设的假设。同样地,从从Q QLBLB统计量的计算值看,滞后统计量的计算值看,滞后1717期期的计算值为的计算值为26.3826.38,未超过,未超过5%5%显著性水平的临界值显著性水平的临界值27.5827.58,因此,因此,可以接受所有的自相关系数可以接受所有的
19、自相关系数 k k(k0)k0)都为都为0 0的假设。的假设。因此,该随机过程是一个平稳过程。该随机过程是一个平稳过程。4497.0,4497.019/196.1,19/196.1,025.0025.0ZZ 序列Random2是由一随机游走过程 Xt=Xt-1+t 生成的一随机游走时间序列样本。其中,第0项取值为0,t是由Random1表示的白噪声。(a)(b)-1.0-0.8-0.6-0.4-0.20.00.20.424681012141618RANDOM2-0.8-0.40.00.40.81.224681012141618RANDOM2AC 样本自相关系数显示样本自相关系数显示:r1=0.
20、48,落在了区间-0.4497,0.4497之外,因此在5%的显著性水平上拒绝1的真值为0的假设。该随机游走序列是非平稳的。该随机游走序列是非平稳的。图形表示出:图形表示出:该序列具有相同的均值,但从样本自相关图看,虽然自相关系数迅速下降到0,但随着时间的推移,则在0附近波动且呈发散趋势。平稳过程自相关图示:非平稳过程自相关图示:例例 9.1.9.1.4 4 检验中国支出法 GDP 时间序列的平稳性。表表 9.1.2 9.1.2 1978200019782000 年中国支出法年中国支出法 GDPGDP(单位:亿元)(单位:亿元)年份GDP年份GDP年份GDP19783605.619861013
21、2.8199446690.719794073.9198711784199558510.519804551.3198814704199668330.419814901.4198916466199774894.219825489.2199018319.5199879003.319836076.3199121280.4199982673.119847164.4199225863.6200089112.519858792.1199334500.6 图形:表现出了一个持续上升的过程图形:表现出了一个持续上升的过程,可,可初步判断初步判断是非平稳是非平稳的。的。样本自相关系数:缓慢下降样本自相关系数:缓慢
22、下降,再次表明它,再次表明它的的非平稳非平稳性。性。图图 9 9.1 1.5 5 1 19 97 78 82 20 00 00 0 年年中中国国 G GD DP P 时时间间序序列列及及其其样样本本自自相相关关图图 -0.4-0.20.00.20.40.60.81.01.2246810121416182022GDPACF020000400006000080000100000788082848688909294969800GDP 拒绝:拒绝:该时间序列的自相关系数在滞后1期之后的值全部为0的假设。结论结论:19782000年间中国GDP时间序列是非平稳序列。从滞后从滞后18期的期的QLB统计量看
23、:统计量看:QLB(18)=57.1828.86=20.05 例例9.1.59.1.5 检验2.10中关于人均居民消费与人均国内生产总值这两时间序列的平稳性。图图 9.1.6 19811996中中国国居居民民人人均均消消费费与与人人均均 GDP 时时间间序序列列及及其其样样本本自自相相关关图图 01000200030004000500060008284868890929496GDPPCCPC-0.4-0.20.00.20.40.60.81.01.212345678910 11 12 13 14 15GDPPCCPC 原图 样本自相关图 从图形上看:从图形上看:人均居民消费(CPC)与人均国内生
24、产总值(GDPPC)是非平稳的是非平稳的。从滞后从滞后1414期的期的QLB统计量看:统计量看:CPC与GDPPC序列的统计量计算值均为57.18,超过了显著性水平为5%时的临界值23.68。再次表明它们的非平稳性。表明它们的非平稳性。就此来说,运用传统的回归方法建立它们的就此来说,运用传统的回归方法建立它们的回归方程是无实际意义的。回归方程是无实际意义的。不过,第三节中将看到,如果两个非平稳时不过,第三节中将看到,如果两个非平稳时间序列是间序列是协整协整的,则传统的回归结果却是有意义的,则传统的回归结果却是有意义的,而这两时间序列恰是的,而这两时间序列恰是协整协整的。的。四、平稳性的单位根检
25、验四、平稳性的单位根检验 对时间序列的平稳性除了通过图形直观判断外,运用统计量进行统计检验则是更为准确与重要的。单位根检验(单位根检验(unit root test)是统计检验中普遍应用的一种检验方法。1 1、DFDF检验检验我们已知道,随机游走序列 Xt=Xt-1+t是非平稳的,其中t是白噪声。而该序列可看成是随机模型 Xt=Xt-1+t中参数=1时的情形。也就是说,我们对式 Xt=Xt-1+t (*)做回归,如果确实发现=1,就说随机变量Xt有一个单位根单位根。(*)式可变形式成差分形式:Xt=(-1)Xt-1+t =Xt-1+t (*)检验(*)式是否存在单位根=1,也可通过(*)式判断
26、是否有=0。一般地一般地:检验一个时间序列检验一个时间序列XtXt的平稳性,可通过检验的平稳性,可通过检验带有截距项的一阶自回归模型带有截距项的一阶自回归模型 X Xt t=+X Xt-1t-1+t t (*)中的参数中的参数 是否小于是否小于1 1。或者:或者:检验其等价变形式检验其等价变形式 X Xt t=+X Xt-1t-1+t t (*)中的参数中的参数 是否小于是否小于0 0。在第二节中将证明,(*)式中的参数 11或或=1=1时,时,时间序列是非平稳的时间序列是非平稳的;对应于(*)式,则是 00或或 =0。因此,针对式 X Xt t=+X Xt-1t-1+t t 我们关心的检验为
27、:零假设零假设 H0:=0,X Xt t 非平稳非平稳。备择假设备择假设 H1:0,X Xt t 平稳平稳 上述检验可通过上述检验可通过OLS法下的法下的t检验完成。检验完成。然而,在零假设(序列非平稳)下,即使在大样本下t统计量也是有偏误的(向下偏移),通常的t 检验无法使用。Dicky和Fuller于1976年提出了这一情形下t统计量服从的分布(这时的t统计量称为 统计量统计量),即DF分布分布(见表9.1.3)。由于t统计量的向下偏倚性,它呈现围绕小于零值的偏态分布。因此,可通过OLS法估计 X Xt t=+X Xt-1t-1+t t 并计算t统计量的值,与DF分布表中给定显著性水平下的
28、临界值比较:如果:如果:t临界值,则拒绝零假设临界值,则拒绝零假设H0:=0,认为时间序列不存在单位根,是平稳的。认为时间序列不存在单位根,是平稳的。表表 9.1.3 DF 分分布布临临界界值值表表 样 本 容 量 显著性水平 25 50 100 500 t分布临界值(n=)0.01-3.75-3.58-3.51-3.44-3.43-2.33 0.05-3.00-2.93-2.89-2.87-2.86-1.65 0.10-2.63-2.60-2.58-2.57-2.57-1.28 注意:在不同的教科书上有不同的描述,但是注意:在不同的教科书上有不同的描述,但是结果是相同的。结果是相同的。例如:
29、例如:“如果计算得到的如果计算得到的t统计量的绝对值大于统计量的绝对值大于临界值的绝对值,则拒绝临界值的绝对值,则拒绝=0”的假设,原序的假设,原序列不存在单位根,为平稳序列。列不存在单位根,为平稳序列。进一步的问题进一步的问题:在上述使用 X Xt t=+X Xt-1t-1+t t对时间序列进行平稳性检验中,实际上实际上假定了时间序列是由假定了时间序列是由具有白噪声随机误差项的一阶自回归过程具有白噪声随机误差项的一阶自回归过程AR(1)生成的生成的。但在实际检验中但在实际检验中,时间序列可能由更高阶的自回归过程,时间序列可能由更高阶的自回归过程生成的,或者随机误差项并非是白噪声生成的,或者随
30、机误差项并非是白噪声,这样用OLS法进行法进行估计均会表现出随机误差项出现自相关估计均会表现出随机误差项出现自相关(autocorrelation),导致DF检验无效。另外另外,如果时间序列包含有明显的随时间变化的某种趋势(如上升或下降),则也容易导致上述检验中的自相关随自相关随机误差项问题机误差项问题。为了保证DF检验中随机误差项的白噪声特性,Dicky和Fuller对DF检验进行了扩充,形成了ADF(Augment Dickey-Fuller)检验检验。2 2、ADFADF检验检验ADF检验是通过下面三个模型完成的:检验是通过下面三个模型完成的:模型模型3 中的中的t是时间变量是时间变量,
31、代表了时间序列随时间变化的某种趋势(如果有的话)。检验的假设都是:针对检验的假设都是:针对H1:500-2.58-2.23-1.95-1.6125-3.75-3.33-3.00-2.6250-3.58-3.22-2.93-2.60100-3.51-3.17-2.89-2.58250-3.46-3.14-2.88-2.57500-3.44-3.13-2.87-2.57500-3.43-3.12-2.86-2.57253.412.972.612.20503.282.892.562.181003.222.862.542.172503.192.842.532.165003.182.832.522.16
32、25003.182.832.522.1625-4.38-3.95-3.60-3.2450-4.15-3.80-3.50-3.18100-4.04-3.73-3.45-3.15250-3.99-3.69-3.43-3.13500-3.98-3.68-3.42-3.13500-3.96-3.66-3.41-3.12254.053.593.202.77503.873.473.142.751003.783.423.112.732503.743.393.092.735003.723.383.082.725003.713.383.082.72253.743.252.852.39503.603.182.81
33、2.381003.533.142.792.382503.493.122.792.385003.483.112.782.3835003.463.112.782.38同时估计出上述三个模型的适当形式,然后通过ADF临界值表检验零假设H0:=0。1)只要其中有一个模型的检验结果拒绝了零假设,只要其中有一个模型的检验结果拒绝了零假设,就可以认为时间序列是平稳的;就可以认为时间序列是平稳的;2)当三个模型的检验结果都不能拒绝零假设时,则)当三个模型的检验结果都不能拒绝零假设时,则认为时间序列是非平稳的。认为时间序列是非平稳的。这里所谓模型适当的形式模型适当的形式就是在每个模型中选取适当的滞后差分项,以使
34、模型的残差项是一个白噪声(主要保证不存在自相关)。一个简单的检验过程:一个简单的检验过程:例例9.1.6 检验19782000年间中国支出法GDP时间序列的平稳性。21101.150.10093.027.22933.1011ttttGDPGDPGDPTGDP (-1.26)(1.91)(0.31)(8.94)(-4.95)1)经过偿试,模型3取了2阶滞后:从从 的系数看,的系数看,t临界值,不能拒绝存在单位根的零假设。临界值,不能拒绝存在单位根的零假设。时间T的t统计量小于ADF分布表中的临界值,因此不能拒绝不能拒绝不存在趋势项的零假设不存在趋势项的零假设。需进一步检验模型需进一步检验模型2。
35、2)经试验,模型2中滞后项取2阶:21115.165.1057.045.357ttttGDPGDPGDPGDP (-0.90)(3.38)(10.40)(-5.63)LM(1)=0.57 LM(2)=2.85 从GDPt-1的参数值看,其t统计量为正值,大于临界值,不能拒绝存在单位根的零假设不能拒绝存在单位根的零假设。常数项的t统计量小于AFD分布表中的临界值,不能拒不能拒绝不存常数项的零假设。绝不存常数项的零假设。需进一步检验模型1。3)经试验,模型1中滞后项取2阶:从GDPt-1的参数值看,其t统计量为正值,大于临界值,不能拒绝存在单位根的零假设。不能拒绝存在单位根的零假设。可断定中国支出
36、法可断定中国支出法GDP时间序列是非平稳的。时间序列是非平稳的。211194.1701.1063.0ttttGDPGDPGDPGDP (4.15)(11.46)(-6.05)LM(1)=0.17 LM(2)=2.67 01000020000300004000050000556065707580859095Y7.27.68.08.48.89.29.610.010.410.8556065707580859095Log(Y)经过一阶差分后的单位根检验:单位根检验的批评 一方面:显著性水平扭曲的问题 另一方面:检验势低的问题非平稳时间序列的变换 差分法 退化趋势法(对时间趋势项进行回归而退化趋势后变为平稳)把DSP当作TSP来处理,则差分不足问题 把TSP 当作DSP来处理,则差分过度问题