1、6.5-66.5-6联立方程模型的单方程估计方法联立方程模型的单方程估计方法Single-Equation Estimation MethodsSingle-Equation Estimation Methods一、狭义的工具变量法(一、狭义的工具变量法(IVIV)二、间接最小二乘法二、间接最小二乘法(ILS)ILS)三、二阶段最小二乘法三、二阶段最小二乘法(2(2SLS)SLS)四、三种方法的等价性证明四、三种方法的等价性证明五、简单宏观经济模型实例演示五、简单宏观经济模型实例演示六、主分量法的应用六、主分量法的应用七、其它有限信息估计方法简介七、其它有限信息估计方法简介八、八、k k级估计
2、式级估计式 联立方程计量经济学模型的估计方法分为两大类:联立方程计量经济学模型的估计方法分为两大类:单方程估计方法与系统估计方法单方程估计方法与系统估计方法。所谓单方程估计方法,指每次只估计模型系统中所谓单方程估计方法,指每次只估计模型系统中的一个方程,依次逐个估计。的一个方程,依次逐个估计。所谓系统估计方法,指同时对全部方程进行估计,所谓系统估计方法,指同时对全部方程进行估计,同时得到所有方程的参数估计量。同时得到所有方程的参数估计量。联立方程模型的单方程估计方法不同于单方程模联立方程模型的单方程估计方法不同于单方程模型的估计方法型的估计方法。一、狭义的工具变量法一、狭义的工具变量法(IVI
3、V,Instrumental VariablesInstrumental Variables)方法思路方法思路“狭义的工具变量法狭义的工具变量法”与与“广义的工具变量法广义的工具变量法”解决结构方程中与随机误差项相关的内生解释变解决结构方程中与随机误差项相关的内生解释变量问题。量问题。方法原理与单方程模型的方法原理与单方程模型的IVIV方法相同。方法相同。模型系统中提供了可供选择的模型系统中提供了可供选择的工具变量,使得工具变量,使得IVIV方法的应用成为可能。方法的应用成为可能。工具变量的选取工具变量的选取 对于联立方程模型的每一个结构方程,例如第对于联立方程模型的每一个结构方程,例如第1个
4、个方程,可以写成如下形式:方程,可以写成如下形式:YYYYXXXggkk112 213 31111122111111 内生解释变量(内生解释变量(g1-1)个,先决解释变量个,先决解释变量k1个。个。如果方程是恰好识别的,有(如果方程是恰好识别的,有(g1-1)=(k-k1)。)。可以选择可以选择(k-k1)个方程没有包含的先决变量作个方程没有包含的先决变量作为(为(g1-1)个内生解释变量的工具变量。个内生解释变量的工具变量。IVIV参数估计量参数估计量 方程的矩阵表示为方程的矩阵表示为Y1001(,)Y X00*0000001001IVYXXYXXX 选择方程中选择方程中没有包含的先决变量
5、没有包含的先决变量X X0 0*作为作为包含的内包含的内生解释变量生解释变量Y Y0 0的工具变量,得到参数估计量为:的工具变量,得到参数估计量为:讨论讨论 该该估计量与估计量与OLSOLS估计量的区别是什么?估计量的区别是什么?该估计量具有什么统计特性?该估计量具有什么统计特性?(k-kk-k1 1)工具变量与(工具变量与(g g1 1-1-1)个内生解释变量的个内生解释变量的对应关系是否影响参数估计结果?为什么?对应关系是否影响参数估计结果?为什么?IVIV是否利用了模型系统中方程之间相关性信息?是否利用了模型系统中方程之间相关性信息?对于过度识别的方程,可否应用对于过度识别的方程,可否应
6、用IV IV?为什么?为什么?对于过度识别的方程,可否应用对于过度识别的方程,可否应用GMM GMM?为什么?为什么?二、间接最小二乘法二、间接最小二乘法(ILS,Indirect Least Squares)ILS,Indirect Least Squares)方法思路方法思路 联立方程模型的结构方程中包含有内生解释变量,联立方程模型的结构方程中包含有内生解释变量,不能直接采用不能直接采用OLSOLS估计其参数。但是对于简化式方程,估计其参数。但是对于简化式方程,可以采用可以采用OLSOLS直接估计其参数。直接估计其参数。间接最小二乘法:先对关于内生解释变量的简化式间接最小二乘法:先对关于内
7、生解释变量的简化式方程采用方程采用OLSOLS估计简化式参数,得到简化式参数估计估计简化式参数,得到简化式参数估计量,然后通过参数关系体系,计算得到结构式参数量,然后通过参数关系体系,计算得到结构式参数的估计量。的估计量。间接最小二乘法只适用于恰好识别的结构方程的参间接最小二乘法只适用于恰好识别的结构方程的参数估计,因为只有恰好识别的结构方程,才能从参数估计,因为只有恰好识别的结构方程,才能从参数关系体系中得到唯一一组结构参数的估计量。数关系体系中得到唯一一组结构参数的估计量。一般间接最小二乘法的估计过程一般间接最小二乘法的估计过程 Y1001(,)Y X00Y100001YX1010010Y
8、XY00000001YX YX0000 00000000XX 0000000000XXX*00001002000010000020 用用OLS估计简化式模型,得到简化式参数估计量估计简化式模型,得到简化式参数估计量,代入该参数关系体系,先由第代入该参数关系体系,先由第2组方程计算得到内生组方程计算得到内生解释变量的参数,然后再代入第解释变量的参数,然后再代入第1组方程计算得到先组方程计算得到先决解释变量的参数。于是得到了结构方程的所有结构决解释变量的参数。于是得到了结构方程的所有结构参数估计量。参数估计量。间接最小二乘法也是一种工具变量方法间接最小二乘法也是一种工具变量方法 ILS等价于一种工
9、具变量方法:依次选择等价于一种工具变量方法:依次选择X作为作为(Y0,X0)的工具变量。的工具变量。数学证明见数学证明见计量经济学计量经济学方法与应用方法与应用(李子(李子奈编著,清华大学出版社,奈编著,清华大学出版社,1992年年3月)第月)第126128页。页。估计结果为:估计结果为:000011ILSYXYXX三、二阶段最小二乘法三、二阶段最小二乘法(2(2SLS,Two Stage Least Squares)SLS,Two Stage Least Squares)2 2SLSSLS是是应用最多的应用最多的单方程估计方法单方程估计方法 IVIV和和ILSILS一般只适用于联立方程模型中
10、恰好识别的一般只适用于联立方程模型中恰好识别的结构方程的估计。结构方程的估计。在实际的联立方程模型中,恰好识别的结构方程在实际的联立方程模型中,恰好识别的结构方程很少出现,一般情况下结构方程都是过度识别的。很少出现,一般情况下结构方程都是过度识别的。为什么?为什么?2 2SLSSLS是一种既适用于恰好识别的结构方程,又适是一种既适用于恰好识别的结构方程,又适用于过度识别的结构方程的单方程估计方法。用于过度识别的结构方程的单方程估计方法。2 2SLSSLS的方法步骤的方法步骤 第一阶段:对内生解释变量的简化式方程使用第一阶段:对内生解释变量的简化式方程使用OLSOLS。得到:得到:()YXXX
11、XX Y0010 用估计量代替结构方程中的内生解释变量,得到新用估计量代替结构方程中的内生解释变量,得到新的模型:的模型:Y1001(,)Y X00 第二阶段:对该模型应用第二阶段:对该模型应用OLS估计,估计,得到的参数得到的参数估计量即为原结构方程参数的二阶段最小二乘估估计量即为原结构方程参数的二阶段最小二乘估计量。计量。00200001001SLSYYXYXYX二阶段最小二乘法也是一种工具变量方法二阶段最小二乘法也是一种工具变量方法 如果用如果用Y Y0 0的估计量作为工具变量,按照工具变量方的估计量作为工具变量,按照工具变量方法的估计过程,应该得到如下的结构参数估计量:法的估计过程,应
12、该得到如下的结构参数估计量:0000001001YXYXYXY 可以严格证明两组参数估计量是完全等价的,所可以严格证明两组参数估计量是完全等价的,所以可以把以可以把2 2SLSSLS也看成为一种工具变量方法。也看成为一种工具变量方法。证明过程见证明过程见计量经济学计量经济学方法与应用方法与应用(李子奈编著,(李子奈编著,清华大学出版社,清华大学出版社,1992年年3月)第月)第130131页页。四、三种方法的等价性证明四、三种方法的等价性证明三种单方程估计方法得到的参数估计量三种单方程估计方法得到的参数估计量*0000001001IVYXXYXXX000011ILSYXYXX002000010
13、01SLSYYXYXYXIVIV与与ILSILS估计量的等价性估计量的等价性 在恰好识别情况下在恰好识别情况下 工具变量集合相同,只是次序不同。工具变量集合相同,只是次序不同。次序不同不影响正规方程组的解。次序不同不影响正规方程组的解。2 2SLSSLS与与ILSILS估计量的等价性估计量的等价性 在恰好识别情况下在恰好识别情况下 ILS的工具变量是全体先决变量。的工具变量是全体先决变量。2SLS的每个工具变量都是全体先决变量的线性组的每个工具变量都是全体先决变量的线性组合。合。2SLS的的正规方程组相当于正规方程组相当于ILS的正规方程组经过一的正规方程组经过一系列的初等变换的结果。系列的初
14、等变换的结果。线性代数方程组经过初等变换不影响方程组的解。线性代数方程组经过初等变换不影响方程组的解。五、简单宏观经济模型实例演示五、简单宏观经济模型实例演示模型模型CYCIYYICGttttttttttt01211012 消费方程是恰好识别的;消费方程是恰好识别的;投资方程是过度识别的;投资方程是过度识别的;模型是可以识别的。模型是可以识别的。数据数据用狭义的工具变量法估计消费方程用狭义的工具变量法估计消费方程.012164 799510 31753870 3919359用用Gt作为作为Yt的工具变量的工具变量 估计结果显示估计结果显示Dependent Variable:CC Method
15、:Two-Stage Least Squares Date:04/11/03 Time:22:06 Sample(adjusted):1979 1996 Included observations:18 after adjusting endpoints Instrument list:C G CC1 Variable Coefficient Std.Error t-Statistic Prob.C 164.8004 95.45182 1.726529 0.1048 Y 0.317539 0.032376 9.807786 0.0000 CC1 0.391935 0.087514 4.4785
16、10 0.0004 R-squared 0.999435 Mean dependent var 9875.667 Adjusted R-squared 0.999360 S.D.dependent var 9026.792 S.E.of regression 228.3835 Sum squared resid 782385.2 F-statistic 13200.10 Durbin-Watson stat 2.015655 Prob(F-statistic)0.000000 用间接最小二乘法估计消费方程用间接最小二乘法估计消费方程CCGYCGtttttttt1011112120211222.
17、1 01 11 26 3 5 9 4 0 0 20 8 1 3 2 8 9 01 2 1 9 1 8 6 3.202122719 263431 32693663 8394822.112222111210101200 317539250 39193422164 800368 C简化式模型估计结果简化式模型估计结果Dependent Variable:CC Method:Least Squares Date:04/11/03 Time:22:13 Sample(adjusted):1979 1996 Included observations:18 after adjusting endpoint
18、s Variable Coefficient Std.Error t-Statistic Prob.C-63.59400 279.1279-0.227831 0.8229 CC1 0.813289 0.145306 5.597062 0.0001 G 1.219186 0.402482 3.029167 0.0085 R-squared 0.994079 Mean dependent var 9875.667 Adjusted R-squared 0.993289 S.D.dependent var 9026.792 S.E.of regression 739.4562 Akaike info
19、 criterion 16.20072 Sum squared resid 8201931.Schwarz criterion 16.34911 Log likelihood-142.8065 F-statistic 1259.163 Durbin-Watson stat 1.542608 Prob(F-statistic)0.000000 Y简化式模型估计结果简化式模型估计结果Dependent Variable:Y Method:Least Squares Date:04/11/03 Time:22:17 Sample(adjusted):1979 1996 Included observ
20、ations:18 after adjusting endpoints Variable Coefficient Std.Error t-Statistic Prob.C-719.2634 740.2944-0.971591 0.3467 CC1 1.326937 0.385377 3.443215 0.0036 G 3.839482 1.067451 3.596869 0.0026 R-squared 0.991131 Mean dependent var 20506.28 Adjusted R-squared 0.989948 S.D.dependent var 19561.13 S.E.
21、of regression 1961.163 Akaike info criterion 18.15147 Sum squared resid 57692390 Schwarz criterion 18.29987 Log likelihood-160.3633 F-statistic 838.1285 Durbin-Watson stat 1.427616 Prob(F-statistic)0.000000 用两阶段最小二乘法估计消费方程用两阶段最小二乘法估计消费方程 比较上述消费方程的比较上述消费方程的3种估计结果,证明这种估计结果,证明这3种方种方法对于恰好识别的结构方程是等价的。估计量
22、的法对于恰好识别的结构方程是等价的。估计量的差别只是很小的计算误差。差别只是很小的计算误差。.YCGttt 719 2634313269366383948221.0121 6 4 9 0 0 0 90 3 1 7 5 5 8 00 3 9 1 8 7 9 4代替原消费方程中的代替原消费方程中的Yt,应用应用OLS估计估计 第第2阶段估计结果阶段估计结果Dependent Variable:CC Method:Least Squares Date:04/11/03 Time:22:22 Sample(adjusted):1979 1996 Included observations:18 aft
23、er adjusting endpoints Variable Coefficient Std.Error t-Statistic Prob.C 164.8004 309.0523 0.533244 0.6017 YF 0.317539 0.104827 3.029167 0.0085 CC1 0.391935 0.283353 1.383203 0.1868 R-squared 0.994079 Mean dependent var 9875.667 Adjusted R-squared 0.993289 S.D.dependent var 9026.792 S.E.of regressio
24、n 739.4562 Akaike info criterion 16.20072 Sum squared resid 8201931.Schwarz criterion 16.34911 Log likelihood-142.8065 F-statistic 1259.163 Durbin-Watson stat 1.542608 Prob(F-statistic)0.000000 用两阶段最小二乘法估计投资方程用两阶段最小二乘法估计投资方程 投资方程是过度识别的结构方程,只能用投资方程是过度识别的结构方程,只能用2SLS估估计。估计过程与上述计。估计过程与上述2SLS估计消费方程的过程相估
25、计消费方程的过程相同。得到投资方程的参数估计量为:同。得到投资方程的参数估计量为:.01380 116140 4049326 至此,完成了该模型系统的估计。至此,完成了该模型系统的估计。2SLS第第2阶段估计结果阶段估计结果Dependent Variable:I Method:Least Squares Date:04/11/03 Time:22:28 Sample(adjusted):1979 1996 Included observations:18 after adjusting endpoints Variable Coefficient Std.Error t-Statistic
26、Prob.C-380.2044 427.6175-0.889123 0.3871 YF 0.404935 0.015324 26.42468 0.0000 R-squared 0.977599 Mean dependent var 7923.500 Adjusted R-squared 0.976199 S.D.dependent var 7975.613 S.E.of regression 1230.436 Akaike info criterion 17.17256 Sum squared resid 24223582 Schwarz criterion 17.27149 Log like
27、lihood-152.5531 F-statistic 698.2639 Durbin-Watson stat 1.376531 Prob(F-statistic)0.000000 用用GMM估计投资方程估计投资方程 投资方程是过度识别的结构方程,也可以用投资方程是过度识别的结构方程,也可以用GMM估计。选择的工具变量为估计。选择的工具变量为c、G、CC1,得到投资得到投资方程的参数估计量为:方程的参数估计量为:405241.02216.38810 与与2SLS结果比较,结构参数估计量变化不大。残结果比较,结构参数估计量变化不大。残差平方和由差平方和由24223582变为变为3832486,显
28、著减少。,显著减少。为为什么?利用了更多的信息。什么?利用了更多的信息。GMM估计结果估计结果Dependent Variable:I Method:Generalized Method of Moments Date:04/11/03 Time:22:33 Sample(adjusted):1979 1996 Included observations:18 after adjusting endpoints No prewhitening Bandwidth:Fixed(2)Kernel:Bartlett Convergence achieved after:2 weight matric
29、ies,3 total coef iterations Instrument list:C G CC1 Variable Coefficient Std.Error t-Statistic Prob.C-388.2216 82.86703-4.684874 0.0002 Y 0.405241 0.004748 85.34159 0.0000 R-squared 0.996456 Mean dependent var 7923.500 Adjusted R-squared 0.996234 S.D.dependent var 7975.613 S.E.of regression 489.4184
30、 Sum squared resid 3832486.Durbin-Watson stat 1.357784 J-statistic 0.002874 六、主分量法的应用六、主分量法的应用方法的提出方法的提出 主分量方法本身并不是联立方程模型的估计方法,主分量方法本身并不是联立方程模型的估计方法,而是配合其它方法,例如而是配合其它方法,例如2SLS使用于模型的估计使用于模型的估计过程之中。过程之中。数学上的主分量方法早就成熟,数学上的主分量方法早就成熟,Kloek和和Mennes于于1960年提出将它用于计量经济学模型的估计。年提出将它用于计量经济学模型的估计。2SLS是一种普遍适用的联立方程
31、模型的单方程估是一种普遍适用的联立方程模型的单方程估计方法,但是当它在实际模型估计中被应用时,计方法,但是当它在实际模型估计中被应用时,立刻就会遇到不可逾越的困难。其第一阶段立刻就会遇到不可逾越的困难。其第一阶段用用OLS估计简化式方程,是难以实现的。估计简化式方程,是难以实现的。为什么?为什么?方法的原理方法的原理 所谓主分量方法,就是用较少数目的新变量重新所谓主分量方法,就是用较少数目的新变量重新表示原模型中较多数目的先决变量的方法。表示原模型中较多数目的先决变量的方法。例如,如果能够找到例如,如果能够找到5个左右的新变量表示宏观个左右的新变量表示宏观经济模型中的经济模型中的30个先决变量
32、,那么只需要个先决变量,那么只需要15组以组以上的样本,就可以进行上的样本,就可以进行2SLS第一阶段的估计。第一阶段的估计。对充当主分量的变量是有严格要求:对充当主分量的变量是有严格要求:一是它必须一是它必须是先决变量的线性组合,二是它们之间必须是正是先决变量的线性组合,二是它们之间必须是正交的。交的。前一条是保证主分量对先决变量的代表性;前一条是保证主分量对先决变量的代表性;后一条是保证主分量之间不出现共线性。后一条是保证主分量之间不出现共线性。主分量的选取主分量的选取 用两个主分量表示两个原变量用两个主分量表示两个原变量 Za Xa X1111122Za Xa X2211222Aaa12
33、11211222aaaa可以证明,可以证明,a1、a2分别是分别是XX的的2个特征值对应个特征值对应的特征向量。的特征向量。用用k个主分量表示个主分量表示k个原变量个原变量 同样可以证明,同样可以证明,a1、a2、ak分别是分别是XX的的k个特征值对应的特征向量。个特征值对应的特征向量。ZXAAaaa12k 用用f个主分量表示个主分量表示k个原变量个原变量 选择选择a1、a2、af分别是分别是XX的的f个最大特征值个最大特征值对应的特征向量。对应的特征向量。ZXAAaaa12f 在在2SLS中主分量的选取中主分量的选取 对于简化式方程对于简化式方程 YXXX0000000*主分量法在主分量法在
34、ILSILS中的应用中的应用 对于对于2SLS,直接利用主分量完成第一阶段的估计,直接利用主分量完成第一阶段的估计,得到内生解释变量的估计量。得到内生解释变量的估计量。对于对于ILS,必须求得到简化式参数,进而计算结构必须求得到简化式参数,进而计算结构式参数。式参数。首先估计首先估计Y=Z+,然后将然后将Z=XA代入,得到代入,得到Y=X 中中的估计量。的估计量。七、其它有限信息估计方法简介七、其它有限信息估计方法简介(Limited Information Estimation Limited Information Estimation Methods)Methods)有限信息最大或然法有
35、限信息最大或然法(LIMLLIML,Limited Information Maximum Likelihood)以最大或然为准则、通过对简化式模型进行最大以最大或然为准则、通过对简化式模型进行最大或然估计,以得到结构方程参数估计量的联立方或然估计,以得到结构方程参数估计量的联立方程模型的单方程估计方法。程模型的单方程估计方法。由由Anderson和和Rubin于于1949年提出,早于两阶年提出,早于两阶段最小二乘法。段最小二乘法。适用于恰好识别和过度识别结构方程的估计。适用于恰好识别和过度识别结构方程的估计。在该方法中,以下两个概念是重要的:在该方法中,以下两个概念是重要的:一是这里的一是这
36、里的“有限信息有限信息”指的是每次估计只考虑指的是每次估计只考虑一个结构方程的信息,而没有考虑模型系统中其一个结构方程的信息,而没有考虑模型系统中其它结构方程的信息;它结构方程的信息;二是这里的二是这里的“最大或然法最大或然法”是针对结构方程中包是针对结构方程中包含的内生变量的简化式模型的,即应用最大或然含的内生变量的简化式模型的,即应用最大或然法求得的是简化式参数估计量,而不是结构式参法求得的是简化式参数估计量,而不是结构式参数估计量。数估计量。具体参见教科书。具体参见教科书。有限信息最小方差比方法有限信息最小方差比方法(LVRLVR,Least Variable Ratio)估计某一个结构
37、方程参数时,仍然只利用关于该估计某一个结构方程参数时,仍然只利用关于该方程的信息,没有利用方程系统的信息,所以是方程的信息,没有利用方程系统的信息,所以是一种有限信息估计方法。一种有限信息估计方法。参见教科书。参见教科书。八、八、k k级估计式级估计式k k级估计式级估计式 本身不是一种估计方法,而是对上述几种方法得本身不是一种估计方法,而是对上述几种方法得到的估计式的概括。到的估计式的概括。对于联立方程模型中的第对于联立方程模型中的第1个结构方程:个结构方程:Y1001(,)YX00 k级估计式级估计式 为:为:(),)(,)(),)00000000100001YYYXYXYYYXkkY 显
38、然,当显然,当 k=0时,即为时,即为OLS估计式;估计式;k=1时,即为时,即为2SLS估计式;估计式;k等于有限信息估计方法中的时,即为有限信息等于有限信息估计方法中的时,即为有限信息估计式。估计式。k k级估计式的性质级估计式的性质 假设工具变量与随机误差项不相关,即假设工具变量与随机误差项不相关,即Pknlim()100010YYY且先决变量与随机误差项不相关,即且先决变量与随机误差项不相关,即Pnlim()1010X那么,容易证明那么,容易证明k级估计式是一致性估计式。级估计式是一致性估计式。工具变量与随机误差项不相关,对工具变量与随机误差项不相关,对k是有限制的,是有限制的,必须有(证明见教科书):必须有(证明见教科书):Pklim()10 这就是说,这就是说,只有在只有在2SLS或有限信息估计方法中,或有限信息估计方法中,k级估计式是一致性估计式,而在级估计式是一致性估计式,而在OLS方法中,不具方法中,不具有一致性。有一致性。