1、4.3 4.3 内生解释变量问题内生解释变量问题 Endogenous Independent Variable 一、内生解释变量问题一、内生解释变量问题二、实际经济问题中的内生解释变量问题二、实际经济问题中的内生解释变量问题三、内生解释变量的后果三、内生解释变量的后果四、工具变量法四、工具变量法五、内生性检验与过渡识别约束检验五、内生性检验与过渡识别约束检验六、案例六、案例 一、内生一、内生解释变量问题解释变量问题1 1、内生解释变量、内生解释变量 经典模型的基本假设之一是解释变量是严格外生经典模型的基本假设之一是解释变量是严格外生变量。变量。如果存在一个或多个变量是内生解释变量,则称如果存
2、在一个或多个变量是内生解释变量,则称原模型存在内生解释变量问题。原模型存在内生解释变量问题。对于内生解释变量问题,假设对于内生解释变量问题,假设X2为内生解释变量,为内生解释变量,又分两种不同情况:又分两种不同情况:01122iiikikiYYXXL 内生随机解释变量与随机干扰项同期无关内生随机解释变量与随机干扰项同期无关(contemporaneously uncorrelated),但异期相关。,但异期相关。0)()(2,2iiiixEXCov0)()(2,2siisiixEXCov0s 内生随机解释变量与随机干扰项同期相关内生随机解释变量与随机干扰项同期相关(contemporaneou
3、sly correlated)。0)()(2,2iiiixEXCov2 2、截面数据模型的内生解释变量问题、截面数据模型的内生解释变量问题 对于截面数据模型,上述第对于截面数据模型,上述第1种情况几乎不存在。种情况几乎不存在。截面数据模型中的内生解释变量问题主要表现在截面数据模型中的内生解释变量问题主要表现在内生解释变量与随机干扰项的同期相关性上,这内生解释变量与随机干扰项的同期相关性上,这时称内生变量为时称内生变量为同期内生变量同期内生变量。二、实际经济问题的内生解释变量问题二、实际经济问题的内生解释变量问题 三种情形:三种情形:被解释变量与解释变量具有联立因果关系被解释变量与解释变量具有联
4、立因果关系(simultaneous causality););模型设定时遗漏了重要的解释变量,而所遗漏的变量模型设定时遗漏了重要的解释变量,而所遗漏的变量与模型中的一个或多个解释变量具有同期相关性与模型中的一个或多个解释变量具有同期相关性(omitting relevant variables););解释变量存在测量误差(解释变量存在测量误差(errors-in-variables)。)。联立因果关系一例联立因果关系一例 为考察企业引进外资是否真正提高了企业的效益,以为考察企业引进外资是否真正提高了企业的效益,以企业资金利润率企业资金利润率LR为被解释变量,以企业资产中外资为被解释变量,以企
5、业资产中外资所占比例所占比例WR和其它外生变量和其它外生变量X为解释变量,建立模型。为解释变量,建立模型。通过对企业引进外资情况的实际考察发现,凡是效益通过对企业引进外资情况的实际考察发现,凡是效益好的企业,比较容易引进外资,凡是效益差的企业,好的企业,比较容易引进外资,凡是效益差的企业,引进外资就很困难。引进外资就很困难。模型中,解释变量模型中,解释变量WR既影响被解释变量既影响被解释变量LR,同时它,同时它也受被解释变量也受被解释变量LR的影响,而的影响,而LR与与具有同期相关性,具有同期相关性,从而导致从而导致WR与与具有同期相关性。具有同期相关性。011,2,iiiiLRWRinXL
6、遗漏解释变量一例遗漏解释变量一例 劳动者的工资劳动者的工资wage主要由劳动者的受教育程度主要由劳动者的受教育程度educ、工作经验工作经验exper、个人能力、个人能力abil等诸多因素决定。等诸多因素决定。由于劳动者个人能力的大小很难测度,该解释变量无由于劳动者个人能力的大小很难测度,该解释变量无法引入到工资模型中,于是它对工资的影响进入到随法引入到工资模型中,于是它对工资的影响进入到随机干扰项之中。机干扰项之中。而个人能力与其所受教育程度有着较为密切的联系,而个人能力与其所受教育程度有着较为密切的联系,这就导致了实际用于模型中的劳动者个人受教育程度这就导致了实际用于模型中的劳动者个人受教
7、育程度变量与随机干扰项间出现同期相关性。变量与随机干扰项间出现同期相关性。个人能力个人能力abil 为同期内生解释变量。为同期内生解释变量。iiiiereducwageexp210 联立因果关系:联立方程模型中的每个结构方程联立因果关系:联立方程模型中的每个结构方程 在一个经济系统中,变量之间在一个经济系统中,变量之间相互依存,互为因果,相互依存,互为因果,而不是简单的单向因果关系,必须用一组方程才能描而不是简单的单向因果关系,必须用一组方程才能描述清楚述清楚。称为。称为联立方程模型。联立方程模型。联立方程模型的每个方程称为联立方程模型的每个方程称为结构方程。结构方程。每个结构方程的被解释变量
8、是经济系统的内生变量,每个结构方程的被解释变量是经济系统的内生变量,而解释变量既包括经济系统的外生变量,也包括其它而解释变量既包括经济系统的外生变量,也包括其它内生变量,由经济行为关系决定。内生变量,由经济行为关系决定。联立方程模型的每个结构方程一般都存在内生解释变联立方程模型的每个结构方程一般都存在内生解释变量问题。量问题。例如:例如:以地区数据为样本,建立某种消费品的需求函以地区数据为样本,建立某种消费品的需求函数模型,数模型,Qi、Pi、Yi表示各个地区的需求量、价格和居表示各个地区的需求量、价格和居民收入。民收入。0121,2,iiiiQPYinL 经济学理论指出,商品价格是由供给与需
9、求的均衡经济学理论指出,商品价格是由供给与需求的均衡关系决定的,因此商品的需求量关系决定的,因此商品的需求量Qi又是影响价格又是影响价格Pi的的重要因素。即价格和需求量一样,也是该经济系统的重要因素。即价格和需求量一样,也是该经济系统的内生变量。内生变量。实际上,上述实际上,上述需求方程只是联立方程模型系统中的需求方程只是联立方程模型系统中的一个结构方程。一个结构方程。三、内生解释变量的后果三、内生解释变量的后果 计量经济学模型一旦出现内生解释变量,且与计量经济学模型一旦出现内生解释变量,且与随机扰动项相关的话,如果仍采用随机扰动项相关的话,如果仍采用OLS法估计模法估计模型参数,会产生严重的
10、后果。型参数,会产生严重的后果。下面以一元线性回归模型为例进行说明。下面以一元线性回归模型为例进行说明。1 1、内生解释变量与随机干扰项相关图、内生解释变量与随机干扰项相关图 (a)正相关(b)负相关 拟合的样本回归拟合的样本回归线可能低估截距项,线可能低估截距项,而高估斜率项。而高估斜率项。拟合的样本回归线拟合的样本回归线高估截距项,而低高估截距项,而低估斜率项。估斜率项。2、OLSOLS参数估计量是有偏、非一致性估计量。参数估计量是有偏、非一致性估计量。iiiXY102121iiiiiixxxyx11211)()(E)(iiiiikExxE11211121)(),()lim()lim(li
11、miiiiniiniiinXVarXCovxPxPxxPOLS估计有偏非一致四、工具变量法四、工具变量法 Instrument variables,IV1 1、工具变量的选取、工具变量的选取 工具变量工具变量:在模型估计过程中被作为工具使用,:在模型估计过程中被作为工具使用,以替代模型中与随机干扰项相关的内生解释变以替代模型中与随机干扰项相关的内生解释变量。量。选择为工具变量的变量必须满足以下条件:选择为工具变量的变量必须满足以下条件:与所替代的内生解释变量高度相关;与所替代的内生解释变量高度相关;与随机干扰项不相关;与随机干扰项不相关;与模型中其它解释变量不与模型中其它解释变量不高度高度相关
12、,以避免出现严相关,以避免出现严重的多重共线性。重的多重共线性。2 2、工具变量的应用、工具变量的应用01122101122112011222201122()()0()()0()()0()()0iiikkiiiiiikkiiiiiiiiikkiiiiikiiikkikiikiYXXXEY XXXXXEXY XXXXXEXY XXXXXEX01122101122112011220122122()()0()()0()()0()()0iiikkiiiiiikkiiiiiiiikkiiikiiikkikiiiiikiYXXXEYXXXXXXXEXYXXXEYXXXXXEXX多元多元线性线性模型模型的正
13、的正规方规方程组程组X2为为与与相相关的关的内生内生变量变量 几个概念问题几个概念问题能否说能否说“用工具变量代替了模型中的内生解释变量用工具变量代替了模型中的内生解释变量”?不能。模型的解释变量仍然是不能。模型的解释变量仍然是X X2 2。能否说能否说“其它解释变量用自己作为工具变量其它解释变量用自己作为工具变量”?可以。可以。能否说能否说“用用Z Z作为作为X X1 1的工具变量,用的工具变量,用X X1 1作为作为X X2 2的工具变的工具变量量”?可以。只改变方程组中方程的次序,不影响方程可以。只改变方程组中方程的次序,不影响方程组的解。组的解。01122101122110112201
14、122()()0()()0()()()(0)0iiikkiiiiiikkiiiiiiiikkiiikiiikkikiiikiiiYXXXEYXXXXXEXYXXXEYXXXXZZZXEX Z作为作为X2的工的工具变量具变量XZYZYZXZ1)(knkknnXXXZZZXXX212111211111Z 这种求模型参数估计量的方法称为这种求模型参数估计量的方法称为工具变量法工具变量法(instrumental variable method),相应的估计量称相应的估计量称为为工具变量法估计量工具变量法估计量(instrumental variable(IV)estimator)。XY工具变量矩阵工
15、具变量矩阵3 3、工具变量法估计量是一致估计量、工具变量法估计量是一致估计量 一元回归中,工具变量法估计量为一元回归中,工具变量法估计量为iiiiiiiiixzzxzxz111)(iiniinxzPzPP1111limlim)lim(0),cov(1limiiiiZznP0),cov(1limiiiiXZxznP11)lim(P4 4、在小样本下,在小样本下,IVIV估计量仍是有偏的估计量仍是有偏的0)()1()1(iiiiiiiizExzEzxzE5 5、工具变量法与两阶段最小二乘法、工具变量法与两阶段最小二乘法 工具变量法估计过程可等价地分解成两个阶段工具变量法估计过程可等价地分解成两个阶
16、段的的OLS回归回归:第一阶段,用第一阶段,用OLS法进行法进行X关于工具变量关于工具变量Z的回归,的回归,并记录并记录X的拟合值;的拟合值;第二阶段,以得到的第二阶段,以得到的X的拟合值代替的拟合值代替X 作为解释变作为解释变量,进行量,进行OLS回归。回归。被称为被称为两阶段最小二乘法两阶段最小二乘法(two stage least squares,2SLS)。)。可以严格证明:可以严格证明:2SLS与直接采用与直接采用IV是等价的。是等价的。对于一元模型:对于一元模型:X为内生变量,为内生变量,Z为工具变量为工具变量iiiXY10iiZX1001 iiYX第1阶段OLS第2阶段OLS 对
17、于二元模型:对于二元模型:X为内生解释变量,为内生解释变量,Z为外生解释为外生解释变量,变量,Z1为为X的工具变量。的工具变量。012iiiiYXZ0112iiiXZZ012iiiYXZ第1阶段OLS第2阶段OLS 对于二元模型:对于二元模型:X为内生解释变量,为内生解释变量,Z为外生解释为外生解释变量,变量,Z1和和Z2都是都是X的工具变量。的工具变量。012iiiiYXZ011223iiiiXZZZ012iiiYXZ第1阶段OLS第2阶段OLS6 6、工具变量法与广义矩方法、工具变量法与广义矩方法 如果如果1个内生解释变量可以找到多个互相独立的个内生解释变量可以找到多个互相独立的工具变量,
18、人们希望充分利用这些工具变量的信工具变量,人们希望充分利用这些工具变量的信息,就形成了息,就形成了广义矩方法广义矩方法(Generalized Method of Moments,GMM)。)。在在GMM中,矩条件大于待估参数的数量,于是如何求中,矩条件大于待估参数的数量,于是如何求解成为它的核心问题。解成为它的核心问题。2SLS是是GMM的一种特殊的估计方法,而当一个内生的一种特殊的估计方法,而当一个内生变量只有一个工具变量时所采用的变量只有一个工具变量时所采用的IV,则是,则是2SLS的一的一个特例。个特例。如果所有解释变量都是外生变量,则如果所有解释变量都是外生变量,则OLS法也可看成法
19、也可看成是是IV和和GMM的特例。的特例。五、内生性检验与过度识别约束检验五、内生性检验与过度识别约束检验1 1、HausmanHausman检验检验 如果如果显著为显著为0与与Y同期无关同期无关与与同期无关同期无关 X与与同期无关同期无关X是同期外生变量;是同期外生变量;如果如果显著不为显著不为0 与与Y同期相关同期相关与与同期相关同期相关X与与同期相关同期相关 X是同期内生变量。是同期内生变量。iiiiZXY1210iiiivZZX22110iiiiivZXY1210Z1外生,与不相关选择Z2作为X 的工具变量采用OLS估计,得到的估计植2 2、过度识别约束检验、过度识别约束检验 当当1个
20、内生解释变量有多于个内生解释变量有多于1个的工具变量时,需个的工具变量时,需要对该组工具变量的外生性进行检验,这就是要对该组工具变量的外生性进行检验,这就是过过度识别约束检验度识别约束检验(overidentifying restrictions test)。)。基本思路是:如果寻找到的工具变量具有外生性,则基本思路是:如果寻找到的工具变量具有外生性,则它们应与原模型中的随机干扰项不同期相关。因此,它们应与原模型中的随机干扰项不同期相关。因此,只需对原模型进行两阶段最小二乘回归(只需对原模型进行两阶段最小二乘回归(2SLS),将),将记录的残差项再关于所有工具变量与原模型中的外生记录的残差项再
21、关于所有工具变量与原模型中的外生变量进行变量进行OLS回归,并对该回归中的所有工具变量前回归,并对该回归中的所有工具变量前的参数都为零的假设进行联合性的参数都为零的假设进行联合性F检验。检验。例如:二元线性模型,例如:二元线性模型,X为内生解释变量,为内生解释变量,Z为外生解为外生解释变量,释变量,Z1、Z2为为X的工具变量。的工具变量。iiiiXYZ210)Z(210iiiiXYiiiiiZZZ322110)(122nRJ 如果如果J J统计量统计量的值大于给定显著性水平下的临界值,则拒绝的值大于给定显著性水平下的临界值,则拒绝Z1Z1和和Z2Z2同同时为外生变量的假设,意味着它们中至少有一
22、个时为外生变量的假设,意味着它们中至少有一个不是外生的。不是外生的。对模型进行对模型进行2SLS2SLS,得到,得到参数估计,并计算参数估计,并计算 六、案例六、案例模型模型 利用美国各州的数据为样本观测值,建立香烟需利用美国各州的数据为样本观测值,建立香烟需求模型。求模型。根据商品需求函数理论,对香烟的人均消费需求根据商品需求函数理论,对香烟的人均消费需求Q与居与居民的收入水平民的收入水平Y及香烟的销售价格及香烟的销售价格P有关。有关。考虑到在市场均衡时香烟的销售价格也同时受香烟的考虑到在市场均衡时香烟的销售价格也同时受香烟的需求量的影响,则需求量的影响,则Q与与P之间存在着双向因果关系,之
23、间存在着双向因果关系,P为内生解释变量。为内生解释变量。考虑到香烟价格中包含政府对烟草的课税,而香烟的考虑到香烟价格中包含政府对烟草的课税,而香烟的人均消费量本身不会直接影响政府对香烟的课税政策,人均消费量本身不会直接影响政府对香烟的课税政策,因此香烟的消费税可能是价格的一个适当的工具变量。因此香烟的消费税可能是价格的一个适当的工具变量。步骤步骤 对模型进行对模型进行OLS估计;估计;用香烟消费税用香烟消费税Tax为工具变量,对模型进行为工具变量,对模型进行IV估估计;计;用香烟消费税用香烟消费税Tax和额外的特别消费税和额外的特别消费税 Taxs作为作为2个工具变量,对模型进行个工具变量,对
24、模型进行2SLS估计;估计;进行过度识别约束检验,以检验进行过度识别约束检验,以检验Tax、Taxs是否是否是外生变量;是外生变量;用豪斯曼检验判定香烟价格是否确实是内生变量。用豪斯曼检验判定香烟价格是否确实是内生变量。OLS估计估计IV估计估计IV估计估计两个工具变量的两个工具变量的2SLS估计估计第第1阶段阶段两个工具变量的两个工具变量的2SLS估计估计第第2阶段阶段PF为第1阶段估计得到的log(p)的估计值 过度识别约束检验过度识别约束检验用Taxe及Taxs两个工具变量对原模型进行两阶段最小二乘估计记录的残差估计值 辅助回归辅助回归总体不显总体不显著,不拒著,不拒绝参数都绝参数都为零
25、的假为零的假设;用设;用R R2 2构造的统构造的统计量显示,计量显示,不拒绝不拒绝taxtax和和taxstaxs作为作为工具变量工具变量的外生性的外生性假设。假设。豪斯曼检验豪斯曼检验 豪斯曼检验豪斯曼检验 前一页前一页OLSOLS估计记估计记录的残差估计值录的残差估计值e1e1的的t t统计统计量和伴随概量和伴随概率显示:在率显示:在10%10%的显著的显著性水平下,性水平下,拒绝参数为拒绝参数为0 0的假设,的假设,可判断香烟可判断香烟价格是内生价格是内生变量;但在变量;但在5%5%的显著性的显著性水平下,不水平下,不拒绝参数为拒绝参数为0 0的假设,的假设,可判断香烟可判断香烟价格不是内价格不是内生变量。生变量。