1、第四章第四章 经典单方程计量经济学模型:经典单方程计量经济学模型:放宽基本假定的模型放宽基本假定的模型基本假定违背基本假定违背主要主要 包括:包括:(1)随机误差项序列存在)随机误差项序列存在异方差性异方差性;(2)随机误差项序列存在)随机误差项序列存在序列相关性序列相关性;(3)解释变量之间存在)解释变量之间存在多重共线性多重共线性;(4)解释变量是随机变量且与随机误差项相关的)解释变量是随机变量且与随机误差项相关的随随机解释变量问题机解释变量问题;(5)模型设定有偏误;)模型设定有偏误;(6)解释变量的方差不随样本容量的增而收敛。)解释变量的方差不随样本容量的增而收敛。计量经济检验:计量经
2、济检验:对模型基本假定的检验对模型基本假定的检验本章主要学习:前本章主要学习:前4类类4.1 4.1 异方差性异方差性 线性回归模型的基本假设中:线性回归模型的基本假设中:随机误随机误差项差项服从服从0 0均值均值、同方差同方差的的正态分布正态分布 即即:i N(0,2)若随机误差项不满足同方差条件,则称若随机误差项不满足同方差条件,则称出现了出现了异方差性异方差性 (Heteroskedasticity)在这一节里,我们需要弄在这一节里,我们需要弄清下列问题的答案:清下列问题的答案:异方差的性质是什么?异方差的性质是什么?异方差的后果是什么?异方差的后果是什么?如何检验异方差的存在?如何检验
3、异方差的存在?如果存在异方差,有哪些如果存在异方差,有哪些补救措施?补救措施?一、异方差的性质一、异方差的性质以个人储蓄与个人可支配收入为例以个人储蓄与个人可支配收入为例实际经济问题中的异方差性实际经济问题中的异方差性 例例4.1.1:截面资料下研究居民家庭的储蓄行为:截面资料下研究居民家庭的储蓄行为:Yi=0+1Xi+iYi:第第i个家庭的储蓄额个家庭的储蓄额 Xi:第第i个家庭的可支配收入。个家庭的可支配收入。高收入家庭:储蓄的差异较大高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小低收入家庭:储蓄则更有规律性,差异较小 i的方差呈现单调递增型变化的方差呈现单调递增型变化
4、 例例4.1,2,以绝对收入假设为理论假设、以截面,以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:数据为样本建立居民消费函数:Ci=0+1Yi+I 将居民按照收入等距离分成将居民按照收入等距离分成n组,取组平均数组,取组平均数为样本观测值。为样本观测值。v一般情况下,居民收入服从正态分布一般情况下,居民收入服从正态分布:中等收入组:中等收入组人数多,两端收入组人数少。而人数多的组平均数人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。的误差小,人数少的组平均数的误差大。v所以所以样本观测值的样本观测值的观测误差观测误差随着解释变量观测值的随着解释变量
5、观测值的不同而不同,往往引起异方差性。不同而不同,往往引起异方差性。例例4.1.3,以某一行业的企业为样本建立企业生以某一行业的企业为样本建立企业生产函数模型:产函数模型:Yi=Ai 1 Ki 2 Li 3e i 被解释变量:产出量被解释变量:产出量Y 解释变量:资本解释变量:资本K、劳动劳动L、技术技术A,那么:那么:每个企业所处的每个企业所处的外部环境外部环境对产出量对产出量的影响被包含在随机误差项中。的影响被包含在随机误差项中。每个企业所处的外部环境对产出量的影响程度每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。不同,造成了随机误差项的异方差性。这时,随机误差
6、项的方差并不随某一个解释变这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。量观测值的变化而呈规律性变化,呈现复杂型。一般异方差的符号表达为:一般异方差的符号表达为:2)(Varii异方差问题异方差问题多存在于多存在于截面数据截面数据(cross-sectional data)中而非时间序中而非时间序列数据(列数据(time-series data)。(?)。(?)在这些截面数据中,我们通常处理的是一定在这些截面数据中,我们通常处理的是一定时间上总体单位,这些总体单位具有不同的时间上总体单位,这些总体单位具有不同的规模,这就有可能出现规模效应(规模,这就有可能出
7、现规模效应(scale effect),),容易产生异方差问题。而在时序容易产生异方差问题。而在时序数据中,变量具有相似的数量级数据中,变量具有相似的数量级。思考:思考:判断下列回归中,哪些容易出现异判断下列回归中,哪些容易出现异方差性?方差性?Y X 样本样本a.公司利润公司利润 净财富净财富 财富前财富前500强强b.婴儿死亡率婴儿死亡率 人均收入人均收入 100个发达和发展国家个发达和发展国家c.通货膨胀率通货膨胀率 货币增长率货币增长率 1980-2000我国数据我国数据二、异方差的后果二、异方差的后果1.参数估计量非有效参数估计量非有效2.变量的显著性检验失去意义变量的显著性检验失去
8、意义3.模型的预测失效模型的预测失效 因为上述内容是跟随机误差项同方差因为上述内容是跟随机误差项同方差密切相关,后果表明:异方差是一个潜在密切相关,后果表明:异方差是一个潜在的严重问题,它可能破坏了常用的的严重问题,它可能破坏了常用的OLSOLS估估计和假设检验过程。计和假设检验过程。三、异方差的检验三、异方差的检验 异方差的检测方法异方差的检测方法检测方法之一:检测方法之一:根据问题的性质根据问题的性质 根据所考察问题的性质看看根据所考察问题的性质看看是否提供了存在异方差的信息是否提供了存在异方差的信息检测方法之二:检测方法之二:残差图(残差图(residual plot)的的图示检验法图示
9、检验法Xe2Xe2判断判断e2和和 X二者相关性,若相关则存在二者相关性,若相关则存在异方差。这是一种粗略检验工具,若发异方差。这是一种粗略检验工具,若发现异方差应继续检验现异方差应继续检验(2 2)X X-ei2的的散散点点图图进进行行判判断断看是否形成一斜率为零的直线看是否形成一斜率为零的直线ei2 ei2 X X 同方差 递增异方差ei2 ei2 X X 递减异方差 复杂型异方差 思考:异方差是针对随机误差项思考:异方差是针对随机误差项i的方的方差检验,为什么此处我们通过观察差检验,为什么此处我们通过观察e2和和 X的的关系就可以粗略检验异方差的存在?关系就可以粗略检验异方差的存在?i和
10、和ei二者是否是相同内容?二者是否是相同内容?i是总体误差的信息,而是总体误差的信息,而ei是样本数据的随是样本数据的随机误差信息,现实中,我们无法观察到总机误差信息,现实中,我们无法观察到总体信息,但可根据能够观察到的体信息,但可根据能够观察到的ei的变化,的变化,来推测来推测i的变化的变化又因为又因为 ,所以经验地,我,所以经验地,我们可以将们可以将 近似地表示随机误差项的方近似地表示随机误差项的方差差 222neiei2根据以上残差图,判断是否出现了异方根据以上残差图,判断是否出现了异方差问题差问题Xe2XeXeBCDAXe检测方法之三:检测方法之三:戈里瑟检验(戈里瑟检验(Glejse
11、r test)检验原理:以检验原理:以 为被解释变为被解释变量,以原模型的某一解释变量量,以原模型的某一解释变量xj为为解释变量,若能建立二者某种函数解释变量,若能建立二者某种函数形式,则说明原模型存在异方差性。形式,则说明原模型存在异方差性。ei2戈里瑟检验示例戈里瑟检验示例:在在企业企业R R&D D支出支出与与销售额销售额的关系的关系研究中,收集到美国研究中,收集到美国19981998年年1818个行业的有个行业的有关数据,容易判断此模型容易出现异方差。关数据,容易判断此模型容易出现异方差。从原始模型中获得从原始模型中获得e ei i之后,之后,GlejserGlejser建议建议作对作
12、对X X的回归,建议形式如下:的回归,建议形式如下:vxBBeiii21vxBBeiii21vxBBeiii 121估计结果:估计结果:578.57+0.0119578.57+0.0119销售额销售额 r r2 2=0.215 t=0.215 t=(0.85250.8525)()(2.09312.0931)eieiei-507.02+7.972-507.02+7.972 销售额销售额r r2 2=0.2599 t=0.2599 t=(-0.5032-0.5032)()(2.37042.3704)-2273.7-19925000-2273.7-19925000销售额销售额1 1r r2 2=0.
13、1405 t=0.1405 t=(3.76013.7601)()(-1.6175-1.6175)结论:存在异方差结论:存在异方差三、三、G-Q(Goldfeld-Quandt)检验检验 检验原理:先按某一解释变量对样本排检验原理:先按某一解释变量对样本排序,再将排序后的样本一分为二,对两个序,再将排序后的样本一分为二,对两个子样本分别进行子样本分别进行OLS回归,然后利用两个回归,然后利用两个子样本的残差平方和之比构造子样本的残差平方和之比构造F统计量进行统计量进行异方差检验。异方差检验。检验步骤检验步骤:(:(详见书第详见书第98页)页)其他检验方法:其他检验方法:斯皮尔曼(斯皮尔曼(Spe
14、arman)秩秩相关检验相关检验 怀特(怀特(White)检验等等检验等等四、如何消除异方差四、如何消除异方差 出现异方差后的补救措施出现异方差后的补救措施1、消除规模效应消除规模效应简单实用的方法简单实用的方法 例:考察收入与消费关系时,若收集的例:考察收入与消费关系时,若收集的是横截面数据,则容易产生异方差,为避是横截面数据,则容易产生异方差,为避免异方差的出现,就可以采用免异方差的出现,就可以采用按规模分别按规模分别建模建模(以收入高低分层)的方法来消除规(以收入高低分层)的方法来消除规模效应模效应2、加权最小二乘法加权最小二乘法(WLS,Weighted least Squares)在
15、在OLSOLS中,每一个都有同样的权重,无论它是中,每一个都有同样的权重,无论它是来源于一个较大还是较小方差的总体,这样来源于一个较大还是较小方差的总体,这样做并不明智,我们应该给方差较小的观测值做并不明智,我们应该给方差较小的观测值以更大的权重(为什么?),而给那些方差以更大的权重(为什么?),而给那些方差较大的观测值较小的权重,这才能更为准确较大的观测值较小的权重,这才能更为准确地估计总体真实情况,得到更为准确的回归地估计总体真实情况,得到更为准确的回归模型模型情形一:情形一:已知已知2i 步骤:步骤:1 1)对模型作以下变换:)对模型作以下变换:即:即:2 2)再对新模型(不再具有异方差
16、)再对新模型(不再具有异方差)用用OLSOLS方法估计方法估计iiiiiiixy10vxyiiiii10情形二:情形二:未知未知2i 例:在例:在R R&D D支出支出与与销售额销售额关系研关系研究中,原回归模型:究中,原回归模型:R R&D D=192.96+0.0319=192.96+0.0319销售额销售额 r r2 2=0.4783=0.4783(0.1950.195)()(3.833.83)X Variable 1 Residual Plot-10000-500005000100000100000200000300000400000X Variable 1残差 由残差图可知,随着由残
17、差图可知,随着销售销售的增加,的增加,R R&D D的变动幅度也增大,存在异方差,的变动幅度也增大,存在异方差,可设与销售成比例即可设与销售成比例即 =x xi i做变换:做变换:对新样本(对新样本(,)用)用OLSOLS得:得:ei2xxxxxyiiiiiii10 xxiixyiixxxyiiii0368.068.246t=(-0.6472)()(5.1723)r2=0.6258五、异方差问题的应用实例五、异方差问题的应用实例1、纽约股票交易所(、纽约股票交易所(NYSE)最初是反对经济佣最初是反对经济佣金率放松管制的,金率放松管制的,1975年以前,年以前,NYSE向股票交向股票交易委员会
18、(易委员会(SEC)提交了一份计量经济研究报告,提交了一份计量经济研究报告,认为在经济行业中存在规模经济,因此由垄断决认为在经济行业中存在规模经济,因此由垄断决定的固定佣金率是公正的。其中报告主要经济分定的固定佣金率是公正的。其中报告主要经济分析是基于以下模型:析是基于以下模型:yi=478000+31.348xi-(1.08310-6)xi2 t=(2.98)(40.39)(-6.54)r2=0.934其中:其中:Y是总成本是总成本 X为股票交易的数量为股票交易的数量然而美国司法部反托拉斯局却认为模型中然而美国司法部反托拉斯局却认为模型中所声称的规模经济只是幻想,因为模型中所声称的规模经济只
19、是幻想,因为模型中存在明显异方差问题。(为什么?)假设存在明显异方差问题。(为什么?)假设误差项与交易量成正比,反托拉斯局重新误差项与交易量成正比,反托拉斯局重新估计了模型,得到以下模型:估计了模型,得到以下模型:yi=342000+25.57xi+(4.3410-6)xi2 t=(32.3)(7.07)(0.503)其中:其中:Y是总成本是总成本 X为股票交易的数量为股票交易的数量从而推翻了从而推翻了NYSE的垄断佣金结构的论点的垄断佣金结构的论点案例案例2-2-中国农村居民人均消费函数中国农村居民人均消费函数 例例4.1.4 中国农村居民人均消费支出主要由中国农村居民人均消费支出主要由人均
20、纯收入来决定。人均纯收入来决定。农村人均纯收入包括农村人均纯收入包括(1)(1)从事农业经营的收从事农业经营的收入,入,(2)(2)包括从事其他产业的经营性收入包括从事其他产业的经营性收入(3)(3)工工资性收入、资性收入、(4)(4)财产收入财产收入(4)(4)转移支付收入。转移支付收入。考察考察从事农业经营的收入从事农业经营的收入(X1 1)和和其他收入其他收入(X2 2)对中国对中国农村居民消费支出农村居民消费支出(Y)增长的影响增长的影响:22110lnlnlnXXY表表 4.1.1 中中国国 2001年年各各地地区区农农村村居居民民家家庭庭人人均均纯纯收收入入与与消消费费支支出出相相
21、关关数数据据(单单位位:元元)地区 人均消费 支出 Y 从事农业经营 的收入 1X 其他收入 2X 地区 人均消费 支出 Y 从事农业经营 的收入 1X 其他收入 2X 北 京 3552.1 579.1 4446.4 湖 北 2703.36 1242.9 2526.9 天 津 2050.9 1314.6 2633.1 湖 南 1550.62 1068.8 875.6 河 北 1429.8 928.8 1674.8 广 东 1357.43 1386.7 839.8 山 西 1221.6 609.8 1346.2 广 西 1475.16 883.2 1088.0 内蒙古 1554.6 1492.8
22、 480.5 海 南 1497.52 919.3 1067.7 辽 宁 1786.3 1254.3 1303.6 重 庆 1098.39 764.0 647.8 吉 林 1661.7 1634.6 547.6 四 川 1336.25 889.4 644.3 黑龙江 1604.5 1684.1 596.2 贵 州 1123.71 589.6 814.4 上 海 4753.2 652.5 5218.4 云 南 1331.03 614.8 876.0 江 苏 2374.7 1177.6 2607.2 西 藏 1127.37 621.6 887.0 浙 江 3479.2 985.8 3596.6 陕
23、西 1330.45 803.8 753.5 安 徽 1412.4 1013.1 1006.9 甘 肃 1388.79 859.6 963.4 福 建 2503.1 1053.0 2327.7 青 海 1350.23 1300.1 410.3 江 西 1720.0 1027.8 1203.8 宁 夏 2703.36 1242.9 2526.9 山 东 1905.0 1293.0 1511.6 新 疆 1550.62 1068.8 875.6 河 南 1375.6 1083.8 1014.1 普通最小二乘法的估计结果:普通最小二乘法的估计结果:21ln5084.0ln3166.0655.1lnXX
24、Y (1.87)(3.02)(10.04)2R=0.7831 2R=0.7676 DW=1.89 F=50.53 RSS=0.8232 异方差检验异方差检验 原模型的加权最小二乘回归原模型的加权最小二乘回归 对原模型进行对原模型进行OLS估计,得到随机误差项的估计,得到随机误差项的近似估计量近似估计量i,以此构成权矩阵以此构成权矩阵 2W的估计量;的估计量;再以再以1/|i|为权重为权重进行进行WLS估计,得估计,得 21ln527.0ln319.0497.1lnXXY (5.12)(5.94)(28.94)2R=0.9999 2R=0.9999 DW=2.49 F=924432 RSS=0.0706 各项统计检验指标全面改善各项统计检验指标全面改善