1、基本假定违背基本假定违背:不满足基本假定的情况。主要 包括: (1)随机误差项序列存在异方差异方差性; (2)随机误差项序列存在序列相关序列相关性; (3)解释变量之间存在多重共线多重共线性; (4)解释变量是随机变量且与随机误差项相关 (随机解释变量随机解释变量); 此外: (5)模型设定有偏误 (6)解释变量的方差不随样本容量的增而收敛 计量经济检验:计量经济检验:对模型基本假定的检验对模型基本假定的检验 本章主要学习:前本章主要学习:前4 4类类 第四章第四章 经典单方程计量经济学模型:放宽经典单方程计量经济学模型:放宽 基本假定的模型基本假定的模型 4.1 异方差性异方差性 一、异方差
2、的一、异方差的概念概念 二、异方差的类型二、异方差的类型 三、实际经济问题中的异方差性三、实际经济问题中的异方差性 四、异方差性的后果四、异方差性的后果 五、异方差性的检验五、异方差性的检验 六、异方差的修正六、异方差的修正 七、案例七、案例 对于模型 ikikiiii XXXY 2210 如果出现 Var ii () 2 即对于不同的样本点对于不同的样本点,随机误差项的方差不再随机误差项的方差不再 是常数是常数,而互不相同而互不相同,则认为出现了则认为出现了异方差性异方差性 (Heteroskedasticity)。 一、异方差的概念一、异方差的概念 二、异方差的类型二、异方差的类型 同方差
3、同方差性假定性假定:i2 = 常数 f(Xi) 异方差异方差时:时: i2 = f(Xi) 异方差一般可归结为异方差一般可归结为三种类型三种类型: (1)单调递增型: i2随X的增大而增大 (2)单调递减型: i2随X的增大而减小 (3)复 杂 型: i2与X的变化呈复杂形式 三、实际经济问题中的异方差性三、实际经济问题中的异方差性 例例4.1.1:截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i Yi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入 高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小 i的方差呈现单调递增型变化的方差呈现单调递增型变化 例例4.1,2,
4、以绝对收入假设为理论假设、以截面 数据为样本建立居民消费函数: Ci=0+1Yi+I 将居民按照收入等距离分成n组,取组平均数为样 本观测值。 一般情况下,居民收入服从正态分布一般情况下,居民收入服从正态分布:中等收入 组人数多,两端收入组人数少。而人数多的组平均 数的误差小,人数少的组平均数的误差大。 所以所以样本观测值的观测误差观测误差随着解释变量观测值 的不同而不同,往往引起异方差性。 例例4.1.3,以某一行业的企业为样本建立企业生产 函数模型 Yi=Ai1 Ki2 Li3ei 被解释变量:产出量Y 解释变量:资本K、劳动L、技术A, 那么:每个企业所处的外部环境外部环境对产出量的影响
5、被 包含在随机误差项中。 每个企业所处的外部环境对产出量的影响程度不 同,造成了随机误差项的异方差性。 这时,随机误差项的方差并不随某一个解释变量 观测值的变化而呈规律性变化,呈现复杂型。 四、异方差性的后果四、异方差性的后果 计量经济学模型一旦出现异方差性,如果仍采 用OLS估计模型参数,会产生下列不良后果: 1 1、参数估计量非有效、参数估计量非有效 OLS估计量仍然具有仍然具有无偏性无偏性,但不具有不具有有效性有效性 因为在有效性证明中利用了 E()=2I 而且,在大样本情况下,尽管参数估计量具有 一致性一致性,但仍然不具有渐近有效性渐近有效性。 2 2、变量的显著性检验失去意义、变量的
6、显著性检验失去意义 变量的显著性检验中,构造了t统计量 其他检验也是如此。 3 3、模型的预测失效、模型的预测失效 一方面,由于上述后果,使得模型不具有 良好的统计性质; 所以,当模型出现异方差性时,参数OLS 估计值的变异程度增大,从而造成对Y的预测 误差变大,降低预测精度,预测功能失效。 五、异方差性的检验五、异方差性的检验 检验思路:检验思路: 由于异方差性异方差性就是相对于不同的解释变量 观测值,随机误差项具有不同的方差。那么: 检验异方差性,也就是检验随机误差项的检验异方差性,也就是检验随机误差项的 方差与解释变量观测值之间的相关性及其相方差与解释变量观测值之间的相关性及其相 关的关
7、的“形式形式”。 问题在于用什么来表示随机误差项的方差问题在于用什么来表示随机误差项的方差 一般的处理方法:一般的处理方法: 首先采用 OLS 法估计模型,以求得随机误差项的 估计量 (注意, 该估计量是不严格的) , 我们称之为 “近近 似估计量似估计量” ,用 ei表示。于是有 VarEe iii ()() 22 ( )eyy iiils 0 几种异方差的检验方法:几种异方差的检验方法: 1 1、图示法、图示法 (1)用)用X-Y的散点图进行判断的散点图进行判断 看是否存在明显的散点扩大散点扩大、缩小缩小或复杂型复杂型 趋势趋势(即不在一个固定的带型域中) ( (2 2) )X X- -
8、ei 2 的的散散点点图图进进行行判判断断 看是否形成一斜率为零的直线 ei 2 ei 2 X X 同方差 递增异方差 ei 2 ei 2 X X 递减异方差 复杂型异方差 2 2、帕克、帕克( (Park)检验与戈里瑟检验与戈里瑟( (Gleiser)检验检验 基本思想基本思想: : 偿试建立方程: ijii Xfe)( 2 或 ijii Xfe)(| | 选择关于变量X的不同的函数形式,对方程进 行估计并进行显著性检验,如果存在某一种函 数形式,使得方程显著成立,则说明原模型存 在异方差性。 如: 帕克检验常用的函数形式: i eXXf jiji 2 )( 或 ijii Xelnln) l
9、n( 22 若若 在统计上是显著的,表明存在异方差性在统计上是显著的,表明存在异方差性。 3 3、戈德菲尔德、戈德菲尔德- -匡特匡特( (GoldfeldGoldfeld-Quandt-Quandt) )检验检验 G-Q检验以F检验为基础,适用于样本容量较大、 异方差递增或递减的情况。 G-QG-Q检验的思想检验的思想: 先将样本一分为二,对子样和子样分别 作回归,然后利用两个子样的残差平方和之比构 造统计量进行异方差检验。 由于该统计量服从F分布,因此假如存在递增 的异方差,则F远大于1;反之就会等于1(同方 差)、或小于1(递减方差)。 G-Q G-Q检验的步骤:检验的步骤: 将n对样本
10、观察值(Xi,Yi)按观察值Xi的大小 排队 将序列中间的c=n/4个观察值除去,并将剩 下的观察值划分为较小与较大的相同的两个 子样本,每个子样样本容量均为(n-c)/2 对每个子样分别进行OLS回归,并计算各自 的残差平方和 在同方差性假定下,构造如下满足F分布的 统计量 ) 1 2 , 1 2 ( ) 1 2 ( ) 1 2 ( 2 1 2 2 k cn k cn F k cn e k cn e F i i 给定显著性水平,确定临界值F(v1,v2), 若F F(v1,v2), 则拒绝同方差性假设,表明 存在异方差存在异方差。 当然,还可根据两个残差平方和对应的子样 的顺序判断是递增型异
11、方差还是递减异型方差。 4 4、怀特(、怀特(White)检验)检验 怀特检验不需要排序,且适合任何形式的异方差 怀特检验的基本思想与步骤怀特检验的基本思想与步骤(以二元为例): iiii XXY 22110 然后做如下辅助回归 iiiiiiii XXXXXXe 215 2 24 2 1322110 2 可以证明,在同方差假设下: (*) R2为(*)的可决系数,h为(*)式解释变量的个数, 表示渐近服从某分布。 注意:注意: 辅助回归仍是检验与解释变量可能的组合的 显著性,因此,辅助回归方程中还可引入解释 变量的更高次方。 如果存在异方差性,则表明确与解释变量的 某种组合有显著的相关性,这时
12、往往显示出有 较高的可决系数以及某一参数的t检验值较大。 当然,在多元回归中,由于辅助回归方程中 可能有太多解释变量,从而使自由度减少,有 时可去掉交叉项。 六、异方差的修正异方差的修正 模型检验出存在异方差性,可用加权最小二乘加权最小二乘 法法(Weighted Least Squares, WLS)进行估计。 加权最小二乘法的基本思想:加权最小二乘法的基本思想: 加权最小二乘法加权最小二乘法是对原模型加权,使之变成一 个新的不存在异方差性的模型,然后采用OLS估 计其参数。 在采用OLS方法时: 对较小的残差平方ei2赋予较大的权数, 对较大的残差平方ei2赋予较小的权数。 2 110 2
13、 ) ( kkiiii XXYWeW 例如例如,如果对一多元模型,经检验知: 222 )()()( jiiii XfEVar i ji i jiji i ji X Xf X XfXf Y Xf 22110 )( 1 )( 1 )( 1 )( 1 i ji ki ji k Xf X Xf )( 1 )( 1 新模型中,存在 222 )( )( 1 ) )( 1 () )( 1 ( i ji i ji i ji E XfXf E Xf Var 即满足同方差性,可用OLS法估计。 一般情况下一般情况下: 对于模型 Y=X + 存在 W 2 )()( 0)( ECov E W w w wn 1 2 即
14、存在异方差性异方差性。 W是一对称正定矩阵,存在一可逆矩阵D使得 W=DD 用D-1左乘 Y=X + 两边,得到一个新的模型: DXDYD 111 * XY 该模型具有同方差性。因为 121121 1111 )()()( DDDDDD DDDD * EEE I 2 * 1 * )( YXXX YWXXWX YDDXXDDX 111 11111 )( )( 这就是原模型 Y=X + 的加权最小二乘估计量加权最小二乘估计量,是无偏、有效的估计量。 这里权矩阵为D-1,它来自于原模型残差项 的方差-协方差矩阵2W 。 如何得到如何得到2W ? 从前面的推导过程看,它来自于原模型残差项 的方差-协方差
15、矩阵。因此 仍对原模型进行OLS估计,得到随机误差项的 近似估计量i,以此构成权矩阵的估计量,即 2 2 1 2 n e e W 这时可直接以 | | /1 ,|, | /1|, | /1 21 1 n eeediag D 作为权矩阵。 注意:注意: 在实际操作中人们通常采用如下的经验 方法: 不对原模型进行异方差性检验,而是直接不对原模型进行异方差性检验,而是直接 选择加权最小二乘法,尤其是采用截面数据选择加权最小二乘法,尤其是采用截面数据 作样本时。作样本时。 如果确实存在异方差,则被有效地消除了; 如果不存在异方差性,则加权最小二乘法 等价于普通最小二乘法 七、案例七、案例-中国农村居民
16、人均消费函数中国农村居民人均消费函数 例例4.1.4 中国农村居民人均消费支出主要由人 均纯收入来决定。 农村人均纯收入包括(1)从事农业经营的收入, (2)包括从事其他产业的经营性收入(3)工资性收 入、(4)财产收入(4)转移支付收入。 考察从事农业经营的收入从事农业经营的收入( (X1 1) )和其他收入其他收入( (X2 2) ) 对中国农村居民消费支出农村居民消费支出( (Y) )增长的影响: 22110 lnlnlnXXY 表表 4.1.1 中中国国 2001年年各各地地区区农农村村居居民民家家庭庭人人均均纯纯收收入入与与消消费费支支出出相相关关数数据据(单单位位:元元) 地区 人
17、均消费 支出 Y 从事农业经营 的收入 1 X 其他收入 2 X 地区 人均消费 支出 Y 从事农业经营 的收入 1 X 其他收入 2 X 北 京 3552.1 579.1 4446.4 湖 北 2703.36 1242.9 2526.9 天 津 2050.9 1314.6 2633.1 湖 南 1550.62 1068.8 875.6 河 北 1429.8 928.8 1674.8 广 东 1357.43 1386.7 839.8 山 西 1221.6 609.8 1346.2 广 西 1475.16 883.2 1088.0 内蒙古 1554.6 1492.8 480.5 海 南 1497
18、.52 919.3 1067.7 辽 宁 1786.3 1254.3 1303.6 重 庆 1098.39 764.0 647.8 吉 林 1661.7 1634.6 547.6 四 川 1336.25 889.4 644.3 黑龙江 1604.5 1684.1 596.2 贵 州 1123.71 589.6 814.4 上 海 4753.2 652.5 5218.4 云 南 1331.03 614.8 876.0 江 苏 2374.7 1177.6 2607.2 西 藏 1127.37 621.6 887.0 浙 江 3479.2 985.8 3596.6 陕 西 1330.45 803.8
19、 753.5 安 徽 1412.4 1013.1 1006.9 甘 肃 1388.79 859.6 963.4 福 建 2503.1 1053.0 2327.7 青 海 1350.23 1300.1 410.3 江 西 1720.0 1027.8 1203.8 宁 夏 2703.36 1242.9 2526.9 山 东 1905.0 1293.0 1511.6 新 疆 1550.62 1068.8 875.6 河 南 1375.6 1083.8 1014.1 普通最小二乘法的估计结果: 21 ln5084.0ln3166.0655.1 lnXXY (1.87) (3.02) (10.04) 2
20、 R=0.7831 2 R=0.7676 DW=1.89 F=50.53 RSS=0.8232 异方差检验 进一步的统计检验进一步的统计检验 (1)G-Q检验检验 将原始数据按X2排成升序,去掉中间的7个数据, 得两个容量为12的子样本。 对两个子样本分别作OLS回归,求各自的残差平 方和RSS1和RSS2: 子样本1: 21 ln119. 0ln343. 0061. 4 lnXXY (3.18) (4.13) (0.94) R2=0.7068, RSS1=0.0648 子样本2: 21 ln776. 0ln138. 0791. 0 lnXXY (0.43) (0.73) (6.53) R2=
21、0.8339, RSS2=0.2729 计算计算F F统计量:统计量: F= RSS2/RSS1=0.2792/0.0648=4.31 查表查表 给定=5%,查得临界值 F0.05(9,9)=2.97 判断判断 F F0.05(9,9) 否定两组子样方差相同的假设,从而该总体随 机项存在递增异方差性存在递增异方差性。 (2 2)怀特检验)怀特检验 作辅助回归: 2 22 2 11 2 )(ln026. 0ln055. 0)(ln015. 0ln102. 017. 0XXXXe (-0.04)(0.10) (0.21) (-0.12) (1.47) 21 lnln043. 0XX (-1.11)
22、 R2 =0.4638 似乎没有哪个参数的t检验是显著的 。但 n R2 =31*0.4638=14.38 =5%下,临界值 20.05(5)=11.07,拒绝拒绝同方差性同方差性 去掉交叉项后的辅助回归结果 2 22 2 11 2 )(ln039. 0ln539. 0)(ln042. 0ln570. 0842. 3XXXXe (1.36) (-0.64) (064) (-2.76) (2.90) R2 =0.4374 X2项与X2的平方项的参数的t检验是显著的,且 n R2 =31 0.4374=13.56 =5%下,临界值 20.05(4)=9.49 拒绝拒绝同方差同方差的原假设的原假设 原模型的加权最小二乘回归原模型的加权最小二乘回归 对原模型进行OLS估计,得到随机误差项的近 似估计量i,以此构成权矩阵2W的估计量; 再以1/| i|为权重进行WLS估计,得 21 ln527.0ln319.0497.1 lnXXY (5.12) (5.94) (28.94) 2 R=0.9999 2 R=0.9999 DW=2.49 F=924432 RSS=0.0706 各项统计检验指标全面改善各项统计检验指标全面改善