1、.1异方差性异方差性计量经济学计量经济学第五章第五章.2引子:引子:更为接近真实的结论是什么?更为接近真实的结论是什么?根据四川省根据四川省20002000年年2121个地市州医疗机构数与人个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对建立卫生医疗机构数与人口数的回归模型。对模型估计的结果如下:模型估计的结果如下:式中式中Y Y表示卫生医疗机构数(个),表示卫生医疗机构数(个),X X表示人口表示人口数量(万人)。数量(万人)。22563.05485.3735(291.5778)(0.644284)
2、(1.931062)(8.340265)0.7854560.77414669.56003iiYXtRRF .3模型显示的结果和问题模型显示的结果和问题 人口数量对应参数的标准误差较小;人口数量对应参数的标准误差较小;t统计量远大于临界值,可决系数和修正的可决系统计量远大于临界值,可决系数和修正的可决系 数结果较好,数结果较好,F检验结果明显显著;检验结果明显显著;表明该模型的估计效果不错,可以认为人口数量表明该模型的估计效果不错,可以认为人口数量 每增加每增加1 1万人,平均说来医疗机构将增加万人,平均说来医疗机构将增加5.37355.3735人。人。然而,这里得出的结论可能是不可靠的,平均说
3、来每然而,这里得出的结论可能是不可靠的,平均说来每增加增加1 1万人口可能并不需要增加这样多的医疗机构,万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。所得结论并不符合真实情况。有什么充分的理由说明这一回归结果不可靠呢?更为有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?接近真实的结论又是什么呢?.4 本章讨论下列问题:本章讨论下列问题:异方差性的概念异方差性的概念 异方差性的后果异方差性的后果 异方差性的检验异方差性的检验 异方差的补救措施异方差的补救措施 案例分析案例分析第五章第五章 异异 方方 差差 性性.5第一节第一节 异方差性的概念异方差性的
4、概念 本节基本内容:本节基本内容:异方差性的实质异方差性的实质 异方差产生的原因异方差产生的原因.6 一、异方差性的实质一、异方差性的实质 同方差的含义同方差的含义 同方差性:对所有的同方差性:对所有的 有:有:(5.15.1)因为方差是度量被解释变量因为方差是度量被解释变量Y Y的观测值围绕回归线的观测值围绕回归线 (5.25.2)的分散程度,因此同方差性指的是所有观测值的的分散程度,因此同方差性指的是所有观测值的 分散程度相同。分散程度相同。(1,2,.,)i in2Var()=iu12233E().iiikkiYXXX.7.8 设模型为设模型为 如果对于模型中随机误差项如果对于模型中随机
5、误差项 有:有:则称具有异方差性。进一步,把异方差看成是由于某则称具有异方差性。进一步,把异方差看成是由于某个解释变量的变化而引起的,则个解释变量的变化而引起的,则 异方差的含义异方差的含义iu(5.4)(5.3)122331,2,.,.iiiikkiYXXXuin2Var(),1,2,3,.,iiuin22Var()()iiiuf X.99.5The variance of Yiincreases as family income,Xi,increases.Heteroscedasticity Case.x1x11x12Yif(Yi)expenditurex13.incomeVar(ui)=
6、E(ui2)=i2.10二、产生异方差的原因二、产生异方差的原因(一)模型中省略了某些重要的解释变量(一)模型中省略了某些重要的解释变量假设正确的计量模型是:假设正确的计量模型是:假如略去假如略去 ,而采用,而采用 (5.5)当被略去的当被略去的 与与 有呈同方向或反方向变有呈同方向或反方向变 化的趋势时化的趋势时,随随 的有规律变化会体现在(的有规律变化会体现在(5.5)式的式的 中。中。12233iiiiYXXu3iX*122iiiYXu3iX2iX*iu2iX.11(二)模型的设定误差(二)模型的设定误差 模型的设定主要包括变量的选择和模型数学模型的设定主要包括变量的选择和模型数学形式的
7、确定。模型中略去了重要解释变量常形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能间本来为非线性的关系设定为线性,也可能导致异方差。导致异方差。(三)数据的测量误差(三)数据的测量误差 样本数据的观测误差有可能随研究范围的扩样本数据的观测误差有可能随研究范围的扩大大 而增加,或随时间的推移逐步积累,也可而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。能随着观测技术的提高而逐步减小。.12(四)截面数
8、据中总体各单位的差异(四)截面数据中总体各单位的差异 通常认为,截面数据较时间序列数据更容易产生通常认为,截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异,一异方差。这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。不过,般说来会大于同一对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。出现比截面数据更严重的异方差。.13第二节第二节 异方差性的后果异方差性的后果 本节基本内容:本节基本内容:对参数估计式统计特性的影响对参数估计式统计特性的影响 对模型假设检验的影
9、响对模型假设检验的影响 对预测的影响对预测的影响.14一、对参数估计统计特性的影响一、对参数估计统计特性的影响(一)参数估计的无偏性仍然成立(一)参数估计的无偏性仍然成立 参数估计的无偏性仅依赖于基本假定中的零均值参数估计的无偏性仅依赖于基本假定中的零均值 假定(即假定(即 )。所以异方差的存在对无偏性)。所以异方差的存在对无偏性 的成立没有影响。的成立没有影响。(二)参数估计的方差不再是最小的(二)参数估计的方差不再是最小的 同方差假定是同方差假定是OLS估计方差最小的前提条件,所估计方差最小的前提条件,所 以随机误差项是异方差时,将不能再保证最小二以随机误差项是异方差时,将不能再保证最小二
10、 乘估计的方差最小。乘估计的方差最小。E()0iu.15 二、对模型假设检验的影响二、对模型假设检验的影响由于异方差的影响,使得无法正确估计参数的标由于异方差的影响,使得无法正确估计参数的标准误差,导致参数估计的准误差,导致参数估计的 t 统计量的值不能正确统计量的值不能正确确定,所以,如果仍用确定,所以,如果仍用 t 统计量进行参数的显著统计量进行参数的显著性检验将失去意义。性检验将失去意义。.16尽管参数的尽管参数的OLS估计量仍然无偏,并且基于此的估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量不是有效预测也是无偏的,但是由于参数估计量不是有效的,从而对的,从而对Y Y的预
11、测也将不是有效的。的预测也将不是有效的。三、对预测的影响三、对预测的影响.17第三节第三节 异方差性的检验异方差性的检验常用检验方法常用检验方法:图示检验法图示检验法 戈德菲尔德戈德菲尔德-夸特检验夸特检验 WhiteWhite检验检验 ARCHARCH检验检验 GlejserGlejser检验检验.18一、图示检验法一、图示检验法 (一)相关图形分析(一)相关图形分析 方差描述的是随机变量取值的(与其均值的)离散方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释变量程度。因为被解释变量Y Y与随机误差项与随机误差项 有相同的有相同的方差,所以利用分析方差,所以利用分析Y Y与与X
12、X的相关图形,可以初略地的相关图形,可以初略地看到看到Y Y的离散程度与的离散程度与X X之间是否有相关关系。之间是否有相关关系。如果随着如果随着X X的增加,的增加,Y Y的离散程度为逐渐增大(或减的离散程度为逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)小)的变化趋势,则认为存在递增型(或递减型)的异方差。的异方差。u.19用用19981998年四川省各地市州农村居民家庭消费支出与家庭纯年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据,绘制出消费支出对纯收入的散点图收入的数据,绘制出消费支出对纯收入的散点图,其中用其中用 表示农村家庭消费支出,表示农村家庭消费支出,表示家
13、庭纯收入。表示家庭纯收入。1Y1X图形举例图形举例.20设一元线性回归模型为:设一元线性回归模型为:运用运用OLS法估计法估计,得样本回归模型为:得样本回归模型为:由上两式得残差:由上两式得残差:绘制出绘制出 对对 的散点图的散点图如果如果 不随不随 而变化,则表明而变化,则表明不存在异方差不存在异方差;如果如果 随随 而变化,则表明而变化,则表明存在异方差存在异方差。(二)残差图形分析(二)残差图形分析iiiY Xu12iiY=+X12iiieYY2ieiX2ie2ieiXiX.21二、二、Goldfeld-Quanadt检验检验 作用作用:检验递增性:检验递增性(或递减性或递减性)异方差。
14、异方差。基本思想基本思想:将样本分为两部分,然后分别对两个样:将样本分为两部分,然后分别对两个样 本进行回归,并计算两个子样的残差平方和所构成本进行回归,并计算两个子样的残差平方和所构成 的比,以此为统计量来判断是否存在异方差。的比,以此为统计量来判断是否存在异方差。(一)(一)检验的前提条件检验的前提条件 1 1、要求检验使用的为大样本容量。、要求检验使用的为大样本容量。2 2、除了同方差假定不成立外,其它假定均满足。、除了同方差假定不成立外,其它假定均满足。.22(二)检验的具体做法(二)检验的具体做法1.1.排序(排序(SORT X)将解释变量的取值按从小到大排序。将解释变量的取值按从小
15、到大排序。2.2.数据分组数据分组 将排列在中间的约将排列在中间的约1/41/4的观察值删除掉,记的观察值删除掉,记 为为c c,再将剩余的分为两个部分,每部分观察,再将剩余的分为两个部分,每部分观察 值的个数为值的个数为(n-c)/2(n-c)/2。3.3.提出假设提出假设222220112H:,=1,2,.,;H:in=in.234.4.构造构造F统计量统计量 分别对上述两个部分的观察值求回归模型,由此分别对上述两个部分的观察值求回归模型,由此 得到的两个部分的残差平方为得到的两个部分的残差平方为 和和 。为前一部分样本回归产生的残差平方和,为前一部分样本回归产生的残差平方和,为后一部分样
16、本回归产生的残差平方和。它为后一部分样本回归产生的残差平方和。它 们的自由度均为们的自由度均为 ,k k为参数的个数。为参数的个数。21ie22ie22ie21ie()/2nck.24 在原假设成立的条件下,因在原假设成立的条件下,因 和和 自由度均自由度均为为(n-c)/2-k(n-c)/2-k的的 分布,可导出:分布,可导出:(5.135.13)21ie22ie22222211()ii*iincnckkn ce/keF=F,n cee/k22222.255.5.判断判断 给定显著性水平给定显著性水平 ,查,查 F分布表得临界值分布表得临界值 计算统计量计算统计量 。如果如果 则拒绝原假设,
17、接受备择假设,即模型中的则拒绝原假设,接受备择假设,即模型中的 随机误差存在异方差。随机误差存在异方差。,22()ncncFkk*F*,22()ncncFFkk.26 要求大样本要求大样本 异方差的表现既可为递增型,也可为递减型异方差的表现既可为递增型,也可为递减型 检验结果与选择数据删除的个数检验结果与选择数据删除的个数C C的大小有关的大小有关 只能判断异方差是否存在,在多个解释变量的只能判断异方差是否存在,在多个解释变量的情下,对哪一个变量引起异方差的判断存在局限。情下,对哪一个变量引起异方差的判断存在局限。(三)检验的特点(三)检验的特点.27三、三、White检验检验(一)(一)基本
18、思想基本思想:不需要关于异方差的任何先验信息,只需要在大不需要关于异方差的任何先验信息,只需要在大样本的情况下,将样本的情况下,将OLS估计后的残差平方对常数、估计后的残差平方对常数、解释变量、解释变量的平方及其交叉乘积等所构解释变量、解释变量的平方及其交叉乘积等所构成一个辅助回归,利用辅助回归建立相应的检验成一个辅助回归,利用辅助回归建立相应的检验统计量来判断异方差性。统计量来判断异方差性。.28(二二)检验的特点检验的特点 要求变量的取值为大样本要求变量的取值为大样本 不仅能够检验异方差的存在性,同时在多变量的不仅能够检验异方差的存在性,同时在多变量的 情况下,还能判断出是哪一个变量引起的
19、异方差。情况下,还能判断出是哪一个变量引起的异方差。.29(三)检验的基本步骤(三)检验的基本步骤 以一个二元线性回归模型为例,设模型为:以一个二元线性回归模型为例,设模型为:(5.14)(5.14)并且,设异方差与并且,设异方差与 的一般关系为的一般关系为 其中其中 为随机误差项。为随机误差项。12233ttttY=+X+X+u23,ttXX222122334253623tttttttt=+X+X+X+X+X X+vt.301.1.求回归估计式并计算求回归估计式并计算用用OLS估计式(估计式(5.145.14),计算残差),计算残差 ,并求,并求残差的平方残差的平方 。2.2.求辅助函数求辅
20、助函数用残差平方用残差平方 作为异方差作为异方差 的估计,并建立的估计,并建立 的辅助回归,即的辅助回归,即(5.15)2tettteYY2te2te2t22232323ttttttX,X,X,X,X X222122334253623ttttttte=+X+X+X+X+X X.313.3.计算计算 利用求回归估计式(利用求回归估计式(5.155.15)得到辅助回归函数的可)得到辅助回归函数的可决系数决系数 。4.4.提出假设提出假设 2R0261H0,H2,3,.,6j:=.=:j(=)不全为零.325.5.检验检验 在零假设成立下,有在零假设成立下,有 渐进服从自由度为渐进服从自由度为5 5
21、的的 分布分布(n(n为样本容量为样本容量)。给定显著性水平。给定显著性水平 ,查查 分分布表得临界值布表得临界值 ,如果,如果 ,则拒绝原假则拒绝原假设,表明模型中随机误差存在异方差设,表明模型中随机误差存在异方差 。反之,不。反之,不存在。存在。2nR222(5)22(5)nR.33(一)(一)ARCH 过程过程 设设ARCH 过程为过程为 p为为ARCH过程的阶数过程的阶数,并且并且 为随机误差。为随机误差。(二)检验的基本思想(二)检验的基本思想在时间序列数据中,可认为存在的异方差性为在时间序列数据中,可认为存在的异方差性为ARCH过程,过程,并通过检验这一过程是否成立去判断时间序列是
22、否存在异方并通过检验这一过程是否成立去判断时间序列是否存在异方差。差。四、四、ARCH检验检验222011tt-pt-pt=+.+vtv001,2i,0 i=,.,p.341.1.提出原假设提出原假设 2.2.参数估计并计算参数估计并计算 对原模型作对原模型作OLS估计,求出残差估计,求出残差 ,并计算,并计算 残差平方序列残差平方序列 ,以分别作为对,以分别作为对 的估计。的估计。(三)(三)ARCH 检验的基本步骤检验的基本步骤0121H:=.=0;H:pj不全为零2221,.,tttpe ee2221tttp,.,te.353.3.求辅助回归求辅助回归 (5.175.17)4.4.检验检
23、验 计算辅助回归的可决系数计算辅助回归的可决系数 与与 的乘积的乘积 。在。在 成立时,基于大样本,成立时,基于大样本,渐进服从渐进服从 分布。分布。给定显著性水平给定显著性水平 ,查,查 分布表得临界值分布表得临界值 ,如果,如果 ,则拒绝原假,则拒绝原假 设,表明模型中得随机误差存在异方差。设,表明模型中得随机误差存在异方差。222011.ttp tpeee2()np R2Rnp0H2()np R22()p2()p22()()np Rp.36变量的样本值为大样本变量的样本值为大样本数据是时间序列数据数据是时间序列数据只能判断模型中是否存在异方差,而不能诊断出只能判断模型中是否存在异方差,而
24、不能诊断出 哪一个变量引起的异方差。哪一个变量引起的异方差。(四)检验的特点(四)检验的特点.37五、五、Glejser检验检验(一)检验的基本思想(一)检验的基本思想 由由OLS法得到残差,取得绝对值,然后将对某个法得到残差,取得绝对值,然后将对某个解释变量回归,根据回归模型的显著性和拟合优解释变量回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。度来判断是否存在异方差。(二)检验的特点(二)检验的特点 不仅能对异方差的存在进行判断,而且还能对异不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式方差随某个解释变量变化的函数形式 进行诊断。进行诊断。该检验要求变
25、量的观测值为大样本。该检验要求变量的观测值为大样本。.381.建立模型并求建立模型并求 根据样本数据建立回归模型,并求残差序列根据样本数据建立回归模型,并求残差序列 2.寻找寻找 与与 的最佳函数形式的最佳函数形式 用残差绝对值用残差绝对值 对对 进行回归,用各种函数进行回归,用各种函数 形式去试,寻找最佳的函数形式。形式去试,寻找最佳的函数形式。(三)检验的步骤(三)检验的步骤ieiiie=YYieXieiX.393.判断判断 根据选择的函数形式作根据选择的函数形式作 对对 的回归,的回归,用回归所得到的用回归所得到的 、t、F等信息判断,等信息判断,若参数若参数 显著不为零,即认为存在异方
26、差。显著不为零,即认为存在异方差。ieX2R.40第四节第四节 异方差性的补救措施异方差性的补救措施 主要方法主要方法:模型变换法模型变换法 加权最小二乘法加权最小二乘法 模型的对数变换模型的对数变换.41一、模型变换法一、模型变换法以一元线性回归模型为例:以一元线性回归模型为例:经检验经检验 存在异方差,且:存在异方差,且:其中其中 是常数,是常数,是是 的某种函数。的某种函数。12iiiYXuiu22var()()iiiuf X2()if XiX.42()if Xiii12iiiiYXu=+f(X)f(X)f(X)f(X)*11;()()()()iiiiiiiiiiYXuYXvf Xf X
27、f Xf X*12iiiYXv变换模型时,用变换模型时,用 除以模型的两端得:除以模型的两端得:则有:则有:.43随机误差项随机误差项 的方差为:的方差为:经变换的模型的随机误差项经变换的模型的随机误差项 已是同方差,已是同方差,常见的设定形式及对应的常见的设定形式及对应的 情况情况函数形式函数形式iviv21var()var()var()()()iiiiiuvuf Xf X()iiiuv=f Xvar()iuvar()iiviX2iX201()iaa X2iX22iX2201()iaa XiiuXiiuX01()iiuaa X222.44二、加权最小二乘法二、加权最小二乘法以一元线性回归模型
28、为例:以一元线性回归模型为例:经检验经检验 存在异方差,且:存在异方差,且:其中其中 是常数,是常数,是是 的某种函数。的某种函数。12iiiYXuiu22var()()iiiuf X2()if XiX.45(一)基本思路(一)基本思路 区别对待不同的区别对待不同的 。对较小的。对较小的 ,给予较给予较 大的权数,对较大的大的权数,对较大的 给予较小的权数,给予较小的权数,从而使从而使 更好地反映更好地反映 对残差平方和的对残差平方和的 影响。影响。2i2ie2ie2i2ie.46(二)具体做法(二)具体做法1.选取权数并求出加权的残差平方和选取权数并求出加权的残差平方和通常取权数通常取权数
29、,当,当 越小越小时,时,越大。当越大。当 越大时,越大时,越小。将权数越小。将权数与残差平方相乘以后再求和,得到加权的残与残差平方相乘以后再求和,得到加权的残差平方和:差平方和:21(1,2,.,)iiwin2iiw2iiw2*212()i iiiiwew YX.472.求使满足求使满足 的的根据最小二乘原理,若使得加权残差平方和根据最小二乘原理,若使得加权残差平方和最小,则:最小,则:其中:其中:*1222()()()*iii*ii=Y Xw XXYY=w XXiiii*iiw XwYX=,Y=ww2mini iwe*i.48三、模型的对数变换三、模型的对数变换 在经济意义成立的情况下,如
30、果对模型:在经济意义成立的情况下,如果对模型:作对数变换,其变量作对数变换,其变量 和和 分别用分别用 和和 代替,即:代替,即:对数变换后的模型通常可以降低异方差性的影响:对数变换后的模型通常可以降低异方差性的影响:运用对数变换能使测定变量值的尺度缩小。运用对数变换能使测定变量值的尺度缩小。经过对数变换后的线性模型,其残差表示相对误差往往经过对数变换后的线性模型,其残差表示相对误差往往 比绝对误差有较小的差异。比绝对误差有较小的差异。注意:注意:对变量取对数虽然能够减少异方差对模型的对变量取对数虽然能够减少异方差对模型的 影响,但应注意取对数后变量的经济意义。影响,但应注意取对数后变量的经济
31、意义。lniXlniY12iiiY=+X+u12lnlniiiY=+X+uiYiX.49第五节第五节 案例分析案例分析一、问题的提出和模型设定一、问题的提出和模型设定 为了给制定医疗机构的规划提供依据,分析比为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。机构数与人口数的回归模型。假定医疗机构数与人口数之间满足线性约束,假定医疗机构数与人口数之间满足线性约束,则理论模型设定为:则理论模型设定为:其中其中 表示卫生医疗机构数,表示卫生医疗机构数,表示人口数。表示人口数。iYiXiY12iiiY=+X
32、+u.50四川省四川省20002000年各地区医疗机构数与人口数年各地区医疗机构数与人口数 地区人口数(万人)医疗机构(个)地区人口数(万人)医疗机构(个)成都1013.36304眉山339.9827自贡315911宜宾508.51530攀枝花103934广安438.61589泸州463.71297达州620.12403德阳379.31085雅安149.8866绵阳518.41616巴中346.71223广元302.61021资阳488.41361遂宁3711375阿坝82.9536内江419.91212甘孜88.9594乐山345.91132凉山402.41471南充 709.2 4064
33、.51二、参数估计二、参数估计估计结果为估计结果为:2563.05485.3735(1.9311)(8.3403)0.7855,se508.2665,69.56iiYXRF.52三、检验模型的异方差三、检验模型的异方差(一)图形法(一)图形法 1.EViews1.EViews软件操作软件操作 由路径:由路径:Quick/Qstimate Equation,进入,进入 Equation Specification窗口,键入窗口,键入 ,点,点“ok”,得样本回归估计结果,见教材表,得样本回归估计结果,见教材表5.2。y c x.53(1)生成残差平方序列。)生成残差平方序列。在得到表在得到表5.
34、2估计结果后,用生成命令生成序列,估计结果后,用生成命令生成序列,记 为记 为 。生 成 过 程 如 下,先 按 路 径:。生 成 过 程 如 下,先 按 路 径:Procs/Generate Series,进入,进入Generate Series by Equation对话框,键入下式并点对话框,键入下式并点“OK”即可:即可:2resid2e 2e.54生成序列图示生成序列图示.55(2 2)绘制)绘制 对对 的散点图。选择变量名的散点图。选择变量名 与与 。(注意选择变量的顺序,先选的变量将在。(注意选择变量的顺序,先选的变量将在图形中表示横轴,图形中表示横轴,后选的变量表示后选的变量表
35、示纵轴),进入数纵轴),进入数据列表,再按路据列表,再按路径径view/graph/scatter,可得散可得散点图,见右图:点图,见右图:2tetXX2e.562.2.判断判断由图可以看出,残差平方由图可以看出,残差平方 对解释变量对解释变量 的散点图的散点图主要分布在图形中的下三角部分,大致看出残差平主要分布在图形中的下三角部分,大致看出残差平方方 随随 的变动呈增大的趋势,因此,模型很可的变动呈增大的趋势,因此,模型很可能存在异方差。但是否确实存在异方差还应通过更能存在异方差。但是否确实存在异方差还应通过更进一步的检验。进一步的检验。2ieXiX2ie.57(二)(二)Goldfeld-
36、Quanadt检验检验1.EViews1.EViews软件操作软件操作 (1)对变量取值排序(按递增或递减)。在)对变量取值排序(按递增或递减)。在Procs菜单里选菜单里选Sort Current Page/Sort Workfile Series命令,出现排序命令,出现排序对话框,键入对话框,键入 ,如果以递增型排序,选,如果以递增型排序,选“Ascenging”,如果以递减型排序,则应选如果以递减型排序,则应选“Descending”,点,点ok。本例。本例选递增型排序,这时变量选递增型排序,这时变量 与与 将以将以 按递增型排序。按递增型排序。(2 2)构造子样本区间,建立回归模型。在
37、本例中,样本容)构造子样本区间,建立回归模型。在本例中,样本容量量 ,删除中间,删除中间1/41/4的观测值,即大约的观测值,即大约5 5个观测值,余下部个观测值,余下部分平分得两个样本区间:分平分得两个样本区间:1818和和14211421,它们的样本个数均,它们的样本个数均是是8 8个,即个,即 X21nX128nnYX.58在在Sample菜单里,将区间定义为菜单里,将区间定义为18,然后用,然后用OLS方法方法 求得如下结果求得如下结果(表表1).59在在Sample菜单里菜单里,将区间定义为将区间定义为1421,再用,再用OLS方法求得如下结果方法求得如下结果(表表2).60(3 3
38、)求求F统计量值。统计量值。基于表基于表1 1和表和表2 2中残差平方和的中残差平方和的数据,即数据,即Sum squared resid的值。由表的值。由表1 1计算得到计算得到的残差平方和为的残差平方和为 ,由表,由表2 2计算得到的计算得到的残差平方和为残差平方和为 。根据根据Goldfeld-Quanadt检验,检验,F统计量为统计量为 21=144958.9ie22=734355.8ie2221734355.85.066144958.9iieFe.61 (4)判断)判断 在在 下,式中分子、分母的自由度均为下,式中分子、分母的自由度均为6,查查F分布表得临界值为:分布表得临界值为:因
39、为因为 ,所以拒绝原假设,所以拒绝原假设,表明模型确实存在异方差。表明模型确实存在异方差。0.050.05(6,6)4.28F0.055.066(6,6)4.28FF.62(三)(三)White检验检验 由表由表5.2估计结果,按路径估计结果,按路径view/residual tests/white heteroskedasticity(no cross terms or cross terms),进入),进入White检验。检验。根据根据White检验中辅助函数的构造,最后一项为变检验中辅助函数的构造,最后一项为变 量的交叉乘积项,因为本例为一元函数,故无交叉量的交叉乘积项,因为本例为一元函
40、数,故无交叉 乘积项,因此应选乘积项,因此应选no cross terms,则辅助函数,则辅助函数 为:为:经估计出现经估计出现White检验结果,见表检验结果,见表5.55.5。22012ttttxxv.63从表从表5.55.5可以看出可以看出由由White检验知,检验知,在在 下,查查 分布表得临界值分布表得临界值 因为因为 所以拒绝原假设,不拒绝备所以拒绝原假设,不拒绝备择假设,表明模型存在异方择假设,表明模型存在异方差。差。表表5.5218.0694nR 0.05220.05(2)5.9915220.0518.0694(2)5.9915nR.64加权最小二乘法加权最小二乘法(WLS)分
41、别选用权数分别选用权数:生成权数:生成权数:在在Genr/Enter equation中中分别键入:分别键入:经估计检验发现用权数经估计检验发现用权数 较好,下面只给出用权较好,下面只给出用权 数数 的结果。的结果。四、异方差的修正四、异方差的修正1232111,ttttttwwwXXX11/wX21/2wX31/sqrt()wX2tw2tw.65方法方法:在在Estimate equation 中输入中输入“”,点点option,在对话框中点在对话框中点 weighted LS,在在weighted 中输入中输入“”再点再点ok ,即出现加权最小二乘结果。即出现加权最小二乘结果。2w y c
42、 x.66估计结果:估计结果:结论结论:运用加权小二乘法消运用加权小二乘法消除了异方差性后,参数的除了异方差性后,参数的t检验检验均显著,可决系数大幅提高,均显著,可决系数大幅提高,F检验也显著,并说明人口数检验也显著,并说明人口数量每增加量每增加1万人,平均说来将万人,平均说来将增加增加2.953个卫生医疗机构,而个卫生医疗机构,而不是引子中得出的增加不是引子中得出的增加5.3735个医疗机构。个医疗机构。表表5.72368.60902.9530(4.3794)(3.5894)0.9387,DW1.7060,se276.0493,12.8838iiYXRF.67第五章第五章 小小 结结1.异
43、方差性是指模型中随机误差项的方差不是常量,异方差性是指模型中随机误差项的方差不是常量,而且它的变化与解释变量的变动有关。而且它的变化与解释变量的变动有关。2.产生异方差性的主要原因有:模型中略去的变量产生异方差性的主要原因有:模型中略去的变量随解释变量的变化而呈规律性的变化、变量的设随解释变量的变化而呈规律性的变化、变量的设定问题、截面数据的使用,利用平均数作为样本定问题、截面数据的使用,利用平均数作为样本数据等。数据等。3.存在异方差性时对模型的存在异方差性时对模型的OLS估计仍然具有无偏估计仍然具有无偏性,但最小方差性不成立,从而导致参数的显著性,但最小方差性不成立,从而导致参数的显著性检验失效和预测的精度降低。性检验失效和预测的精度降低。.684.检验异方差性的方法有多种,常用的有图形法、检验异方差性的方法有多种,常用的有图形法、Goldfeld-Qunandt检验、检验、White检验、检验、ARCH检验以及检验以及Glejser检验,运用这些检验方法时要检验,运用这些检验方法时要注意它们的假设条件。注意它们的假设条件。5.异方差性的主要方法是加权最小二乘法,也可以异方差性的主要方法是加权最小二乘法,也可以用变量变换法和对数变换法。变量变换法与加用变量变换法和对数变换法。变量变换法与加权最小二乘法实际是等价的权最小二乘法实际是等价的。.69第 五 章 结 束 了!