1、1第4章 违背经典假设的回归模型z 第一节 异方差性谢谢观赏2019-6-252违背基本假设的情况z在前述基本假定下OLS估计具有BLUE的优良性。(Best Linear Unbiased Estmator)z然而实际问题中,这些基本假定往往不能满足,使OLS方法失效不再具有BLUE特性。z估计参数时,必须检验基本假定是否满足,并针对基本假定不满足的情况,采取相应的补救措施或者新的方法。z检验基本假定是否满足的检验称为计量经济学检验谢谢观赏2019-6-253BLUE的优良性z1、最小二乘估计量是线性估计量估计量是因变量观察值的线性组合z2、最小二乘估计量是无偏估计量估计量的数学期望等于被估
2、计的参数z3、最小二乘估计量是一切线性、无偏估计量中的最佳估计量,因为它的方差最小z这些性质是由高斯-马尔科夫定理保证的谢谢观赏2019-6-254不满足基本假定使高斯-马尔科夫定理失效z1、随机扰动项的方差不等于常数=异方差y截面数据时,经常出现异方差z2、随机扰动项相关=序列相关y时间序列数据经常出现序列相关z3、随机扰动项具有水平变动=变量误差模型z4、随机扰动项与所有自变量不相关=自变量之间不相关=多重共线z通常不会发生随机扰动项均值=0与非线性模型的假设不满足的情形上页谢谢观赏2019-6-255回顾6项基本假定z(1)残差纵向变动 (隐含自变量X是确定性变量)z(2)E(ei)=0
3、 (随机项均值为零) z(3)Var(ei)=2 (同方差) z(4)Cov(ei, ej)=0(随机项无自相关) z(5)Cov(x, ei)=0(随机项与解释变量X不相关)自变量间不相关z(6)数据生成过程为线性过程 (只讨论线性模型) Y=X+e下页谢谢观赏2019-6-256基本假定违背的解决办法z1随机扰动项e不是同方差,而是异方差z=检验是否存在=消除异方差z2随机扰动项e存在序列相关(存在自相关)z=检验是否存在=消除自相关z3解释变量是随机变量,且与e相关 z(=误差变量模型第15章)z4解释变量之间线性相关,存在多重共线z(=模型技术上,只能采用逐步回归、主成分回归、岭回归等
4、)谢谢观赏2019-6-257计量经济学检验z采取补救措施和方法之前,需要根据实际样本资料对模型是否满足这些基本假定逐项进行检验,这种检验称为计量经济学检验。z计量经济学检验仍然是z一种假设检验,它是对z随机扰动项是否满足基z本假定的假设检验。谢谢观赏2019-6-258解决问题的思路z1、违反6项基本假定之一的定义异方差、自相关、误差变量模型、多重共线的基本概念z2、违反基本假定的原因z3、怎样诊断基本假定的违反z4、消除或减弱对基本假定的违反出现违反基本假定的补救措施谢谢观赏2019-6-259计量经济学检验有两种基本方法z图示法和解析法谢谢观赏2019-6-2510图示法z是利用残差序列
5、绘制出各种图形,以供分析检验使用。包括:z1、时间为X轴,残差e为Y轴的残差序列图z2、因变量估计值y为X轴,残差e为Y轴的Y-e散点图z3、解释变量为X轴,残差e(或e2)为Y轴的x-e散点图z4、残差e的直方图z也可以使用误差项的平方来作图谢谢观赏2019-6-2511解析法z导出检验统计量的解析式,根据一些准则,进行检验。例如:z1、检验异方差的Goldfeld-Quandt检验z2、检验自相关的Durbin-Watson检验z3、检验多重共线的简单相关系数和综合统计检验法等谢谢观赏2019-6-2512讨论问题的思路与步骤z1、违反6项基本假定之一的定义异方差、自相关、误差变量模型、多
6、重共线的基本概念z2、违反基本假定的原因z3、怎样诊断基本假定的违反图示法和解析法z4、消除或减弱对基本假定的违反出现违反基本假定的补救措施谢谢观赏2019-6-2513第十章的主要内容z第一节 异方差概述z第二节 如何发现异方差z第三节 异方差的后果z第四节 异方差的解决方法z案例一 个人储蓄模型z案例二 人均消费函数z案例三 分组资料 z案例四 我国北方农业产出模型谢谢观赏2019-6-2514第一节异方差概述z1、异方差的定义z2、现实社会经济中异方差是很常见的z3、处理截面数据时,尤应注意z4、原因1:使用截面数据研究储蓄函数z5、原因2:用分组资料研究Cobb-Douglass生产函
7、数谢谢观赏2019-6-2515异方差的定义 的变化而变化。的方差随异方差是指定理不成立。马尔可夫斯不成立,古典模型中高由于方差。项假设都满足,称为异存在异方差,而其它不成立,即古典假设中只有假设常数:xiii2i2i-3 古典假设5 Var3 Var3 古典假设谢谢观赏2019-6-2516异方差产生的原因1:使用截面数据研究储蓄函数的异方差性。增加,所以,具有明显的增加而的方差随着收入随机扰动项于是对于上列储蓄函数较小,即方差小。储蓄较有规律,差异性某种目的而参加储蓄,剩余较少。为了家庭除了必要支出以外即方差较大。而低收入的差异性较大,更大的余地,因此储蓄在消费方式的选择上有本消费支出之外
8、,家庭由于收入较高,基在储蓄行为中,高收入与事实不符。这里,同方差假设显然人口、文化背景等等。,如利率、家庭配收入以外的其它因素代表影响储蓄额除可支个家庭的可支配收入,第个家庭的储蓄额,第式中:为储蓄函数模型Xiiiiiiiiixyxbby10谢谢观赏2019-6-2517原因2:用分组资料研究Cobb-Douglass生产函数(参见应用回归分析P94是异方差的。的增大而增大,些差别随着投入规模差别)。这以外的其它影响因素的和的差别(即除因素上上的差别以及其它一些上的区别,技术和管理的企业,在设备工艺表示不同投入规模式中生产函数可以写成、劳动力相应的平均数各组都用产出、资金、数不同,组资料,各
9、组的观测点如果所用样本数据是分),(),(,KLKLKLALKYeKLYiii谢谢观赏2019-6-2518第二节 异方差的检验 (如何发现异方差)z1、图示法z2、解析法谢谢观赏2019-6-25191、图示法及其类型z异方差是指e的方差随着x的变化而变化。z故可以根据x-y或残差x-e2的散点图,对异方差是否存在及其类型作出判断。z异方差大致可分为三种:z(1)递增异方差z(2)递减异方差z(3)复杂型异方差谢谢观赏2019-6-2520u x谢谢观赏2019-6-2521u x谢谢观赏2019-6-2522u x谢谢观赏2019-6-2523u x谢谢观赏2019-6-2524 就是同方
10、差模型。变换后的模型那么,两端同时除以所得关系:例如,在一元回归模型利用关系消除异方差。间的关系与检验力图寻找检验不考虑注意或或或设中求出在模型311312121:,22222432432zzuzzuzuzxzzyzzuuxyzuzuxyyyxzyyyyyuyuxyiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiVarVarbafbafRESETRESETba谢谢观赏2019-6-2525谢谢观赏2019-6-2526 ,否则称为有交叉。项交叉项的称为无交叉,个回归项。不包括,那么共有三个变量,叉项两种。例如,今有方法分无交叉项和有交用以消除异方差。,与各个回归项
11、的关系式显著,建立判断各个回归系数是否归。乘积项和平方项进行回对所有解释变量、交叉并求出对方程394,3213231212322213231213213213212321222222211xxxxxxxxxxxxxxxxxxxxxxxxuxxxuuuuuxbxbxbyffaiiiiiiikkiii谢谢观赏2019-6-2527谢谢观赏2019-6-2528谢谢观赏2019-6-2529 。就是具有同方差的模型变换后的模型那么,两端同时除以:例如,在一元回归模型利用关系消除异方差。,即存在异方差,且,若成立则随机扰动项判断系数是否不全为再拟合中求出在模型31131121,022112122211
12、221xxuxxuxuxxxxyxuuxyxxxxuxxuxxxxuuuxbyiiiiiiiiiiiiiiiiiikkikiijkjjikkjijlkjijjiiikjijjiffVarffVarffbaffxffbafffa谢谢观赏2019-6-2530怎样通过Eviews作x-y散点图zScat y x 回车 (作散点图的命令)z其中 y(第一位)是y轴,x(第二位)是x轴。并观察其是否成:z(1)喇叭型或倒喇叭型z(2)纺锤型或反纺锤型z(3)以及其它有规则的图形(除线性条形)。z以上三种均可能存在异方差。uuyy2, , ,谢谢观赏2019-6-2531怎样通过Eviews作x- e2
13、 散点图z1、键入 LS y c x 作回归z2、键入 GENR E1=resid 调用残差z3、键入 GENR E2=E12 生成残差平方z4、键入 SCAT E2 Xz 或 SCAT E1 Xz如果呈现出某种有规律的分布,说明残差中蕴涵作模型(1)未提取净的信息,或(2)可能存在异方差或自相关,或(3)设定有误。谢谢观赏2019-6-25321。纺锤型谢谢观赏2019-6-25332。反纺锤型谢谢观赏2019-6-25343。漏斗型谢谢观赏2019-6-25354。反漏斗型谢谢观赏2019-6-25365。其它有规律可寻的图形谢谢观赏2019-6-25372、解析法(主要介绍Goldfel
14、d-Quant检验)z1。RESET检验z2。WHITE检验z3。GEJSTER检验z4。Goldfeld-Quant检验z5。Park检验谢谢观赏2019-6-2538下页直到找到显著为止。与它们的关系,的方向寻找沿着yyyyikiii,2谢谢观赏2019-6-2539Ramsey RESET Test:F-statistic3.890501 Probability0.058509Log likelihood4.033214 Probability0.044613Test Equation:LS / Dependent Variable is YSample: 1 31Included ob
15、servations: 31VariableCoefficient Std. ErrorT-Statistic Prob. X0.1191180.0180866.5860750C-1097.868244.3881-4.4923120.0001Fitted2-0.0001638.25E-05-1.9724350.0585R-squared0.928167 Mean dependent var1230Adjusted R-squared0.923036 S.D. dependent var 817.1759S.E. of regression226.7043 Akaike info criteri
16、on10.93906Sum squared resid1439056 Schwartz criterion 11.07783Log likelihood-210.5425 F-statistic180.8959上页没有侦察出来谢谢观赏2019-6-2540的关系。与此确定哪一回归系数显著,借回归,判断分别对那么、假如模型有三个自变量xexxxxxxxxxxxxexxxiii3231212322213212321,下页谢谢观赏2019-6-2541White Heteroskedasticity Test:F-statistic9.800293 Probability0.000594Obs*R-
17、squared12.76493 Probability0.001691Test E quation:LS / Dependent Variable is RESID2Sample: 1 31Included observations: 31VariableCoefficient Std. ErrorT-Statistic Prob. C17608.4661990.720.284050.7785X-2.0946786.069039-0.3451420.7326X20.000140.0001321.0661770.2955R-squared0.411772 Mean dependent var52
18、871.21Adjusted R-squared0.369756 S.D. dependent var63761.31S.E. of regression50618.79 Akaike info criterion21.75592Sum squared resid7.17E+10 Schwartz criterion21.89469Log likelihood-378.2039 F-statistic9.800293上页因变量没有侦察出来谢谢观赏2019-6-2542Goldfeld-Quant检验z1。 Goldfeld-Quant检验的思路z2。 Goldfeld-Quant检验的几何意义
19、z3。 Goldfeld-Quant检验具体做法z4。 Goldfeld-Quant检验在EViews上的实现zG-Q检验统计量F及其检验z5。 Goldfeld-Quant检验适用条件谢谢观赏2019-6-25431。 Goldfeld-Quant检验的思路z先将样本一分而二,对子样1和子样2分别作回归,然后利用两个子样的残差的方差之比构造检验统计量F进行异方差检验。这个检验统计量服从F分布。z递增异方差,方差之比就会远远大于1;反之,z同方差,方差之比趋近于1z递减异方差,方差之比远远小于1谢谢观赏2019-6-25442。 Goldfeld-Quant检验的几何意义谢谢观赏2019-6-
20、2545u x样本13n/8n/43n/8样本2谢谢观赏2019-6-25463。 G-Q检验具体做法z(1)将n对观察值(xi,yi),按解释变量x的大小顺序排列z(2)将其中的 c = n / 4 个观察值除去,余下前后两个子样本z(3)每个子样的个数为(n-c)/2,各自进行回归,分别计算残差平方和,自由度=(n-c)/2-k-1,k是模型中自变量个数z(4)提出假设:两个子样方差相等z(5)进行F检验谢谢观赏2019-6-2547G-Q检验统计量F及其检验,不存在异方差若,存在递增异方差若给定显著水平FFeeeedfdfdfdfiiiiFFFkcndfdfkcnkcnF2, 12, 1
21、21222122122112/12/谢谢观赏2019-6-25484。 Goldfeld-Quant检验在EViews上的实现z(1)用SORT X 以X为条件排序z(2)用SMPL命令定义两个子样z(3)用LS命令进行两次回归,计算出残差平方和(可以直接读出)与自由度z(4)进行F检验谢谢观赏2019-6-25495。Goldfeld-Quant检验适用条件zG-Q检验以F检验为基础z适用于样本容量较大、异方差递增或递减的情况谢谢观赏2019-6-2550OLS处理结果谢谢观赏2019-6-2551谢谢观赏2019-6-25520.000020.000040.000060.000080.00
22、0100.00012010000200003000040000QSHX权数、个人收入散点图谢谢观赏2019-6-2553WLS输出结果谢谢观赏2019-6-2554-50000500010000010000200003000040000RESIDX加权WLS处理后的残差自变量散点图谢谢观赏2019-6-2555模型变换法 结果是一致的与加权最小二乘法式模型变换法估计结果同方差作模型变换两端除以对设CXQSHwYLSVarVarbababaxuuuxyxxuxxyxxuuxyiiiiiiiiiiiiiiiii)(33121121122谢谢观赏2019-6-2556模型变换法OLS处理结果谢谢观赏
23、2019-6-2557obsYX197622.835197727.141.3197834.552.4197939.460.8198043.867.5198148.573.4198252.579.7198357.889.4198464.599198570.3107.6198675.8116.5198779.7122.2Lx4lchf106.wf1原始数据谢谢观赏2019-6-2558OLS估计结果谢谢观赏2019-6-2559OLS估计残差与自变量的散点图典型纺锤型-1.0-0.50.00.51.020406080100120140RESIDX谢谢观赏2019-6-2560谢谢观赏2019-6-
24、2561模型变换法估计结果请比较残差平方和是否减小谢谢观赏2019-6-2562模型变换法后的残差与自变量的散点图-0.10-0.050.000.050.1020406080100120140RESIDX谢谢观赏2019-6-2563GEJSTER检验的思路z格里奇和帕克检验是用残差的绝对值或者残差的平方值序列,分别对X进行回归z由回归的拟合优度、显著性判断异方差是否存在。若显著,则存在异方差,并得到异方差的函数形式。反之则不存在。z它们的优点:可以近似地给出异方差的存在形式: 2i = 2 f(xi)。以便用模型法消除异方差。z1.GEJSTER检验的步骤z2.EViews中实现GEJSTE
25、R检验z3. GEJSTER检验的程序谢谢观赏2019-6-2564GEJSTER检验的步骤z(1)用原始数据估计模型,计算残差直接读取residz(2)用残差绝对值与X进行回归:z| e|=b0+b1xh+u z u满足基本假定,幂次通常需要选择多种值试算,如h=1,2,-1,1/2等z(3)经过R2、F、t检验找出最优的回归方程形式,或无异方差谢谢观赏2019-6-2565EViews中实现GEJSTER检验z(1)LS Y C Xz(2)GENR E1=residz(3)GENR E2=E1*E1 或取绝对值z(4)GENR XH=XH (依次分别取H=1,2,-1,1/2,)生成Xh序
26、列z(5)LS E2 C XHz(6)重复(4)直至找出适合的方程形式谢谢观赏2019-6-2566Glejster程序谢谢观赏2019-6-2567Park检验的的思想z Park认为随机扰动项ei的形式为z 2i = 2 xi b1ev 两边取对数,z ln2i =ln 2+b1ln xi +Vi z 令 ln2 =b0z ln2i = b0 +b1ln xi +Viz 两边取对数,进行OLS。若显著存在异方差,且找到函数形式;否则无异方差。z1.Park检验的步骤z2.EViews中进行Park检验的步骤z3.PARK程序谢谢观赏2019-6-2568Park检验的步骤z(1)拟合回归方
27、程,计算残差z(2)计算残差平方和z(3)取残差平方和、解释变量X的对数z(4)用对数变换后的数据拟合回归方程z(5)作统计检验,判断异方差是否存在谢谢观赏2019-6-2569EViews中进行Park检验的步骤z(1)LS Y C Xz(2)GENR E1=residz(3)GENR E2=E1*E1z(4)GENR LNE2=LOG(E2)z(5)GENR LNX=LOG(X)z(6)LS LNE2 C LNX谢谢观赏2019-6-2570load c:eviewslx4lchf106.wf1equation yeq.ls y c xgenr e1=residgenr e2= e1*e1
28、genr lne2=log(e2)genr lnx=log(x)equation lne2eq.ls lne2 c lnxshow yeq.resid(g)show lne2eq.resid(g)PARK程序谢谢观赏2019-6-2571关于“自由度”z“自由度”即:number of degrees of freedom“.z它是指样本中观测值的总数(n)减去对它们的独立的(线性)约束或限制的个数。z换句话说,它是观测值的总个数中独立的观测值的个数。z例如:“RSS” ,在能够计算它的值之前,必须先算出B0和B1。这两个估计值就是附加给RSS的两个约束条件。谢谢观赏2019-6-2572z因此,在计算RSS时,就只有n-2而不是n个独立观测值。按照这一逻辑,在3个变量回归中RSS将有n-3个自由度。z因此,对于k个参数的模型,它就有n-k个自由度。z一般规律是:df=n-待估参数的个数谢谢观赏2019-6-2573谢谢观赏2019-6-25