1、第三章 回归诊断及处理方法主要内容n异方差的产生原因、后果、诊断方法以及处理方法;n自相关的产生原因、后果、诊断方法以及处理方法;n多重共线性的产生原因、后果、诊断方法以及处理方法;一、异方差问题及其处理v异方差产生的经济背景v异方差的影响v异方差诊断方法v异方差的处理(一)异方差产生的经济背景n异方差(heteroscedasticity)jiuujivarvar 时当(一)异方差产生的经济背景n收入与消费nCD生产函数(一)异方差产生的经济背景v随解释变量数值的变化,随机因素影响的力度不同v遗漏重要的解释变量(二)异方差的影响1、最小二乘估计不再具有最小方差的优良性2、将使得回归系数标准差
2、的估计失准,使得t检验失效3、SSR/(n-k-1)不再是随机误差方差的无偏估计,从而使得F检验失效 1211covXXXXXuuEXXX(二)异方差的影响n以一元线性回归模型为例XXlN211,XXiXXiiXXiiXXXYllXXlYXXll212222211varvar如果(二)异方差的影响n普通最小二乘的标准误估计n存在异方差时真实的标准误 XXXXlnSSRl12var21 2221varXXiilXX 11varse 11varse(二)异方差的影响n普通最小二乘的t统计量n如果分母并非真正的标准误,那么该统计量也不会服从t分布2/1ntlstXX(二)异方差的影响n在OLS中,估
3、计随机误差项的方差采用如下公式:n如果存在异方差,该公式将不再合适12kneePuuXXXXIuXXXXuuXXXXXuXXYe111(二)异方差的影响 1112covcove eu P PuPe eu PuE e eE uIX X XXuxnE XXAn nE x Axtr AAE e etrIX X XXutr IX X XX 是投影阵根据如下定理:设 为 维随机向量,期望和协方差存在,记,若 为常数阵,则(二)异方差的影响11122212kneekneeEknXXXtrXtrIeeE(二)异方差的影响n正规的分析 22222222222122221000000cov000000covii
4、innwnntrwwwuu(二)异方差的影响 11covXXXuuEXXX 11212covcovXXXXXXXXh同方差时的估计量异方差时的估计量 11covXXknee异方差下错误的估计量(二)异方差的影响n可以证明,如果参数估计量具有一致性,则有:1lim222kneessp(二)异方差的影响 iiniiiiniiiinihxxwnxxnwxxnnXXnXXnXXnXXnXXnXXnXXXXXXXXsD11111211212111covcov在大样本下:112112221112212211*11+21*2111*12+21*2212*11+22*2112*12+22*22(二)异方差的影
5、响n模拟分析 通过模拟,可以直观的观察到不同异方差模式下,普通最小二乘法回归系数标准误估计失准的不同程度。(三)异方差诊断方法n利用残差图进行诊断n各种检验(三)异方差诊断方法n残差图是否具有某种趋势 X()e YY(三)异方差诊断方法 X()e Y(三)异方差诊断方法n检验1、Glejser检验2、等级相关系数检验3、Breusch-Pagan检验4、White检验1、Glejser检验n假定残差与自变量存在密切联系,是自变量的函数,这样通过对残差与自变量建模并进行检验,可以判断关系是否显著,籍此可以进一步判断异方差的存在n步骤:得到残差;以残差为被解释变量,以某个解释变量为解释变量建模并进
6、行通常的F、t检验,如果拒绝原假设,则存在异方差,反之不能如此认为1、Glejser检验n常用函数形式 iiiiiiiiiiiiiiiiiivXevXevXevXevXevXe2101010101010112、等级相关系数检验n如果自变量与残差具有共变性,此增彼增或者相反,则存在异方差,采用等级相关,可以适用更广泛的异方差模式n步骤:1)获得残差并取绝对值 2)计算残差与自变量的Spearman系数 3)进行检验2、等级相关系数检验21280:0:2,1,0ntrnrtnHHXeXeXeXe3、Breusch-Pagan检验n如果同方差假定正确,则有:n如果不正确,则有:2212221,var
7、kkXXXuEXXXu3、Breusch-Pagan检验n可以构造F统计量来检验所有回归系数是否都为0步骤:1)得到残差并计算其平方;2)残差对自变量作回归,并得到F统计量3)如果大于临界值,则存在异方差4、White检验n思想与Breusch-Pagan检验完全相同,只不过增加了所有自变量的平方与交叉乘积项 vXXXXXXXXXXXXe32931821723622521433221102 型为以三个自变量为例,模4、White检验n一种比较节省自由度的方法是对如下函数建模并进行F检验vYYe22102(三)异方差诊断方法n检验未能拒绝原假设,并不意味着不存在异方差n检验拒绝了原假设并不意味着
8、存在异方差,其他如设定错误、序列相关也会导致类似的结果(四)异方差的处理n处理异方差的方法按建模阶段大致可以分为三类:n数据变换n改进参数估计方法n改进检验统计量1、数据变换对数据进行幂变换,以获得同方差性v获得p值的方法(适用于一元回归)首先将数据按自变量的大小分组,然后计算每一组因变量的中位数和四分位距;对四分位距取对数为纵坐标,对中位数取对数为横坐标;拟合一条直线,1-斜率就是所需要的p值 1、数据变换n变换的机制 假设经过变换获得同方差的数据 ppppppcMdMcMdMMYMcdMc cMddMMMY/1/1/1/1/1000四分位距:;下四分位数;上四分位数;:中位数对于,常数,不
9、依赖于四分位距:;,下四分位数;,上四分位数;,:中位数对于pY1、数据变换2332213232/1/16212162121162121111/1McdqqqMcdqqcdqMMdqqqMcqqMcq-MdqqqMdqqMdqMMaclaurinMcMdMcMdMpqcMdMqqqqqpp公式展开分别用、对1、数据变换 ppFFqppMpkMpqkdMqcdqdcdqMcMdM/1/11/1/1ln1ln/11lnln1lnlnln1、数据变换n上述变换图的方法适用于数据较多的一元回归情况,能给出相对可靠的p值估计,更为通常的做法是:对每个变量取对数n对数变换可以压缩变量尺度,降低异方差的影响
10、2、加权最小二乘(WLS)22221102211022222varvariiiiiiiikkiiiiiiiiikkiiiiiiiiiiiihuEhuhuhXhXhXhhYuXXXYhXhiXXhXu个样本的所有自变量指第2、加权最小二乘(WLS)n权数的确定 在一元回归情况下,可以用类似Glejser检验中的方法得到异方差的确切形式 在多元回归情况下,可以利用White检验的方法得到估计,如下的模型也可以采用:2011222201122201122var|expexpln1kkkkkku XXXXuXXXvuXXXv2、加权最小二乘(WLS)n对该方程进行回归,得到拟合值g ihgh1exp权数为 结束语当你尽了自己的最大努力时,失败也是伟大的,所以不要放弃,坚持就是正确的。When You Do Your Best,Failure Is Great,So DonT Give Up,Stick To The End谢谢大家荣幸这一路,与你同行ItS An Honor To Walk With You All The Way演讲人:XXXXXX 时 间:XX年XX月XX日
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。