ImageVerifierCode 换一换
格式:PPT , 页数:32 ,大小:433KB ,
文档编号:5268980      下载积分:25 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-5268980.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(罗嗣辉)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(大学课件:第7章 模型选择:标准与检验(新1404).ppt)为本站会员(罗嗣辉)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

大学课件:第7章 模型选择:标准与检验(新1404).ppt

1、第二部分实践中的回归分析第6章 虚拟变量模型:复习总结 1、虚拟变量、虚拟变量 在计量经济模型研究中的作用:起在计量经济模型研究中的作用:起到到“数据分类器数据分类器”的作用。即被解释变量对定性的作用。即被解释变量对定性变量(即解释变量)的不同反映(通过截距和斜变量(即解释变量)的不同反映(通过截距和斜率系数)率系数)2、虚拟变量引入方式、规则、虚拟变量引入方式、规则 3、引入虚拟变量的模型中估计参数的含义(即与、引入虚拟变量的模型中估计参数的含义(即与基准类的差别)基准类的差别)3/3/2023基本假定违背:基本假定违背:不满足基本假定的情况:四种。(1)模型设定有偏误;所选模型是正确设定的

2、(2)解释变量之间存在多重共线多重共线性;(3)随机误差项序列存在异方差异方差性;(4)随机误差项序列存在序列相关序列相关性。所选模型是正确设定的解释变量之间不存在完全线性关系误差项方差为常数误差项之间不相关基本假定基本假定基本假定基本假定第第7章章 模型选择:标准与检验模型选择:标准与检验7.1好的好的模型具有的性质模型具有的性质7.2设定误差的类型设定误差的类型7.3遗漏相关解释变量的模型遗漏相关解释变量的模型:过低拟合模型过低拟合模型7.4引入不相关解释变量模型引入不相关解释变量模型:过度拟合模型过度拟合模型7.5不正确的函数形式不正确的函数形式7.6变量的度量误差变量的度量误差 7.7

3、模型设定误差的检验模型设定误差的检验 7.1“好的”模型具有的性质 简约性可识别性拟合优度理论一致性预测能力计量经济模型是对现实的抽象,模型应尽可能简洁即能够用少数解释变量说明一个被解释变量就不要用多个解释变量每个参数只有一个估计值对样本数据的拟合程度较好参数估计值的符号与经济理论相符预测值与经验值检验模型的有效性,即具有良好的预测能力7.2设定误差的类型:四个 遗漏相关变量采用了错误的函数形式变量的度量误差引入无关变量请注意:实践中的模型设定误差可能源于上述一个或多个原因。对所研究问题的相关基本理论了解不深未关注本领域前期的研究成果(相关文献)在研究中缺乏相关数据数据测量时有误差设定误差产生

4、的原因 采用遗漏相关变量的模型进行估计而带来的误差称为遗漏相关变量误差遗漏相关变量误差 设正确的模型为:两个解释变量 Y=B1+B2X1+B3X2+却错误设定为:一个解释变量 Y=A1+A2X1+v7.3遗漏相关变量遗漏相关变量遗漏解释变量将产生如下后果:六个(1)如果漏掉的如果漏掉的X2与与X1相关,使得遗漏变量的模型的最小二乘相关,使得遗漏变量的模型的最小二乘估计量是有偏的。即不仅代表了估计量是有偏的。即不仅代表了x1x1对被解释变量的直接影响,对被解释变量的直接影响,还代表了对被解释变量的间接影响(经由还代表了对被解释变量的间接影响(经由x2)x2)。简言之,本应由遗漏变量简言之,本应由

5、遗漏变量x2x2对被解释变量的影响却确体现在对被解释变量的影响却确体现在x1x1上。上。第四章之第四章之4.9设定误差设定误差,分析了古钟拍卖价格与钟表年代、竞标人数的回归分析了古钟拍卖价格与钟表年代、竞标人数的回归,(见(见P83)(2 2)错误模型的参数估计量也是不一致的,即参)错误模型的参数估计量也是不一致的,即参数估计值的均值数估计值的均值E(aE(ai i)与其理论值与其理论值A Ai i不相等。不相等。(3)如果如果X2与与X1不相关,则遗漏变量的模型的估计量满足无不相关,则遗漏变量的模型的估计量满足无偏性与一致性。偏性与一致性。(4 4)错误模型的随机误差项方差是真实随机误差方差

6、的有)错误模型的随机误差项方差是真实随机误差方差的有偏估计偏估计3/3/2023(5)错误模型的斜率系数方差也是有偏估计。)错误模型的斜率系数方差也是有偏估计。(6)通常的置信区间和假设检验过程不再可靠,置信区间会通常的置信区间和假设检验过程不再可靠,置信区间会变宽,会更频繁接受零假设。变宽,会更频繁接受零假设。3/3/2023举例:婴儿死亡率的决定因素 被解释变量:婴儿死亡率(CM)解释变量:人均国民收入PGNP;女性识字率 FLR 正确模型:上述三个变量模型(CM对PGNP、FLR回归)错误模型:遗漏FLR变量的两个变量模型(CM对PGNP回归)结论:不包含女性识字率的双变量模型,错误之处

7、:不仅忽略结论:不包含女性识字率的双变量模型,错误之处:不仅忽略了遗漏变量了遗漏变量“女性识字率女性识字率”对婴儿死亡率的影响,而且,也忽对婴儿死亡率的影响,而且,也忽略了女性识字率对人均国民收入的影响。略了女性识字率对人均国民收入的影响。因此,错误模型中的解释变量因此,错误模型中的解释变量PGNP,就担负起遗漏变量,就担负起遗漏变量“女女性识字率性识字率”对被解释变量(对被解释变量(CM)的影响,从而无法表现出的影响,从而无法表现出PGNP对对CM的真实的影响。的真实的影响。提示:在建立计量经济模型时,需要对所研究现象所蕴含的经提示:在建立计量经济模型时,需要对所研究现象所蕴含的经济理论做深

8、入了解,其目的是把相关解释变量都引入模型中。济理论做深入了解,其目的是把相关解释变量都引入模型中。3/3/2023婴儿死亡率与人均收入女性识字率建立的模型婴儿死亡率与人均收入女性识字率建立的模型正确设定模型正确设定模型:cm=263.6416-0.0056PGNP-2.2316FLR错误设定模型:错误设定模型:cm=157.4244-0.0114PGNP错误模型表明,人均收入每增加1美元,婴儿死亡率平均降低0.01,而该估计结果是错误高估了解释变量对被解释变量的影响,是上偏的。做FLR与PGNP回归即可以看出上偏的结果。FLR=47.5971+0.00256PGNP其斜率系数为b32=0.00

9、256,由正确模型估计结果知,B2=-0.0056,B3=-2.2316,根据式(7-3)得:B2+B3*b32=-0.0056+(-2.2316)*0.00256=-0.0114这与错误模型得到的估计值基本相等。因此,错误设定的模型中遗漏了变量因此,错误设定的模型中遗漏了变量FLR,不仅忽略了,不仅忽略了FLR对对CM的影响,也的影响,也忽略了忽略了FLR对对PGNP的影响,则错误设定模型的变量的影响,则错误设定模型的变量PGNP就只能担负起遗漏就只能担负起遗漏变量变量FLR对对CM的影响。从而也就无法表示的影响。从而也就无法表示PGNP对对CM的真实影响结果。的真实影响结果。包含无关变量偏

10、误包含无关变量偏误:采用包含无关解释变量的模型进行估计带来的偏误。设 Y=0+1X1+v (*)为正确模型,但却估计了错误的模型:Y=0+1X1+2X2+(*)如果2=0,则(*)与(*)相同,因此,可将(*)式视为以2=0为约束的(*)式的特殊形式。即即P86P86,第四章所介绍的第四章所介绍的“受限最小二乘受限最小二乘”7.4包含无关变量包含无关变量:过度拟合模型过度拟合模型用OLS法估计模型Y=0+1X1+2X2+由于所有的经典假设都满足,因此:(1)OLS估计量无偏的,也是一致的(4)但是,引入多余解释变量的模型的但是,引入多余解释变量的模型的OLS估计量无效,估计量无效,不具有最小方

11、差性不具有最小方差性(2)从错误的回归方程中,得到的方差估计量是正确的(3)置信区间和假设检验仍然是有效的OLS估计量是线性无偏估计量,但非最优,不再有效。估计量是线性无偏估计量,但非最优,不再有效。小结:小结:3/3/2023例7-2:举例说明 第六章中的6.5:食品支出模型 被解释变量:食品支出 解释变量:税后收入(x),“性别”(采用加法引入和乘法引入两个变量(D、DX)模型:回归结果:Y=1432.577+0.0616X-67.893D-0.0063DX t=(5.765)(7.376)(-0.194)(-0.485)iiiiiiXDDXY)(43103/3/2023例7-2的结论 前

12、面的模型中引入了差别截距、差别斜率变量的前面的模型中引入了差别截距、差别斜率变量的虚拟变量模型,由于虚拟变量模型,由于D、DX参数估计值都不显著,参数估计值都不显著,而引入虚拟变量而引入虚拟变量D的差别截距模型(的差别截距模型(6-9)的虚拟的虚拟变量系数显著,表明,差别斜率虚拟变量变量系数显著,表明,差别斜率虚拟变量DX很可很可能属于多余的。也就是说,食品支出模型中,正能属于多余的。也就是说,食品支出模型中,正确的引入解释变量,应该是定量变量:税后收入确的引入解释变量,应该是定量变量:税后收入X,虚拟变量虚拟变量D 食品支出模型引入虚拟变量食品支出模型引入虚拟变量D,表明:男女食品,表明:男

13、女食品支出的平均水平(截距)存在差异,但男女食品支出的平均水平(截距)存在差异,但男女食品支出的变化率(斜率)无差异。支出的变化率(斜率)无差异。当选取了错误函数形式并对其进行估计时,带来的偏误称错误函数形式偏误错误函数形式偏误 容易判断,这种偏误所估计的模型参数估偏误所估计的模型参数估计量是有偏估计计量是有偏估计。例如,如果“真实”的回归函数为生产函数eXAXY2121vXXY22110却估计线性式:显然,显然,两者的参数具有完全不同的经济含义,两者的参数具有完全不同的经济含义,且估计结果一般也是不相同的且估计结果一般也是不相同的。7.5错误函数形式错误函数形式3/3/2023例7-3:举例

14、说明 被解释变量:美国进出口商品支出 解释变量:个人可支配收入(PDI)、年份(Year)线性回归模型与对数回归模型所得到的参数估计值含义是完全不同的,(详细解释见教材第170页)7.6度量误差度量误差应变量中的度量误差引起的后果不太严重。解释变量中的度量误差引起的后果非常严重。建议使用工具变量工具变量或替代变量替代变量:与原始变量X高度相关,但与回归误差项无关,且不存在度量误差。若不同时期变量的定义不同,则需要确保数据的可比性。实践中的建议:实践中的建议:确保解释变量(X)的数据尽可能准确,不免除记录、舍入和遗漏误差。模型设定偏误的后果模型设定偏误的后果 模型设定出现误差时,模型估计结果会与

15、“实际”有偏差。这种偏差的性质与偏差的性质与程度与模型设定误差的类型密切相关。程度与模型设定误差的类型密切相关。7.77.7模型设定误差的检验模型设定误差的检验 7.7.1检验是否含有无关变量检验是否含有无关变量 可用可用t 检验与检验与F检验完成。检验的基本思想检验完成。检验的基本思想:如果模型中误选了无关变量,则其系数的真值应为零。因此,只须对无关变量系数的显著性进行检验。t t检验检验:检验某1个变量是否应包括在模型中;F F检验检验:检验若干个变量是否应同时包括在模型中(建议:F检验可以采用受限最小二乘,可以回答多个变量是否包含在模型中)。7.7.2对遗漏相关变量或函数形式设定偏误的检

16、验对遗漏相关变量或函数形式设定偏误的检验 (1)残差图示法)残差图示法 残差序列变化图残差序列变化图(a)趋势变化)趋势变化:模型设定时可能遗漏了一随着时间的推移而持续上升的变量(b)循环变化:)循环变化:模型设定时可能遗漏了一随着时间的推移而呈现循环变化的变量 (c c)模型函数形式设定偏误时残差序列呈现模型函数形式设定偏误时残差序列呈现正负交替变化正负交替变化 图示:图示:一元回归模型中,真实模型呈幂函数形式,但却选取了线性函数进行回归。补充说明 通常情况下,选择无关变量没有遗漏相关变量的后果严重。通常情况下,选择无关变量没有遗漏相关变量的后果严重。如果研究者注重估计量的无偏性、一致性,一

17、般宁可误选如果研究者注重估计量的无偏性、一致性,一般宁可误选无关变量也不愿遗漏相关变量。无关变量也不愿遗漏相关变量。如果研究者注重估计量的有效性,一般宁遗漏相关变量,如果研究者注重估计量的有效性,一般宁遗漏相关变量,也不愿误选无关变量。也不愿误选无关变量。检验模型中有没有无关变量,可以采用通常的检验模型中有没有无关变量,可以采用通常的t或或F检验的检验的方法,比较容易操作;方法,比较容易操作;检验模型中有没有遗漏变量,一般都是从不同角度检验随检验模型中有没有遗漏变量,一般都是从不同角度检验随机误差项(一般用回归的残差序列代替)是否的确与遗漏机误差项(一般用回归的残差序列代替)是否的确与遗漏的相

18、关变量呈现某种依存关系,若有依存关系,则表明有的相关变量呈现某种依存关系,若有依存关系,则表明有遗漏相关变量;若没有依存关系,则表明无遗漏相关变量。遗漏相关变量;若没有依存关系,则表明无遗漏相关变量。3/3/20237.7.37.7.3在线性模型和对数模型之间选择:在线性模型和对数模型之间选择:MWDMWD检验检验H0:线性模型:Y是X的线性函数H1:对数线性模型:Y是X(或LnX)的线性函数估计线性模型,得到Y的拟合值估计对数线性模型,得到LnY的拟合值做Y对X和Z1的回归1=-iiiZLnY LnY求2=-logiiiZY antiLnY求做LnY对X(或LnX)和Z2的回归对Z1的系数进

19、行变量的显著性检验,若显著,则拒绝H0对Z2的系数进行变量的显著性检验,若显著,则拒绝H1例P176:因为Z1的系数显著,则拒绝H0:假设真实的进口支出函数是线性的。因为Z2的系数显著,则拒绝H1:假设真实的进口支出函数是对数线性的。根据上述结果,本例中两个模型都是合理的。7.7.47.7.4一般性设定偏误检验一般性设定偏误检验 但更准确更常用的判定方法是拉姆齐(Ramsey)于1969年提出的所谓RESET 检验检验(regression error specification test)。基本思想:基本思想:如果事先知道遗漏了哪个变量,只需将此变量引入模型,估计并检验其参数是否显著不为零即

20、可;问题是不知道遗漏了哪个变量,需寻找一个替代变量Z,来进行上述检验。RESET检验中,采用所设定模型中被解释变量检验中,采用所设定模型中被解释变量Y的估计值的估计值的若干次幂来充当该的若干次幂来充当该“替代替代”变量。变量。(1)估计。估计。先估计原始模型得到拟合值。(4)检验和判断。检验和判断。若仅增加一个“替代”变量,可采用t t检验;检验;若增加多个“替代”变量,可采用“受限最小二乘”的F F检验。检验。(2)观察观察残差与拟合值的关系,决定引入拟合值的若干次幂进入模型作为“替代变量”。(3)再估计。再估计。估计引入了“替代变量”的新模型。230123iiiiiYXYY01iiiYXu

21、拉齐姆检验(拉齐姆检验(RESET 检验)检验)RESET 检验评价检验评价优点:简单易行。缺陷:可用于判断模型设定是否错误,却不能帮助我们选择正确模型。因此,该检验主要是诊断工具。例例:对商品进口进行研究,估计了中国商品进口M与GDP的关系,然而,由于仅用GDP来解释商品进口的变化,明显地遗漏了诸如商品进口价格、汇率等其他影响因素。在此,采用RESET检验考察建模时是否遗漏了重要的相关变量。(1)用原回归模型估计出商品进口序列 ttGDPM020.091.152 R2=0.9484 (-0.085)(8.274)(-6.457)(6.692)R2=0.9842320759.80028.0072.0860.3tttMEMGDPM)1(/()1(/)(222qknRqRRFURU5.22)424/()984.01(2/)948.0984.0(在=5%下,查得临界值F0.05(2,20)=3.49判断:判断:拒绝原模型与引入新变量的模型可决系数无显著差异的假设,表明原模型确实存在遗漏相关变量的设定偏误。

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|