1、第二部分 实践中的回归分析 1 基本假定违背:基本假定违背:不满足基本假定的情况。 (1)模型设定有偏误;所选模型是正确设定的 (2)解释变量之间存在多重共线多重共线性; (3)随机误差项序列存在异方差异方差性; (4)随机误差项序列存在序列相关序列相关性。 所选模型是正确设定的 解释变量之间不存在完全线性关系 误差项方差为常数 误差项之间不相关 基本假定 基本假定 基本假定 基本假定 2 第七章 模型选择:标准与检验 一、模型设定误差概述一、模型设定误差概述 二、模型设定偏误的后果二、模型设定偏误的后果 三、模型设定偏误的检验三、模型设定偏误的检验 3 一、模型设定误差概述 1、模型设定误差
2、的含义及类型 3、设定误差产生的原因 2、“好的”模型具有的性质 4 1a模型设定误差的含义 模型中被解释变量和解释变量之间的关系设定有误 实践中的模型设定误差可能源于上述一个或多个原因。 1b设定误差的类型 遗漏相关变量 采用了错误的函数形式 错误地设定了误差项的形式 多选无关变量 度量误差 5 2、“好的”模型具有的性质 简约性 可识别性 拟合优度 理论一致性 预测能力 模型是对现实的抽象,模型应尽可能简洁 每个参数只有一个估计值 对样本数据的拟合程度较好 参数估计值的符号与理论相符 预测值与经验值检验模型的有效性, 即具有良好的预测能力 6 对所研究问题的相关理论了解不深 未关注本领域前
3、期的研究成果 在研究中缺乏相关数据 数据测量时有误差 3、设定误差产生的原因 7 二、模型设定偏误的后果二、模型设定偏误的后果 模型设定出现偏误时,模型估计结果会 与“实际”有偏差。这种偏差的性质与偏差的性质与 程度与模型设定偏误的类型密切相关。程度与模型设定偏误的类型密切相关。 8 1、遗漏相关变量 正确的模型为 Y=0+1X1+2X2+ 错误设定的模型为 Y=0+ 1X1+v (1)若X2与X1相关,OLS估计量在小样本下有偏、大样本下非一致 (2)若X2与X1不相关,1的估计量无偏、一致,然0的估量有偏 () ii E 11221 ()*Eb 0022211 ()*EXbX 9 1、遗漏
4、相关变量 正确的模型为 Y=0+1X1+2X2+ 错误设定的模型为 Y=0+ 1X1+v (5) 通常的置信区间和假设检验过程不再可靠,置信区间会变宽, 会更频繁接受零假设。 (3)错误模型的误差方差是真实误差方差的有偏估计。 22 v E (4) 的方差是真实估计量 的方差的有偏估计 1 1 11 E VarVar 10 2、包含无关变量 正确的模型为 Y=0+1X1+ 错误设定的模型为 Y=0+ 1X1+ 2X2+ v (1)OLS估计量无偏且一致 (3)建立在t、F检验基础上的置信区间和假设检验有效。 () ii E (2)错误模型的误差方差是真实误差方差的无偏估计。 22 v E 11
5、 2、包含无关变量 正确的模型为 Y=0+1X1+ 错误设定的模型为 Y=0+ 1X1+ 2X2+ v (5) 估计的标准误变大,参数估计值不精确,置信区间会变宽。 (4) 的方差是真实估计量 的方差的有偏估计 1 1 11 E VarVar OLS估计量是线性无偏估计量,但非最优,不再有效。估计量是线性无偏估计量,但非最优,不再有效。 12 当选取了错误函数形式并对其进行估计时, 带来的偏误称错误函数形式偏误错误函数形式偏误(wrong functional form bias)。 容易判断,这种偏误是全方位的偏误是全方位的。 例如,如果“真实”的回归函数为 eXAXY 21 21 vXXY
6、 22110 却估计线性式 显然,两者的参数具有完全不同的经济含义, 且估计结果一般也是不相同的。 3、错误函数形式的偏误 13 4 4、度量误差、度量误差 应变量中的度量误差引起的后果不太严重。 解释变量中的度量误差引起的后果非常严重。 建议使用工具变量工具变量或替代变量替代变量:与原始变量X高度 相关,但与回归误差项无关,且不存在度量误差。 若不同时期变量的定义不同,则需要确保数据的可比性。 实践中的建议:实践中的建议: 确保X的数据尽可能准确,不免记录、舍入和遗漏误差。 14 三、模型设定偏误的检验三、模型设定偏误的检验 1、检验是否含有无关变量、检验是否含有无关变量 可用可用t 检验与
7、检验与F检验完成。检验完成。 检验的基本思想检验的基本思想: :如果模型中误选了无关变量,则 其系数的真值应为零。因此,只须对无关变量系数的 显著性进行检验。 t t检验检验:检验某1个变量是否应包括在模型中; F F检验检验:检验若干个变量是否应同时包括在模型中 。 15 2、检验是否有相关变量的遗漏或函数、检验是否有相关变量的遗漏或函数 形式设定偏误形式设定偏误 (1)残差图示法)残差图示法 16 残差序列变化图残差序列变化图 (a)趋势变化)趋势变化 : 模型设定时可能遗 漏了一随着时间的 推移而持续上升的 变量 (b)循环变化:)循环变化: 模型设定时可能遗 漏了一随着时间的 推移而呈
8、现循环变 化的变量 17 (c c) 模型函数形式设定偏误时残差序列呈现模型函数形式设定偏误时残差序列呈现 正负交替变化正负交替变化 图示:图示:一元回归模型中,真实模型呈幂函数形 式,但却选取了线性函数进行回归。 18 (2)一般性设定偏误检验)一般性设定偏误检验 但更准确更常用的判定方法是拉姆齐(Ramsey) 于1969年提出的所谓RESET 检验检验(regression error specification test)。 基本思想:基本思想: 如果事先知道遗漏了哪个变量,只需将此变量 引入模型,估计并检验其参数是否显著不为零即 可; 问题是不知道遗漏了哪个变量,需寻找一个替 代变量
9、Z,来进行上述检验。 RESET检验中,采用所设定模型中被解释变量检验中,采用所设定模型中被解释变量Y 的估计值的估计值的若干次幂来充当该的若干次幂来充当该“替代替代”变量。变量。 19 (1)估计。估计。先估计原始模型得到拟合值。 (4)检验和判断。检验和判断。若仅增加一个“替代”变量,可采用 t t检验;检验;若增加多个“替代”变量,可采用“受限最小二 乘”的F F检验。检验。 (2)观察观察残差与拟合值的关系,决定引入拟合值的若干 次进入模型作为“替代变量”。 (3)再估计。再估计。估计引入了“替代变量”的新模型。 23 0123 iiiii YXYY 01iii YXu RESET 检
10、验检验 20 RESET 检验评价检验评价 优点:简单易行。 缺陷:可用于判断模型设定是否错误, 却不能帮助我们选择正确模型。 因此,该检验主要是诊断工具。 21 例例:对商品进口进行研究,估计了中国商品进口 M与GDP的关系,然而,由于仅用GDP来解释商 品进口的变化,明显地遗漏了诸如商品进口价格、 汇率等其他影响因素。在此,采用RESET检验考 察建模时是否遗漏了重要的相关变量。 (1)用原回归模型估计出商品进口序列 tt GDPM020. 091.152 R2=0.9484 22 (-0.085) (8.274) (-6.457) (6.692) R2=0.9842 32 0759. 8
11、 0028. 0072. 0860. 3 ttt MEMGDPM )1(/()1 ( / )( 2 22 qknR qRR F U RU 5 .22 )424/()984. 01 ( 2/ )948. 0984. 0( 在=5%下,查得临界值F0.05(2, 20)=3.49 判断:判断:拒绝原模型与引入新变量的模型可决系 数无显著差异的假设,表明原模型确实存在遗 漏相关变量的设定偏误。 23 (3 3)在线性模型和对数模型之间选择:)在线性模型和对数模型之间选择:MWDMWD检验检验 H0:线性模型:Y是X 的线性函数 H1:对数线性模型:Y是X (或LnX)的线性函数 估计线性模型,得到Y
12、的拟合值 估计对数线性模型,得到LnY的拟合值 做Y对X和Z1的回归 1 =- i ii ZLnY LnY求 2 = -log iii ZY antiLnY求 做LnY对X(或LnX )和Z2的回归 对Z1的系数进行变 量的显著性检验, 若显著,则拒绝H0 对Z2的系数进行变 量的显著性检验, 若显著,则拒绝H1 24 H0:线性模型:M是 GDP的线性函数 例. 商品进口M与GDP的关系选择线性or对数线性模型? H1:对数线性模型:LnM 是GDP的线性函数 1 1 = 141.440.02112.42 = ZLnMLnM MGDPZ t p 令 (2.87)(19.56)(0.73) (
13、0.01)(0.00)(0.47) 对Z1的系数进行变量的显著性检验,不显 著,所以不拒绝H0 25 H0:线性模型:M是 GDP的线性函数 例. 商品进口M与GDP的关系选择线性or对数线性模型? H1:对数线性模型:LnM 是GDP的线性函数 2 2 =e 5.41 0.0000290.001 = LnM ZM LnMGDPZ t p 令 (50.67)(11.61)(-2.90) (0.00)(0.00)(0.009) 对Z2的系数进行变量的显著性检验,显著, 所以拒绝H1 26 H0:线性模型:M是 GDP的线性函数 例. 商品进口M与GDP的关系选择线性or对数线性模型? H1:对数线性模型:LnM 是GDP的线性函数 对Z2的系数进行变量的显著性检验,显著, 所以拒绝H1 对Z1的系数进行变量的显著性检验,不显 著,所以不拒绝H0 结论:认为M是GDP的线性函数比较合适。 27 例P176: 因为Z1的系数显著,则拒绝H0:假设真实的进口支出 函数是线性的。 因为Z2的系数显著,则拒绝H1:假设真实的进口支出 函数是对数线性的。 根据上述结果,无从选择,另寻方法。 28 作业:问题7.1问题7.10 习题:7.117.15、7.18、7.20 上机操作:7.16、 7.17、7.19 、7.21 29