1、计量经济总结计量经济总结 第六章 1、总体线性回归函数方程: uXBBY iii 21 ,其中ui是随机误差项 Y uXBBY iii 21 u u 0X 样本线性回归函数方程: eXbbY iii 21 2、 “线性”问题。 (一)变量线性 uXBBY iii 21 是变量线性的 u X BBYi i i 1 21 是变量非线性的 (二)参数线性 uXBBY iii 21 是参数线性的 uXBBY iii 2 2 1 是参数非线性的 注:计量经济书本上所说的线性通常默认是参数线性的,而非变量线性 3、样本的线性回归方程是如何找出来的? 找样本线性回归方程的准则:各样本点离回归直线的距离之和最
2、小,即 e 之和最小。 方法:普通最小二乘法普通最小二乘法,找出方程中的 b1,b2 方法原理: XbbYeiii21 , 根据上面的准则就有: )(e 21 Minimize 2 2 iXbbYii , 通过计算就可以得到 b1,b2,然后样本线性回归方程就出来了。 (具体推导过程看书上 120 页及 106 页) 第七章 1、计量经济学中的理想状态:古典线性回归模型 古典线性回归模型的假设: (一)参数线性,但变量不一定是线性的(第九章会涉及变量非线性的处理) (二)X 与 u 不相关,即 X 不随 u 的变动而相应变动 (三)给定一个 Xi,扰动项的期望或均值为 0,即 E(u|Xi)=
3、0。 (四)同方差,即方差的均值不随 Xi的变动而变动, 2 )var( ui YY OXOX 同方差异方差 (第 13 章涉及出现异方差的处理问题) (五)无自相关,两个误差项之间不相关 判断标准:cov(ui,uj)=0, ij,则两个误差项无自相关;若不等于 0 则自相关。 (第 14 章涉及出现自相关的处理问题) (六)模型不存在设定误差或设定错误,设定误差即模型中本该考虑进去的变量没有在 方程中体现出来。 (当然把所有影响的变量都考虑进去几乎是不可能的,所以现实中模型是 必然存在设定误差的,第 11 章将会涉及如何尽量减少设定误差的问题) 2、普通最小二乘估计量(b1,b2)的估计
4、(一)同一总体中的不同样本会出现不同的 b1,b2,如下图,黑色点和红色点是同一总体 中的不同样本,它们分别所求得的线性回归方程有所不同。 虽然不同的样本会有不同的 b1、b2,但是,b1、b2的变动是服从正态分布的。 (二)估计量的假设检验(以前概率学的内容,略) 3、回归直线的优度如何:判定系数 r2 YYiRSS=ei=(Yi-Y i ) TSS=Y Yi ESS=Y Yi Y OXXiX Y Y TSS ESS Y Y r i i 2 ,通常用来度量回归线的拟合优度。用文字表述为,判定 系数度量了回归模型对 Y 变异的解释比例。 4、回归分析结果各数据的解释 X Y i i 0814.
5、 06182. 7 Se=(3.0523) (0.0112) t=(2.4958) (7.2624)r2=0.8682 p=(0.0372) (0.0001) se 表示 b1,b2的标准差,r2表示 X 解释了 Y86.82%的变异。P 表示真实值 B1、B2为 0 的 概率,如上述pb 1 =0.0372,表示 B1=0 的概率仅有 0.372%,是小概率事件,所以 B1显著不 为 0;同样 B2也显著不为 0 第八章 1、什么是多元回归:包含有多个解释变量的回归模型 uXBXBBY iIii 23121 假设条件:无共线性。 如果一个变量能被其他变量表示,则称这两个变量具有共线性。如,
6、XXii12 2, 则这两个变量具有共线性。 实际中很少遇到完全共线性的情况,但是高度共线性或近似完全共线性的情况还是 很常见的。 (第 12 章将会涉及多重共线性的处理问题) 2、求多元线性回归方程 (一)同样,求多元线性回归方程的准则也是:各样本点离回归直线的距离之和最小,即 e 之和最小 (二)方法还是:普通最小二乘法普通最小二乘法,找出方程中的 b1,b2,b3 (三)方法原理也相类似。 鉴于多元线性回归方程的求解相当繁琐,估计不用记,只需要理解原理就行了。 3、多元回归只是一元回归的扩展,基本性质大同小异 (一)判定系数的求法也一样 TSS ESS r 2 (二)假设检验方法雷同,只
7、是分了偏回归系数的检验和联合检验而已。 偏回归系数检验就是假设 H0:B2=0. 联合检验就是假设 H0:B2=B3=0 或 R2=0,检验过程同样是用概率学里面的显著性检 验法。 4、关于什么时候增加新的解释变量的问题第 11 章会有更深入的分析 第九章回归模型的函数形式 模型形式适用截距和系数的解释 线性 XY BB21 截距表示:当 X=0 时,Y 的平均值,截距通常 没有经济意义。但更好的解释是,回归模型中 所有省略变量对 Y 的平均影响。 系数表示:每增加 1 单位 X,增加B 2单位的 Y 双对数 XY BB lnln 21 原式为 X B AY 2 ,其中 B1=lnA 柯布-道
8、格拉 斯生产函数 截距表示: 当X=1时, Y=eB1( X e B B Y 2 1 ) 系数表示: 每增加 1%X, 增加 100B 2%Y, 或每增加 1 单位 lnX, 增加B 2单位的 lnY 对 数 - 线性 XY BB21 ln 原式为 )1 ( 0 r YY t t , 其 中 B1 =lnY 0 , B2 =ln (1+r) 线 性 - 对数 XY BB ln 21 倒数 ) 1 ( 21 X Y BB 恩格尔消费指 数、 菲利普斯曲线 逆对数 ) 1 (ln 21 X Y BB 原式为 Y=e X BB 1 21 多项式 XBXBBB XY 3 4 2 321 总成本曲线 第
9、十章 1、什么是虚拟变量(或叫定性变量)? 定量变量如价格、重量、收入 定性变量如性别、种族、肤色 2、虚拟变量的处理:虚拟变量“定量化” 方法:用 0 表示变量不具备某种性质(如用 0 表示男) ,用 1 表示变量具备某种性质(如 用表示女) Yi=B1+B2Di+ui,其中,Di=1,女性 Di=0,男性 则 B Yi 1 表示男性的 Y 值, BB Yi 21 表示女性的 Y 值 3、多分定性变量 性别只有两种,所以用 0,1 表示就可以了。但是如果是肤色(肤色有黑白黄等多种) , 怎么表示? 方法:多分定性变量 假定如下模型: uDBDBBY iiii 23221 其中,Yi表示收入,
10、 D2=1,黄种人 =0,其他肤色人 D3=1,白种人 =0,其他肤色人 则黄种人的收入为 BBBBB Yi 21321 )0() 1 ( 白种人的收入为 BBBBB Yi 31321 ) 1 ()0( 黑种人及其他肤色人种的收入为 BBBB Yi 1321 )0()0( 第十一章 1、如何才是好的模型 (一)简约性。简单优于复杂的 (二)可识别性。估计的参数值必须是唯一的。 (三)拟合优度。R2越高,模型越好 (四)理论一致性。模型系数正负与实际中的理论相一致 (五)预测能力。 2、实践中经常遇到的一些设定误差: (一) 遗漏相关变量。 遗漏相关变量的后果很严重, 所估计的参数不符合有效性,
11、 一致性。 遗漏相关变量,模型对现象的解释力度就差。 (二)包括不相关变量。所估计的参数无偏且有效,估计的误差方差正确。但是估计系数 的方差会变大,因而无法辨别应变量与解释变量之间的显著关系,容易接受零假设。 (三)不正确的函数形式。 XY BB21 (1) XY BB lnln 21 (2) 对一个现象建立模型到底是选择(1)还是(2) ,需要用到 MWD 检验(注:不能 用两个模型的 R2直接比较,然后选择 R2高的) (四)度量误差。收集的数据不准确。 3、诊断设定误差。 (一)诊断非相关变量的存在 方法:当变量的系数 P 值比较大(一般是 0.1 以上) ,不能拒绝零假设时,那么该变量
12、 就是一个多余变量;如果 P 值十分小,拒绝零假设,则该变量很可能属于模型。 注意:如果经济理论表明模型中的变量都对 Y 有影响,那么就应该把它们都纳入模型, 即使实证检验发现一个或多个解释变量的系数是统计不显著的。 (二)对遗漏变量和不正确函数形式的检验 通常,判定模型是否恰当主要根据一下一些参数: (1)R2和校正后的 R2,R2越高越好 (2)估计量的 t 值,看 t 值是否是显著的 (3)估计系数的符号,看系数符号是否与实际预期相同 如果这些结果都很好,则可以接受所选模型,认为它较好地代表了现实。 如果这些结果不好,为究其“病因” ,可以采用残差检验、MWD 检验、RESET 检验、
13、沃尔德检验、拉格朗日乘子检验等 第 12 章 1、什么是多重共线性:即多元回归中的解释变量 X 之间存在线性关系 (一)完全多重共线性:如 x1= a x2+ b (二)不完全多重共线性:如 x1i= a x2 i+ b + ei 2、多重共线性的后果: (一)OLS 估计量仍然无偏 (二)OLS 估计量的方差和标准误较大 (三)置信区间变宽。这是由于标准误增大所导致的。 (四)t 值不显著。也是标准误增大导致的。 (五)R2值较高,但 t 值并不都是统计显著的。 (六)回归系数符号有误。根据经济现象,收入增加,对普通商品的需求量是会增加的。 但是在计量经济中, 如果选取的变量间存在着多重共线
14、性, 有可能会出现收入跟普通商品是 负效应的。 (七)难以评估各个解释变量对 R2的贡献。 3、诊断 (一)R2值较高,但 t 值统计显著的不多。 (二)一个解释变量可以用其他一个或多个变量解释。做法:做该变量对其他变量的回归 并计算相应的 R2值。 (三)方差膨胀因子 4、多重共线性就不好吗? 并不是这样的。当在做整体预测时,如果变量 X 是多重共线性的,对其预测不是坏事, 反而会提高预测的准成度。但如果含有多重共线性的函数是用于估计参数,研究个体,则存 在严重问题(如,系数符号) 5、如何对付多重共线性。 (一)在模型中删除一个变量。既然有一个变量是可以由其他变量表示的,那就干脆把这 个变
15、量给删掉。 (二)增加新的数据或样本 (三)重新考虑模型 第 13 章 1、什么是异方差? 异方差即方差随观察值(X)不同而发生变化。 异方差与同方差的比照: 异方差同方差 符号表示方式 E(ui2)= 2 i 2 i 即方差随 Xi变化而变化, 当 Xi=X1时, 2 i = 2 1 ; 当 Xi=X2时, 2 i = 2 2 E(ui2)= 2 2 i 即方差不随 Xi的变化, 当 Xi=X1时,方差为 2 ; 当 Xi=X2时,方差仍为 2 图形X-Y 图 方差图 YY 椭圆 非椭圆 OX X-e2图 OX 2、现实生活中,什么时候出现异方差? 在研究某一时点上各大中小公司平均成本与产出
16、关系的时候,在研究某一时点上各省 收入情况的时候,我们都会遇到异方差问题。 总的来说,异方差多存在于截面数据中,发生在研究某一时点上异质性对象的情况的 时候。 3、异方差后果: 在存在异方差的情况下,估计量(b1、b2)无偏,但估计量不再有效,且方差有偏,置 信区间和假设检验不可靠,有可能得出错误的结论。 分析: 方差有偏,是因为异方差中方差不是恒定的,而是随 Xi的变化而变化的,那么就会造 成以任何一个方差作为真实方差的估计都会存在偏差。 既然方差不可靠, 建立在 t 分布和 F 分布之上以方差为基础量而求得的置信区间和假设 检验也不可靠。 异方差破坏 OLS 估计以及假设检验,它的严重性,
17、在具体研究中尤其是涉及截面数据 时,必须判断是否存在异方差。 4、异方差的诊断: (一)图形检验:利用上述的 X-e2图 (二)帕克检验、怀特的一般异方差检验 5、异方差的补救: 思路一:将模型通过“变换” ,使异方差变为同方差。 (一)当 2 i 已知时,两边同乘 i 1 (二)当 2 i 未知,若误差方差与 Xi成比例,两边同乘 xi 1 方差不 随 Xi变 化 方差随 Xi变化 而变化 若Xi2 xi 1 思路二:重新设定模型,通过双对数模型,消除方程异方差性。 思路三:怀特异方差校正 第 14 章 1、什么是自相关? 简单来说,自相关就是当期的误差与过去的误差有关,即误差与时间存在一定
18、关系。 (图看 313 页) 2、什么时候出现自相关? 在研究一家公司历年的产出情况时,在研究一个省份历年的收入情况时,就会遇到自相 关的问题。总的来说,自相关通常与时间序列数据有关。 3、自相关出现的原因: (一)惯性或迟缓性。 (二)模型设定误差。 4、自相关后果 在存在自相关的情况下,估计量(b1、b2)无偏,但无效,方差有偏,t、F 检验不可靠。 5、诊断 (一)图形法 t-et图 无自相关自相关 et-et-1图 无自相关自相关 (二)德宾-沃森 d 检验 6、补救措施(略) 经济计量学首先是构建一个理想状态古典回归模型, 在此基础上研究估计量、 置信 区间、假设检验、拟合优度、函数形式、虚拟变量等问题的。但在实际生活中,这种理想状 态几乎是不可能发生的,例如,研究一个地区历年的发展状况时,会遇到自相关;在研究某 一年各个地区的发展问题时,又会遇到异方差;在构建模型的时候,可能会遇到遗漏变量、 包括多余变量,甚至是构建了不正确的函数形式;还有可能是遇到,所构建的模型中解释变 量是多重共线性的为处理这些问题, 书上在第三部分对它们进行了分析, 分析了问题造 成的后果,提供了如何解决的方法。