1、1计量经济学期末复习计量经济学期末复习2第第1章章 经济计量学的特征及研经济计量学的特征及研究范围究范围一、什么是经济计量学一、什么是经济计量学 经济计量学是利用经济理论、数学、统计经济计量学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科推断等工具对经济现象进行分析的一门社会科学。学。经济计量学运用数理统计知识分析经济数经济计量学运用数理统计知识分析经济数据,对构建于数理经济学基础之上的数学模型据,对构建于数理经济学基础之上的数学模型提供经验支持,并得出数量结果。提供经验支持,并得出数量结果。计量经济学与其他学科的区别计量经济学与其他学科的区别3二、利用计量经济学研究经济问
2、题的步骤二、利用计量经济学研究经济问题的步骤 1.1.理论分析;理论分析;2.2.收集数据;收集数据;3.3.建立数学模型;建立数学模型;4.4.建立统计或经济计量模型;建立统计或经济计量模型;5.5.经济计量模型的参数估计;经济计量模型的参数估计;6.6.检查模型的准确性;检查模型的准确性;7.7.检验来自模型的假说;检验来自模型的假说;8.8.运用模型进行预测;运用模型进行预测;4第2章 线性回归模型的基本思想:双变量模型一、回归的含义一、回归的含义 二、总体回归函数二、总体回归函数iiXBBXYE21)(iiiuXBBY215三、随机误差项的性质三、随机误差项的性质 1.模型中未包括的变
3、量的影响;(简单原则)2.随机因素的影响;3.量测误差;6四、样本回归函数四、样本回归函数 iiXbbY21iiieXbbY217五、线性回归模型五、线性回归模型 1.解释变量线性 2.参数线性 注:线性回归是指参数线性的回归,而解释变 量不一定是线性的。8六、普通最小二乘法(六、普通最小二乘法(P26-P28)P26-P28)普通最小二乘法原理:残差平方和最小 9第 3、4章 多元线性回归模型的参数估计、假设检验 一、古典线性回归模型的基本假定一、古典线性回归模型的基本假定 1.解释变量与扰动项不相关;解释变量与扰动项不相关;2.扰动项的均值为零;扰动项的均值为零;3.扰动项同方差;扰动项同
4、方差;4.扰动项之间无自相关;扰动项之间无自相关;5.扰动项服从正态分布;扰动项服从正态分布;6.解释变量之间不存在线性相关关系;解释变量之间不存在线性相关关系;10二、普通最小二乘估计量(双变量)二、普通最小二乘估计量(双变量)普通最小二乘估计量的性质;P46 高斯-马尔柯夫定理 最优线性无偏最优线性无偏 11三、三、t-统计量统计量 其中,其中,n为样本个数,为样本个数,k为参数个数,为参数个数,(n-k)称称为为t-统计量的自由度。统计量的自由度。在给定自由度和显著性水平的情况下,可在给定自由度和显著性水平的情况下,可以求出以求出t-临界值。临界值。kntbseBb)(22212四、置信
5、区间四、置信区间 置信区间为:1)(2/2222/tbseBbtP1)()(22/2222/2bsetbBbsetbP)(,)(22/222/2bsetbbsetb13五、显著性检验五、显著性检验 H0:B2=B*,H1:B2 B*在原假设成立的条件下:统计量t=(b2-B*)/se(b2)服从于自由度为n-k的 t-分布;取定显著水平,查表得到t/2(n-k)t t/2 拒绝零假设 t t/2 不拒绝零假设 特别地,B*=014六、六、离差分解离差分解 222)()()(iiiiYYYYYY2)(YYi2)(YYi2)(iiYY 称为总离差平方和,记为TSS称为回归平方和,记为ESS 称为残
6、差平方和,记为RSS15七、各七、各平方和及其自由度平方和及其自由度 P81 总离差平方和可以分解为两个部分:一部分归于回归直线(回归平方和),一部分归于随机因素(残差平方和);即 TSS=ESSTSS=ESSRSSRSS TSS的自由度为n-1 RSS的自由度为n-k ESS的自由度为k-1 其中,n为样本个数,k为参数个数;16八、八、拟和优度的检验:判定系数拟和优度的检验:判定系数R R2 2 判定系数R2度量了回归模型(解释变量)对Y的解释程度;也表示样本回归模型对总体回归模型的拟合程度;0 R2 1 特别地,对于两变量回归模型来说,R2在数值上等于相关系数的平方,相关系数的符号由B2
7、确定。TSSRSSTSSESSR1217十、十、校正校正R R2 2 判定系数R2的一个重要性质就是模型中的解释变量的个数越多,R2值就越大;为了消除变量个数对R2的影响,我们定义了校正的判定系数:knnRR1)1(12218十一、校正判定系数的性质:十一、校正判定系数的性质:1.对于多元回归模型来说,校正判定系数小于非校正判定系数;2.虽然校正判定系数总为正,但校正判定系数可以为负;19十二、联合检验十二、联合检验 显著性检验是用来检验某一个参数是否为零。现在考虑假设:这个零假设称为联合假设,即B2和B3同时为零,或者说X X2 2和X X3 3对Y Y无影响,等同于下面的零假设:即X X2
8、 2和X X3 3对因变量变化的解释比例为零;0:320 BBH0:20RH20十三、十三、F F统计量统计量 其含义为:被X X2 2和X X3 3解释的Y Y的变动除以未被X X2 2和X X3 3解释的Y Y的变动;可见X X2 2和X X3 3对Y Y的解释程度越高,F值越大;如果计算得到的F值超过F临界值,则拒绝原假设;否则接受原假设;),1(././knkFfdRSSfdESSF21十四、十四、F F与与R R2 2的关系的关系 可以证明:R2等于0时,F等于0;R2越大,F值越大;R2等于1时,F无穷大;)/()1()1/(22knRkRF22第5章 回归方程的函数形式一、双一、
9、双对数模型对数模型 B2表示X X变化百分之一引起Y Y变化B2百分点,其经济意义为Y Y对X X的弹性;如果上述模型满足古典假定,b1、b2是无偏有效估计量。iiiuXBBYlnln2123二、二、对数对数-线性模型线性模型 B2表示X X变化一个单位引起Y Y变化的百分比,或者说X X变化一个单位,Y Y的平均增长率;特别地,如果解释变量为时间t,则上述模型称为增长模型;iiiuXBBY21ln24三、三、线性对数线性模型线性对数线性模型 B2表示X X变化1个百分点引起Y Y的绝对量的变化为(0.01*B2);本章的重点为,偏斜率系数(偏回归系数)的解释;以及不同形式模型间的比较;iii
10、uXBBYln2125第6章 虚拟变量一、定义一、定义 有些指标是定性变量(性别、学历),我们用虚拟变量来描述定性变量;习惯上我们把取值为0和1的变量称为虚拟变量,0表示变量不具备某种属性,1表示变量具备某种属性。用表示虚拟变量。26 例:利用虚拟变量建立经济计量模型研究女性在工资收入方面是否受到歧视。27二、二、加法模型加法模型 再引入一个变量,令表示工作年限再引入一个变量,令表示工作年限 建立模型:在古典假定下,我们有:女性平均年薪:男性平均年薪:如果B2=0则说明不存在性别歧视,如果B20则说明存在性别歧视;iiiiuDBXBBY210iiiXBBDYE10)0(210)1(BXBBDY
11、Eiii28 男女职工的平均年薪对工龄的函数具有相同男女职工的平均年薪对工龄的函数具有相同斜率斜率B B1 1,即随着工龄的增长男女工资的增长幅度,即随着工龄的增长男女工资的增长幅度相同;截距不同,说明男女的初始年薪不同。相同;截距不同,说明男女的初始年薪不同。我们称这种虚拟变量只影响截距不影响斜我们称这种虚拟变量只影响截距不影响斜率的模型为加法模型。率的模型为加法模型。29三、三、乘法模型乘法模型 如果随着工龄增加,男性与女性的年薪差距也发生变化,则模型就变为:在古典线性假定下,我们有:男性平均年薪:女性平均年薪:如果B2=0则说明不存在性别歧视,如果B20则说明存在性别歧视;iiiiiuX
12、DBXBBY210iiiXBBDYE10)0(iiiXBBBDYE)()1(21030 男女职工的平均年薪对工龄的函数具有相同截距B0,说明男女的初始年薪相同;但斜率不同,说明随着工龄的增长男女工资的增长幅度不同。我们称这种虚拟变量只影响斜率不影响截距的模型为乘法模型。31五、混合五、混合模型模型 如果男性与女性的初始年薪和年薪增速都存在差异,我们可以将加法模型和乘法模型结合起来,得到如下模型:上面的上面的模型可以用来表示截距和斜率都发生变化的模型,称为混合模型;iiiiiiuDBXDBXBBY321032六、虚拟变量的几点说明六、虚拟变量的几点说明 基准类:赋值为0的一类称为基准类;差别系数
13、:虚拟变量的系数;差别截距系数;差别斜率系数;对于有截距项的模型,引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,就是通常说的虚拟变量陷阱。33第8章 多重共线性一、什么是多重共线性一、什么是多重共线性 多重共线性是指解释变量之间存在着完全或高度线性相关关系;可分为完全多重共线性和高度多重共线性;本书中所研究的多重共线性是指高度多重共线性。当回归模型中的两个解释变量之间存在着完全多重共线性,我们就可以通过它们之间的线性关系消除掉其中一个变量;其后果表现为不能完全估计出模型的参数,只能估计出两变量参数的线性组合。34二、多重共线性问题的几点说明二、多重共线性问题的几点说明 1
14、.当模型中存在着多重共线性问题时,普通最小二乘法估计量仍然是线性无偏最小方差估计量;2.最小方差性并不意味着在任何给定的样本中普通最小二乘估计量的方差会很小;3.即使总体上各个变量之间不存在线性相关,但却可能在具体获得的样本中存在线性相关,即多重共线性本质上是一个样本问题。35三、多重共线性的实际后果三、多重共线性的实际后果 1.OLS估计量的方差和标准差较大;2.置信区间变宽;3.模型R2值较高,t值不显著;4.OLS估计量及其标准差对数据的变化敏感;5.回归系数符号有误;6.难以衡量各个解释变量对R2的贡献;36四、多重共线性的测定四、多重共线性的测定 在研究多重共线性的测定问题之前,应该
15、先明确下面两个问题:1.多重共线性是一个程度问题而不是存在与否的问题;2.多重共线性是样本的特征,而不是总体的特征;因此,测定的不是多重共线性存在与否的问题,而是测定给定样本的多重共线性程度问题。37五、多重共线性的测定方法五、多重共线性的测定方法 1.R2较高,但t值显著的不多;2.解释变量之间两两高度相关;3.辅助回归;4.方差膨胀因素;P19138六、六、辅助回归辅助回归 作每个变量对其他剩余变量的回归并计算相应的R2值。其中的每一个回归都被称为是从属或者辅助回归;如果某个解释变量不是其他变量的线性组合,则该回归方程的R2显著为零。通过判断F值是否显著,判断变量之间是否存在共线性。39七
16、、七、方差膨胀因素方差膨胀因素 通过代数替换方差公式可以改写为:其中:R22表示X2对X3回归的拟合优度;我们称VIF为方差膨胀因素;VIF越大表示变量之间共线性的程度越高;VIF超过10,则认为是高度共线的。VIFxbi2222)var(2211RVIF40八、修正多重共线性的方法八、修正多重共线性的方法 1.从模型中删除不重要的解释变量 2.获取额外的数据或新的样本 3.先验信息 4.变量代换41第9章 异方差异方差一、异方差定义、异方差定义 本章主要介绍古典假设中同方差假定不满足的情况下,如何进行计量经济分析;异方差:对于不同的观测点,随机扰动项的方差不同。用公式表示为:异方差问题多存在
17、于横截面数据中;22iiuE42二、二、异方差的后果异方差的后果 1.OLS估计量仍然是线性无偏的;2.OLS估计量不再具有最小方差性;3.估计量 不再是真实 的无偏估计;4.OLS估计量方差的估计量是有偏的;5.t检验和F检验失效;2243三、三、异方差的检验异方差的检验 1.帕克检验;P210-P216 2.格莱舍尔检验;3.White检验;44四、四、加权最小二乘法加权最小二乘法(WLS)(WLS)误差方差 是已知的情况:考虑双变量回归函数:对模型作如下变换:令 为变换后的误差项;2iiiiiiiiuXBBY211iiiuv/iiiuXBBY2145 在实际估计回归方程时,将Y和X的每个
18、观察值都除以已知的 ,然后再对这些变换后的数据进行OLS回归,由此获得的估计量就称为加权最小二乘估计量,为权数。这种加权的过程就称为加权最小二乘法。2ii/146五、五、异方差的补救措施异方差的补救措施(未知未知)情形1:方差 与 成比例:对模型作如下变换:令 为变换后的误差项;2i2iiiX22iiiiiiiXuXXBXBXY211iiiXuv/iX47 情形2:方差 与 成比例:对模型作如下变换:令 为变换后的误差项;2iX2i222iiXiiiiiXuBXBXY211iiiXuv/48第10章 自相关一、自相关定义、自相关定义 本章主要介绍古典假设中无自相关假定不满足的情况下,如何进行计
19、量经济分析;自相关:指回归模型中的随机扰动项之间存在相关。用公式表示为:自相关问题多存在于时间序列数据中;jiuuEji,0)(49二、自相关的后果二、自相关的后果 1.OLS估计量是线性无偏的;2.OLS估计量不是有效的;3.OLS估计量的方差是有偏的;4.t检验和F检验失效;5.计算的误差方差是真实方差的有偏估计量;6.计算的R不能测度真实R;7.计算的预测方差和标准差可能也是无效的;50三、自相关的诊断三、自相关的诊断 1.游程检验;2.DW检验;51五五、D DW W统计量的定义统计量的定义 niiiniieeed12212)(52六、六、D DW W统计量的一些基本假设统计量的一些基
20、本假设 1.回归模型包括截距项;2.解释变量是非随机变量;3.扰动项 的产生机制是:4.在回归方程的解释变量中,不包括因变量的滞后变量;iu11,1iiivuu53七、七、D DW W检验检验 可以证明对于大样本来说 其中:则我们可以根据DW统计量的取值来判断自相关性(0,2,4);12dniiniiieee1221/54八、八、D DW W检验的步骤检验的步骤 1.进行OLS回归并获得残差 ;2.计算d值;3.给定样本容量及解释变量的个数,从d检验表中查到临界值 和 。4.把DW统计量与上、下临界值比较,判断相关性;P252的图12-5和表12-2ieLdUd55DW检验检验 拒绝拒绝H0存
21、在着正存在着正 的自相关的自相关 无法无法判断判断区域区域(盲(盲区区)无法判无法判断区域断区域(盲区)(盲区)接受接受H0或者或者H*0拒绝拒绝H*0,存在着存在着负自相负自相关关0 dL dU 2 4-dU 4-dL 456九、补救措施九、补救措施 广义差分方程 24257十、相关系数十、相关系数的估计方法的估计方法 244页 121dtttvee158第11章 联立方程模型一、基本概念一、基本概念 定义:包括多个方程,并且变量之间存在双向关系的回归模型称为联立方程模型;基本概念:内生变量、外生变量、结构方程、结构系数、恒等式、简化方程、简化系数;59二、模型的联立问题二、模型的联立问题
22、P262 随机解释变量问题随机解释变量问题 60三、模型的识别问题三、模型的识别问题 P265-P270 1.不可识别;2.恰好识别;3.过度识别;4.识别的阶条件;61模型识别的阶条件(仅是必要条件)模型识别的阶条件(仅是必要条件)m=模型中内生变量的个数(等于方程个模型中内生变量的个数(等于方程个数);数);k=不包含在给定方程中所有变量(包含内不包含在给定方程中所有变量(包含内生变量和外生变量)的个数生变量和外生变量)的个数判定规则:判定规则:若若k=m-1,方程恰度(好)识别。,方程恰度(好)识别。若若km-1,方程过度识别。,方程过度识别。若若km-1,方程不可识别。,方程不可识别。
23、62四、间接最小二乘法四、间接最小二乘法(ILS)P264 步骤:步骤:步骤步骤1:从结构方程导出简化方程;:从结构方程导出简化方程;步骤步骤2:对简化方程的每个方程用:对简化方程的每个方程用OLS方法回归;方法回归;步骤步骤3:利用简化方程系数的估计值求结构方程系:利用简化方程系数的估计值求结构方程系 数的估计值。数的估计值。63五、两阶段最小二乘法五、两阶段最小二乘法(2SLS)P270 1.解释变量中的内生变量对所有外生变量解释变量中的内生变量对所有外生变量回归,使用回归,使用OLS估计估计(第一次第一次),得到相应内生变,得到相应内生变量的拟合值。量的拟合值。2.用上一步中得到的工具变量用上一步中得到的工具变量 替换替换Y,用,用OLS估计变换后的回归方程估计变换后的回归方程(第二次第二次)。iY64例:宏观经济模型例:宏观经济模型 tttttttttttGICYuYBYBBIuYAAC21321121