1、第四章第四章 经典单方程计量经济学经典单方程计量经济学模型:放宽基本假定的模型模型:放宽基本假定的模型基本假定违背基本假定违背:不满足基本假定的情况。主要 包括:(1)随机误差项序列存在异方差异方差性;(2)随机误差项序列存在序列相关序列相关性;(3)解释变量之间存在多重共线多重共线性;(4)解释变量是随机变量且与随机误差项相关 (随机解释变量随机解释变量);此外:(5)模型设定有偏误(6)解释变量的方差不随样本容量的增而收敛 计量经济检验:计量经济检验:对模型基本假定的检验对模型基本假定的检验 本章主要学习:前本章主要学习:前4类类4.1 异方差性异方差性一、异方差的一、异方差的概念概念二、
2、异方差的类型二、异方差的类型三、实际经济问题中的异方差性三、实际经济问题中的异方差性四、异方差性的后果四、异方差性的后果五、异方差性的检验五、异方差性的检验六、异方差的修正六、异方差的修正七、案例七、案例对于模型ikikiiiiXXXY2210如果出现Varii()2即对于不同的样本点对于不同的样本点,随机误差项的方差不再随机误差项的方差不再是常数是常数,而互不相同而互不相同,则认为出现了则认为出现了异方差性异方差性(Heteroskedasticity)。一、异方差的概念一、异方差的概念 二、异方差的类型二、异方差的类型 同方差同方差性假定性假定:i2=常数 f(Xi)异方差异方差时:时:i
3、2=f(Xi)异方差一般可归结为异方差一般可归结为三种类型三种类型:(1)单调递增型:i2随X的增大而增大 (2)单调递减型:i2随X的增大而减小 (3)复 杂 型:i2与X的变化呈复杂形式 三、实际经济问题中的异方差性三、实际经济问题中的异方差性 例例4.1.1:截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+iYi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入 高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小 i的方差呈现单调递增型变化的方差呈现单调递增型变化 例例4.1,2,以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:Ci=0+1Yi+I将居民按
4、照收入等距离分成n组,取组平均数为样本观测值。一般情况下,居民收入服从正态分布一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。所以所以样本观测值的观测误差观测误差随着解释变量观测值的不同而不同,往往引起异方差性。以上例子均为随机误差项的方差随着解释变量的变化而有规律变化的情形有规律变化的情形。例例4.1.3,以某一行业的企业为样本建立企业生产函数模型 Yi=Ai1 Ki2 Li3ei 被解释变量:产出量Y 解释变量:资本K、劳动L、技术A,那么:每个企业所处的外部环境外部环境对产出量的影响被包含在随机误差项中。每个企业
5、所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项的方差并不随某一个解释变量观随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。测值的变化而呈规律性变化,呈现复杂型。对于横截面数据横截面数据而言,不同样本点之间解释变量以外的其他因素的差异较大,往往存在异方差。四、异方差性的后果四、异方差性的后果 计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1 1、参数估计量非有效、参数估计量非有效 OLS估计量仍然具有仍然具有无偏性无偏性,但不具有不具有有效性有效性 因为在有效性证明中利用了 E()=2I 而且,在
6、大样本情况下,尽管参数估计量具有一致性一致性,但仍然不具有渐近有效性渐近有效性。参数估计量不具有一致性。2 2、变量的显著性检验失去意义、变量的显著性检验失去意义 变量的显著性检验中,构造了t统计量 其他检验也是如此。3 3、模型的预测失效、模型的预测失效 一方面,由于上述后果,使得模型不具有良好的统计性质;所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。五、异方差性的检验五、异方差性的检验 检验思路:检验思路:由于异方差性异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验随机误差
7、项的检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相方差与解释变量观测值之间的相关性及其相关的关的“形式形式”。问题在于用什么来表示随机误差项的方差问题在于用什么来表示随机误差项的方差 一般的处理方法:一般的处理方法:首先采用 OLS 法估计模型,以求得随机误差项的估计量(注意,该估计量是不严格的),我们称之为“近近似估计量似估计量”,用ei表示。于是有VarEeiii()()22()eyyiiils0几种异方差的检验方法:几种异方差的检验方法:1 1、图示法、图示法(1)用)用X-Y的散点图进行判断的散点图进行判断 看是否存在明显的散点扩大散点扩大、缩小缩小或复杂型
8、复杂型趋势趋势(即不在一个固定的带型域中)(2 2)X X-ei2的的散散点点图图进进行行判判断断看是否形成一斜率为零的直线ei2 ei2 X X 同方差 递增异方差ei2 ei2 X X 递减异方差 复杂型异方差2 2、帕克、帕克(Park)检验与戈里瑟检验与戈里瑟(Gleiser)检验检验 基本思想基本思想:偿试建立方程:ijiiXfe)(2或ijiiXfe)(|选择关于变量X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。如:帕克检验常用的函数形式:ieXXfjiji2)(或ijiiXelnln)ln(22 若若 在统
9、计上是显著的,表明存在异方差性在统计上是显著的,表明存在异方差性。3 3、戈德菲尔德、戈德菲尔德-匡(夸)特匡(夸)特(Goldfeld-Quandt)(Goldfeld-Quandt)检验检验 G-Q检验以F检验为基础,适用于样本容量较大、样本容量较大、异方差递增或递减异方差递增或递减的情况。G-QG-Q检验的思想检验的思想:先将样本一分为二,对子样和子样分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。由于该统计量服从F分布,因此假如存在递增的异方差,则F远大于1;反之就会等于1(同方差)、或小于1(递减方差)。G-Q G-Q检验的步骤:检验的步骤:将n对样本观察值(X
10、i,Yi)按观察值Xi的大小排队排队将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2对每个子样分别进行OLS回归,并计算各自的残差平方和 在同方差性假定下,构造如下满足F分布的统计量)12,12()12()12(2122kcnkcnFkcnekcneFii 给定显著性水平,确定临界值F(v1,v2),若F F(v1,v2),则拒绝同方差性假设,表明存在异方差存在异方差。当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。3 3、怀特(、怀特(White)检验)检验 怀特检验不需要排序,且适合任
11、何形式的异方差 怀特检验的基本思想与步骤怀特检验的基本思想与步骤(以二元为例):iiiiXXY22110然后做如下辅助回归iiiiiiiiXXXXXXe215224213221102 可以证明,在同方差假设下:(*)R2为(*)的可决系数,h为(*)式解释变量的个数,表示渐近服从某分布。注意:注意:辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉
12、交叉项。六、异方差的修正异方差的修正 模型检验出存在异方差性,可用加权最小二乘加权最小二乘法法(Weighted Least Squares,WLS)进行估计。加权最小二乘法的基本思想:加权最小二乘法的基本思想:加权最小二乘法加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。在采用OLS方法时:对较小的残差平方ei2赋予较大的权数,对较大的残差平方ei2赋予较小的权数。21102)(kkiiiiXXYWeW 例如例如,如果对一多元模型,经检验知:222)()()(jiiiiXfEVar ijiijijiijiXXfXXfXfYXf22110)(1)(
13、1)(1)(1 ijikijikXfXXf)(1)(1 新模型中,存在 222)()(1)(1()(1(ijiijiijiEXfXfEXfVar即满足同方差性,可用OLS法估计。一般情况下一般情况下:对于模型 Y=X+存在 W2)()(0)(ECovEW wwwn12即存在异方差性异方差性。W是一对称正定矩阵,存在一可逆矩阵D使得 W=DD 用D-1左乘 Y=X+两边,得到一个新的模型:DXDYD111*XY该模型具有同方差性。因为 1211211111)()()(DDDDDDDDDD*EEEI2*1*)(YXXXYWXXWXYDDXXDDX11111111)()(这就是原模型 Y=X+的加权
14、最小二乘估计量加权最小二乘估计量,是无偏、有效的估计量。这里权矩阵为D-1,它来自于原模型残差项 的方差-协方差矩阵2W。如何得到如何得到2W?从前面的推导过程看,它来自于原模型残差项 的方差-协方差矩阵。因此 仍对原模型进行OLS估计,得到随机误差项的近似估计量i,以此构成权矩阵的估计量,即2212neeW 这时可直接以|/1,|,|/1|,|/1211neeediagD作为权矩阵。(该方法称为广义最小二乘法(该方法称为广义最小二乘法)广义最小二乘法 通过对模型的修改来调整原数据的数值,从而使其误差项满足高斯-马尔可夫定理中对最小二乘法的应用所要求的假设条件。即我们要通过某种修正和调整,把变
15、化不定的误差项的方差固定下来。注意:注意:在实际操作中人们通常采用如下的经验方法:不对原模型进行异方差性检验,而是直接不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据选择加权最小二乘法,尤其是采用截面数据作样本时。作样本时。如果确实存在异方差,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法七、案例七、案例-中国农村居民人均消费函数中国农村居民人均消费函数 例例4.1.4 中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入包括(1)从事农业经营的收入,(2)包括从事其他产业的经营性收入(3)工资性收入、(4)财产收入(4)转移支付
16、收入。考察从事农业经营的收入从事农业经营的收入(X1 1)和其他收入其他收入(X2 2)对中国农村居民消费支出农村居民消费支出(Y)增长的影响:22110lnlnlnXXY表表 4.1.1 中中国国 2001年年各各地地区区农农村村居居民民家家庭庭人人均均纯纯收收入入与与消消费费支支出出相相关关数数据据(单单位位:元元)地区 人均消费 支出 Y 从事农业经营 的收入 1X 其他收入 2X 地区 人均消费 支出 Y 从事农业经营 的收入 1X 其他收入 2X 北 京 3552.1 579.1 4446.4 湖 北 2703.36 1242.9 2526.9 天 津 2050.9 1314.6 2
17、633.1 湖 南 1550.62 1068.8 875.6 河 北 1429.8 928.8 1674.8 广 东 1357.43 1386.7 839.8 山 西 1221.6 609.8 1346.2 广 西 1475.16 883.2 1088.0 内蒙古 1554.6 1492.8 480.5 海 南 1497.52 919.3 1067.7 辽 宁 1786.3 1254.3 1303.6 重 庆 1098.39 764.0 647.8 吉 林 1661.7 1634.6 547.6 四 川 1336.25 889.4 644.3 黑龙江 1604.5 1684.1 596.2 贵
18、 州 1123.71 589.6 814.4 上 海 4753.2 652.5 5218.4 云 南 1331.03 614.8 876.0 江 苏 2374.7 1177.6 2607.2 西 藏 1127.37 621.6 887.0 浙 江 3479.2 985.8 3596.6 陕 西 1330.45 803.8 753.5 安 徽 1412.4 1013.1 1006.9 甘 肃 1388.79 859.6 963.4 福 建 2503.1 1053.0 2327.7 青 海 1350.23 1300.1 410.3 江 西 1720.0 1027.8 1203.8 宁 夏 2703
19、.36 1242.9 2526.9 山 东 1905.0 1293.0 1511.6 新 疆 1550.62 1068.8 875.6 河 南 1375.6 1083.8 1014.1 普通最小二乘法的估计结果:21ln5084.0ln3166.0655.1lnXXY (1.87)(3.02)(10.04)2R=0.7831 2R=0.7676 DW=1.89 F=50.53 RSS=0.8232 异方差检验 进一步的统计检验进一步的统计检验(1)G-Q检验检验 将原始数据按X2排成升序,去掉中间的7个数据,得两个容量为12的子样本。对两个子样本分别作OLS回归,求各自的残差平方和RSS1和R
20、SS2:子样本1:21ln119.0ln343.0061.4lnXXY (3.18)(4.13)(0.94)R2=0.7068,RSS1=0.0648子样本2:21ln776.0ln138.0791.0lnXXY (0.43)(0.73)(6.53)R2=0.8339,RSS2=0.2729计算计算F F统计量:统计量:F=RSS2/RSS1=0.2792/0.0648=4.31 查表查表 给定=5%,查得临界值 F0.05(9,9)=2.97判断判断 F F0.05(9,9)否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性存在递增异方差性。(2 2)怀特检验)怀特检验 作辅助回归
21、:2222112)(ln026.0ln055.0)(ln015.0ln102.017.0XXXXe (-0.04)(0.10)(0.21)(-0.12)(1.47)21lnln043.0XX (-1.11)R2=0.4638似乎没有哪个参数的t检验是显著的。但 n R2=31*0.4638=14.38=5%下,临界值 20.05(5)=11.07,拒绝拒绝同方差性同方差性 去掉交叉项后的辅助回归结果 2222112)(ln039.0ln539.0)(ln042.0ln570.0842.3XXXXe (1.36)(-0.64)(064)(-2.76)(2.90)R2=0.4374X2项与X2的平
22、方项的参数的t检验是显著的,且 n R2=31 0.4374=13.56 =5%下,临界值 20.05(4)=9.49 拒绝拒绝同方差同方差的原假设的原假设 原模型的加权最小二乘回归原模型的加权最小二乘回归 对原模型进行OLS估计,得到随机误差项的近似估计量i,以此构成权矩阵2W的估计量;再以1/|i|为权重进行WLS估计,得 21ln527.0ln319.0497.1lnXXY (5.12)(5.94)(28.94)2R=0.9999 2R=0.9999 DW=2.49 F=924432 RSS=0.0706 各项统计检验指标全面改善各项统计检验指标全面改善4.2 序列相关性序列相关性 Se
23、rial Correlation一、一、序列相关性概念序列相关性概念二、实际经济问题中的序列相关性二、实际经济问题中的序列相关性 三、序列相关性的后果三、序列相关性的后果四、序列相关性的检验四、序列相关性的检验五、具有序列相关性模型的估计五、具有序列相关性模型的估计六、案例六、案例4.2 序列相关性序列相关性 一、序列相关性概念一、序列相关性概念 如果对于不同的样本点,随机误差项之间不再如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现是不相关的,而是存在某种相关性,则认为出现了了序列相关性序列相关性。对于模型 Yi=0+1X1i+2X2i+kXki+i i=1
24、,2,n随机项互不相关的基本假设表现为 Cov(i,j)=0 ij,i,j=1,2,n在其他假设仍成立的条件下,序列相关序列相关即意味着0)(jiE称为一阶列相关一阶列相关,或自相关自相关(autocorrelation)其中:被称为自协方差系数自协方差系数(coefficient of autocovariance)或一阶自相关系数一阶自相关系数(first-order coefficient of autocorrelation)i是满足以下标准的OLS假定的随机干扰项:如果仅存在 E(i i+1)0 i=1,2,n 自相关自相关往往可写成如下形式:i=i-1+i -11 0)(iE,2)
25、var(i,0),cov(sii 0s 由于序列相关性经常出现在以时间序列为样本的模型中,由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标因此,本节将用下标t代表代表i。二、实际经济问题中的序列相关性二、实际经济问题中的序列相关性 大多数经济时间数据都有一个明显的特点:惯性惯性,表现在时间序列不同时间的前后关联上。由于消费习惯消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。例如,例如,绝对收入假设绝对收入假设下居民总消费函数模型居民总消费函数模型:Ct=0+1Yt+t t=1,2,n 1 1、经济变量固有的惯性、经济变量固有的惯性 2 2、模型设定
26、的偏误、模型设定的偏误 所谓模型设定偏误设定偏误(Specification error)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。例如例如,本来应该估计的模型为 Yt=0+1X1t+2X2t+3X3t+t但在模型设定中做了下述回归:Yt=0+1X1t+1X2t+vt因此,vt=3X3t+t,如果X3确实影响Y,则出现序列相关。但建模时设立了如下模型:Yt=0+1Xt+vt 因此,由于vt=2Xt2+t,,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。又如:如果真实的边际成本回归模型应为:Yt=0+1Xt+2Xt2+t其中:Y=边际成
27、本,X=产出,3 3、数据的、数据的“编造编造”例如:季度数据季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。还有就是两个时间点之间的“内插内插”技术往往导致随机项的序列相关性。在实际经济问题中,有些数据是通过已知数据生成的。因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:二、序列相关性的后果二、序列相关性的后果 1 1、参数估计量非有效、参数估计量非有效 因为,在有效性证明中利用了 E(NN)=2I 即同方差性和互相独立性条件。而且,在大样
28、本情况下,参数估计量虽然具有参数估计量虽然具有一致性,但仍然不具有渐近有效性。一致性,但仍然不具有渐近有效性。2、变量的显著性检验失去意义、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。其他检验也是如此。3、模型的预测失效模型的预测失效 区间预测与参数估计量的方差有关,在区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准方差有偏误的情况下,使得预测估计不准确,预测精度降低。确,预测精度降低。所以,所以,当模型出现序列相关性时,它的当模型出现序列相关性时,它的预测功能失效。预测功
29、能失效。三、序列相关性的检验三、序列相关性的检验 然后然后,通过分析这些“近似估计量近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。序列相关性序列相关性检验方法有多种,但基本思路相同:检验方法有多种,但基本思路相同:首先首先,采用 OLS法估计模型,以求得随机误差项的“近似估计量近似估计量”,用ei表示:lsiiiYYe0)(基本思路基本思路:三、序列相关性的检验三、序列相关性的检验 1 1、图示法、图示法 2 2、回归检验法、回归检验法 以te为被解释变量,以各种可能的相关量,诸如以1te、2te、2te等为解释变量,建立各种方程:tttee1tttteee2211 如果存在某
30、一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。回归检验法回归检验法的优点优点是:(1)能够确定序列相关的形式,(2)适用于任何类型序列相关性问题的检验。3 3、杜宾、杜宾-瓦森(瓦森(Durbin-WatsonDurbin-Watson)检验法)检验法 D-W检验是杜宾(检验是杜宾(J.Durbin)和)和瓦(沃)森瓦(沃)森(G.S.(G.S.Watson)Watson)于于19511951年提出的一种检验序列自相关的方年提出的一种检验序列自相关的方法法,该方法的假定条件是该方法的假定条件是:(1)解释变量X非随机;(2)随机误差项i为一阶自回归形式:i=i-1+i(3)回归模
31、型中不应含有滞后应变量作为解释变量,即不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项 该统计量该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到精确的分布很难得到。但是但是,他们成功地导出了临界值的下限dL和上限dU,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。杜宾和瓦森针对原假设:H0:=0,即不存在一阶自回归,构如下造统计量:nttnttteeeWD12221)(.D.W.统计量统计量:D.W检验步骤检验步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判
32、断 若 0D.W.dL 存在正自相关 dLD.W.dU 不能确定 dU D.W.4dU 无自相关 4dU D.W.4 dL 不能确定 4dL D.W.4 存在负自相关 0 dL dU 2 4-dU 4-dL 正相关不能确定无自相关不能确定负相关 当D.W.值在2左右时,模型不存在一阶自相关。证明:证明:展开D.W.统计量:nttntntnttttteeeeeWD1222212122.(*)1(2)1(2.1221nttnttteeeWD如果存在如果存在完全一阶正相关完全一阶正相关,即,即=1,则,则 D.W.0 完全一阶负相关完全一阶负相关,即,即=-1,则则 D.W.4 完全不相关完全不相关
33、,即即=0,则,则 D.W.2这里,nttntttnttnttteeeeee22211221为一阶自回归模型 i=i-1+i 的参数估计。)1(2)1(2.1221nttnttteeeWD 4、拉格朗日乘数(、拉格朗日乘数(Lagrange multiplier)检验)检验 拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。它是由布劳殊(Breusch)与戈弗雷(Godfrey)于1978年提出的,也被称为GB检验检验。ikikiiiXXXY22110 对于模型如果怀疑随机扰动项存在p阶序列相关阶序列相关:tptpttt2211 GB检验可用来检验如下
34、受约束回归方程 tptptktkttXXY11110约束条件为:H0:1=2=p=0约束条件H0为真时,大样本下)()(22pRpnLM其中,n为样本容量,R2为如下辅助回归的可决系数:tptptktktteeXXe11110给定,查临界值2(p),与LM值比较,做出判断,实际检验中,可从1阶、2阶、逐次向更高阶检验。如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。最常用的方法是广义最小二乘法广义最小二乘法(GLS:Generalized least squares)和广义差分法广义差分法(Generalized Difference)。四、序列相关的补救四、序列相关的补救 1
35、1、广义最小二乘法、广义最小二乘法 对于模型 Y=X+如果存在序列相关,同时存在异方差,即有,22212222111221)()Cov(nnnnnE 是一对称正定矩阵,存在一可逆矩阵D,使得 =DD变换原模型:D-1Y=D-1X +D-1 即 Y*=X*+*(*)1211211111)()()(DDDDDDDDDD*EEEI2(*)式的OLS估计:*1*)(YXXXYXXXYDDXXDDX11111111)()(这就是原模型的这就是原模型的广义最小二乘估计量广义最小二乘估计量(GLS estimators),是无偏的、有效的估计量。是无偏的、有效的估计量。该模型具有同方差性和随机误差项互相独立
36、性该模型具有同方差性和随机误差项互相独立性:如何得到矩阵如何得到矩阵?对 的形式进行特殊设定后,才可得到其估计值。1000001000000100000100000121D,22121221111)(nnnnCov 如设定随机扰动项为一阶序列相关形式 i=i-1+i 则 2 2、广义差分法、广义差分法 广义差分法广义差分法是将原模型变换为满足OLS法的差分模型,再进行OLS估计。ikikiiiXXXY22110如果原模型存在tltlttt2211可以将原模型变换为:)()1(1111111011ltlttlltlttXXXYYYtlktlktktkXXX)(11 该模型为广义差分模型广义差分模
37、型,不存在序列相关问题。可进行OLS估计。注意:广义差分法广义差分法就是上述广义最小二乘法广义最小二乘法,但是却损失了部分样本观测值。如:如:一阶序列相关的情况下,广义差分是估计tktktkttttXXXXYY)()()1(1111101nt,3,2这相当于1000001000000100000100000121D去掉第一行后左乘原模型Y=X+。即运用了GLS法,但第一次观测值被排除了。3 3、随机误差项相关系数的估计、随机误差项相关系数的估计 应用应用广义最小二乘法广义最小二乘法或或广义差分法广义差分法,必须已知随,必须已知随机误差项的相关系数机误差项的相关系数 1,2,L。实际上,人们并不
38、知道它们的具体数值,所以必实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。须首先对它们进行估计。常用的估计方法有:常用的估计方法有:科克伦科克伦-奥科特奥科特(Cochrane-Orcutt)迭代法迭代法。杜宾杜宾(durbin)两步法两步法 (1)科克伦科克伦-奥科特迭代法奥科特迭代法。以一元线性模型为例:首先首先,采用OLS法估计原模型 Yi=0+1Xi+i得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式 i=1i-1+2i-2+Li-L+i得到,12l,作为随机误差项的相关系数 12,l的第一次估计值第一次估计值。求出i新的“近拟估计值”,并以之作为样本观测值
39、,再次估计 i=1i-1+2i-2+Li-L+iilln12,ililiilliliiXXXYYY)()1(1111011 类似地,可进行第三次、第四次迭代。类似地,可进行第三次、第四次迭代。关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次1,2,L的估计值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦科克伦-奥科特奥科特两步法两步法。(2)杜宾)杜宾(durbin)两步法两步法 该方法仍是先估计该方法仍是先估计 1,2,l,再对差分,再对差分模型进行估计模型进行估计 第一步第一步,变换差分模型为下列形式ilil
40、iilliliiXXXYYY)()1(1111011illn12,进行OLS估计,得各Yj(j=i-1,i-2,i-l)前的系数1,2,l的估计值第二步第二步,将估计的l,21代入差分模型ililiilliliiXXXYYY)()1(1111011 illn12,采用 OLS 法估计,得到参数110),1(l的估计量,记为*0,*1。于是:)1(1*00l,*11应用软件中的广义差分法应用软件中的广义差分法 在在Eview/TSP软件包下,广义差分采用了科克伦软件包下,广义差分采用了科克伦-奥科特(奥科特(Cochrane-Orcutt)迭代法估计)迭代法估计。在解释变量中引入在解释变量中引入
41、AR(1)(1)、AR(2)(2)、,即可得即可得到参数和到参数和1、2、的估计值。的估计值。其中其中AR(m)表示随机误差项的表示随机误差项的m阶自回归。在阶自回归。在估计过程中自动完成了估计过程中自动完成了1、2、的迭代。的迭代。如果能够找到一种方法,求得如果能够找到一种方法,求得或或各序列相关各序列相关系数系数j的估计量,使得的估计量,使得GLS能够实现,则称为能够实现,则称为可行的广义最小二乘法可行的广义最小二乘法(FGLS,Feasible Generalized Least Squares)。)。FGLS估计量估计量,也称为也称为可行的广义最小二乘估计可行的广义最小二乘估计量量(f
42、easible general least squares estimators)可行的广义最小二乘估计量不再是无偏的,但可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦却是一致的,而且在科克伦-奥科特迭代法下,奥科特迭代法下,估计量也具有渐近有效性。估计量也具有渐近有效性。前面提出的方法,就是前面提出的方法,就是FGLS 注意:注意:4 4、虚假序列相关问题、虚假序列相关问题 由于随机项的序列相关往往是在模型设由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为数形式设定有误,这种情形可称为虚
43、假序虚假序列相关列相关(false autocorrelation),应在模型,应在模型设定中排除。设定中排除。避免产生虚假序列相关性的措施是在开避免产生虚假序列相关性的措施是在开始时建立一个始时建立一个“一般一般”的模型,然后逐渐的模型,然后逐渐剔除确实不显著的变量。剔除确实不显著的变量。五、案例:中国商品进口模型五、案例:中国商品进口模型 经济理论指出,商品进口商品进口主要由进口国的经经济发展水平济发展水平,以及商品进口价格指数商品进口价格指数与国内价格国内价格指数指数对比因素决定的。由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。表表 4.2.1
44、4.2.1 19782001 年中国商品进口与国内生产总值年中国商品进口与国内生产总值 国内生产总值 GDP(亿元)商品进口 M(亿美元)国内生产总值 GDP(亿元)商品进口 M(亿美元)1978 3624.1 108.9 1990 18547.9 533.5 1979 4038.2 156.7 1991 21617.8 637.9 1980 4517.8 200.2 1992 26638.1 805.9 1981 4862.4 220.2 1993 34634.4 1039.6 1982 5294.7 192.9 1994 46759.4 1156.1 1983 5934.5 213.9 1
45、995 58478.1 1320.8 1984 7171.0 274.1 1996 67884.6 1388.3 1985 8964.4 422.5 1997 74462.6 1423.7 1986 10202.2 429.1 1998 78345.2 1402.4 1987 11962.5 432.1 1999 82067.46 1657 1988 14928.3 552.7 2000 89442.2 2250.9 1989 16909.2 591.4 2001 95933.3 2436.1 资料来源:中国统计年鉴(1995、2000、2002)。1.通过通过OLS法建立如下中国商品进口方程
46、:法建立如下中国商品进口方程:ttGDPM02.091.152 (2.32)(20.12)2.进行序列相关性检验。进行序列相关性检验。DW检验检验 取=5%,由于n=24,k=2(包含常数项),查表得:dl=1.27,du=1.45由于 DW=0.628 20.05(2)故:存在正自相关存在正自相关2 2阶滞后:阶滞后:3阶滞后:321032.0819.0108.10003.0692.6tttteeeGDPe (0.22)(-0.497)(4.541)(-1.842)(0.087)R2=0.6615 于是,LM=210.6614=13.89取=5%,2分布的临界值20.05(3)=7.815
47、LM 20.05(3)表明:存在正自相关;但存在正自相关;但 t-3t-3的参数不显著,说的参数不显著,说明不存在明不存在3 3阶序列相关性。阶序列相关性。3、运用广义差分法进行自相关的处理、运用广义差分法进行自相关的处理(1)采用杜宾两步法估计)采用杜宾两步法估计 第一步第一步,估计模型 tttttttGDPGDPGDPMMM2*31*2*12211*02121054.0096.0055.0469.0938.009.78ttttttGDPGDPGDPMMM(1.76)(6.64)(-1.76)(5.88)(-5.19)(5.30)第二步第二步,作差分变换:)469.0938.0(21*ttt
48、tMMMM)469.0938.0(21*ttttGDPGDPGDPGDP则则M*关于关于GDP*的的OLS估计结果为:估计结果为:*020.018.86ttGDPM (2.76)(16.46)取=5%,DWdu=1.43(样本容量24-2=22)表明:已不存在自相关162.300.469)0.938-/(186.18)1/(21*00于是原模型为:ttGDPM020.030.162与与OLS估计结果的差别只在估计结果的差别只在截距项截距项:ttGDPM02.091.152(2)采用科克伦)采用科克伦-奥科特迭代法估计奥科特迭代法估计 在在Eviews软包下,软包下,2阶广义差分的结果为:阶广义
49、差分的结果为:取=5%,DWdu=1.66(样本容量:22)表明:广义差分模型已不存在序列相关性。2801.0 1 108.1020.032.169ARARGDPMtt (3.81)(18.45)(6.11)(-3.61)可以验证可以验证:仅采用1阶广义差分,变换后的模型仍存在1阶自相关性;采用3阶广义差分,变换后的模型不再有自相关性,但AR3的系数的t值不显著。4.3 多重共线性多重共线性Multi-CollinearityMulti-Collinearity 一、多重共线性的概念一、多重共线性的概念 二、实际经济问题中的多重共线性二、实际经济问题中的多重共线性 三、多重共线性的后果三、多重
50、共线性的后果 四、多重共线性的检验四、多重共线性的检验 五、克服多重共线性的方法五、克服多重共线性的方法 六、案例六、案例*七、分部回归与多重共线性七、分部回归与多重共线性 4.3 多重共线性多重共线性 一、多重共线性的概念一、多重共线性的概念 在多元回归模型中,解释变量之间存在的线性或近似线性的关系,称为共线性。共线性理论最早由弗瑞斯在1934年提出,对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相如果某两个或多个解释变量之间出现了相关性,则称为关性,则称为多重共线性多重共线性(Multicolli
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。