1、1l四、选择解释变量的四条准则:l、理论l、检验l、拟合优度检验l、偏倚l五、检验误设定的RESET方法:l具体步骤:l、估计方程:l、添加解释变量:l、检验:2i21i10iXXYi4i53i42i32i21i10iuYYYXXY1)kS/(nS)/g(SFR 模型中解释变量违反了基本假定4 解释变量与随机扰动项相互独立的假定,导致解释变量之间线性相关,称为多重共线性。3l对于模型l如果某两个或多个解释变量之间出现多重共线:l其中C不全为0,即某一个解释变量可以用其他解释变量的线性组合表示,则称为完全多重共线性。l完全多重共线性的情况并不多见,一般出现不同程度的多重共线性。uxxxyikik
2、iii221100cxcxcxckiki22i 1104l1、产出受规模的限制和影响,产出与投入要素之间 存在正比例关系,以某行业的企业为样本建立企业生产函数,那么解释变量之间存在多重共线。l2、相对收入假设,时间序列数据建立消费函数(当期收入与前期消费相关)ucIctttt1210成成比比例例LKuLKQiiiiii,f5(1)经济变量的内在联系(根本原因)(2)经济变量变化趋势的“共向性”(3)解释变量中含有滞后变量l1、完全多重共线性:OLS估计量不存在;l2、共线变量参数估计量的方差很大;(主要后果)l3、难以区分每个解释变量的单独影响;l4、t检验的可靠性降低;l5、回归模型缺乏稳定
3、性;6l五、多重共线的检验l1、根据回归结果判别l2、相关系数检验l3、VIF检验(辅助回归模型)l4、特征值检验xxxxxkikijjijjiji1111110)R1(1)(VIF2ij0XX1k21CI病态指数:病态指数:minmax病态数:病态数:7l1、直接剔除次要共线变量l2、间接剔除重要解释变量l(1)利用附加信息,增加约束l(2)综合使用TS,CS数据LAKQ 1)LKA(LQlnPblnXbblnY210需需求求函函数数:ii10ilnXaalnYtt10t1tlnPbblnXa lnY83、逐步回归:(1)选取与被解释变量相关性最强的解释变量,建立 一元回归模型;(2)在一元
4、回归模型中分别引入剩余的变量建 立个二元回归模型,选取最优的模型;(3)在选取的二元回归模型中,引入第三个解释 变量,直至无法引入新的变量为止。取舍原则:(1)R*2增加,每个 t 增加,则保留引入变量;(2)R*2下降,每个 t 变化不大,则删除引入变量。9l例1、服装需求函数。影响居民服装需求的主要因素有:可支配收入、流动资产拥有量K、服装类价格指数P1和总物价指数P0。服装需求函数有关统计资料年份服装需求Y可支配收入X流动资产拥有量K服装类价格指数P1总物价指数P019791980198119821983198419851986198719888.49.610.411.412.214.2
5、15.817.919.320.882.988.099.9105.3117.7131.0148.0161.8174.2184.717.121.325.129.034.040.044.049.051.053.0929396941001011051121121129496979710010110410911111110KbP0bP1bXbaY4321需需求求函函数数:XKP0P1Y0.9978450.9833590.9754800.988705X 1.0000000.9884280.9801370.987705K0.9884281.0000000.9699620.969477P00.9801370.
6、9699621.0000000.991796P10.9877050.9694770.9917961.000000(1)相关系数检验:11(2)逐步回归:模 型XP1P0KR*2R2Y,X0.11790.99500.9956Y,X,P10.1262(8.57)-0.0378(-0.57)0.99460.9958Y,X,P00.1030(5.67)0.0857(0.83)0.99480.9960Y,X,K0.1315(7.03)-0.0388(-0.74)0.99470.9959Y,X,P1,P00.1042(7.55)-0.1866(-2.47)0.3132(2.59)0.99700.9980Y
7、,X,P1,P0,K 0.0978(3.71)-0.1972(2.24)0.3401(-2.20)0.0144(0.30)0.99650.9980P0bP1bXbaY32112l同方差:D(ui)=2=常数 i=1,2,n 即对不同的样本点,扰动项的离散程度相同。l异方差:l D(ui)=2i i=1,2,n13例1、使用横截面数据研究储蓄函数。例2、用分组资料研究CD函数。1、模型中遗漏了影响逐渐增大的因素2、模型函数形式的设定误差。3、随机因素的影响导致异常观测值的出现而产生。为为储储蓄蓄函函数数模模型型ii10ixbbyeKALY 14l1、OLS估计不再是有效估计l2、无法正确估计参数
8、的标准误差l3、t检验失效l4、降低预测精度21)XX()(CovVar)(set15纺锤型16反纺锤型17漏斗型18反漏斗型19l(2)残差分布图分析l例1、我国制造工业利润函数。20服装需求函数有关统计资料行业名称销售利润Y销售收入X行业名称销售利润Y销售收入X食品加工业食品制造业饮料制造业烟草加工纺织业服装制品业皮革制品业木材加工业家具制造业纸制品印刷业体育用品石油加工业化学制品187.25111.42205.42183.87316.79157.7081.7035.6731.06134.4090.2154.40194.45502.613180.441119.881489.891328.5
9、93862.901779.101081.77443.74226.781124.94499.83504.442363.804195.22医药制造业化纤制造橡胶制品业塑料制品业非金属制品黑色金属业有色金属业金属制品业普机械制造专机械制造交通设备电子机械电子通讯仪表仪器238.7181.5777.84144.34339.26367.47144.29201.42354.69238.16511.94409.83508.1572.461264.10779.46692.081345.002866.143868.281535.161948.122351.681714.734011.533286.154499.
10、19663.6821 2、解析法l(1)Goldfeld-Quandt检验u x样本13n/8n/43n/8样本2)1k2cn,1k2cn(FRSSRSSF1222(2)White检验:l具体步骤:l1、估计模型,计算e2;l2、估计辅助回归模型:l3、计算辅助回归模型的R2;i2i21i10iuXXY 二二元元模模型型:i2i1i524232i21i102uXXXXXXe2i1ii)q(nR22同方差时:同方差时:23l(3)帕克(Park)检验和戈里瑟(Gleiser)检验l 原理:通过建立残差序列对解释变量的回归模型,判l 断扰动项与解释变量之间是否存在较强的相关关系。l ark检验模型
11、:l Gleijser检验模型:l 优点:可以近似地给出异方差的存在形式:l 2i=2 f(xi)。以便用模型变换消除异方差。iiiu2eXeii2ulnXlnlnei,21,2,1huXeihii240.0001p 22.64F 4655.0R 673lnX.15549.5lne (1)2i2i0.003p 05.11F 2982.0R 0153X.02394.12e(2)2ii0.001p 68.12F 3279.0R X3862.16768.15e(3)2ii0.012p 24.7F 2177.0R X1074.20584.27e(4)226ii25l1、模型变换法:l对模型进行变量变换
12、,消除异方差。常数常数为常数为常数i2iiiii1i0ii2i2iiuD1uDu),0()u(D (1)xxxbxbxyxii10iuxbby 一一元元模模型型:26 xxxxxxbxbxyxiiiiiiiii1i0iii2iiuD1uDu)u(D)2()x/1(xuDxuxDuxxxbxbyxx/1)u(D (3)iiiiiiiiii1i0iii2ii27)(f)(fuD)(f1)(fuD)(fu)(f)(f)(f)(f)u(Dxxxxxxxbxbxyxiiiiiiiiii1i0iii2ii一般的:一般的:28模型存在异方差时,WLS估计量是BLUE的。ii10iuxbby 一一元元模模型型
13、:1uD1uDux)u(D i2iiiiiii1i0ii2iibby*uxbxb*yi2i11i0i2ii2i2i2ee1*ei29模型变换法的实质就是WLS法。2iiii1i0ii2i2ii1u)u(D xbxbxyx2ii1:WLS30(1)生成权数变量;(2)使用WLS法估计模型。例2、我国制造工业利润函数中异方差性的调整。0.0001p 22.64F 4655.0R 673lnX.15549.5lne Park2i2i检验:检验:0.001p 68.12F 3279.0R X3862.16768.15e Gleiser2ii检验:检验:1.67431.67431 1x x1 1 x x
14、1 12 231 e 1324e1依次键入命令:LS(W=Wi)Y C X i=1,2,3,40.085p 92.4nr 8483.0R (0.0099)(3.8823)W1)(W 1086X.09220.5y (1)220.206p 16.3nr 6115.0R (0.0077)(11.1877)W2)(W 1062x .06349.8y (2)223237).12()(0.62 t(0.0084)(19.5181)8547.0R 1044X.00335.12y OLS2i法估计:法估计:用用0.036p 64.6nr 9754.0R (0.0035)(3.7798)W3)(W 1094x
15、.01689.4y (3)220.213p 10.3nr 9969.0R )16.54()11.3(t(0.0021)(1.6603)W4)(W 1114X.01689.5y (4)2233l一、定义l若随机扰动项各期之间存在相关关系,即:l则称之为自相关或序列相关。l主要出现在时间序列中。jiuuEuuCovjiji 0)(),(34l一阶自相关:l一般形式:ntuuuuEttttt,2,1 0)(11tptptttuuuu221135l二、自相关的原因及后果l1、模型中遗漏了重要的解释变量:l例如,如果真实的回归方程形式为,l其中,被解释变量表示牛肉需求量,解释变量分别为牛肉价格、消费者收
16、入和猪肉价格。l但是在作回归时用的是,l那么,随机扰动项就会出现系统性模式,l从而造成自相关。tttttuXXXY443322133221tttuXv44362、模型函数形式的设定误差:例如:平均成本函数本应该是二次多项式模型,如果设成了直线形式,则随机误差项是自相关的。37l、经济惯性(滞后效应):l由于经济发展的连续性所形成的惯性(或粘滞性),使得经济变量的前后期之间是相互关联的。l例如,在消费支出对收入的时间序列分析中,当期的消费支出除了依赖于收入等其它变量外,还依赖前期的消费支出,如:l设定模型时使用的是,l则可能会出现自相关。因为随机误差项:ttttuCIC1321tttuIC21v
17、Cuttt1338、随机因素的影响:例如自然灾害、金融危机、世界经济环境的变化等随机因素的影响,往往要持续多个时期,使得随机误差呈现出自相关性。39l三、自相关性的后果l1、参数的OLS估计不再是有效估计l2、OLS法会低估参数的标准误差l3、t检验的可靠性降低l4、降低模型的预测精度40l四、自相关性的检验l1、残差图分析:l2、DW检验(Durbin-Watson):l简称DW检验,是目前检验自相关性最常用的方法,只适用于检验一阶自相关,即:et=et1+vtlDW检验的基本原理和步骤:l(1)提出原假设H0:=0 即et不存在一阶自相关;l(2)构造检验统计量:nttnttteeeDW1
18、2221)(41nttntttttnttnttteeeeeeeeDW122121212221/)2(/)(nttnttntteee22122122112121211222tttttttteeeeeeee)1(2211DWeeettt则记2121211ttttttteeeeeee42401DW.4,1;0,1;2,0DWDWDW则当则当则当)1(2DW43 计算统计量 根据n,k和显著性水平以及DW检验表,查出临界值dL、dU.若DW dL,则拒绝H0,认为随机误差项有正自相关;若dU DW 4dL,则拒绝H0,认为随机误差项有负自相关;若dL DW dU 或4dU DW 4dL,则不能作出结论
19、。nttnttteeeDW12221)(440dLdU24-dU4-dL4d正自相关正自相关无自相关无自相关负自相关负自相关不不能能确确定定不不能能确确定定DW检验判断域45序列相关性的回归检验法对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关。iiiiiiiveeevee2211146l1、当模型同时存在序列相关和异方差l2、通过模型转换(GLS法)消除序列相关和异方差l3、GLS估计模型的步骤47l模型l线性l无偏l但序列相关和存在异方差,OLS估计量已经不是有效的uXY2)()(uuEuuCovDDIwwwwwwwwwnnnnn对称正定2
20、122211121=YXXX1)(=uXXX1)()(E)()()()(11XXXuuXXXEEVar =11)()()(XXXuuEXXX =11)()(XXVXXXX =112)()(XXXXXX48模型基本假定中的表达0)(),()()(00222222jijiiiiuuEuuCovuEuVaruIuuE同方差,且不自相关随机扰动项49IuEuuEuuEuuEuEuuEuuEuuEuENNEuuuuuuuuuuuuuuuuuuuuuNNnnnnnnnnnnnn22222212221212122212221212122121000000)()()()()()()()()()(1150l 存
21、在=DD ,D-1左乘模型l于是可用OLS估计模型(2),得到参数估计量 1uXYuDXDYD111 2*NXYIDDDDDDDuuEDDuuDENNE21211211111*)()()(3)()()()(11111111111*1*YXXXYDDXDXDDXYVXXVXYXXX51YYeeeeeeeeeeeeeeeeeennnnn2212222112121l首先进行OLS估计得到随机误差项的估计值,以此构造矩阵。52l(1)对原模型进行OLS估计,得到矩阵的估计值l(2)采用前页(3)式,计算其估计量l(3)经验方法,一律采用GLS方法。不存在序列相关及异方差,GLS等价于OLS;否则,就消
22、除了序列相关及异方差,得到具有优良性的估计。53l差分法是克服序列相关的有效方法。l1、一阶差分l2、广义差分l3、随机误差项相关系数的估计l4、广义差分法在EViews中的实现54l用OLS对模型(2)进行估计,得到BLUE估计量l完全正自相并不多见,但是,只要存在一定的一阶正自相关时,可采用一阶差分法来处理序列相关,再用OLS估计模型。)51(32112211111221110122110项基本假定满足iiiiiikkiiiikikiiiiikkiiiuuuxxxyuxxxyuxxxy55lGENR DX=X-X(-1)l或,GENR DX=d(X)lLS DY DX1 DX2 DX3l为
23、了估计模型:l直接采用命令:lLS d(Y)d(X1)d(X2)d(X3)l1、生成差分序列再估计模型l2、直接采用差分算子d(X),或d(X,n)uxxxyttttt33221156调用差分算子,无须计算差分序列ld(X)first difference of X,X-X(-1)ld(X,n)n-th order difference of X57ld(x,2)=d(d(x)l=d(x-x(-1)l=d(x)-d(x(-1)l=x-x(-1)-(x(-1)-x(-2)l=x-x(-1)-x(-1)+x(-2)l=x-2x(-1)+x(-2)58l数据资料:lzn43.wf1l目的:采用简单实
24、用的一阶差分克服序列相关l方法:直接采用一阶差分算子估计模型5960DW有明显改善61d(xfze)=0.5719d(gdp)即 1=0.5719gdp5719.055.732e xfz55.7325.225305719.094.13618pgdexfz5.22530pgd13618.94exfzpgdexfz1010所求回归方程为故,由又因为62l(1)存在一阶序列相关的模型l(2)存在L阶序列相关的模型l(3)广义差分模型在EViews中的实现63(1)存在一阶序列相关的模型设线性回归模型yt=b0+b1xt+ut t=1,2,n随机项ut存在一阶自相关ut=ut-1+vt式中随机项vt满
25、足基本假设。64若已知,将线性回归模型yt=b0+b1xt+ut (1)滞后一期并两边乘以,得yt-1=b0+b1xt-1+ut-1 (2)(1)-(2),由ut=ut-1+vt得yt-yt-1=(1-)b0+b1(xt-xt-1)+vt (3)令 yt*=yt-yt-1 xt*=xt-xt-1(3)式变成yt*=b0+b1xt*+vt (其中b0=(1-)b0 )上式称为广义差分模型,其中vt满足基本假设。65Dependent Variable:EXPTVariableCoefficientStd.Errort-StatisticProb.C-2531.831270.8792-9.3467
26、140.0000GNP0.2817620.00935530.119890.0000R-squared 0.981606 F-statistic907.2079Durbin-Watson stat0.950536 Prob(F-statistic)0.000000某地区商品出口模型(expt.wf1)expt出口A类商品总值gnp国民生产总值66由DW=0.9505计算的估计值 1-DW/2=0.5248genr sexpt=expt-0.5248*expt(-1)genr sgnp=gnp-0.5248*gnp(-1)ls sexpt c sgnp67dU=1.41 4-dU=2.59Depe
27、ndent Variable:SEXPTVariableCoefficientStd.Errort-StatisticProb.C-1504.828246.4742-6.1054180.0000SGNP0.3030690.01720817.611820.0000R-squared 0.950947 F-statistic310.1763Durbin-Watson stat1.556291 Prob(F-statistic)0.000000sexpt=-1504.828+0.3031sgnp73.31665248.01828.1504068Expt=-3166.73+0.3031gnp所求回归方
28、程为69 在TSP和Eviews中,带AR(1)项的LS命令提供了对自相关序列进行校正的回归计算过程,使用的是Cochrane-Orcutt提出的迭代法。在回归分析输出结果中,可以直接读到的迭代收敛值。70Dependent Variable:EXPTConvergence achieved after 6 iterationsVariableCoefficientStd.Errort-StatisticProb.C-3354.7171007.252-3.3305620.0046GNP0.3092410.0328379.4175030.0000AR(1)0.6039980.2845822.12
29、24080.0509R-squared 0.986094 F-statistic 531.8248Durbin-Watson stat1.671465 Prob(F-statistic)0.000000Inverted AR Roots .60LS expt c gnp AR(1)71Expt=-3354.72+0.3092gnp试比较用广义差分法所求方程Expt=-3166.73+0.3031gnp所求回归方程为72)()2()1(1502211022222211021112211101221122110LLluxxxyuxxxyuxxxyuuuuuxxxyLiLkikLiLiLiikiki
30、iiikikiiiiiLiLiiiikikiii期滞后:到进行项基本假定。对原模型满足其中,阶序列相关:存在原模型:73)()2()1()()2()1(LL2L21L1L0L222222222121202211111212111110112211022222211021112211101LLuxxxyuxxxyuxxxyuxxxyuxxxyuxxxyLiLkikLiLiLiikikiiiikikiiiLiLkikLiLiLiikikiiiikikiii74 新阶序列相关:存在原iLkiLkikikLiLiiLLiLiiiLiLkikLiLiLiikikiiiikikiiiiLiLiiiikik
31、iiixxxxxxyyyyuxxxyuxxxyuxxxyuuuuuxxxyLL11111111102211LL2L21L1L0L222222222121202211111212111110112211221101)()2()1(753、随机误差项相关系数的估计(1)杜宾两步法(2)Cochrane-Orcutt 法76 10212121111111111022111111111110221122110)(11kLLiiiLiiLkiLkikikLiLiiLLiLiiiiLkiLkikikLiLiiLLiLiiiikikiiiyyyexxxxxxyyyyxxxxxxyyyyuxxxyOLS,得模
32、型参数新估计的左右,得样本值新变换,的参数值,得新估计右端括号作样本值新计算,得原新新原 77Dependent Variable:EXPTVariableCoefficientStd.Errort-StatisticProb.C-2531.831270.8792-9.3467140.0000GNP0.2817620.00935530.119890.0000R-squared 0.981606 F-statistic907.2079Durbin-Watson stat0.950536 Prob(F-statistic)0.000000例:商品出口模型(expt.wf1)expt出口A类商品总值
33、 gnp国民生产总值得到残差序列:genr rsdresid78 Dependent Variable:RSD Method:Least Squares Sample(adjusted):1968 1985Variable Coefficient Std.Error t-Statistic Prob.RSD(-1)0.468438 0.259986 1.801784 0.0893R-squared 0.155628 Mean dependent var -12.51639Adjusted R-squared0.155628 S.D.dependent var 171.825S.E.of reg
34、ression157.8903 Sum squared resid 423798.Log likelihood-116.1407 Durbin-Watson stat 1.3930950.468479yt=yt-1+0(1-)+1(xt-xt-1)+vt设 sxt=xt-xt-1则 yt=0+yt-1+1sxt+vt估计上述方程,得 .Eviews 命令:genr sgnp=gnp-0.4684gnp(-1)ls expt c expt(-1)sgnp80Dependent Variable:EXPTMethod:Least SquaresSample(adjusted):1968 1985V
35、ariable CoefficientStd.Errort-StatisticProb.C -1640.146398.4733-4.1160750.0009EXPT(-1)0.4634020.1525473.0377640.0083SGNP 0.3020670.0733204.1198720.0009R-squared0.985903 F-statistic 524.5344Durbin-Watson stat 1.463044 Prob(F-statistic)0.000000=0.463481yt yt-1=0(1-)+1(xt-xt-1)+vt设 zxt=xt-xt-1 zyt=yt-y
36、t-1则 zyt=0+1zxt+vt估计上述方程,得 0=0(1-)和 1。Eviews 命令:genr zgnp=gnp-0.4634*gnp(-1)genr zexpt=expt-0.4634*expt(-1)Ls zexpt c zgnp82Dependent Variable:ZEXPTMethod:Least SquaresSample(adjusted):1968 1985Variable CoefficientStd.Errort-StatisticProb.C-1641.264248.6142-6.6016500.0000ZGNP 0.2994590.01546819.3593
37、00.0000R-squared0.959057 F-statistic374.782Durbin-Watson stat 1.465963 Prob(F-statistic)0.00000 0=-1641.264/(1-0.4634)=-3058.64 1=0.29945983所求回归方程为Expt=-3058.64+0.2995gnp试比较前期所求方程Expt=-3354.72+0.3092gnpExpt=-3166.73+0.3031gnp84load expt.wf1ls expt c gnpgenr er=residls er er(-1)er(-2)vector(2)l1l1(1)
38、=c(1)l1(2)=c(2)genr sx=gnp-l1(1)*gnp(-1)-l1(2)*gnp(-2)ls expt c expt(-1)expt(-2)sxvector(2)l2l2(1)=C(2)L2(2)=C(3)genr dy=expt-l2(1)*expt(-1)-l2(2)*expt(-2)genr dx=gnp-l2(1)*gnp(-1)-l2(2)*gnp(-2)ls dy c dxvector(2)mm(1)=c(1)/(1-l2(1)-l2(2)m(2)=c(2)show m二阶序列相关的情况85(2)Cochrane-Orcutt 法1.考虑线性回归模型 yt=b0
39、+b1xt+ut2.用最小二乘法估计模型,得残差的一阶自回归方程 et=et-1+v的系数的初始估计值1=1-DW/23.利用1对原模型进行广义差分变换作第一次迭代,得广义差分模型 yt(1)=b0+b1xt(1)+vt(1),并以此线性回归模型返回步骤2.4.重复上述过程,反复进行迭代,求得一系列的i (i1,2,),直至i收敛为止。86l科克兰内-奥克特法在EViews中直接采用命令:lLS Y C X1 X2 XK AR(1)AR(2)AR(l)l直接进行迭代估计l一般先不引入AR项,若DW差异显著,首先引入AR(1)直至DW不显著来确定阶数。)2(112)()1(221111011111111102211ililiiikkiiilkilkiikkliliilliliiiuuuxxyxxxxxxyyyy改写为估计模型广义差分模型87l虚假序列相关指的是模型的序列相关性是由于省略了显著的解释变量所致。l例如,在生产函数模型中省略了资金,资金的贡献归入随机误差项,而资金在时间上具有连续性,必然导致误差序列自相关。l为此,一般先建立一个“大包围”的模型,逐个剔除不显著的解释变量,保留下显著的解释变量,避免虚假序列相关。