1、010203序列相关又称为自相关,是指一随机变量当期值与其滞后期值之间的相关性关系。这里主要是指回归模型中,随机扰动项t与其滞后项之间的相关关系。1.序列相关的内涵2.序列相关的检验3.序列相关时的参数估计1.序列相关的含义对于线性回归模型:随机扰动项之间不相关不相关,即:如果随机扰动项之间表现为:则认为出现了序列相关性相关性。即对于不同的样本点,随机扰动项之间不再是相互完全独立的,而是存在某种相关性。由于通常的假设随机扰动项都是服从均值为零,同方差的正态分布,则序列相关性也可以表示为:如果仅仅存在 则称为一阶序列相关一阶序列相关。这种序列相关最为常见。n 1,2,.,=t,+X+.+X+X+
2、=Ytktk2t21t1tn1,2,.,=t,0s0,=),cov(s-ttn 1,2,.,=t,0s0,),cov(s-ttn1,2,.,=t0,s0,),E(s-ttn1,2,.,=t0,),E(1-tt2.序列相关产生的原因(1)经济行为的惯性)经济行为的惯性经济行为的惯性是序列相关产生的重要原因。大多数经济时间序列数据往往保持原有经济行为的惯性,这就意味着存在或强或弱的相关性,其当期值往往受滞后值的影响,如:国民生产总值、国民消费、固定资产投资等。(2)模型的设定问题)模型的设定问题 如果设定的模型和变量之间的真实关系不一致,随机扰动项常常表现为自相关,本来应该为非线性的模型,被设置成
3、了线性模型,可能造成随机扰动项序列相关。同时,研究人员在建立经济模型时,因为各种原因,可能造成某些因素被忽略,如果这些被忽略的因素存在自相关,则随机扰动项就存在自相关。3.序列相关产生的后果(1)参数估计值仍是无偏的)参数估计值仍是无偏的【例】:以一元线性回归模型模型为例,考虑一阶自相关:其中,|0,则 所以,随机扰动项存在自相关时参数估计值的方差不是最优的,如果在随机扰动项存在自相关时仍然使用普通最小二乘法估计参数,可能造成低估参数估计值的方差低估参数估计值的方差。var 0var3.序列相关产生的后果(3)随机扰动项的方差估计量可能被低估)随机扰动项的方差估计量可能被低估【接上例】对于一元
4、线性回归模型,如果不存在序列相关,其随机扰动项方差的无偏估计量为:但是,如果随机扰动项存在序列相关,譬如一阶自相关,则:即:2122nenii2122211212212nxExxEnnXXEYYEeEjiniijijjiijiniiiniiinii222neEi3.序列相关产生的后果(4)模型的统计检验失败)模型的统计检验失败 在扰动项存在自相关的情况下,如果仍然使用普通最小二乘法来估计参数,则会在使用残差估计母体的方差时出现低估的情形,从而使得参数估计的标准误差被低估。这样的后果是t检验统计量出现过大的危险,从而夸大所估计参数的显著性。这使得原本不重要的变量被认为是重要的变量而被保留,导致伪
5、回归的危险性增加。序列相关检验的基本思路基本思路:首先对原始模型用OLS估计,得到原始模型的残差序列,然后通过分析这些残差之间是否具有序列相关,以此来判断随机扰动项之间是否具有序列相关性。常用的序列相关检验:1.杜宾-沃森(DW)检验2.布鲁奇-戈弗雷检验(BG检验、拉格朗日乘数检验、LM检验)3.回归检验法t1.杜宾-沃森(DW)检验 利用残差ei构成的统计量来推断随机扰动项是否存在自相关。(1)基本假定模型必须含有截距项解释变量为非随机变量,在解释变量里面不包含被解释变量的滞后项随机扰动项是一阶自回归,其中t为白噪声其余古典假定成立样本容量n15(2)DW检验的假设 H H0 0:=0=0
6、 H H1 1:00(3)DW检验统计量,1,+=t1-ttntttntttteee22121DW统计量被用于一阶自相一阶自相关关的检验,计算公式为:nttntnttttnttnttnttteeeeeeeeDW122212122122212当n较大时nttntttnttntttnttnttntteeeeeeeee12121221211222122James.Durbin,Geoffery Waston提出的检验随机扰动项自相关的DW检验是基于回归残差et计算出来的 DW=d=2(1-)DW=d=42010 1 DW值2,随机扰动项相关性变小DW值0时,随机扰动项呈正向关系DW值4时,随机扰动项
7、呈负向关系(4)统计推断 d统计量的分布介于两个统计量dl和du之间,而它们的分布只与样本容量和解释变量的个数有关,易于操作。具体判断:在得到DW值后,查DW检验表,得到相应的临界值dl和du如果ddl,拒绝随机扰动项存在一阶正自相关关系如果dlddu,不能认定随机扰动项是否存在自相关关系如果dud4-du。不能拒绝H0,不能认定随机扰动项存在自相关关系如果4-dud4-dl,不能认定随机扰动项是否存在自相关关系如果4-dld,拒绝H0,表示随机扰动项存在一阶负自相关关系 在样本容量不够大时,DW检验不能确定的区域会很宽,而且该检验条件比较苛刻,所以在实证研究中,用的不是太多。【例3.1】建立
8、消费对收入的线性回归模型:使用表3.1.2的数据估计样本回归方程:又n=23,k=2,DW=0.725572,所以dL=1.17,dU=1.54,显然:DW=0.725572dL 从而随机扰动项存在一阶正自相关 sgdpscons725572.0997786.027965.97263173.2074183.127831.212DWRsgdpnsosc参数检验统计量的t值人均收入每增加一个单位,消费增加1.074183个单位,违背消费理论由于斜率的经济意义不合理,因此考虑前期的人均收入是否对当期消费有影响,所以重新设定模型:使用样本数据进行参数估计,得到如下样本回归方程:当其他变量不变时,人均收
9、入每增加一个单位,人均消费增加0.763072个单位;前期的消费对当期的消费影响也是显著的,当其他变量不变时,前期的人均收入每增加一个单位,对当期的消费增加0.357037个单位。DW=1.007268,n=22,k=3,所以dL=1.05,dU=1.66 显然,DW=1.0072682(p),拒绝原假设,残差存在序列相关【例3.2】Breusch-Godfrey Serial Correlation LM Test:F-statistic5.882153 Prob.F(1,18)0.0260Obs*R-squared5.418581 Prob.Chi-Square(1)0.0199Test
10、Equation:Dependent Variable:RESIDMethod:Least SquaresDate:08/06/17 Time:02:02Sample:1991 2012Included observations:22Presample missing value lagged residuals set to zero.VariableCoefficientStd.Errort-StatisticProb.C-1.7715488.285404-0.2138160.8331SGDP0.0075820.0180750.4194490.6799DSGDP-0.0472000.119
11、377-0.3953880.6972RESID(-1)0.5079750.2094472.4253150.0260R-squared0.246299 Mean dependent var-8.34E-14Adjusted R-squared0.120682 S.D.dependent var20.53324S.E.of regression19.25442 Akaike info criterion8.916324Sum squared resid6673.187 Schwarz criterion9.114695Log likelihood-94.07956 Hannan-Quinn cri
12、ter.8.963054F-statistic1.960718 Durbin-Watson stat1.819437Prob(F-statistic)0.156074检验统计量Obs*R-squared服从自由度为1的2分布如果显著性水平取为0.05,则相伴概率为p=0.01990.05,拒绝原假设,随机扰动项存在一阶自相关考虑随机扰动项的二阶自相关,结果如下:如果随机扰动项存在高阶自相关,则需要寻找新的解释变量,重新设定模型。Breusch-Godfrey Serial Correlation LM Test:F-statistic4.111011 Prob.F(2,17)0.0350Obs
13、*R-squared7.171688 Prob.Chi-Square(2)0.0277检验统计量Obs*R-squared服从自由度为2的2分布如果显著性水平取为0.05,则相伴概率为p=0.02770.05,拒绝原假设,随机扰动项存在二阶自相关3.回归检验法 适用于任何随机变量序列相关的检验,而且能够提供序列相关的任何随机变量序列相关的检验,而且能够提供序列相关的具体形式具体形式。优点:当确定了序列相关性存在时,也就确定了其序列相关的数学优点:当确定了序列相关性存在时,也就确定了其序列相关的数学形式,并且此方法是用任何形式的序列相关检验。形式,并且此方法是用任何形式的序列相关检验。缺点:实际
14、的序列相关的数学形式是十分不易确定的,除特殊情况外,此方法的工作量较大。具体步骤:将模型进行OLS回归,得到残差序列e1,.,en将et关于残差的滞后值et-1,.,et-p以及相应残差的二次效应e2t-1,.,e2t-p进行回归处理,得到如下模型:对不同形式的回归模型进行统计检验,如果某个估计式是显著的,或者多个估计式是显著的,就选择其中最显著者。这表明随机扰动项存在序列相关。tttttttttttteeeeeeeee2321111211111 如果随机扰动项存在自相关,应该分析随机扰动项自相关产生的原因,以便更好地设定模型,确定变量之间的关系。随机扰动项产生序列相关原因是多方面的,所以对随
15、机扰动项的修正也是不同的。产生原因模型的设定形式错误模型中省略了重要的解释变量由于客观经济现象自身的特点决定修正方法重新选择模型形式。使得所选模型的形式能够匹配变量之间的关系重新寻找丢失的解释变量,把它列入模型当中运用差分差分的方法,将模型中的自相关转化为无自相关,然后对模型的参数进行估计1.广义差分变换法(1)广义差分变换假定模型为:其中,t满足普通最小二乘估计的基本假定。当t取t-1时,得:方程两边同时乘以,得:用式(1)减去式(3),得ntXXXYttttktkttt,.,2,1.12211111221111.tktktttXXXY111221111.tktktttXXXY(1)(2)(
16、3)tktktkttttttXXXXXXYY1122211111.1(4)令则式(4)可以表示为:因为t满足普通最小二乘估计的基本假定,所以可以对上式使用OLS估计回归参数,所得估计量具有最佳线性无偏性。如果自相关类型是高阶自相关,同理可以使用广义差分变换消除随机扰动项的自相关性,然后使用普通最小二乘法获得相应的参数估计。tktktttXXXY*22*11*.1,.,2,1,*1*1*kjXXXYYYjtjtjtttt1.广义差分变换法(2)自相关系数的估计方法 进行广义差分变换的前提是自相关系数已知,但自相关系数通常情况下是未知的,因此需要首先估计得到残差,然后利用残差估计自相关系数。ste
17、p1:直接对一阶自相关回归模型进行OLS处理,得到残差序列,利用残差序列求得自相关系数的估计值:ntttntttteee22121step2:计算 然后对变换后的模型用OLS进行处理,求出参数的估计值利用新的参数获得新的残差 ,利用新的残差再求新的自相关系数估计值:step 3:迭代停止条件其中为事先给定的精度,如=10-4ntttntttteee221211,.,2,1,*1*1*kjXXXYYYjtjtjtttt,.,1kte2.极大似然估计法假定一阶自回归AR(1)模型为:其中,|1,t满足普通最小二乘估计的基本假定,即t满足高斯白噪声。利用滞后算子,可以将t表示为:又因为|1,得:nt
18、XXXYttttktkttt,.,2,1.12211tL)-(11=tntLLtt,.,2,1.12两边同时取期望与方差,得:22222122122122242221.1.1.1var)var(.1)(sstststsstststtttsttttttEEEELLELLE因为E(t)=0,所以的协方差矩阵为:其中,为一正定矩阵,由矩阵知识可知,存在n阶可逆矩阵D,使得=DDT,从而存在D-1使得一阶自回归模型的矩阵表达式变为 111111)var(321322122222nnnnnnTtE100010001000121111DDXDYDD-1的方差协方差矩阵为:令Y*=D-1Y,X*=D-1X,
19、*=D-1,则矩阵表达式可以写成如下形式:这时随机扰动项满足普通最小二乘估计的基本假定,对上式进行最小二乘回归,即可得到参数的最小二乘解,也就是参数的广义最小二乘解。考虑极大似然解,针对上式,随机扰动项满足古典假定是一个独立同分布的正态随机变量,因此,可以写出*的联合分布密度函数。nTTIDDED221111var*XY)I,0(*n2 212*222*exp21,nttnf令*t=Y*t-X*t,借助矩阵表达进行变换,变换之后的似然函数为:对上式取对数,得到对数似然函数:最大化似然函数求得参数估计值,2。2*222*exp21,XYXYnTf 2*22*22log2,XYXYnfT异方差是指
20、针对不同的观测对象,随机扰针对不同的观测对象,随机扰动项具有不同的方差动项具有不同的方差,这是我们称这样的模型为异方差模型。定义如下:此时,我们称随机扰动项具有异方差。njijintXXXYjttktkttt,.,2,1,varvar,2,1,22111.异方差的原因与后果2.异方差的检验3.异方差时的参数估计一、异方差的原因与后果一、异方差的原因与后果1.异方差产生的原因(1)遗漏重要变量)遗漏重要变量由于未知性,模型设定时,现实的模型可能不能真实地反应被不能真实地反应被解释变量与解释变量之间的真实关系解释变量与解释变量之间的真实关系,从而遗漏重要的解释变量。【例】研究某一个行业的上市公司,
21、建立企业的生产函数模型:其中,Yt为产出量,K,L分别为资本和劳动力,t为随机扰动项,包含了除资本和劳动力以外的其他因素,这些因素可能造成异方差。企业生产的外部环境、企业的规模、生产工艺的区别、管理上的差异等,造成对产出的影响有较大的差异,使得模型中的随机扰动项具有异方差。在研究一个商品的需求函数中,如果没有将有关互补商品和替代商品的价格引入模型当中,包含了这些遗漏变量的随机扰动项也很可能出现异方差teKALYttt一、异方差的原因与后果一、异方差的原因与后果1.异方差产生的原因(2)数据自身的特点)数据自身的特点 在使用截面数据时,经常出现异方差。在使用截面数据时,经常出现异方差。【例】在截
22、面资料下研究居民的消费行为:其中,分别为家庭消费和家庭可支配收入,为随机扰动项。这里随机扰动项往往不能满足同方差性,因此对高收入家庭来讲,消费的差异性大;而对低收入家庭来讲消费更有规律,差异性较小。因此一般来讲,随机扰动项方差随着可支配收入的增加而增大,呈现一种单调递增的形态。tttXY一、异方差的原因与后果一、异方差的原因与后果1.异方差产生的原因(3)分组数据的特点)分组数据的特点【例】以绝对收入假设为理论假设,以截面数据为样本建立居民消费函数:其中,Ct,Xt分别为家庭组平均消费和家庭组平均可支配收入,为随机扰动项。根据居民收入按照等距分成n组,取组平均数为样本观测值。一般情况下居民收入
23、服从正态分布,处于中等收入组中的人数比较多,处于两端收入组中的人数比较少,人数多的组平均数误差比较小,人数少的组平均误差比较大。所以一般来说,样本观测值的误差随着解释变量的增大先减少样本观测值的误差随着解释变量的增大先减少后增大,因此对于分组数据易出现异方差。后增大,因此对于分组数据易出现异方差。tttXC一、异方差的原因与后果一、异方差的原因与后果2.异方差产生的后果(1)参数估计量非有效)参数估计量非有效当计量经济学模型出现异方差时,普通最小二乘乘法估计量仍然具有无偏性,但是不再具有最优性不再具有最优性。而且在大样本情况下,此参数估计量仍然不具有渐进有效性,也就是说参数估计量不具有一致不具
24、有一致性性。【分析】其中,XY1211221212111121121121111,.,.,.,knknnnkkTnnTknTnnXXXXXXXXXXYYYY一、异方差的原因与后果一、异方差的原因与后果随机扰动项的方差协方差矩阵为:当随机扰动项具有异方差时,普通最小二乘估计量仍然具有线性性。线性性线性性 当随机扰动项具有异方差时,参数的OLS估计量表达形式仍然是:nTE000000var122YXXXTT11,.,n不全相同,随机扰动项满足其余古典假定一、异方差的原因与后果一、异方差的原因与后果无偏性无偏性 当随机扰动项具有异方差时,参数的OLS估计量表达形式仍然是:OLS估计量不再具有最优性估
25、计量不再具有最优性 根据线性性,得:TTTTTTTTXXXEXXXEXXXXEYXXXEE1111TTTTTTXXXXXXXYXXX111一、异方差的原因与后果一、异方差的原因与后果因此,的方差协方差矩阵:而当模型存在同方差时,其参数的OLS估计量方差为:因此,当模型存在异方差时,的有效性得不到满足。1121111varXXXXXXXXXEXXXXXXEXXXEETTTTTTTTTTTTT 12varXXT一、异方差的原因与后果一、异方差的原因与后果2.异方差产生的后果(2)变量的显著性检验失去意义)变量的显著性检验失去意义 在变量的显著性检验中,因为t统计量包含有随机扰动项共同的方差2,而随
26、机扰动项的方差估计量 不再是2的无偏估计量,所以t统计量失真统计量失真 可能使原本显著的解释变量无法通过显著性检验原本显著的解释变量无法通过显著性检验,从而使t检验失去意义。(3)模型的预测失效)模型的预测失效 由于上述后果,不仅使得模型不具有良好的统计性质,还可能由于在预测值的置信区间中也包含随机扰动项共同的方差,导致当模型出现异方差时预测失效。kneesT2异方差检验的思路思路:由于异方差性是指对不同样本点随机扰动项的方差变化,也就是说,相对于解释变量的不同观测值,随机扰动项具有不同的方差,检验异方差也就是检验随机扰动项的检验异方差也就是检验随机扰动项的方差与解释变量观测值之间的相关性方差
27、与解释变量观测值之间的相关性。几种常用检验方法:1.怀特检验(White Test)2.格里瑟(H.Glejser)检验3.布鲁奇-帕根-戈弗雷(Breusch-Pagan-Goldfrey)检验4.戈德菲尔德-匡特(Goldfeld-Quandt)检验1.怀特检验(White Test)该检验方法可以直接检验是否存在异方差。设一般的计量模型为:(1)检验假设 H0:var(t)=2,t=1,2,.,n H1:var(t)=2t,t=1,2,.,n (2)检验步骤对原始模型做普通最小二乘回归,得到残差序列et,t=1,2,.,n以e2t作为被解释变量,以原来的解释变量作为解释变量,并且考虑解释
28、变量的二次效应、交叉效应,进行辅助回归。【例】模型:辅助回归模型:tktk2t21t1t+X+.+X+X+=Yt2t21t1t+X+X+=Yt2t1t122t21t12t21t102t+XX+XX+X+X+=e构造检验统计量nR2,在原假设为真的情况下,nR2渐进服从自由度是5的2分布。当给定显著性水平,相伴概率prob,如果大于显如果大于显著性水平,则接受原假设,认为模型不存在异方差,否则认为模型著性水平,则接受原假设,认为模型不存在异方差,否则认为模型存在异方差。存在异方差。【例3.4】考虑如下的回归模型:使用样本数据得到如下的样本回归方程:由于是分地区的横截面数据,所以可能存在异方差,用
29、怀特检验进行异方差分析 gdpcons8680.0(13.8106)(0.4196)3347.02710.5612Rgdpnsoc检验结果如下:Heteroskedasticity Test:WhiteF-statistic13.42494 Prob.F(2,28)0.0001Obs*R-squared15.17499 Prob.Chi-Square(2)0.0005Scaled explained SS37.17178 Prob.Chi-Square(2)0.0000怀特检验的2统计量Obs*R-squared,其伴随概率为p=0.0005,远小于显著性水平0.05,所以拒绝随机扰动项不存在
30、异方差的假设,随机扰动项存在异方差2.格里瑟(H.Glejser)检验 检验思路:由OLS得到原始模型的残差序列,然后取绝对值,假设方差与解释变量之间存在某种幂关系,对一个或者多个解释变量做回归,根据显著性判断是否存在异方差。优点:不仅能对异方差的存在进行判断,而且还能通过异方差对某个优点:不仅能对异方差的存在进行判断,而且还能通过异方差对某个解释变量变化的函数形式进行诊断。解释变量变化的函数形式进行诊断。检验步骤首先用OLS对原始模型进行回归,得到残差序列et,t=1,2,.,n,取绝对值|et|用|et|与解释变量的不同幂次进行回归【例】一元线性回归模型:ttt+X+=Y进行显著性检验,若
31、有一种模型通过了显著性检验,则认为存在异方差。若有一种模型通过了显著性检验,则认为存在异方差。但是因为在构造上述|et|与解释变量的不同幂次回归检验模型时事探测性的,如果试验模型选择不当,可能检验不出是否存在异方差。tktttttt21ttt21-ttt-1tt+X+=e+X+=e+X+=e+X+=e+X+=e【例3.5】基于格里瑟检验考虑随机扰动项的异方差性检验结果如下:格里瑟检验的2统计量Obs*R-squared,其伴随概率为p=0.001,远小于显著性水平0.05,所以拒绝随机扰动项不存在异方差的假设,随机扰动项存在异方差Heteroskedasticity Test:GlejserF
32、-statistic15.74196 Prob.F(1,29)0.0004Obs*R-squared10.90700 Prob.Chi-Square(1)0.0010Scaled explained SS15.07664 Prob.Chi-Square(1)0.00013.布鲁奇-帕根-戈弗雷(Breusch-Pagan-Goldfrey)检验 又称拉格朗日乘数检验 基本思想:构建残差平方序列与解释变量之间的辅助函数 【例】考虑如下形式:关于随机扰动项的方差可以写成下式:ptzzzzzfnt,.,var,.,2,1,+X+.+X+X+=Y212tktk2t21t1t pptzzzzf.var2
33、211022(1)检验假设 H0:1=2=.=p=0 H1:存在:存在i,使得,使得i0,i=1,2,.,p(2)检验步骤对原始模型运用最小二乘法,求出残差et用e2t做被解释变量,做如下回归模型得到可决系数R2构造检验统计量 对给定的显著性水平,如果伴随概率对给定的显著性水平,如果伴随概率probprob小于显著性水平小于显著性水平,则拒,则拒绝原假设,认为模型存在异方差绝原假设,认为模型存在异方差【例3.6】用布鲁奇-帕根-戈弗雷检验来检测随机扰动项的方差 tptptttzzze.2211022(p)nR=LM2Heteroskedasticity Test:Breusch-Pagan-G
34、odfreyF-statistic16.12260 Prob.F(1,29)0.0004Obs*R-squared11.07650 Prob.Chi-Square(1)0.0009Scaled explained SS27.13236 Prob.Chi-Square(1)0.0000伴随概率为p=0.0009,远小于显著性水平0.05,同怀特检验、格里瑟检验一致4.戈德菲尔德-匡特(Goldfeld-Quandt)检验 又称又称G-Q检验,以检验,以F检验为基础,适用于大样本,异方差递增或者递检验为基础,适用于大样本,异方差递增或者递减的情况减的情况 基本思想:如果不同观测对象的扰动项方差相同
35、,那么样本某一部分的方差将和样本另一部分的方差相同,所以可以使用F统计量来检验扰动项方差的均衡性 检验步骤:全部观测值按照解释变量Xj由低到高进行排序去掉居中的c个中间观测值,将其余的观测值分为两组,每组含有(n-c)/2个观测分别利用两组数据进行回归,得到各自的残差平方和构造检验统计量若相伴概率小于显著性水平,则拒绝若相伴概率小于显著性水平,则拒绝H H0 0,即拒绝同方差的假定,即拒绝同方差的假定 12,211212112212kcnnnnnFeeFnttntt1.加权最小二乘法如果模型被检验证明存在异方差性,则需要发展新方法估计模型的参数,其中最常用的方法就是加权最小二乘法。基本思路:对
36、原模型加权,使之变成一个新的不含有异方差的对原模型加权,使之变成一个新的不含有异方差的模型,然后用模型,然后用OLS估计其参数。估计其参数。假设原模型如下:如果经过检验其随机扰动项的方差是解释变量的函数:其中,f(zt)为解释变量的函数。njijintXXXYjttktkttt,.,2,1,varvar,2,1,2211 nizftit,.,2,1,var22以 为权重,得到新的模型如下:此时,变换后的模型是同方差的,即:对新的模型用OLS来处理,得到原始模型的参数无偏有效估计量。这种加权变换的方法就是加权最小二乘法。ntzfXzfXzfXzfzfYzfttktktttttttt,2,1,11
37、11112211)(1tzf 2211vartttzfEzf【例】一般情况下,考虑如下模型:其中,所以,模型存在异方差令:即 =DDT XY nTEE000000var,0122nD00000011111000000nD上述模型具有同方差性:可以用OLS处理得到参数的加权最小二乘解 权数矩阵:对原始模型运用OLS,得到随机扰动项的估计值et,以此可构成权数矩阵的估计矩阵。111DXDYD211211111varTTTDDDDEDDEDYXXXYDXDXDXDTTT111111111无偏、有效的估计量当运用计量软件包,常用经验方法:不对原模型进行异方差性检验,而直接选择加权最小二乘法,尤其是采用
38、截面数据作为样本时。如果确实存在异方差性,则它被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。1.模型的对数变换采用对解释变量和被解释变量取对数,然后再回归来对模型进行估计。【例】模型:取对数:降低异方差性的影响 tttXYtttXYlnln能降低测量值的数量级,使原来测量值之间的巨大差异迅速缩小对数变换后其残差表示为相对误差,而相对误差往往具有相对较小的差异?可以看做被解释变量Y对解释变量X的弹性,在实际应用中有较强的应用意义1.什么是多重共线性2.多重共线性产生的原因与后果3.多重共线性的检验4.多重共线性的处理对于模型:如果两个或者多个解释变量之间出现了相关性,
39、则称为多重共线性多重共线性。如果存在一组数使得:其中,j j=1,2,.,k不全为零,这时称解释变量之间完全共线性)(1.3.3,2,1,2211ntXXXYtktkttt)(2.3.3,2,1,02211ntXXXktktt多重共线性完全共线性近似共线性多重共线性的矩阵表示形式:Y=X+(3.3.3)其中解释变量的矩阵为:当Rank(X)1010或或Tolerance0.1Tolerance1010时,模型存在多种共线性,当时,模型存在多种共线性,当CNCNi i3030时,模型存在严重时,模型存在严重的多重共线性的多重共线性kiCNi,.,2,1,minmax1.增加样本容量增加样本容量多
40、重共线性往往是一种样本现象,所以通过增加样本容量,来避免或者是减弱多重共线性是一种常用的方法。因为多重共线性可能是由偶然的样本或者是测量误差造成的,所以增加样本容量能够降低或者避免多重共线性。2.剔除不重要的解释变量剔除不重要的解释变量 简单方法是剔除共线性变量组中解释变量与被解释变量简单相关系数最小者。一般做法是依据对被解释变量的熟悉程度,基于某些原理,将与被解释变量相关的全部因素纳入模型,然后依据每个回归系数t值的大小,从最小的开始,逐个剔除那些不显著的解释变量,知道模型中包含的变量都是影响被解释变量的显著因素为止。3.模型重新设定模型重新设定 一般情况下,多重共线性可能是由模型设定的问题
41、造成的,所以将原设定的模型形式做适当变换,可以有效地消除或减弱原模型中解释变量之间的相关性,从而减弱多重共线性的影响。4.逐步回是变量归法逐步回是变量归法 逐步回归法是在选择解释变量时,解释变量要按照对被解释变量影响程度的大小依次逐个引入模型。5.主成分回归分析法主成分回归分析法 主成分回归分析法是一种多元回归分析法,首先,利用主成分分析将解释变量转换成若干主成分,这些主成分从不同侧面反映了解释变量的综合影响,并且互不相关;其次,将被解释变量关于获得的主成分进行回归,再根据主成分与解释变量之间的关系,求得原回归模型的回归方程。1.若 用Yt关于X3t,X4t.Xkt回归,得到预测值 ,以及残差
42、 ,同时作X2关于其他解释变量的回归,得到预测值 ,残差 是 关于 的回归系数 让R22表示X2关于其余解释变量回归的拟合优度,讨论 的方差如何随着X2与其余解释变量线性关系强弱变化。tktk2t2t+X+.+X+=YtYYYt2X2222.若 et表示残差序列,表示预测值 如果et关于常数项X2t,X3t进行回归,则常数项估计值应是多少?如果Y关于常数项 回归,截距项和斜率的估计值应是多少?t3t32t21t+X+X+=YtYY3.Y含有测量误差 假定不含测量误差,Y*=X+,Y*为无观测误差的数据。用b*表示的参权估计量(ols),现在假定Y是包含测量误差的被解释变量 Y=Y*+,是观测误差 假定 E(i)=0 var(i)=2 E(i)=0 var(i)=2 实际模型 Y=Y*+=X+说明:b具有无偏性,一致性 含有测量误差的k的估计量bk的方差比无观测误差k的估计量b*k的方差大 4.X含有测量误差 假定不包含测量误差的模型为Y=+X*+,X*为无观测误差的权据向量。用b*表示的参权估计量(ols)假定 X=X*+,表示观测误差 同时,满足ols基本假定:既定 E(i)=0 var(i)=2 cov(i,i)=0 X*是固定变量 真实模型 Y=+X*+=+(x-)+=+x+-说明:=-,E(i)=E(-)=0,cov(i,xi)=?是否具有无偏性、一致性