1、1第一章第一章 导论导论计量经济学的性质和经济数据计量经济学的性质和经济数据2计量经济学“四大过程”模型设计:模型设计:理论假说理论假说理论模型理论模型计量模型计量模型模型估计:模型估计:数据数据估计方法估计方法模型检验:模型检验:经济经济统计统计计量计量模型应用:模型应用:预测预测制定政策制定政策3计量模型“四个要素”Y=1+2X+u3、方程式4、随机扰动项2、参数1、变量4第二章第二章 简单回归模型简单回归模型5本章大纲本章大纲u简单回归模型的定义简单回归模型的定义u普通最小二乘法的推导普通最小二乘法的推导uOLS的操作技巧u测量单位和函数形式uOLS估计量的期望值和方差u过原点回归6术语
2、注解术语注解u线性的含义:y 和x 之间并不一定存在线性关系,但是,只要通过转换可以使y的转换形式和x的转换形式存在相对于参数的线性关系,该模型即称为线性模型。7关于关于u的假定的假定u我们假定总体中误差项u的平均值为零.E(u)=0(2.5)u该假定是否具有很大的限制性呢?8关于关于u的假定的假定u如果,E(u)=5.则 y=(0+5)+1x+(u-5),从而,E(u)=E(u-5)=0.u上述推导说明我们总可以通过调整常数项来实现误差项的均值为零,因此该假定的限制性不大.9条件期望零值假定条件期望零值假定 u我们需要对u和 x之间的关系做一个关键假定。u理想状况是对x的了解并不增加对u的任
3、何信息。u换句话说,我们需要u和 x完全不相关。E(u|x)=E(u)。10条件期望零值假定条件期望零值假定 u由于我们已经假定了E(u)=0,因此有 E(u|x)=E(u)=0.(2.6)u该假定是何含义?11条件期望零值假定条件期望零值假定 u(2.6)说明总体回归函数应满足 E(y|x)=0+1x.u该函数是x的线性函数,y的分布以它为中心。12普通最小二乘法的推导普通最小二乘法的推导u回归的基本思想是从样本去估计总体参数。13普通最小二乘法的推导普通最小二乘法的推导0011011101niiiiniiixyxnxyn14因此因此OLS估计出的斜率为估计出的斜率为112121 0niii
4、niiniixxyyxxxx只要15关于关于OLS的更多信息的更多信息u OLS法是要找到一条直线,使残差平方和最小。u残差是对误差项的估计,因此,它是拟合直线(样本回归函数)和样本点之间的距离。16OLS的代数性质的代数性质u回归元(解释变量)和OLS残差之间的样本协方差为零uOLS回归线总是通过样本的均值。xy10 17 OLS的代数性质的代数性质u我们可把每一次观测看作由被解释部分和未解释部分构成.u预测值和残差在样本中是不相关的iiiuyy 0),cov(iiuy18证明证明 SST=SSE+SSR SSE 2 SSR 222222yyuyyyyuuyyuyyyyyyiiiiiiiii
5、iii19拟合优度拟合优度u我们如何衡量样本回归线是否很好地拟合了样本数据呢?u可以计算模型解释的总平方和的比例,并把它定义为回归的R-平方u R2=SSE/SST=1 SSR/SST20自然对数自然对数u log()yxlog(1)xx0forx 101000log()log()()/xxxxxx x 21假定假定SLR.1(关于参数是线性的)(关于参数是线性的)u在总体模型中,因变量 y 和自变量 x 和残差 u 的关系可写作y=0+1x+u,其中 0 和 1 分别是总体的截距参数和斜率参数22假定假定SLR.2(随机抽样随机抽样):u假定我们从总体模型随机抽取容量为n的样本,(xi,yi
6、):i=1,2,n,那么可以写出样本模型为:yi=0+1xi+ui23Assumptions SLR.3 and SLR.4uSLR.3,零条件期望:u假定 E(u|x)=0.那么在随机样本中我们有 E(ui|xi)=0 SLR.4 (自变量中的样本变动):在样本中,自变量 x 并不等于一个不变常数。(|)0E u x 24定理定理2.1(OLS的无偏性的无偏性)u使用假定SLR.1到SLR.4,我们可以得到无论0,和1 取什么值,它们的OLS估计量的期望值等于它们各自的真值。25无偏性总结无偏性总结u1 和 0 的OLS估计量是无偏的u 无偏性的证明依赖于我们的四个假定-如果任何假定不成立,
7、OLS未必是无偏的u记住无偏性是对估计量的描述-对于一个给定的样本我们可能靠近也可能远离真实的参数值26 OLS估计量的抽样方差估计量的抽样方差 在一个附加假定下计算这个方差会容易的多,因此有u假定 SLR.5(同方差性):Var(u|x)=s2 (Homoskedasticity)27定理定理 2.2(OLS 估计量的抽样方差估计量的抽样方差)u在假定 SLR.1 到 SLR.5 下,我们有(2.57):niixxxsVar122221)(ssnxxxVarii2220)()(s28误差方差估计量误差方差估计量(继续继续)01010100112221/22iiiiiiiiuyxxuxuuSS
8、Rnnss那么,的一个无偏估计量是29第三章第三章 多元回归分析:多元回归分析:估计估计30对多元回归的解释01 1221 12221 1.,.,.,kkkkkyxxxyxxxxxyxceteris paribus 所以。如果保持不变,。也就是说,每一个都具有“其他情况保持不变()”的解释。偏导数。31简单回归估计与多元回归估计01 101 122112212 :0()yxyxxxxx比较简单回归和多元通常,。除非即没有局部效应,或者样本中 和不相关。32拟合优度222 SST SSE SSR SST SSE SSRiiiiiiyyuyyyyu每一个观测值都可以看作包含两部分:模型能够解释的部
9、分和不能解释的部分定义:33拟合优度 如何判断样本拟合优劣?计算因变量总离差平方和(SST)中 能由模型解释的比例,回归 R-squared R2=SSE/SST=1 SSR/SST34拟合优度(cont)22222 iiiiiiRyyyyyyRyyyy也可以把看作 与 之间相关系数的平方35关于 R2 u 随着解释变量的增加R2 不会下降,通常会上升u 鉴于R2 会随着解释变量的增加而上升,模型间仅仅基于R2 的比较意义不大36无偏假定 线性 总体模型关于参数线性:y=0+1x1+2x2+kxk+u 随机抽样从总体中随机抽取容量为 n的样本,(xi1,xi2,xik,yi):i=1,2,n,
10、样本模型为 yi=0+1xi1+2xi2+kxik+ui 零条件均值E(u|x1,x2,xk)=0。无完全共线性任何字变量都不是常数,自变量之间不存在完全线性关系。37遗漏变量导致的偏差01 12201 1111211,iiiyxxuyxuxxyxx假设真实模型为:错误设定为:则:38遗漏变量导致的偏差(cont)21112201 112111121 iiixxxxxxxxxE 考虑对的回归,则所以39OLS 估计量的方差 估计量的抽样分布以真实值为中心 希望知道这一分布的分散程度如何 如果再附加一条假定,分析估计量的方差将更容易。所以假定 Var(u|x1,x2,xk)=s2(Homoske
11、dasticity)40OLS 估计量的方差(cont)u 以 x 表示(x1,x2,xk)u 假定 Var(u|x)=s2 也意味着 Var(y|x)=s2u 个无偏假定再加上同方差假定,就是 Gauss-Markov 假定41OLS 估计量的方差(cont)22222Gauss-Markov 1;()jjjjijjjjVarSSTRSSTxxRxxRs假定前提下其中:是对关于所有其他的 的回归的判定系数42对误差方差(Error Variance)的估计 无法知道误差的方差,s2,因为无法观测到,ui 能够观测到的是残差,i 可以利用残差来估计误差的方差43误差方差的估计(cont)221
12、 221 1ijjjunkSSR dfseSSTRssu df=n (k+1)=n k 1u df(自由度)(样本容量)(估计参数的个数)44Gauss-Markov 定理u 在个 Gauss-Markov 假定前提下,OLS估计量是 最佳线性无便估计()u Bestu Linearu Unbiasedu Estimatoru 所以,假定前提成立,放心使用OLS45第四章 多元回归分析:推断 y=0+1x1+2x2+.kxk+u46经典线性模型假定(CLM)u截至目前,我们知道,在 Gauss-Markov 假定前提下,OLS 是BLUE,u 为了进行经典假设检验,我们需要增加其他假定(在 G
13、auss-Markov 假定之外)u 假定假定 u 独立于独立于 x1,x2,xk 而且而且 u 服从均值服从均值为零为零,方差为方差为s s2的正态分布的正态分布:u Normal(0,s2)47CLM假定(cont)u 在CLM假定下,OLS 不仅仅是 BLUE,而且是具有最小方差的无偏估计量u 可以把关于总体的CLM 假定总结如下 y|x Normal(0+1x1+kxk,s2)u虽然可以暂时作出正态性假定,很显然有时实际并非如此u 大样本可以使我们无须为正态假定烦恼48t 检验j122 CLM ():1jn kjtsetnkss 在假定前提下注意这是分布 而非正态分布这是因为我们必须以
14、来估计自由度注意49t 检验(cont)u 知道了估计量标准化以后的抽样分布,就可以进行假设检验u 从零假设(a null hypothesis)开始u 例如,H0:j=0u 如果接受零假设,也就意味着认为:控制住其他的x,xj 对 y没有影响.50t 检验(cont)j0t :Hjjjttset为进行 检验,首先需要构造的统计量利用和拒绝准则来决定是否拒绝零假设()51yi =0 +1xi1 +kxik+uiH0:j=0 H1:j 0c0a1 a单侧对立假设(cont)无法拒绝拒绝52c0a/21 a-ca/2双侧对立假设拒绝拒绝无法拒绝01ii1iki01y =+x +x+uH:=0 H:
15、0kjj53对于 H0:j=0的总结u 除非特意声明,否则对立假设是双侧假设u 如果拒绝了零假设,通常说“xj 在a%水平上统计显著”u 如果无法拒绝零假设,我们通常会说“xj 在 a%水平上统计不显著”54其他假设的检验u t 检验的更一般的形式可能会是希望检验类似于H0:j=aj 这样的假设u这种问题中,恰当的 t 统计量是 0 jjjjatsea其 中,对 应 于 标 准 的 检 验55置信区间u 使用经典统计检验的另一种方法是使用双侧检验中的临界值构造置信区间u (1-a)%置信区间的定义是1,c jjn kc set 其中是 在分布中的临界值56计算 t 检验的p值(p-value)
16、u可以用另一种方法取代经典检验方法“零假设能够被拒绝的最小显著性水平是多少?”u 从而,计算 t 统计量,然后查表看它对应于t分布中的分位点这就是 p-valueu p-value 就是,如果零假设成立,我们能够得到前述计算出的t 统计量的概率57多重线性约束检验u 到目前为止所做的检验只包含一个线性约束,(例如:1=0 或者1=2)u 但有时可能可能需要对参数的多重约束进行联合检验u 一个典型的例子是检验“排除性约束”希望知道一组参数是否都等于零58对排除性约束的检验u 如果零假设类似于 H0:k-q+1=0,.,k=0u 对立假设是 H1:H0 不正确u 不能单独检查各个 t 统计量,因为
17、我们想知道这 q 个参数是否在一个给定的显著性水平上 联合 显著很可能在这一显著水平上任何一个都不显著59对排除性约束的检验(cont)u 进行这种检验需要估计包含所有变量x 的不受约束模型(“unrestricted model”)以及不包含xk-q+1,xk 的受约束模型u从直觉上看,我们希望知道SSR的变化是不是足以保证把 xk-q+1,xk 包括在模型1r u rru ru rS S RS S RqFS S Rnk其 中代 表 约 束而代 表 不 被 约 束60F 统计量uF 总是正数,这是因为受约束模型中的 SSR 不会比不受约束模型中的 SSR 小u 实际上F统计量可以衡量 从不受
18、约束模型变化到受约束模型时SSR 的相对变化u q=约束个数,或者 dfr dfuru n k 1=dfur61F 统计量(cont)u 为了确定从不受约束模型变化为受约束模型时SSR 的变化是否“足够大”从而能够拒绝排除,需要知道 F 统计量的样本分布uF Fq,n-k-1,其中 q 是分子自由度,n k 1 是分母自由度 620ca1 af(F)FF 统计量(cont)拒绝无法拒绝如果F c,在 a 显著水平上拒绝H063F统计量的 R2 形式u 由于 SSR可能很大,计算麻烦,可以使用另外一种方便的替代方法u 由于 SSR=SST(1 R2),带入 SSRr 和 SSRur中,于是222
19、11 r ururrurRRqFRnk表 示 受 约 束,代 表 不 受 约 束64模型总体显著性u 一种特殊的排除性约束是检验 H0:1=2=k=0u 在一个只含有截距的模型中 R2 为0,F 统计量成了1122knRkRF65一般线性约束uF统计量的基本形式 适合于任何线性约束检验u 首先估计不受约束模型,然后估计受约束模型u 每次估计时都记录下 SSRu 施加约束可能需要技巧很可能需要重新定义变量66回归结果的报告22log()10.5230.825(/)(0.042)(0.200)N=408,R=0.040,R=0.040,F=,DW=salaryb s如果只有一个方程:67回归结果的
20、报告(cont)解释变量解释变量:log(salary)自变量自变量(1)(2)(3)b/s-0.825(.200)-0.605(.165)-0.589(.165)log(enroll)0.0874(0.0073)0.0881(0.0073)log(staff)-0.222(0.050)-0.218(0.050)droprate -0.00028(0.00161)gradrate 0.00097(0.00066)截距截距(intercept)10.523(0.042)10.884(0.252)10.738(0.258)N R-Squared 408 0.040 4080.353 408 0.3
21、61 68第五章第五章 多元回归分析:多元回归分析:OLS的渐近性的渐近性略略69第六章 多元回归分析:其他问题 y=0+1x1+2x2+.kxk+u70本章大纲u数据的测度单位换算对OLS统计量的影响u对函数形式的进一步讨论u拟合优度和回归元选择的进一步探讨u预测和残差分析71要点u重新定义变量的影响n估计系数nR 平方nt 统计量u函数形式n对数函数形式n含二次式的模型n含交叉项的模型72函数形式uOLS也可以用在x和y不是严格线性的情况,通过使用非线性方程,使得关于参数仍为线性。u 可以取x,y(一个或全部)的自然对数,可以用x的平方形式u 可以用x的交叉项73对数模型的解释对数模型的解
22、释u如果模型是 log(y)=0+1log(x)+u 1是y对于x的弹性u如果模型是log(y)=0+1x+u 1近似是,给定一单位x的改变,y的百分比变化,常被称为半弹性。74为什么使用对数模型?u取对数后变量的斜率系数,不随变量测度单位改变。u如果回归元和回归子都取对数形式,斜率系数给出对弹性的一个直接估计。u对于y0的模型,条件分布经常偏斜或存在异方差,而ln(y)就小多了,所以uln(y)的分布窄多了,限制了异常(或极端)观测值(outliers)的影响。75一些经验法则一些经验法则u什么类型的变量经常用对数形式?n肯定为正的钱数:工资,薪水,企业销售额和企业市值。n非常大的变量:如人
23、口,雇员总数和学校注册人数等。76一些经验法则一些经验法则u什么类型的变量经常用水平值形式?n用年测量的变量:如教育年限,工作经历,任期年限和年龄u可以以水平值或对数形式出现的变量:n比例或百分比变量:失业率,养老保险金参与率等。77对数形式的限制u一个变量取零或负值,则不能使用对数。u如果y非负但可以取零,则有时使用log(1+y)。u当数据并非多数为零时,使用log(1+y)估计,并且假定变量为log(y),解释所得的估计值,是可以接受的。78慎重使用对数形式注意,当y取对数形式时,更难以预测原变量的值,因为原模型允许我们预测log(y)而不是y。79含二次式的模型含二次式的模型对于形式为
24、y=0+1x+2x2+u的模型,我们不能单独将1解释为关于x,y变化的度量,我们需要将2也考虑进来,因为20121212(1)(2)2,(3)2yxxyxxyxx 所以80含二次式的模型含二次式的模型u如果感兴趣的是,给定x的初始值和变动,预测y的变化,那么可以直接使用(1)。u一般来说,我们可以使用x的平均值,中值,或上下四分位数来预测y,取决于我们感兴趣的问题。81对含二次式模型的进一步讨论对含二次式模型的进一步讨论u假如x的系数为正,x2的系数为负。u那么,y首先随x上升而上升,但最终转向随x上升而下降。12*12002x对于,转折点。82对含二次式模型的进一步讨论对含二次式模型的进一步
25、讨论u假如x的系数为负,x2的系数为正。u那么,y首先随x上升而下降,但最终转向随x上升而上升。12*121200200 x对于,转折点,与,时相同。83交叉项交叉项u 对于形式为y=0+1x1+2x2+3x1x2+u的模型,我们不能单独将1解释为关于x1,y变化的度量,我们需要将3也考虑进来,因为13 21,yxx84第七章 虚拟变量85 问题的引出问题的引出在前面讨论的回归模型中,所遇的变量均为定量变量(可直接测度、数值性),例如GDP,工资,收入、受教育年数,销售额等。在实际建模中,一些定性变量具有不可忽视的重要影响。例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营
26、、非私营)、地理位置(东、中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是定性描述的。在同时考虑定量和定性因素的条件下,依据现有的回归分析知识,如何对非定量因素进行回归分析?采用“虚拟变量”对定性变量进行量化一种思路。86u定量因素:可直接测度、数值性的因素。定量因素:可直接测度、数值性的因素。u定性因素:属性因素,表征某种属性存在与定性因素:属性因素,表征某种属性存在与否的非数值性的因素。否的非数值性的因素。u是否可将这些定性因素进行量化,以达到定是否可将这些定性因素进行量化,以达到定性因素能与定量因素有着相同作用之目的。性因素能与定量因素有着相同作
27、用之目的。定性与定量定性与定量87虚拟变量虚拟变量u 虚拟变量通常取值为1或0(其他取值方式?)u 例如:male(=1 如果为男性,0 其他),south(=1 如果在南方,0 其他),etc.u 或者称为二值变量(a binary variable)uWAGE1 female,married,nonwhite,south,etc.88注意注意dummy variable trapu如果既包含male,也包含femaleumale+female=1u多重共线性uEAST、MIDDLE、WEST?89虚拟变量与其他变量的交互作用虚拟变量与其他变量的交互作用u 也可以考虑虚拟变量(d)与其他连续
28、型变量(x)的交叉乘积 y=0+1d+1x+2d*x+u 如果 d=0,y=0+1x+u 如果 d=1,y=(0+1)+(1+2)x+uu 可以解释为斜率的变化90yxy=0+1xy=(0+0)+(1+1)x例如:0 0、1 0d=1d=091第八章 异方差92本章提要uOLS中异方差的影响中异方差的影响uOLS估计后估计后“对异方差稳健对异方差稳健”的统计推断的统计推断u检验异方差u加权最小二乘估计93什么是异方差u 同方差假定意味着条件于解释变量,不可观测误差的方差为常数u如果u 的方差随x变化,那么误差是异方差的。u 例子:估计教育回报并且能力不可观测,认为能力的方差随教育水平变化。94
29、当存在异方差时当存在异方差时uOLS无偏且一致uR平方和调整后的R平方仍可以很好地度量拟合优度。n它们是对总体R平方1 Var(u)/Var(y)的估计,其中的方差是总体中的“非条件”方差。n无论Var(u|x)=Var(y|x)是否依赖于x,它们都可以一致地估计总体R平方。95为何关心为何关心异方差异方差?u如果存在异方差,那么估计值的标准差是有偏的。u如果标准差有偏,我们就不能应用通常的t统计量或F统计量来进行统计推断。96怎么办?怎么办?u计量经济学家已经知道如何调整标准差,t,F,LM量,使得它们当未知形式的异方差存在时仍然有效。uWhite(1980)指出,在存在异方差时,方差 也是
30、可以估计的。()jVar97异方差存在时的方差异方差存在时的方差1122212221x.Var()/SSTiiiiixxixx uxxxxxVarSSTSSTxxss一个简单情况是,所以对于给定的,其中当同方差成立时退化为。98异方差存在时的方差异方差存在时的方差222White()OLS.iixjixxuSSTVaru指出,是的一个合适的估计量,其中是残差99异方差存在时的方差异方差存在时的方差222()jijijijjjVarr uSSRrxiSSR对于多元回归,当异方差存在时,的一个合适的估计量是,其中是将对其它解释变量回归时第 个观察值对应的残差,是辅助方程中的残差平方和。100异方差
31、存在时的方差异方差存在时的方差u开平方被称为n对异方差稳健的标准差,或nWhite标准差,或nHuber标准差,或nEicker 标准差222 ij ijr uSSR101检验异方差检验异方差u虽然我们有办法计算HSK稳健的t,F和LM统计量,我们仍然有理由去寻找可以识别异方差的简单检验。102检验异方差检验异方差u理由1:除非有证据显示异方差存在,我们仍会偏好于常规OLS的标准差及检验统计量。u理由2:如果异方差存在,OLS不再是BLUE,那么就有可能得到比OLS更好的估计量。103用用B-P检验检验异方差检验检验异方差u 本质上,我们想检验H0:Var(u|x1,x2,xk)=s2 这等价
32、于检验H0:E(u2|x1,x2,xk)=E(u2)=s2u如果我们假设u2 和xj之间具有线性关系,则可以通过一组线性约束来完成检验。u所以,对于 u2=0+1x1+k xk+v 这意味着检验 H0:1=2=k=0104用用B-P检验检验异方差检验检验异方差u在零假设下,通常可以假定误差v与x1,xk独立u那么,如果将u2视为被解释变量,检验全部解释变量显著性的F 或LM 统计量就可以用来检验异方差。u由于u2在样本中不是正态分布,这些统计量只在渐近的意义下适用。105用用B-P检验检验异方差检验检验异方差u不可观测的误差可以通过OLS残差进行估计。u将残差平方对所有的 x 回归之后,可以通
33、过R2构造F 或LM 检验。106用用B-P检验检验异方差检验检验异方差01 1201 121.y=.2.,.kkkkuxxuuuxxvR估计模型保存残差进行第二个回归保存107用用B-P检验检验异方差检验检验异方差22k,n-k-13.F/,(1)/(1)FuuRkFRnk计算 统计量在零假设下渐近服从分布108用用B-P检验检验异方差检验检验异方差224.LMLMLMukLMnRBreuschPagan或者,通过计算统计量,在零假设下,渐近服从。形式的检验通常称为异方差检验109用用B-P检验检验异方差检验检验异方差u如果我们怀疑HSK仅依赖与某些特定的解释变量,我们可以做一些调整:将第一
34、步的残差只对那些解释变量回归,并进行适当的F或LM检验。110用用White检验检验异方差检验检验异方差u B-P检验可以识别任意线性形式的异方差u White检验通过加入 x 的平方项和交叉项引入了一定的非线性。u仍然是用F和LM检验来检验xj,xj2,xjxh是否联合显著111用用White检验检验异方差检验检验异方差u这个办法很快就会显出其烦琐之处。u例如,如果我们有三个解释变量x1,x2,x3那么White检验有9个约束,三个线性项,三个平方项,三个交叉项。u在小样本情形,自由度将会随着解释变量数目增加而迅速减少。112White检验的变形检验的变形u考虑到OLS的预测值是所有x的函数
35、。u 因此,2是平方项和交叉项的函数。和 2可以用来替代所有的xj,xj2,xjxh113White检验的变形检验的变形u将残差平方对 和 2回归,用R2来构建F或LM统计量u现在只需要检验两个约束22012uyyv114对对HSK检验的最后评价检验的最后评价u即便真实的情况并无异方差,HSK检验可能由于重要变量的遗漏而错误的拒绝零假设。uHSK可能意味着模型设定错误,因此,如果可能的话,应当在HSK检验之前进行模型设定检验。115加权最小二乘法加权最小二乘法u对OLS估计稳健标准差总是能办到的,但是,如果我们知道一些关于异方差结构的信息,我们可以将原模型转化为具有同方差的新模型,这称为加权最
36、小二乘法。u在这些情况中,加权最小二乘法比OLS更为有效。对应的t 和 F 统计量具有t 和 F 分布。116异方差结构在比例意义上已知的情况异方差结构在比例意义上已知的情况u假设异方差可以由模型Var(ui|xi)=s2i=s2 hi刻画,其中hi=h(x)只依赖于可观测特征xu在这种情况下,定义并考虑转化后的模型是否服从Gauss-Markov假设。*iiu =u/ih117广义最小二乘法广义最小二乘法u 通过OLS估计变换后的方程可以作为广义最小二乘法(GLS)的一个例子u GLS在这种情形下为BLUEu GLS是加权最小二乘法(WLS)在权重为Var(ui|xi)倒数时的特例。118加
37、权最小二乘法加权最小二乘法u尽管对变换后的模型做OLS是直观的,但是变换本身可能很繁琐。u 加权最小二乘法可以完成相同的目的,但是不需要进行变换。u想法是最小化加权平方和(权重为1/hi)119关于关于 WLSu如果我们知道Var(ui|xi)的形式,WLS很棒u在大多数情况下,我们并不清楚异方差的形式120可行可行GLSu更典型的情形是你并不知道异方差的形式u此时,你需要估计h(xi)u通常,我们可以从一个非常灵活的方程形式入手u Var(u|x)=s2exp(0+1x1+kxk)u由于未知,我们必须对它进行估计。121可行可行GLS(cont)u我们的假定意味着 u2=s2exp(0+1x
38、1+kxk)v,其中E(v|x)=1.u ln(u2)=a0+1x1+kxk+eu 其中E(e)=1 且 e 独立于xu现在,我们知道 是u 的一个估计,所以我们可以通过OLS对其进行估计。122可行可行GLS(cont)u对h的估计可以通过=exp()得到,其倒数为我们的权重u那么,我们做了什么呢?u对原方程做OLS回归,保存残差,平方之,并取自然对数u将ln(2)对全部解释变量回归,得到预测值 u将1/exp()作为权重,做WLS123WLSu当在WLS后进行F检验时,通过无约束模型构造权重,并利用此权重做约束模型和无约束模型的WLS回归。u记住:我们只是用WLS来提高有效性,OLS仍然是
39、无偏且一致的。u 由于采样误差的存在,估计值可能不同,但是如果差异很大的话,有可能是因为GaussMarkov假定的其它假定不成立。124第十章第十章 时间序列初步时间序列初步125静态模型静态模型t01ttt01t2t3ttPhillips inf=+unem +umrdrte=+convrte+unem+yngmle +u静态曲线假定自然失业率不变,通胀预期固定;失业迅速影响当期的通胀谋杀案件的影响因素126FDL模型模型t00t1t-12t-2tt00t1t-12t-2tt00t1t-1qt-qtgfr=+pe pepe+ugfr1000pey=+z zz+uy=+z zz+uaa:每名
40、育龄妇女生育孩子数:税收豁免一般情形:127FDL 模型u把 0 称作即期乘数 反映了 y的当期变化u对于q阶FDL模型,假定z有一个短期的变化(只有一个时期),y将在q+1时期回到其初始水平u 把 0+1+q 称作长期乘数(LRP)反映了z的一个持久变化对 y 长期影响128无偏性假定无偏性假定u1、仍然假定模型关于参数线性:yt=0+1xt1+.+kxtk+utu 2、仍然需要零均值假定:E(ut|X)=0,t=1,2,n 注意:这意味着任一特定时期的误差项与所有时期的解释变量都无关129假定假定(continued)u 这一零均值假定意味着解释变量为严格外生u 一个与横截面数据情形下类似
41、的替代性假定:E(ut|xt)=0uX是同期外生u 同期外生只在大样本情形下有效130假定假定(continued)u 3、仍然要假定没有哪一个解释变量是常数,也不存在完全共线性u注意:没有做随机抽样的假定u 随机抽样假定的主要影响在于每一个ui 是独立的u 严格外生假定考虑到这一问题131OLS估计量的无偏性估计量的无偏性u 使用时间序列数据时,基于这 3 个假定,可以保证OLS 估计量是无偏的u 和横截面数据情形下一样,恰当的条件下 时间序列OLS 估计量也是无偏的u 对于省略变量造成的偏误,分析方法与横截面情形下相同。132OLS 的方差的方差u 正如横截面情形,为了简化推导估计量方差的
42、过程,需要添加同方差假定u4、假定:Var(ut|X)=Var(ut)=s2u从而,误差的方差独立与所有的x,而且在各个时期相同u 5、还需要假定不存在序列相关:Corr(ut,us|X)=0 for t s133OLS估计量的方差估计量的方差(continued)u 在这 5 个假定前提下,时间序列OLS估计量的与横截面情形下相同。即,us2 的估计值相同u OLS 仍然BLUEu 再增加一个正态误差假定,推断也是一样134OLS的样本方差的样本方差j2j2jtj2Gauss-Markov XVar()(1)SST x xj R-squared jjjSSTRRs在时间序列假定下,在条件下的
43、方差为:其中是的离差平方和,是 关于其他解释变量回归的。1352s的无偏估计22TS.1TS.5,SSR=n-k-1ss在假定成立的前提下估计量是的一个无偏估计量。136G A U S S-M A R K O V T H E O R E M u在假定TS.1TS.5成立的条件下,给定 X X,OLS是BLUE。137有趋势的时间序列有趋势的时间序列u 经济时间序列经常包含趋势u 仅仅因为2个序列共同包含趋势,不能将二者之间的联系确定为因果关系u 通常,两个序列之所以都包含时间趋势很可能是另外一个(观测不到的)因素的影响u 即便这类因素无法直接观测,通过直接考虑趋势也可以控制这些变量138在回归
44、模型中使用趋势变量在回归模型中使用趋势变量t01t12t23t ty=+x +x+u避免伪回归方法:在模型中加入趋势变量139消除趋势(Detrending)u 回归中加入线性时间趋势相当于在回归中时间序列消除趋势u 对序列消除趋势,需要对模型中每一个变量都关于t回归u残差形成了消除趋势的序列 u趋势被排除出去140消除趋势(continued)u 对数据直接消除趋势(与增加趋势变量相比)的优点在于计算拟合优度u时间序列回归通常具有很高的 R2u消除趋势之后的 R2 更好地反映了 xt对 yt的解释能力141季节影响季节影响u 通常,时间序列还呈现某种周期性,此处只讨论季节性u 例如:零售业的季度数据通常在第四季度(相对于前三季度)攀升u 可以通过增加一系列反映季节变化的虚拟变量对季节影响进行处理u如同对趋势的处理,可以先对序列进行趋势调整,然后再进行回归
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。