1、第二章 标准线性回归模型(2)1、控制变量的思想n多元模型中每个变量的回归系数,可以理解为在模型中其他解释变量所代表的因素保持不变的情况下,该变量对被解释变量的影响这就是所谓的控制1、控制变量n被解释变量n解释变量n控制变量1、控制变量1、控制变量n条件收敛的验证 一般认为经济增长具有收敛性,即落后国家(人均GDP较低)会比先进国家(人均GDP较高)具有更高的GDP增长率,但实证分析的结果并不支持此种观点,所以有学者提出条件收敛的概念,即增长率的高低取决于一个国家或地区实际增长水平与稳态增长水平之间的差距,而非仅仅由实际增长水平决定。差距越大,平均增长率会越高,反之则较低。条件收敛理论意味着:
2、如果两国有相同的稳态增长水平,落后国家会具有较高的增长率。1、控制变量n如果控制了不该控制的变量,如该变量和核心解释变量高度相关,或具有因果关系,则也会影响估计的可靠性2、因果分析的方法n相关不是因果 有因果的关系可以不相关 无因果的关系可以表现出相关2、因果分析的方法n回归模型只具有相关意义,不具有因果意义 吸烟吸烟 肺癌肺癌 某种基因某种基因 2、因果分析的方法6、因果分析的方法患癌症患癌症未患癌症未患癌症吸吸 烟烟4060不吸烟不吸烟2080女性女性男性男性患癌症患癌症未患癌症未患癌症患癌症患癌症未患癌症未患癌症吸吸 烟烟060400不吸烟不吸烟080200Granger检验n检验要求估
3、计如下回归tqjjtjqiitittpjjtjpiitituYXXuYXY211111 11212nntntXUYUYGranger检验n检验统计量)中待估参数的个数。为无约束回归(为滞后项的个数,平方和;的滞后项的回归的残差的滞后项和为包括了平方和;的滞后项的回归的残差对为urkpYXSSRYYSSRkn/SSRp/SSRSSRFurrururrGranger检验n3点注意:1、在检验之前,要先保证序列的平稳性,或者具有协整关系;2、控制变量问题3、检验结果对滞后长度敏感。Granger检验nGranger检验 Granger检验经常用来判断两个变量的因果关系,其基本思想是,如果X为Y的原因
4、,则X的发生应该在前,应该可以通过X预测Y,所以Granger检验是通过检验可预测性来推断因果关系 本质上Granger检验不是因果检验2、因果分析的方法n有学者引入图模型(graphical model)理论研究该问题n有向非循环图(directed acyclic graphs,DAG)3、解释变量之间的关系因变量自变量1自变量2自变量33、解释变量之间的关系因变量自变量1自变量2自变量33、解释变量之间的关系n解释变量(explanatory variables)vs 控制变量(control variables)n中介变量(mediator)vs 调节变量(moderator)3、解释
5、变量之间的关系n调节变量因变量自变量1自变量23、解释变量之间的关系n中介变量因变量自变量1自变量2调节效应的检验设交互项检验调节效应 适用于解释变量X1对于被解释变量Y的边际影响取决于解释变量X2的水平的情况uomotioniceomotioniceDemandPrPrPrPr321003调节效应的检验n假说:“若行业的平均规模越大,则更高的银行集中度有利于该行业的发展,若行业以中小企业为主,则更低的银行集中度有利于该行业的发展”n人口密度高的地区,交通设施对信任的影响要比人口密度低的地区大n教育对于经济体吸收新技术的能力具有积极效应,因此,平均教育年限越长的国家,经济由初始水平收敛到均衡水
6、平的速度越快调节效应的检验中介变量的检验方法n中介变量的检验方法 32121uMXYuXMuXY中介变量的检验方法n方法1 0 101:HuXY,则为完全中介不再显著不为且显著不为如果:00031220321HuMXY0)2(02:HuXM中介变量的检验方法n方法2 222222222200szsssSobelH检验:中介变量的检验方法n方法3 010:H1111stsrsXM中介变量的检验方法n群体效能感在团队组织氛围与团队有效性之间充当中介变量,即团队组织氛围通过提升或降低群体效能感来影响团队的有效性。n工作满意度是个人组织匹配影响离职倾向的中介变量;工作满意度是组织支持感影响离职倾向的中
7、介变量4.函数的设定n常用手段:1)增设二次项 适用于解释变量X对于被解释变量Y的边际影响取决于解释变量X的水平的情况 uentAdvertisementAdvertisemDemand22104.函数的设定 0,0214.函数的设定0,021 4.函数的设定n民主与增长的关系:当民主水平很低时,提高民主可以限制政府权力的过度使用,从而促进增长;而当民主水平较高时,进一步提高民主程度,反而会因过度关注公平而影响效率,从而抑制增长。n库兹涅兹曲线(环境库兹涅兹曲线EKC)4.函数的设定人均GDP人均净对外直接投资4.函数的设定2)设滞后项 存在1期的滞后影响 uentAdvertisementA
8、dvertisemDemandtt12104.函数的设定3)部分变量取非线性形式 uGradeentAdvertisemomotioniceDemandlnPrPr4321001234exp(Pr)PrDemandiceomotionAdvertisementGradeu5.变量变换取对数n取对数的好处n如果因变量、自变量都取对数,参数具有弹性含义n经过对数变换的变量,一般更加符合假设条件n可以缩小取值范围,减少异常值的影响n什么时候取对数n变量之间为相乘关系(双对数),或具有某种非线性关系(单对数)n那些取值为正的右偏分布变量5.变量变换取对数n取对数的陷阱 取对数后,为获得原变量的估计,往
9、往需要取指数进行还原,此时的估计会出现系统偏差。5.变量变换取对数uGradeentAdvertisemomotioniceDemand43210PrPr)ln(uEGradeentAdvertisemomotioniceXDemandEexpPrPrexp43210 2expexp2uE的低估进行拟合,将出现系统用DemandDemandn lexpYYn lexp2exp2正确的公式:5.变量变换取对数n如果u不服从正态分布,则调整程序如下:1)得到lnY的拟合值2)对每个拟合值取指数,得到mi3)做Y对mi的过原点回归,得到回归系数4)将此系数乘以mi,得到最终拟合值6.常遭忽略的两个问
10、题1)把函数当作确定关系处理,遗忘了随机项uGradeentAdvertisemomotioniceDemand)ln()ln()ln(Pr)ln(Pr)ln(4321043210PrPrGAomotioniceeD ueGAomotioniceeD43210PrPruGAomotioniceeD43210PrPr2,1Nu也存在问题 存在干扰不对称问题6.常遭忽略的两个问题2)过原点回归具有一些特殊的性质n残差的均值不等于0nR2有可能为负,一般需要调整n如果总体回归函数中截距项非0,则斜率估计是有偏的7.模型的评价n经济显著与统计显著 经济显著是指自变量的改变对因变量有较大的影响;统计显著
11、是指有充分证据证明回归系数不为0(一般情况下);n对于参数是否为0的检验:经济显著性越强,则在统计上越容易显著;在小样本下,经济显著而统计不显著的情况容易出现;在大样本下,统计显著而经济不显著的情况容易出现;7.模型的评价n分析系数的符号、取值是否与理论预期相一致,是评价模型的关键环节。如果出现不一致,首先怀疑模型与数据,如确无问题,再怀疑理论。n对于线性模型,主要观察正负号。7.模型的评价n对于非线性模型(包括对变量非线性和对参数非线性),情况要比较复杂,有时系数符号以及其他约束条件的预期到底是什么,并非一望可知,需要根据理论推出。7.模型的评价例1:总成本函数的估计 TC Q C uQQQ
12、TC33221000,00TCQ232132QQMC00,01MCQ003件:二阶导大于二次函数有极小值的条03/232取最小值,当MCQ7.模型的评价nMC要大于0,不能和X轴有交点:312231222312404 acb7.模型的评价n例2:洛伦兹曲线的估计 L 收入者累计比重 F 00.20.40.60.8100.20.40.60.81收入累计比重 P O D cFbFaFL23baccbaLF111,11,0012302baFbabFaF则一阶导大于031000260baFbFbaF二阶导大于7.模型的评价a 判定系数R2或修正R2YYXXXYXYXYXXXYYYXYiiiiiiLLL
13、LLLLLLYYYYYYYYYYR21222222)()()()()(7.模型的评价a 判定系数R2或修正R2111111121/122222222knnRnSST1-k-nSSRRnSSTE-nSSRERnSSTnSSRRYY总体7.模型的评价n修正R2的主要优点在于:它为在一个模型中随意增加自变量施加了惩罚,当自由度过小时,该指标会非常小,而R2则往往很大。7.模型的评价n对于拟合优度,没有一个标准来说明,拟合优度小到什么程度,就是不可接受的,对于时序数据而言,R2大于0.9也很正常,对于截面数据而言,R2等于0.5也不算小n当在自变量数目不同的模型间进行选择时,修正R2更适合作为选择标准
14、7.模型的评价n帽子矩阵(hat matrix)寻找杠杆点XXjiijnjjijnjjXXjinjjXXjjiiiilXXXXnhYhYlXXXXYnlYXXXXYXXYXY111111107.模型的评价n帽子矩阵对角线上的点称为杠杆率,在高杠杆率的位置如果出现异常的Y值,将对拟合产生严重的影响。7.模型的评价nPRESS预测误差平方和,用以判断交叉有效性nCooks D 反映删除一个观测值对参数估计的影响8.联合假设检验n不仅可以检验全部回归系数全为0,和某个系数为0,还可以检验某几个系数是否全为0。uentAdvertisementAdvertisemDemand2210 upromoti
15、onentadvertisemDemand2108.联合假设检验0;0:210HuGradeomotioniceDemand5430PrPruGradeomotioniceentAdvertisementAdvertisemDemand5432210PrPr不受约束模型受约束模型8.联合假设检验n如果p值很小,则可以拒绝原假设1/knSSRqSSRSSRFururr8.联合假设检验n该检验实际检验了两个线性约束,所以称为联合假设检验n类似的思想也可以用于检验各种线性约束(如果只检验一个约束,不称为联合检验)如:121218.联合假设检验n例ulationerestinvestmentulati
16、onerestinvestmentinfintinfint102100210:H8.联合假设检验n研究地区差异的影响,设置多个地区变量,如果每个都不显著,可对之进行联合检验,以判断地区因素是否存在影响9.经济解释n基本含义:nX增加1个单位,Y将平均增加 个单位iiXY1019.经济解释n取对数以后的解释 XYlnln10XdXYdYXdXYdY111X增加1%,Y将增加%。n双对数模型应用非常广泛,其优点是:n参数具有弹性含义(可用来估计常弹性)n经过对数变换的变量,一般更加符合假设条件n可以缩小取值范围,减少异常值的影响9.经济解释9.经济解释nX增加1%,Y将增加 。XYln10XXYX
17、dXdY11101.09.经济解释XY10)ln(XYYdXYdY11X增加1个单位,Y将增加%10019.经济解释n在解释时,要考虑计量单位010121211XwYwXwwXYYXwwXwXXXXYYXXlliiiiiiiiXXXY9、多元模型的解释n基本解释 的含义是在X2不变的情况下,X1增加1个单位,Y将平均增加 个单位;的含义是在X1不变的情况下,X2增加1个单位,Y将平均增加 个单位22110XXY11229、多元模型的解释n更加复杂的情况n要通过计算导数研究212110212110XXXYXXY221112112XXYXdXdY9、多元模型的解释22110XXY2121XYX的影响超过对,是否意味着大于如果v比较不同变量影响程度的方法有二:计算弹性标准化数据9.系数的解释uGradeentAdvertisemomotionomotioniceDemand5423210PrPrPr)ln(111100%100%YXYdXYdY 1exp100%1exp100%1exp1exp/lnln11100101101YXYXYYYXYYXYY近似结果精确结果