1、第第8章:面板数据分析方法章:面板数据分析方法大纲大纲1.什么是面板数据,面板数据信息来源及面板数据分析方法的直观理解2.面板数据分析三种常见模型3.固定效用模型估计方法4.面板数据分析实例什么是面板数据,面板数据信息来源什么是面板数据,面板数据信息来源,面板数据估面板数据估计方法的直观理解计方法的直观理解什么是面板数据什么是面板数据?面板数据(面板数据(Panel DataPanel Data)是包含多个个体,并且同一个体有一系列不同时间观测点的数据。公司财务数据高管薪酬数据分析师预测数据 基金数据面板数据同时包含了横截面和时间序列两个维度的数据:个体维度(i=1,2,N)和时间维度(t=1
2、,2,T)。4一个面板数据例子一个面板数据例子IDYEARINCEDUAGEGENDER12017800323112018100042411201912005251220171200530022018125063102201913007320合并横截面数据合并横截面数据合并横截面数据合并横截面数据(pooled cross-sectional dataset)和面板数据的差异在于它并没有跟踪记录同一个个体。它只是多年横截面数据的简单叠加。YEARINCEDUAGEGENDER201780032312018100042412019120052512017120053002018125063102
3、01913007320面板数据分类面板数据分类(1)(1)短面板短面板:N比较大,T比较小长面板长面板:N很小,T很大大面板大面板:N比较大,T也较大面板数据分类面板数据分类(2)(2)平衡面板平衡面板:对于每个个体,它们都有相同时间T的观测点。非平衡面板非平衡面板:对于每个个体,没有相同时间T的观测点。如果非平衡面板数据缺失是由于随机原因造成的,它和平衡面板的处理方法并没有区别。如果数据缺失是由于非随机原因造成的,我们必须考虑缺失的原因。面板数据的信息来源面板数据的信息来源面板数据里变量的总方差可以分解为个体间方差和个体内方差(也称为组间方差和组内方差):总方差(Total Variatio
4、n)=个体间方差(Between Variation)+个体内方差(Within Variation)22111()1NToititsXXNT 2211()1NBiisXXN22111()1NTwitiitsXXNT 样本总方差:样本个体间方差:样本个体内方差:面板数据因果关系分析的直观理解面板数据因果关系分析的直观理解面板数据因果关系分析的直观理解面板数据因果关系分析的直观理解面板数据因果关系分析的直观理解面板数据因果关系分析的直观理解面板数据分析三种常见模型面板数据分析三种常见模型面板数据分析的三种常见模型面板数据分析的三种常见模型合并横截面模型(合并横截面模型(Pooled Cross
5、Sectional ModelPooled Cross Sectional Model)随机效应模型(随机效应模型(RandomRandom Effects Model Effects Model)随机效应模型(随机效应模型(RandomRandom Effects Model Effects Model)2,22(,)(,)i ti t siitiit sucorr eecorruu固定效应模型固定效应模型 (Fixed Effects Model)Fixed Effects Model)固定效应模型固定效应模型固定效用模型估计方法固定效用模型估计方法固定效应模型的估计固定效应模型的估计个体
6、内差分估计法个体内差分估计法去除个体均值后,公式里不存在造成和解释变量相关的固定效应,可以直接用OLS估计。换而言之,去除个体均值后的数据,已经“控制”掉了个体效用。iiiiiYXZu对每个变量取个体平均值得到()()itiitiitiYYXXuuitititYXu两式相减得到个体内差分估计法个体内差分估计法个体内差分估计法个体内差分估计法最最小二乘虚拟变量估计法(小二乘虚拟变量估计法(LSDVLSDV,Least Square Dummy Least Square Dummy Variable EstimatorVariable Estimator)11.ititiiiNNitYXZDDDu
7、 最小二乘虚拟变量估计法最小二乘虚拟变量估计法 (LSDV)(LSDV)121122ititiitINCEDUGENDERDDuIDYearINCEDUGENDERD1D2120178003110120181000411012019120051102201712005001220181250600122019130070011NititiitiiYXdDu最小二乘虚拟变量估计法最小二乘虚拟变量估计法vs.vs.组内差分法组内差分法LSDVLSDV法和组内差分估计法得到的结果是完全一样的。可以通过法和组内差分估计法得到的结果是完全一样的。可以通过图形直观理解:图形直观理解:28YiXiDi123
8、4567一阶差分估计法(一阶差分估计法(First Difference EstimatorFirst Difference Estimator)ititiitYXdu-1-1-1ititiitYXdu1,1,1()iiitititi titi tduuYYXXdititituYX 两式相减,得到:时间固定效应时间固定效应个体固定效应的估计控制了个体不随时间变化的变量。类似的,通过引入时间固定效应,可以控制在同一时间不随个体变化的因素(例如每年的宏观经济因素),也称为双向固定效应。由于时间点通常不多,可以引入时间虚拟变量在回归方程中控制年固定效应,模型为:ititititYXdu2Tititi
9、t tittYXdTu面板数据分析实例面板数据分析实例税法改革对企业经营业绩的影响税法改革对企业经营业绩的影响税法改革对企业经营业绩的影响税法改革对企业经营业绩的影响企业1和2省A在2014年进行了税法改革,企业3和4所在省B没有企业4企业3企业2企业1EFABCD55.566.577.5企业业绩指标:Tobins Q20102011201220132014201520162017年没受税改影响受税改影响企业4企业3企业2企业1EFABCD55.566.577.5企业业绩指标:Tobins Q20102011201220132014201520162017年没受税改影响受税改影响T(after
10、)T(before)C(before)C(after)受税改影响企业和未受影响企业税改前后平均业绩受税改影响企业和未受影响企业税改前后平均业绩平均业绩2010-2013年2014-2017年处置组受税改影响企业(和)T(before)=6.78T(after)=7.35控制组为受税改影响企业(和)C(before)=5.78C(after)=5.95处置组和控制组的差异T(before)-C(before)=1T(after)-C(after)=1.4简单横截面回归简单横截面回归简单横截面回归简单横截面回归企业4企业3企业2企业1EFABCD55.566.577.5企业业绩指标:Tobins
11、Q20102011201220132014201520162017年没受税改影响受税改影响合并横截面回归合并横截面回归固定效应模型固定效应模型LSDVLSDV估计估计固定效应模型固定效应模型LSDVLSDV估计估计具体回归结果如下所示:.tabulate id,gen(firm)/*根据id 产生虚拟变量*/.regress q tax firm1-firm4,noconstant/*LSDV回归,nonconstantnonconstant设置没有共同截距设置没有共同截距*/Source|SS df MS Number of obs =32-+-F(5,27)=44635.78 Model|
12、1352.2988 5 270.45976 Prob F =0.0000 Residual|.1636 27 .006059259 R-squared =0.9999-+-Adj R-squared =0.9999 Total|1352.4624 32 42.26445 Root MSE =.07784-q|Coef.Std.Err.t P|t|95%Conf.Interval-+-tax|.57 .0389206 14.65 0.000 .4901415 .6498585 firm1|7.03 .0337062 208.57 0.000 6.96084 7.09916 firm2|6.53
13、.0337062 193.73 0.000 6.46084 6.59916 firm3|6.115 .027521 222.19 0.000 6.058531 6.171469 firm4|5.615 .027521 204.03 0.000 5.558531 5.671469-四个虚拟变量的系数代表各个企业的个体固定效应。它反映了在没有税改情况下,每个企业业绩的平均差异。固定效应模型个体内估计(固定效应模型个体内估计(WinthinWinthin Estimator)Estimator)手动进行固定效应模型个体内估计手动进行固定效应模型个体内估计:.egen mq=mean(q),by(id
14、)/*按id,生成组q均值*/.egen mtax=mean(tax),by(id)/*按id,生成组tax均值*/.generate within_q=q-mq/*对q进行去组均值转换*/.generate within_tax=tax-mtax/*对tax进行去组均值转换*/.regreg within_qwithin_q within_tax,noconstantwithin_tax,noconstant /*将转换后的将转换后的q q和和taxtax做回归做回归,nonconstantnonconstant设设置没有共同截距置没有共同截距*/Source|SS df MS Number
15、 of obs =32-+-F(1,31)=246.26 Model|1.29959997 1 1.29959997 Prob F =0.0000 Residual|.163599998 31 .005277419 R-squared =0.8882-+-Adj R-squared =0.8846 Total|1.46319997 32 .045724999 Root MSE =.07265-within_q|Coef.Std.Err.t P|t|95%Conf.Interval-+-within_tax|.57 .0363229 15.69 0.000 .4959189 .6440811-固
16、定效应模型个体内估计(固定效应模型个体内估计(WinthinWinthin Estimator)Estimator)直接使用直接使用STATASTATA的的xtregxtreg,fefe命令命令,结果如下.tsset id year/*将数据设为面板,id为个体维度,year为时间维度*/panel variable:id(strongly balanced)time variable:year,2010 to 2017 delta:1 unit.xtreg q tax,fe/*使用STATA的固定效应模型估计命令*/Fixed-effects(within)regression Number
17、 of obs =32Group variable:id Number of groups =4 R-sq:Obs per group:within =0.8882 min=8 between=0.8521 avg=8.0 overall=0.5576 max=8 F(1,27)=214.48corr(u_i,Xb)=0.5066 Prob F =0.0000-q|Coef.Std.Err.t P|t|95%Conf.Interval-+-tax|.57 .0389206 14.65 0.000 .4901415 .6498585 _cons|6.3225 .0168531 375.15 0.
18、000 6.28792 6.35708-+-sigma_u|.6020036 sigma_e|.07784124 rho|.98355552 (fraction of variance due to u_i)-F test that all u_i=0:F(3,27)=355.67 Prob F=0.0000 得到变量tax的系数为0.57,和LSDV结果一致固定效应模型固定效应模型R R2 2一阶差分模型(一阶差分模型(FDFD)回归估计)回归估计纳入时间固定效应纳入时间固定效应纳入时间固定效应纳入时间固定效应运用常见问题运用常见问题使用固定效应模型后,变量系数和显著性通常会发生变化,使用固定效应模型后,变量系数和显著性通常会发生变化,如何理解这些变化如何理解这些变化?当使用固定效应模型后,有些变量系数变为不显著,是否就当使用固定效应模型后,有些变量系数变为不显著,是否就意味着该变量和被解释变量没有因果关系?意味着该变量和被解释变量没有因果关系?