1、 问题和动机问题和动机 遗漏重要变量或有明确的非观测效应遗漏重要变量或有明确的非观测效应 动态效应动态效应 原理原理 离差消除不可观测效应离差消除不可观测效应 综合利用截面和时间序列信息综合利用截面和时间序列信息 方法方法 例子例子第八章第八章 面板数据模型(面板数据模型(Panel Data)一面板数据定义一面板数据定义 面板数据是同时在时间和截面空间上取得的二维数据。面板数据是同时在时间和截面空间上取得的二维数据。面板数据从横截面上看,是由若干个体在某一时刻构面板数据从横截面上看,是由若干个体在某一时刻构成的截面观测值,从纵剖面上看是一个时间序列。成的截面观测值,从纵剖面上看是一个时间序列
2、。面板数据用双下标变量表示。面板数据用双下标变量表示。例如例如 Yi t,i=1,2,n;t=1,2,Tn 表示面板数据中含有表示面板数据中含有n个个体。个个体。T 表示时间序列的表示时间序列的最大长度。若固定最大长度。若固定t不变,不变,Yi.,(i=1,2,n)是横是横截面上的截面上的n个随机变量;若固定个随机变量;若固定i不变,不变,Y.t 是纵剖面是纵剖面上的上的一一个时间序列。个时间序列。基本模型基本模型1,.n;1,.ititititTYX横截面对横截面对Y的干扰的干扰混合影响混合影响,itititiiiitititititiYXWYXW:截距项随机的模型可以改写为其中随机效应模型
3、(随机效应模型(Random Effect)固定效应模型固定效应模型(Fixed Effect或或 LSDV)(1)(2),ititiitiiittYX截距项模型模型非随机的由截距项体现个体差异由截距项体现个体差异二二.固定效应模型固定效应模型(1)(2),ititiitiiittYX截距项模型模型非随机的对模型(对模型(1 1)*)()(itiitktkXXYEXE YX当时从不同的个体来看()()itktikE YE Y不同个体的差异与不同个体的差异与 t 无关无关对同一个个体:对同一个个体:()()0itisiiE YE Y同一个体在不同时期没有差异。同一个体在不同时期没有差异。对模型(
4、对模型(2 2)*)()(itiittktktXXYEXE YX当时从不同的个体来看()()itktikE YE Y不同个体的差异与不同个体的差异与 t 无关无关对同一个体不同时期:对同一个体不同时期:()()itistsE YE Y同一个体在不同时期有差异。同一个体在不同时期有差异。()()()(itkskitsE YE Y对不同个体不同时期:对不同个体不同时期:不同个体不同时期有差异。不同个体不同时期有差异。2()()(,)00aritititksikVECovts 1.关于关于it2.对固定效应的模型(对固定效应的模型(1)设定和估计)设定和估计ititiitYX(1)设定()设定(不含
5、截距项,引进不含截距项,引进n个虚拟变量)个虚拟变量)11.itititnitnitYDDX10itkikDik(2)估计)估计 OLS,ML 估计(只要满足古典假设)估计(只要满足古典假设)Y D1 D2 Dn X OLS 分块估计(克服分块估计(克服n 太大)太大)思路:先估计思路:先估计()(ititititititYXYXititiitYXiitititYX得得.2.()()()ititiiititiitXYXYXX 再估计再估计i.iiiYX方差的估计量为:方差的估计量为:2.2()(1)itiitntnee(3)设定检验)设定检验0121:.:nHH至少有一个不等基本模型基本模型固
6、定影响模型固定影响模型线性约束检验(有线性约束检验(有n-1个约束方程)个约束方程)1(1)/nntne ee eFe e基固固00(1,1),(1,1),nntnnntnFFHFFH若拒若接不选基本模型不选基本模型不拒基本模型不拒基本模型注:对含截距项模型,设定时引进注:对含截距项模型,设定时引进n-1个虚拟变量。个虚拟变量。22.itititnitnitYDDX3.对固定效应的模型(对固定效应的模型(2)设定和估计)设定和估计ititiittYX(1)设定()设定(不含截距项,引进不含截距项,引进nT-1个虚拟变量)个虚拟变量)1212.itititnititTitnitTYDDHHX10
7、itkikDik10itstsHts含截距项,引进含截距项,引进nT-2个虚拟变量个虚拟变量:2222.itititnnititTititTYDDHHX(2)估计)估计 OLS,ML 估计(只要满足古典假设)估计(只要满足古典假设)分块估计分块估计(3)设定检验)设定检验(不含截距项不含截距项)012:.023.nTH 若接受,则选基本模型若接受,则选基本模型说明:说明:用模型(用模型(2)比较少。因为引进变量太多,)比较少。因为引进变量太多,参数估计太多,自由度减少。一般刻画时间上的参数估计太多,自由度减少。一般刻画时间上的 差异时直接引进差异时直接引进 t。,itititiiiititit
8、ititiYXWYXW:截距项随机的模型可以改写为其中三三.随机效应模型(随机效应模型(Random Effect)1.模型模型2.假定假定2()0()(,)()0iiikikiikEVarCovEX 与回归量 无关2()0()(,)()0iititksitksitikksEVarCovEX 与回归量 无关(,)0,ititiiCov无关222()02()(,)()0(,)()()itititksitksitisitisitikwEVar wE wCov w ww wECov w ww wE关于关于wit的假定:的假定:不同个体无自相关;同一个个体有自相关。不同个体无自相关;同一个个体有自相关
9、。3.估计方法估计方法OLS,GLS,FGLS,ML等等下面利用下面利用OLS介绍单位间估计和单位内估计介绍单位间估计和单位内估计 Between estimator和和within estimator1.OLS1.OLS估计量估计量1)(bttXYXXSS()()tititXXSXXXX 其中()()tititXYSXYXY 1 1ititXn TX 1 1ititYn TY 2.2.分解分解(1 1)单位内估计)单位内估计1)(bwwwXYXXSSitititiuYX.iiiiuYX.)()(ititiiiitXYYX用用.()()wititXXiiSXXXX 其中.()()wititXY
10、iiSXXXY 22.()itinTnkee 2.2.分解(续)分解(续)(2 2)单位间估计)单位间估计itititiuYX.iiiiuYX用用1)(bbbbXYXXSS.()()bXXiiiST XXXX其中*2nke e.()()bXYiiiST XYXY(3 3)单位内估计和单位间估计的关系)单位内估计和单位间估计的关系tWbXXXXXXSSStWbXYXYXYSSS()twbwbwbbbbFFFFI1()wbwwXXXXXXSSSF1()wbbbXXXXXXSSSF 被解释变量被解释变量:消费支出消费支出y 单位:元单位:元解释变量解释变量:纯收入纯收入x 单位:元单位:元一一、模型
11、设定、模型设定例:例:模型形式:模型形式:itititxyititiitxyititiitxuy二、二、样本样本选自中国农业统计年鉴。选自中国农业统计年鉴。各地区农村居民平均每人年生活消费支出及纯收入各地区农村居民平均每人年生活消费支出及纯收入调用数据库调用数据库Panel data3.模型结果展示:模型结果展示:4.结果分析结果分析 从简单回归结果看,从简单回归结果看,2R=0.9279,样本拟合优度很高。T统计量=18.29大于临界值16.2)13(025.0t,变量显著。F统计量=334.4,大于临界值 22.4)26,1(05.0F说明方程显著成立。从固定影响模型检验结果看,从固定影响
12、模型检验结果看,拒绝假设,即不选基本模型。拒绝假设,即不选基本模型。从随机影响模型检验结果看,从随机影响模型检验结果看,假设假设0H:个体影响与回归量无关:个体影响与回归量无关 接受假设,不选固定影响模型,选随机影响模型合适。接受假设,不选固定影响模型,选随机影响模型合适。5.经济分析经济分析根据随机影响模型回归结果进行简单的边际分析。根据随机影响模型回归结果进行简单的边际分析。模型为:模型为:y=-192.43+0.79x我国农村居民人均纯收入每增加一元,我国农村居民人均纯收入每增加一元,人均消费将增加人均消费将增加0.79元。元。Stata的应用有关命令XtdesXtsumXttabXtreg(Xtreg,fe和Xi:reg)XtdataXtivreg