1、A1动态因子模型动态因子模型DFMs2010年1月;2010年5月7日修订 James H.Stock;Mark W.Watson*A2目录二二 因子的估计因子的估计三三 因子数量的决定因子数量的决定一一 引言引言四四 被估计因子的应用被估计因子的应用五五 选择性拓展选择性拓展A3:宏观计量经济学家面临 一个特有的数据结构:一方面,可靠和相关数据的年份数量是有限制的,且不能很容易地增长。另一方面,战后很长时间内,统计局收集了很多相关数据,包括宏观经济,金融,有关经济领域内变量的月度和季度数据。因此,宏观经济学家面临的数据集:成百上千个序列,但每个序列观察的数量相当少(例如20至40年的季度数据
2、)。A4DFMs:背景背景:最初由Geweke(1977)提出,作为以前由横截面数据发展而来的因子模型的一个时间序列扩展。早期影响力作品中,Sargent and Sims(1977),有两个动态因子能够解释大部分美国重要的宏观经济季度变量的方差,例如产量,就业和价格。Giannone,Reichlin,and Sala(2004)and Watson(2004),一个因子能够解释宏观经济序列的大部分方差,这一主要的经验主义发现已被许多研究所证实。在过去几十年得到很大注意力,因为它能够模拟序列数量大于时间观测数量的数据集的同时性和一致性。目的目的:在现有的DFMs著作中,所描述的在某种程度上具
3、体足以用于使研究者创新于此领域,关键的理论结果,应用和经验主义的发现。Bai and Ng(2008)和Stock and Watson(2006)对这个作品提供了补充性的调查。Bai and Ng(2008)比这个更有技术性,并且更专注于计量经济学的理论和条件;Stock and Watson(2006)关注在DFM基础上的预测,它是在许多预测者使用的其他方法背景下进行的。A5DFMs:前提前提:一些潜在的动态因子 ,联动于一个时间序列变量构成的高维向量 ,也被一个均值为零的特殊干扰向量 所影响。这些特殊干扰是由测量误差和特定于单个序列的特殊性质所引起的(例 如,沙门氏菌恐慌对餐厅就业的影响
4、)。这些潜在的因子,遵循一定的时间序列过程,一般认为是一个向量自回归过程(VAR)。A6DFMs:动态因子模型用方程式表示为:动态因子模型用方程式表示为:这里有N个序列,所以 和 为N1阶;有q个动态因子,所以 和 为q1阶;L为滞后算子,且滞后多项式矩阵(L)和(L)分别为Nq阶和qq阶。第i个滞后多项式 是第i个序列所加载的动态因子,和 是第i个序列的主成分。我们假定(1)和(2)中所有的过程都是固定的(不固定的情况在本章最后部分讨论)。特殊干扰被假定与前后的创新因素是不相关的,即,对于所有的k,。在所谓精确的动态因子模型中,特殊干扰被假定为在前后步中是不相关的,即,对于所有的s,,如果i
5、j。A7DFMs:考虑DFMs的一个重要的动机是:如果已知因子 ,且 是高斯的,我们就能对一个单独的变量做出有效的预测,运用到滞后因素和变量滞后性的总 体回归。于是,预测者只运用q个因子就能从所有N变量中得到好处,这里q远远小于N。特别地,在方差损失下,第i个变量的最理想的向前一步预测为:这里第三行根据等式(2),最后一行根据(1)和精确的DFM假设。于是,有效总体预测回归的维数不会随着系统变量的增加而增加。于是,有效总体预测回归的维数不会随着系统变量的增加而增加。A8 计量经济学家将会考虑的第一个问题:估计因子(或更精确的说,判断因子的跨越空间)和确定有多少因子。第2和第3部分 一旦有了这些
6、因子的可靠估计量,不仅仅是用来预测,而且把它们作为工具变量,估计因子增广向量自回归(FAVARs)和估计动态随机一般均衡模型(DSGEs)。第4部分 第5部分会讨论一些拓展。A9二二 因子估计因子估计 Geweke(1977)和Sargent and Sims(1977)开创性的工作是用频域分析方法来寻找动态因子结构的迹象和预测因子的重要程度。然而,那些方法不能够直接估计 ,因此也不能用于预测。后来的DFMs工作针对时域分析方法时域分析方法,这时 能够直接被估计。A10DFMs的时域估计研究分为三个阶段 第一阶段:低维(N很小)参数模型 运用高斯最大似然估计法(MLE)和卡尔曼滤波。这种方法提
7、供了在模型假设和参数下f的最佳估计量(和最佳预测值)。然而,那些参数的估计必须包括非线性的优化,这种优化有限制参数数量的作用,从而限制能够被处理,运用的序列数量。A11 第二阶段:大N的非参数估计 运用横截面平均方法,主要是主成分和相关分析方法。第二阶段的关键结果是因子拓展空间的主成分估计量是一致的,此外,如果N充分大,因子被精确的估计其精确度足以使其作为后面回归的数据。A12 第三阶段:运用因子的一致非参数估计量来估计第一阶段中状态空间模型的参数,从而解决第一阶段模型中相关的维度问题。在状态空间模型中,许多参数未知的问题解决办法是运用贝叶斯方法,即,用优先和整合取代最大化,一小部分论文用到这
8、种解决方法,它同时还用到第二和第三阶段的(传统的)估计量。A13 注意注意:这一部分中所有方法都假设数据已消除单位根和其趋势。代表性地,通过区分所需的序列,然后标准化不同的序列来完成;例如,一个典型的元素X可能为一个真实活动预测量的某一阶段增长率,它被标准化为零均值和单位标准偏差。A142.1 第一阶段:时域最大似然法,通过卡尔曼滤波第一阶段:时域最大似然法,通过卡尔曼滤波 Engle and Watson(1981,1983),Stock and Watson(1989),Sargent(1989),and Quah and Sargent(1993):早期的动态因子模型的时间域估计用卡尔曼
9、滤波来估算高斯似然,用最大似然法来估计参数,然后用卡尔曼滤波和滤波器得到因子有效估计。A15把DFM写成一个线性状态空间模型。令p作为滞后多项式矩阵(L)的维度 ,表示一个r1维向量,令 ,这里 为第i个滞后矩阵(L)的Nq维系数矩阵。令(L)为只包含1,0和(L)中元素的矩阵。DFM(1)和和(2)被改写为:被改写为:这里,G为一个只有1和0的矩阵,因此(5)和(2)是等价的。等式(4)和(5)被称为DFM的静态形式,因为这些因子只能同时出现。A16 线性状态空间模型通过详细说明对于 和误差 的过程而完成。典型地,误差项 被假定为遵循单变量的自回归:随着更进一步的假设为 服从独立同分布,,i
10、=1,.,N,服从独立同分布,,j=1,.,q,和 是独立的,等式(4)到(6)构成一个完全线性状态空间模型。给出了这些参数,卡尔曼滤波能够用作计算可能性和估计 的 过滤值,进而估计 。(6)A17 这个参数的状态空间模型的好处是,它能够处理数据的不规则性。EM算法会用来估计参数的最大似然估计(MLEs)。不过,参数的数量要与N成比例,所以MLE系数的直接估计是难处理的。A182.2 2.2 第二阶段:非参数平均方法第二阶段:非参数平均方法 1 横截面平均法为什么起作用 2 主成分估计 3 广义主成分估计 4 动态主成分A191 横截面平均法为什么起作用横截面平均法为什么起作用 考虑 的横截面
11、平均因子估计的动机为,特殊干扰的加权平均数将根据弱大数定理收敛到0,以至于只有因子的线性组合依然存在。横截面平均估计量是在DFM(4)的静态表示基础上的。横截面平均估计量是非参数的,在某种意义上他们不需要这样一个参数模型,正如(5)中的因子F或者(6)中的特殊动态。所取代的是,被认为是一个由一N维数据向量所估计的r维参数。取代参数假设,按照Chamberlain and Rothschild(1983)的近似因子模型的较弱的假设是关于因子结构的。尤其是,考虑到以下条件,A20 把构造的 的估计量看作X的加权平均数,用到了一个权重为W的非随机Nr矩阵,这里W被标准化以至于WW/N=:(9)一般来
12、说,对于将会有不足的结构去假定一个权重矩阵W,W不依靠这些主成分分析所到达的数据。A212 2 主成分估计主成分估计 F的主成分估计量是加权平均估计(9),并且W=,这里的 是 的样本方差矩阵的特征向量矩阵,,关联于 的r个最大的特征向量。主成分估计量能够导出最小二乘问题的解决办法:服从于其标准化 。为了解决(11),首次最小化提供的 ,从而得到 ,然后集中于目标函数,因此(11)变成 。这个最小化问题等价于 ,它依次等价于 服从于 。这个最后的问题的解决办法是使 等价于 扩展的特征向量,它与它的r个最大的特征向量相对应。因为 ,这意味着F的最小二乘估计量是 ,即X的扩展的前r个主成分。A22
13、 的主成分估计量的一致性首次被显示为固定的T和N,被Connor and Korajczyk(1986)在确切的静态因素模型中表示。Stock and Watson(2002s)在更弱的条件下证明了因子的统一一致性,允许特殊误差的弱连续和互相关。也提供了N和T的率条件,在 被当作是第二阶段最小二乘回归的数据的条件下(即,的估计误差不能够影响 作为回归量的OLS的系数的渐进分布)。Bai(2003)提供了估计因子和一般成分的极限分布。Bai and Ng(2006a)提供了增长率,尤其是N,T和N2/T,在 是一致的且在后来的回归中作为数据的条件下;他们也提供了用 估计的一般成分的置信区间结构的
14、结果。A233 广义主成分估计广义主成分估计 广义主成分对于主成分相当于广义最小二乘法对于最小平方。如果干扰误差变量矩阵与单位矩阵不成比例,那么最小二乘回归的类比表明 和解决了(11)的加权版本,这里的权重矩阵为 :A24 至少有三个可行的广义主成分估计的版本被提名为DFM。首先,Forni,Hallin,Lippi,and Reichlin(2005)重新整理了这个分解,这里 是一般成分 (这个分解由(4)而来)的方差来获得 。他们提出通过动态主成分来估计 (在下面会提到)。第二,Boivin and Ng(2003)提出运用估计量 ,这里 是 在主成分估计量 上回归的误差变量的通常估计量;
15、令 的非对角线位置为0,则它们的权重矩阵只含有N个估计元素。这些解决办法都没有提出 有可能序列相关。把这个考虑在内的话,Stock and Watson(2005)提出了一个三步的解决办法,近似于Cochrane-Orcutt估计量,当 通过主成分被首次估计时,N个独立自回归适合在 上 回归的残差,X运用第i个自回归的系数是拟差分的,然后Boivin-Ng(2003)的的对角线方法也应用于这些拟差分中。A254 动态主成分动态主成分 动态主成分是由Brillinger(1964,1981)发展而来的主成分的频域模拟。Forni,Hallin,Lippi,and Reichlin(2000,20
16、04)证明了一般成分的一致性并且提供了其收敛率,这些一般成分是被动态主成分估计的。通过动态主成分估计f的方法需要两边平滑,所以样本最后f的估计量是不可得的。结果是,动态主成分不能够直接用于预测,工具变量回归,FAVAR或者其他需要用到f的估计量的应用,对于所有样本来说。在这个调查中我们不再进一步讨论这个方法。A262.3 2.3 第三阶段:混合主成分和状态空间方法第三阶段:混合主成分和状态空间方法 估计因子方法的第三个阶段是融合状态空间方法的统计效率和主成分方法的便利性及平稳性。这个合并的估计过程发生在两步:首先,这些因子通过主成分或者一般主成分所估计;第二步,这些被估计因子 用来估计状态空间
17、表示的未知参数。A27 静态因子的状态空间模型:静态因子的状态空间模型:模型由(4)-(6)给出。动态因子的状态空间模型动态因子的状态空间模型 模型由式(1)(2)和(6)给出。A28 这些被估计参数完全地填充于状态空间模型中,以至于或 能够运用卡尔曼平滑来更好地估计其估计量,这个估计量能引起时间序列平均。运用这些被估计的系数作为系数最大可能估计的一致开始值也是可能的。Engle and Watson(1983),Quan and Sargent(1993)and Doz,Giannone,and Reichlin(2006):最大似然估计能够运用EM算法来估计;Jungbacker and
18、Koopman(2008):解决了如何加快在DFM中卡尔曼透视的估值,通过把 转换为一个r1阶向量;Jungbacker,Koopman,and van der Wel(2009):提供了额外的计算设备,当存在缺失数据时也能够使用。A292.4 2.4 估计量的比较估计量的比较 一些研究把各种估计量与真实数据作比较,得到了某种程度上不同的结论。当因子和特殊干扰是一致时,一般主成分估计量实质上更精确与共同成分的主成分估计量,虽然当N和T非常大时,这种不同会消失。并且在一个标准化数据下,只有很小的不同存在。把主成分估计量的预测性与各种可行的一般主成分估计量作比较:虽然存在细微差别,总体结论是运用各
19、种因子估计量产生的预测值是高度共线的。A302.5 2.5 贝叶斯估计贝叶斯估计 DFM参数和因子也能用贝叶斯方法来估计。主要是由于三点:首先,当存在很多未知参数时,综合估算后面的部分能够在数字上更简单,更稳定;第二,在非线性或非高斯潜在变量模型中,直接估算的可能性是非常小的;第三,一些分析人员可能希望以一个先验分布的形式在模型的开头强加一些信息。A31 贝叶斯方法在模型中包括非线性,非高斯元素时特别有用。eg:一四变量的DFM,这个模型的自然分层有助于Gibbs抽样和模型参数和动态因子后部贡献的估计;非线性或非高斯状态空间模型的一般MCMC解决办法。另外一个优点是贝叶斯估计比第二三阶段方法产
20、生更好的预测。A32三三 因子数量的决定因子数量的决定 对于估计静态因子r和动态因子q的数量的一些方法是可得的。3.1 估计静态因子r的数量 3.2 估计动态因子q的数量A333.1 3.1 估计静态因子估计静态因子r r的数量的数量 Bai and Ng(2002):静态因子r的数量能够被先验信息,因子碎石图的视觉检验和信息标准的运用所决定。作为视觉诊断法的因子碎石图作为视觉诊断法的因子碎石图 因子碎石图是 的有序特征值构成的图,它允许视觉评定第i个主成分的边际贡献,来描绘 而不是前i个主成分回归的R的平方。在此基础上的正式测验将在下面讨论。A34 以信息标准为基础的以信息标准为基础的r r
21、的估计:的估计:因子碎石图基础上的正式检验因子碎石图基础上的正式检验(13)A353.2 3.2 估计动态因子估计动态因子q q的数量的数量 三种方法:Hallin and Liska(2007)提出一个频域过程,它基于观察到的一般成分频谱的秩是q;Bai and Ng(2007)提出了这样一个估计量,它基于观察到总体向量自回归(5)中的创新方差矩阵有秩q;Amengual and Watson(2007)的估计量是基于:在 过去值的 回归中,其剩余值有一个秩为q的因子结构,这里表明基于样本方差矩阵的Bai and Ng(2007)的信息标准不满足动态因子数量的一致估计。A36 我们自己有限的
22、Monte Carlo实验表明,Bai and Ng(2007)有着某种程度上更好的有限样本性能,相对于Amengual and Watson(2007)的估计量。A37四 被估计因子的应用 被估计因子能够作为数据应用于第二阶段的回归和估计结构性模型(FAVAR和DSGE)。4.1 4.1 在第二阶段回归中的因子应用在第二阶段回归中的因子应用 预测预测 作为工具变量作为工具变量A384.2 增广向量自回归增广向量自回归(FAVAR)FAVAR作为一种解决VAR模型构造中两个相关问题的方式:第一,在一常见的N个变量的VAR中,参数数量会随着N的平方增长,因此当N/T很大时,无限制的VAR是不可实
23、行的,这一问题的解决办法是强加先验分布的形式结构到参数上,但这时需要一个先验分布;第二,SVARs的可逆性或非根本性问题。A39 Bernanke,Boivin,and Eliasz(2005)提出维数问题可以通过强加来自DFM中的限制条件来解决。参考这个,以VAR形式来写静态的DFM(4)-(6)是可行的。结果是:(14)中所有的参数都能被估计。egA40至于SVARs的问题,需要强加足够的识别限制:运用通常SVAR识别工具包的延伸,包括强加短期内的限制;长期内限制;通过最大化一个或更多变量的主成分方差来识别冲击;强加对符号的限制等。A414.3 4.3 运用运用DFMsDFMs的的DSGE
24、DSGE估计估计 Sargent(1989)指出,DFM可被理解为一个潜在的地位经济模型中的相关的多个指标。Bovin and Giannoni(2006)通过联结动态因子发展等式(2)和一个滞后线性的DSGE来延伸上个观点。通过引进潜在过程中的多个指标,带来的附加信息来对DSGE的参数估计产生影响。原则上这个估计可通过MLE来完成。A42五 扩展 这一部分简要地回顾了DFM研究的三种扩展:断裂的DFM;协整与误差校正的DFM;构造的DFM,例如分层的DFM。A435.1 5.1 断裂和时变参数断裂和时变参数 很少有论文考虑到断裂或含时变参数的DFM,以下有几个例子:Stock and Wat
25、son(2002a)表示,因子的主成分估计量是一致的,即使是因子载荷中断裂的或时间变化的某些类型;Banerjee,Marcellino,and Masten(2007)提供了因子基础上预测的Monte Carlo结果,这种预测在因子载荷中是不稳定的;并且发现如果大的断裂不能被探测到的话,它会在本质上减少全样本因子基础上预测的性能。A445.2 5.2 协整与误差校正协整与误差校正 因子主成分估计的计量经济学理论需要改进来覆盖综合和协整的变量。经验性的证据表明,基于因子误差纠正模型上的预测胜过标准DFM预测。此项结论研究的前提是在水平变量上存在大规模的协整。在某些特定的事例中,分层的结构自然地
26、被提出并且被纳入DFM中。5.3 5.3 分层的分层的DFMsDFMsA455.4 前景前景 动态因子模型有着根植于动态宏观理论和提供一个好的第一顺序的经验主义宏观数据描述的双要求,在这个意义上,因子的一小部分数量解释了许多宏观经济序列方差的很大一部分。在过去几十年,DFMs基础上的理论计量经济研究已经取得了很大的进步,并且各种方法对于因子和因子数量的估计是可得的。这些理论性的工作在许多相关领域是持续的,包括弱因子结构,因子数量的检测和不稳定及间断的因子模型。A46 到现在大部分经验主义的工作已经集中于预测。现在关于因子预测的性能和运用因子进行预测的最好的实践,大部分已经都了解了。线性因子预测相对于其他很多但不是所有宏观经济序列的预测,表现地越来越好;参数DFM也很好的适用于即使预报;DFM其他应用研究也是更新的,例如结构性VAR和DSGEs参数的估计,这些到现在为止是相对少的。这些对于未来的研究进行了很好的指导。