1、第二章第二章 回归模型及其应用回归模型及其应用学习目标学习目标n熟悉一元回归和多元回归模型及其运用;n掌握线性回归结果的t检验和F检验;n熟悉模型的稳定性检验;n熟悉虚拟变量的运用。第二章第二章 回归模型及其应用回归模型及其应用n第一节第一节 一元线性回归模型及其应用一元线性回归模型及其应用n第二节第二节 多元线性回归及其应用多元线性回归及其应用n第三节第三节 线性回归模型的检验线性回归模型的检验n第四节第四节 虚拟变量引入与模型稳定性检验虚拟变量引入与模型稳定性检验一元线性回归模型及其应用一元线性回归模型及其应用n一、一元线性回归模型一、一元线性回归模型n一元线性回归模型是用于描述两个变量之
2、间的线性关系的计量模型,它是多元线性回归模型和非线性回归模型的基础,在金融实证分析中有较广泛的运用 n一元线性回归模型可表达为n (2.1)n 为被解释变量或因变量;为解释变量或自变量;为误差项或扰动项,该项表示变化中 未被 所解释的部分;为样本个数。iiiyax(1,2,)tTyxiuyxxT一元线性回归模型及其应用一元线性回归模型及其应用n古典线性回归模型包含一系列基本假设,这些假设包括:n(1)随机误差项具有零均值和同方差性,即E(i)=0,Var(i)=n(2)随机误差项之间不相关,即E(i,j)=0,ij,i、j=1,2,Tn(3)解释变量与随机误差项不相关,即E(xi,j)=0,i
3、j,i、j=1,2,Tn(4)随机误差项(random error term)服从均值为零,同方差的正态分布,即iN(0,)n(5)一般假定解释变量具有非随机特征,这个假定说明被解释变量的概率分布具有均值2一元线性回归模型及其应用一元线性回归模型及其应用n二、最小二乘法(二、最小二乘法(OLS)n最小二乘法的基本原则是:最优拟合直线应该使各点到直线的距离绝对值之和最小。为了数学表达方便,剔除正负号的影响,上述原则可变为距离的平方和最小。假定根据这一原理估计得到的 、分别为 、,则直线可表达为 。a aiiyax一元线性回归模型及其应用一元线性回归模型及其应用n根据前面的定义,最小二乘法就是使得
4、直线与各散点的距离的平方和最小,实际上是使残差平方和(residual sum squares,简称RSS)最小化n根据最小化的一阶条件,将上式分别对 、求偏导,并令其为零,即可得到如下结果:21TiiuRSS 21()Tiiiyy21()Tiiiyax a22iiix yTxyxTx ayx普通最小二乘回归模型普通最小二乘回归模型 一元线性回归模型及其应用一元线性回归模型及其应用n三、最小二乘估计量的性质三、最小二乘估计量的性质n(1)线性无偏性 n ,是参数 ,的线性无偏估计。线性线性即估计量是另一随机变量的线性函数无偏性无偏性即估计量的均值或者期望等于总体参数的真实值。0101一元线性回
5、归模型及其应用一元线性回归模型及其应用n(2)一致性(consistency):,是参数 ,的一致性估计。一致性即当样本容量趋于无穷大时,估计量依概率收敛于总体参数的真实值。n(3)有效性:,是参数 ,所有可能的线性无偏估计量中具有最小方差的估计量。01010110一元线性回归模型及其应用一元线性回归模型及其应用n四、参数估计的精确性和性质四、参数估计的精确性和性质n由上文可知,OLS的估计值会因为样本数据的不同而不同,那么我们就希望知道通过OLS估计出的参数值的精确度和可靠性,也就是说我们有必要知道是否存在估计值的置信度,以及这种置信度是否会随着选取样本的不同而显著地改变。通常,对参数精确性
6、和可靠性的估计可以用它的标准误差(Standard Error)来表示。22222()()()ttttxxSEssTxxTxTx22211()()ttSEssxxxTx一元线性回归模型及其应用一元线性回归模型及其应用n参数估计值的标准差具有如下性质:n(1)样本T越大,系数标准误差越少。n(2)系数的标准误差都依赖于s,从前面的内容可知,是残差方差估计值,该值越大,残差就越离散,模型的不确定性越大,即数据点偏离回归线的幅度越大。n(3)两个公式中都出现了 偏离它们的均值的平方和 ,且都在分母中,所以平方和越大,系数方差越少。tx2()txx2s一元线性回归模型及其应用一元线性回归模型及其应用n
7、案例分析案例分析2-1一元回归方法的运用一元回归方法的运用证券市场过度反应吗?证券市场过度反应吗?nDeBondt和Thaler(1985,1987)的两项研究结果显示,对于先前业绩相当好的股票,当它们经历了35年的较差业绩以后,会趋向于出现超常业绩。这意味着平均来讲,之前在收益上为“输者”的股票以后会成为“赢者”,反之亦然。nClare和Thomas在英国股票市场随机抽取了1000个样本公司,通过一定的方法将公司的业绩进行排序和划分组合资产形成阶段,并计算出赢者(组合资产形成阶段20的业绩最佳的公司)和输者(20业绩最差的公司)在18、9、或6个阶段每月的平均收益的差额,定义为 。n第一个回
8、归是输者相对于赢者的超额收益对常数进行回归:DtR Dt1tR=+一元线性回归模型及其应用一元线性回归模型及其应用n上述方程的回归结果如表所示。通过对表前两行输者收益和赢者收益的比较可知,12个月对于输者变成赢者并不是充分长的时间,在2年或3年后,输者成为了赢者。同时在样本中剔除1月份的收益使得随后输者资产过度业绩的程度显著降低了,表现为项的显著性有所降低。因此,仅有部分过度反应的现象发生在1月份。一元线性回归模型及其应用一元线性回归模型及其应用121表表2-1:英国股票市场上有过度反映效应吗?英国股票市场上有过度反映效应吗?A组组:所有月份所有月份 输者的收益赢者的收益隐含的年收益差回归方程
9、系数回归方程系数回归方程系数B组:除去一月份的所有月份回归方程系数n=12 0.00330.0036-0.37%-0.00031(0.29)-0.00034(-0.30)-0.022(-0.25)-0.0007(-0.72)n=24 0.0011-0.00031.68%0.0014*(2.01)0.00147*(2.01)0.01-0.210.0012*(1.63)n=360.01290.01151.56%0.0013(1.55)0.0013*(1.41)-0.0025(-0.06)0.0009(1.05)多元线性回归及其应用多元线性回归及其应用n第二节第二节 多元线性回归及其应用多元线性回归
10、及其应用n一、多元线性回归模型一、多元线性回归模型n在上一节中我们讨论了一元线性回归模型,然而现实经济中的各变量之间的相互关系是错综复杂的,往往一个经济指标都会受到很多其他经济因素的影响,如果想要通过数量模型来描述这一影响关系的话,这就要求我们在一元线性回归模型的基础上引入多元线性回归模型。多元线性回归及其应用多元线性回归及其应用n二、模型假定二、模型假定n每组观察值所对应的误差项均为零均值的随机变量,即 。n误差项的方差为常数,即 ,其中I为NN单位矩阵。n随机误差向量服从多元正态分布,即 n对应于不同的观察值所对应的误差项不相关 即 对于任意的 都成立。n解释变量 是确定性变量而非随机变量
11、,也就是说X是一个确定的矩阵,同时在 k1时假设不同解释变量之间不存在线性关系,即 。()0E u 2()E uuI2(0,)uNI(,)()0ijijCov u uE uuij12.(1,2.)iiiiTXxxxik()1r XkT 多元线性回归及其应用多元线性回归及其应用n三、参数估计三、参数估计n为了获得参数的估计值 RSS将相对于所有的 元素最小化。n运用矩阵形式,残差平方和为:n 12,k RSS u u1 u2 utu12Tuuu21 u22 u2.Tu2tu多元线性回归及其应用多元线性回归及其应用n利用与上一节一元回归类似的方法,可以得出多变量回归系数的估计式:n多元回归模型估计
12、误差的方差 用残差平方和除以自由度来估计:yXXXk121)(22 uusTk多元线性回归及其应用多元线性回归及其应用n四、多元回归参数估计量的性质四、多元回归参数估计量的性质n线性线性n无偏性无偏性,即参数最少二乘估计量的数学期望值都等于真实值n有效性有效性,参数最少二乘估计值的方差是所有线性无偏估计值中方差最小的多元线性回归及其应用多元线性回归及其应用n案例分析案例分析2-2多元回归方法的运用多元回归方法的运用Beta值影响因素检验值影响因素检验n按照Sharpe(1964)的CAPM定价模型,Beta值是影响股权融资成本的唯一因素。从大量实证研究结果包括Fama和French(1992)
13、来看,Beta值与股票收益之间缺乏显著的相关性,规模、净值市价比(BP)、财务杠杆、市盈率等变量可用于解释股票收益。类似于Gode和Mohanram(2003)分析美国股票市场资本成本时选取的影响因素和叶康涛、陆正飞(2004)选取的影响因素,我们选取以下影响因素:n系统风险Beta值 n帐面市值比例(BM)值 n资产负债率(DM)n股东权益市值(M)n非流通股所占比例(NT)多元线性回归及其应用多元线性回归及其应用InterceptBMLn(DM)Ln(M)NTSF ValuePr F0.12455*(22.10)1.080.30060.07484*(2.20)0.00075718(0.34
14、)0.01360(1.49)1.640.19540.76488*(6.84)0.00355*(1.68)0.00210(0.24)-0.03048*(-6.44)15.08.00010.69495*(6.45)0.00396*(1.90)0.00254(0.30)-0.02714*(-5.98)-0.00504(-0.52)10.31.0001上市公司股权融资成本横截面回归分析结果上市公司股权融资成本横截面回归分析结果从表的回归结果我们可以看出,我国上市公司融资成本与公司的帐面市值和公司规模具有显著的相关性,而与公司的资本结构和非流通股比例无关,具体而言,上市公司的股权融资成本与公司帐面市值正
15、相关,与公司规模负相关。多元线性回归及其应用多元线性回归及其应用n五、逐步回归方法五、逐步回归方法n(一)逐步回归方法介绍(一)逐步回归方法介绍n基本思想n逐步引入自变量,每次引入对Y影响显著的自变量,并对方程中的原有变量进行逐个检验,并把变为不显著的变量逐个从方程中剔除。最终得到的方程中既不遗漏对Y影响显著的变量,又不包含对影响不显著的变量。多元线性回归及其应用多元线性回归及其应用n(二)逐步回归的(二)逐步回归的SAS实现实现n逐步回归的SAS软件操作过程分为以下五步:n首先,通过“SolutionsAnalysisAnalyst”打开数据集;n第二步,选择菜单“StatisticsReg
16、ressionlinear”;n第三步,在弹出的线性回归主窗口选择因变量和自变量,选择“variables(Dependent/Explanatory)”;n第四步,再进行逐步回归选择“ModelStepwise selection”。n第五步,是查看回归结果,并对检验结果进行分析。多元线性回归及其应用多元线性回归及其应用n实证案例实证案例2-3 逐步回归方法的应用逐步回归方法的应用IPO折价实证检验折价实证检验n20世纪60年代以来,世界各国学者一直关注IPO及其在二级市场的表现。大量研究表明,IPO(Initial Public Offerings)存在短期发行抑价问题,即首次公开发行的股
17、票由于发行价偏低,上市后的市场价格远高于发行价,导致IPO存在较高的初始收益率,我国IPO的溢价问题相对于国外更加严重。耿建新、朱保成(2006)利用20022004年度在上海股市发行并上市A股的上市公司作为研究样本,剔除解决历史遗留问题而未发行新股的上市公司,共有195家上市公司入选。在此,对新股初始收益率与相关解释变量之间的关系进行了回归分析。多元线性回归及其应用多元线性回归及其应用n上海A股最优回归方程为:nRIPO-A=0.397+1.066E-02REXC+9.810E-02PK-0.173PF-0.252CRBSn式中,RIPO-A表示新股初始收益率,REXC表示首日换手率,PF表
18、示首日开盘价,CRBS表示中签率。表表2-32-3:上海:上海A股新股初始收益率的多元回归分析股新股初始收益率的多元回归分析变量常数项首日换手率REXC首日开盘价PK发行价PF中签率CRBSR=0.776F=71.970回归系数 0.397*1.066E-02*9.810E-02*-0.173*-0.252*R2=0.602P=0.000标准化系数0.2250.869-0.898-0.093AdjR2=0.594D.W.=1.970T值2.2974.44213.142-12.932-1.910显著性水平0.0230.0000.0000.0000.058多元线性回归及其应用多元线性回归及其应用n
19、(1)回归方程的显著性检验n根据表2-3,对应于上海A股计算出的F值分别为71.970,且P值均为0.000。n因此,每个回归方程都是显著的,即新股初始收益率与方程中的至少一个解释变量存在显著的线性关系;同时,D.W.为1.970,与2较接近,两个计量模型均不存在扰动项的一阶自相关。n(2)回归系数的显著性检验分析n上市首日换手率与新股初始收益率显著正相关,换手率过高表明市场热衷于短期操作或存在过度投机行为。n上市首日开盘价与新股初始收益率显著正相关,表明市场对该新股反应激烈,受追捧程度较高,则抑价程度也高。n发行价与新股初始收益率显著负相关,表明发行价越低,新股的不确定性越小,新股的抑价幅度
20、也越高。n中签率与新股初始收益率显著负相关,中签率越高,说明市场需求越低;相反,中签率越低,则说明市场需求越高,进而影响新股抑价程度。线性回归模型的检验线性回归模型的检验n第三节第三节 线性回归模型的检验线性回归模型的检验n一、假设检验一、假设检验n1、零假设与备选假设、零假设与备选假设n在假设检验的框架内,总伴随着两个重要的假设零假设(Null Hypothesis,用 表示)和备选假设(Alternative Hypothesis,用 表示)。零假设是实际上被检验的统计假设,备选假设表示其余可能的结果。0H1H线性回归模型的检验线性回归模型的检验n在统计理论中,有两种实施假设检验的方法:显
21、著性检验方法(Test of Significance Approach)和置信区间方法(Confidence Interval Approach)。这两种方法的核心都是对系数估计值进行统计比较并把它的值置于零假设下。概括而言,如果估计值远离零假设,零假设很可能被拒绝;如果在零假设下的值与估计值相互接近,零假设就不大可能被拒绝。例如:显著性检验法中最常用的是t检验和F检验,前者是对单个变量系数的检验,后者是对多个变量系数的联合显著性检验(t检验实际上是F检验的一个特例,即对单变量进行F检验)。线性回归模型的检验线性回归模型的检验n置信区间法的基本思想是建立围绕估计值 的一定限定范围,推断总体参
22、数 是否在一定置信度下落在此区间范围内。这里所说的置信度(或置信水平)与t检验的显著性水平是相对的。例如,我们选择显著性水平为5%,则置信度为95%,这说明在总体抽样的情况下,真实总体的参数 有95%的可能性落在样本的置信区间内,5%的可能性落在置信区间之外。通常,置信区间又称为接受区域(acceptance region);接受区域以外的称为临界区域(critical region)或者拒绝域(region of rejection)。aa线性回归模型的检验线性回归模型的检验 临 界 值 置 信 区 间 x 临 界 值 置信区间与临界值线性回归模型的检验线性回归模型的检验n2、假设检验中的错
23、误分类和、假设检验中的错误分类和p值值n如果在所选择的显著性水平下检验统计量具有统计显著性,则 通常被拒绝。这里,我们可能会犯两类错误:n(1)拒绝一个其实为真的 这称为第一类错误(Type I Errors)。第一类错误的概率正好等于 ,即所选择的显著性水平 n(2)实际是错误的,但我们没有拒绝它这称为第二类错误(Type II Errors)。0H0H0H线性回归模型的检验线性回归模型的检验n为说明第一类错误和第二类错误的关系,在此我们假设将显著性水平由5%变为1%,则的置信水平由95%上升到99%,这说明错误地拒绝零假设(或犯第一类错误)的概率由5%降至1%,但同时犯第二类错误的概率却上
24、升了。的可能性变小 减少 更严格地 拒绝零假设的 显著性水平 拒绝零假设 可能性变小 错误地拒绝零假设 错误地接受零假设 的可能性变大 更少地犯第一类错误 更有可能犯第二类错误 线性回归模型的检验线性回归模型的检验n与两类错误密切相关的是p值,p值又称为概率值,这是我们在度量显著性水平时常用的一个统计指标,它是一个计量结果对应的精确性显著性水平。n作为衡量显著性水平的一个重要指标,p值度量的是犯第一类错误的概率,即拒绝正确的零假设的概率。p值越大,错误地拒绝零假设的可能性也就越大;相反,p值越小,错误地拒绝零假设的可能性也就越小,我们就对统计结果的可靠性就越放心。线性回归模型的检验线性回归模型
25、的检验n二、变量的显著性检验二、变量的显著性检验 n变量的显著性检验所用的方法是数理统计学中的假设检验。为了对参数作区间估计和假设检验,我们需要知道参数估计量的分布。n各种显著性检验方法:n1、t检验n2、方程显著性检验和F统计量线性回归模型的检验线性回归模型的检验nt检验n通常检验的步骤如下:n使用回归方法估计出参数 、和 、的值n按照下面的公式计算统计量(以 为例):n以上述方式推导出的检验统计量服从(T-2)自由度的t分布,接下来使用t分布表对上面估计出的检验统计量进行比较。n选择“显著性水平”,通常用 表示选择5的显著性水平,注意它不是回顾截距系数。n给定显著性水平,从而确定拒绝区域和
26、非拒绝区域。n运用t分布表获得临界值,并把临界值与检验统计量进行比较。n最后进行检验010()SE1()SE0*000SE检 验 统 计 量()线性回归模型的检验线性回归模型的检验nF检验是一个联合检验,在F检验中存在无约束和有约束这两类回顾归,无约束回归是指系数由样本数据自由决定的回归,而有约束的回归对某些系数施加一定约束条件的回归。nF检验的步骤大体如下:n分别写出无约束和有约束的回归方程,并利用软件进行回归分别得出无约束和有约束回归中的残差平方和n计算检验统计量n选择“显著性水平”,通常用表示选择5或1的显著性水平。n运用F分布表获得临界值,并把临界值与检验统计量进行比较。n最后进行检验
27、,如果统计量超过临界值,则拒绝零假设,即约束不成立,否则就不能拒绝。线性回归模型的检验线性回归模型的检验n三、自相关检验:德宾三、自相关检验:德宾-沃森检验(沃森检验(Durbin-Watson Test)n检验自相关问题实际上就是研究残差的当期值 与以前各期值 之间是否存在某种关系。n德宾和沃森(Durbin&Watson)在1951年提出了一种检验随机误差项是否存在一阶自相关的方法,它只检验残差的当期值 与其前一期值的关系tu12,.ttuutu线性回归模型的检验线性回归模型的检验n四、拟合优度检验和四、拟合优度检验和 统计量统计量n 1.统计量统计量n拟合优度(goodness of f
28、it statistic)是指一个回归模型拟和数据的程度,为了度量这一拟合程度,我们必须构造出合适的变量即“拟合优度统计量 ”。在OLS回归中,我们选择使残差平方和最小的系数估计值,RSS的值越小,模型拟合数据的效果越好。2R2R2R线性回归模型的检验线性回归模型的检验n 的构建过程及含义。n对于某一回归模型:n系数 的估计值就是y的均值,记为 。y相对均值的波动性,即 为总平方和(TSS)n其中,是被模型所解释的部分,称为回归平方和(the explained sum of squares,ESS)n拟合优度统计量由回归平方和与总平方和的比率决定:2Rttyuy2()tyy222()tttT
29、SSyyyyu2()tyyRESSTSS2线性回归模型的检验线性回归模型的检验n 越大,说明回归拟合程度越好;越小,说明回归拟合程度越差。n2经调整的经调整的 (Adjusted )n其中,T为样本容量,k为自变量个数。2R2R2R2R)1(1122RkTTR线性回归模型的检验线性回归模型的检验n五、五、AIC准则和准则和Schwarz准则准则n在时间序列模型中,因变量中往往会包含一些滞后t期的变量,例如 ,这时,滞后阶数越高,则模型的模拟效果越好,那么我们就必须选择一个统计量来确定一个最佳滞后长度,通常我们选择AIC和SC统计量。n选择最佳滞后阶数时,AIC和SC统计量越小越好,12,.tt
30、tx xx2/2(1)/AICL TkT 2/(1)ln/SCL TkTT 线性回归模型的检验线性回归模型的检验n六、残差检验(六、残差检验(residual test)n古典线性回归模型中假定随机扰动项是正态分布的,因而在检验模型拟合程度时,有必要进行残差正态性检验,最常用的方法是Bera-Jarque检验,简称BJ检验。nBera和Jarque(1981)通过验证偏斜度系数和超峰度系数是否联合为零来检验残差项是否为正态分布。用u表示误差,表示方差,可以得出偏斜度系数和峰度系数的表达式:nBera-Jarque统计量为:2342 3/222()(),()()E uE upf22(3)624p
31、fWT线性回归模型的检验线性回归模型的检验n实证案例实证案例2-4应用应用t检验进行验证检验进行验证CAPM:共同基金:共同基金能否战胜市场?能否战胜市场?n共同基金能否战胜市场(beat the market),是基金业绩评价的一个基础性问题。Jensen(1968)最先应用CAPM模型检验了共同基金业绩表现。在此,我们应用t检验进行验证CAPM,说明共同基金能否战胜市场。Jensen(1968)对CAPM检验是通过一个简单的回归方程实现的。n估计方程如下:()jtftjjmtftjtRRaRRu线性回归模型的检验线性回归模型的检验2 r1(,)*ttu u ItemnMean Value-
32、.011.840.865-.07717Mddian Value-.009.848.901-.06419Extreme ValueMinimum-0.080 0.219 0.445-0.688 10Maximum0.0581.4050.9770.57520Mean Absolute Deviation.016.162.074.2113.12方程回归结果方程回归结果线性回归模型的检验线性回归模型的检验n在两种情况下的 值都为负数,这表示平均(即平均值或中位值)基金并不能战胜市场,当然最佳业绩的基金的 值为0.058,取得了非正常收益。平均基金的Beta值为0.84,说明基金相对市场而言风险整体较小
33、,原因在于基金主要投资蓝筹股(Blue Chip)而非资本金小的股票(Small Caps)。表示上述结果的一个更为直观的方法是对系数 作图,以显示每一组t比率分类下的共同基金数量。图2-13表示考虑总交易成本时的情况。线性回归模型的检验线性回归模型的检验Jensens Alpha的的t比率分布比率分布 线性回归模型的检验线性回归模型的检验n对 的双测检验的适当临界值大约是2.1(假定20个年度数据有18个自由度),从图可知,115只基金中只有大约5只基金超过市场水平,而有5只基金明显低于市场水平,大部分基金约等于市场水平。因此我们认为美国基金管理者似乎并不能获得非正常的收益。0j线性回归模型
34、的检验线性回归模型的检验n实证案例实证案例2-5金融中介和股票市场与经金融中介和股票市场与经济增长关系的济增长关系的OLS检验检验n谈儒勇(1999)利用普通最小二乘法(OLS)对中国金融中介、股票市场与经济增长的关系进行线性回归 虚拟变量引入与模型稳定性检验虚拟变量引入与模型稳定性检验n第四节第四节 虚拟变量引入与模型稳定性检验虚拟变量引入与模型稳定性检验n一、包含虚拟变量的回归模型一、包含虚拟变量的回归模型n(一)简单理论回顾(一)简单理论回顾n虚拟变量是回归分析中常用的工具之一。在研究某一因变量时,解释变量除了某些定量变量,还希望引入一些定性变量。这些定量变量称为指标变量、二元变量或分类
35、变量。本节将在回归模型中引入这些变量,并赋值0或1。而对于只取0或1的变量我们将它称为称为虚拟变量(dummy variable)。n一般而言,虚拟变量可以D来表示,以示和其他变量的区别。例如,虚拟变量的引入,考察董事长和总经理两职合一是否和公司绩效存在关联,可构造如下回归模型:n其中,公司绩效,N表示抽样样本个数,为虚拟变量,取值为0或1。11,2,iiiYDuiNiYiD虚拟变量引入与模型稳定性检验虚拟变量引入与模型稳定性检验n(二)包含虚拟变量模型的应用(二)包含虚拟变量模型的应用上证指数上证指数的的“周末效应周末效应”检验检验n“周末效应”又名周日效应,也就是说股票的收益与风险在周内各
36、交易日表现出不同的特征,对此国外学者很早就有研究,Cross(1973年)、French(1980年)、Gbbons和Hess(1981年)对美国股票市场研究发现,周一股票的平均收益率显著为负,且比同周内的其他交易日都低;周五的收益率比其他交易日都高,且风险相对较小,即存在“周末效应”。关于我国上海和深圳股票市场是否存在“周末效应”,国内学者也有不少研究,认为我国股票市场与其他新兴市场一样,存在显著的周末效应,周五的收益率相对同周的其他交易日较高,而周二的收益率相对较低。虚拟变量引入与模型稳定性检验虚拟变量引入与模型稳定性检验n1、数据描述、数据描述n我们选取2000年1月4日-2006年6月
37、30日的上证市场收盘价数据。采取连续收益率法计算日收益率。n2、检验模型、检验模型n为对上证指数收益率进行周末效应检验,在此构建如下的虚拟变量模型:n n从回归结果我们可以看出,周一的收益率为负,而周五的收益率却显著得为正值,说明我国上证市场存在显著的“周末效应”。011223445ttttttRaa Da Da Da D虚拟变量引入与模型稳定性检验虚拟变量引入与模型稳定性检验n二、回归模型的结构稳定性检验二、回归模型的结构稳定性检验n在金融模型中,各变量之间的关系因自身性质改变或外部冲击而发生结构性变化。若在金融计量中忽视这一点,仍同时利用变化前后的数据进行回归分析,则模型的精确度就会大大降
38、低,利用模型所得出的估计、推断和预测也就难免出现偏差。因此,在金融计量过程中,对回归模型的稳定性检验是必要的。回归模型稳定性检验的主要方法:nChow检验法和虚拟变量法。虚拟变量引入与模型稳定性检验虚拟变量引入与模型稳定性检验n(一)(一)Chow检验检验 nChow检验法是著名美籍华人、美国宾夕法尼亚大学教授(G.C.Chow)于1960年提出的一种模型稳定性统计检验。这篇发表于经济计量学的论文指出,“当某一线性回归方程被用于表示一种经济关系,经常会产生这样一个问题,即是否该(经济)关系在两个时间段里保持稳定就统计上而言,可以通过检验两组观察值是否能被看成属于同一个回归模型来回答该问题。”“
39、通常,假设两者关系完全相同是毫无经济学道理的。更为合理的是假设部分关系在两个不同时间段或两组里相一致 统计上说,我们是在问两个回归方程里参数的子集是否相等。”换句话说“我们的问题在于检验M个新增观察值与前一组样本的N 个观察值是否属于同一个回归关系,以及检验两个回归方程参数的子集是否一致。n1、Chow检验法的步骤如下检验法的步骤如下n第一步,把样本数据分成两个子样本,分别对整个样本数据和两个子样本进行回归,并获取每个回归的 。n第二步,受约束的是对整个样本的回归,而不受约束的是对两个子样本的回归,因此可以构建F检验统计量:n它服从 。虚拟变量引入与模型稳定性检验虚拟变量引入与模型稳定性检验R
40、SS1212()2RSSRSSRSSTkRSSRSSk检验统计量(,2)F k Tk虚拟变量引入与模型稳定性检验虚拟变量引入与模型稳定性检验n2、应用、应用Eviews进行进行Chow检验检验n首先,构建回归模型,即构建如下回归模型:n第二步,是进行Chow氏稳定系国内检验。n第三步骤,是确定结构变化的转折点,进行检验。ttXu tY+虚拟变量引入与模型稳定性检验虚拟变量引入与模型稳定性检验n(二)回归模型稳定性检验(二)回归模型稳定性检验虚拟变量法虚拟变量法 nCHOW检验法只能告诉我们模型结构是否变化,但不能揭示是斜率变化还是截距发生变化,而虚拟变量法则可以解决这一问题。n将某一总体样本分
41、拆为两个子样本,设为样本1和样本2,分别对两个子样本按照以下模型进行回归:n样本1:n样本2:11tttyx22tttyx虚拟变量引入与模型稳定性检验虚拟变量引入与模型稳定性检验n同时用总体样本估计以下模型:n上式中 。n得到回归结果后,利用t检验判断 系数的显著性,可以得到以下四种结果:121121()()tttttyDxXD.tttXDx DttDXD和虚拟变量引入与模型稳定性检验虚拟变量引入与模型稳定性检验(1)系数都显著为零,即 ,表明回归模型稳定。(2)的系数不等于零,的系数等于零,即 表明模型不稳定的原因在于模型的截距发生了变化。(3)的系数等于零,的系数不等于零,即 表明模型不稳定的原因在于模型的斜率存在差异。(4)系数都显著不为零,即 ,表明回归模型非常不稳定,截距和斜率都容易发生变化。ttDXD和1212,tDtDtXDtXD1212,1212,ttDXD和1212,