1、线性回归模型线性回归模型1 1 回归分析概述回归分析概述一、线性回归模型的特征一、线性回归模型的特征二、线性回归模型的普遍性二、线性回归模型的普遍性三、线性回归模型的基本假设三、线性回归模型的基本假设一、线性回归模型的特征一、线性回归模型的特征1 1、线性回归模型的特征、线性回归模型的特征 一个例子一个例子 凯恩斯绝对收入假设消费理论:消费(C)是由收入(Y)唯一决定的,是收入的线性函数: C = + Y (2.2.1) 但实际上但实际上上述等式不能准确实现上述等式不能准确实现。 原因原因 消费除受收入影响外,还受其他因素的影响; 线性关系只是一个近似描述; 收入变量观测值的近似性:收入数据本
2、身并不绝对准确地反映收入水平。 因此因此,一个更符合实际的数学描述为一个更符合实际的数学描述为: C = + Y+ (2.2.2)其中: 是一个随机误差项,是其他影响因素的“综合体”。 线性回归模型的特征:线性回归模型的特征: 通过引入随机误差项,将变量之间的关系用一通过引入随机误差项,将变量之间的关系用一个线性随机方程来描述,并用随机数学的方法来个线性随机方程来描述,并用随机数学的方法来估计方程中的参数;估计方程中的参数; 在线性回归模型中,被解释变量的特征由解释在线性回归模型中,被解释变量的特征由解释变量与随机误差项共同决定。变量与随机误差项共同决定。2 2、模型的理论方程中为什么必须包含
3、随机、模型的理论方程中为什么必须包含随机误差项?误差项? 从数学角度看,引入随机误差项,将变量从数学角度看,引入随机误差项,将变量之间的关系用一个线性随机方程来描述, 才能之间的关系用一个线性随机方程来描述, 才能用随机数学的方法来估计方程中的参数。用随机数学的方法来估计方程中的参数。 从经济学角度看, 客观经济现象是十分复从经济学角度看, 客观经济现象是十分复杂的,是很难用有限个变量、某一种确定的形杂的,是很难用有限个变量、某一种确定的形式来描述的,这就是设置随机误差项的原因。式来描述的,这就是设置随机误差项的原因。 (1)在解释变量中被忽略的因素的影响;)在解释变量中被忽略的因素的影响;
4、(2)变量观测值的观测误差的影响;)变量观测值的观测误差的影响;(3)模型关系的设定误差的影响;)模型关系的设定误差的影响;(4)其它随机因素的影响。)其它随机因素的影响。3 3、随机误差项主要包括哪些因素的影响?随机误差项主要包括哪些因素的影响?4. 单方程线性回归模型的一般形式 单单方方程程线线性性回回归归模模型型的的一一般般形形式式为为: iiiXXY22110ikikX i=1,2,n (2.1.3)其其中中,Y 称称被被解解释释变变量量,,21XXkX称称解解释释变变量量,k 为为解解释释变变量量的的数数目目,为为随随机机误误差差项项,i 为为观观测测值值下下标标,n 为为样样本本容
5、容量量, 012,k为为待待估估参参数数。二、线性回归模型的普遍性二、线性回归模型的普遍性 线性回归模型线性回归模型是计量经济学模型的主要形是计量经济学模型的主要形式,许多实际经济活动中经济变量间的复杂式,许多实际经济活动中经济变量间的复杂关系都可以通过一些简单的数学处理,使之关系都可以通过一些简单的数学处理,使之化为数学上的线性关系。化为数学上的线性关系。1.1.线性的含义线性的含义对变量而言对变量而言对参数而言对参数而言 iiiXXY22110222110iiiXXY2.2.将非线性模型转化为线性模型的数学将非线性模型转化为线性模型的数学处理方法处理方法变量置换变量置换例如,例如,描述税收
6、与税率关系的拉弗曲线拉弗曲线:抛物线 s = a + b r + c r2 c0 s:税收; r:税率设X1 = r,X2 = r2, 则原方程变换为 s = a + b X1 + c X2 c0 变量置换仅用于变量非线性的情况。变量置换仅用于变量非线性的情况。 函数变换函数变换 例如例如,Cobb-Dauglas生产函数:幂函数 Q = AKLQ:产出量,K:投入的资本;L:投入的劳动 方程两边取对数: ln Q = ln A + ln K + ln L(3)(3)级数展开级数展开例如例如,不变替代弹性CES生产函数:方程两边取对数后,得到:对在=0处展开台劳级数,取关于的线性项,即得到一个
7、线性近似式。 QAKL()121LnQLnALnKL112()LnKL()12变量置换得到lnlnlnln(ln()YAmKmLmKL 12121 22ZXXX0112233结论:结论: 实际中的许多问题,都可以最终化为线性问题,实际中的许多问题,都可以最终化为线性问题,所以,线性回归模型有其普遍意义。所以,线性回归模型有其普遍意义。 即使对于无法采取任何变换方法使之变成线性即使对于无法采取任何变换方法使之变成线性的非线性模型,目前使用得较多的参数估计方的非线性模型,目前使用得较多的参数估计方法法非线性最小二乘法,其原理仍然是以线性非线性最小二乘法,其原理仍然是以线性估计方法为基础。估计方法为
8、基础。 线性模型理论方法在计量经济学模型理论方法的线性模型理论方法在计量经济学模型理论方法的基础。基础。Back:三、线性回归模型的基本假设三、线性回归模型的基本假设 对于线性回归模型,模型估计的任务是用回归对于线性回归模型,模型估计的任务是用回归分析的方法估计模型的参数。最常用的估计方分析的方法估计模型的参数。最常用的估计方法是普通最小二乘法。为保证参数估计量具有法是普通最小二乘法。为保证参数估计量具有良好的性质,通常对模型提出若干基本假设。良好的性质,通常对模型提出若干基本假设。如果实际模型满足这些基本假设,普通最小二如果实际模型满足这些基本假设,普通最小二乘法就是一种适用的估计方法;乘法
9、就是一种适用的估计方法;如果实际模型如果实际模型不满足这些基本假设,普通最小二乘法就不再不满足这些基本假设,普通最小二乘法就不再适用,而要发展其它方法来估计模型。适用,而要发展其它方法来估计模型。 线性回归模型在上述意义上的基本假设线性回归模型在上述意义上的基本假设 (1)解释变量)解释变量X1,X2,Xk 是确定性变是确定性变量,不是随机变量;解释变量之间互不相关。量,不是随机变量;解释变量之间互不相关。 (2)随机误差项具有均值和同方差。即)随机误差项具有均值和同方差。即 E(i)=0 i=1,2, ,n Var (i)=2 i=1,2, ,n (5)随机误差项服从均值、同方差的正态)随机
10、误差项服从均值、同方差的正态分布。即分布。即 iN(0, 2 ) i=1,2, ,n(3)随机误差项在不同样本点之间是独立的)随机误差项在不同样本点之间是独立的,不存在序列相关。即,不存在序列相关。即 Cov(i, j)=0 ij i,j= 1,2, ,n(4)随机误差项与解释变量之间不相关。即)随机误差项与解释变量之间不相关。即 Cov(Xji, i)=0 j=1,2, ,k i=1,2, ,n 重要提示重要提示 几乎没有哪个实际问题能够同时满足所有基本假设;几乎没有哪个实际问题能够同时满足所有基本假设; 通过模型理论方法的发展,可以克服违背基本假设通过模型理论方法的发展,可以克服违背基本假
11、设带来的问题;带来的问题; 违背基本假设问题的处理构成了单方程线性模型的违背基本假设问题的处理构成了单方程线性模型的理论方法的主要内容:理论方法的主要内容: 异方差问题(违背同方差假设)异方差问题(违背同方差假设) 序列相关问题(违背序列不相关假设)序列相关问题(违背序列不相关假设) 共线性问题(违背解释变量不相关假设)共线性问题(违背解释变量不相关假设) 随机解释变量(违背解释变量确定性假设)随机解释变量(违背解释变量确定性假设)Back2 2 线性回归模型的参数估计线性回归模型的参数估计 -普通最小二乘法 假定变量假定变量yt与与k k 个变量个变量x xjtjt, , j j = 1,
12、= 1, , , k k ,存在线性关系。多元线性回归模型表,存在线性关系。多元线性回归模型表示为:示为:tKtktttuXXXy22110 其中其中y yt t是被解释变量(因变量),是被解释变量(因变量),x xjtjt 是解释变是解释变量(自变量),量(自变量),u ut t是随机误差项,是随机误差项, i i, , i i = 0, = 0, 1, 1, , , k k 是回归参数(通常未知)。这说明是回归参数(通常未知)。这说明x xjtjt, , j j = 1, = 1, , , k k, , 是是y yt t的重要解释变量。的重要解释变量。 u ut t代表众多影响代表众多影响
13、y yt t变化的微小因素。变化的微小因素。l模型描述模型描述ikikiiikiiiiuXXXYniXXXYn2211021,2, 1),(,得:样本观测值为的样本当给定一个容量为nknknnnkkkkuXXXYuXXXYuXXXY2211022222121021121211101即形式矩阵形式uuuXXXXXXXXXYYYnkknkknnn2121021222211121121111UXBYuuuXXXXXXXXXYYYnkknkknnnUBXY2121021222211121121111令2 2 线性回归模型的参数估计线性回归模型的参数估计 1. 普通最小二乘法普通最小二乘法(OLS) 最
14、小二乘最小二乘 法法(OLS)的原理是通过求残差的原理是通过求残差(误差项的估计值)平方和最小确定回(误差项的估计值)平方和最小确定回归参数估计值。这是求极值问题。用归参数估计值。这是求极值问题。用Q表示残差平方和,求其最小值条件下的表示残差平方和,求其最小值条件下的回归参数的估计值。回归参数的估计值。 nininiiXXYYYQkikiiiie1212121100000210kQQQQkikiiiikikiiiXXXYeXXXY2211022110iiiYYeminQ00001102110211101110XXXxYXXXXYXXXXYXXYkikikikiiikikiiiikikiiiki
15、kii得到下列方程组得到下列方程组求参数估计值的实质是求一个求参数估计值的实质是求一个k k+1+1元方程组元方程组正规方程正规方程变成矩阵形式ikikkiikiikiiiikikiiiikikiiYXXXXXXXYXXXXXXXYXXXnkii222110111222110221101ikiiiikkiikiikiikiiiikiiiYXYXYXXXXXXXXXXXXXXXnkii121022111221211YXXXBYXBXX1)(22111221121kikiikiikiikiiiiikiiiXXXXXXXXXXXXXXXnXXkB210ikiiiiYXYXYYX1uuuXXXXXXX
16、XXYYYnkknkknnnUBXY2121021222211121121111令最小二乘法的矩阵表示1002)()()()(), 0(2112212kneeYXXXBBXXYXBQBXXBYXBYYYXBBXYBXXBYXBBXYYYBXYXBYQBXYBXYeeBXYYYEyyQeBXYINUUXBYBXYniniiiie?为什么正规方程的结构正规方程的结构Y 被解释变量观测值被解释变量观测值 n x 1X 解释变量观测值(含虚拟变量解释变量观测值(含虚拟变量n x (k+1) )XX 设计矩阵(实对称设计矩阵(实对称(k+1) x (k+1)矩阵矩阵 )XY 正规方程右端正规方程右端 (
17、k+1) x 1 回归系数矩阵回归系数矩阵 (k+1) x 1 高斯乘数矩阵,高斯乘数矩阵, 设计矩阵的逆设计矩阵的逆 残差向量(残差向量( n x 1 ) 被解释变量的拟合(预测)向量被解释变量的拟合(预测)向量 n x 1B1)(XXeYYXXXBYXBXX1)(2.最小二乘估计量的性质最小二乘估计量的性质 线性(估计量都是被解释变量观测值的线性组合) 无偏性(估计量的数学期望=被估计的真值) 有效性(估计量的方差是所有线性无偏估计中最小的)1)1)线性线性YXXXB)(1因为因为X X的元素是非随机的,的元素是非随机的,( (X X X X) ) -1-1X X是一个常数矩阵,由上式知是
18、一个常数矩阵,由上式知是是Y Y的线性组合,为线性估计量。具有线性特性的线性组合,为线性估计量。具有线性特性B2) 2) 无偏特性无偏特性有无偏性。的线线性无偏估计量, 是B (3.12) B = E(u) XX)(X+ = u) + (X XX) E(X = Y XX) E(X = ) E( ,可得0 = E(u)利用1 -1 - 1 -BBBB3) 3) 有效性有效性)()()()()()()()()()()()()()()() )()()() )()(1111111111122)1()1(XXXXXXXXUUEXXXUUEXXXXXXUUXXXEBUXBXXXBUXBXXXEBYXXXB
19、YXXXEBBBBEBEBBEBEBCovxExExCovkk具有最小方差特性。具有最小方差特性。随机误差项的方差随机误差项的方差 的估计量的估计量22 M = M M2=MM = M 利用上述性质,残差平方和利用上述性质,残差平方和 e e = (M u) (M u) = u M M u= u M u= u I - X (X X )-1 X uE(e e) = E tru (I - X (X X )-1 X ) u = tr( I - X (X X )-1 X ) E(u u )=(n-K-1)12knee3. 3. 样本容量问题样本容量问题 样本是一个重要的实际问题,模型依赖于实际样本。样
20、本是一个重要的实际问题,模型依赖于实际样本。 获取样本需要成本,企图通过样本容量的确定减轻获取样本需要成本,企图通过样本容量的确定减轻收集数据的困难。收集数据的困难。 最小样本容量:满足基本要求的样本容量最小样本容量:满足基本要求的样本容量样本容量问题样本容量问题(XX)-1存在存在| XX |0 XX 为为k+1阶的满秩阵阶的满秩阵R(AB) min(R(A),R(B)R(X) k+1因此,必须有因此,必须有nk+1,此为最小样本容量,此为最小样本容量YXXXB1)(满足基本要求的样本容量满足基本要求的样本容量 一般经验认为:n 30或者n 3(k+1)才能满足模型估计的基本要求。n 3(k
21、+1)时,t分布才稳定,检验才较为有效3 3 线性回归模型的统计检验线性回归模型的统计检验1 1 拟合优度检验拟合优度检验2 2 方程的整体显著性方程的整体显著性3 3 参数的显著性检验参数的显著性检验 回归分析是要通过样本所估计的参数来代替总体的回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归。真实参数,或者说是用样本回归线代替总体回归。 尽管从统计性质上已知,如果有足够多的尽管从统计性质上已知,如果有足够多的重复重复 抽抽样,样,参数的估计值的期望(均值)就等于其总体的参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于
22、参数真值,但在一次抽样中,估计值不一定就等于该真值。该真值。 那么,在一次抽样中,参数的估计值与真值的差异那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。有多大,是否显著,这就需要进一步进行统计检验。 主要包括主要包括拟合优度检验、变量的显著性检验及模型拟合优度检验、变量的显著性检验及模型整体的显著性检验。整体的显著性检验。1.1.拟合优度检验拟合优度检验 拟合优度拟合优度指用指用 样本回归线对样本观察值的样本回归线对样本观察值的拟合程度拟合程度. .(1) 总离差平方和的分解总离差平方和的分解YX0*9Y*Y9YYYyiiYYyiiiiiYYeYYy
23、iiYYyiiiiiYYe由回归方程解释的部分,表示解释变量X对Y的线性影响残差项,表示回归方程不能解释的部分2iy2iy2ie总离差平方和(总离差平方和(TSSTSS)回归平方和(回归平方和(ESS)残差平方和(残差平方和(RSS)(1)总离差平方和的分解注意英文缩小的含义注意英文缩小的含义 TSS:Total Square Sum / 总离差平方和总离差平方和 RSS:Residual Square Sum / 残差平方和残差平方和 ESSExplain Square Sum / 解释平方和(回归平方和)解释平方和(回归平方和)平方和分解的意义平方和分解的意义 TSS=RSS+ESS 被解
24、释变量Y总的变动(差异)= 解释变量X引起的变动(差异) + 除X以外的因素引起的变动(差异) 如果如果X引起的变动在引起的变动在Y的总变动中占很大比例,那么的总变动中占很大比例,那么X很好地解释了很好地解释了Y;否则,;否则,X不能很好地解释不能很好地解释Y。122Knei(2)(2)样本可决系数样本可决系数v样本可决系数是拟合优度评价的最重要指标,残差的标准差也能作为拟合优度评价的参考指标v样本可决系数(The coefficient of Determination)R2v随机项的方差2的最小二乘估计量222)(11iiiyYYTSSRSSTSSESSR相关系数相关系数 计算方法与样本决
25、定系数一样 含义有所不同:样本可决系数是判断回归方程与样本观测值拟合优度的一个数量指标,隐含的前提条件是X和Y具有因果关系相关系数是判断两个随机变量线性相关的密切程度,不考虑因果关系。(3)(3)调整的可决系数调整的可决系数(adjusted coefficient of detemination) 增加解释变量时,很可能增加增加解释变量时,很可能增加R2,容易引起错觉,认,容易引起错觉,认为只要在回归模型中增加解释变量就可以了,因此考为只要在回归模型中增加解释变量就可以了,因此考虑对虑对R R2 2进行修正进行修正1112nTSSknRSSR思考:调整的可决系思考:调整的可决系数能否为负?如
26、果为数能否为负?如果为负,说明什么问题?负,说明什么问题?TSSRSSTSSESSR12注意注意TSSTSS、ESSESS、RSSRSS的自由度的自由度 TSS(离差平方和离差平方和): n-1 RSS(残差平方和残差平方和):n-k-1 ESS(回归平方和回归平方和):k= n-1赤池信息准则和施瓦茨准则赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的为了比较所含解释变量个数不同的多元回归模型的拟合优度拟合优度,常用的标准还有常用的标准还有赤池信息准则和施瓦茨准则赤池信息准则和施瓦茨准则赤池信息准则的定义为赤池信息准则的定义为: :AIC = = ln( ee/n) +
27、2(k+1)/n施瓦茨准则的定义为施瓦茨准则的定义为: :SC = = ln( ee/n) +(k/n)ln n上面的两个准则均要求仅当所增加的解释变量能够减少上面的两个准则均要求仅当所增加的解释变量能够减少AICAIC和和SCSC的值时的值时, ,才允许在模型中增加该解释变量才允许在模型中增加该解释变量2.2.方程整体线性的显著性检验方程整体线性的显著性检验(F(F检验检验) )HHknkFknkFknRSSkESSknyykyyFkyyRSSkyyESSuxxxyFyyHHiiiiiiikkiiiiiki002222222221210) 1,() 1,() 1/(/) 1()(/)(/0:
28、0, 0, 0:22110,否则,不拒绝拒绝若分布,有一组样本的平方和服从服从正态分布,由于至少其中一个不为v检验估计的回归方程作为一个整体的统计显著性3.3.参数估计量的参数估计量的t t检验检验10000111122222( )( )(,)kkkkiiiiCov BXXcccVar BXXccXXNc 主对角线主对角线上的元素称为高斯乘数,乘上就是对应系数的方差v检验回归方程中每个解释变量的统计显著性3.3.参数估计量的参数估计量的t t检验检验v检验回归方程中每个解释变量的统计显著性22200/20(1)11 (1)0()11| |0,iiiiiiiiiiiiiiyyeeeen kn k
29、n ktt n kteeeeSn kn ktttppHcctHH :成立下,若拒绝认为与 有显著的差异或者根据 查分布表的概率 若拒绝参数的置信区间参数的置信区间) 1(1kntkncStiiiiiiiee容易推出:在(1-)的置信水平下i的置信区间是 (,)iitstsii22其中,t/2为显著性水平为 、自由度为n-k-1的t分布的临界值。 回归模型统计检验的步骤回归模型统计检验的步骤(1) 查看拟合优度,进行查看拟合优度,进行F检验,从整体上判断回归方程检验,从整体上判断回归方程是否成立,如果是否成立,如果F检验通不过,无须进行下一步;否检验通不过,无须进行下一步;否则进行下一步则进行下
30、一步(2) 查看各个变量的t值及其相应的概率,进行t检验,如果相应的概率小于给定的显著水平,该自变量的系数显著地不为0,该自变量对因变量作用显著;否则系数与0无显著差异(本质上=0),该自变量对因变量无显著的作用,应从方程中删去,重新估计方程。 但是,一次只能将最不显著(相应概率最大)的删除。每次删除一个,直至全部显著。4 4 线性回归模型的预测线性回归模型的预测对于模型 BXY00给定样本以外的解释变量的观测值X0=(1,X01,X02,X0k),可以得到被解释变量的预测值:它可以是总体均值E(Y0)或个值Y0的预测。但严格地说,这只是被解释变量的预测值的估计值,而不是预测值。为了进行科学预
31、测,还需求出预测值的置信区间,包括E(Y0)和Y0的置信区间。 BXY1. E(1. E(Y Y0 0) )的置信区间的置信区间易知 )()()()(00YEEEYEBXBXBX000002000000000000000)()()()()()()()()()()()()()()()()()()()(111111111112XXXXXXXXXXXXNNEXXXXUUEXXXXXXXXNNXXXEXXBNXBXXXBNXBXXXEXXBYXXXBYXXXEXXBBBBEXXBBBBXEYVarxExExVar容易证明 ) 1(knt)E(YY00010XX)X(X于是,得到(1-)的置信水平下E(
32、Y0)的置信区间: 010000100)()()(22XXXXXXXXtYYEtY其中,t/2为(1-)的置信水平下的临界值。),(020XX)X(XBX100NY2. 2. Y Y0 0的置信区间的置信区间 如果已经知道实际的预测值Y0,那么预测误差为:000YYe容易证明 )(1 ()()()(01022100200XXXXXXXXEeEeVar0)()()()(100000000XXXXBBXBXBXEEEeEe0服从正态分布,即 )(1 (, 0(01020XXXXNe)(1 (010220XXXXe构造t统计量 ) 1(000kntYYte可得给定(1-)的置信水平下Y0的置信区间:
33、 010000100)(1)(122XXXXXXXXtYYtY5 5 极大似然估计极大似然估计(Maximum Likelihood) 极大似然估计极大似然估计 基本原理:当从模型总体随机抽取容量为基本原理:当从模型总体随机抽取容量为n n的的一组样本观测值后,最合理的参数估计量应该一组样本观测值后,最合理的参数估计量应该使得从模型中抽取该组样本观测值的概率最大。使得从模型中抽取该组样本观测值的概率最大。在满足基本假设条件下,对一元线性回归模型: iiiXY10随机抽取容量为容量为n n的一组样本观测值后的一组样本观测值后(Xi, Yi)(i=1,2,n)。假如模型的参数估计量已经求得,为那么
34、Yi服从如下的正态分布:),(210iiXNY于是,Y的概率函数为:2102)(2121)(iiXYieYP(i=1,2,n)因为Yi是相互独立的,所以的所有样本观测值的联合概率,也即似然函数似然函数(likelihood function)(likelihood function)为: ),(),(21210nYYYPL 21022)(21)2(1iinXYne将该似然函数极大化,即可求得到模型参数的极大似然估计量。由于似然函数的极大化与似然函数的对数的极大化是等价的,所以,取对数或然函数如下:2102*)(21)2ln()ln(iiXYnLL解得模型的参数估计量为: 2212220)()(
35、iiiiiiiiiiiiiXXnXYXYnXXnXYXYX可见,在满足一系列基本假设的情况下,模型结构参数的极大似然估计量极大似然估计量与普通最小二乘估计量普通最小二乘估计量是相同的。6 6受约束回归受约束回归一、模型参数的线性约束一、模型参数的线性约束 一般地一般地, ,估计线性模型时估计线性模型时, ,可对模型参数施加若干个可对模型参数施加若干个线性约束条件线性约束条件, ,例如对模型例如对模型: :uXXXyKk22110可施加约束可施加约束:kk121, 1于是上面的模型转化为于是上面的模型转化为:*1133*10*1uXXXykk采用普通最小二乘法得到参数的估计结果是采用普通最小二乘
36、法得到参数的估计结果是:1310,k再由约束条件再由约束条件: :可得: 能否对直接施加了约束条件的模型进行估计能否对直接施加了约束条件的模型进行估计? ?这需进一这需进一步的检验步的检验, ,常用的检验方法有常用的检验方法有F F检验检验, ,x x2 2检验与检验与t t检验检验kk121, 1k,2 记无约束条件模型的矩阵表示式为记无约束条件模型的矩阵表示式为eBXy1记受约束条件模型的矩阵表示式记受约束条件模型的矩阵表示式:于是于是,受约束样本回归模型的残差项可写为受约束样本回归模型的残差项可写为:受约束样本回归模型的残差平方和受约束样本回归模型的残差平方和RSSR为为:eBXy1)(
37、BBXeBXeBXBXYe)()(BBXXBBeeee于是于是: : 由于无论对于无约束的回归模型还是受约束的回归模型由于无论对于无约束的回归模型还是受约束的回归模型, ,Y Y的总的离差平方和的总的离差平方和TSSTSS相同相同, ,因此因此eeeeuRSSee的残差平方和为无约束样本回归模型RRuRuRESSESSRSSRSSTSSTSS因此因此,通常情况下通常情况下,受约束的回归模型的解释能力较无受约束的回归模型的解释能力较无约束回归模型来说要差约束回归模型来说要差 但如果约束条件为真但如果约束条件为真, ,则无约束条件模型与受约束则无约束条件模型与受约束条件模型有相同的解释能力条件模型
38、有相同的解释能力, ,即有即有由于由于:) 1(22knxRSS故故:.,的真实性的大小来检验约束条件因此我们一般用的差异小与uRuRRSSRSSRSSRSS)1(22UUknxRSS) 1(22RRknxRSS)(22RUURkkxRSSRSS 因此因此, ,我们可以采用此统计量进行我们可以采用此统计量进行x x2 2检验检验, ,当当22未未知时知时, , 采用它的估计量代替采用它的估计量代替. .) 1,(1URUUURUURknkkFknRSSkkRSSRSSFF统计量无需估计随机扰动项的方差统计量无需估计随机扰动项的方差2差差,根据该根据该统计量统计量,如果约束条件无效如果约束条件无
39、效,则则F值较大值较大,当对给定当对给定的显著性水平的显著性水平,有有FF认为约束条件无效认为约束条件无效当当2未知时未知时, 可以构造可以构造F统计量统计量FF 认为约束条件有效认为约束条件有效二、对回归模型增加或减少解释变量二、对回归模型增加或减少解释变量对如下的两个回归模型对如下的两个回归模型: :) 1 (22110uXXXyKk 对模型中要不要增加解释变量对模型中要不要增加解释变量, ,哪些解释变量要去掉哪些解释变量要去掉? ? t t检验可以对单个变量的取舍进行判断检验可以对单个变量的取舍进行判断; ; F F检验除了能对单个变量进行取舍判断外检验除了能对单个变量进行取舍判断外,
40、,还可以对多还可以对多 个变量的取舍进行判断个变量的取舍进行判断. . 因此对模型解释变量取舍的问题的检验因此对模型解释变量取舍的问题的检验, ,我们经常采用我们经常采用的是的是F F检验检验. .) 2(1122110uXXXXXyqKqkKkKk 其中其中(1)(1)式可看成是对式可看成是对(2) (2) 式施加的如下的约束条式施加的如下的约束条件的受约束回归件的受约束回归: :0:210qkkkH相应的相应的F统计量为统计量为:如果约束条件为真如果约束条件为真,则说明则说明F统计量较小统计量较小,无须加进这无须加进这q个解释变量个解释变量;否则否则F统计量较大统计量较大,约束条件为假约束
41、条件为假,说明这说明这q个解释变量对个解释变量对Y有较强的解释能力有较强的解释能力,)1(,() 1(qknqFqknRSSqRSSRSSFUUR另外另外: :由由)1(,()1(1)1()()1(222qknqFqknRqRRqknRSSqESSESSqknRSSqRSSRSSFURUURUUUR程的可决系数程的可决系数,表明通过增减前后回归方程的可决系数表明通过增减前后回归方程的可决系数R2是否有足够大的变化来判断变量的增减与否是否有足够大的变化来判断变量的增减与否22RURR 与分别为无约束回归与受约束回归方分别为无约束回归与受约束回归方三三, ,参数的稳定性检验参数的稳定性检验) 1
42、(22110uXXXyKk对该模型对该模型,结构上可能发生变化结构上可能发生变化,怎么检验怎么检验?1. 邹氏参数的稳定性检验邹氏参数的稳定性检验)2(22110uXXXyKk检验的问题是检验的问题是:iiH:0)1( 2, 1() 1( 212121knnkFknnRSSkRSSRSSFUUR三三, ,参数的稳定性检验参数的稳定性检验) 1 (22110uXXXyKk对该模型对该模型,结构上可能发生变化结构上可能发生变化,怎么检验怎么检验?1. 邹氏预测检验邹氏预测检验)2(22110uXXXyKk检验的问题是检验的问题是:0:0H)1(,() 1(1212knnFknRSSnRSSRSSF
43、UUR四四, ,非线性约束非线性约束1. 最大似然比检验最大似然比检验(LR)2. 沃尔德检验沃尔德检验(WD)3. 拉格朗日乘数检验拉格朗日乘数检验(LM) 实例实例一、回归分析报告(总结本章例子的过程,再写出回归分析报告) 例:家庭人均生活性消费支出Y与人均可支配收入X 的资料如下(单位:十元) : XYXY16058360033643480290858100722576503120102144001040412240415012422500153761860051801463240021316262806210159441002528133390724016857600282244032
44、082701817290032761488709300194900003763658200103302111089004452169630合计19501428454500226108318660回归分析报告(书写格式)1648.41189808. 0)2772.20()5301. 6()0267. 0()7008. 5(5414. 0227.372FdfrtesXY总结总结: 回归分析的工作步骤回归分析的工作步骤(二) 估计参数(三) 检验模型 经济意义检验; 统计推断检验; 基本假设检验; 预测检验; (计算机仿真技术判 断模型参数估计值 的可信度及模型的 功效等)。(一) 设定模型(四) 应用模型 经济预测; 经济结构分析; 政策评价; (通过政策模拟提供制定 经济政策的依据)