《数学多元回归》课件.ppt_163文库

资源描述

1、第三章第三章经典单方程计量经济学模型：经典单方程计量经济学模型：多元回归多元回归第三章第三章经典单方程计量经济学模型：多元回归经典单方程计量经济学模型：多元回归 n多元线性回归模型多元线性回归模型n多元线性回归模型的参数估计多元线性回归模型的参数估计n多元线性回归模型的统计检验多元线性回归模型的统计检验n多元线性回归模型的预测多元线性回归模型的预测n非线性模型的线性化非线性模型的线性化n回归模型的参数约束回归模型的参数约束3.1 多元线性回归模型多元线性回归模型一、多元线性回归模型的形式一、多元线性回归模型的形式二、多元线性回归模型的基本假定二、多元线性回归模型的基本假定一、多元线性

2、回归模型的形式一、多元线性回归模型的形式多元线性回归模型多元线性回归模型:表现在线性回归模型中的表现在线性回归模型中的解释变量有多个。解释变量有多个。一般表现形式：一般表现形式：其中其中:k为解释变量的数目，为解释变量的数目，j j称为称为回归参数回归参数（regression coefficient）。）。习惯上：把习惯上：把常数项常数项看成为一看成为一虚变量虚变量的系数，的系数，该虚变量的样本观测值始终取该虚变量的样本观测值始终取1。这样：。这样：模型中解释变量的数目为（模型中解释变量的数目为（k+1+1）kkXXXY22110也被称为也被称为总体回归函数总体回归函数的的随机表达形式随机

3、表达形式。它。它的的非随机表达式非随机表达式为为:方程表示：方程表示：各变量各变量X X值固定时值固定时Y Y的平均响应的平均响应。j也被称为也被称为偏回归系数偏回归系数，表示在其他解释变，表示在其他解释变量保持不变的情况下，量保持不变的情况下，Xj每变化每变化1个单位时，个单位时，Y的均值的均值E(Y)的变化的变化;或者说或者说j给出了给出了Xj的单位变化对的单位变化对Y均值的均值的“直直接接”或或“净净”（不含其他变量）影响。（不含其他变量）影响。kkXXXY22110kkkXXXXXXYE2211021),|(样本回归函数样本回归函数：用来估计总体回归函数：用来估计总体回归函数其其随机

4、表示式随机表示式:e 称为称为残差残差或或剩余项剩余项(residuals)，可看成，可看成是总体回归函数中随机扰动项是总体回归函数中随机扰动项的近似替代。的近似替代。eXXXYkk22110kkXXXY22110二、多元线性回归模型的基本假定二、多元线性回归模型的基本假定假设假设1 1，回归模型正确设定。，回归模型正确设定。假设假设2 2，解释变量是非随机的或固定的，且解释变量是非随机的或固定的，且假设假设3 3，各解释变量，各解释变量X X在所抽取的样本中具有变异性，且在所抽取的样本中具有变异性，且样本容量趋于无穷时，各解释变量的方差趋于有界常数，样本容量趋于无穷时，各解释变量的方差趋

5、于有界常数，即即n时时假设假设4 4，随机误差项具有零均值、同方差及不序列相关性，随机误差项具有零均值、同方差及不序列相关性0)(iE22)()(iiEVar0)(),(jijiECovnjiji,2,1,假设假设5，解释变量与随机项不相关，解释变量与随机项不相关 0),(ijiXCov假设假设6，随机项满足正态分布，随机项满足正态分布),0(2Nikj,2,1 jjjijiQXXnxn22)(11各各X之间互不之间互不相关（无多重共线性）。相关（无多重共线性）。3.2 多元线性回归模型的估计多元线性回归模型的估计估计方法：估计方法：OLS、ML或者或者MM一、普通最小二乘估计一、普通最小二

6、乘估计 *二、最大或然估计二、最大或然估计 *三、矩估计三、矩估计四、参数估计量的性质四、参数估计量的性质五、样本容量问题五、样本容量问题六、估计实例六、估计实例一、普通最小二乘估计一、普通最小二乘估计对于随机抽取的对于随机抽取的n组观测值组观测值如果如果样本函数样本函数的参数估计值已经得到，则有：的参数估计值已经得到，则有：i=1,2n根据根据最小二乘原理最小二乘原理，参数估计值应该是下列方程组的解，参数估计值应该是下列方程组的解 0000210QQQQk其中2112)(niiiniiYYeQ2122110)(nikikiiiXXXYikkiiiXXXY22110,.,2,1;,.2

7、,1),(kjniYXiij于是得到关于待估参数估计值的于是得到关于待估参数估计值的正规方程组正规方程组：kiikikikiiiiikikiiiiiikikiiikikiiXYXXXXXYXXXXXYXXXXYXXX)()()()(221102222110112211022110 解该（k+1）个方程组成的线性代数方程组，即可得到(k+1)个待估参数的估计值,jjk 012。随机误差项随机误差项的方差的方差的无偏估计的无偏估计可以证明，随机误差项可以证明，随机误差项的方差的无偏估计量为的方差的无偏估计量为 1122knkneiee 四、参数估计量的性质四、参数估计量的性质在满足基本假

8、设的情况下，其结构参数在满足基本假设的情况下，其结构参数的的普通普通最小二乘估计最小二乘估计仍具有：仍具有：线性性线性性、无偏性无偏性、有效性有效性。同时，随着样本容量增加，参数估计量具有：同时，随着样本容量增加，参数估计量具有：渐近无偏性、渐近有效性、一致性渐近无偏性、渐近有效性、一致性。1、线性性、线性性 CYYXXX1)(其中其中,C=(XX)-1 X 为一仅与固定的为一仅与固定的X有关的行向量有关的行向量 2、无偏性、无偏性 XXXXXXXYXXX11)()()()()()(1EEEE这里利用了假设:E(X)=0 3、有效性（最小方差性）、有效性（最小方差性）其中利用了 YXXX1)

9、(XXXXXXX11)()()(和I2)(E 五、样本容量问题五、样本容量问题所谓所谓“最小样本容量最小样本容量”，即从最小二乘原理，即从最小二乘原理和最大或然原理出发，欲得到参数估计量，不管和最大或然原理出发，欲得到参数估计量，不管其质量如何，所要求的样本容量的下限。其质量如何，所要求的样本容量的下限。最小样本容量最小样本容量样本最小容量必须不少于模型中解释变量样本最小容量必须不少于模型中解释变量的数目（包括常数项）的数目（包括常数项）,即 n k+1因为，因为，无多重共线性要求：秩无多重共线性要求：秩(X)=)=k+1+1 2 2、满足基本要求的样本容量、满足基本要求的样本容量从统计

10、检验的角度：从统计检验的角度：n 30 时，时，Z检验才能应用；检验才能应用；n-k 8 8时时,t分布较为稳定分布较为稳定一般经验认为一般经验认为:当当n 30或者至少或者至少n 3(k+1)时，才能说满足时，才能说满足模型估计的基本要求。模型估计的基本要求。模型的良好性质只有在大样本下才能模型的良好性质只有在大样本下才能得到理论上的证明得到理论上的证明六、多元线性回归模型的参数估计实例六、多元线性回归模型的参数估计实例例例3.2.2 在例在例2.5.1中，已建立了中，已建立了中国中国居民人均消费居民人均消费一元线性模型。这里我们再一元线性模型。这里我们再考虑建立多元线性模型。考虑建立

11、多元线性模型。解释变量：人均解释变量：人均GDP：GDPP 前期消费：前期消费：CONSP(-1)估计区间估计区间：19792000年Eviews软件估计结果软件估计结果 LS/Dependent Variable is CONS Sample(adjusted):1979 2000 Included observations:22 after adjusting endpoints Variable Coefficient Std.Error t-Statistic Prob.C 120.7000 36.51036 3.305912 0.0037 GDPP 0.221327 0.060969

12、 3.630145 0.0018 CONSP(-1)0.451507 0.170308 2.651125 0.0158 R-squared 0.995403 Mean dependent var 928.4946 Adjusted R-squared 0.994920 S.D.dependent var 372.6424 S.E.of regression 26.56078 Akaike info criterion 6.684995 Sum squared resid 13404.02 Schwarz criterion 6.833774 Log likelihood -101.7516 F

13、-statistic 2057.271 Durbin-Watson stat 1.278500 Prob(F-statistic)0.000000 3.3 多元线性回归模型的统计检验多元线性回归模型的统计检验一、拟合优度检验一、拟合优度检验二、方程的显著性检验二、方程的显著性检验(F(F检验检验)三、变量的显著性检验（三、变量的显著性检验（t t检验）检验）四、参数的置信区间四、参数的置信区间一、拟合优度检验一、拟合优度检验 1、可决系数与调整的可决系数、可决系数与调整的可决系数则2222)()(2)()()()(YYYYYYYYYYYYYYTSSiiiiiiiiii 总离差平方和的分解

14、总离差平方和的分解由于)()(YYeYYYYiiiiikiikiiieYXeXee110=0所以有：ESSRSSYYYYTSSiii22)()(注意：注意：一个有趣的现象一个有趣的现象 222222YYYYYYYYYYYYYYYYYYiiiiiiiiiiii 可决系数可决系数TSSRSSTSSESSR12该统计量越接近于该统计量越接近于1，模型的拟合优度越高。，模型的拟合优度越高。问题：问题：在应用过程中发现，如果在模型中增加一个解在应用过程中发现，如果在模型中增加一个解释变量，释变量，R2往往增大（往往增大（Why?Why?)这就给人这就给人一个错觉一个错觉：要使得模型拟合得好，要使得模型拟

15、合得好，只要增加解释变量即可只要增加解释变量即可。但是，现实情况往往是，由增加解释变量个但是，现实情况往往是，由增加解释变量个数引起的数引起的R2的增大与拟合好坏无关的增大与拟合好坏无关，R2需调整需调整。调整的可决系数调整的可决系数（adjusted coefficient of determination）在样本容量一定的情况下，增加解释变量必在样本容量一定的情况下，增加解释变量必定使得自由度减少，所以定使得自由度减少，所以调整的思路是调整的思路是:将残差平将残差平方和与总离差平方和分别除以各自的自由度，以方和与总离差平方和分别除以各自的自由度，以剔除变量个数对拟合优度的影响剔除变量个数对

16、拟合优度的影响:)1/()1/(12nTSSknRSSR其中：其中：n-k-1为残差平方和的自由度，为残差平方和的自由度，n-1为总体平为总体平方和的自由度。方和的自由度。11)1(122knnRR问题：问题：多大才算通过拟合优度检验？多大才算通过拟合优度检验？2REVIEWS软件中，直接给出可决系数和调整后的软件中，直接给出可决系数和调整后的可决系数：可决系数：*2、赤池信息准则和施瓦茨准则、赤池信息准则和施瓦茨准则为了比较所含解释变量个数不同的多元回归模型为了比较所含解释变量个数不同的多元回归模型的拟合优度，常用的标准还有的拟合优度，常用的标准还有:赤池信息准则赤池信息准则（Akaike

17、 information criterion,AIC）nknAIC)1(2lnee施瓦茨准则施瓦茨准则（Schwarz criterion，SC）nnknAClnlnee 这两准则均要求这两准则均要求仅当所增加的解释变量能够减少仅当所增加的解释变量能够减少AICAIC值或值或ACAC值时才在原模型中增加该解释变量值时才在原模型中增加该解释变量。Eviews的估计结果显示：中国居民消费一元例中：AIC=6.68 AC=6.83 中国居民消费二元例中：AIC=7.09 AC=7.19从这点看，可以说前期人均居民消费CONSP(-1)应包括在模型中。二、方程的显著性检验二、方程的显著性检验(F检验检

18、验)方程的显著性检验，旨在对模型中被解释变方程的显著性检验，旨在对模型中被解释变量与解释变量之间的线性关系量与解释变量之间的线性关系在总体上在总体上是否显著是否显著成立作出推断。成立作出推断。1、方程显著性的、方程显著性的F检验检验即检验模型即检验模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n中的参数中的参数 j是否显著不为是否显著不为0。可提出如下原假设与备择假设：可提出如下原假设与备择假设：H0：0=1=2=k=0 H1：j不全为不全为0 F F检验的思想检验的思想来自于总离差平方和的分解式：来自于总离差平方和的分解式：TSS=ESS+RSS由于回归平方和2iyESS是

19、解释变量X的联合体对被解释变量 Y 的线性作用的结果，考虑比值 22/iieyRSSESS 如果这个比值较大，则如果这个比值较大，则X的联合体对的联合体对Y的解释程的解释程度高，可认为总体存在线性关系，反之总体上可能不度高，可认为总体存在线性关系，反之总体上可能不存在线性关系。存在线性关系。因此因此,可通过该比值的大小对总体线性关系进行可通过该比值的大小对总体线性关系进行推断推断。根据数理统计学中的知识，在原假设根据数理统计学中的知识，在原假设H0成成立的条件下，统计量立的条件下，统计量)1/(/knRSSkESSF服从自由度为服从自由度为(k,n-k-1)1)的的F分布分布给定显著性水平给

20、定显著性水平，可得到临界值，可得到临界值F(k,n-k-1)，由样本求出统计量由样本求出统计量F的数值，通过的数值，通过 F F F(k,n-k-1)或或 F F F(k,n-k-1)来拒绝或接受原假设来拒绝或接受原假设H0，以判定原方程，以判定原方程总体上总体上的的线性关系是否显著成立。线性关系是否显著成立。对于中国居民人均消费支出的例子：对于中国居民人均消费支出的例子：一元模型：一元模型：F=285.92 二元模型：二元模型：F=2057.3给定显著性水平给定显著性水平 =0.05，查分布表，得到临界，查分布表，得到临界值：值：一元例：一元例：F(1(1,21)=)=4.32 二元例二元例

21、：F(2(2,19)=)=3.52显然有显然有 F F F(k,n-k-1)即二个模型的线性关系在即二个模型的线性关系在95%的水平下显著成立。的水平下显著成立。2、关于拟合优度检验与方程显著性检验关关于拟合优度检验与方程显著性检验关系的讨论系的讨论由由)1/()1/(12nTSSknRSSR)1/(/knRSSkESSF可推出：kFknnR1112与或)1/()1(/22knRkRF在在中国居民人均收入中国居民人均收入-消费消费一元模型一元模型中，中，在在中国居民人均收入中国居民人均收入-消费消费二元模型二元模型中中，三、变量的显著性检验（三、变量的显著性检验（t检验）检验）方程的方程的总

22、体线性总体线性关系显著关系显著每个解释变量每个解释变量对对被解释变量的影响都是显著的被解释变量的影响都是显著的因此，必须对每个解释变量进行显著性检验，因此，必须对每个解释变量进行显著性检验，以决定是否作为解释变量被保留在模型中。以决定是否作为解释变量被保留在模型中。这一检验是由对变量的这一检验是由对变量的 t t 检验完成的。检验完成的。1、t统计量统计量由于12)()(XXCov 以以cii表示矩阵表示矩阵(XX)-1 主对角线上的第主对角线上的第i个元素，个元素，于是参数估计量的方差为：于是参数估计量的方差为：iiicVar2)(其中其中 2为随机误差项的方差，在实际计算为随机误差项

23、的方差，在实际计算时，用它的估计量代替时，用它的估计量代替:1122knkneiee),(2iiiicN因此，可构造如下t统计量)1(1kntkncStiiiiiiiee 2、t检验检验设计原假设与备择假设：设计原假设与备择假设：H1：i0 给定显著性水平给定显著性水平，可得到临界值，可得到临界值t/2(n-k-1)，由样本求出统计量由样本求出统计量t的数值，通过的数值，通过|t|t/2(n-k-1)或|t|t/2(n-k-1)来拒绝或接受原假设来拒绝或接受原假设H0，从而，从而判定对应的解释变判定对应的解释变量是否应包括在模型中。量是否应包括在模型中。H0：i=0 （i=1,2k）注意：注

24、意：一元线性回归中，一元线性回归中，t t检验与检验与F F检验一致检验一致一方面一方面，t检验与检验与F检验都是对相同的原假设检验都是对相同的原假设H0：1=0=0 进行进行检验检验;另一方面另一方面，两个统计量之间有如下关系：两个统计量之间有如下关系：222212221222122212212)2()2()2()2(txnexnexnenexneyFiiiiiiiiii在中国居民人均收入中国居民人均收入-消费支出消费支出二元模型二元模型例中，由应用软件计算出参数的t值：651.2630.3306.3210ttt 给定显著性水平=0.05，查得相应临界值：t0.025(19)=2.093。

25、可见，可见，计算的所有计算的所有t值都大于该临界值值都大于该临界值，所以，所以拒绝原假设。即拒绝原假设。即:包括常数项在内的包括常数项在内的3个解释变量都在个解释变量都在95%的水的水平下显著，都通过了变量显著性检验。平下显著，都通过了变量显著性检验。四、参数的置信区间四、参数的置信区间参数的参数的置信区间置信区间用来考察：用来考察：在一次抽样中所估在一次抽样中所估计的参数值离参数的真实值有多计的参数值离参数的真实值有多“近近”。在变量的显著性检验中已经知道：在变量的显著性检验中已经知道：)1(1kntkncStiiiiiiiee容易推出容易推出：在在(1-(1-)的置信水平下的置信水平下

26、i的置信区间是的置信区间是(,)iitstsii22其中，其中，t/2为显著性水平为为显著性水平为、自由度为、自由度为n-k-1的临界值。的临界值。在中国居民人均收入中国居民人均收入-消费支出消费支出二元模型二元模型例中,给定=0.05，查表得临界值：t0.025(19)=2.093计算得参数的置信区间：0：(44.284,197.116)1：(0.0937,0.3489)2：(0.0951,0.8080)170.04515.0061.02213.051.3670.120210210sss 从回归计算中已得到：如何才能缩小置信区间？如何才能缩小置信区间？增大样本容量增大样本容量n n，因为在

27、同样的样本容量下，因为在同样的样本容量下，n n越越大，大，t t分布表中的临界值越小，同时，增大样本容分布表中的临界值越小，同时，增大样本容量，还可使样本参数估计量的标准差减小；量，还可使样本参数估计量的标准差减小；提高模型的拟合优度提高模型的拟合优度，因为样本参数估计量的标，因为样本参数估计量的标准差与残差平方和呈正比，模型优度越高，残差准差与残差平方和呈正比，模型优度越高，残差平方和应越小。平方和应越小。提高样本观测值的分散度提高样本观测值的分散度,一般情况下，样本观一般情况下，样本观测值越分散测值越分散，(XX)-1的分母的的分母的|XX|的值越大，致的值越大，致使区间缩小。使区间缩小

28、。3.4 多元线性回归模型的预测多元线性回归模型的预测一、一、E(Y0)的置信区间的置信区间二、二、Y0的置信区间的置信区间对于模型对于模型 XY给定样本以外的解释变量的观测值给定样本以外的解释变量的观测值X0=(1,X10,X20,Xk0)，可以得到被解释变量的，可以得到被解释变量的预测值：预测值：X00Y 它可以是总体均值它可以是总体均值E(Y0)或个值或个值Y0的预测。的预测。但严格地说，但严格地说，这只是被解释变量的预测值的这只是被解释变量的预测值的估计值，而不是预测值。估计值，而不是预测值。为了进行科学预测，还需求出预测值的

29、置信为了进行科学预测，还需求出预测值的置信区间，包括区间，包括E(Y0)和和Y0的的置信区间置信区间。一、一、E(Y0)的置信区间的置信区间易知)()()()(00YEEEYEXXX000)()()(20()X(XXX0000EEYVar0102000)()()(XXXXX)(XX)(X00EEYVar容易证明),(020XX)X(XX100NY)1(knt)E(YY00010XX)X(X于是，得到于是，得到(1-(1-)的置信水平下的置信水平下E(Y0)的的置信区间置信区间：010000100)()()(22XXXXXXXXtYYEtY其中，其中，t/2/2为为(1-(1-)的置信水平下的的

30、置信水平下的临界值临界值。二、二、Y0的置信区间的置信区间如果已经知道实际的预测值如果已经知道实际的预测值Y0，那么预测误差为：，那么预测误差为：000YYe容易证明 0)()()()(100000000XXXXXXXEEEeE)(1()()()(01022100200XXXXXXXXEeEeVare0服从正态分布，即服从正态分布，即)(1(,0(01020XXXXNe)(1(010220XXXXe构造构造t统统计量计量)1(000kntYYte可得给定可得给定(1-(1-)的置信水平下的置信水平下Y0的的置信区间置信区间：010000100)(1)(122XXXXXXXXtYYtY 中国居

31、民人均收入中国居民人均收入-消费支出消费支出二元模型二元模型例中：2001年人均GDP：4033.1元，于是人均居民消费的预测值人均居民消费的预测值为 2001=120.7+0.22134033.1+0.45151690.8=1776.8（元）实测值实测值（90年价）=1782.2元，相对误差：相对误差：-0.31%预测的置信区间预测的置信区间：00004.000001.000828.000001.000001.000285.000828.000285.088952.1)(1XX3938.0010XX)X(X于是E(E(2001）的95%的置信区间为:3938.05.705093.28.177

32、6或（1741.8，1811.7）3938.15.705093.28.1776或（1711.1,1842.4）同样，易得2001的95%的置信区间为tttXXY2110.020.09.582R例：例：为了解释牙买加对进口的需求，为了解释牙买加对进口的需求，J.GafarJ.Gafar根据根据1919年年的数据得到下面的回归结果的数据得到下面的回归结果:se=(0.0092)(0.084)se=(0.0092)(0.084)R R2 2=0.96 =0.96 =0.96 =0.96其中：其中：Y=Y=进口量（百万美元），进口量（百万美元），X X1 1=个人消费支出（美元个人消费支出（美元/

33、年），年），X X2 2=进口价格进口价格/国内价格。国内价格。（1 1）解释截距项，及）解释截距项，及X X1 1和和X X2 2系数的意义；系数的意义；（2 2）Y Y的总离差中被回归方程解释的部分，的总离差中被回归方程解释的部分，未被回归方程解释的部分；未被回归方程解释的部分；（3 3）对回归方程进行显著性检验）对回归方程进行显著性检验,并解释检验结果；并解释检验结果；（4 4）对参数进行显著性检验）对参数进行显著性检验,并解释检验结果。并解释检验结果。2R（1）截距项为）截距项为-58.9，在此没有什么意义。，在此没有什么意义。X1的系的系数表明在其它条件不变时，个人年消费量增加数表明

34、在其它条件不变时，个人年消费量增加1美美元，牙买加对进口的需求平均增加元，牙买加对进口的需求平均增加0.2万美元。万美元。X2的的系数表明在其它条件不变时，进口商品与国内商品系数表明在其它条件不变时，进口商品与国内商品的比价增加的比价增加1美元，牙买加对进口的需求平均减少美元，牙买加对进口的需求平均减少0.1万美元。万美元。（2）被回归方程解释的部分为）被回归方程解释的部分为96%，未被回归方，未被回归方程解释的部分为程解释的部分为4%。（3）提出原假设）提出原假设:H0：b1=b2=0,计算统计量计算统计量 F F0.05(2,16)=3.63，拒绝原假设，回归方程显著成，拒绝原假设，回归方

35、程显著成立。立。)1/(/)1/()1(/22knRSSkESSknRkRF19216/04.02/96.0=（4）提出原假设）提出原假设:H0：b1=0,t0.025（16）=2.12，拒绝原假设，接受拒绝原假设，接受b1显著非零，说明显著非零，说明X1-个人消费支个人消费支出对进口需求有解释作用，这个变量应该留在模型中。出对进口需求有解释作用，这个变量应该留在模型中。提出原假设提出原假设:H0：b2=0 t0.025（16）=2.12，不能拒绝原假设，接受不能拒绝原假设，接受b2显著为零，说明显著为零，说明X2-进口商进口商品与国内商品的比价对进口需求没有解释作用，这个品与国内商品的比价对

36、进口需求没有解释作用，这个变量不应该留在模型中。变量不应该留在模型中。210740092.02.0)()(111bSbbT19.1084.01.0)()(222bSbbT3.5 非线性模型的线性化非线性模型的线性化一、模型的类型与变换一、模型的类型与变换二、非线性回归实例二、非线性回归实例在实际经济活动中，经济变量的关系是复杂在实际经济活动中，经济变量的关系是复杂的，直接表现为线性关系的情况并不多见。的，直接表现为线性关系的情况并不多见。如著名的如著名的恩格尔曲线恩格尔曲线(Engle curves)表现为表现为幂幂函数曲线函数曲线形式、宏观经济学中的形式、宏观经济学中的菲利普斯曲线菲利

37、普斯曲线（Pillips cuves）表现为）表现为双曲线双曲线形式等。形式等。但是，大部分非线性关系又可以通过一些简但是，大部分非线性关系又可以通过一些简单的数学处理，使之化为数学上的线性关系，从单的数学处理，使之化为数学上的线性关系，从而可以运用线性回归的方法进行计量经济学方面而可以运用线性回归的方法进行计量经济学方面的处理。的处理。一、模型的类型与变换一、模型的类型与变换 1、倒数模型（双曲函数模型）与变换、倒数模型（双曲函数模型）与变换例如，例如，商品的需求曲线是一种双曲线形式，商品需商品的需求曲线是一种双曲线形式，商品需求量求量Q与商品价格与商品价格P之间的关系为双曲线函数的形之间的

38、关系为双曲线函数的形式：式：PbaQ11令令 Y=1/Q,X=1/P，将方程转化成一元线性回，将方程转化成一元线性回归问题进行分析：归问题进行分析：Y=a+bX 一、模型的类型与变换一、模型的类型与变换 2、多项式模型与变换、多项式模型与变换例如例如，描述税收与税率关系的描述税收与税率关系的拉弗曲线拉弗曲线：抛物线抛物线 s=a+b r+c r2 c0 s：税收；：税收；r：税率：税率设设X1=r，X2=r2，则原方程变换多元线性回则原方程变换多元线性回归问题进行分析：归问题进行分析：s=a+b X1+c X2 c0 一、模型的类型与变换一、模型的类型与变换 3、双对数函数模型与变换、双对数函

39、数模型与变换双对数函数模型的双对数函数模型的一般形式为：一般形式为：令令 X*=lnX，Y*=lnY，将原方程变换为一元线性回归模，将原方程变换为一元线性回归模型进行分析：型进行分析：X*=a+bY*将对数函数方程两边微分：将对数函数方程两边微分：一般地，关于解释变量的非线性问题都可以通过一般地，关于解释变量的非线性问题都可以通过变量置换变成线性问题。变量置换变成线性问题。XbaYlnln XdXbYdYXdXYdYb b为被解释变量为被解释变量对于解释变量对于解释变量的弹性的弹性4、幂函数模型、指数函数模型与对数变换法、幂函数模型、指数函数模型与对数变换法例如例如，Cobb-Daugla

40、s生产函数生产函数：幂函数：幂函数 Q=AK L Q：产出量，：产出量，K：投入的资本；：投入的资本；L：投入的劳动：投入的劳动方程两边取对数：方程两边取对数：ln Q=ln A+ln K+ln L3、复杂函数模型与级数展开法、复杂函数模型与级数展开法方程两边取对数后，得到：eLKAQ1)(21(1+2=1)Q:产出量，K：资本投入，L：劳动投入：替代参数，1、2：分配参数)(211LKLnLnALnQ例如例如，常替代弹性CES生产函数将式中ln(1K-+2L-)在=0处展开台劳级数,取关于的线性项，即得到一个线性近似式。如取0阶、1阶、2阶项，可得 22121ln21lnlnlnln

41、LKmLmKmAY并非所有的函数形式都可以线性化并非所有的函数形式都可以线性化无法线性化模型的一般形式为:),(21kXXXfY其中，f(x1,x2,Xk)为非线性函数。如：LAKQ案例案例1：多项式模型：多项式模型重庆市直辖以来贷重庆市直辖以来贷款总（款总（LOAN）和与）和与GDP之间的关系之间的关系n重庆市自重庆市自1997至至2009年，贷款年，贷款总和（总和（LOAN）与）与地区生产总值（地区生产总值（GDP）之间关系。）之间关系。n从从散点图散点图中看二者之间呈现的关系中看二者之间呈现的关系.n由散点图发现由散点图发现Loan和和GDP呈现呈现近似线性关系近似线性关系，但是，但

42、是用用多项式方程形式多项式方程形式进行拟合似乎更加合理，因此可进行拟合似乎更加合理，因此可以尝试用不同的形式进行建模，然后根据拟合优度以尝试用不同的形式进行建模，然后根据拟合优度及其他检验方法比较不同模型的优劣。及其他检验方法比较不同模型的优劣。二、非线性回归实例二、非线性回归实例案例案例1：多项式模型：多项式模型重庆市直辖以来贷重庆市直辖以来贷款总（款总（LOAN）和与）和与GDP之间的关系之间的关系nGDP与与LOAN散点图散点图02004006008001,0000200400600800GDPLOANn由估计结果可以看到，随着多项式次数的增加，可由估计结果可以看到，随着多项式次数的增

43、加，可决系数逐渐增大，但是当加入决系数逐渐增大，但是当加入GDP的四次方项时，的四次方项时，各项的各项的t统计量值发生了变化，很多不能通过检验。统计量值发生了变化，很多不能通过检验。因此选用三次方项的估计形式。可以整理为下式：因此选用三次方项的估计形式。可以整理为下式：Loani=0+1 GDPi+2 GDPi 2+3 GDPi3+ui =-24.5932+1.6354 GDP -0.0026GDP 2 (-2.0)(11.3)(-6.3)+0.0000027 GDP 3 (7.9)R2=0.9986,DW=2.58,F=2462.483loann重庆市重庆市GDP（Y），从业人数（），从业人

44、数（L），资金（），资金（K）；）；数据（数据（1997-2009），），Y、L、K分别取对数分别取对数n散点图散点图n一般生产函数常设为一般生产函数常设为C-D函数函数，从散点图也可以看出，从散点图也可以看出该组数据的该组数据的C-D函数特征函数特征二、非线性回归实例二、非线性回归实例案例案例2：C-D函数模型函数模型重庆市重庆市GDP函数函数Y与年份的散点图与年份的散点图K与与Y的散点图的散点图L与与Y 的散点图的散点图取对数进行回归：取对数进行回归：LNKLNLLNY64.052.193.7 （-2.12）（3.0）（47.36）9969.0RF=1770.422 D.W.=1.39

45、116.264.052.11分析：分析：该模型中规模报酬增大。该模型中规模报酬增大。练习练习1题题n已知某市已知某市33个工业行业个工业行业2011年生产函数为：年生产函数为：Q=AL K eu 1.说明说明、的经济意义。的经济意义。2.写出将生产函数变换为线性函数的变换方法写出将生产函数变换为线性函数的变换方法3.假如变换后的线性回归模型的常数项估计量假如变换后的线性回归模型的常数项估计量为为，试写出，试写出A的估计式。的估计式。0n1，分别表示产出对劳动投入和资本投入的弹性分别表示产出对劳动投入和资本投入的弹性系数，系数，表明劳动投入增长表明劳动投入增长1%，产出增长的百分比，产出增长的

46、百分比；表明资本投入增长表明资本投入增长1%，产出增长的百分比。，产出增长的百分比。n 2生产函数的两边分别取自然对数生产函数的两边分别取自然对数lnQ=lnA+lnL+lnK+u 令令 QL=lnQ,LL=lnL,KL=lnK ,0=lnA则生产函数变换为则生产函数变换为QL=0+LL+KL+un 30eA 练习练习2题题n739家上市公司绩效（家上市公司绩效（NER）与基金持股比例（）与基金持股比例（RATE）关系）关系的的OLS估计结果表如下：估计结果表如下：请回答：请回答：1.计算画线处数计算画线处数字，并给出步骤。字，并给出步骤。2.给出一元回归给出一元回归表达式。表达式。3.给出一次项系给出一次项系数的经济含义。数的经济含义。

展开阅读全文