1、第二章回顾n总体回归模型(因果关系)、总体回归函数、随机误差变量、模型的假设;n样本回归模型、样本回归函数、残差;n最小二乘估计OLS、估计的性质、高斯n-马尔可夫定理(BLUE)、参数估计值、估计值标准差、回归标准差、残差平方和(Eviews);n统计检验:拟合度检验、显著性检验n预测应用:点预测、区间预测第三章 多元线性回归分析n第一节 多元线性模型的参数估计n第二节 多元线性模型的统计检验n第三节 多元线性模型预测n第四节 非线性模型的线性化第一节 多元线性模型的参数估计n一般的多元线性计量经济模型:其中,k为解释变量个数。被解释变量y与解释变量 之间都存在着线性随机关系。即一个结果由多
2、个原因来解释。表示样本数据的顺序,n为样本容量。(3.1.1)实际上有n个方程。3.1.1 ,2,1 22110niuXXXYikikiiikXXX,21ni,2,1多元线性回归模型的基本假设n1、随机误差项的均值为零n2、随机误差项各分量的方差相等(等方差)n3、随机误差项在不同样本点之间是独立的,不存在序列相关。即n4、随机误差项与解释变量之间不相关。即n5、解释变量 为确定性变量(非随机变量)。且 之间互不相关。n6、随机误差项服从正态分布。0iuE niuVaruDuii,2,1,2jiuuCovji,0,kniuXCovij,1,2,j .,2,1,0,jXkXXX,21iu2,0u
3、N多元线性模型参数OLSn对于模型(3.1.1),可以写成另一种形式:n其中:(3.1.2)NXBY1211)1(10)1(21222121211111,111X ,2nnkkknknnnkknnuuuNBXXXXXXXXXYYYY特征函数:nOLS准则:n由上式推出的特征方程为:n矩阵形式:n其中n ,所以有211221102)(ninikikiiiiXXXYuQ),(,1010kkQMinQQ(3.1.3),0,1,2,0,2,1,0,kjQkjjjjeeeYYuQTiniiinii22112BXYeeeen21BXYBXYeeTT)((3.1.3)相当于:n即:n所以有:两边左乘n思考:
4、k=1时,(3.1.5)能否成立?kjeejT,2,1,0 ,0(3.1.4)0TTBBXYBXY(3.1.5)1YXXXBTTOLS YXBXXTT 1XXT多元回归模型 OLS的特征n1、样本均值 落在回归直线上;n2、Y的理论估计值 的均值即为 ;n3、残差一阶和为0:n4、残差与解释变量不相关:n5、残差与y的理论预测值亦不相关:YYXXXk,210ie0,0,021kiiiiiiXeXeXe0iiYeY 例题例题:中国居民人均消费模型中国居民人均消费模型目的:考察中国居民收入与消费支出的关系。表表 2.5.1 中中国国居居民民人人均均消消费费支支出出与与人人均均 GDP(元元/人人)
5、年份 人均居民消费 CONSP 人均GDP GDPP 年份 人均居民消费 CONSP 人均GDP GDPP 1978 395.8 675.1 1990 797.1 1602.3 1979 437.0 716.9 1991 861.4 1727.2 1980 464.1 763.7 1992 966.6 1949.8 1981 501.9 792.4 1993 1048.6 2187.9 1982 533.5 851.1 1994 1108.7 2436.1 1983 572.8 931.4 1995 1213.1 2663.7 1984 635.6 1059.2 1996 1322.8 288
6、9.1 1985 716.0 1185.2 1997 1380.9 3111.9 1986 746.5 1269.6 1998 1460.6 3323.1 1987 788.3 1393.6 1999 1564.4 3529.3 1988 836.4 1527.0 2000 1690.8 3789.7 1989 779.7 1565.9 其中GDPP:人均国内生产总值人均国内生产总值(1990年不变价)CONSP:人均居民消费人均居民消费(以居民消费价格指数(1990=100)缩减)。该两组数据是19782000年的时间序列数据时间序列数据(time series data);1、建立一元模型
7、、建立一元模型 拟建立如下总体一元回归模型 采用Eviews软件软件进行回归分析的结果见下表 tttuGDPPCONSP10 表表 2.5.2 中中国国居居民民人人均均消消费费支支出出对对人人均均 GDP的的回回归归(19782000)LS/Dependent Variable is CONSP Sample:1978 2000 Included observations:23 Variable Coefficient Std.Error t-Statistic Prob.C 201.1071 14.88514 13.51060 0.0000 GDPP1 0.386187 0.007222 5
8、3.47182 0.0000 R-squared 0.992709 Mean dependent var 905.3331 Adjusted R-squared 0.992362 S.D.dependent var 380.6428 S.E.of regression 33.26711 Akaike info criterion 7.092079 Sum squared resid 23240.71 Schwarz criterion 7.190818 Log likelihood -112.1945 F-statistic 2859.235 Durbin-Watson stat 0.5502
9、88 Prob(F-statistic)0.000000 一般可写出如下回归分析结果:(13.51)(53.47)R2=0.9927 F=2859.23 DW=0.5503 T统计量 2、模型检验、模型检验 R2=0.9927T值:C:13.51,GDPP:53.47 临界值:t0.05/2(21)=2.08斜率项:00.38621,符合绝对收入假说3、预测、预测 2001年:GDPP=4033.1(元)(90年不变价)点估计:CONSP2001=201.107+0.38624033.1=1758.7(元)2001年实测实测的CONSP(1990年价):1782.2元,相对误差相对误差:-1.
10、32%。2001年人均居民消费的预测区间预测区间 人均GDP的样本均值样本均值与样本方差样本方差:E(GDPP)=1823.5 Var(GDPP)=982.042=964410.4 在95%的置信度下,E(CONSP2001)的预测区间的预测区间为:)4.964410)123()5.18231.4033(231(22371.23240306.27.17582 =1758.740.13或:(1718.6,1798.8)同样地,在95%的置信度下,CONSP2001的预测区间的预测区间为:)4.964410)123()5.18231.4033(2311(22371.23240306.27.1758
11、2 =1758.786.57或 (1672.1,1845.3)将模型改为多元线性的参数估计将模型改为多元线性的参数估计在本例中,前面已建立了中国居民人均消费中国居民人均消费一元线性模型。这里我们再考虑建立多元线性模型。解释变量:解释变量:人均GDP-GDPP 前期消费-CONSP(t-1)被解释变量被解释变量:消费-CONSP估计区间估计区间:19792000年ttttuCONSPGDPPCONSP1210Eviews软件估计结果 LS/Dependent Variable is CONS Sample(adjusted):1979 2000 Included observations:22
12、after adjusting endpoints Variable Coefficient Std.Error t-Statistic Prob.C 120.7000 36.51036 3.305912 0.0037 GDPP 0.221327 0.060969 3.630145 0.0018 CONSP(-1)0.451507 0.170308 2.651125 0.0158 R-squared 0.995403 Mean dependent var 928.4946 Adjusted R-squared 0.994920 S.D.dependent var 372.6424 S.E.of
13、 regression 26.56078 Akaike info criterion 6.684995 Sum squared resid 13404.02 Schwarz criterion 6.833774 Log likelihood -101.7516 F-statistic 2057.271 Durbin-Watson stat 1.278500 Prob(F-statistic)0.000000 多元回归模型高斯马尔可夫定理n若多元线性模型满足计量经济基本假设(比一元模型多一个),则参数的最小二乘估计是最小方差的线性无偏估计。(BLUE)n高斯马尔可夫定理的初步证明(与一元模型类似
14、)多元OLS下的统计推断n1、随机误差变量 的方差估计值n2、参数估计量 的样本方差iu)1(22kneiu的对角线元。为矩阵(,122),2,10,XXckjcTjjujjjj第二节 多元线性模型的统计检验一、拟合度检验:定义判定系数 R2n修正的 检验(意义避免多解释变量少样本数后可能的R2 虚高):TSSRSSTSSESSYYeYYYYRiiii1122222(3.2.1)102 R2R(3.2.2)1(111)1(122222YYeknnnYYkneRiiii二、显著性检验n1、方程显著性检验(F-检验)n统计量:n2、参数的显著性检验(t-检验)n统计量:n具体检验步骤同一元线性回归
15、分析。(3.2.3)122knekYYFiikjStjjj,2,1,0 ,第三节 多元线性模型预测问题的提出:n预测问题:给出解释变量的某个样本以外的值 ,求相应的被解释变量的预测值 。n点预测与区间预测。n一、和 点预测(估计)值:n有结论:点预测值是 和 的无偏估计fY),(21kfffXXXfYfffkfkfffuBXuXXXY22110)(fYEBXXXXYfkfkfff22110fY)(fYEBXBEXBXEYEYEfffff)()()()(二、多元模型的区间预测n1、点预测 的总体方差:n 其中:n2、预测残差 的总体方差:n均值预测置信区间:n个值预测置信区间:n置信度:1-fY
16、 21uTfTffXXXXYDkffffXXXX,121fe 21)1(uTfTffXXXXeD ffyffyfStYYEStY22ffeffefStYYStY22第四节 非线性模型的线性化所谓线性模型有二种线性范畴:1、模型形式是线性的;2、模型变量也是线性的(一次);一、非标准线性模型 的标准化特征:有线性模型的形式,但变量非完全线性。1.倒数变换模型:(令 )2.双对数模型:3.半对数模型:(对数函数)(指数函数)4.多项式模型:(令 )xbay1*1xx xbayln)ln(xbaylnxbayln2210 xxy221,xxxx二、非线性模型的标准线性化n特征:变量与方程均非线性。n
17、1、间接代换:如 作对数变换n有:,可线性化。n2、不可线性模型的处理,如:n二种方法:a.泰勒展开近似取作多项式函数,再作线性变换;b.直接利用Eviews软件中的NLS估计法求参数估计值。nDependent VariableuKLAQlnlnlnlnuxxyx322110KALQ 作业三:nP87:1,3,4n补充练习:通过统计年鉴找出国家地区行业(选其中之一)的历年的产值Q、资金投入值K、劳力投入值L,利用Cobb-Douglas模型进行回归分析,并对结果进行统计检验。nCobb-Douglas模型原型:n线性化后的计量模型为:n补充练习可用Email交,但须附上原始数据。uKLAQlnlnlnlnKLAQ我的电子邮箱:Z