1、 计量经济学 (精编本)第一篇第一篇 导导 论论第一章第一章 计量经济学概述计量经济学概述【本章要点】本章主要介绍计量经济学的产生和发展,了解计量经济学的学科性质、基本概念与内容,掌握建立计量经济模型的主要步骤。1.1 什么是计量经济学什么是计量经济学一、计量经济学的含义一、计量经济学的含义“计量经济学是一门由经济学、统计学和数学结合而成的交叉学科,它以经济学提供理论基础,统计学提供资料依据,数学提供研究方法的一门经济学是经济的计量学或计量的经济学。”二、计量经济学在经济学中的地位二、计量经济学在经济学中的地位著名经济学家诺贝尔经济学奖获得者萨缪尔森曾经说:“第二次世界大战后的经济是经济计量的
2、时代。”诺贝尔经济学奖获得者克莱茵教授在其计量经济学教科书中阐述“经过20世纪50年代扎实的发展和60年代的扩张,计量经济学已经在经济学中居于重要地位,在大多数大学和学院中,计量经济学的讲授已经成为经济学课程中最具权威的一部分。”我们不妨看看从1969年设立诺贝尔经济学奖开始至2005年36年中共有57位获奖者,其中四分之三都是与计量经济学密切相关。直接因为对计量经济学的创立和发展做出贡献而获奖者达15位。他们或者是计量经济学理论方面做出重大贡献,或者是利用计量经济学理论和方法解决经济问题取得了杰出成就。这些诺贝尔经济学奖的获得,从一个侧面反映了计量经济学在经济科学中的地位。2003年诺贝尔经
3、济学奖再次垂青计量经济学家美国的罗伯特F.恩格尔(Robert F.Engle)和英国的克莱夫W.J.格兰杰(Clive W.J.Granger)是因为他们在时间序列数据研究方法方面的重要贡献,这再一次向世人证明计量经济学是经济学中最重要的学科之一。另一方面,绝大多数诺贝尔经济学奖获得者即使其主要贡献不在计量经济学领域,也都普遍应用了计量经济学方法。三、计量经济学的发展概况计量经济学的发展概况计量经济学从20世纪30年代诞生之日起,就显示出其强大的生命力,经过20世纪40年代至50年代的大发展及60年代的大扩张,使计量经济学在经济学中占据重要地位。20世纪60年代佛兰克莫迪里亚尼(Franco
4、 Modigliani)、默顿H.米勒(Morton H.Miller)、哈里M.马科维茨(Harry M.Markowitz)、威廉F.夏普(William F.Sharpe),将计量经济学方法应用于证券与投资研究,开创了金融计量经济学应用的新领域。20世纪70年代以来,计量经济学的理论和应用又进入一个新阶段。一方面由于计算机的广泛应用和新的计算方法大量出现,使所用的计量经济模型和变量的数目越来越多。另一方面表现为宏观计量经济模型的研制和应用方面。目前已有一百多个国家编制了不同的宏观计量经济模型,模型也由地区模型逐步发展到国家模型乃至世界模型。宏观计量经济模型的发展趋势,一是模型的规模越来越
5、大(例如克莱因发起的世界连接模型,包括7000多个方程、3000多个外生变量),二是模型体系日趋完善,涉及生产、需求、价格及收入等经济生活的各个领域。1998年7月教育部高等学校经济学学科教学指导委员会决定将“计量经济学”列为高等学校经济学门类各专业的八门核心课程之一(八门核心课包括政治经济学、西方经济学、计量经济学、货币银行学、财政学、统计学、会计学、国际经济学)。将计量经济学列入经济学各专业核心课,是我国经济学学科教学走向现代化和科学化的重要标志,对提高我国经济学人才培养质量和研究水平具有重要意义。1.2 计量经济学的研究对象、内容与步骤计量经济学的研究对象、内容与步骤一、计量经济学的研究
6、对象一、计量经济学的研究对象我们知道计量经济学是以经济理论为基础,利用数学方法,根据实际观测的统计数据,分析研究经济过程,探讨经济规律的学科。因此,可以说计量经济学研究的对象是经济现象,是研究经济现象中的具体数量规律。或者说,计量经济学是利用数学方法,根据统计测定的经济数据,对反映经济现象本质的经济数量关系进行研究。二、计量经济学的研究内容计量经济学的研究内容计量经济学的内容可概括为两个方面,一方面是它的方法论,即计量经济学方法或理论计量经济学,另一方面是它的实际应用,即应用计量经济学。但是,无论理论计量经济学还是应用计量经济学它们都应包括:理论、方法和数据三要素,缺一不可。理论即经济理论,也
7、就是研究对象的行为理论,它是计量经济学的基础;方法即模型的建立和计算方法,它是计量经济研究的工具和手段;数据即反映研究对象活动的信息,它是计量经济研究的原料。三、计量经济模型的研究步骤三、计量经济模型的研究步骤应用计量经济学方法,建立计量经济模型并用于研究客观经济现象,一般可分为五个步骤:(一)理论计量经济模型的建立(一)理论计量经济模型的建立(二)样本数据的收集(二)样本数据的收集(三)模型参数的估计(三)模型参数的估计(四)模型的检验(四)模型的检验(五)计量经济模型的应用(五)计量经济模型的应用根据经济理论的分析建立计量经济模型收集并整理数据资料参数估计模型检验未通过模型应用通过经济预测
8、政策评价结构分析 图1.2.1 建立与应用计量经济模型的主要步骤第二篇第二篇 单方程线性回归模型单方程线性回归模型第二章第二章 一元线性回归分析一元线性回归分析【本章要点】(1)最小二乘法的基本思想;(2)能应用最小二乘法估计一元线性回归模型的参数;(3)能够对参数的性质进行讨论;(4)能应用一元线性回归模型进行预测;(5)掌握 EViews的使用方法,能应用EViews软件计算和分析一元线性回归模型的实际经济问 2.1 一元线性回归模型及基本假定一元线性回归模型及基本假定设有如下关系设有如下关系 yi=+xi+ui (i=1,2,n)(2.1.1)其中其中xi和和yi分别代表两个经济变量,分
9、别代表两个经济变量,yi称为因变量称为因变量或被解释变量,或被解释变量,xi称为自变量或解释变量;称为自变量或解释变量;ui是是一个随机变量,称为随机项;一个随机变量,称为随机项;和和是两个常数,是两个常数,称为回归参数;角码称为回归参数;角码i表示变量的第表示变量的第i个观察值或与个观察值或与之对应的随机项。之对应的随机项。关系关系(2.1.1)称为一元线性回归模型。模型称为一元线性回归模型。模型(2.1.1)是是对总体而言的,因此也叫做总体回归模型。对总体而言的,因此也叫做总体回归模型。要求随机项u和自变量x满足的统计假定有五个,这些假定称为经典回归模型的基本假定或称经典(古典)假定。假定
10、假定1 每个ui(i=1,2,3,n)均为服从正态分布的实随机变量。假定假定2 每个ui(i=1,2,3,n)的期望值均为0,即E(ui)=0 (i=1,2,3,n)假定假定3 每个ui(i=1,2,3,n)的方差均为同一个常数,即V(ui)=E()=常数称之同方差假定或等方差性。ui22u假定假定4 与自变量不同观察值xi相对应的随机项ui彼此独立,即COV(ui,uj)=0 (ij)这个假定称为非自相关假定。假定假定5 随机项ui与自变量的任一观察值xj不相关,即COV(ui,xj)=0 (i,j=1,2,3,n)显然,如果x是非随机变量,则假定5将自动满足。以上假定通常也叫高斯马尔可夫(
11、Gauss Markov)假定,也称古典假定。满足以上古典假定的线性回归模型,也称为古典线性模型或经典线性模型。根据假定假定2,对(2.1.1)式两边同时取期望值,则有 E(yi)=+xi (2.1.2)表明点(xi,E(yi))在直线(2.1.2)上,这条直线叫做总体回归直线(或理论回归直线或总体方程)。上述五个基本假定中1-4是针对随机项ui的假定,最后一个是针对ui和xi两者的假定。基本假定1-3决定了ui的分布:ui N(0,)(2.1.3)同时也决定了模型(2.1.1)中yi的分布。2u事实上,由于yi是ui的线性函数,而ui服从正态分布,所以yi也服从正态分布。根据假定3,由(2.
12、1.1)和(2.1.2)式可得 V(yi)=E()=常数 (2.1.4)因此,yi服从期望值为+xi,方差为的正态分布:yi N(+xi,)(2.1.5)ui22u2u2.2 回归参数的最小二乘估计回归参数的最小二乘估计对模型 yi=+xi+ui (2.2.1)两边取期望值得总体方程:E(yi)=+xi (2.2.2)这里参数和是未知的,实际上总体回归直线是无法求得的,它只是理论上的存在。如何作一条直线使它成为总体回归直线(2.2.2)的最好估计?假设样本回归直线已做出,设它为 (2.2.3)其中 是的估计量,是的估计量,这样就可以用样本回归直线(2.2.3)估计总体回归直线(2.2.2)。x
13、yii设给定的样本观测值(xi,yi),i=1,2,n,在直角坐标系里,做出它们的对应点(xi,yi),i=1,2,n,构成散点图,如图2.2.1所示。iyixyii .xi x),(yxii.图2.2.1 散点与回归直线y观察值yi与它的拟合值(回归值)之差,记作 (2.2.4)i称为回归残差。于是有 (2.2.5)yyiiiiiixy最小二乘准则认为,和 应这样选择:使得i对所有i的平方和最小,即使 (2.2.6)达到最小,这就是最小二乘准则(原理)。这种估计回归参数的方法称为普通最小二乘法(Ordinary Least Squares,简记OLS),称为普通最小二乘估计量(Ordinar
14、y Least Squares Estimator,简记OLSE)。nininiixyyyQiiii121212)()(和和由于(2.2.6)是 和 的二次函数并且是非负的,由二次函数的性质知,(2.2.6)式的最小值总是存在的,为此,须使(2.2.6)式对 和 的一阶偏导数为零,即0)(2)(2xyQiii0)(2)(2xxyQiiii(2.2.7)(2.2.8)0i 0 xii(2.2.7)(2.2.8)(2.2.7)、(2.2.8)(或(2.2.7),(2.2.8))是以,,为未知数的方程组,叫做正规方程组,或简称为正规方程。解正规方程(2.2.7)、(2.2.8),得 ,的表达式:(2
15、.2.9)(2.2.10)其中 ,显然,当常数项=0时,线性模型(2.2.1)变为 yi=xi+ui (2.2.11)xyxyxiii2xxxiiyyyii此时参数估计量的计算公式为xyxiii2比较(2.2.10)与(2.2.12)就会发现,只要将(2.2.10)中的圆点去掉即得到(2.2.12),这个规律具有普遍性,即不论对一元线性回归模型或多元线性回归模型,常数项不等于0和常数项等于0这两种情形下参数估计量的公式具有相似结构,差别仅在于:前者公式中所有的变量都带圆点,而后者公式中所有变量都不带圆点。到目前为止,我们得到了四个关系式如下:总体回归模型:yi=+xi+ui 它表示总体变量之间
16、的真实关系。总体回归直线(或称总体回归方程):E(yi)=+xi 它表示总体变量之间的依存关系。样本回归模型:它表示样本显示出的变量之间的关系。样本回归直线:它表示样本显示出的变量之间的依存关系。iiixyxyii2.3 参数最小二乘估计量的统计性质参数最小二乘估计量的统计性质 一、线性一、线性所谓线性是指和是yi或ui的线性函数。(一)的线性表达式由(2.2.10)有xyxiii2ykxyxiiiii2(2.3.1)其中 (2.3.2)xxkiii2(2.3.1)表明是yi的线性函数由于yi=+xi+ui,所以)(uxkykiiiiiukxkkiiiiiukii(2.3.3)其中 ki=0
17、(2.3.4)kixi=1 (2.3.5)(2.3.3)表明是ui的线性函数(二)的线性表达式由(2.2.9)有xyykxyniii1ykxnii)1((2.3.6)(2.3.6)表明 是yi的线性函数。ukxnuxkxnykxniiiiiii)1()(1()1(2.3.7)(2.3.7)表明 是ui的线性函数。二、无偏性二、无偏性由(2.3.3)知 ,取期望值便有 (2.3.8)其中E(ui)=0,(2.3.8)表明 是的无偏估计量。ukii)()(uEkEii由(2.3.7)上式两边取期望值便有 (2.3.9)(2.3.9)表明 是的无偏估计量。ukxnii)1()()1()(uEkxnE
18、ii三、最小方差性三、最小方差性所谓最小方差性是指在所有线性无偏估计量中,最小二乘估计量的方差最小。方差最小这一性质又称为最佳性。为了证明这一性质,我们先导出最小二乘估量 和 的方差。由(2.3.3)(2.3.10)xkukVViuiuii2222)()()1()(ukxnVVii由(2.3.7)1()1(22222xxnkxniuiu(2.3.11)或者把(2.3.11)写成形式:xnxViiu222)(2.3.11)下面证明 的最小方差性。假设我们用其它方法求得参数的估计量为 ,并且满足线性和无偏性。因而应有关系:和*ycii*)(*E(2.3.12)由于 yi=+xi+ui所以 由此可知
19、,欲使 估计量具有无偏性,ci应满足条件 xcciiiE)(*0ci1xcii(2.3.13)下面我们将在满足(2.3.13)的前提下,寻求的最小方差:*)(*VcycViuii22)()()(22*kkcViiiukkciuuii2222)(2.3.14)(2.3.14)式当且仅当 ci=ki 时,达到最小,此时 与最小二乘估计量 相等:)(*V*ykyciikiiiic(2.3.15)将此结果代入(2.3.14)便有 (2.3.16)此结果与(2.3.10)式相同。xkViuiu2222*)(对于 的最小方差性的证明与 的证明完全类似,请读者自己完成。这样我们证明了,只要经典回归模型的假定
20、25满足,回归参数的最小二乘估计量就是线性、无偏、最佳估计量,简称为最佳线性无偏估计量(BLUE:best linear unbiased estimators)。这一结论就是著名的高斯-马尔可夫(Gauss Markov)定理。无偏性与最佳性结合起来构成了估计量好坏的重要标志。由于最小二乘估计量的最佳线性无偏估计量的特性,才使得最小二乘法得到了广泛的应用。2.4 参数估计量的抽样分布及参数估计量的抽样分布及 的估计量的估计量一、参数估计量的抽样分布一、参数估计量的抽样分布 和 所服从的分布称为参数估计量的抽样分布。)1(,222xxnNiu),(22xNiu(2.4.1)(2.4.1)就是
21、和 的抽样分布。2u二、我们的任务是利用自变量二、我们的任务是利用自变量xi和因变量和因变量yi的的观察值来计算观察值来计算 的估计量的估计量我们可以用i的方差 来估计ui的方差 。将i的方差取成如下形式:(2.4.2)2ufeui)(22其中fe是回归残差平方和的自由度,其大小应由 的无偏性要求决定。现在我们的任务是设法找到 fe的取值。由于2u2u2u2u01in所以(2.4.2)式可简化为 (2.4.3)feiu22为此我们先计算i:)()(yyyyyyiiiii)()()(xuxxuxiii)()(uuxii(2.4.4)将(2.4.4)平方求和,再取期望值便有 )()(2)()()(
22、2222uuuxxiEuEEEiiii(2.4.5)(2.4.5)式中2222)()(uiixVxE22,)()()()(uiuiijijiijiijjiixkuuxkuxukuxEuEuE(2.4.7)(2.4.6)222222222)(1)(1)()(1)(uujijiiiiiiinuuEnuEnuEunuEunuEuuEi(2.4.8)把(2.4.6)、(2.4.7)和(2.4.8)代入(2.4.5)便有或 22)2()(uinE22)2(uinE即取 fe=n-2,便有的无偏估计量2u222niu(2.4.9)为了计算方便,也可以采用如下计算形式:(2.4.10)2u222nyxyii
23、iu2.5 回归参数的回归参数的t检验和区间估计检验和区间估计一、回归参数的一、回归参数的t检验检验在2.4节中,我们已经知道 都服从正态分布,即 和和)(,(VN)(,(VN)1()(222xxnViuxViu22)(2.5.1)(2.5.2)(2.5.3)(2.5.4)其中 显然,统计量)(V N(0,1)(2.5.5)(V N(0,1)(2.5.6)式中的 可用无偏估计量 代替,由此得出 和 的无偏估计量:2u2u)(V)(V)1()(222xxnViuxiuV22)(2.5.7)(2.5.8)在小样本情况下(一般 n 30)可以证明,用无偏估计量 代替(2.5.5)和(2.5.6)中的
24、 便得 T 统计量(证明略))(VV)(和)V(V)(和)(V t(n-2)(2.5.9)(V t(n-2)(2.5.10)通常我们关心的是回归模型中的因变量与自变量之间是否存在线性关系或者说是否=0。为此我们对进行t检验。提出假设H0:=0,备择假设H1:0,在H0成立时,有统计量)(VT t(n-2)(2.5.11)对给定的显著水平,查自由度为n-2的t分布表,得临界值 ,如果T ,则拒绝H0:=0,接受备择假设H1:0,表明回归模型中因变量与自变量之间确实存在线性关系。对于的t检验可以用类似的方法进行。)2(2/nt)2(2/nt图2.5.1阴影部分为t检验的否定域二、回归参数的区间估计
25、二、回归参数的区间估计由于T 统计量服从 t 分布:T=t(n-2)(2.5.10)(V对给定的显著水平,便有1)2()2(2/2/ntTntP即我们有1-的把握说,)2()2(2/2/ntTnt(2.5.12)(2.5.11)成立。换句话说,我们有1-的把握说,在)()2(,)()2(2/2/VntVnt(2.5.13)区间内,或者写成:)()2(2/Vnt(2.5.14)此范围称之为置信区间,-称为置信度。对参数的区间估计有类似的结果:)()2(2/Vnt(2.5.15)2.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度一、总离差平方和的分解一、总离差平方和的分解设由样本
26、观察值(xi,yi),i=1,2,,n,得出的回归直线为 如图2.6.1所示。xyiixyiiyiiyyiyyiyixiyxy0图2.6.1 因变量偏差的分解由(2.2.4)知,因变量的观察值yi可分解为 与i之和:(2.6.1)yiiiiyy 此式又可写成:iiiyyyy)((2.6.2)反映全部总离差变化的最好的变量是总离差平方和,记作TSS:TSS=(2.6.3)niiyy12)(将(2.6.3)展开:TSS=niiiniiiiyyyyyy1212)()()(niiiniiniyiyyy12112)(2)(其中第二项 0)(1iniiyy便有 TSS 称为总离差平方和niiniiyy12
27、12)(记 RSS 称为回归平方和niiyy12)(ESS 称为剩余平方和或残差平方和nii12于是便有 TSS=RSS+ESS (2.6.4)由平方和分解定理知,三个平方和的自由度之间具有如下关系:(2.6.5)fffERT二、拟合优度(样本决定系数)二、拟合优度(样本决定系数)用RSS与TSS之比来反映样本回归直线与全部观察值之间的拟合程度:yyyyyyTSSRSSRiiii22222)()((2.6.6)称为拟合优度或样本决定系数。越大,表明回归直线与样本观察值拟合得越好,反之,拟合得就越差。R2R2由于 所以xyiiRSS=(2.6.7)yxxyiiii222便有yyxRiii22(2
28、.6.8)进一步可以写成形式:xxyxRiiii2222)((2.6.9)取 的平方根,便有R2yxyxriiiixy22(2.6.10)这就是我们熟悉的相关系数公式。102R(2.6.12)R2越接近1,回归直线与样本观察值拟合得越好。三、回归方程显著性的三、回归方程显著性的F 检验检验回归方程显著性检验是回归模型总体的显著性检验,也就是判定回归方程的所有解释变量x对被解释变量y的影响的显著性,即方程的总体的显著性。这实际上就是对回归方程拟合优度的检验,能满足这一要求的检验便是 F 检验。对一元线性回归模型而言,具体步骤如下:(1)假设H0:=0,备择假设H1:0。(2)构造统计量)2/(/
29、2nyxfESSfRSSFiiiER(2.6.13)(3)当H0成立时,F F(,n-2)(4)对给定的显著水平,确定临界值F如图2.6.3所示。(5)判定方程显著性,若F F,拒绝假设H0,即不为零,解释变量总体对y的影响是显著的,方程估计可靠。若F F,则接受假设H0,说明所有解释变量对y的影响不显著,方程估计不可靠。图2.6.3 阴影部分为F检验的否定域将上面分析的结果可用一张表格来表示,见表2.6.1,这张表叫做回归问题的方差分析表。离差名称平方和自由度均方(方差)F值回归(因素x)1剩余(随机因素)n-2总 计n-1yxyiii22i yi2yxii)2/(22niu/2uiiyxF
30、表2.6.一元回归方差分析表由(2.6.4)知,ESS=TSS-RSS即yxyiiii22(2.6.15)把(2.6.15)代入(2.6.14)便有222nyxyiiiu由2.节的(2.4.9)知 (2.6.14)222niu这便是公式(2.4.10)。四、四、F 与与 R2 的关系的关系由(2.6.11)知,拟合优度可表为yRii2221yRii2221(2.6.16)yyynnyFiiiiii222222/)2()2/(又统计量(2.6.17)把(2.6.6)和(2.6.16)代入(2.6.17)便有 (2.6.18)RRnF221)2(可以看出,F 与 R2 成正比,R2越大,F值也越大
31、。2.7 预测预测一、点预测一、点预测设有模型 yt=+xt+ut t=1,2,n (2.7.1)t表示第t个抽样时期,现在假设属于抽样时期以外的某个时期 f(预测期)的自变量值 xf 已知,并且(2.7.1)式同样适用于第 f个时期,这时因变量有 yf=+xf+uf (2.7.2)且uf满足基本假定。由于每一个xf 值都对应着yf 的一个分布,所以,讨论yf 的预测值有两个含义:预测与xf 值相对应的yf 的期望值;预测与xf 值相对应的yf 的单个(当期)值。具体预测办法是:我们可以利用模型(2.7.1)和样本观察值(xt,yt)得出回归方程xytt 将t外推到抽样期之外的某个预测期 f,
32、就有 (2.7.3)xyff其中xf 已知。此时既可作为 的估计量也可以作为yf 的估计量。事实上)()()(yExxEyEffff表明:是 的无偏估计量。yf)(yEf又有 表明:二者之差在多次观察中平均来说等于零。综上所述,用来估计 和 是合理的。0)()()(uxxEyyEfffffyf)(yEfyf)(yEf二、区间预测二、区间预测(一)的区间预测为了求出 的置信区间,我们先求出估计量的方差:)(yEf)(yEfyf)()()()(2xExVyVfff其中ukxntntt1)1(uktntt1)1()1()()1)(1()()1()1()(222222221xxnkxnuuEkxnkx
33、nuEkxnukxnEyVtfuttfustsftstftttftnttff于是有(2.7.4)用估计量 代替 ,便得 的估计量:(2.7.5)2u2u)(yfV)1()(222xxnyVtfuf利用(2.7.5)构造 T 统计量,显然有)()(yyyfffVET t(n-2)(2.7.6)则置信度为1-的置信区间为:xxtyytfuffnnE2221)2()((2.7.7)(二)的区间预测为了求出 的预测区间,须先计算 -的方差。yfyfyf)()()(yVyVyyVffff)1()(222xxnyVtfuf2)(ufyV由于所以)11()(222xxnyyVtfuff(2.7.8)yf用估
34、计量 代替 ,得2u2u)11()(222xxnyyVtfuff(2.7.9)利用(2.7.9)构造统计量,显然有)(yyyyffffVT t(n-2)则置信度为1-的置信区间为xxtyytfuffnn22211)2(图2.7.1 E(yf)和yf的置信带 由(2.7.7)和(2.7.10)结合图2.7.1可以看出:样本容量n越大,预测越准确,预测精度越高。xf 距 越近,预测精度越高。越大,即抽样范围越宽,预测精度越高。xxt2第三章第三章 多元线性回归分析多元线性回归分析【本章要点】1.掌握多元线性回归模型的概念和模型经典假定;2.掌握多元线性回归模型参数的最小二乘估计和检验;3.模型的检
35、验和预测;4.能应用EViews软件计算和解决线性回归模型的实际经济问题。3.1 多元线性回归模型及其基本假定多元线性回归模型及其基本假定假定因变量y与解释变量x1,x2,,xk具有线性关系,它们之间的线性关系,可用线性回归模型表示为yi=0+1x1i+2x2i+k xki+ui (3.1.1)称为总体线性回归模型。下标i表示第i期观察值(yi,x1i,x2i,,xki),ui 为对应的随机项,i=1,2,n。由于有n期样本观察值,这一模型实际上是包含n个方程的模型:y1=0+1x11+2x21+kxk1+u1 y2=0+1x12+2x22+kxk2+u2 (3.1.2)yn=0+1x1n+2
36、x2n+kxkn+un 把(3.1.2)改写成矩阵形式:uuuxxxxxxxxxyyynkknnnkkn211021222121211121111(3.1.3)(3.1.3)简化为 Y=X +U (3.1.4)其中yyyYn21xxxxxxxxxXknnnkk212221212111111k10uuuUn21对多元线性回归模型基本假定如下:假定假定1 随机项U的每一个元素ui均为实随机变量,且服从正态分布。假定假定2 随机项U的每一个元素的期望值均为零,即0000)()()()(2121uEuEuEuuuEUEnn假定假定3 所有随机项的ui的方差均相同,即有 i=1,2,n (3.1.5)2
37、2)()(uiiuEuV假定假定4 不同期的两个随机项ui和uj彼此不相关,即有 (ij)(3.1.6)i,j=1,2,,n0)(),(uuEuuCOVjiji假定假定3和假定假定4称作高斯马尔可夫(Gauss-Markov)假定。它可以统一表示为IUUEnu2)((3.1.7)假定假定5 (3.1.8)j=1,2,,k ,i=1,2,,n即说明解释变量x1,x2,xk与随机项ui不相关。与一元线性回归分析相同,为了数学处理方便,一般情况下我们都假定所有自变量均为非随机变量。0),(uxCOVij假定假定6 所有自变量彼此线性无关,即 rk(X)=k+1 且 k+1 n (3.1.9)也就是说
38、矩阵X的秩等于参数的个数,或者说,解释变量x1,x2,,xk彼此不相关。3.2多元线性回归模型参数的最小二乘估计多元线性回归模型参数的最小二乘估计一、一般模型的参数最小二乘估计一、一般模型的参数最小二乘估计设与总体线性回归模型(3.1.1)对应的样本线性回归模型为ikikiiixxxy22110(3.2.1)i=1,2,,n或表示为矩阵形式为XY其中 10kn21相应的样本线性回归方程为xxxykikiii22110(3.2.2)i=1,2,,n利用最小二乘法求参数估计量 :,210k设残差平方和为Q,则Q=)(22yyiii)(222110 xxxykikiii我们的任务是寻求适当的 使Q达
39、到最小。根据多元函数的极值原理,应是下列方程组的解:,210k,210k0)(2221100 xxxyQkikiii0)(21221101xxxxyQikikiii 0)(222110 xxxxyQkikikiiik整理可得正规方程组:yxxxnikikii22110yxxxxxxxiiikikiiii1112221110 yxxxxxxxkiikikkiikiiki222110由(3.2.3)第一个方程,可以得到:xxxykk22110(3.2.3)(3.2.4)将正规方程组写成矩阵形式:1022111221121kkikiikiikiikiiiiikiiixxxxxxxxxxxxxxxny
40、xyxyikiiii1(3.2.3)其中XXxxxxxxxxxxxxxxxnkikiikiikikiiiiiikiii22112121121YXyxyxyikiiii110k于是正规方程组的矩阵形式为YXXX)((3.2.5)YXXX)(1(3.2.6)于是有二、中心化模型的参数最小二乘估计二、中心化模型的参数最小二乘估计我们已经知道,总体线性回归模型可以表示为 (3.2.7)uxxxyikikiii22110相应的样本线性回归模型可以表示为ikikiiixxxy22110(3.2.8)对于样本容量为n 的 y 的均值可分别表示为uxxxykk22110(3.2.9)其中心化模型uxxxyik
41、ikiii2211ikikiiixxxy2211(3.2.11)(3.2.12)(i=1,2,,n)和xxxykk22110(3.2.10)这里 =0,可以看作是对参数施加一个限制条件。将它们写成矩阵形式:UXYXY(3.2.13)(3.2.14)(3.2.13)为总体回归模型的中心化形式(或离差形式),(3.2.14)为样本回归模型的中心化形式(或离差形式)。其中yyyYn21xxxxxxxxxknnnkkX212221212111k2121kuuuUn21n21残差平方和)()(2XYXYi2XXYXYY(3.2.15)其中用到 是标量的性质。XY将残差平方和(3.2.15)对 求导,并令
42、其为零:022)(XXYX整理得正规方程组YXXX(3.2.16)解方程组(3.2.16)得YXXX)(1(3.2.17)由(3.2.17)式可以看出,参数估计量的表达式与(3.2.6)式相比形式基本相同,但应注意(3.2.17)中的 不包含 ,比 少一列常数1。对于(3.2.17)的计算可采用以下形式:0XXxxxxxxxxxxxxxxxxxxXXknnnkkknkknn212221212111212222111211xxxxxxxxxxxxxxxkiiikikiiiiikiiiiiki2212221212121(3.2.18)yxyxyxyyyxxxxxxxxxYXikiiiiinknkk
43、nn2121212222111211(3.2.19)对于k=2的情形,(3.2.17)式可以表示为yxyxxxxxxxiiiiiiiiii2112122122121(3.2.20)解之可得xxxxxxxyxxxyxiiiiiiiiiiiii221221212222111xxxxxxyxxxyxxiiiiiiiiiiiii221221212121212(3.2.21)(3.2.22)记D(2)=(3.2.23)xxxxxxiiiiii22122121D1(2)=(3.2.24)xyxxxyxiiiiiii222211D2(2)=(3.2.25)yxxxyxxiiiiiii212121从而参数估计
44、量的表达式可以简记为)2()2(11DD)2()2(22DD(3.2.26)(3.2.27)推广至 k 元线性回归,其参数的表达式便有:)()(kDkDjj j=1,2,,k (3.2.28)xxxykk22110(3.2.29)3.3回归参数估计量的统计性质回归参数估计量的统计性质总体模型 (3.3.1)UXY的参数是通过样本模型XY(3.3.2)来计算出其估计值 。那么用 来估计效果怎样,因此,我们需要讨论 的统计性质。一、线性一、线性UXXXUXXXXYXXX)()()()(111(3.3.3)可见,既是Y的线性函数也是U的线性函数。二、无偏性二、无偏性)()()()(11UEXXXUX
45、XXEE(3.3.4)可见,是的无偏估计量。三、方差三、方差协方差和最小方差协方差和最小方差我们先导出 的方差,然后证明在的一切线性无偏估计量中,以 的方差最小。由方差协方差矩阵的定义)()()(EEECOVV)(EkkkkE,11001100)()()()()()()()()(21100112110011001100200kkkkkkkkkkEEEEEEEEE)(),(),(),()(),(),(),()(1011010100kkkkkVCOVCOVCOVVCOVCOVCOVV(3.3.5)(3.3.5)是一个对称矩阵,其主对角线上的元素是参数估计量的方差,非主对角线元素是不同参数估计量之间
46、的协方差,所以称为 的方差协方差矩阵。另一方面,由(3.3.3)有 UXXX)(1)()(ECOVV)()(11UXXXUXXXE)()()(11XXXUUEXXX)(12XXu即)()(12XXCOVVu(3.3.6)与(3.3.5)比较知)()(12jjujXXV)(),(12jiujiXXCOV(3.3.7)(ij,i,j=0,1,k)(3.3.8)由(3.3.7)和(3.3.8)式知,只要算出逆矩阵 ,所有参数的方差,协方差都可算出。)(1XX)()(12XXCOVVu)()(12jjujXXV(3.3.9)(3.3.10))(),(12ijujiXXCOV(3.3.11)(ij,i,
47、j=1,2,k)对于中心化变量的方差协方差,有类似的结果:再证明由(3.3.7)给出的方差具有最小方差性(最佳性)。为此,设另外有一个的线性无偏估计量:PYYPXXX)(1(3.3.12)其中P为(k+1)n阶非随机矩阵,代表对最小二乘估计量 的一个干扰。)()()()(YPEEPYEEPX(3.3.13)要使 满足无偏性要求,矩阵P必须满足条件:PX=0 (3.3.14)此时PU(3.3.15)PPCOVVPPXXPPPXXXXXPXXXPUUXXXPUUXXXEPUPUEECOVVuuuuuuu2212212121211)()()()()()()(3.3.16)由于P为(k+)n阶矩阵且k
48、+0时,随后的若干个随机项ut+1,u t+2,都有大于0的倾向,当ut 0时,随后若干个随机项都有小于0的倾向,我们说u具有正相关性;而负自相关则意味着两个相继的随机项ut和ut+1具有正负号相反的倾向。在经济数据中,常见的是正自相关现象。二、产生自相关的原因二、产生自相关的原因1.经济变量的惯性作用2.模型中略去了具有自相关的解释变量3.经济冲击的延续4.模型设定的不正确三、自相关强度的量度三、自相关强度的量度自相关系数自相关系数 假定u存在自相关,若ut的取值仅与前一期ut-1有关,即ut=f(ut-1),则称这种相关为一阶自相关。若ut不仅与ut-1相关,而且还同ut-2相关,即ut=
49、f(ut-1,ut-2),则称这种相关为二阶自相关。两个随机项在时间上相隔越远,前者对后者的影响就越小。如果存在自相关的话,最强的自相关应表现在相邻两个随机项之间,即一阶自相关是主要的。因此,我们只讨论一阶自相关,而且假定这是一种线性自相关,即具有一阶线性自回归形式:若ut的取值与它的前 s 期取值有关,即ut=f(ut-1,ut-2,ut-s),则称这种相关为 s 阶自相关。二阶以上的自相关统称为高阶自相关。111vuuttt(6.1.1)(6.1.1)式中是一个常数,称为自相关系数,vt是一个新的随机项,它满足经典回归的全部假定:)(0)()(0)(),0(2stvuEttvvENvtst
50、tvt(6.1.2)(6.1.1)式可以看成是一个一元线性回归模型,ut是因变量,ut-1是自变量,是回归系数。由于vt满足经典回归的全部基本假定,可用OLS法估计:nttntttuuu22121(6.1.3)当样本容量很大时,有 ,于是(6.1.3)式可以改写为nttnttuu22122ntntttntttuuuu2221221(6.1.4)(6.1.4)式右端的表达式完全符合样本相关系数的定义,所以把称为自相关系数是合理的。四、四、ut的方差和协方差的方差和协方差由(6.1.1)式知222121)()()()(vutttttvVuVvuVuV即2222vuu(6.1.5)当0时,为正自相关