线性回归模型介绍课件.ppt

上传人(卖家):三亚风情 文档编号:3272504 上传时间:2022-08-15 格式:PPT 页数:125 大小:1.44MB
下载 相关 举报
线性回归模型介绍课件.ppt_第1页
第1页 / 共125页
线性回归模型介绍课件.ppt_第2页
第2页 / 共125页
线性回归模型介绍课件.ppt_第3页
第3页 / 共125页
线性回归模型介绍课件.ppt_第4页
第4页 / 共125页
线性回归模型介绍课件.ppt_第5页
第5页 / 共125页
点击查看更多>>
资源描述

1、n 第一节 简介n 第二节 一元线性回归模型n 第三节 多元线性回归模型n 第四节 非线性回归模型线性化一、计量经济学的定义计量经济学是一门利用经济学、数学、统计学从数量上研究宏观和微观经济行为关系的综合性经济学学科。计量经济学英文“Econometrics”一词最早是由挪威经济学家 R.Frisch 于 1926 年仿照“Biometrics”(“生物计量学”)提出来的,也可以翻译为经济计量学。例:n 问题:如何农产品波动难以平抑?n 理论假说:农产品供给受国民生产总值影响,当经济繁荣时,生产要素流向非农部门;相反,流向农业部门。这导致了农业的波动,只有考虑到了这一点才可减少波动。n 找数据

2、:粮食产量与GDPn 建立、计算计量方程:协整检验ECM(误差修正模型),计算参数n 检验计算结果n 解释n 应用粮食产量波动与国民经济波动有何关系?计量结果与检验n 长期方程:n lngrain=-0.28 lntindu+1.28 lngrain(-1)-0.28 lngrain(-2)+0.16 lntindu(-1)n 调整后R2=0.98,DW=1.79,AIC=-2.68n 误差修正模型n lngrain=-0.24lntindu+1.33lngrain(-1)-0.52lngrain(-2)+0.36lntindu(-1)-0.94e(-1)-2.7=AIC1.9,=DW 0.2

3、,=R(-1.86)(2.79)(-2.50)(2.72)(-2.04)解释:n 短期弹性为-0.24表明当二、三产业产值增加1%时会使粮食产量下降-0.24%。二、三产业的发展可能引起粮食产量(甚至所有农产品产量)的下降;我国粮食周期与整体经济周期存在必然的联系,在经济总体波动无法消除的情况下,粮食波动也难以消除,但可以根据经济总体波动情况主动调控粮食波动。n 对策:在经济繁荣时要更加注意对农业的保护,加大补贴力度。二、计量经济学的产生与发展n 1926年挪威经济学家弗里希(R.Frisch)提出了“Econometrics”。n 1930年12月,弗里希与荷兰经济学家丁伯根(J.Tinbe

4、rgen)等人在美国克里夫兰发起成立了国际计量经济学会,并于1933年创刊会刊Econometrica。n 从30年代到今天,尤其是二次大战以后,计量经济学在西方各国的影响迅速扩大。计量经济学的发展计量经济学的发展3040年代年代微观计量经济学微观计量经济学舒尔茨对消费理论和市场行为方面的研究道格拉斯对边际生产力的研究弗里希对需求弹性、边际生产力的研究4070年代年代宏观计量经济学宏观计量经济学40年代,经济理论的模型化和数学化50年代,泰尔发表二阶段最小二乘法60年代,发表分布滞后的新处理方法70年代以后年代以后经济计量学进入了一个新的阶段经济计量学进入了一个新的阶段我国经济计量学的发展我国

5、经济计量学的发展7080年代开始介绍计量经济学的学科内容和国外发展情况8090年代1995年计量经济学的教学大纲正式发表;全国许多高校相继开设计量经济学课程。1998年将计量经济学列入经济类各专业八门公共核心课程之一。三、中级计量经济学框架n 经典线性回归模型:单方程n 一元回归:最简单,是其他模型基础;n 多元回归:应用面最广的模型;n 非线性转化;n 多重共性、异方差、自相关、虚拟变量;n 单方程拓展:n 二元选择模型n 多元选择模型n 数据拓展:时间序列n 联立方程:因变量与自变量相互影响。例:消费与收入实际上是互相影响的。四、数据类型n 时间序列:以时间为顺序进行排列的数据;n 横截面

6、数据:在某个时间点上从不同样本获取的调查数据;n 混合数据:时间序列与横截面数据混合而成的数据。n 虚拟变量数据:只取0与1的数据,代表无法定量化表达的自然与社会现象,如:政策、天气、性别。n 面板数据:每个时间点与横向截数据都完整的混合数据。第二节 一元线性回归模型n 回归;n 一元线性模型表达;n 假设条件一、回归n 指随机变量向期望值靠拢的客观自然与社会现象,它是计量有意义的基础。yx160165170175180185140150160170180190200YX儿子们身高向着平均身高“回归”,以保持种族的稳定父亲身高儿子身高纬度与身高关系模型建立.20度40度E(Y|X)=b0+b1

7、XYf(Y|X)二、一元线性回归模型表达Y=bo+b1 X+1.客观现象的随机性质2.模型中省略的变量3.测量与归并误差4.数学模型形式设定造成的误差三、线性三、线性回归模型的基本假定1.零均值假定:随机扰动项可正可负,有相互抵消的趋势 E(ui)=02.同方差假定:各次观察值中ui具有相同的方差 Var(ui)=2 高斯马尔柯夫假定3.无序列相关假定:随机扰动项相互独立 Cov(ui,uj)=0 高斯马尔柯夫假定4.随机扰动项服从正态分布5.解释变量与随机扰动项不相关假定:Cov(ui,Xi)=06.解释变量之间不存在线性相关假定异方差情况.X X1X2Yf(Y|X)X3.E(Y|X)=b0

8、+b1X经典回归其他假设 参数与变量是线性关系(自变量与因变量?);X具有确定性和变异性和方差稳定性,且观察次数大于参数个数;正确设定回归模型。QnxxX,i2)(限常数样本方差趋向于一个有的解释变量容量的无限增加方差稳定性指随着样本四、普通最小二乘法(四、普通最小二乘法(OLS)一元线性回归模型一元线性回归模型:只有一个解释变量 iiiXYbb10i=1,2,nY为被解释变量,X为解释变量,b0与b1为待估待估参数参数,为随机干扰项随机干扰项普通最小二乘法是一种参数估计方法,确定估计参数的准则是使全部观察值的残差平方和最小,即 ei2 min,由此得出选择回归参数 b0,b1 的最小二乘估计

9、式。YXX1X2X3X4X5X6e1e2e3e4e5e6残差平方和2112112)()(niioiniiniiXbbYYYe使偏导数为零0)(2)(12ioioiXbbYbe0)(2)(112iioiiXXbbYbe得正规方程 Yi=nbo+b1 Xi XiYi=bo Xi+b1 Xi2 解得2)(2iiii1XXnYXnbiYiXXbYb1o记 X,Y的平均数(请同学们自己推导并记忆)。另外,如果我们设置自变量均值为零,结果如何?也请自己推导iYnYiXnX11YiYiyXiXix则得2iii1xyxbXbYob1简化公式2:如果自变量累加是零?XY1bb021)(2iiiiXXnYXniY

10、iXb21iiiXYXb作业:练习简洁版公式推导 已知某产品销售与时间成正比关系:请预测八月份的产品销售额。单位万元。一月一月二月二月三月三月四月四月五月五月六月六月七月七月-3-2-10123506271798390103答案:109.4五、五、参数估计的最大似然法参数估计的最大似然法(ML)最大最大似似然法然法(Maximum Likelihood,简称ML),也称最大似然法最大似然法,是不同于最小二乘法的另一种参数估计方法,是从最大或然原理出发发展起来的其它估计方法的基础。基本原理基本原理:对于已经发生的事件,最佳的参数应该是使其概率最大的参数。当从模型总体随机抽取n组样本观测值后,最合

11、理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。或然函数或然函数(likelihood function)(likelihood function)应该是?应该是?在满足基本假设条件下,对一元线性回归模型:iiiXYbb10 随机抽取n组样本观测值(Xi,Yi)(i=1,2,n)。那么Yi服从如下的正态分布:),(210bbiiXNY于是,Y的概率函数为2102)(2121)(iiXYieYPbb(i=1,2,n)假如模型的参数估计量已经求得,为因为Yi是相互独立的,所以的所有样本观测值的联合概率,也即或然函数或然函数(likelihood function)(likelihoo

12、d function)为:),(),(21210nYYYPL bb21022)(21)2(1iinXYnebb 将该或然函数极大化,即可求得到模型参数的极大或然估计量。由于或然函数的极大化与或然函数的对数的极大化是等价的,所以,取对数或然函数如下:2102*)(21)2ln()ln(iiXYnLLbb解得模型的参数估计量为:可见,在满足一系列基本假设的情况下,模型结构参数的最大或然估计量最大或然估计量与普通最小普通最小二乘估计量二乘估计量是相同的。XY1bb021)(2iiiiXXnYXniYiXb六、最小二乘估计量的统计性质线性性 线性特性是指估计式 bo 和 b1 是Yi 的线性函数。ii

13、iiioiiiiiYwYXbYkYbxxxxn1221无偏性 无偏性指估计量 bo 和 b1 的均值等于总体回归参数bo 和 b1 E(b1)=b1 P48页推导E(bo)=bo 为什么非要参数与因变量是线性关系?iiiiiiiiiiiiiiiiiiiiiiYkbxxkxYxbXnXnXXXXxxxYxYxxYYxxyxb1110)()(222222则令则因为iiiiiiiiiiiiiiiiiiiiiiYkbxxkxYxbXnXnXXXXxxxYxYxxYYxxyxb1110)()(222222则令则因为iiiiiiiiiiiiiiiiiiiiiiYkbxxkxYxbXnXnXXXXxxxYx

14、YxxYYxxyxb1110)()(222222则令则因为iiiiiiiiiYwbXknwYXknXYknYXbYb1001)1(则令有效性(最小方差性)最小方差性是指估计量 bo 和 b1 具有最小方差的性质,又叫有效性。22222)()(iioixnXbVarxbVaruu1 高斯马尔可夫定理 最小二乘估计量与用其他方法求得的所有线性无偏估计量相比,具有最小的方差。在小样本情况下,一个估计量如果它是线性的,同时又是有效的(即无偏的,又具有最小方差)那它就是最佳线性无偏估计量 BLUE:Best Linear Unbiased Property of an Estimator 其中,ci=k

15、i+di,di为不全为零的常数则容易证明现有b的方差最小。含义:大样本、变异性icYb一致性(大样本)一致性(Consistency):随着样本的增大,估计参数收敛于真实参数。b的概率密度 b的概率密度 b的概率密度 b的概率密度(a)无偏性(b)有效性(c)一致性(d)最小平均偏差方差b无偏估计有偏估计有效估计b非有效估计大样本b小样本中等样本有偏但有效的估计b无偏但非有效的估计七、样本决定系数及回归直线拟合优度的检验(一)总离差平方和分解 回归直线 =+X =被解释了的部分 Yi =ei 未被解释的部分 Yi =(Yi )+()越大,ei 越小说明回归直线与样本点拟合得好。ob1biYYY

16、iy iYYiYiYYiy YYiiYY O Xi Xie=来自残差(YiY)=总离差 来自回归iy(Yi-Y)2=(Yi-Yi)+(Yi-Y)2 =(Yi-Yi)2+(Yi-Y)2+2 (Yi-Yi)(Yi-Y)yi2 =ei2 +yi2 TSS =RSS +ESSTotal sum of squares explained sum of squares residual sum of squares (二)样本决定系数18895386.70689732)4.3613114(=0.97735322TSSESSiyiyR2=回归平方和总离差平方和样本决定系数(判定系数)(三)随机扰动项方差 2

17、 的估计由于随机项 u 不可观测,只能用残差 e 估计ei2=(Yi-i)2=42792.531614.416.70689731022390462016.53490275.06.7068973016.5349016.5349853.42792222222221iiebiebiexnXSSxSSnSoe残差平方和样本方差b1 的样本标准差b0 的样本标准差(四)假设检验某一给定的观测或发现是否与某一声称的假设(stated hypothesis)相符?此处用“相符”一词表示观测的值与假设的值“足够相近”,因而我们不拒绝所声称的假设。原假设(Null hypothesis):一种信以为真的、意在维

18、护的或理论上的假设,并用 H0 表示,其成立的概率大。备择假设(alternative hypothesis):为与之对立的假设,记为 H1(是研究者拟验证的假设),往往是小概率。如,原假设 Ho:b1=0 备择假设H1:b1 0第一类错误:拒绝真实;第二类错误:接受错误。模型中样本值可以自由变动的个数,称为自由度,即:自由度=样本个数 样本数据受约束条件(方程)的个数了。但对于一个方程因变量来说,其自由度是自变量个数。自由度:(五)参数显著性检验(t 检验)H0:b1=0;H1:b1 0;)2(/22ntxS(b1)Tib1所以有,aaa1)/Pr(2222txti从而,22aatt 检验的

19、估计值是否在此区间,b1b1b1b1b1S(b1),S(b1)b1 1-a接受域 -ta/2 O ta/2 t如果在则接受原假设,否则拒绝原假设。比较|T|与 ta的大小2|T|ta 拒绝 H02对 bo 的显著性 t 检验Ho:bo=0;H1:bo 0325.41614.41032054.178T0obSob对 b1 的显著性 t 检验Ho:b1=0;H1:b1 0586.180275.0511123.0T111bSb给定显著性水平 a=0.05,查自由度 n-2=8 的 t 分布表,得 ta=2.3062T1 2.306 拒绝原假设,接受备择假设(六)回归方程的显著性检验(F 检验))2,

20、1.4)2,1()2/(1/.3.2.122nFFnFneyRSSESSFii(分布表,得临界值,查给定显著性水平检验计算统计量列出方差分析表根据样本观察值计算并提出总体参数的假设aaH0:b0=b1=0;H1:bi 不全为 0;离差名称平方和自由度均方差回归平方和剩余平方和总体平方和2iy2ie2iykn k-1n-1kxbi/221)1/(2knei方 差 分 析 表)1/(2nyi对方程的显著性 F 检验H0:b0=b1=0;H1:bi 不全为 0;32.5)2,18105.024633.345210/13.427921/6.7068973*511123.02/1/2/1/2222122

21、nFFnebneyRSSESSFiiiix(分布表,得临界值查第二自由度为,时,第一自由度为给定显著性水平检验)(aaF 5.32 拒绝原假设,接受备择假设九、作业 寻找问题;形成理论假说;查找数据;建立模型;检验解释结果;可以通过建立小组方式进行学习,但每人要有题目。软件演示 认识软件 文件建立 数据输入 模型计算 结果解读 预测 结果表达本节作业:找到感兴趣问题,并准确描述(可以结合导师课题);阅读文献,形成理论假说,确定变量;查找相关数据,建立一元线性回归模型,并用计量方法检验模型结果。如果模型不是一元的,可以先建立一元模型,以后再完善。对模型结果进行检验。对模型结果进行解读并根据结果提

22、出建议。内容回顾 什么是回归?什么是计量模型?什么是自变量、因变量?如何估计参数?有哪些基本方法?各自原理是什么?估计出来的参数具有哪些基本性质?如何对其进行检验?如何判断模型估计的总体效果?如何运用模型进行预测?如何进行区间预测?如何创建WF?如何录入数据?如何估计?其他问题 是否完成相关课题选择与试验性模型建立与计算?软件操作是否成功?是否需要助教进行帮助?是否需要单独指导时间?第三节 多元线性回归模型 内容:矩阵表达 多元线性回归的条件 计算过程 参数特征 重点:矩阵推演 一、多元线性回归模型一、多元线性回归模型 多元线性回归模型多元线性回归模型:表现在线性回归模型中的解释变量有多个。一

23、般表现形式一般表现形式:ikikiiiXXXYbbbb 22110i=1,2,n其中:k为解释变量的数目,bj称为回归参数回归参数(regression coefficient)。是因变量对自变量偏导数。习惯上习惯上:把常数项常数项看成为一虚变量虚变量的系数,该虚变量的样本观测值始终取1。这样:模型中解释变量的数目为(模型中解释变量的数目为(k+1+1)取 n 个观察值,i=1,2,n,得 n 个方程ikikiiiXXXYbbbb 22110nknkjnjnnnkkjjkkjjXXXXYXXXXYXXXXY1221102222221210211121211101bbbbbbbbbbbbbbb

24、方程表示:方程表示:各变量各变量X X值固定时值固定时Y Y的平均响应的平均响应。bj也被称为也被称为偏回归系数偏回归系数,表示在其他解释变,表示在其他解释变量保持不变的情况下,量保持不变的情况下,Xj每变化每变化1个单位时,个单位时,Y的均值的均值E(Y)的变化的变化;或者说或者说bj给出了给出了Xj的单位变化对的单位变化对Y均值的均值的“直直接接”或或“净净”(不含其他变量)影响。(不含其他变量)影响。总体回归模型总体回归模型n个随机方程的个随机方程的矩阵表达式矩阵表达式为为 XY其中其中)1(212221212111111knknnnkkXXXXXXXXXX1)1(210kkbbbb12

25、1nn121nnYYYY样本回归函数样本回归函数:用来估计总体回归函数:用来估计总体回归函数kikiiiiXXXYbbbb22110其其随机表示式随机表示式:ikikiiiieXXXYbbbb22110 ei称为称为残差残差或或剩余项剩余项(residuals),可看成是总,可看成是总体回归函数中随机扰动项体回归函数中随机扰动项 i的近似替代。的近似替代。样本回归函数样本回归函数的的矩阵表达矩阵表达:其中:其中:kbbb10neee21e二、多元线性回归模型的基本假定二、多元线性回归模型的基本假定 假设1,解释变量是非随机的或固定的,且各X之间互不相关(无多重共线性)。假设2,随机误差项具有零

26、均值、同方差及不序列相关性0)(iE22)()(iiEVar0)(),(jijiECovnjiji,2,1,假设3,解释变量与随机项不相关 0),(ijiXCov假设4,随机项满足正态分布),0(2Nikj,2,1 维恩图12345上述假设的上述假设的矩阵符号表示矩阵符号表示 式:式:假设1,n(k+1)矩阵X是非随机的,且X的秩=k+1,即X满秩。假设2,0)()()(11nnEEEEnnEE11)(21121nnnEI22211100)var(),cov(),cov()var(nnn假设3,E(X)=0,即 0)()()(11iKiiiiiKiiiiEXEXEXXE三、多元线性模型估计之普

27、通最小二乘估计三、多元线性模型估计之普通最小二乘估计对于随机抽取的n组观测值kjniXYjii,2,1,0,2,1),(如果样本函数样本函数的参数估计值已经得到,则有:KikiiiiXXXYbbbb22110i=1,2n根据最小二乘原理最小二乘原理,参数估计值应该是下列方程组的解 0000210QQQQkbbbb其中2112)(niiiniiYYeQ2122110)(nikikiiiXXXYbbbb普通最小二乘估计普通最小二乘估计2210222211022110)()(iXbiXbbiYiYiYieQiXbiXbbiYiuiXbiXbbiYiYiXiXbiXiXbiXbbQiYiXiXiXbi

28、XbiXbbQiYiXbiXbbnbQ22222112021212211101221100000于是得到关于待估参数估计值的正规方程组正规方程组:kiikikikiiiiikikiiiiiikikiiikikiiXYXXXXXYXXXXXYXXXXYXXX)()()()(221102222110112211022110bbbbbbbbbbbbbbbb 解该(k+1)个方程组成的线性代数方程组,即可得到(k+1)个待估参数的估计值,bjjk 012。正规方程组正规方程组的矩阵形式矩阵形式nknkknkkiikikikiiiikiiYYYXXXXXXXXXXXXXXXXn2121112111021

29、12111111bbb即YXX)X(由于XX满秩,故有 YXXX1)(BXYUXBYYX-X)(XBBX)XY)(X1(对上述方程两边同乘观察值距阵 X 的转置距阵X注:关注教材P73页推导过程.是否可以直接乘以X的逆阵?*最大似然估计最大似然估计 对于多元线性回归模型ikikiiiXXXYbbbb 22110易知),(2XiNYi Y的随机抽取的n组样本观测值的联合概率)()(21)(212122222211022)2(1)2(1),(),(XYXYbbbbeeYYYPLnXXXYnnnkikiiin即为变量Y的或然函数或然函数 对数或然函数为)()(21)2()(2*XYXYnLnLLnL

30、对对数或然函数求极大值,也就是对)()(XYXY求极小值。因此,参数的最大或然估计最大或然估计为为YXXX1)(结果与参数的普通最小二乘估计相同结果与参数的普通最小二乘估计相同*矩估计矩估计(Moment Method,MM)OLS估计是通过得到一个关于参数估计值的正正规方程组规方程组YXX)X(并对它进行求解而完成的。该该正规方程组正规方程组 可以从另外一种思路来导:XYXXXYXXX(YX)求期望:0XYX)(E0XYX)(E称为原总体回归方程的一组矩条件矩条件,表明了原总体回归方程所具有的内在特征。矩即E(X-E(X)k0)1X(YXn由此得到正规方程组正规方程组 YXXX解此正规方程组

31、即得参数的MM估计量。易知MM估计量与与OLS、ML估计量等价。矩方法矩方法是是工具变量方法工具变量方法(Instrumental Variables,IV)和和广义矩估计方法广义矩估计方法(Generalized Moment Method,GMM)的基础的基础 在在矩方法矩方法中关键是利用了中关键是利用了 E(X)=0 如果某个解释变量与随机项相关,只要能找到1个工具变量,仍然可以构成一组矩条件。这就是IV(工具变量在这里可以理解为替代变量)。如果存在k+1个变量与随机项不相关,可以构成一组包含k+1方程的矩条件。这就是GMM。例:例:某公司的企业管理费主要取决于两种重点产品的产量,试估计

32、企业管理费线性回归模型。可求得:于是 64142165141153153813XY5.25.10.85.10.15.40.85.47.26)(10976201298125815515251551XXYXXX5.15.2410976205.25.10.85.10.15.40.85.47.26)(1YXXXb回归模型为:215.15.24XXY5.15.10610810976205.15.245381353813YXYYXYYYeeRSSbb3693.15.275.0)(866.0175.0)(47493.47.2675.0)(75.025.112221110002CSCSCSkneebbb:参数

33、估计的样本标准差随机扰动项的方差:四、四、参数估计量的性质参数估计量的性质 在满足基本假设的情况下,其结构参数b b的普通最小二乘估计、最大或然估计最大或然估计及矩估计矩估计仍具有:线性性线性性、无偏性无偏性、有效性有效性。同时,随着样本容量增加,参数估计量具有:渐近无偏性、渐近有效性、一致性渐近无偏性、渐近有效性、一致性。1、线性性、线性性 CYYXXX1)(其中,C=(XX)-1 X 为一仅与固定的X有关的行向量 2、无偏性、无偏性 XXXXXXXYXXX11)()()()()()(1EEEE这里利用了假设:E(X)=0 3、有效性(最小方差性)、有效性(最小方差性)其中利用了 YXXX1

34、)(XXXXXXX11)()()(和I2)(E 五、样本容量问题五、样本容量问题 所谓“最小样本容量最小样本容量”,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。最小样本容量最小样本容量 样本最小容量必须不少于模型中解释变量样本最小容量必须不少于模型中解释变量的数目(包括常数项)的数目(包括常数项),即 n k+1因为,无多重共线性要求:秩(X)=k+1 2 2、满足基本要求的样本容量、满足基本要求的样本容量 从统计检验的角度从统计检验的角度:n30 时,Z检验才能应用(大样本使用);n-k8时,t分布较为稳定 一般经验认为一般经验认为:当n30

35、或者至少n3(k+1)时,才能说满足模型估计的基本要求。模型的良好性质只有在大样本下才能模型的良好性质只有在大样本下才能得到理论上的证明得到理论上的证明 六、多元线性回归模型的参数估计实例六、多元线性回归模型的参数估计实例 例例 前章已建立了中国居民人均消费中国居民人均消费一元线性模型。这里我们再考虑建立多元线性模型。解释变量:解释变量:人均GDP:GDPP 前期消费:CONSP(-1)估计区间估计区间:19792000年Eviews软件估计结果 LS/Dependent Variable is CONS Sample(adjusted):1979 2000 Included observat

36、ions:22 after adjusting endpoints Variable Coefficient Std.Error t-Statistic Prob.C 120.7000 36.51036 3.305912 0.0037 GDPP 0.221327 0.060969 3.630145 0.0018 CONSP(-1)0.451507 0.170308 2.651125 0.0158 R-squared 0.995403 Mean dependent var 928.4946 Adjusted R-squared 0.994920 S.D.dependent var 372.642

37、4 S.E.of regression 26.56078 Akaike info criterion 6.684995 Sum squared resid 13404.02 Schwarz criterion 6.833774 Log likelihood -101.7516 F-statistic 2057.271 Durbin-Watson stat 1.278500 Prob(F-statistic)0.000000 七、拟合优度检验 TSS =(Yi-Y)2=(Yi2-2 Y Yi+Y 2)=Yi2-nY 2 =YY-nY 2 ESS =(Yi-Y)2-e2 =(YY-nY 2)-(Y

38、Y-BXY)=BXY-n Y 2222)(1TSSESSYYYYYXBnnYiYeeR2校正样本决定系数:?R2=1-(1-R2)(n-1)(n-k-1)可决系数可决系数TSSRSSTSSESSR12该统计量越接近于1,模型的拟合优度越高。问题:问题:在应用过程中发现,如果在模型中增加一个解释变量,R2往往增大(Why?)这就给人一个错觉一个错觉:要使得模型拟合得好,只要使得模型拟合得好,只要增加解释变量即可要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整需调整。调整的可决系数调整的可决系数(adjusted coefficient of

39、determination)在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方将残差平方和与总离差平方和分别除以各自的自由度,以剔和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响除变量个数对拟合优度的影响:)1/()1/(12nTSSknRSSR其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。k越大,RSS越小,n-k-1越小。*赤池信息准则和施瓦茨准则赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有:赤池信息准则赤池信息准则(Akaike information criter

40、ion,AIC)nknAIC)1(2lnee施瓦茨准则施瓦茨准则(Schwarz criterion,SC)nnknAClnlnee 这两准则均要求这两准则均要求仅当所增加的解释变量能够减少仅当所增加的解释变量能够减少AICAIC值或值或ACAC值时才在原模型中增加该解释变量值时才在原模型中增加该解释变量。总体回归方程的显著性检验(F检验)H0:b0=b1=bk=0;H1:bi 不全为 0;)1,)1,()1/(/)1/(/2knkFFknkFknknknRSSkESSF(分布表,得临界值,查给定显著性水平aaYXBYYYYXB离差名称平方和自由度回归平方和剩余平方和总体平方和2YYXBnYX

41、BYY2YYYnkn-k-1n-1k-自变量的个数n-样本个数F统计量与R2的关系221)1()1(/)(/)1/()(/)1/(/RRkknkknTSSESSTSSTSSESSknESSTSSkESSknRSSkESSF估计参数的显著性检验(t 检验)t 检验是检验自变量 Xi 对因变量 Y 线性作用是否显著的一种统计检验。H0:bi=0;H1:bi 0;t(n-k-1)S(bi)Tbi比较|T|与 ta的大小2|T|ta 拒绝 H02 1-a接受域 -ta/2 O ta/2 t对多个回归系数联合检验 过程:对模型做无约束与约束的回归,得到相应的残差平方和与R平方;利用上述结果设计统计量F;

42、对F进行检验:原假设,系数都是零;备择假设,系数不为零。最后看F值及其概率。注:对模型总体检验的F检验是这里F统计量的特例)1/(/)(1,knRSSqRSSRSSFururrknqEVIEWS实现 模型估计;在结果中点View/Coefficient Tests/Wald-coefficient Restrictions 进行参数约束设定(虚假设);点击OK,出现结果,根据F值与其概率进行判断。作业:完成多元线性模型 完成多元线性模型设计;比较R2与调整后R2;分析t检验结果;分析F检验结果,并比较其与R2关系。第四节 非线性方程线性化 一、主要曲线类型(一)双曲线方程(倒数模型)Yt=bo

43、+b1 +ut 1Xtbo 0,b1 0bo 0,b1 0a 0b 0 b3 00Y=bo+b1 X+b2 X 2+b3 X 3多项式函数图象YX0Y=bo+b1 X+b2 X 2总成本曲线图形总成本曲线图形Y=bo+b1 X+b2 X 2+b3 X 3(五)逻辑曲线bxaekY1产品生长周期:产品生产量随着时间变化的过程,开始阶段发展较慢,接着是急剧增长,然后是平稳发展的周期,最后达到饱和状态,其轨迹形成一条“S”型曲线。YX0KK2 K1+a二、曲线方程的线性化(一)直接代换法 直接代换法适用于变量之间的关系虽然是非线性的,但因变量与参数之间的关系却是线性的非线性模型。=bo+b1 +ut

44、 1Yt 1Xt令 Y*=,X*=1Xt 1YtYt*=bo+b1 X t*+ut得双曲线方程Y=bo+b1 X+b2 X 2+b3 X 3令 X2=X 2 ,X3=X 3得Y=bo+b1 X +b2 X 2+b3 X 3 从而将一元 3 次方程转化为三元 1 次方程。多项式函数方程(二)间接代换法 当经济变量之间的非线性关系,不能通过直接变量代换转化为线性形式,需要先通过方程两边取对数后再进行变量代换,转化为线性形式,这种方法称为间接代换法。对方程两边取对数,得:ln Y=ln A+a ln L+b ln K 令 Y*=ln Y,A*=ln A,L*=ln L,K*=ln K则 Y*=A*+

45、a L*+b K*柯布道格拉斯方程baKAL Y baKLAe Yt 如何替换?逻辑曲线方程bxaekY1bxaYaaYYkYbxaYYkeaYYkbx*ln*ln*lnln)()(得:令:方程变换:,方程两边取对数三、案例 案例案例1 根据平均成本U型曲线理论,成本函数可用产量的三次多项式近似表示。利用某企业的总成本和产量的统计资料,建立某企业的总成本模型和平均成本模型。2758.21.1649799977.099971.059.977.295.1177.10004.003.07.8523242232WDFRRXXXY)()()()(总成本模型总成本模型平均成本模平均成本模型型20004.0

46、03.07.852324XXXXY案例2 柯布道格拉斯生产函数柯布道格拉斯生产函数特征(1)柯布道格拉斯生产函数是 阶齐次函数。假定所有投入都明确作为可变投入对待,比例报酬参数(即函数系数)就等于各项投入的b值之和。(2)各项投入的生产弹性恒为常量,且为各投入要素的b值。ibiiiibXYXYE柯布道格拉斯生产函数特征(3)所有的投入都必须大于0。由于柯布道格拉斯生产函数是乘积函数,缺少任何一项投入都将导致总产出为0,这个特点就限制了其使用范围。在应用柯布道格拉斯生产函数时一定要注意。(4)柯布道格拉斯生产函数没有最大值存在。当函数系数大于1时,产出值以递增的速率增加;当函数系数等于1时,产出

47、值以固定的速率增加;当函数系数小于1时,产出值以递减的速率增加。柯布道格拉斯生产函数的应用(1)弹性值分析 (2)边际值分析(3)测定科技进步率 dtLdLdtKdKdtYdYdtdLLdtdKKdtdYYLKtAY/1101lnlnlnln0bababadtydy/dtkdk/dtldl/产出年均增长率资本投入年均增长率劳动投入年均增长率技术进步率Y=A0etKL的贡献份额劳动的增长对经济增长的贡献份额资本的增长对经济增长贡献份额技术进步对经济增长的1dtldldtkdkdtydy/baYLYKYLKY1baba GDP的年均增长速度 资本的年均增长速度 劳动的年均增长速度%00916.21

48、7.166078.315351/141419581972GDPGDPVY%6825.217.178033.417941/141419581972KKVK%13882.015.2751.2881/141419581972LLVL%24.24%4.65%36.101%4.65%00916.2%68254.249.0%36.10%00916.2%13882.0499.1贡献份额技术进步对经济增长的的贡献份额资本的增长对经济增长的贡献份额劳动的增长对经济增长YKYLab数学分析:不同的生产函数 Y=ALaKb LNY=LNA+alnL+blnK(对时间求微分)dY/Y=dA/A+adL/L+bdK/K dA/A=dY/Y-(adL/L+bdK/K)科技贡献率=(dA/A)/(dY/Y)作业:计算安徽省农业科技进步贡献率;计算中国经济科技进步贡献率。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(线性回归模型介绍课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|