1、第二章 一元线性回归模型第一节 一元线性回归模型及其假设第二节 模型参数估计与统计量的性质第三节 一元线性回归模型的检验与预测第四节 几个应当注意的问题第五节 一元线性回归模型的应用第1页,共40页。n回归分析方法n研究因变量随自变量变化的关系形式的分析方法n常见的分类:n一元回归和多元回归n线性回归和非线性回归n普通回归和带虚拟变量的回归n无自回归的回归模型和自回归模型第2页,共40页。第一节 一元线性回归模型及其假设一、回归分析和相关分析相关关系的概念回归分析与相关分析相关分析以相关系数为对象,通常用相关系数表示回归分析研究因变量和自变量之间的数量变动关系 相关系数的取值范围为-1,1。|
2、r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。第3页,共40页。二、一元线性回归模型yabxu随机扰动项自变量、解释变量被解释变量、预测对象,1,2,iiiyabxu in随机扰动项自变量、解释变量被解释变量、预测对象随机扰动项自变量、解释变量被解释变量、预测对象第4页,共40页。第5页,共40页。三、假设条件假设1:()0,1,2,iE uin()E yabx理论回归直线第6页,共40页。n假设2:2(),1,2,iuD ui,n(,)0,1,2,ijCov u uij j,n等方差性“高斯-马尔可夫假设”无序列相关性第7页,共40
3、页。n假设3:(,)0,1,2,iiCov u xin,2(,)uyN abx为非随机变量ix第8页,共40页。第二节 模型参数估计与统计量的性质,1,2,iiyabxu in一元线性回归模型iiyabxiiieyy估计误差、残差第9页,共40页。n最小二乘法的主要思想主要思想:为观测值配合一条较为理想的回归直线,两点要求:原观测值和模型估计值的离差平方和最小;离差总和为0.2min()iiyy()0iiyy第10页,共40页。第11页,共40页。回归参数的估计值为:1112211nnniiiiiiinniiiinx yxybnxx 11nniiiiyxabybxnn第12页,共40页。n某地
4、区居民家庭可支配收入xt与家庭消费支出yt的资料如右表所示(单位百元)。n要求:建立居民家庭消费支出yt对家庭可支配收入xt的回归直线方程;指出居民可支配收入每增加200元时,家庭消费支出增加多少。第13页,共40页。第14页,共40页。第三节 一元线性回归方程的检验与预测n回归直线是否有意义,可否能用于预测或控制?需要通过显著性检验n相关系数检验法nF检验法nT检验法第15页,共40页。n一、离差平方和的分解和可决系数n离差平方和的分解2xyiLyy总离差222iiiiyyyyyyTSS,Total Sum of SquaresRSS,Residual Sum of SquaresESS,E
5、xplained Sum of Squares第16页,共40页。第17页,共40页。n可决系数(决定系数)2R21ESSRSSRTSSTSS 201R第18页,共40页。n 相关系数R22221iiiiiyyyyRyyyy22(,)()()iiiixxyycov x yRvar x var yxxyy第19页,共40页。n二、回归方程的检验n相关系数检验法计算相关系数根据回归模型的自由度(n-2)和给定的显著性水平,从相关系数临界值表中查出临界值判别,(2)Rn(2)RRn(2)RR n第20页,共40页。nF检验法n构造F统计量22(2)(2)iiiyyESSFRSSyynnF统计量服从第
6、一自由度为1,第二自由度n-2的F分布。第21页,共40页。nt检验法n构造t统计量22(2)iiibtyynxt统计量服从自由度为(n-2)的t分布第22页,共40页。第23页,共40页。n三、一元线性回归预测区间n点估计n预测区间:在一定的显著性水平上,依据数理统计方法计算出的包含预测对象未来真实值的某一区间范围。n点估计值 的统计性质0 y2200021,ixyN abxnx第24页,共40页。n总体方差 的无偏估计量222iiyyn2的无偏估计量第25页,共40页。n预测值和预测区间n设预测点为(,),则预测值为0 x0y00yabxn其预测误差为000eyy可以得出:2200210,
7、1ixeNnx第26页,共40页。n预测区间为0/200/20(2),(2)ytnSytnS第27页,共40页。第28页,共40页。第四节 几个应当注意的问题一、重视数据的收集和甄别一些变量无法直接观测,一些现实数据不能公开数据缺失或出现异常数据数据量不够,样本太小数据不准确、不一致、有矛盾第29页,共40页。二、合理确定数据的单位适当的选取变量的单位,使模型中各变量的数量级大体一致第30页,共40页。第五节 一元线性回归模型的应用例1:菲利普斯曲线第31页,共40页。例2:根据美国1962-1977年的数据,得到如下的汽车需求函数:58073.24iiyx()(1.634)s b20.22R
8、 n对b建立一个95%的置信区间;n假设检验:该置信区间包括b=0。如果不包括,那么接受零假设吗?n在H0:b=0下,计算t值,在5%的显著性水平下,它是统计显著吗?实际可支配收入私家车零售数量第32页,共40页。0.0250.0253.24(14)(),3.24(14)()ts bts b接受零假设3.24/1.6341.9829t 第33页,共40页。例3:利用给出的2008年我国城镇居民人均消费支出与人均可支配收入数据(数据来源:中国统计年鉴2009),回答问题:1、建立一元线性回归模型,写出回归方程,如何解释斜率?2、给出显著性水平5%,对参数进行显著性检验3、弹性定义为自变量变动百分
9、之一所引起的因变量变动的百分比,用数学形式表示为弹性=斜率*(x/y)。假设仅根据2得到的回归结果,能求出支出对收入的弹性吗?如果不能,计算此弹性还需要其它什么信息?4、如果增加一个地区,该地区年可支配收入是12000元,求该地区的消费支出的点预测值,和该地区人均消费支出95%置信水平的区间预测。第34页,共40页。第35页,共40页。725.3460.665iiyx(1.589)t(22.496)20.946R 506.08F 第36页,共40页。第37页,共40页。12000fx 725.3460.665*120008705.346fy 22()11()ffyixxSSnxx0.0250.025,ffffytSytS第38页,共40页。第39页,共40页。例4:给出我国1989-2008年农业总产量y(万吨)、有效灌溉面积x1(千公顷)、化肥施肥量x2(万吨)及农机总动力x3(万千瓦)。根据数据回答下列问题:试估计下面三个一元线性回归模型,并进行结构分析和统计检查比较三个模型拟合程度的优劣,用最好的模型估计2009年的预测值(2009:59942.7,5383,86396.8),给出样本值和预测值的时间序列图,并求2009年的农业总产值95%的预测区间01 1iiiybb xu012iiiybb xu013iiiybb xu第40页,共40页。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。