1、2013/11/16第一章 统计学基础知识一元回归模型一元回归模型 现在,我们用一个一次方程来表示两个数据X和Y之间的关系。这个公式就是一元回归模型。X是表示原因的变量,成为解释变量或独立变量;Y是表示结果的变量,称为被解释变量或从属变量。u是误差项或扰乱项,它是Y的变化中不能完全由X的变化来解释的部分,换句话说,它表示的是Y(实际值)与+X(理论值)之间的偏差。2013/11/16第一章 统计学基础知识 一般来说,回归分析是为了发现X作为原因,Y作为结果是两者之间的因果关系,因此,X与Y之间的关系,理论上必须能够成立。如果对没有理论意义上的公式进行推算,即使能够得出良好的推算结论,也是没有意
2、义的分析,这一点必须充分注意。回归分析的主要目的是估计回归系数、,最常用的办法就是最小二乘法(ordinary least squares method,OLS)。2013/11/16第一章 统计学基础知识最小二乘法最小二乘法(OLS)利用OLS来估计一元回归模型,可以得到所谓的估计回归线(最小二乘回归线),即YX 称为的估计值(最小二乘估计值)。读作Y hat,如图所示,它是与X实际值(观测值)相对应的估计回归线上的Y值,称为Y的理论值(估计值、计算值、预测值等)。、Y2013/11/16第一章 统计学基础知识Y Y(结果)(结果)X X(原因)(原因)Y Y1 1:观测值观测值1:Y理论值
3、1 u:残差2 u3 u4 u:YX估计回归曲线12013/11/16第一章 统计学基础知识22222OLSn=nxyx1XYn-11Xn-1XYXYXXXXYYXXXXYYXX 根据计算、的公式如下:和 的协方差的方差222-=nnXYXXYXXYXYX 2013/11/16第一章 统计学基础知识 下面,就残差为u,残差=实际值-理论值 其次,计算残差的2次方的总和,即残差平方和(residual sum of squares,RSS),得 寻找能够使残差平方和最小的 值,就是OLS的基本原理。为了求残差平方和 关于 的最小值,需要将上式对 分别求偏导,并设其为零,即 u=YY YX22 u
4、=YX、2 u2013/11/16第一章 统计学基础知识 这个联立方程称为正规方程。222 u20 u20n+YXX YXYXXYXX 将这两个方程整理,得联立方程2013/11/16第一章 统计学基础知识例题例题3-1 利用下面的数据,对一元回归模型Y=+X+u进行最小二乘估计。X X6 6111117178 81313Y135242013/11/16第一章 统计学基础知识解答解答 将数据带入工作表中进行计算,得:22225515192679n5 19255 15135=0.3655 67955370n13515553701.01n51.01 0.365XYXYXXYXYXXYXYX 根据公
5、式,因此,估计回归线为2013/11/16第一章 统计学基础知识又解又解 将数据带入工作表进行计算。225515113n5n5x=y=5515x0y0 xy27x74xy27=0.365x74273111.01741.01 0.365XYXYXXYYXYYXYX 其中:同时:得:根据公式因此,估计回归线为2013/11/16第一章 统计学基础知识决定系数决定系数(coefficient of determination)是反映估计的回归线对观测的数据的解释能力,或者说是反映两者拟合优度的尺度,是回归分析不可缺少的统计量。我们将Y的实际值与平均值之差的平方和称作Y的全部变化,即2=YYY的全部变
6、化另外将Y的理论值与平均值之差的平方和称作能够由回归解释的变化(回归平方和),即2=YY能够由回归解释的变化2013/11/16第一章 统计学基础知识 这样,所谓决定系数R2反映的是Y的全部变化中,能够由回归来解释的部分的比率,其定义如下:222222=1 u=1RYYYYYYYYYY 能够由回归解释的变化(回归平方和)的全部变化不能由回归解释的变化(残差平方和)的全部变化2013/11/16第一章 统计学基础知识 决定系数的计算公式可以采用下面三个公式中的任何一个。222222222222222=xyxynnnXXRYYXXYYXXYYXYXYXXYY 2013/11/16第一章 统计学基础
7、知识 此外,决定系数与相关系数之间有以下关系:决定系数的取值范围为:0R21 决定系数越接近于1,理论值与实际值越近似,说明模型的解释能力越强。例如,如果R2=90%,则模型具有90%的解释力;如果R2=30%,则说明模型只有30%的解释力2013/11/16第一章 统计学基础知识例题例题3-2 表3-3显示了日本1994-2005年的12年间,实际国内生产总值X与实际居民消费支出Y的数据。(1)对下面的宏观消费函数进行最小二乘估计;(2)计算决定系数R2,并考察估计出来的宏观消费函数的拟合优度;(3)求理论值和残差;(4)利用(1)中估算出来的宏观消费函数,当实际国内生产总值在510兆日元和
8、570兆日元时,对实际居民消费支出分别进行预测。2013/11/16第一章 统计学基础知识年份年份实际国内生产总值实际国内生产总值X X实际居民最终消费支出实际居民最终消费支出Y Y1994199519961997199819992000200120022003200420054694784904974884875015035045135255382662712772792772802832872902912973032013/11/16第一章 统计学基础知识解答解答(1)222225993340117007472997131965153n12 17007475993 340126771=0.
9、5405812 2997131 599349523n15405.8XYXYXYXYXYXX 将数据代入工作表,得:根据公式这个 称作边际消费倾向,它的含义是如果实际国内生产总值增加 兆日元,将会引起实际居民最终消费支出增加亿日元。其次267713401599349523=13.443n1213.4430.54058YXYX,根据公式因此,估计的日本宏观消费函数为2013/11/16第一章 统计学基础知识解答解答(2)222222222nnn12 17007475993 340112 2997131 599312 96515334017166864410.962574457830596.25%+
10、XYXYRXXYYYX 根据公式:这就是说,实际居民最终消费支出 的变化中,有可以由模型来解释。估计出来的宏观消费函数具有极高的拟合优度。2013/11/16第一章 统计学基础知识解答解答(3)13.443+0.540583-400YYXXuYYuuYYYYuYYYY关于理论值,可以在(1)中求出的下式中代入 的实际值求解。另外根据公式:求残差表是理论值与残差值的计算结果即过大估计即过小估计在回归分析中,考虑过大估计、过小估计的发生原因,非常重要。2013/11/16第一章 统计学基础知识年份年份实际值实际值理论值理论值残差残差199419951996199719981999200020012
11、002200320042005266271277279277280283287290291297303266.97271.84278.33282.11277.25276.70284.27285.35285.89290.76297.25304.27-0.97-0.84-1.33-3.11-0.253.30-1.271.654.110.24-0.25-1.272013/11/16第一章 统计学基础知识解答解答(4)51013.4430.5405813.4430.54058 510289.1()57013.4430.5405813.4430.54058 570321.6()XYXXYX当时兆日元当时
12、兆日元是在解释变量X的实际取值范围之内(469兆日元X538兆日元)预测Y,称为内插预测;是在解释变量X的实际取值范围之外预测Y,称为外插预测。2013/11/16第一章 统计学基础知识非线性方程非线性方程(non-linear equation)的回归分析的回归分析 当数据的分散情况在一定的较小的范围时,被解释变量与解释变量之间的回归关系,大部分是线性相。但是随着范围的扩大,非线性近似的情况很多。一般来说,非线性方程的回归分析,通过对被解释变量与解释变量的某种变换,可以将非线性方程转换成能够用最小二乘法进行分析的线性方程。下表所列的线性变换是非线性函数回归分析中常用的类型。2013/11/16第一章 统计学基础知识2013/11/16第一章 统计学基础知识2013/11/16第一章 统计学基础知识
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。