《应用统计学教程》课件第11章.pptx

上传人(卖家):momomo 文档编号:7904117 上传时间:2024-09-03 格式:PPTX 页数:27 大小:221.61KB
下载 相关 举报
《应用统计学教程》课件第11章.pptx_第1页
第1页 / 共27页
《应用统计学教程》课件第11章.pptx_第2页
第2页 / 共27页
《应用统计学教程》课件第11章.pptx_第3页
第3页 / 共27页
《应用统计学教程》课件第11章.pptx_第4页
第4页 / 共27页
《应用统计学教程》课件第11章.pptx_第5页
第5页 / 共27页
点击查看更多>>
资源描述

1、第11章 相关分析与回归分析11.1、变量间的关系11.2、相关系数的测度11.3、简单线性回归模型11.4、回归模型的应用11.1、变量间的关系1、函数关系和相关关系 Y=f(x)变量之间不确定性的依存关系,我们称之为相关关系.2、相关关系的种类0510152025300102030051015202501020300510152025300102030051015202501020300102030405060010203040500204060801001201401600102030例1、下面是19个家庭食品消费支出和家庭收入数据(数据教材11-1),试用图表分析食品消费支出与家庭收入

2、的相关关系。)(ix0246805101520家庭食品支出与收入相关分析图11.2 相关系数的测度1、线性相关系数性质:-1r+1r0,正相关;|r|=1完全相关强相关和弱相关22)()()(YYXXYYXXriii 2222)()(iiiiiiiiYYnXXnYXYXnr相关系数的另一种形式计算式 在手工计算样本相关系数时,通常先列计算表得到X,Y,XY,X2,Y2。然后代入公式。Excel计算相关系数的函数CORREL2、相关系数的检验总体相关系数=0时,样本相关系数r趋近于正态分布。而当接近于+1或-1时,除非n非常大,r的分布是有偏的。在实际的检验中,通常情况下采取费舍尔提出的t检验,

3、检验适用于小样本,也适用于大样本。因为在总体相关系数 接近0时,t的分布接近正态分布。t检验的步骤:第一步:提出假设H0:=0 H1:0第二步:计算检验统计量值 第三步:根据给定的显著性水平a和自由度查t分布表,得到 临界值ta/2(n-2)。若t ta/2(n-2),则拒绝原假设。反之,不能拒绝原假设。)2(122nrrt例11.2 针对数据11.1,19个家庭食品消费支出和家庭收入数据计算的样本相关系数r=0.9785,检验两者之间的线性相关系数是否显著(a=0.05)。解:第一步:提出假设H0:=0 H1:0第二步:计算检验统计量值 56.19)219(9785.019785.0)2(1

4、2222nrrt第三步:根据给定的显著性水平a和自由度查t分布表,得到 临界值t0.025(17)=2.1098。因为t=19.56 ta/2(n-2),故拒绝原假设。表明家庭食品支出与家庭收入变量总体上相关性显著。11.3 简单线性回归模型11.3.1模型的基本定义 1、模型的数学形式Y:因变量、应变量、被解释变量X:自变量、解释变量iiiXY102、模型包含随机误差项的原因1)引起变量观察值随机误差的诸多因素,使模型产生的误差。变量观察值的误差往往是不可避免的,无论是试验数据还是观察数据。但是在多次观察中有理由认为绝对值相同的正、负误差出现的机会大致相同。2)模型设定的误差。这其中既有模型

5、的函数形式设定的误差,也可能有遗漏解释变量的误差。引起设定误差的原因可能是我们对于引起 变动的机理尚不清楚,有时也是为了简化模型的需要。3)存在一些无法观测的解释变量。3.关于随机误差项的假定1)对于本身而言,具有零均值,即 E(i)=0;2)对于本身而言,具有等方差,即:D(i)=2;3)对于本身而言,即i和j不相关,可以表示为:COV(i,j)=0;4)与解释变量X不相关,可以表示为:COV(i,Xj)=0。11.3.2 最小二乘估计法(Least Squares Estimate Method)1.最小二乘的基本思想 根据Y 和X的样本观察值得到总体参数的估计值,最常用的方法就是最小二乘

6、估计法,即假设在拟合Y依X线性关系的所有直线中,有一条直线的预测值和观察值的偏离程度最小,即:必有:2102)(min)(minminiiiXYYYQ0)(2/0)1)(2/i101100XXYQXYQiiii整理得到参数的估计值:在手工计算样本相关系数时,通常先列计算表得到X,Y,XY,X2,Y2。然后代入公式。XYXXnYXYXniiiiii10221)(例11.3 针对数据11-1,试估计居民食品消费支出依家庭收入的回归方程。通过计算,可以得到食品消费支出依居民家庭收入的样本回归方程,写成:2537.0164178219641644.64519)(2221iiiiiiXXnYXYXn17

7、82.1191642537.0196410XYiiXY2537.01782.1根据经济学的知识,对这一回归方程可以做出解释,斜率0.2537表示当家庭收入每增加1万元,用于居民家庭食品的消费支出平均增加2537元,可以理解为收入对食品支出的边际贡献;而截距1.1782可以理解为收入为0时家庭食品支出额。2.在EXCEL中回归方程的估计第一步,选择“数据分析”中的“回归”分析工具,选择Y的输入区域和X的输入区域,如图第二步,点击确定后得到如图11-3b的三张表:回归统计、方差分析和系数表(Coefficients)。11.3.3回归方程的显著性检验1.回归方程整体拟合效果的检验拟合优度(good

8、ness of fit)Y的总变差:回归平方和:残差平方和:2)(YYTSSi2)(YYESSi22)(iiiYYeRSS对于给定的样本数据,无论样本回归线如何,总变差平方和TSS总是一定的,那么ESS在TSS中所占比重越高,或者说由于随机因素引起的变差RSS所占比重越小,都能够说明根据 解释 的变化效果越好,因此我们定义:称R2为拟合优度(goodness of fit)或判定系数,它度量了回归方程的拟合效果。根据上面相关定义可知,拟合优度的取值0,1。TSSRSSTSSESSR122.回归方程线性关系的显著检验F检验度以例11-3中食品消费支出的回归分析结果为例第一步:提出假设H0:=0H

9、1:0第二步:计算F统计量)2,1()2/(1/nFnRSSESSF8091.38217/0477.11/5933.23)2/(1/nRSSESSF第三步:查自由度为(1,17)的F分布临界值,一般情形下,给定显著性水平a=0.05 。F0.05(1,17)=8.3997第四步:将根据样本回归结果计算的F=382.8091和临界值比较,由于F F0.05(1,17)=8.3997,因此拒绝原假设。P-值检验,F对应的右侧概率。3.回归方程系数的显著检验t检验度(t-test)nXX22)(1nXXssiie22)(1MSRnRSSYYnsie2)(21111stt检验的步骤第一步:提出假设第二步:计算 统计量第三步:查自由度为(n-2)的t分布临界值ta/2(n-2)第四步:将根据样本回归结果计算的t值和临界值作比较|t|ta/2(n-2),拒绝原假设否则,不能拒绝原假设11.4 回归模型的应用11.4.1回归模型参数的区间估计112/112/1StSt)()(222/11222/1nXXMSRtnXXMSRt11.4.2根据回归方程预测1.点估计2.区间估计 1)E(Y)2)YiXY10YYStYYEStY2/02/)(220)()(1XXXXnssieY002/02/)(YYStYYEStY220)()(110XXXXnsSieY

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(《应用统计学教程》课件第11章.pptx)为本站会员(momomo)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|