真实图形课件.ppt

上传人(卖家):三亚风情 文档编号:3305390 上传时间:2022-08-18 格式:PPT 页数:51 大小:884KB
下载 相关 举报
真实图形课件.ppt_第1页
第1页 / 共51页
真实图形课件.ppt_第2页
第2页 / 共51页
真实图形课件.ppt_第3页
第3页 / 共51页
真实图形课件.ppt_第4页
第4页 / 共51页
真实图形课件.ppt_第5页
第5页 / 共51页
点击查看更多>>
资源描述

1、 统 计 学STATISTICS第8章 相关和回归分析学习目标 7.1 相关与回归分析的基本概念 7.2 一元线性回归分析 7.3多元线性回归分析 7.4 非线性回归 7.5 相关分析云南财经大学统计信息学院第1页,共51页。统 计 学STATISTICS学习重点1.相关系数的分析方法相关系数的分析方法2.一元线性回归的基本原理和参数的最小一元线性回归的基本原理和参数的最小二乘估计二乘估计3.回归直线的拟合优度回归直线的拟合优度4.回归方程的显著性检验回归方程的显著性检验5.利用回归方程进行估计和预测利用回归方程进行估计和预测云南财经大学统计信息学院第2页,共51页。统 计 学STATISTI

2、CS 7.1 相关与回归分析的基本概念 函数关系是一一对应的确定关系设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量各观测点落在一条线上 云南财经大学统计信息学院第3页,共51页。统 计 学STATISTICS函数关系(几个例子)云南财经大学统计信息学院第4页,共51页。统 计 学STATISTICS相关关系(correlation)变量间关系不能用函数关系精确表达2.一个变量的取值不能由另一个变量唯一确定3.当变量 x 取某个值时

3、,变量 y 的取值可能有几个4.各观测点分布在直线周围 云南财经大学统计信息学院第5页,共51页。统 计 学STATISTICS相关关系(几个例子)云南财经大学统计信息学院第6页,共51页。统 计 学STATISTICS相关关系(类型)按相关程度划分:完全相关、不完全相关和不相关 按相关方向划分:正相关和负相关 按相关形式划分:线性相关和非线性相关 按变量多少划分 单相关、复相关和偏相关 按相关性质划分 真实相关和虚假相关 云南财经大学统计信息学院第7页,共51页。统 计 学STATISTICS7.2 一元线性回归 7.2.1 标准的一元线性回归模型标准的一元线性回归模型 7.2.2一元线性回

4、归模型的估计一元线性回归模型的估计 7.2.3一元线性回归模型的检验一元线性回归模型的检验 7.2.4一元线性回归模型的预测一元线性回归模型的预测云南财经大学统计信息学院第8页,共51页。统 计 学STATISTICS一元线性回归模型描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型回归模型一元线性回归模型可表示为 y=b b0 0+b b1 1 x+y 是 x 的线性函数(部分)加上误差项线性部分反映了由于 x 的变化而引起的 y 的变化误差项 是随机变量反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响是不能由 x 和 y 之间的线性关系所解释的变异性1.b0

5、 和 b1 称为模型的参数云南财经大学统计信息学院第9页,共51页。统 计 学STATISTICS一元线性回归模型(基本假定)误差项的期望值为0,即E()=0。对于一个给定的 x 值,y 的期望值为E(y)=b b 0+b b 1 x对于所有的 x 值,误差项之间不存在序列相关关系,即 自变量是给定的变量,与随机误差项线性无关随机误差项服从正态分布,即 N(0,2)2)(Var0)(stCov云南财经大学统计信息学院第10页,共51页。统 计 学STATISTICS总体回归函数描述 y 的平均值或期望值如何依赖于 x 的方程称为总体回归函数总体回归函数的数学形式如下 E(y)=b b0+b b

6、1 x云南财经大学统计信息学院第11页,共51页。统 计 学STATISTICS样本回归函数(估计方程)云南财经大学统计信息学院第12页,共51页。统 计 学STATISTICS7.2.2一元线性回归模型的估计一元线性回归模型的估计0b1b云南财经大学统计信息学院第13页,共51页。统 计 学STATISTICS最小二乘法(和 的计算公式)云南财经大学统计信息学院第14页,共51页。统 计 学STATISTICS估计方程的求法(例题分析)【例【例7-1】估计食品支出的恩格尔函数1b云南财经大学统计信息学院第15页,共51页。统 计 学STATISTICS估计标准误差(standard erro

7、r of estimate)实际观察值与回归估计值离差平方和的均方根反映实际观察值在回归直线周围的分散状况对误差项的标准差的估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量反映用估计的回归方程预测y时预测误差的大小 计算公式为云南财经大学统计信息学院第16页,共51页。统 计 学STATISTICS7.2.3一元线性回归模型的检验一元线性回归模型的检验离差因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面由于自变量 x 的取值不同造成的除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响对一个具体的观测值来说,变差的大小可以通过该实际观测值与其

8、均值之差 来表示云南财经大学统计信息学院第17页,共51页。统 计 学STATISTICS离差的分解(图示)y云南财经大学统计信息学院第18页,共51页。统 计 学STATISTICS离差平方和的分解(三个平方和的关系)云南财经大学统计信息学院第19页,共51页。统 计 学STATISTICS离差平方和的分解(三个平方和的意义)总平方和总平方和(SST)反映因变量的 n 个观察值与其均值的总离差回归平方和回归平方和(SSR)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和残差平方和残差平方和(SSE)反映

9、除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和云南财经大学统计信息学院第20页,共51页。统 计 学STATISTICS可决系数r2回归平方和占总离差平方和的比例云南财经大学统计信息学院第21页,共51页。统 计 学STATISTICS可决系数r2(例题分析)【例【例7-2】计算估计食品支出的恩格尔函数回归的可决系数,并解释其意义 可决系数的实际意义是:可决系数的实际意义是:在食品支出取值的变差中,有88.63%可以由食品支出与家庭收入之间的线性关系来解释,或者说,在食品支出取值的变动中,有88.63%是家庭收入所决定的。可见食品支出与家庭收入之间有较强的线性关系

10、 云南财经大学统计信息学院第22页,共51页。统 计 学STATISTICS 7.2.3一元线性回归模型的检验一元线性回归模型的检验云南财经大学统计信息学院第23页,共51页。统 计 学STATISTICS回归系数的检验(样本统计量 的分布)云南财经大学统计信息学院第24页,共51页。统 计 学STATISTICS回归系数的检验(检验步骤)提出假设H0:b1=0(没有线性关系)H1:b1 0(有线性关系)1.计算检验的统计量云南财经大学统计信息学院第25页,共51页。统 计 学STATISTICS回归系数的检验(例题分析)对例题的回归系数进行显著性检验(0.05)提出假设H0:b1=0 H1:

11、b1 0 计算检验的统计量云南财经大学统计信息学院第26页,共51页。统 计 学STATISTICS 7.2.4一元线性回归模型的预测一元线性回归模型的预测根据自变量 x 的取值估计或预测因变量 y的取值估计或预测的类型点估计y 的个别值的点估计(或预测)区间估计1.y 的个别值的预测区间预测区间估计云南财经大学统计信息学院第27页,共51页。统 计 学STATISTICSy 的个别值的点预测 利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计值 ,就是个别值的点估计 例如,如果我们只是想知道家庭收入为200元的那些家庭的食品支出是多少,则属于个别值的点

12、估计。根据估计的回归方程得fy 云南财经大学统计信息学院第28页,共51页。统 计 学STATISTICS区间预测 点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间本课程讨论的区间估计类型1.预测区间估计(prediction interval estimate)云南财经大学统计信息学院第29页,共51页。统 计 学STATISTICS预测区间估计利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计区间,这一区间称为预测区间预测区间(predicti

13、on interval)y0在1-置信水平下的预测区间为云南财经大学统计信息学院第30页,共51页。统 计 学STATISTICS影响区间宽度的因素置信水平(1-)区间宽度随置信水平的增大而增大数据的离散程度s区间宽度随离散程度的增大而增大3.样本容量区间宽度随样本容量的增大而减小4.用于预测的 xp与x的差异程度2.区间宽度随 xp与x 的差异程度的增大而增大云南财经大学统计信息学院第31页,共51页。统 计 学STATISTICS置信区间、预测区间、回归方程云南财经大学统计信息学院第32页,共51页。统 计 学STATISTICS7.3多元线性回归分析7.3.1 多元线性回归模型多元线性回

14、归模型 7.3.2 多元线性回归模型多元线性回归模型 的估计的估计7.3.3 多元线性回归模型多元线性回归模型 的检验和预测的检验和预测云南财经大学统计信息学院第33页,共51页。统 计 学STATISTICS7.3.1多元回归模型 一个因变量与两个及两个以上自变量的回归描述因变量 y 如何依赖于自变量 x1,x2,xk 和误差项 的方程,称为多元回归模型涉及 p 个自变量的多元回归模型可表示为云南财经大学统计信息学院第34页,共51页。统 计 学STATISTICS多元回归模型(基本假定)误差项是一个期望值为0的随机变量,即E()=0对于自变量x1,x2,xp的所有值,的方差 2都相同误差项

15、是一个服从正态分布的随机变量,即N(0,2),且相互独立云南财经大学统计信息学院第35页,共51页。统 计 学STATISTICS多元样本回归函数(方程)用样本统计量 估计回归方程中的 参数 时得到的方程由最小二乘法求得一般形式为云南财经大学统计信息学院第36页,共51页。统 计 学STATISTICS7.3.2 多元线性回归模型多元线性回归模型 的估计的估计云南财经大学统计信息学院第37页,共51页。统 计 学STATISTICS7.3.3 多元线性回归模型多元线性回归模型 的检验的检验和预测和预测回归方程的拟合优度回归平方和占总平方和的比例计算公式为3.因变量取值的变差中,能被估计的多元回

16、归方程所解释的比例 云南财经大学统计信息学院第38页,共51页。统 计 学STATISTICS修正多重可决系数用样本容量n和自变量的个数p去修正R2得到 计算公式为避免增加自变量而高估 R2意义与 R2类似数值小于R2云南财经大学统计信息学院第39页,共51页。统 计 学STATISTICS 显著性检验(回归系数的检验)提出假设H0:bi=0 (自变量 xi 与 因变量 y 没有线性关系)H1:bi 0 (自变量 xi 与 因变量 y有线性关系)1.计算检验的统计量 t云南财经大学统计信息学院第40页,共51页。统 计 学STATISTICS 显著性检验(回归方程的显著性检验)提出假设H0:b

17、1b2bp=0 线性关系不显著H1:b1,b2,bp至少有一个不等于0云南财经大学统计信息学院第41页,共51页。统 计 学STATISTICS7.4 非线性回归1.因变量 y 与 x 之间不是线性关系2.可通过变量代换转换成线性关系用最小二乘法求出参数的估计值并非所有的非线性模型都可以化为线性模型云南财经大学统计信息学院第42页,共51页。统 计 学STATISTICS双曲线基本形式:线性化方法令:y=1/y,x=1/x,则有y=+b xb+xxy云南财经大学统计信息学院第43页,共51页。统 计 学STATISTICS指数曲线基本形式:线性化方法两端取对数得:lny=ln+b x令:y=l

18、ny,则有y=ln+b x云南财经大学统计信息学院第44页,共51页。统 计 学STATISTICSS 型曲线基本形式:线性化方法 令:y=1/y,x=e-x,则有y=+b x云南财经大学统计信息学院第45页,共51页。统 计 学STATISTICS7.5 相关分析 相关系数(correlation coefficient)对变量之间关系密切程度的度量对两个变量之间线性相关程度的度量称为简单相关系数若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 若是根据样本数据计算的,则称为样本相关系数,记为 r云南财经大学统计信息学院第46页,共51页。统 计 学STATISTICS相关系数(计

19、算公式)样本相关系数的计算公式云南财经大学统计信息学院第47页,共51页。统 计 学STATISTICS相关系数(取值及其意义)r 的取值范围是-1,1|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关 r=0,不存在线性线性相关关系-1r0,为负相关 0r1,为正相关1.|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切云南财经大学统计信息学院第48页,共51页。统 计 学STATISTICS相关系数的显著性检验(r 的抽样分布)1.r 的抽样分布随总体相关系数和样本容量的大小而变化当样本数据来自正态总体时,随着n的增大,r 的抽样分布趋于正态分布,尤其是在总体相关

20、系数很小或接近0时,趋于正态分布的趋势非常明显。而当远离0时,除非n非常大,否则r的抽样分布呈现一定的偏态。2.当为较大的正值时,r 呈现左偏分布;当为较小的负值时,r 呈现右偏分布。只有当接近于0,而样本容量n很大时,才能认为r是接近于正态分布的随机变量云南财经大学统计信息学院第49页,共51页。统 计 学STATISTICS相关系数的显著性检验(检验的步骤)1.检验两个变量之间是否存在线性相关关系等价于对回归系数 b1的检验采用R.A.Fisher提出的 t 检验检验的步骤为2.提出假设:H0:0;H1:0云南财经大学统计信息学院第50页,共51页。统 计 学STATISTICSEnd of Chapter 7云南财经大学统计信息学院第51页,共51页。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(真实图形课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|