第8章真实图形课件.ppt

上传人(卖家):晟晟文业 文档编号:5167413 上传时间:2023-02-15 格式:PPT 页数:51 大小:492KB
下载 相关 举报
第8章真实图形课件.ppt_第1页
第1页 / 共51页
第8章真实图形课件.ppt_第2页
第2页 / 共51页
第8章真实图形课件.ppt_第3页
第3页 / 共51页
第8章真实图形课件.ppt_第4页
第4页 / 共51页
第8章真实图形课件.ppt_第5页
第5页 / 共51页
点击查看更多>>
资源描述

1、 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院第8章 相关和回归分析学习目标 7.1 相关与回归分析的基本概念 7.2 一元线性回归分析 7.3多元线性回归分析 7.4 非线性回归 7.5 相关分析 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院学习重点1.相关系数的分析方法相关系数的分析方法2.一元线性回归的基本原理和参数的最小一元线性回归的基本原理和参数的最小二乘估计二乘估计

2、3.回归直线的拟合优度回归直线的拟合优度4.回归方程的显著性检验回归方程的显著性检验5.利用回归方程进行估计和预测利用回归方程进行估计和预测 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院 7.1 相关与回归分析的基本概念 函数关系1.是一一对应的确定关系2.设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量3.各观测点落在一条

3、线上 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院函数关系(几个例子)统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院相关关系(correlation)1.变量间关系不能用函数关系精确表达2.一个变量的取值不能由另一个变量唯一确定3.当变量 x 取某个值时,变量 y 的取值可能有几个4.各观测点分布在直线周围 统统统 计计计 学学学STATISTICSSTATISTICSSTATI

4、STICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院相关关系(几个例子)统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院相关关系(类型)按相关程度划分:完全相关、不完全相关和不相关 按相关方向划分:正相关和负相关 按相关形式划分:线性相关和非线性相关 按变量多少划分 单相关、复相关和偏相关 按相关性质划分 真实相关和虚假相关 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财

5、经大学统计信息学院7.2 一元线性回归 7.2.1 标准的一元线性回归模型标准的一元线性回归模型 7.2.2一元线性回归模型的估计一元线性回归模型的估计 7.2.3一元线性回归模型的检验一元线性回归模型的检验 7.2.4一元线性回归模型的预测一元线性回归模型的预测 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院一元线性回归模型1.描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型回归模型2.一元线性回归模型可表示为 y=b b0 0+b b1 1 x+y 是 x 的线性函

6、数(部分)加上误差项线性部分反映了由于 x 的变化而引起的 y 的变化误差项 是随机变量反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响是不能由 x 和 y 之间的线性关系所解释的变异性b0 和 b1 称为模型的参数 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院一元线性回归模型(基本假定)1.误差项的期望值为0,即E()=0。对于一个给定的 x 值,y 的期望值为E(y)=b b 0+b b 1 x2.对于所有的 x 值,3.误差项之间不存在序列相关关系,即 4.自变量

7、是给定的变量,与随机误差项线性无关5.随机误差项服从正态分布,即 N(0,2)2)(Var0)(stCov 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院总体回归函数1.描述 y 的平均值或期望值如何依赖于 x 的方程称为总体回归函数2.总体回归函数的数学形式如下3.E(y)=b b0+b b1 x 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院样本回归函数(估计方程)统统统 计计

8、计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院7.2.2一元线性回归模型的估计一元线性回归模型的估计0b1b 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院最小二乘法(和 的计算公式)统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院估计方程的求法(例题分析)【例【例7-1】估计食品支出的恩

9、格尔函数1b 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院估计标准误差(standard error of estimate)1.实际观察值与回归估计值离差平方和的均方根2.反映实际观察值在回归直线周围的分散状况3.对误差项的标准差的估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量4.反映用估计的回归方程预测y时预测误差的大小 5.计算公式为 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院

10、云南财经大学统计信息学院7.2.3一元线性回归模型的检验一元线性回归模型的检验离差1.因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面由于自变量 x 的取值不同造成的除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响2.对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院离差的分解(图示)y 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财

11、经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院离差平方和的分解(三个平方和的关系)统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院离差平方和的分解(三个平方和的意义)1.总平方和总平方和(SST)反映因变量的 n 个观察值与其均值的总离差2.回归平方和回归平方和(SSR)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和3.残差平方和残差平方和(SSE)反映除 x 以外的其他因素对

12、y 取值的影响,也称为不可解释的平方和或剩余平方和 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院可决系数r21.回归平方和占总离差平方和的比例 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院可决系数r2(例题分析)【例【例7-2】计算估计食品支出的恩格尔函数回归的可决系数,并解释其意义 可决系数的实际意义是:可决系数的实际意义是:在食品支出取值的变差中,有88.63%可以由食品支

13、出与家庭收入之间的线性关系来解释,或者说,在食品支出取值的变动中,有88.63%是家庭收入所决定的。可见食品支出与家庭收入之间有较强的线性关系 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院 7.2.3一元线性回归模型的检验一元线性回归模型的检验 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院回归系数的检验(样本统计量 的分布)统统统 计计计 学学学STATISTICSSTATIS

14、TICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院回归系数的检验(检验步骤)1.提出假设H0:b1=0(没有线性关系)H1:b1 0(有线性关系)2.计算检验的统计量 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院回归系数的检验(例题分析)对例题的回归系数进行显著性检验(0.05)1.提出假设H0:b1=0 H1:b1 0 2.计算检验的统计量 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学

15、统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院 7.2.4一元线性回归模型的预测一元线性回归模型的预测1.根据自变量 x 的取值估计或预测因变量 y的取值2.估计或预测的类型点估计y 的个别值的点估计(或预测)区间估计y 的个别值的预测区间预测区间估计 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院y 的个别值的点预测 利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计值 ,就是个别值的点估计 例如,如果我们只是想知道家庭收入为200

16、元的那些家庭的食品支出是多少,则属于个别值的点估计。根据估计的回归方程得fy 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院区间预测 1.点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计2.对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间3.本课程讨论的区间估计类型预测区间估计(prediction interval estimate)统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学

17、统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院预测区间估计1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计区间,这一区间称为预测区间预测区间(prediction interval)2.y0在1-置信水平下的预测区间为 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院影响区间宽度的因素1.置信水平(1-)区间宽度随置信水平的增大而增大2.数据的离散程度s区间宽度随离散程度的增大而增大3.样本容量区间宽度随样本容量的增大而减小4.用

18、于预测的 xp与x的差异程度区间宽度随 xp与x 的差异程度的增大而增大 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院置信区间、预测区间、回归方程 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院7.3多元线性回归分析7.3.1 多元线性回归模型多元线性回归模型 7.3.2 多元线性回归模型多元线性回归模型 的估计的估计7.3.3 多元线性回归模型多元线性回归模型 的检验和预测的检

19、验和预测 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院7.3.1多元回归模型 1.一个因变量与两个及两个以上自变量的回归2.描述因变量 y 如何依赖于自变量 x1,x2,xk 和误差项 的方程,称为多元回归模型3.涉及 p 个自变量的多元回归模型可表示为 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院多元回归模型(基本假定)1.误差项是一个期望值为0的随机变量,即E()=02.对

20、于自变量x1,x2,xp的所有值,的方差 2都相同3.误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院多元样本回归函数(方程)1.用样本统计量 估计回归方程中的 参数 时得到的方程2.由最小二乘法求得3.一般形式为 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院7.3.2 多元线性回归模型多元线性回归模型 的估计的估计

21、统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院7.3.3 多元线性回归模型多元线性回归模型 的检的检验和预测验和预测回归方程的拟合优度1.回归平方和占总平方和的比例2.计算公式为3.因变量取值的变差中,能被估计的多元回归方程所解释的比例 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院修正多重可决系数1.用样本容量n和自变量的个数p去修正R2得到 2.计算公式为3.避免增加自变量而高

22、估 R24.意义与 R2类似5.数值小于R2 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院 显著性检验(回归系数的检验)1.提出假设H0:bi=0 (自变量 xi 与 因变量 y 没有线性关系)H1:bi 0 (自变量 xi 与 因变量 y有线性关系)2.计算检验的统计量 t 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院 显著性检验(回归方程的显著性检验)1.提出假设H0:b1

23、b2bp=0 线性关系不显著H1:b1,b2,bp至少有一个不等于0 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院7.4 非线性回归1.因变量 y 与 x 之间不是线性关系2.可通过变量代换转换成线性关系用最小二乘法求出参数的估计值并非所有的非线性模型都可以化为线性模型 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院双曲线1.基本形式:2.线性化方法令:y=1/y,x=1/x,则

24、有y=+b xb+xxy 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院指数曲线1.基本形式:2.线性化方法两端取对数得:lny=ln+b x令:y=lny,则有y=ln+b x 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院S 型曲线1.基本形式:2.线性化方法 令:y=1/y,x=e-x,则有y=+b x 统统统 计计计 学学学STATISTICSSTATISTICSSTATI

25、STICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院7.5 相关分析 相关系数(correlation coefficient)1.对变量之间关系密切程度的度量2.对两个变量之间线性相关程度的度量称为简单相关系数3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 4.若是根据样本数据计算的,则称为样本相关系数,记为 r 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院相关系数(计算公式)样本相关系数的计算公式 统统统 计计计 学学学STATISTI

26、CSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院相关系数(取值及其意义)1.r 的取值范围是-1,12.|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关3.r=0,不存在线性线性相关关系4.-1r0,为负相关5.0r1,为正相关6.|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院相关系数的显著性检验(r 的抽样分布)1.r 的抽样分布随总体相关

27、系数和样本容量的大小而变化当样本数据来自正态总体时,随着n的增大,r 的抽样分布趋于正态分布,尤其是在总体相关系数很小或接近0时,趋于正态分布的趋势非常明显。而当远离0时,除非n非常大,否则r的抽样分布呈现一定的偏态。2.当为较大的正值时,r 呈现左偏分布;当为较小的负值时,r 呈现右偏分布。只有当接近于0,而样本容量n很大时,才能认为r是接近于正态分布的随机变量 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院相关系数的显著性检验(检验的步骤)1.检验两个变量之间是否存在线性相关关系2.等价于对回归系数 b1的检验3.采用R.A.Fisher提出的 t 检验4.检验的步骤为提出假设:H0:0;H1:0 统统统 计计计 学学学STATISTICSSTATISTICSSTATISTICS云南财经大学统计信息学院云南财经大学统计信息学院云南财经大学统计信息学院End of Chapter 7

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第8章真实图形课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|