《统计基础》课件项目六.ppt

上传人(卖家):momomo 文档编号:4383818 上传时间:2022-12-04 格式:PPT 页数:18 大小:813.50KB
下载 相关 举报
《统计基础》课件项目六.ppt_第1页
第1页 / 共18页
《统计基础》课件项目六.ppt_第2页
第2页 / 共18页
《统计基础》课件项目六.ppt_第3页
第3页 / 共18页
《统计基础》课件项目六.ppt_第4页
第4页 / 共18页
《统计基础》课件项目六.ppt_第5页
第5页 / 共18页
点击查看更多>>
资源描述

1、项目六项目六 相关与回归分析相关与回归分析学习目标目录 1任务一 相关分析2任务二 回归分析相关分析任务一一、一、变量之间的关系变量之间的关系(一)(一)函数关系:函数关系:函数关系是指变量之间存在严格确定的依存关系,在这种关系中,当一个或几个变量取一定量的值时,另一个变量有确定值与之相对应,并且这种关系可以用一个数学表达式反映出来。(二二)相关关系:相关关系:相关关系是指变量之间存在一定的相依关系,但这种关系又不是确定的和严格依存的。这类关系中,当一个或几个相互联系的变量取一定数值时,与之相对应的变量就会有若干个数值,从而表现出一定的波动性。函数关系和相关关系之间并不存在严格的界限。由于有测

2、量误差等原因,函数关系在实际中往往通过相关关系表现出来;反之,当对现象之间的内在联系和规律性更清楚、更深刻的时候,相关关系也可能转化为函数关系。因此,相关关系通常可以用一定的函数关系表达式去近似地描述。相关分析任务一二二、相关关系的种类相关关系的种类(一)(一)变量的个数:变量的个数:(1)单相关单相关:两个变量之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量。(2)复相关复相关:三个或三个以上变量之间的相关关系叫复相关,即研究时涉及三个或三个以上的自变量和因变量。(二二)相关关系的方向:相关关系的方向:相关关系是指变量之间存在一定的相依关系,但这种关系又不是确定的和严格依存的。这

3、类关系中,当一个或几个相互联系的变量取一定数值时,与之相对应的变量就会有若干个数值,从而表现出一定的波动性。函数关系和相关关系之间并不存在严格的界限。由于有测量误差等原因,函数关系在实际中往往通过相关关系表现出来;反之,当对现象之间的内在联系和规律性更清楚、更深刻的时候,相关关系也可能转化为函数关系。因此,相关关系通常可以用一定的函数关系表达式去近似地描述。相关分析任务一二二、相关关系的种类相关关系的种类(三三)相关关系的表现形式:相关关系的表现形式:(1)线性相关)线性相关:当相关关系的自变量x发生变动,因变量y值随之发生大致均等的变动,从图像上近似地表现为直线形式,这种相关关系通常称为线性

4、相关。(2)非线性相关)非线性相关:在两个相关现象中,自变量x发生变动,因变量y也随之发生变动,这种变动不是均等的,在图像上的分布是各种不同的曲线形式,这种相关关系称为非线性相关。(四四)相关关系的程度:相关关系的程度:(1)不相关)不相关:如果变量间彼此的数量变化互相独立,则其关系为不相关。即自变量x变动时,因变量y的数值不随之相应变动。(2)完全相关)完全相关:如果一个变量的变化是由其他变量的数量变化所唯一确定的,此时变量间的关系称为完全相关。(3)不完全相关:)不完全相关:如果变量间的关系介于不相关和完全相关之间,则称为不完全相关,大多数相关关系属于不完全相关,是统计研究的主要对象。相关

5、分析任务一三三、相关分析的目的和方法相关分析的目的和方法相关分析就是分析两个变量之间的线性关系,其实主要是解决如下几个问相关分析就是分析两个变量之间的线性关系,其实主要是解决如下几个问题:题:变量间是否存在关系?若存在关系,是何种关系?变量间的关系强度如何?样本所反映的变量间的关系能否代表总体变量之间的关系?为了更好地解决上述的几个问题,在进行相关分析之前需要对总体做出以为了更好地解决上述的几个问题,在进行相关分析之前需要对总体做出以下两点假设下两点假设:两个变量之间是线性关系。两个变量是随机变量。在分析这类问题时一般首先需要绘制散点图来判断变量之间是否存在线性在分析这类问题时一般首先需要绘制

6、散点图来判断变量之间是否存在线性关系,如果存在则可以通过下列方法加以分析。关系,如果存在则可以通过下列方法加以分析。相关分析任务一三三、相关分析的目的和方法相关分析的目的和方法(一一)定性分析定性分析相关表与相关图相关表与相关图相关表是一种统计表。它是直接使用研究问题的原始数据,将这一变量的若干值按照从小到大的顺序依次排列,并将另一个变量的值与之对应排列所形成的统计表。其好处在于当数据量较小时可以直接看出变量间是否存在相关关系,缺点在于数据量增大时很难看出变量之间的关系。而把相关表上一一对应的具体数值在直角坐标系中用点标出来而形成的散点图则称为相关图。利用相关表和相关图,可以更直观、更形象地表

7、现变量之间的相互关系。(二)二)定量分析定量分析相关系数相关系数1.1.相关系数的含义与计算相关系数的含义与计算相关系数是直线相关条件下,说明两个变量之间相关关系密切程度的统计分析指标。相关系数的理论公式为:相关分析任务一三三、相关分析的目的和方法相关分析的目的和方法(二)二)定量分析定量分析相关系数相关系数理论公式理论公式:(1 1)变量变量x x和和y y的协方差:的协方差:;(2 2)变量变量x x的标准差:的标准差:;(3 3)变量变量y y的标准差:的标准差:;2xyxyr 2xyx2()()xyxxyyn2()xxxny2()yyyn相关分析任务一三三、相关分析的目的和方法相关分析

8、的目的和方法(二)二)定量分析定量分析相关系数相关系数2.2.相关系数的性质相关系数的性质(1)r取值范围:;(2),表明x与y之间存在着确定的函数关系;(3)表明两变量成正相关,成负相关,不相关;(4)表明存在一定的线性相关;绝对值越大,表明相关程度越高;微弱相关;低度相关;显著相关;高度相关。3.3.相关系数运用的几点说明相关系数运用的几点说明(1)计算相关系数时,两个变量哪个作为自变量,哪个作为因变量,对于相关系数的值大小没有影响。(2)相关系数指标只能用于直线相关程度的判断,当其数值很小甚至为0时只能说明变量之间直线相关程度很弱或者不存在直线相关关系,但不能就此判断变量之间不存在相关关

9、系。(3)对于相关系数的绝对值大与0.8时,变量之间存在高度线性相关关系,通常还需要进行相关系数的显著检验。1r 11r 1r 1r 0r 0r 1r r0.3r 0.30.5r0.50.8r0.81r相关分析任务一三三、相关分析的目的和方法相关分析的目的和方法2.2.相关系数的性质相关系数的性质(1)r取值范围:|r|1,即-1r1;(2)|r|=1即r=1,表明x与y之间存在确定的函数关系;(3)r0表明两个变量成正相关,r1表明存在一定的线性相关,且|r|绝对值越大,相关程度越高;|r|0.3为微弱相关;0.3|r|0.5 为低度相关;0.5|r|0.8 为显著相关;0.8|r|1为高度

10、相关。3.3.相关系数运用的几点说明相关系数运用的几点说明(1)计算相关系数时,两个变量哪个作为自变量,哪个作为因变量,对于相关系数的值大小没有影响。(2)相关系数只能用于线性相关程度的判断,当其数值很小甚至为0时只能说明变量之间线性相关程度很弱或者不存在线性相关关系,但不能就此判断变量之间不存在相关关系。(3)当相关系数的绝对值大于0.8时,变量之间存在高度线性相关关系,通常还需要进行相关系数的显著性检验。回归分析任务二一、回归分析简介一、回归分析简介(一)回归分析的含义(一)回归分析的含义 回归分析是指对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行测定,确立一个相应的数学方

11、程式,描述变量变动的相互关系,以便从一个已知量来推测另一个未知量,为估计预测值提供一个重要的方法。根据回归分析建立的数学方程称为回归方程(一元回归方程、多元回归方程)。相关分析是回归分析的基础,而回归分析则是认识变量之间相关程度的具体形式。(二)回归分析的种类(二)回归分析的种类 按照自变量的个数可分为一元回归分析与多元回归分析。按照回归的表现形式可分为线性回归分析与非线性回归分析。研究一个因变量与一个自变量之间的线性关系,称为一元线性回归分析或简单线性回归分析;研究一个因变量与多个自变量之间的线性关系,称为多元线性回归分析。回归分析任务二一、回归分析简介一、回归分析简介(三)回归分析的特点(

12、三)回归分析的特点(1)回归分析是研究两个变量之间的因果关系,所以必须通过定性分析来确定哪个是自变量,哪个是因变量;相关分析则是研究两个变量之间的关系,没有自变量和因变量之分。(2)回归方程在进行预测估计时,只能通过自变量的数值求因变量的可能值。(3)线性回归方程中自变量的系数称为回归系数,回归系数为正,说明变量成正相关,为负则说明成负相关。(4)回归分析对于因果关系不甚明确或可以互为自变量的两个变量,可以求出y依据x的回归方程,还可求出x依据y的回归方程;而相关分析中两个变量的相关程度指标,相关系数是唯一的。回归分析任务二二、一元性回归方程二、一元性回归方程(一)回归方程(一)回归方程一元线

13、性回归方程是用来近似描述两个具有密切相关关系的变量之间变动关系的数学方程式。该方程在平面坐标系中表现为一条直线,回归分析中称为回归直线,即:YcYc=a+bx=a+bxYc表示Y的估计值,借以区别的实际观察值;a表示直线的起点值,即纵轴截距;b表示斜率,即回归系数。对于不完全线性相关的两个变量的所有散点,要拟合一条直线。数学证明,利用最小平方法拟合的直线是最合理的线性回归方程表达式。基本原理:所拟合的直线模型可以使实际值y与理论值(估计值)y.离差的代数和等于0,使离差平方和最小,图形上看就是所有的散点都比较均匀地分布在这条直线周边,各散点到该直线的距离的平方和最小。根据已知的实际观察值z、y

14、,利用最小平方法求参数a、b,具体公式为:具体公式为:=表示当自变量数值为0时,因变量的取值。又称回归系数。表示当x每变动一个单位,因变量平均来说变动多少。表示增加平均数,表示减少平均数。22xxnyxxynb xyxxyxxyxxy222nxbnyxbyaab0b0b回归分析任务二二、一元性回归方程二、一元性回归方程(二)回归系数(二)回归系数b b与相关系数与相关系数r r b =b =运用数学等量关系式,故有 ,。1.因为 均是正值,所以b与r的符号是一致的,所以我们可以通过回归系数b来确定r的符号,从而来判断相关的方向。2.b的r大小成正比例,所以还可以利用b来说明相关程度。xyxxy

15、2yxyxxyryxrbxybryx、回归分析任务二三、估计标准误与区间估计三、估计标准误与区间估计(一)估计标准误(一)估计标准误估计标准误就是实际值与估计值之间的偏差平均程度,是用来说明回归方程代表性或推算结果的准确程度的分析指标。计算公式计算公式:是估计标准误,计算结果若值越小,说明各个散点离回归直线越近,实际值与估计值的偏差越小,回归直线的代表性越高,估计越准确可靠;计算结果若 值越大,说明各个散点离回归直线越远,实际值与估计值的偏差越大,回归直线的代表性越低,估计准确性越差。22)(22nxybyaynyyScyySySyS回归分析任务二三、估计标准误与区间估计三、估计标准误与区间估

16、计(二)区间估计(二)区间估计根据变量之间的线性关系,建立直线回归方程的目的,在于给定自变量的值来估计因变量的可能值,该估计值是理论值,与实际值之间存在差异,差异的一般水平用估计标准误来表示,因此可以对因变量的取值范围作区间估计,而不是只给一个估计值。实际值通常以估计值为中心,上下在一定的区间范围内波动,在平面坐标图上表现为各个散点总是围绕回归趋势直线上下在一定区间分布。如果成正态分布或近似正态分布,可以根据正态分布的性质对实际值的分布范围(区间)进行可靠性估计。实际值分布区间的大小取决于估计标准误 与估计标准误倍数t(概率度)的大小。即实际值y落在回归线 为中心,两条平行于回归线的直线 +t 与 +t 之间(统计上又称这一区间为置信区间),可靠性为t的取值所对应的概率(t=1、2、3)。ySbxaycbxaycySbxaycyS回归分析任务二四、应用回归分析中应注意的问题四、应用回归分析中应注意的问题(1)严格意义上讲,根据已知的资料建立回归方程,应该对回归方程的参数的有效性进行显著性统计检验,以判断回归估计的有效性。(2)利用回归直线进行估计预测时,如果所给定的自变量的值在样本观察值的区间范围内,其估计通常比较准确;如果所给定的自变量的值在样本观察值的区间范围之外,一般要求所给定的自变量值不宜偏离样本观察数据的平均值太远,否则预测就会不准确。THANK YOU

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(《统计基础》课件项目六.ppt)为本站会员(momomo)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|