第11讲散点图、相关系数2021优秀课件.ppt

上传人(卖家):晟晟文业 文档编号:3860614 上传时间:2022-10-19 格式:PPT 页数:45 大小:1.03MB
下载 相关 举报
第11讲散点图、相关系数2021优秀课件.ppt_第1页
第1页 / 共45页
第11讲散点图、相关系数2021优秀课件.ppt_第2页
第2页 / 共45页
第11讲散点图、相关系数2021优秀课件.ppt_第3页
第3页 / 共45页
第11讲散点图、相关系数2021优秀课件.ppt_第4页
第4页 / 共45页
第11讲散点图、相关系数2021优秀课件.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

1、方差分析方差分析控制变量数量控制变量数量(类别变量)(类别变量)协变量数量协变量数量(定距变量)(定距变量)因变量数量因变量数量(定距变量)(定距变量)相同点相同点不同点不同点单因素方差分析111.正态分布检验 2.方差齐性检验3.F统计量4.假设检验的四个过程多因素方差分析=11存在变量之间的交互作用协方差分析=111排除协变量的影响之后进行方差分析第第11讲讲散点图、相关系数散点图、相关系数相关概念相关概念一、相关的概念一、相关的概念1.1.变量之间关系的概念变量之间关系的概念 客观世界中,事物之间存在相互依存、相互制约、相互影响的关系。用于描述事物数量特征的变量之间也存在一定的关系。这些

2、关系分为两种:(1)函数关系:函数关系:变量之间的一一对应的关系,当自变量x取一定值时,因变量y依据函数关系取唯一的值。如:在单价确定时,销售量与销售额之间的关系:y=f(x)销售额价格*销售量 圆的面积与圆的半径之间的关系:圆面积3.14*半径2一、相关的概念一、相关的概念1.1.关系的概念关系的概念 (2)相关关系:相关关系:如果变量之间存在密切的关系,但又不能由一个或几个变量的值确定另一个变量的值,当自变量x取一定值时,因变量y的值可能有多个,这种变量之间的非一一对应的、不确定的关系,称之为相关关系。如:子女身高与父母身高之间的关系 证券指数与利率之间的关系一、相关的概念一、相关的概念2

3、.2.相关关系的分类相关关系的分类 (1)按相关的程度分为:完全相关:一个变量的取值完全取决于另一个变量,数据点落在一条直线(或曲线)上相关:一个变量的取值部分取决于另一个变量,数据点围绕分布在一条直线(或曲线)上不相关:两个变量的数据点分布很分散,无任何规律 就是函数关系一、相关的概念一、相关的概念2.2.相关关系的分类相关关系的分类 (2)按相关的表现形式分为:线性相关:两个变量之间的关系近似地表现为一条直线非线性相关:两个变量之间的关系近似地表现为一条曲线一、相关的概念一、相关的概念2.2.相关关系的分类相关关系的分类 (3)按相关的方向分为:正相关:一个变量增加(减少),导致另一个变量

4、增加(减少)负相关:一个变量增加(减少),导致另一个变量减少(增加)一、相关的概念一、相关的概念3.3.线性相关的四种相关关系线性相关的四种相关关系 强正线性相关:一个变量x增加,导致另一个变量y明显增加,说明x是影响变量y的主要因素弱正线性相关:一个变量x增加,导致另一个变量y增加,但不明显,说明x是影响变量y的因素,但不是唯一(主要)的影响因素强负线性相关:一个变量x增加,导致另一个变量y明显减少,说明x是影响变量y的主要因素弱负线性相关:一个变量x增加,导致另一个变量y减少,但不明显,说明x是影响变量y的因素,但不是唯一(主要)的影响因素一、相关的概念一、相关的概念4.4.相关分析的概念

5、相关分析的概念 相关分析是描述两个或两个以上变量间关系密切程度的统计方法,可有效地揭示事物之间相关关系的强弱程度。5.5.相关分析的方法相关分析的方法 图形(散点图):常用的一种直观的分析方法,将样本数据点绘制在二维平面或三维空间上,根据这些数据点的分布特征,能够直观地研究变量间的统计关系以及它们的强弱程度和数据对的可能走向。数值(相关系数):变量间关系的密切程度常以一个数量性指标描述,这个指标称相关系数r=0.8一、相关的概念一、相关的概念SPSSSPSS提供了三种相关分析的方法提供了三种相关分析的方法二元变量分析(Bivariate):偏相关分析(Partial):距离相关分析(Dista

6、nces):相关分析的方法相关分析的方法二、相关分析的方法二、相关分析的方法1.1.散点图散点图散点图是相关分析过程中常用的一种直观的分析方法;将样本数据点绘制在二维平面或三维空间上,根据数据点的分布特征,直观的研究变量之间的统计关系以及强弱程度。就两个变量而言,如果变量之间的关系近似地表现为一条直线,则称为线性相关,如图(a)和(b);如果变量之间的关系近似地表现为一条曲线,则称为非线性相关或曲线相关,如图(c);如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系,如图(d)。(a)(b)(c)(d)二、相关分析的方法二、相关分析的方法2.2.相关系数相关系数 散点图能够直观

7、地反映变量之间的关系,但不精确。相关系数以数值的方式精确地反映了变量之间线性关系的强弱程度。相关系数通过正、负表示相关的方向,相关系数r的取值在-1+1之间:下表中是通过相关系数来描述相关程度 不同类型的变量采用不同的相关系数指标,但取值范围和含义都是相同的相关系数取值范围r=0|r|0.8|r|=1相关程度无相关微弱相关低度相关显著相关高度相关完全相关 二、相关分析的方法二、相关分析的方法3.3.相关系数的分类相关系数的分类PearsonPearson简单相关系数简单相关系数(皮尔逊皮尔逊)用来度量正态分布的正态分布的定距变量间的线性相关关系 Pearson简单相关系数要求变量来自的总体 分

8、布正态SpearmanSpearman秩相关系数秩相关系数(斯皮尔曼斯皮尔曼)采用非参数检验方法来度量定序变量间的线性相关关系 不要求总体正态分布 由于数据为非定距变量,因此不能直接采用原始数据,而是利用数据的秩KendallKendall秩相关系数秩相关系数(肯德肯德和谐系数和谐系数、一致性系数一致性系数)采用非参数检验方法来度量定序变量间的线性相关关系 多用于计算评价者的评定一致性看备注页二、相关分析的方法二、相关分析的方法4.4.利用利用相关系数相关系数进行变量之间进行变量之间线性线性关系的分析关系的分析利用相关系数进行变量之间线性关系的分析分两步:(1)利用样本数据计算样本相关系数r;

9、(2)利用样本推测总体是否存在显著的线性线性关系。由于存在抽样的随机性以及样本数量较少等原因,通常样本相关系数不能直接反映样本是否存在显著的线性相关关系,需要通过假设检验的方式对样本的总体进行统计推测。推测步骤:(1)提出零假设H0:两总体线性不相关(或相关系数与0无显著性差异)(2)选择检验统计量:对不同变量采用不同的相关系数,同时也采用不同的检验统计量(3)计算统计量的观测值和对应的概率p值;(4)对总体的相关性进行推断 注:显著的相关性并不能导出任何因果结论。二、相关分析的方法二、相关分析的方法5.5.根据概率根据概率P P进行进行解释解释 检验统计量的概率p值小于给定的显著性水平值(0

10、.05),拒绝零假设,认为总体相关。若检验统计量的概率p值大于给定的显著性水平值(0.05),接受零假设,认为总体不相关。通常认为通常认为0.050.05,认为总体相关,认为总体相关;0.010.01,认为总体,认为总体显著显著(较强较强)相关相关。注:在实际应用中,变量间相关性的研究应注意将绘制散点图与计算相关系数的方注:在实际应用中,变量间相关性的研究应注意将绘制散点图与计算相关系数的方法相结合。仅根据散点图或相关系数都无法准确反映变量间的相关性,两者的结合法相结合。仅根据散点图或相关系数都无法准确反映变量间的相关性,两者的结合运用是必要的。运用是必要的。二元变量分析二元变量分析三、二元变

11、量分析三、二元变量分析1.1.概念概念 二元变量分析(Bivariate)是研究和分析两个变量之间相关程度的统计方法。2.2.应用应用 很多时候都是通过两个变量进行相关分析,所以二元变量分析应用十分广泛。如:家庭收入与家庭消费支出之间是否相关 商品销售价格与商品销售额之间是否相关 客户满意度与商业企业综合竞争力之间是否相关 广告投入和销售额之间是否相关可以结合单变量方差分析理解可以结合单变量方差分析理解三、二元变量分析三、二元变量分析3.3.SPSSSPSS操作及案例分析操作及案例分析 例一:例一:为了研究某项职业技能和员工年龄之间的关系,对员工进行职业技能测试,得到有关上述两变量的数据表。(

12、8-Bivariate_age.sav)现以年龄作为自变量x,职业技能测试得分为因变量y,以两变量数据为依据,绘制散点图分析两变量之间的相关关系。注意:通过散点图只是初步分析两变量之间的相关关系 通常用散点图描述相关关系的表达方式:完全相关 较强(正/负)相关 较弱(正/负)相关 不相关三、二元变量分析三、二元变量分析3.3.SPSSSPSS操作及案例分析操作及案例分析结果分析:结果分析:从散点图中可以看出,点的分布比较分散,在拟合线上或周围的点分布较少,说明两变量之间相关程度较弱。从拟合线的趋势来看,职业技能和员工年龄之间之间有一定的相关关系,而且是随着年龄的增加,职业技能测试得分会随之上升

13、,但上升幅度较小。所以上述两变量之间具有较弱正相关的关系。通过对散点图的编辑,可以添加拟合线三、二元变量分析三、二元变量分析3.3.SPSSSPSS操作及案例分析操作及案例分析操作步骤操作步骤 Graphs Legacy Dialogs Scatter/Dot数据文件:8-Bivariate_age.sav常用的散点图类型简单散点图重叠散点图矩阵散点图三维散点图单点散点图三、二元变量分析三、二元变量分析3.3.SPSSSPSS操作及案例分析操作及案例分析散点图的其他应用散点图的其他应用(1)在散点图中设置散点标记。三、二元变量分析三、二元变量分析3.3.SPSSSPSS操作及案例分析操作及案例

14、分析散点图的其他应用散点图的其他应用(2)在散点图中设置散点标签。3.3.SPSSSPSS操作及案例分析操作及案例分析散点图的其他应用散点图的其他应用(3)在散点图中添加拟合线。三、二元变量分析三、二元变量分析1.双击该图区3.3.SPSSSPSS操作及案例分析操作及案例分析散点图的其他应用散点图的其他应用(4)计算相关系数。AnalyzeCorrelateBivariate.三、二元变量分析三、二元变量分析解释:1.Sig.=0.0410.05,拒绝H0假设,表明两变量之间是相关的。2.由于r=0.2290.3,为微弱正相关。三、二元变量分析三、二元变量分析3.3.SPSSSPSS操作及案例

15、分析操作及案例分析 例二:例二:在有氧训练中,人的耗氧量y(毫升/分*千克体重)是衡量人的身体状况的重要指标,它与多项指标有关。为了研究人的耗氧量与多项指标之间的关系,对31名测试者进行测试。8-Bivariate.sav 现以人的耗氧量y为因变量,多项指标中之一1.5英里跑所用时间x3为自变量,通过散点图和相关系数,分析研究耗氧量y与1.5英里跑所用时间x3之间的相关关系。三、二元变量分析三、二元变量分析3.3.SPSSSPSS操作及案例分析操作及案例分析结果分析:结果分析:从散点图中可以看出,耗氧量y与1.5英里跑所用时间x3之间存在较强负相关的关系,即1.5英里跑所用时间增加,耗氧量会随

16、之降低。伴随概率P=0.0000.01,说明两变量之间是明显相关关系;在相关系数表中,r=-0.832,说明两变量之间高度负相关。CorrelationsCorrelations1-.832*.0003131-.832*1.0003131Pearson CorrelationSig.(2-tailed)NPearson CorrelationSig.(2-tailed)N1.5英里跑所用时间耗氧量1.5英里跑所用时间耗氧量Correlation is significant at the 0.01 level(2-tailed).*.三、二元变量分析三、二元变量分析3.3.SPSSSPSS操作

17、及案例分析操作及案例分析结果分析:结果分析:拟合线。三、二元变量分析三、二元变量分析3.3.SPSSSPSS操作及案例分析操作及案例分析例三:例三:利用例二的数据,分析因变量y(人的耗氧量),与自变量x1、x2、x3、x4、x5、x6之间的关系。8-Bivariate.sav与耗氧量有关的因素年龄x1(岁)体重x2(次/分)1.5英里跑所用时间x3(分)静止时心跳速率x4(次/分)跑步时心跳速率x5(次/分)跑步时最大心跳速率x6(次/分)三、二元变量分析三、二元变量分析3.3.SPSSSPSS操作及案例分析操作及案例分析结果图:结果图:三、二元变量分析三、二元变量分析3.3.SPSSSPSS

18、操作及案例分析操作及案例分析结果分析:结果分析:从相关系数计算结果来看:(1)耗氧量y与1.5英里跑所用时间x3、静止时心跳速率x4、跑步时心跳速率x5相关程度较高,其中耗氧量与1.5英里跑所用时间的r=-0.832,伴随概率P=0.0000.01,属于明显相关;其他两项r=-0.436,r=-0.420,伴随概率P分别等于0.014和0.019大于0.01,但小于0.05属于低度相关;(2)上述三个变量与耗氧量之间的关系都属于负相关。结论:结论:跑步速度快、静止时心跳速率慢、跑步时心跳速率慢的人,耗氧量大;反之,耗氧量小。三、二元变量分析三、二元变量分析3.3.SPSSSPSS操作及案例分析

19、操作及案例分析操作步骤:操作步骤:操作步骤:Analyze Correlate Bivariate 数据文件:8-Bivariate.sav偏相关分析偏相关分析四、偏相关分析四、偏相关分析1.1.概念概念在多元相关分析中,由于受到其他变量的影响,在计算某两个变量之间的相关系数时,得到的结果往往不能真实反映变量之间的相关关系所以在多元相关分析中,通常将其他变量固定(控制),而计算某两个变量之间的相关系数,称为偏相关系数。偏相关分析用于计算变量之间的偏相关系数,可以判断自变量对因变量的影响程度,舍弃影响较小的自变量,保留影响较大的自变量,从而更准确地判断变量之间的相关关系和相关程度。可以结合可以结

20、合协方差分析协方差分析理解理解四、偏相关分析四、偏相关分析2.2.SPSSSPSS操作及案例分析操作及案例分析 例四:以数据文件“8-Cars.sav”为例,分析在油耗不变的情况下、汽车马力(horse)和加速度(accel)的偏相关系数。四、偏相关分析四、偏相关分析2.2.SPSSSPSS操作及案例分析操作及案例分析结果分析结果分析 汽车马力和加速度的偏相关系数为-0.622,有效样本数为389,显著性水平为0.000,这两个变量的偏相关系数小于0.01,属于显著负相关关系。结论:结论:在油耗量不变的情况下,汽车发动机功率越大,汽车加速到某个速度的时间越短。C Co or rr re el

21、la at ti io on ns s1.000-.622.0000389-.6221.000.000.3890CorrelationSignificance(2-tailed)dfCorrelationSignificance(2-tailed)dfHorsepowerTime to Acceleratefrom 0 to 60 mph(sec)Control VariablesMiles per GallonHorsepowerTime toAcceleratefrom 0 to 60mph(sec)四、偏相关分析四、偏相关分析2.2.SPSSSPSS操作及案例分析操作及案例分析 同样是上

22、述例子同样是上述例子(1)不排除不排除油耗量的影响 汽车马力和加速度的相关系数为-0.701,显著性水平为0.000(即:Analyze Correlate Bivariate)(2)排除排除油耗量的影响 汽车马力和加速度的偏相关系数为-0.622,显著性水平为0.000(即:AnalyzCorrelate Partial)C Co or rr re el la at ti io on ns s1.000-.622.0000389-.6221.000.000.3890CorrelationSignificance(2-tailed)dfCorrelationSignificance(2-tai

23、led)dfHorsepowerTime to Acceleratefrom 0 to 60 mph(sec)Control VariablesMiles per GallonHorsepowerTime toAcceleratefrom 0 to 60mph(sec)CorrelationsCorrelations1-.701*.000400400-.701*1.000400406Pearson CorrelationSig.(2-tailed)NPearson CorrelationSig.(2-tailed)NHorsepowerTime to Acceleratefrom 0 to 6

24、0 mph(sec)HorsepowerTime toAcceleratefrom 0 to 60mph(sec)*.四、偏相关分析四、偏相关分析2.2.SPSSSPSS操作及案例分析操作及案例分析操作步骤:操作步骤:不排除油耗影响不排除油耗影响 AnalyzCorrelate Bivariate 数据文件:8-Cars.sav四、偏相关分析四、偏相关分析2.2.SPSSSPSS操作及案例分析操作及案例分析操作步骤:操作步骤:排除油耗影响排除油耗影响 AnalyzCorrelate Partial 数据文件:8-Cars.sav零阶相关系数输出包括控制变量的所有相关矩阵思考题思考题 已知有某河

25、流的一年月平均流量观测数据和该河流所在地区当年的月平均雨量和月平均温度观测数据,试分析温度与河水流量之间的相关关系。分别用相关分析和偏相关分析方法分别计算相关系数和偏相关系数,并对计算结果进行对比分析。(提示:河水流量除了和温度有关外,降雨量也是影响流量的一(提示:河水流量除了和温度有关外,降雨量也是影响流量的一个因素,在进行偏相关分析时,可以将雨量作为控制变量,进行分析。)个因素,在进行偏相关分析时,可以将雨量作为控制变量,进行分析。)数据文件:8-flow.sav课外作业课外作业 完成实验报告三回归概念、回归系数回归概念、回归系数 研究一个或者多个变量的变动对另一个变量的变动的影响程度的方

26、法线性回归分析曲线估计非线性回归分析下节展望下节展望谢结束结束谢6.将来的你,一定会感谢现在拼命的自己!72.随随便便浪费的时间,再也不能赢回来。63.每一个繁花似锦,都是经历了暗涛汹涌;每一个鲜艳夺目,都是经历了风雨无阻;每一个风光无限,都是经历了黯然伤神。所有的一切,只有经历过的人,才更懂得背后的力量。33.千万人的失败,都有是失败在做事不彻底,往往做到离成功只差一步就终止不做了。93.所有的不甘,都是因为还心存梦想,在你放弃之前,好好拼一把,只怕心老,不怕路长。32.生活从未变得轻松,是你在一点一点变强大。30.大海若没有千尺深度,哪有如山浪头。35.为了不让生活留下遗憾和后悔,我们应该尽可能抓住一切改变生活的机会。59.积极的人在每一次忧患中都看到一个机会,而消极的人则在每个机会都看到某种忧患。40.梦想不抛弃苦心追求的人,只要不停止追求,你们会沐浴在梦想的光辉之中。27.不要因为小小的争执,远离了你至亲的好友,也不要因为小小的怨恨,忘记了别人的大恩。16.目标不是都能达到的,但它可以作为瞄准点。92.过去不等于未来。85.生活平平淡淡,早起与家人互道早安;父母健康长寿,尽量天天见面;孩子聪明可爱,每天亲亲小脸;夫妻恩爱有加,一生把手相牵;生活无需复杂,幸福就是如此简单。92.每件事情都必须有一个期限,否则,大多数人都会有多少时间就花掉多少时间。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第11讲散点图、相关系数2021优秀课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|