相关分析课件.ppt

上传人(卖家):晟晟文业 文档编号:4621403 上传时间:2022-12-26 格式:PPT 页数:22 大小:140KB
下载 相关 举报
相关分析课件.ppt_第1页
第1页 / 共22页
相关分析课件.ppt_第2页
第2页 / 共22页
相关分析课件.ppt_第3页
第3页 / 共22页
相关分析课件.ppt_第4页
第4页 / 共22页
相关分析课件.ppt_第5页
第5页 / 共22页
点击查看更多>>
资源描述

1、第14章 相关分析相关分析本章主要内容:本章主要内容:1、相关分析简介;2、简单相关分析;3、偏相关分析;4、Distance过程14.1 相关分析简介 一、相关分析的指标体系一、相关分析的指标体系1、连续变量的相关指标2、有序变量的相关指标3、名义变量的相关指标4、其他特殊指标1、连续变量的相关指标(积差)相关系数(或Pearson相关系数)Spearman相关系数2、有序变量的相关指标有序变量的相关性称为一致性一致性。(1)Gamma统计量(2)Kendalls Tau-b(3)Kendalls Tau-c(4)Somers d四个系数都在-1到+1之间取值、其解释与Pearson相关系数

2、相同。值得注意的是对各自对tie(并列值)的不同处理。Gamma不考虑并列值,即在计算时,并列值出现的次数不被计入分母之中。Somers d将自变量的并列值考虑了进去、但没有考虑因变量的并列值。Kendalls tau-b则将自变量和因变量的并列值同时考虑了进去;而Kendalls tau-c 则如同Gamma一样,忽略任何并列值。3、名义变量的相关指标(1)列联系数(2)Phi和Crammers V(3)系数(4)Uncertainly Coefficient4、其他特殊指标Eta指标:名义变量和连续变量的相关程度。KappaORRR二、SPSS的相关分析功能(1)Crosstabs中Sta

3、tistics子对话框(2)Correlate子菜单BivariatePartialDistances14.2 简单相关分析一、方法原理1、基本概念直线相关曲线相关正相关与负相关完全相关2、系数计算3、积差相关系数的适用条件(1)积差相关系数适用于线性相关的情形。(2)样本中存在的极端值对积差相关系数的计算影响极大,要慎重考虑和处理,必要时可以对其进行剔除,或进行变量变换。(3)积差相关系数要求相应的变量呈双变量正态分布。4、散点图的作用(1)变量间是否存在相关趋势;(2)相关趋势呈现为线性趋势还是曲线趋势;(3)发现明显的异常点,或者强影响点。二 案例:考察总信心指数值和年龄的相关性操作步骤

4、:1、打开数据库后,绘制总信心指数和年龄的散点图;2、单击Analyze Correlate Bivariate 打开Bivariate对话框。2、从左边的变量框中选择需要考察的两个变量进入 Variables 框内,从Correlation Coefficients 栏内选择相关系数的种类,有Pearson相关系数,Kendalls一致性系数和Spearman等级相关系数。从检验栏内选择检验方式,有双尾检验和单尾检验两种。3、单击Options按纽,选择输出项和缺失值的处理方式。本例中选择输出基本统计描述。4、单击OK,可以得到相关分析的结果。三 秩相关系数秩相关系数又称Spearman等级

5、相关系数。秩相关系数是利用两变量的秩次大小进行线性相关分析。适用范围:对于连续变量,当积差相关系数不适用时,可以使用Spearman等级相关系数来衡量两个变量之间的相关系数。四 Kendall相关系数Kendall相关系数适用于有序分类变量。14.3 偏相关分析偏相关分析一、方法原理简单相关关系只反映两个变量之间的关系,但如果因变量受到多个因素的影响时,因变量与某一自变量之间的简单相关关系显然受到其它相关因素的影响,不能真实地反映二者之间的关系,所以需要考察在其它因素的影响剔除后二者之间的相关程度,即偏相关分析。偏相关分析偏相关分析是指在相关的基础上考虑两个因素以外的各种影响因素,或者说在扣除

6、了其他因素的作用大小以后,重新来考虑这两个因素间的关联程度。计算公式:参见多元统计分析。二 案例:例:在控制家庭收入对总信心指数影响的前提下,考察总信心指数值和年龄的相关性。总信心指数与年龄存在相关关系,即年龄越老,信心指数越小,年龄越年轻,信心指数越大。同样,总信心指数与家庭收入也存在负相关关系。那么,总信心指数与年龄之间的负相关关系受不受家庭收入的影响?这种影响有多大?这就需要考虑偏相关关系。操作步骤:单击Analyze Correlate Partial 打开Partial对话框。此处,偏相关系数等于-0.203,与前文的相关系数-0.219是不一样的。14.4 Distance距离一、

7、距离测量与相似性指标在统计学中,距离距离可以用来表示两个变量的相似程相似程度度。另一个常用的相似指标是相关关系。根据变量的不同类型,可以有不同的距离/相似指标。具体内容参见多元统计分析中的判别分析和聚类分析。1、距离测量指标(1)欧式距离(2)频数表距离或卡方值距离(3)二分类距离2、相似性测量指标(1)计量资料:如,相关系数等(2)二分类变量:如,Russell and Rao等。二 案例:基因间距离的计算例:某实验室制作了一张基因芯片,上面一共检测了上万个基因,现在从数据库中提取了7个基因的数据,对其进行距离测量,确定哪些基因的距离比较接近。数据见:distance.sav操作步骤:单击Analyze Correlate Distances 打开Distances对话框。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(相关分析课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|