心理与教育统计学第5章-相关关系课件.ppt

上传人(卖家):晟晟文业 文档编号:3885909 上传时间:2022-10-22 格式:PPT 页数:43 大小:269.91KB
下载 相关 举报
心理与教育统计学第5章-相关关系课件.ppt_第1页
第1页 / 共43页
心理与教育统计学第5章-相关关系课件.ppt_第2页
第2页 / 共43页
心理与教育统计学第5章-相关关系课件.ppt_第3页
第3页 / 共43页
心理与教育统计学第5章-相关关系课件.ppt_第4页
第4页 / 共43页
心理与教育统计学第5章-相关关系课件.ppt_第5页
第5页 / 共43页
点击查看更多>>
资源描述

1、 第五章第五章 相关关系相关关系 第五章 相关关系第五章第五章 章节内容章节内容一、相关、相关关系与散点图一、相关、相关关系与散点图二、积差相关二、积差相关三、等级相关三、等级相关四、质与量相关四、质与量相关五、品质相关五、品质相关六、相关系数的选用与解释六、相关系数的选用与解释第五章 章节内容一、相关、相关关系与散点图一、一、相关、相关关系与散点图相关、相关关系与散点图1 1、相关的意义、相关的意义事物之间的相互关系事物之间的相互关系 因果关系(两种事物)因果关系(两种事物)共变关系(三种事物)共变关系(三种事物)相关关系(两种事物)相关关系(两种事物)相关的含义相关的含义事物之间存在关系,

2、但又不能直接做因果关系解释时,事物之间存在关系,但又不能直接做因果关系解释时,称事物间的联系为相关。称事物间的联系为相关。判断两个因素或变量之间是否有关系,定量地研究这判断两个因素或变量之间是否有关系,定量地研究这些关系,称为相关分析。些关系,称为相关分析。一、相关、相关关系与散点图1、相关的意义事物之间的相互关系相相关的类别相关的类别相关的类别两列变量间相关程度的数字表现形式,即用来表示相关两列变量间相关程度的数字表现形式,即用来表示相关系数强度的指标。系数强度的指标。P P(总体)总体)r r(样本)样本)110001,1,ppppprp不相关,相互独立不相关,相互独立正相关正相关负相关负

3、相关完全正相关完全正相关完全负相关完全负相关p越接近越接近1,表示两个变量的相关程度越密切,称高相关。,表示两个变量的相关程度越密切,称高相关。越接近越接近0,表示两个变量的相关程度越疏松,称低相关。,表示两个变量的相关程度越疏松,称低相关。相关系数相关系数两列变量间相关程度的数字表现形式,即用来表示相关系数强度的相关散点图相关散点图直观地显示了两个事物的成对观测值之间是直观地显示了两个事物的成对观测值之间是否存在相关,存在什么样的相关以及相关程否存在相关,存在什么样的相关以及相关程度。度。相关散点图直观地显示了两个事物的成对观测值之间是否存在相关,几种相关散点图几种相关散点图线性线性 (如身

4、高和体重)(如身高和体重)非线性非线性(如年龄和身高如年龄和身高)曲线相关曲线相关 线性正相关线性正相关R=-1R=1线性负相关线性负相关 零相关零相关几种相关散点图线性(如身高和体重)非线性(如年龄和身高)二、积差相关二、积差相关英国英国 Pearson 1、定义公式2211)()()(yyxxyyxxriniiiniiiiyxSNSXYr若记 则yyYxxXii,二、积差相关英国 P e a r s o n 1、定义积差相关适用条件积差相关适用条件 要求成对数据 两列变量各自总体的分布都是正态 两个相关的变量是连续变量,也即两列数据都是测量数据 两列变量之间的关系是直线性的,如果是非直线性

5、的双列变量,不能计算线性相关。判断两列变量之间的相关是否为直线式,可作相关散点图进行初步分析,也可查阅已有研究结果论证。积差相关适用条件 要求成对数据)(2222iiyxdyxyxdSSSSsriiii3、计算公式2222)(.)()(YYNXXNYXXYNr3、计算公式4、标准分数的计算公式iiyxZZNr1iiyxZZNr14、标准分数的计算公式实例:书P116(例5-1)实例:书P 1 1 6(例5-1)相关系数的合并相关系数的合并意义:来自同一总体的多个样本的相关系数的合成。意义:来自同一总体的多个样本的相关系数的合成。步骤:步骤:(1 1)将各样本的)将各样本的r r 转换成费舍转换

6、成费舍Z Z分数,见附表分数,见附表8 8。(2 2)求每一样本的)求每一样本的Z Z分数之和分数之和(3 3)求平均)求平均Z Z分数分数)3()3(iiinZnZ例子:例子:P123 (例例5-2)相关系数的合并意义:来自同一总体的多个样本的相关系数的合成。三、等级相关三、等级相关)1(6122NNDrR(一(一)斯皮尔曼等级相关斯皮尔曼等级相关 斯皮尔曼等级相关是等级相关的一种,适用于只有两列变量,而且是属于等级变量性质具有线性关系的资料 其中:N 成对数 D=Rx-Ry 对偶等级之差请注意:尽可能不出现相同等级,即不能并列排名,否则误差大1、定义公式:、定义公式:三、等级相关(一)斯皮

7、尔曼等级相关请注意:1、定义公式:2 2、相同等级计算方法、相同等级计算方法(1)将连续变量转化为等级变量求相关两个变量排序的方式要一致遇到相同等级时,要求他们的等级平均值例:例:X 100 98 97 97 93 93 93 90X 100 98 97 97 93 93 93 90 等级等级 1 2 3.5 3.5 6 6 6 8 1 2 3.5 3.5 6 6 6 8 2、相同等级计算方法(2 2)校正公式)校正公式12)1(12)1(12)1(12)1(222222222222nnNNYnnNNXYXDYXrR12)1(12)1(12)1(12)1(222222222222nnNNYnn

8、NNXYXDYXrR其中:其中:其中:其中:D D:对偶等对偶等级差级差n:n:各变量各变量相同等级数相同等级数(2)校正公式其中:其中:例子:P128(例5-5)(1 1)必须成对数据)必须成对数据(2 2)必须都是等级变量)必须都是等级变量(3 3)正态条件不明或非正态时,转为等级求)正态条件不明或非正态时,转为等级求r r例子:P 1 2 8 (例5-5)(二)肯德尔等级相关(二)肯德尔等级相关 1 1、肯德尔、肯德尔W W系数系数 (1 1)适用资料)适用资料 肯德尔肯德尔W W系数又称为肯德尔和谐系数是表示多列等级变量相系数又称为肯德尔和谐系数是表示多列等级变量相关程度的一种方法。这

9、种资料的获得一般采用等级评定的方法,关程度的一种方法。这种资料的获得一般采用等级评定的方法,即让即让K K个被试(或称评价者)对个被试(或称评价者)对N N件事物或作品进行等级评定,这件事物或作品进行等级评定,这样便可得到样便可得到K K列从列从1 1到到N N的等级变量资料;另一种情况是一个评价者的等级变量资料;另一种情况是一个评价者先后先后K K次评价次评价N N件事物或作品,采用等级评定的方法,这样,同样件事物或作品,采用等级评定的方法,这样,同样得到得到K K列从列从1 1到到N N的等级变量资料。对这样的的等级变量资料。对这样的K K列等级变量资料求相列等级变量资料求相关,用肯德尔关

10、,用肯德尔W W系数。系数。*用于三个或三个以上变量等级的相关系数,即求几个变用于三个或三个以上变量等级的相关系数,即求几个变量的一致性或和谐性量的一致性或和谐性(二)肯德尔等级相关 1、肯德尔W系数*用于三(2 2)肯德尔)肯德尔W W系数计算公式系数计算公式基本公式:基本公式:)(12132NNKSW其中:其中:22)()(2RRNRRSiii(2)肯德尔W系数计算公式其中:R i:每一件被评价事物的K 个校正公式(出现相同等级的计算)12)(121)(3322nnKNNKRRWi12)(121)(3322nnKNNKRRWi例子:例子:P132(例例5-7)校正公式(出现相同等级的计算)

11、例子:P 1 3 2 (例5-7)2、肯德尔肯德尔U U系数系数(1 1)适用资料)适用资料评价者采用对偶比较的方法,将评价者采用对偶比较的方法,将N N件事物两两配对,件事物两两配对,然后对每一对中两事物进行比较,择优选择,优者然后对每一对中两事物进行比较,择优选择,优者记记1 1,非优者记,非优者记0 0,最后整理成相对应的评价结果。,最后整理成相对应的评价结果。(2 2)计算公式:)计算公式:1)1()1()(82KKNNrKrUijij其中:N N:被评事物的数目,即被评事物的数目,即等级数等级数K K:评价者的数目评价者的数目r rijij:对偶比较记录表格对偶比较记录表格中的择优分

12、数中的择优分数例子:书例子:书P133(5-8)2、肯德尔U 系数其中:例子:书P 1 3 3(5-8)定义:需要计算相关的两更变量一列为等比或等距的测量数据,另一列是按性质划分的类别,欲求这样两列变量的直线相关,称之为质量相关,包括点二列相关、二列(双列)相关及多系列相关。*质量相关是研究连续变量与二分变量的相关关系。质量相关是研究连续变量与二分变量的相关关系。有一种变量,只有两个取值,称为二分变量二分变量(1、0)人为划分为两个取值,称人为二分变量人为二分变量(及格、不及格)若有等级之分,称二分等级变量二分等级变量若无等级之分,称二分称名变量二分称名变量(男、女)四、四、质与量相关质与量相

13、关 定义:需要计算相关的两更变量一列为等比或等距的测量数据,另一1 1、点二列相关、点二列相关 (1)适用资料 两列变量,一列为来自正态分布的等距或等比测量数据的连续变量,另一列变量是二分称名变量或整体不服从正态的二分等级变量(2)公式及计算(P136)*该相关系数的正负号无意义,只根据绝对值的大小该相关系数的正负号无意义,只根据绝对值的大小加以解释。加以解释。pqsXXrtqppb1、点二列相关(1)适用资料2 2、二列相关、二列相关 (1)适用资料两列变量,都为连续变量均属于正态分布,一列变量等距或等比,另一列为的二分变量。(2)公式及计算:是非选择题用点二列,主观题评分用二列。ypqsX

14、XrtqpbypsXXrttpbq2、二列相关(1)适用资料q例例下表为10名考生一次测验的卷面总分和一道问答题的得分,试求该问答题的区分度(该问答题满分为10分,因此得6分和6分以上则认为该题通过)例下表为1 0 名考生一次测验的卷面总分和一道问答题的得分,试求解:问答题得分被人为划为通过、不通过两类,本题应解:问答题得分被人为划为通过、不通过两类,本题应求双列相关。求双列相关。根据题意可得:根据题意可得:62.03866.040.060.012.625.6133.673866.0,60.025.61,33.674.0,6.0,12.6,10ypqSXXrypXXqpSnxqpbqpt解:问

15、答题得分被人为划为通过、不通过两类,本题应求双列相关。3 3、多列相关、多列相关(1)适用资料:适合处理两列正态变量资料,其中一列为等距或等比变量的测量数据,另一列被人为分为多种类别,称为名义变量。分为三类就叫作三列相关,四类就叫做四类相关。(2)公式及计算见(P140)3、多列相关(1)适用资料:适合处理两列正态变量资料,其中一五、品质相关五、品质相关 1、品质相关用于表示RC(行列)表的两个变量之间的关联程度。可用于心理测验的编制,进行项目分析2、这种相关因两个变量(因素)只划分为不同的品质类别,故而得名。一般对计数数据,而非测量数据,即使是测量数据,也人为地分为几个类别。3、主要有四分(

16、格)相关、相关、列联表相关等。五、品质相关 1、品质相关用于表示R C(行列)表的两个变1 1、四分相关、四分相关(1)适用资料四分相关适用于计算两个变量都是连续且每个变量都被这样的测量数据之间的相关。计算四分相关首先要将资料整理成四格表。四格表是二个因素(变量),每个变量各有两项分类。四格表的二因素都是连续的正态变量,只是人为将其按一定标准划分为两个不同的类别(2)计算公式:P1431、四分相关(1)适用资料2 2、系数系数 (1)适用资料 两个相互关联的变量分布都是,其系数用符号表示。求取系数可以运用列联表来计算,因此系数又叫列联系数。适用资料是除四分相关之外的四格表(计数)资料,是表示两

17、因素两项分类资料相关程度最常用的一种相关系数。2、系数(1)适用资料(2)计算公式:完全正相关全体个案落在四格表中的a、d中;完全负相关全体个案落在四格表中的b、c中;零相关表示均匀分配。当值小于0.3时,表示相关较弱,当值大于0.6时,表示相关较强。除常用系数,也用Q系数或归结系数。)()()(dcdbcababcadr(2)计算公式:3 3、列联表相关、列联表相关 (1)列联相关又称均方相依系数、接触系数等,一般用C表示。(2)它是二因素的RC列联表资料求得,故称为列联相关。当数据属于RC表的计数资料,欲分析所研究的二因素之间的相关程度,就要应用列联相关3、列联表相关(1)列联相关又称均方

18、相依系数、接触系数等,(3)公式:(4)另外当双变量的测量数据整理成次数分布表后,也可用列联相关系数表示两变量的相关程度。此时,当分组数目R5,C5,而且样本N又较大,计算的列联相关系数C与积差相关系数r很接近。22nC(3)公式:六、相关系数的选用与解释六、相关系数的选用与解释如何选择合适的相关系数如何选择合适的相关系数1、选择计算相关系数的方法主要取决于要处理的数据的性质以及某一相关系数需要满足的假设条件2、总的来说,为了选择一个合适的相关系数进行相关分析,要分下面几个步骤考虑:考虑每种测量所产生的数据类型 要对第一种测量数据和第二种测量数据的类型依次做出判断 确定采用哪一种相关系数。至于

19、两个测量数据哪个为第一,哪个标为第二,没有差别六、相关系数的选用与解释如何选择合适的相关系数1、相关系数是一个指标值,它表示两个变量之间的相关程度2、相关系数不是等距的测量值,因此在比较相关程度时,不能用倍数关系说明,只能说绝对值大者比绝对值小者相关更密切一些。3、相关系数值的大小表明了两列测量数据相互间的相关程度,并可以预测。4、当两个变量之间的关系受到其他变量的影响时,两者之间的高强度相关很可能是一种假象:虚假相关或伪相关相关系数值的解释相关系数值的解释1、相关系数是一个指标值,它表示两个变量之间的相关程度相关系5、偏相关与半偏相关6、在纯理论研究中,即使是很小的相关,如果在统计上有显著性

20、,也能够说明心理规律,但这并不表明有显著性就就有高相关7、特别注意:证实两个变量之间存在相关关系,并不一定说明一个变量的变化会引起另外一个变量发生变化,即“相关关系不是因果关系”。相关值较大的两类事物之间,不一定存在因果关系相关系数值的解释相关系数值的解释5、偏相关与半偏相关相关系数值的解释 相关意义的理解相关意义的理解1.相关的意义要看确定系数R22.相关系数0.3以下,为低相关,有理论意义而无实际意义3.相关系数0.4-0.6,为中等相关,既有有理论意义,也有实际意义4.相关系数0.7以上,为高相关,理论意义与实际意义都很大 相关意义的理解1.相关的意义要看确定系数R 2相关分析的发展相关

21、分析的发展聚类分析聚类分析多组相关指标的简缩聚类分析(cluster analysis)又称分类分析、群聚分析、集群分析,是将所观测的事物,或观测事物的指标进行分类的一种统计分析方法。样品聚类-Q型聚类:根据样品(事物或被试)之间的“距离”。指标聚类-R型聚类:用指标之间的相关系数,如果被施测的团体一定,可对测试指标进行聚类,从众多指标中找出一些有代表性的指标。这样可以减少指标,优化指标。相关分析的发展聚类分析多组相关指标的简缩相关分析的发展相关分析的发展因素分析因素分析多组相关背后因素的探索它是从众多可观测“变量”根据其相关情况,概括和推论出少数不可观测的“潜变量”(又称因素),目的在于用最

22、少的因素去概括和解释大量的观测事实,并建立起最简洁的,基本的概念系统,以揭示事物之间的本质联系的一种统计分析方法。相关分析的发展因素分析多组相关背后因素的探索探索性因素分析主要是从一组杂乱无章的数据对其又缺乏理论认识找出共同属性,以建立新的理论假设或发展新的理论构架;验证性因素分析的目的则在于验证已有的理论构架对其已有理论上的认识。探索性因素分析主要是从一组杂乱无章的数据对其又缺乏理论认识1 1、下表是平时两次考试的成绩分数,假设其分、下表是平时两次考试的成绩分数,假设其分布为正态,分别用积差相关与等级相关方法计布为正态,分别用积差相关与等级相关方法计算相关系数,并回答,就这份资料用哪种相关算

23、相关系数,并回答,就这份资料用哪种相关法更恰当?法更恰当?1、下表是平时两次考试的成绩分数,假设其分布为正态,分别用积2 2、假设两变量为线性关系,对下列各种情况各应使、假设两变量为线性关系,对下列各种情况各应使用何种方法计算相关系数?用何种方法计算相关系数?(1 1)两列变量是等距或等比变量,且均为正态分布。)两列变量是等距或等比变量,且均为正态分布。(2 2)两列变量是等距或等比变量,但不为正态分布。)两列变量是等距或等比变量,但不为正态分布。(3 3)一列变量为正态连续变量,另一列变量为正态)一列变量为正态连续变量,另一列变量为正态连续变量但被人为分为两类。连续变量但被人为分为两类。(4 4)一列为正态连续变量,另一列变量为二分称名)一列为正态连续变量,另一列变量为二分称名变量。变量。心理与教育统计学第5 章-相关关系课件 谢谢大家!谢谢大家!谢谢大家!

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 医疗、心理类
版权提示 | 免责声明

1,本文(心理与教育统计学第5章-相关关系课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|