第五章-相关系数讲解课件.ppt

上传人(卖家):晟晟文业 文档编号:4960781 上传时间:2023-01-28 格式:PPT 页数:56 大小:590KB
下载 相关 举报
第五章-相关系数讲解课件.ppt_第1页
第1页 / 共56页
第五章-相关系数讲解课件.ppt_第2页
第2页 / 共56页
第五章-相关系数讲解课件.ppt_第3页
第3页 / 共56页
第五章-相关系数讲解课件.ppt_第4页
第4页 / 共56页
第五章-相关系数讲解课件.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

1、第五章第五章 相关系数相关系数李金德李金德n第一节第一节 相关系数与散点图相关系数与散点图n第二节第二节 积差相关积差相关n第三节第三节 等级相关等级相关n第四节第四节 质与量相关质与量相关n第五节第五节 品质相关品质相关n第六节第六节 相关系数的选用与解释相关系数的选用与解释第一节第一节 相关系数与散点图相关系数与散点图n一、什么是相关?一、什么是相关?n(一)事物可能存在的关系(一)事物可能存在的关系n1.因果关系因果关系nA是引起是引起B的原因,的原因,B是是A导致的结果。导致的结果。n如:扁桃体发炎导致喉咙十分难受。如:扁桃体发炎导致喉咙十分难受。n又如又如:努力学习让学习成绩得到了提

2、高。努力学习让学习成绩得到了提高。ABn2.共变关系共变关系n表面看似有关系的两个事物,实际上是因为两者都与表面看似有关系的两个事物,实际上是因为两者都与第三个事物有关的缘故。第三个事物有关的缘故。n如:医疗设备越好居民患病率越高。如:医疗设备越好居民患病率越高。n又如:研究发现携带火柴的数量与肺癌患病率正相关。又如:研究发现携带火柴的数量与肺癌患病率正相关。ABCn3相关关系相关关系nA与与B在发展变化的方向与大小方面存在一定关系。在发展变化的方向与大小方面存在一定关系。n相关关系不同于因果关系,不能确定两者谁是因果;相关关系不同于因果关系,不能确定两者谁是因果;也有理由认为这两者不同时受第

3、三个因素的影响,即也有理由认为这两者不同时受第三个因素的影响,即不存在共变关系。不存在共变关系。n但是,相关关系比较复杂,研究中研究者常常把相关但是,相关关系比较复杂,研究中研究者常常把相关作为因果和共变关系的研究前奏。作为因果和共变关系的研究前奏。n(二)相关的类别(二)相关的类别n1.从方向上来判断从方向上来判断n正相关正相关变化方向一致,变化方向一致,“同增共减同增共减”n负相关负相关变化方向相反,变化方向相反,“此增彼减此增彼减”n零相关零相关变化没有趋势趋势变化没有趋势趋势n2.从形状上看从形状上看n直线相关直线相关n曲线相关曲线相关n3.从相关程度上看从相关程度上看n完全相关:完全

4、相关:A和和B变化完全对应。表现为坐标上的一变化完全对应。表现为坐标上的一条直线。条直线。n强相关:强相关:A变化时变化时,B增大(或减少)的可能性非常大。增大(或减少)的可能性非常大。表现为散点图较为集中在某条直线的周围。表现为散点图较为集中在某条直线的周围。n弱相关:弱相关:A变化时变化时,B增大(或减少)的可能性较少。增大(或减少)的可能性较少。表现为散点图较为分散的集中在某条直线的周围。表现为散点图较为分散的集中在某条直线的周围。n零相关:零相关:A变化时变化时,B或增大或减少,好无规律。或增大或减少,好无规律。二、相关系数二、相关系数n概念概念:相关系数是变量之间相关程度的指标。计算

5、相:相关系数是变量之间相关程度的指标。计算相关系数一般需大样本。关系数一般需大样本。n符号符号:样本相关系数:样本相关系数r,总体相关系数,总体相关系数 n取值取值:-11。n性质性质:顺序数据。:顺序数据。三、散点图三、散点图XY0完全正相关完全正相关XY0高正相关高正相关XY0零相关零相关XY0完全负相关完全负相关XY0高负相关高负相关XY0零相关零相关第二节第二节 积差相关积差相关n一、概念及适用范围一、概念及适用范围n积差相关,是计算两个变量线性相关的一种方法,由积差相关,是计算两个变量线性相关的一种方法,由英国统计学家皮尔逊提出,因此也称为皮尔逊英国统计学家皮尔逊提出,因此也称为皮尔

6、逊(Pearson)相关。相关。n 适用范围:适用范围:数据成对数据成对n 两变量总体正态分布或接近正态分布两变量总体正态分布或接近正态分布n 两变量是连续变量两变量是连续变量n 两变量为线性关系两变量为线性关系二、计算公式二、计算公式n1.运用标准差与离均差的计算公式运用标准差与离均差的计算公式222y2xyxyx,Ny,Nx,x,xyrSSYSXSNYYyXXyxSNSxyryx根据的标准差为的标准差为为成对数据的数目两个变量的离均差,二、计算公式二、计算公式n2.运用标准分数计算积差相关运用标准分数计算积差相关变量的标准分为变量的标准分为YZXZZZNryxyx1二、计算公式二、计算公式

7、n3.运用原始数据计算积差相关运用原始数据计算积差相关2222 YYNXXNYXXYNr或者NYYNXXNYXXYr2222例题例题5-1 试问身高与体重有无关系试问身高与体重有无关系第1 栏 第2 栏 第3 栏 第4 栏 第5 栏 第6 栏 实测记分 离差记分 积差 标准记分 标准积差 身高 体重 Xd Yd YXdd XZ YZ YXZZ 编号 XXX YY YYXX XXSd YYSd YYXXSdSd 1 170 72 0 3 0 0 1.5 0.00 2 165 69-5 0 0-0.41 0 0.00 3 150 66-20-3 60 1.63-1.5 2.44 4 180 70

8、10 1 10 0.82 0.5 0.41 5 185 68 15-1-15 1.22-0.5-0.61 850 345 0 0 55 2.24 Yn解:采用标准分数计算积差相关解:采用标准分数计算积差相关n(1)先求标准分数)先求标准分数1705850X695345Y25.1257502NdSXX25202NdSYYn(2)求两变量的积差)求两变量的积差n(3)再求两变量标准分数的成绩)再求两变量标准分数的成绩 ,对其求,对其求和:和:n(4)带入公式:)带入公式:YYXXyxZZ24.2yxZZ45.0524.21yxZZNr课堂练习:用原始数据计算积差相关课堂练习:用原始数据计算积差相关

9、编号编号身高身高X体重体重YX2Y2XY11705028900250085002173452992920257785316047256002209752041554424025193668205173502992925008650求和求和8312361383831117039275三、相关系数的合并三、相关系数的合并n合并的步骤:合并的步骤:n1.rZ,即先将各样本的相关系数,即先将各样本的相关系数r转化为转化为Fisher Z分分数(查附表数(查附表8););n2.求平均的求平均的Z分数:分数:,其中,其中n为每个样本为每个样本的容量;的容量;n3.Zr,即用附表,即用附表8再将平均的再将平

10、均的Z分数转化为平均的相分数转化为平均的相关系数。关系数。33iiinZnZ第二节第二节 等级相关等级相关n一、等级相关的意义一、等级相关的意义n等级相关是根据等级资料来研究变量之间相互关系的等级相关是根据等级资料来研究变量之间相互关系的方法。方法。n数据来源:一是等级评定的资料,二是等距或比率资数据来源:一是等级评定的资料,二是等距或比率资料转化而成的等级评定资料。料转化而成的等级评定资料。n优点:使用范围较积差相关更广优点:使用范围较积差相关更广n缺点:没有积差相关精确缺点:没有积差相关精确二、斯皮尔曼等级相关二、斯皮尔曼等级相关n(一)斯皮尔曼等级相关(一)斯皮尔曼等级相关nSpearm

11、ans rank correlation。符号:符号:rR,rS.n斯皮尔曼等级相关是根据两列变量的斯皮尔曼等级相关是根据两列变量的成对等级差数成对等级差数计计算相关系数,又叫算相关系数,又叫“等级差数法等级差数法”。n条件:成对;线性相关;无正态假设;无大样本限定条件:成对;线性相关;无正态假设;无大样本限定n结论:比皮尔逊积差相关应用范围广。结论:比皮尔逊积差相关应用范围广。(二)计算公式(二)计算公式n1.无相同等级时无相同等级时n(1)利用等级差值计算)利用等级差值计算级差数二列成对等级变量的等等级对数DNNNDrs)1(6122n(2)直接运用等级计算)直接运用等级计算等级序数为两列

12、变量各自排列的等级对数yxyxsRRNNNNRRNr,)1()1(413例题例题5-2n现有现有10人的视、听两种感觉道的反应时(单位:毫人的视、听两种感觉道的反应时(单位:毫秒),数据见下表。问视、听反应时是否具有一致性?秒),数据见下表。问视、听反应时是否具有一致性?听反应时听反应时 视反应时视反应时 被试被试 X X Y Y RX RY RRYXD D2 RXRY 1 1 172172 179179 7 7 5 5 2 2 4 4 3535 2 2 140140 162162 2 2 2 2 0 0 0 0 4 4 3 3 152152 153153 5 5 1 1 4 4 1616 5

13、 5 4 4 187187 189189 8 8 8 8 0 0 0 0 6464 5 5 139139 181181 1 1 6 6 -5 5 2525 6 6 6 6 195195 220220 9 9 1010 -1 1 1 1 9090 7 7 212212 210210 1010 9 9 1 1 1 1 9090 8 8 164164 182182 6 6 7 7 -1 1 1 1 4242 9 9 149149 178178 4 4 4 4 0 0 0 0 1616 1010 146146 170170 3 3 3 3 0 0 0 0 9 9 5555 5555 4848 3613

14、61。相关系数为人的视听反应时的等级答:这已知解:根据表中的计算,71.01071.011110144493)110()110(1036141103)1()1(41371.01104861161361,48,10102222NNNRRNNNyxRRYXrNDrRRDn2.有相同等级的计算公式有相同等级的计算公式222222yxDyxrRC12)1(,12232nnCCNNxxx为相同等级的数目nnnCCNNyyy12)1(,12232例例5-3:n表表5-9是是10名学生的数学和语文考试成绩,问名学生的数学和语文考试成绩,问数学和语文成绩是否相关?数学和语文成绩是否相关?语文语文 数学数学 学

15、生学生 X X Y Y RX RY RRYXD D2 1 1 5959 4747 4.54.5 6 6 -1.51.5 2.252.25 2 2 3535 4040 1010 1010 0 0 0 0 3 3 5959 4242 4.54.5 8 8 -3.53.5 12.2512.25 4 4 5757 5555 6 6 3.53.5 2.52.5 6.256.25 5 5 5050 4949 7 7 5 5 2 2 4 4 6 6 7171 6363 1 1 1 1 0 0 0 0 7 7 6262 5555 3 3 3.53.5 -0.50.5 0.250.25 8 8 4747 424

16、2 8 8 8 8 0 0 0 0 9 9 4343 4242 9 9 8 8 1 1 1 1 1010 6868 5757 2 2 2 2 0 0 0 0 N=10N=10 262D 。相关,相关系数为答:数学与语文成绩有84.084.00.162136808222680822805.2121012825.01210125.225.0121312125.01212222223323322221010322yxDyxrCNyCNxCCRCYXYXNNn解:解:三、肯德尔和谐系数三、肯德尔和谐系数n1.肯德尔肯德尔W系数又称和谐系数,是表示多列等级变量系数又称和谐系数,是表示多列等级变量相关程度

17、的一种方法。相关程度的一种方法。n2.适用范围:(适用范围:(1)采用等级评定的方法收集等级数采用等级评定的方法收集等级数据,即让据,即让K个评委(被试)评定个评委(被试)评定N件事物,或件事物,或1个评委个评委(被试)先后(被试)先后K次评定次评定N件事物。件事物。n (2)每个评价者对)每个评价者对N件事物排出一个等件事物排出一个等级顺序,最小的等级序数为级顺序,最小的等级序数为1,最大的为,最大的为N,若并列,若并列等级时,则平分共同应该占据的等级。等级时,则平分共同应该占据的等级。n3.计算公式计算公式n无相同等级无相同等级NNKsW32121评委数量被评价的事物个事物的等级之和为第K

18、NiRNRRsiii2211311222NNNNKRWi例例5-4n有有10人对红、橙、黄、绿、蓝、紫七种颜色按照其喜人对红、橙、黄、绿、蓝、紫七种颜色按照其喜欢程度进行等级评定。其中,最喜欢的等级为欢程度进行等级评定。其中,最喜欢的等级为1,最,最不喜欢的等级为不喜欢的等级为7。结果见表。结果见表5-10。问这。问这10人对颜色人对颜色的爱好是否具有一致性?的爱好是否具有一致性?表表5-10性。的喜爱具有较高的一致值看,这十个人对颜色答:从或者解:W827.04827.417173171351612827.028002316712123162316710710223222WWNiisRRn(

19、2)有相同等级)有相同等级TKNNKsW32121123nnT例例5-7:n五位评分者对七篇作文进行评价,评价等级为五位评分者对七篇作文进行评价,评价等级为15,评价结果见表评价结果见表5-12,试问评分者之间对标准的掌握是,试问评分者之间对标准的掌握是否一致?否一致?表表5-12N=7N=7 评价者评价者 K=5 K=5 被评作文被评作文 1 1 2 2 3 3 4 4 5 5 Ri Ri2 A A 4 4 5 5 3.53.5 5 5 4 4 21.521.5 462.25462.25 B B 1 1 1 1 1.51.5 2 2 1 1 6.56.5 42.2542.25 C C 2.5

20、2.5 2 2 1.51.5 2 2 2 2 1010 100100 D D 6 6 5 5 5 5 4 4 5 5 2525 625625 E E 2.52.5 3 3 3 3.5.5 2 2 3 3 1414 196196 F F 5 5 5 5 7 7 6 6 6 6 2929 841841 G G 7 7 7 7 6 6 7 7 7 7 3434 11561156 合计合计 140140 3422.53422.5 926.05.6725.6225.5571215.6225.51231221221231225.62275.2234753223214032333332222WTNiiRRs

21、解:第四节第四节 质与量的相关质与量的相关n一、点二列相关一、点二列相关n(一)定义(一)定义n 研究一列等距或比率变量与一列研究一列等距或比率变量与一列“二分二分”名称变名称变量之间相关的统计方法称做点二列相关。量之间相关的统计方法称做点二列相关。符号:符号:rpb。n(二)适用范围(二)适用范围n 1.一列数据一列数据等距或等比,总体服从正态分布;等距或等比,总体服从正态分布;n 2.另一列变量另一列变量按事物的性质划分为两类的变量;按事物的性质划分为两类的变量;n 3.多用于测验中评价题目的区分度。多用于测验中评价题目的区分度。n(三)计算公式(三)计算公式np,q是二分变量各所占的比例

22、,是二分变量各所占的比例,nSt是连续变量的标准差,是连续变量的标准差,n 是二分变量对应连续变量相应部分的平均数,是二分变量对应连续变量相应部分的平均数,nXt是连续变量的平均数。是连续变量的平均数。pqSXXrtqppbqpXX,例例5-6n有一是非式选择测验题,每题选对得有一是非式选择测验题,每题选对得2分,共有分,共有50题,题,满分满分100分。表分。表5-14是是20名学生在该测验中的总成绩名学生在该测验中的总成绩及第及第5题的选答情况。问这道题与测验总分的相关程题的选答情况。问这道题与测验总分的相关程度如何?度如何?表表5-14学生学生 总分总分 第五题第五题 学生学生 总分总分

23、 第五题第五题 1 1 8484 对对 1111 7878 对对 2 2 8282 错错 1212 8080 错错 3 3 7676 错错 1313 9292 对对 4 4 6060 错错 1414 9494 对对 5 5 7272 错错 1515 9696 对对 6 6 7474 错错 1616 8888 对对 7 7 7676 错错 1717 9090 对对 8 8 8484 对对 1818 7878 错错 9 9 8888 对对 1919 7676 错错 1010 9090 对对 2020 7474 错错 高。表明第五题的区分度教与总分有一致性。即第五题的答对与答错,相关较高,之间的相关

24、系数为答:第五题与测验总分解:766.0766.05.05.088.88.744.8888.8,8.74,4.88,5.02010,5.02010XXqpsXXrstqppbtqp二、二列相关二、二列相关n(一)定义(一)定义n 二列相关系数是研究一列正态的比率或等距变二列相关系数是研究一列正态的比率或等距变量和一列人为量和一列人为“二分二分”名称变量之间相互关系的统计名称变量之间相互关系的统计方法。符号:方法。符号:rb。n(二)适用范围(二)适用范围n 两个变量都是等距或等比数据,服从正态分布,两个变量都是等距或等比数据,服从正态分布,其中一列被人为地划分为两类。其中一列被人为地划分为两类

25、。n 在测量中用于测验效度和试题区分度的分析。在测量中用于测验效度和试题区分度的分析。n(三)计算公式(三)计算公式nY为标准正态曲线中为标准正态曲线中p值对应的高度。值对应的高度。ypqSXXrtqpbypSXXrttpb第五节第五节 品质相关品质相关n一、四分相关一、四分相关n(一)适用条件(一)适用条件n四格表的二因素都是连续的正态变量,只是人为地将四格表的二因素都是连续的正态变量,只是人为地将其按一定标准划分为两个不同的类别。其按一定标准划分为两个不同的类别。n(二)计算公式(二)计算公式bcadbccosr bcad1180cosrtt或例例5-8n下表所列的数据是调查下表所列的数据

26、是调查377名学生两科测验成绩所得到的结果,名学生两科测验成绩所得到的结果,假设两科成绩的分布为正态,只是人为地将其按一定标准划分假设两科成绩的分布为正态,只是人为地将其按一定标准划分为及格、不及格两类。为及格、不及格两类。及格及格不及格不及格及格及格a(124)b(68)不及格不及格c(85)d(100)地地理理成成绩绩历史成绩历史成绩n解:已知解:已知a=124,b=68,c=85,d=100,a+b+c+d=377n将上面的结果代入公式得:将上面的结果代入公式得:。答:四格相关系数为2919.02919.0031.73cos)85681001241180cos(00tr二、二、相关相关n

27、(一)适用资料(一)适用资料n 相关的适用资料是除四分相关之外的四格表资料,相关的适用资料是除四分相关之外的四格表资料,是表示两二分变量相关程度最常用的一种相关系数。是表示两二分变量相关程度最常用的一种相关系数。n(二)计算公式(二)计算公式系数显著。则检验显著若,22dbcadcbabcadn例例5-9:n有研究者调查了有研究者调查了358名不同性别的学生对某项教育措名不同性别的学生对某项教育措施的评价态度,结果如下表。根据这些结果能否说性施的评价态度,结果如下表。根据这些结果能否说性别与评价态度有关?相关的程度如何?别与评价态度有关?相关的程度如何?拥护拥护反对反对男男66106女女281

28、58性性别别评价态度评价态度著,需要进一步检验。一定程度相关,是否显答:性别也评价态度有解:3042.0106281586610628158665569.010628158661062815866265.047.281767460186264941722810615866)()()(bcadbcadbcadbcadQdcdbcababcadr三、列联相关三、列联相关n(一)适用资料(一)适用资料n 属于属于RC列联表的资料,要分析所研究的二因素列联表的资料,要分析所研究的二因素之间的相关程度,就要用列联相关。之间的相关程度,就要用列联相关。n (二)计算公式(二)计算公式22nC第六节第六节

29、相关系数的选用与解释相关系数的选用与解释一、如何选择合适的相关系数一、如何选择合适的相关系数1.考虑每种测量所产生的数据属于什么类型考虑每种测量所产生的数据属于什么类型2.要对第一种测量数据和第二种测量数据的类型依次做要对第一种测量数据和第二种测量数据的类型依次做出判断出判断3.确定采用哪种相关系数确定采用哪种相关系数二、相关系数值的解释二、相关系数值的解释 相关系数是一个指标值,它表示两个变量之间的关系相关系数是一个指标值,它表示两个变量之间的关系程度。是顺序型数据。程度。是顺序型数据。相关系数即使很高,也不能断定两个变量之间有因果相关系数即使很高,也不能断定两个变量之间有因果关。关。三、相关系数的特殊用途三、相关系数的特殊用途 可以用于确定测验的信度系数和效度系数,用于对测可以用于确定测验的信度系数和效度系数,用于对测验的项目区分度进行分析。验的项目区分度进行分析。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第五章-相关系数讲解课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|