1、Different kind of researchnCorrelational Researchn即相关研究,这种研究所要回答的问题一般是这种:n学习动机和学习成绩有关吗?n智商与幸福感有关吗?n考试焦虑与高考成绩有关吗?n年龄与握力有关吗?Different kind of researchnCorrelational Research总体随机抽样独立样本;自变量;因变量n统计分析:对从同一组被试中得出的两个变量求相关;n统计结论:两个变量之间是否存在相关,但无法确定两者之间是否存在因果关系;心理与教育统计学心理与教育统计学第四章相关分析n本章要点:n1.相关与相关系数;n2.常用的几种相
2、关系数计算方法;n事物之间的相互关系事物之间的相互关系n因果关系:一种现象是另一种现象的原因,而另一种现象是结果。n共变关系:表面上看来有联系的两种事物都与第三种现象有关。这时两种事物之间的关系,便是共变关系。n相关关系:两类现象在发展变化的方向与大小方面存在一定的关系,但不是前面两种关系。n不能确定这两类现象之间哪个是因,哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系。n具有相关关系的两种现象之间的关系是比较复杂的,甚至可能包含有暂时的尝未认识的因果关系以及共变关系在内。因果推论定向性问题大学生的学习成绩和班级活动大学生的学习成绩和班级活动参与程度之间存在正相关参与程
3、度之间存在正相关So what?1.参与更多的班级活动,就可以学到更多的东西,参与更多的班级活动,就可以学到更多的东西,从而带来更好的学习成绩?从而带来更好的学习成绩?2.好的学习成绩使大学生对某些课程或主题感兴好的学习成绩使大学生对某些课程或主题感兴趣,从而更加乐意参与班级活动?趣,从而更加乐意参与班级活动?3.可能存在第三变量同时影响学习成绩和班级活可能存在第三变量同时影响学习成绩和班级活动参与程度,结果使两者出现相关?动参与程度,结果使两者出现相关?2023-2-146n相关的含义相关的含义n事物之间存在关系,但又不能直接做因果关系解释时,称事物间的联系为相关。n判断两个因素或变量之间是
4、否有关系,定量地研究这些关系,称为相关分析。n相关的类别相关的类别n从变化的方向来看,相关的情况有以下三种:n 正相关:两列变量的变化方向相同。n 负相关:两列变量的变化方向相反。n 零相关:两列变量的变化方向无一定规律。n n是两列变量间相关程度的数字表现形式,或者说是用来表示相关关系强度的指标。作为样本间相互关系程度的统计特征数,常用r表示,作为总体参数,一般用p表示,并且是指线性相关而言。n相关系数的取值介于-1.00至+1.00之间,常用小数形式表示。它只是一个比率,不代表相关的百分数,更不是相关量的相等单位的度量。,1,1,0,0,0,1,1p rp rp rp rp rp r n
5、n1.相关系数的取值在-1.00和+1.00之间;n2.相关系数的绝对值表示两个变量之间的相关强度,绝对值越接近1表示相关越强,越接近0表示相关越弱;n3.相关系数的正负号表示相关的方向,相关系数为正的表示正相关,相关系数为负的表示负相关;n4.相关系数可以比较大小,但不能进行加减乘除运算。查尔斯爱德华斯皮尔曼(Charles Edward Spearman)英国理论和实验心理学家。作为实验心理学的先驱,斯皮尔曼对心理统计的发展做了大量的研究,他对相关系数概念进行了延伸,导出了等级相关的计算方法。他还创立因素分析的方法,这是他学术上最伟大的成就。2023-2-1412n n在直角坐标系中,以
6、X、Y 二列变量中的一列变量(如X 变量)为横坐标,以另一列变量(如Y 变量)为纵坐标,把每对数据Xi、Yi当做同一个平面上的个点(Xi、Yi),一一描绘在直角坐标系中,产生的图形就称为散点图。n散点图通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够对原始数据间的关系做出直观而有效的预测和解释。n不同形状的散点图显示了两个变量间不同程度的相关关系。如果所有散点分布呈椭圆状,则说明二变量之间呈线性关系。正相关正相关负相关负相关如果椭圆长轴的倾斜方向左低右高(以轴为基准),则为正相关,左高右低则为负相关;如果散点图呈现圆形,就为零相关或弱相关。而害羞和测验焦虑可能有一而害羞和测验
7、焦虑可能有一定关系,也可能并没有关系。定关系,也可能并没有关系。2023-2-1416n 在教育与心理实践中,常用的相关分析方法有:n1.积差相关n2.等级相关n包括斯皮尔曼等级相关和肯德尔和谐系数。n3.质量相关n包括点双列相关和双列相关n 积差相关的概念和适用条件积差相关的概念和适用条件n当两列变量都是正态连续变量,而且两者之间呈线性关系,表示这两列变量之间的相关称为积差相关。使用积差相关必须满足下列条件:n1.要求成对的数据,即若干个体中每个个体都有两种不同的观测值。n2.计算相关的成对的数据的数目不宜少于30对。n3.两列变量各自总体的分布都是正态分布,至少两个变量服从的分布是接近正态
8、的单峰分布。n4.两个相关的变量是连续变量,也即两列数据都是测量数据。n5.两列变量之间的关系应是直线性的。n 积差相关的计算方法积差相关的计算方法1221()()()()iiniXYniiixXyYrxXyYn 1.基本公式n 2.如果有 ,那么基本公式可变成:ix xXiy y Y XYXYxyrnS Sxyn离均差离均差n 积差相关的计算方法积差相关的计算方法n 3.标准分公式11XYXYXYXYxyxyrnS SnSSZ Znn 积差相关的计算方法积差相关的计算方法n 4.计算公式2222()()().()iiiiXYiiiinx yxyrnxxnyyn 例题.(10分)某个统计学教授
9、认为数学知识水平对学生的统计学课程学习至关重要。为了验证自己的这一想法,她在统计课程开始前给学生实施了数学标准化测试(X)。学期结束后又对学生施测了统计学期末测试(Y)。学生XY1909428592380814757857074670737707586066960531050520.966XYr71X 73.8Y 12.2XS14.1YSn 等级相关等级相关n何时使用等级相关?n1.当测量得到的数据不是等距或等比数据,而是具有等级顺序的测量数据,n2.或者所得数据是等距或等比数据,但来自于非正态分布的整体,n这两种情况中的任何一种出现了,就不能用积差相关,而应该计算两列(斯皮尔曼等级相关)或多
10、列数据(肯德尔和谐系数)的等级相关。n斯皮尔曼(斯皮尔曼(spearman)等级相关)等级相关n适用于只有两列变量,具有线性关系的资料。用 表示。其计算公式有下列三种情况:n1.等级差数法(N 30)n2.等级序数法n3.有相同等级时计算等级相关的方法Rrn1.等级差数法(N 30)22611RDrn n n 对偶等级之差n n 对偶数据个数XYDRRn 例题.(5分)某个心理学教授认为观看电视节目的暴力程度与小学生的暴力行为水平有关。为了验证自己的这一想法,她调查了10名小学生,评估了他们观看电视节目的暴力程度(X),并让其老师评估这些学生的暴力行为水平(Y)。学生XY14527835442
11、35910612767831986101090.903Rr 216D n2.等级序数法43111XYRR Rrnnn nn X 变量的等级n Y 变量的等级nn 对偶数据个数XRYRn 例题.(4分)某个幼儿园老师认为小孩家长的焦虑程度与孩子的调皮程度有关。为了验证自己的这一想法,她调查了10名幼儿及其父母,评估了幼儿的问题行为水平(X),并让其父母互评焦虑程度并求平均值(Y)。幼儿XY1452783544235910612767831986101090.903Rr 377XYR R n3.有相同等级时计算等级相关的方法n在使用等级序数法时要求两列等级变量数据的方差相等,这样就必须有两列数据的
12、等级和相等且等级平方和相等。n如果任意一个数据列中有相同等级时,则平方和相等的条件就不能满足。某列数据中的等级平方和会随着相同等级数目的逐渐增多而有规律地减少,其减少的规律为:nc 差数值(几个相同等级出现时的等级平方和与没有相同等级出现时的等级平方和之差)nt 某一等级的相同数2112t tcn3.有相同等级时计算等级相关的方法n当一列数据中有多个相同等级出现时,它们的差数值为:2112t tc nc 差数值(几个相同等级出现时的等级平方和与没有相同等级出现时的等级平方和之差)nt 某一等级的相同数n3.有相同等级时计算等级相关的方法n于是,有相同等级时,等级相关的计算公式为:222222y
13、xDyxrRC3212Xnnxc3212Ynnyc0.891Rr n 例题.(8分)某个幼儿园老师认为小孩家长的焦虑程度与孩子的调皮程度有关。为了验证自己的这一想法,她调查了10名幼儿及其父母,评估了幼儿的问题行为水平(X),并让其父母互评焦虑程度并求平均值(Y)。幼儿XY14527.5835542257.51061277.5783297.55101095Xc4Yc 217D n肯德尔肯德尔W系数(肯德尔和谐系数)系数(肯德尔和谐系数)n适用于两列以上的变量,是表示多列等级变量相关程度的一种方法,其符号为:n计算肯德尔和谐系数时,原始数据资料的获得一般采用等级评定的方法,即让K个评价者对N件事
14、物或N件作品进行等级评定;n每个评价者都能对N件事物(或作品)根据好坏、优劣、喜好、大小、高低等排出一个等级顺序。最小的等级序数为1,最大的为N,这样,K个评价者便可得到K列从1至N的等级变量资料。Wn肯德尔肯德尔W系数(肯德尔和谐系数)系数(肯德尔和谐系数)n适用于两列以上的变量,是表示多列等级变量相关程度的一种方法,其符号为:n另一种情况是一个评价者先后K次评价N件事物或N件作品,也是采用等级评定的方法,这样也可得到K列从1至N的等级变量资料。这类K列等级变量资料综合起来求相关,也用肯德尔W系数。Wn肯德尔肯德尔W系数(肯德尔和谐系数)系数(肯德尔和谐系数)n适用于两列以上的变量,是表示多
15、列等级变量相关程度的一种方法,其符号为:n其计算公式为:W23112RiSSWKnn2222iiRiiiiRRSSRRRRNN nK 等级变量的列数或评价者数目;nn 被评价对象数目;n 的离差平方和;n 每一件被评价事物的K个等级之和;RiSSiRiRn肯德尔肯德尔W系数(肯德尔和谐系数)系数(肯德尔和谐系数)n当K个评价者对n件事物进行等级评价是,如果他们的意见完全一致,则n个Ri分别为:K,2K,3K,nK;n=5评分者k=6作文123456一111111二222222三333333四444444五555555(n 1)2(n 1)2KnRnKK2K3K4K5Kn肯德尔肯德尔W系数(肯德
16、尔和谐系数)系数(肯德尔和谐系数)n当K个评价者对n件事物进行等级评价是,如果他们的意见完全一致,则n个Ri分别为:K,2K,3K,nK;2RiiSSRR 222iiRR RR 222iiRR RnR(n 1)2KR222(1)(21)(1)(1)624Rin nnn nn nSSK2223(1)(21)(1)1()6412Rin nnn nSSKKnnn肯德尔肯德尔W系数(肯德尔和谐系数)系数(肯德尔和谐系数)n当K个评价者对n件事物进行等级评价完全不一致,那么 等于0。iRSSn=5评分者k=5作文12345一1234515二5421315三2143515四3512415五4351215i
17、R23112RiSSWKnn01Wn肯德尔肯德尔W系数(肯德尔和谐系数)系数(肯德尔和谐系数)n同斯皮尔曼等级相关系数一样,当出现相同等级时,肯德尔和谐系数也需要校正,其公式为:23112RiSSWKnnKc3()12ttc nc 差数值nt 某一等级的相同数n 例题.(8分)5位专家对5名学生的创造力水平的评价意见如表所示,请考察这5位评价者的评分者信度。学生一二三四五A544.543B1.52123C3.554.543D1.51211E3.53345专家5.5c33(22)3=1.512(33)2=41215R 2RiiSSRR iR20.59.5206.518.517023112RiSS
18、WKnnKcn 例题.(8分)5位专家对5名学生的创造力水平的评价意见如表所示,请考察这5位评价者的评分者信度。学生一二三四五A544.543B1.52123C3.554.543D1.51211E3.53345专家5.5c170RiSS23112RiSSWKnnKc231121705555 5.5 0.764n 质量相关质量相关n何时使用质量相关?n要计算相关的两个变量一列为等比或等距的测量数据,另一列是按性质划分的类别,欲求这样两列变量的直线相关,称之为质量相关,包括:n1.点二列相关;n2.二列相关;n 质量相关质量相关n1.点二列相关n两个变量其中一个是正态连续性变量(等距或等比的测量数
19、据);n另一个是真正的二分变量(二分称名变量,按事物的某一性质只能分为两类相互独立的变量,如男与女、文盲与非文盲等);n表示这两个变量之间的相关称为点二列相关。n 质量相关质量相关n1.点二(双)列相关n其计算公式为:pqpbXXXrpqSn 二分称名变量中取某一值的变量比例;n 二分称名变量中取另一值的变量比例;n 等距(比)变量中与p对应的那部分数据的平均值;n 等距(比)变量中与p对应的那部分数据的平均值;n 全部等距(比)变量的标准差;pqpXqXXSn 例题.(8分)下表是不同性别的人的作文考试的得分,请判断性别(1=男性;0=女性;)与作文成绩是否有关系。考生一二三四五六七八九十性
20、别0111001000成绩3730333536393238343660.610p 40.410q 36.67pX32.5qX7XSpqpbXXXrpqS36.6732.50.4*0.670.292n 质量相关质量相关n2.二(双)列相关n两列变量均属于来自正态总体的等距或等比变量;n其中一列被人为地划分为二分的类别数据;n表示这两个变量之间的相关要用二列相关。n 质量相关质量相关n2.二(双)列相关n其计算公式为:pqpbXXXpqrSYn 二分称名变量中取某一值的变量比例;n 二分称名变量中取另一值的变量比例;n 等距(比)变量中与p对应的那部分数据的平均值;n 等距(比)变量中与p对应的那部分数据的平均值;n 全部等距(比)变量的标准差;n 标准正态曲线下p与q交界点的Y轴高度;pqpXqXXSYn 例题.(8分)下表10名考生一次测验的卷面总分和一道问答题的得分,试求该问答题的区分度(该问答题满分10分,故得6分及以上则认为该题通过)。考生一二三四五六七八九十总成绩75577365675663616567问答767474447660.610p 40.410q 67.33pX61.25qX6.12XSpqpbXXXpqrSY67.3361.25 0.4*0.66.12Y0.38660.62