1、心理测量学内容心理测量学内容学习目标学习目标一、信度(一、信度(Reliability)定义定义信度信度(Reliability): :测量结果的一致性、测量结果的一致性、可靠性程度。可靠性程度。信度系数信度系数(Reliability Coefficient):描述:描述测量信度的数量指标,以相关系数来表测量信度的数量指标,以相关系数来表示。示。 信度是一个被测团体的真分数的变异数信度是一个被测团体的真分数的变异数与实得分数的变异数之比。与实得分数的变异数之比。信度是一个被测团体的真分数与实得分信度是一个被测团体的真分数与实得分数的相关系数的平方。数的相关系数的平方。 22XTxxSSr22
2、1XExxSSr2TXXXrr二、信度种类及估计方法二、信度种类及估计方法重测信度重测信度复本信度复本信度同质性信度同质性信度评分者信评分者信度度(一)重测(一)重测(test-retesttest-retest)信度信度1.1.定义及计算:定义及计算:用同一个测验对同一组被试在不同时间用同一个测验对同一组被试在不同时间施测两次所得结果的一致性程度,其大施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。数的皮尔逊积差相关系数。又称稳定性又称稳定性信度、再测信度、施测信度、再测信度、施测再施测信度、再施测信度、跨时间一致
3、性。跨时间一致性。 图图1 1 重测信度图式重测信度图式 10名学生幸福感调查的两次施测分数名学生幸福感调查的两次施测分数重测信度的重测信度的计算举例计算举例ABCDEFGHIJ161513131110109871516141210911867X1X22.2.使用前提条件使用前提条件测验所测的特质必须是稳定的。测验所测的特质必须是稳定的。 遗忘与练习的效果基本上相互抵消。遗忘与练习的效果基本上相互抵消。 两次施测期间被试的学习效果没有差别。两次施测期间被试的学习效果没有差别。 (二)复本(二)复本(alternate-form, Equivalent)信度信度1.1.定义及计算:定义及计算:用
4、两个平行测验(同一测验的两个用两个平行测验(同一测验的两个复份)在相距最短时间内测量同一复份)在相距最短时间内测量同一组被试所得结果的一致性程度,其组被试所得结果的一致性程度,其大小等于同一组被试在两个复本测大小等于同一组被试在两个复本测验上所得分数的皮尔逊积差相关系验上所得分数的皮尔逊积差相关系数。又叫等值性信度,跨型式的一数。又叫等值性信度,跨型式的一致性。致性。 图图2 2 复本信度图式复本信度图式 10名学生创造力的复本测验结果名学生创造力的复本测验结果复本信度的复本信度的计算举例计算举例ABCDEFGHIJX1X220191818171614121210202019161617121
5、11392 2使用的前提条件使用的前提条件1)施测所用的两个复份必须是真正平行)施测所用的两个复份必须是真正平行的测验(即的测验(即A、B卷)卷) 2)被试要有条件接受两个测验)被试要有条件接受两个测验注意排除施测顺序的影响注意排除施测顺序的影响在报告结果时,应报告两次施测的间隔、在报告结果时,应报告两次施测的间隔、及在此间隔内被试的有关经历。及在此间隔内被试的有关经历。 稳定性与等值性稳定性与等值性(Stability and Equivalent)信度信度如果两个复本测验是相距较长一段时如果两个复本测验是相距较长一段时间分两次施测的,同一组被试施测结间分两次施测的,同一组被试施测结果的一致
6、性程度果的一致性程度 。是一种最为严格的信度指标是一种最为严格的信度指标(三)内部一致性信度(三)内部一致性信度 (internal consistencyinternal consistency)1.1.定义定义: : 指的是测验内容的一致性或测验内指的是测验内容的一致性或测验内部所有题目的一致性(项目同质性)部所有题目的一致性(项目同质性)程度。又称同质性程度。又称同质性(homogeneity ) 信度。信度。2. 估计同质性信度的方法估计同质性信度的方法分半法分半法库德库德-理查逊方法理查逊方法系数系数分半法分半法分半信度分半信度(Split-half reliability) :将一
7、个测将一个测验分成对等的两半后,所有被试在这两验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。半上所得分数的一致性程度。确定分半方法确定分半方法计算两半相关系数计算两半相关系数利用公式校正利用公式校正库德库德(Kuder(Kuder) ) -理查逊理查逊( (Richardson)Richardson)方法方法20公式(仅适用于以(仅适用于以1 1、0 0记分)记分)21公式(适用于以(适用于以1 1、0 0记分,各题难度近记分,各题难度近似)似) )(122XiiXKKSqpSKKr)1 (12XiiKKSqpKKKr22) 1()(XXKKSKXKXKSrGOGO系数或克伦巴赫
8、系数或克伦巴赫( (CronbachCronbach) )公式公式 适用于一切非适用于一切非0 0、1 1记分和连续记分(即记分和连续记分(即多重记分)的情况多重记分)的情况 例例)1)(1(22xiSSKKa3.3.内在一致性信度的适用范围内在一致性信度的适用范围 1)内在一致性信度适用于同质性测验,)内在一致性信度适用于同质性测验,而不适用于异质性测验。而不适用于异质性测验。 2)不适用于速度测验。)不适用于速度测验。 (四)(四)评分者信度的估计评分者信度的估计1.1.定义:定义: 多个评分者给一组测验结果评分,多个评分者给一组测验结果评分,所得分数之间的一致性程度。所得分数之间的一致性
9、程度。 2. 2. 计算计算如是两个评分者,则采用积差相关或等如是两个评分者,则采用积差相关或等级相关的方法。级相关的方法。如果是多个评分者,则采用如果是多个评分者,则采用肯德尔和谐肯德尔和谐系数来估计。系数来估计。 NNKNRRWii3222/12如有如有A A、B B、C C三位专家给三位专家给6 6位应聘者的面试评分,结位应聘者的面试评分,结果如下,试求评分者信度。果如下,试求评分者信度。 ABC175664529072603816354460604258475636969066 ABCRi154514222373454134666185332861113 =14+7+13+18+8+3
10、=63 =142+72+132+182+82+32=811 iR2iR由题意知由题意知 K=3, N=6, 将上述值代入公式有将上述值代入公式有: W= =0.95 如在评定中有相同的等级时,用下式校正。其中如在评定中有相同的等级时,用下式校正。其中n为为相同等级的个数相同等级的个数 6636/638111232212/1232222nnKNNKNRRWii小结:小结:重测信度:估计测验中跨时间的一致性重测信度:估计测验中跨时间的一致性复本信度:估计测验中跨形式的一致性复本信度:估计测验中跨形式的一致性稳定稳定-等值信度:估计测验中跨时间和形等值信度:估计测验中跨时间和形式的一致性式的一致性内
11、在一致性信度:估计测验中跨项目或内在一致性信度:估计测验中跨项目或两个分半测验的一致性两个分半测验的一致性评分者信度:估计测验中跨评分者的一评分者信度:估计测验中跨评分者的一致性致性分数分布范围分数分布范围 克莱克莱(Kelly)公式公式 例例测验的长度测验的长度测验的难度测验的难度221XExxSSr2211nooonnSrSr提高信度的常用方法为:提高信度的常用方法为:适当增加测验的长度适当增加测验的长度使所有题目的难度接近正态分布使所有题目的难度接近正态分布努力提高测题的区分度努力提高测题的区分度选取恰当的被试团体选取恰当的被试团体 评价测验评价测验 能力与成就测验能力与成就测验: 0.
12、90以上以上 人格测验人格测验: 0.80以上以上 自编学绩测验自编学绩测验: 0.60以上以上 解释个人测验分数的误差解释个人测验分数的误差 思考题思考题不同信度系数的适应范围不同信度系数的适应范围? ?影响测量信度的主要因素有哪些影响测量信度的主要因素有哪些? ?怎样提高测怎样提高测量信度?量信度?谈谈信度的定义谈谈信度的定义, ,其作用有哪些其作用有哪些? ?基本概念基本概念: :信度信度 重测信度重测信度 复本信度复本信度 内部内部一致性信度一致性信度 评分者信度评分者信度公式公式 计算计算参考文献参考文献对儿童认知发展水平诊断工具对儿童认知发展水平诊断工具IPDTIPDT的信的信度效
13、度检验度效度检验. .心理学报心理学报.2004.1.2004.1大学生心理压力感量表编制理论及信、大学生心理压力感量表编制理论及信、效度研究效度研究. .心理学探新心理学探新.2003.4.2003.4中学生中学生SCL-90SCL-90信度、效度检验及常模的信度、效度检验及常模的建立建立. . 中国心理卫生中国心理卫生.1999.1999年第年第1 1期期例 奇偶分半法如一个学生对如一个学生对1010道题回答为(正确答案道题回答为(正确答案标记为,错误答案标记为):标记为,错误答案标记为):1.1. 2.2. 3.3. 4.4. 5.5.6.6. 7.7. 8.8. 9.9. 10.10.
14、这个学生的总分为这个学生的总分为5 5分,分,3 3个奇数题正确,个奇数题正确,2 2个个偶数题正确。偶数题正确。 表表4.3 54.3 5名被试测验结果名被试测验结果被试被试奇数题得分奇数题得分偶数题得分偶数题得分A32B55C44D11E45BACK满足等值性时满足等值性时, ,使用使用斯皮尔曼布朗公式斯皮尔曼布朗公式( (Spearman-Brawn)Spearman-Brawn)不满足等值性时不满足等值性时, ,使用使用弗拉南根弗拉南根( (FlanaganFlanagan) )公式公式卢伦(卢伦(RulonRulon)公式)公式oeoeXXrrr12XXXXKKrKKrr) 1(1)
15、1 (2222xbaxxSSSr221tdttSSr表表4.4 4.4 初一学生地理成绩测验内在一致性信度系数计算表初一学生地理成绩测验内在一致性信度系数计算表 BACK1BACK2表表4.5 64.5 6个论文题目测验内在一致性信度系数计算表个论文题目测验内在一致性信度系数计算表 学生学生题目题目(K=6)总分总分XtX2t123456A34321417289B63454628784C13124416256D62215319361E53124217289总和总和211511121820971979平方和平方和1074731387490 首先计算测验总分的方差首先计算测验总分的方差再计算各题方
16、差的总和再计算各题方差的总和将有关数据代入将有关数据代入系数公式系数公式, ,则则2tS22NXNXtt259751979= 19.442222222520181211152159074383147107Si2= = 11.20)44.1920.111)(166(a= 0.51某态度量表共某态度量表共7 7题,题,100100个被试在各题上个被试在各题上得分的方差分别是得分的方差分别是0.81, 0.82, 0.79, 0.81, 0.82, 0.79, 0.83, 0.85, 0.76, 0.77,0.83, 0.85, 0.76, 0.77,测验总分的方测验总分的方差为差为14.0014.
17、00,试求该量表的,试求该量表的系数。系数。 =0.70BACK)1)(1(22tiSSKKa00.1477. 076. 085. 083. 079. 082. 081. 01177=表表2 1002 100题纯速度测验的结果题纯速度测验的结果 被试被试做题总数做题总数奇数题正确数奇数题正确数偶数题正确数偶数题正确数M M505025252525N N848442424242O O545427272727P P363618181818Q Q282814141414BACK克莱公式克莱公式如,一记忆力测验实施于某市全体初中生,如,一记忆力测验实施于某市全体初中生,其分数的标准差为其分数的标准差为
18、1010,信度系数为,信度系数为0.900.90,若,若将该测验施测于初二年级,其分数标准差为将该测验施测于初二年级,其分数标准差为6 6。求初二年级的信度系数估计值。求初二年级的信度系数估计值。 2211nooonnSrSr2211nooonnSrSr22690. 01101=0.72BACK测验测验A A:只有一道题:只有一道题:2+4=2+4= 测验测验B B:1+1=1+1= ;3+3=3+3= ;4+4=4+4= ;5-3=5-3= ;2+4=2+4= 等等3030道题。道题。表表4.10 4.10 测验长度与信度的关系测验长度与信度的关系 测量长度测量长度信度系数信度系数 测量长度
19、测量长度信度系数信度系数50.20 1600.89100.33 3200.94200.50 6400.97400.67 1.00800.80 如由如由5050题组成的儿童心理学测验,其信度题组成的儿童心理学测验,其信度系数为系数为0.720.72,若再增加,若再增加3030个与原测验难度个与原测验难度相近且同质性的题目,问长度增加后的测相近且同质性的题目,问长度增加后的测验系数是多少?验系数是多少?XXXXKKrKKrr) 1(172. 01503050172. 0503050KKr= 0.80如如, ,某一测验有某一测验有1212个项目,信度是个项目,信度是0.60,0.60,问问测验应增加
20、到多少个项目测验应增加到多少个项目, ,才能使信度达才能使信度达到到0.90?0.90? )1 (1kkxxxxkkrrrrK)60. 01 (60. 060. 0190. 0K612=72所以题目增加到所以题目增加到7272个个, ,才能满足要求才能满足要求 = 6 BACKxxxErSS1etSXXZ如果选用如果选用95%的可靠性要求(置信水平),的可靠性要求(置信水平),Z0.95=1.96,那么,真分数就有那么,真分数就有95%的可能性落在的可能性落在 的范围内,的范围内,即即etSX96. 1etSX96. 1etSX96. 1X95. 096. 196. 1tetXXSXP如,已知如,已知WISC-RWISC-R的标准差为的标准差为1515,信度系数为,信度系数为0.950.95,对一名对一名1212岁的儿童实施该测验后,岁的儿童实施该测验后,IQIQ为为110110,那么,那么他的真分数在他的真分数在95%95%的可靠度要求下,变动范围是多的可靠度要求下,变动范围是多大?大?xxxErSS135. 395. 0115=110tX35. 396. 111035. 396. 1110X103.4 116.6XBACKyyxxdrrSS2BACK