1、测量心理学串讲第一节概述第一节概述 1.测量就是依据一定的法则用数字对事物加以确定。该定义包括三个主要元素:事物;数字;法则。2.测量要素:参照点(绝对零点和相对零点)和单位(好的单位要:有确定的意义,有相同的价值)。3.量表是一个定有单位和参照点的连续体。4.根据量表的精确程度,可把量表从低级到高级分成四种水平:命名量表;顺序量表(既无相等单位又无绝对零点,数字仅表示等级。如学生的考试名次);等距量表(可以相互做加、减运算);等比量表。5.心理测验的性质 间接性;相对性;客观性。第一节概述第一节概述 6.心理测验的分类按测验的功能分:智力测验特殊能力测验人格测验(MMPI,16PF,EPQ,
2、罗夏测验,主题统觉测验)。按测验材料的性质分:文字测验操作测验。按测验材料的严谨程度分:客观测验投射测验。按测验的方式分:个别测验团体测验。按测验的要求分:最高作为测验典型行为测验。7.错误的测验观:测验万能论测验无用论心理测验即智力测验。8.正确的测验观:心理测验昌重要的心理研究方法之一,是决策的辅助工具心理测验作为研究方法和测量工具尚不完善。第一节概述第一节概述 9.在我国目前情况下,心理门诊中运用较多的大致有这样三类心理测验:智力测验、人格测验、心理评定量表。10.心理测验的产生和发展 记住三个人的名字:首先倡导心理测验的学者是英国生物学家和心理学家高尔顿。1890年,美国心理学家卡特尔
3、在心理杂志上发表心理测验与测量一文,这是心理测验第一次出现于心理学文献上。比内主张用一种测验的方法去辨别和发现智力落后的儿童,与助手西蒙发表量表,编制了世界上第一个正式的心理测验。心理测验主要以下几个方面的发展:操作测验的发展团体智力测验的发展 能力倾向测验的发展人格测验的发展。近些年来我国的心理学家正在致力于测验本土化,编制适合我国文化背景的智力测验、适应行为量表等。第二节测验的常模第二节测验的常模 1.常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。2.常模团体的条件:群体的构成必须明确界定 常模团体必须是所测群体的代表性样本 样本的大小要适当(一般最低不小于30
4、或100个;全国性常模,一般应有2000-3000人为宜)标准化样组是一定时空的产物。3.取样即从目标人群中选择有代表性的样本 简单随机抽样-随机号码表法系统抽样 分组抽样分层抽样第二节测验的常模第二节测验的常模 4.常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。5.发展顺序量表可以告诉人们儿童是正常、超前还是滞后。最早的一个范例是葛塞尔发展程序表。6.皮亚杰最著名的工作就是对守恒概念的研究(5质6重7容)。7.比内-西蒙量表中首先使用智力年龄(智龄)的概念。智龄的计算方法:基础年龄,即全部题目都通过的哪组题目所代表的年龄。例如在吴天敏修订的比-西量表中,每个
5、年龄都有6个题目,答对一题则得智龄2个月。第二节测验的常模第二节测验的常模 8.百分位常模:百分等级,百分点,四分位数,十分位数。百分等级(考):是指在常模样本中低于这个分数的人数百分比。85的百分等级表示在常模样本中有85%的人比这个分数要低。百分点(百分位数):百分点是计算处于某一百分比例的人对应的测验分数是多少,其计算可根据直线内插法进行。四分位数是将量表分为四等份,相当于百分等级的25%、50%、75%对应的四段。十分位数也可以依此类推:1%-10%为第一段。第二节测验的常模第二节测验的常模 9.标准分常模 是将原始分数与平均数的距离认标准差为单位表示出来的量表。因为它的基本单位是标准
6、差,所以叫标准分数。常见的标准分数有:z分数、Z分数、T分数、标准九分、离差智商(IQ)等。线性转换的标准分数 由于在z分数中经常出现小数点和负数,通常把它转换为Z分数:Z=A+BZ A 、B为根据需要指定的常数。加上一个常数是为了去掉负值,乘以一个常数是为了使单位变小从而去掉小数点。非线性转换的标准分数第二节测验的常模第二节测验的常模标准分平均分标准差公式T分数5010T5010z标准九分52标准十分51.5标准二十103离差智商10015IQ10015z第二节测验的常模第二节测验的常模10.智商及其意义 比率智商:比率智商IQ被定义为心理年龄MA与实足年龄CA之比,乘100为避免小数。即I
7、Q=MA/CA*100(MA:心理年龄,CA:实足年龄)韦克斯勒将离差智商的平均数定为100,标准差定为15:IQ=100+15z=100+15(x-x)/SD (SD表示这一年龄水平被试的量表分数的标准差)从不同测验获得的离差智商,只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。11.最简单而且最基本的表示常模的方法就是转换表,有时也叫常模表。12.剖面图是将测验分数的转换关系用图形表示出来,可以很直观的看出被试在各个分测验上的表现及其相对的位置。第三节测验的信度第三节测验的信度 1.信度的定义信度是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结
8、果的一致性程度。在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差(实得分数的方差)的比率。信度也可以看作在总方差中非测量误差的方差所占的比例,只受随机误差的影响。2.信度的评估类型与方法重测信度:又称稳定性系数,它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。第三节测验的信度第三节测验的信度复本信度:又称等值性系数,它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数,这个相关系数就代表
9、了复本信度的高低。如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数。内部一致性信度 分半信度:分半法经常会低估信度,必须修正,借以估计整个测验的信度。其中常用的修正公式是斯皮尔曼-布朗公式 同质性信度:代表测验内部所有题目间的一致性。评分者信度:用于测量不同评分者之间所产生的误差。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。第三节测验的信度第三节测验的信度 3.信度与测验分数的解释确定信度可以接受的水平(记数据),一般原则是:当rxx 0.70时,测验不能用;当 0.70 rxx 0.85时,可用于团体比较;当rxx 0.85时,才能用来鉴
10、别或预测个人成绩或作为。解释个人分数的意义:从信度可以解释个人分数的意义,这就是测量标准误的应用。它有两个作用:估计真实分数的范围:了解实得分数再测时可能的变化情形:比较不同测验分数的差异第三节测验的信度第三节测验的信度4.影响信度的因素 样本团体异质性的影响:获得信度的取样团体较为异质的话,往往会高估测验的信度。测验长度:测验越长,测验的测题取样或内容取样就越有代表性;被试的猜测因素影响就越小。要注意:增加测验长度的效果应遵循报酬递减率原则,测验过长是得不偿失的,有时反而会引起被试的疲劳和反感而降低可靠性。测验难度:洛德提出在学绩测验中,为了保持其可靠性,各类选择题的理想平均难度为:五择一,
11、0.70;四择一,0.74;三择一,0.77;是非题,0.85.时间间隔:以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大。第四节测验的效度第四节测验的效度1.效度的定义在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与总方差的比率。信度和效度的关系 信度是效度的必要而非充分条件;效度是受信度制约的。2.效度的性质:在评鉴测验的效度时,必须考虑其目的与功能。第四节测验的效度第四节测验的效度 3.效度分类与评估方法 一、内容效度:也称逻辑效度,指的是
12、测验题目对有关内容或行为取样的适用性;从而确定测验是否是所要测量的行为领域的代表性取样。这种测验的效度主要与测验内容有关,所以称内容效度。内容效度的评估方法 专家判断法统计分析法经验推测法第四节测验的效度第四节测验的效度 二、构想效度:也叫构思效度、结构效度。它主要涉及的是心理学的理论概念问题,是指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。构想效度的评估方法:对测验本身的分析:测验间的相互比较效标效度的研究证明实验法和观察法证实第四节测验的效度第四节测验的效度 三、效标效度:又称实证效度,反映的是测验预测个体在某种情境下行为
13、表现的有效性程度。被预测的行为是检验效度的标准,简称效标。分为同时效度和预测效度两类。效标效度的评估方法:相关法区分法命中率法第四节测验的效度第四节测验的效度 4.效度的功能之一-预测误差:效度系数的实际意义常常以决定性系数来表示,意指相关系数的平方,它表示测验正确预测或解释的效标的方差占总方差的比例。5.影响效度的因素测验本身的影响:要保证测验具有较高效度,要做好以下几点:测验材料必须对整个内容有代表性;测题设计时应尽量避免容易引起误差的题型;测题难度要适中,具有较高的区分度;测验长度要恰当,即要有一定的测题量;测题的排列按先易后难顺序。测验实施中的干扰因素:主试的影响因素;被试的影响因素;
14、测验情境;其他干扰因素。样本团体的性质:样本团体越同质,测验效度就越低。干涉变量也会影响效度。效标的信度第五节项目分析第五节项目分析 1难度,指项目的难易程度。通常以通过率表示,即以答对或通过该题的人数百分比来表示:P=R/N100%(P代表项目的难度,N代表群体被试者人数,R为答对或通过该项目的人数)以通过率表示难度时,通过人数越多,难度越低。2P值越接近于0.50,区别力越高,即难度在0.50左右的试题比较合适,各题难度在0.50 0.20之间。3.项目区分度,也叫鉴别力,是指测验项目对被试的心理特性的区分能力。区分度取值范围介于1到1之间。第五节项目分析第五节项目分析 4.项目区分度的计
15、算方法 鉴别指数:D=PHPL为鉴别指数,PH为高分组在该项目上的通过率或得分率,PL为低分组在该项目上的通过率或得分率。相关法 点二列相关:点二列相关法适用于一类变量为二分称名变量,另一类变量为连续变量的成对变量的相关计算。二列相关:二列相关适用于两个连续变量,但其中一个变量被人为分成两类。相关法此种相关适用于两个变量均为二分称名变量。5.区分度与难度的关系:一般来说,较难的项目对高水平的被试区分度高,较易的项目对水平低的被试区分度高,中等难度的项目对中等水平的被试区分度高。第六节第六节 测验编制的一般程序测验编制的一般程序 1.测验的用途分两类:显示和预测。2.工作分析及步骤:工作分析:对
16、于选拔和预测功用的预测性测验,它的主要任务就是要对所预测的行为活动作具体分析,称为工作分析。这种分析包括两个步骤:确定哪些心理特征和行为可以使要预测活动达到成功。建立衡量被试是否成功的标准。3.测验题目的来源可分为三个方面:已出版的标准测验理论和专家的经验临床观察和记录 4.命题的一般原则内容方面要符合测验的目的文字方面语句要简明扼要理解方面不要使人误解社会敏感性方面尽量避开 5.试题的排列方式并列直进式;混合螺旋式第七节 心理测验的使用1.主试的资格要求:知识结构;专业理论知识和专业技能;职业道德(测验的保密和控制使用;测验中个人隐私的保护)。2.对被试的指导语一般包括:如何选择反应形式;如何记录这些反应;时间限制;是否允许猜测;例题;有时告知被试测验的目的。3.大多数典型行为测验是不受时间限制的。第七节 心理测验的使用4.练习效应的具体表现有:教育背景较差或智力较高者,受练习效应的影响较大;着重速度的测验,练习效应较为明显;重复实施相同的测验,影响程度大于复本测验;两次测验之间的时距越大,练习效应越小。5.反应定势一般表现为:求快与求精确;喜好正面叙述;喜好特殊位置;喜好较长选项;猜测。6.对测验结果进行分析时要注意:不能把分数绝对化,更不能仅仅根据一次测验的结果轻易下结论。