1、心理测量学理论(“测验”有关文档)共163张关于测量关于测量物理测量:长度、重量、面积、速度等。物理测量:长度、重量、面积、速度等。生理测量:生理测量:生化成分、生理机能等。生化成分、生理机能等。社会测量:人口普查、经济统计、民意调查等。社会测量:人口普查、经济统计、民意调查等。心理测量:智力、人格、成就、职业兴趣、态度等。心理测量:智力、人格、成就、职业兴趣、态度等。在心理咨询与治疗过程中,无论是临床诊断,在心理咨询与治疗过程中,无论是临床诊断,还是疗效评估,心理测量都是重要的手段。因还是疗效评估,心理测量都是重要的手段。因此,心理咨询师有必要了解心理测量的理论与此,心理咨询师有必要了解心理
2、测量的理论与技术。技术。第一节第一节 概述概述第二节第二节 测验的常模测验的常模 第三节第三节 测验的信度测验的信度第四节第四节 测验的效度测验的效度第五节第五节 项目分析项目分析第六节第六节 测验编制的一般程序测验编制的一般程序第七节第七节 心理测验的使用心理测验的使用第一节第一节 概概 述述第第1 1单元单元 测量与测量量表测量与测量量表 第第2 2单元单元 心理测量的基本概念心理测量的基本概念 第第3 3单元单元 心理测验的分类心理测验的分类 第第4 4单元单元 纠正错误的测验观纠正错误的测验观第第5 5单元单元 心理测验在心理咨询中的应用心理测验在心理咨询中的应用 第第6 6单元单元心
3、理测量的发展史心理测量的发展史第一单元第一单元 测量与测量量表测量与测量量表一、什么是测量一、什么是测量测量就是依据一定的法则用数字对事物加以确定。测量就是依据一定的法则用数字对事物加以确定。测量包括测量包括3 3个元素:事物、数字与法则。个元素:事物、数字与法则。事物:就是我们要测量的对象。事物:就是我们要测量的对象。数字:代表某一事物或该事物某一属性的量。数数字:代表某一事物或该事物某一属性的量。数字具有区分性、序列性、等距性和可加性。字具有区分性、序列性、等距性和可加性。法则:是指测量所依据的规则和方法。法则:是指测量所依据的规则和方法。二、测量要素二、测量要素任何测量都具有两个要素:参
4、照点和单位任何测量都具有两个要素:参照点和单位(一)参照点(一)参照点要确定事物的量,必须有一个计算的起点,这个起点就叫参照点。要确定事物的量,必须有一个计算的起点,这个起点就叫参照点。参照点有两种:一是绝对零点参照点有两种:一是绝对零点(重量、长度重量、长度);二是相对零点(人为确定的参照点,如温度、;二是相对零点(人为确定的参照点,如温度、海拔高度)。海拔高度)。(二)单位(二)单位单位是测量的基本要求,没单位就无法进行测量。单位是测量的基本要求,没单位就无法进行测量。好的单位必须具备两个条件:一是有确定的意义(好的单位必须具备两个条件:一是有确定的意义(cmcm、kgkg);二是有相同的
5、价值();二是有相同的价值(1cm-2cm-1cm-2cm-3cm3cm)。)。年年5 5月多选题:月多选题:任何测量都应该具备的要素是任何测量都应该具备的要素是()()(A)(A)量表量表(B)(B)参照点参照点(C)(C)等级等级(D)(D)单位单位(BDBD)斯蒂文斯将测量从低级到高级分成四种水平,即斯蒂文斯将测量从低级到高级分成四种水平,即命名量表、顺序量表、等距量表和等比量表。命名量表、顺序量表、等距量表和等比量表。(一)命名量表一)命名量表 命名量表是测量水平最低的一种量表,只是用数字来代表事物命名量表是测量水平最低的一种量表,只是用数字来代表事物或把事物归类。或把事物归类。可分为
6、两种:可分为两种:代号:用数字来代表个别事物,如学生和运动员的编号等。代号:用数字来代表个别事物,如学生和运动员的编号等。类别:用数字来代表具有某种属性的事物的全体,如用类别:用数字来代表具有某种属性的事物的全体,如用1 1代表男、用代表男、用2 2代表女,或用不同数字代表不同职业等。代表女,或用不同数字代表不同职业等。命名量表的命名量表的特点:无大小之分、无零点、无单位、不能运算特点:无大小之分、无零点、无单位、不能运算(二)顺序量表(二)顺序量表 顺序量表顺序量表比命名量表水平高,其中的数字不仅指明比命名量表水平高,其中的数字不仅指明类别,同时也指明类别的大小或含有某种属性的程类别,同时也
7、指明类别的大小或含有某种属性的程度。如:考试名次、工资级别等,主要用于分等级度。如:考试名次、工资级别等,主要用于分等级或排出顺序。或排出顺序。特点:无相等单位、无绝对零点、特点:无相等单位、无绝对零点、数字仅表示数字仅表示等级等级、不能运算、不能运算。(三)等距量表(三)等距量表 特点:有大小关系、有相等单位特点:有大小关系、有相等单位,数值可以进行加,数值可以进行加减运算,由于没有绝对零点,不能做乘除运算。减运算,由于没有绝对零点,不能做乘除运算。比如,比如,0C温度温度并不意味着没有温度。并不意味着没有温度。(四)等比量表(四)等比量表 等比量表是最高水平的量表。等比量表是最高水平的量表
8、。特点:有相等的单位,有绝对零点、特点:有相等的单位,有绝对零点、其数值可其数值可以进行加、减、乘、除运算。以进行加、减、乘、除运算。如:长度、重量、时间如:长度、重量、时间等。等。一般来说,心理测量是在顺序量表上进行的,一般来说,心理测量是在顺序量表上进行的,因为对于人的智力、性格、兴趣、态度等来说因为对于人的智力、性格、兴趣、态度等来说,绝对零点是难以确定的。,绝对零点是难以确定的。一、心理测量的定义一、心理测量的定义 所谓心理测量,就是依据心理学理论,使用一定的所谓心理测量,就是依据心理学理论,使用一定的操作程序,通过观察人的少数操作程序,通过观察人的少数有代表性的行为有代表性的行为,对
9、,对于贯穿在人的全部行为活动中的心理特点做出推论于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。和数量化分析的一种科学手段。(应对问卷:(应对问卷:10.10.常常喜欢找人聊天以减轻烦恼常常喜欢找人聊天以减轻烦恼)年年5 5月单选题:月单选题:心理测验的行为样本必须具有心理测验的行为样本必须具有()()。A A、全国性、全国性B B、区域性、区域性C C、代表性、代表性D D、整群性、整群性 (C)(C)(一)间接性(一)间接性(通过外显行为推论心理特质)(通过外显行为推论心理特质)(二)相对性(二)相对性(如智力高低、兴趣大小)(如智力高低、兴趣大小)(三)客观性(三
10、)客观性 心理测量的客观性实际上就是测验的标准化问题,包括:心理测量的客观性实际上就是测验的标准化问题,包括:测验的刺激是客观的测验的刺激是客观的对反应的量化是客观的对反应的量化是客观的对结果的推论是客观的对结果的推论是客观的 一、按测验的功能分类一、按测验的功能分类(一)智力测验(一)智力测验 是对一般能力的测验(观察力、记忆力、想象力、思维力、注意力),比如:比内是对一般能力的测验(观察力、记忆力、想象力、思维力、注意力),比如:比内-西蒙西蒙智力测验、韦克斯勒智力量表。智力测验、韦克斯勒智力量表。(二)特殊能力测验(二)特殊能力测验 如音乐、绘画等才能的测验。如音乐、绘画等才能的测验。(
11、三)人格测验(三)人格测验 用于测量性格、气质、兴趣、情绪、动机、信念等,如用于测量性格、气质、兴趣、情绪、动机、信念等,如16PF。21.21.我对于人或物的兴趣都很容易改变我对于人或物的兴趣都很容易改变:A.A.是的是的 B.B.介乎介乎A A与与C C之间之间 C.C.不是的不是的二、按测验材料的性质分类二、按测验材料的性质分类(一)文字测验(一)文字测验(二)操作测验(非文字测验)(二)操作测验(非文字测验)三、按测验材料的严谨程度分类三、按测验材料的严谨程度分类(一)客观测验(一)客观测验(二)投射测验(二)投射测验 包括罗夏墨迹测验、主题统觉测验、自由联想包括罗夏墨迹测验、主题统觉
12、测验、自由联想测验、句子完成测验等。测验、句子完成测验等。夏墨迹测验夏墨迹测验主题统觉测验主题统觉测验四、按测验的方式分类四、按测验的方式分类(一)个别测验(一)个别测验(二)团体测验(二)团体测验五、按测验的要求分类五、按测验的要求分类(一)最高行为测验(智力测验、成就测验)(一)最高行为测验(智力测验、成就测验)(二)典型行为测验(人格测验)(二)典型行为测验(人格测验)第四单元第四单元 纠正错误的测验观纠正错误的测验观一、错误的测验观一、错误的测验观(一)测验万能论(一)测验万能论(二)测验无用论(二)测验无用论(三)心理测验即智力测验(三)心理测验即智力测验二、正确的测验观二、正确的测
13、验观(一)心理测验是重要的心理学研究方法之一,是决(一)心理测验是重要的心理学研究方法之一,是决策的辅助工具。策的辅助工具。(二)心理测验作为研究方法和测量工具尚不完善。(二)心理测验作为研究方法和测量工具尚不完善。目前,在我国心理门诊中运用较多的大致有目前,在我国心理门诊中运用较多的大致有3 3类类心理测验:心理测验:智力测验智力测验 人格测验人格测验 心理评定量表(精神病评定量表、抑郁量表等)心理评定量表(精神病评定量表、抑郁量表等)心理测验在心理咨询与治疗过程中并不是必不可少的,如果通过心理测验在心理咨询与治疗过程中并不是必不可少的,如果通过与来访者的交谈,对其问题已形成明确的看法,就应
14、放弃不必要与来访者的交谈,对其问题已形成明确的看法,就应放弃不必要的心理测验。的心理测验。一、科学心理测验的产生与发展一、科学心理测验的产生与发展 首先倡导科学心理测验的学者是英国生物学家和首先倡导科学心理测验的学者是英国生物学家和心理学家高尔顿,他提出人的不同气质特点和智心理学家高尔顿,他提出人的不同气质特点和智能是按身体特点的不同而遗传的。为了研究个体能是按身体特点的不同而遗传的。为了研究个体差异的遗传性,他设计了测量差异的方法,为心差异的遗传性,他设计了测量差异的方法,为心理测验奠定了统计学基础。他第一个提出了理测验奠定了统计学基础。他第一个提出了相关相关的概念。(价值观与幸福感的关系)
15、的概念。(价值观与幸福感的关系)年年11月单选题:月单选题:首先倡导科学心理测验的学者是首先倡导科学心理测验的学者是()。A、比内、比内B、高尔顿、高尔顿C、卡特尔、卡特尔D、皮尔逊、皮尔逊 (B)另一位对促进心理测验发展做出巨大贡献的是另一位对促进心理测验发展做出巨大贡献的是 心理学家卡特尔,他于心理学家卡特尔,他于18901890年在心理杂志上年在心理杂志上发表发表“心理测验与测量心理测验与测量”一文,这是心理测验第一文,这是心理测验第一次出现于心理学文献中。他强调:一次出现于心理学文献中。他强调:“心理学若心理学若不立足于实验与测量上,绝不能够有自然科学之不立足于实验与测量上,绝不能够有
16、自然科学之准确性。准确性。”、“心理测验如果有一个普遍的标准心理测验如果有一个普遍的标准,则其科学的与实用的价值都可以增加。,则其科学的与实用的价值都可以增加。”法国心理学家法国心理学家与助手与助手于于19051905年发表了年发表了题为题为“诊断儿童智力的新方法诊断儿童智力的新方法”的文章,介绍的文章,介绍了一个包括了一个包括3030个项目的量表,这个量表是世界个项目的量表,这个量表是世界上第一个正式的心理测验。上第一个正式的心理测验。2020世纪以后,心理测验主要有四个方面的发展:世纪以后,心理测验主要有四个方面的发展:1 1、操作测验的发展、操作测验的发展(尤其适用于不识字者)(尤其适用
17、于不识字者)2 2、团体智力测验的发展、团体智力测验的发展(用于官兵选拔和分派兵种)(用于官兵选拔和分派兵种)3 3、能力倾向测验的发展、能力倾向测验的发展(韦克斯勒智力量表)(韦克斯勒智力量表)4 4、人格测验的发展、人格测验的发展(MMPIMMPI、16PF16PF、EPQEPQ等)等)二、现代心理测验在我国的发展二、现代心理测验在我国的发展 我国近代心理测验大约源于我国近代心理测验大约源于19141914年前后。年前后。近年来,我国心理学家正在致力于心理测验的近年来,我国心理学家正在致力于心理测验的本土化本土化,编制适合我国文化背景的智力测验、,编制适合我国文化背景的智力测验、适应行为量
18、表等。适应行为量表等。(王登峰:大七人格)(王登峰:大七人格)第一单元第一单元 常模团体常模团体第二单元第二单元 常模的类型常模的类型第三单元第三单元 常模分数的表示方法常模分数的表示方法 什么是常模?什么是常模?常模是指一定人群在测验常模是指一定人群在测验上的上的。常模,就是常人的样子。常模,就是常人的样子。补充:常模参照与标准参照补充:常模参照与标准参照采用采用分数解释的测验:如律师资格考试,即使大家考试都考得特别分数解释的测验:如律师资格考试,即使大家考试都考得特别好,也只取前面的百分之几。好,也只取前面的百分之几。采用采用分数解释的测验:如心理咨询师资格的考试,包括基础理分数解释的测验
19、:如心理咨询师资格的考试,包括基础理论和操作技能,满分都是一百,六十分及格。两科都满论和操作技能,满分都是一百,六十分及格。两科都满6060,就能通过。,就能通过。通过与不通过,参照一个事先设定好的标准来解释分数,就叫做标准参照分数通过与不通过,参照一个事先设定好的标准来解释分数,就叫做标准参照分数解释。解释。一、常模团体的性质一、常模团体的性质 常模团体是由具有某种共同特征的人所组成的常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。一个群体,或者是该群体的一个样本。对测验编制者而言,在确定常模团体时,需要对测验编制者而言,在确定常模团体时,需要先确定一般总体,再确定
20、目标总体,最后确定先确定一般总体,再确定目标总体,最后确定样本。样本。二、常模团体的条件二、常模团体的条件(一)群体的构成必须明确界定(一)群体的构成必须明确界定(性别、年龄、职业(性别、年龄、职业)(二)常模团体必须是所测群体的代表性样本(二)常模团体必须是所测群体的代表性样本(三)样本的大小要适当(三)样本的大小要适当 在实际工作中,应从经济、实用和减少误差两方面来综合考虑样本的大小。如果总体在实际工作中,应从经济、实用和减少误差两方面来综合考虑样本的大小。如果总体数目大,样本一般最低不小于数目大,样本一般最低不小于3030或或100100个。全国性常模,一般应有个。全国性常模,一般应有2
21、000-30002000-3000人为宜。人为宜。(四)标准化样组是一定时空的产物(四)标准化样组是一定时空的产物/具有新近性具有新近性 年年1111月多选题:月多选题:常模团体的条件有常模团体的条件有()()。A A、群体构成明确、群体构成明确B B、样本具有代表性、样本具有代表性C C、样本大小适当、样本大小适当D D、具有新近性、具有新近性 (ABCD)(ABCD)这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。由于人的大多数心理特性呈常态分布,所以项目难度的分布也以常态分布为好,即特别难与特别易的项目少些,接近中等难度的项目多些,使所有项目的平均难度为050。这就是说,大
22、约有95%的可能性真分数落在所得分数的范围内,或有5%的可能性落在范围之外。常用作特殊能力测验的中间效标(1)相容效度是构思效度的一个证据。(二)相对性(如智力高低、兴趣大小)b、接受测验的团体的特点。人的许多心理特质,如智力、技能等,是随着时间有规律地发展的,因此可以将个人的成绩与各种发展水平的人的平均表现相比较。评分者信度用于测量不同评分者之间所产生的误差。因此,85的百分等级表示在常模样本中有85%的人比这个分数要低。测量的效度除受随机误差影响外,还受系统误差的影响。如在韦氏智力测验中,通常是用测得的IQ值加减5(可信限水平 85%90%)的方法判断IQ值的波动范围,若测得某被试的IQ值
23、为105时,他的IQ便在100110的范围内变化。离差智商是一种以年龄组为样本计算而得到的标准分数,为使其与传统的比率智商基本一致,韦克斯勒将离差智商的平均数定为100,标准差定为15。效标必须能最有效地反映测验的目标,即效标测量本身必须有效;常模资料,包括常模表、常模适用的团体及对测验分数如何做解释。最常用的方法是请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。取样就是从取样就是从目标人群目标人群中选择有代表性的样本。中选择有代表性的样本。取样方法有:取样方法有:(一)简单随机抽样(一)简单随机抽样(二)系统抽样(二)系统抽样(三)分组抽样(三)分组抽样(四)
24、分层抽样(四)分层抽样简单随机抽样就是按照简单随机抽样就是按照随机表随机表顺序选择受测者构成样本,或顺序选择受测者构成样本,或者将抽样范围内的每个人或每个抽样单位进行编号,再随机者将抽样范围内的每个人或每个抽样单位进行编号,再随机选择。(随机表选择。(随机表=乱数表)乱数表)系统抽样又称系统抽样又称等距抽样等距抽样,就是将已编好号码的个体排成顺序,就是将已编好号码的个体排成顺序,然后每隔若干个号码抽取一个。然后每隔若干个号码抽取一个。分组抽样是先将群体进行分组,再在组内进行随机取样。分组抽样是先将群体进行分组,再在组内进行随机取样。分层抽样是先将目标总体按某种变量(如年龄、性别等)分成若干分层
25、抽样是先将目标总体按某种变量(如年龄、性别等)分成若干层次,再从各层次中抽取若干受测者,最后把各层的受测者组合成层次,再从各层次中抽取若干受测者,最后把各层的受测者组合成常模样本。常模样本。四、常模与常模分数四、常模与常模分数(一)常模(一)常模常模是一种供比较的标准量数,是心理测验时用于比较和解释测验结果的参常模是一种供比较的标准量数,是心理测验时用于比较和解释测验结果的参照分数标准。照分数标准。按照样本大小和来源,常模可分为全国常模、区域常模和特殊常模。按照样本大小和来源,常模可分为全国常模、区域常模和特殊常模。(二)常模分数(二)常模分数常模分数就是施测常模样本后,将受测者的原始分数按一
26、定规则转换出来的导出分数常模分数就是施测常模样本后,将受测者的原始分数按一定规则转换出来的导出分数。导出分数具有一定的参照点和单位,是一个有意义的测验量表,与原始导出分数具有一定的参照点和单位,是一个有意义的测验量表,与原始分数等值,可以进行比较。分数等值,可以进行比较。一、发展常模一、发展常模 人的许多心理特质,如智力、技能等,是随着时人的许多心理特质,如智力、技能等,是随着时间有规律地发展的,因此可以将个人的成绩与各间有规律地发展的,因此可以将个人的成绩与各种发展水平的人的种发展水平的人的平均表现平均表现相比较。根据这种平相比较。根据这种平均表现所制成的量表就是发展常模,亦称均表现所制成的
27、量表就是发展常模,亦称年龄量年龄量表表。在年龄量表中,个人的分数表明他的行为按。在年龄量表中,个人的分数表明他的行为按正常途径发展处于什么样的发展水平。正常途径发展处于什么样的发展水平。(一)发展顺序量表(一)发展顺序量表 发展顺序量表发展顺序量表告诉人们多大的儿童具备什么能告诉人们多大的儿童具备什么能力或行为就表明其发育力或行为就表明其发育正常正常,相应能力或行为,相应能力或行为早于某年龄出现,说明发育早于某年龄出现,说明发育超超前,否则即为发前,否则即为发育育滞后滞后。(三翻六坐九爬)(三翻六坐九爬)发展顺序量表发展顺序量表最早的一个范例是格塞尔发展程序最早的一个范例是格塞尔发展程序表,按
28、月份显示儿童在运动水平、适应性、语表,按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。言、社会性四个方面的大致发展水平。在儿童发展方面,瑞士心理学家皮亚杰最著名在儿童发展方面,瑞士心理学家皮亚杰最著名的工作就是对守恒概念的研究。皮亚杰发现,的工作就是对守恒概念的研究。皮亚杰发现,儿童在不同时期出现不同的守恒概念,通常儿儿童在不同时期出现不同的守恒概念,通常儿童到童到5 5岁时才会理解质量守恒(橡皮泥);岁时才会理解质量守恒(橡皮泥);6 6岁岁时才会掌握重量守恒(杯中水);时才会掌握重量守恒(杯中水);7 7岁时才具有岁时才具有容量守恒概念。容量守恒概念。(二)智力年龄(
29、二)智力年龄比内比内-西蒙量表中首先使用西蒙量表中首先使用智力年龄智力年龄的概念。的概念。一个儿童在年龄量表上所得的分数,就是最能代表他智力水平的年龄。这种分一个儿童在年龄量表上所得的分数,就是最能代表他智力水平的年龄。这种分数叫做智力年龄,简称智龄。数叫做智力年龄,简称智龄。计算方法:计算方法:在吴天敏修订的比内在吴天敏修订的比内-西蒙量表中西蒙量表中,每个年龄都有每个年龄都有6 6个测题个测题,答对每题则得智龄答对每题则得智龄2 2个个月。假如某儿童月。假如某儿童6 6岁组的题目全部通过,岁组的题目全部通过,7 7岁组通过岁组通过4 4题,题,8 8岁组通过岁组通过3 3题,题,9 9岁组
30、通岁组通过过2 2题,其智龄为:题,其智龄为:6 6(岁)(岁)+4+42 2(月)(月)+3+32 2(月)(月)+2+22 2(月)(月)=6=6岁岁+18+18月月=7=7岁岁6 6个月。个月。(三)年级当量(三)年级当量年级当量实际上就是年级量表,测验结果说明属哪一年级的水年级当量实际上就是年级量表,测验结果说明属哪一年级的水平,在教育成就测验中最常用。平,在教育成就测验中最常用。其表达方式常是:某学生的算术是其表达方式常是:某学生的算术是6 6年级水平,阅读是年级水平,阅读是4 4年级水平年级水平、理解是、理解是5 5年级的水平。如常模样本中年级的水平。如常模样本中6 6年级的算术平
31、均分为年级的算术平均分为3535,某儿童在算术测验中也得某儿童在算术测验中也得3535分,那么,该儿童的算术能力是分,那么,该儿童的算术能力是6 6年年级水平。级水平。二、百分位常模二、百分位常模 百分位常模包括百分等级和百分点、四分位数和百分位常模包括百分等级和百分点、四分位数和十分位数。十分位数。(一)百分等级(一)百分等级 是应用最广的表示测验分数的方法。是应用最广的表示测验分数的方法。一个测验分数的百分等级是指在常模样本中一个测验分数的百分等级是指在常模样本中低于低于这个分数的人的百分比。因此,这个分数的人的百分比。因此,8585的百分等级表的百分等级表示在常模样本中有示在常模样本中有
32、85%85%的人比这个分数要低。的人比这个分数要低。(二)百分点(二)百分点也叫百分位数,是计算处于某一百分比例的人对应的测验也叫百分位数,是计算处于某一百分比例的人对应的测验分数是多少。分数是多少。在分数量表上,相对于某一百分等级的分数点就叫百分点在分数量表上,相对于某一百分等级的分数点就叫百分点或百分位数。或百分位数。在实际应用中,一般既可以由原始分数计算百分等级,也可以在实际应用中,一般既可以由原始分数计算百分等级,也可以由百分等级确定原始分数。通过这样的双向方式编制的原始分由百分等级确定原始分数。通过这样的双向方式编制的原始分数与百分等级对照表,就是百分位常模。数与百分等级对照表,就是
33、百分位常模。(三)四分位数和十分位数(三)四分位数和十分位数四分位数和十分位数只是百分位数的两个变式,其含义相四分位数和十分位数只是百分位数的两个变式,其含义相似。似。百分位数是将量表分成百分位数是将量表分成100100份份,而四分位数是将量分成四等份而四分位数是将量分成四等份,相当于百分等级的相当于百分等级的25%25%、50%50%和和75%75%对应的三个百分点分成的四段对应的三个百分点分成的四段。十分位数也可以依此类推出,十分位数也可以依此类推出,1%-10%1%-10%为第一段,为第一段,91%-100%91%-100%为第十为第十段。段。三、标准分常模三、标准分常模 标准分常模是将
34、原始分数与平均数的距离以标准分常模是将原始分数与平均数的距离以为单位表示出来的量表。因为它的基本单位是标准为单位表示出来的量表。因为它的基本单位是标准差,所以叫差,所以叫标准分数标准分数。(标准差:各数据偏离平均数的距离的平均数。)(标准差:各数据偏离平均数的距离的平均数。)标准分数可通过标准分数可通过线性转换线性转换,也可通过,也可通过非线性转换非线性转换得得到。到。(一)线性转换的标准分数(一)线性转换的标准分数z z分数是典型的线性转换的标准分数,原始分转换为标准分数的公式:分数是典型的线性转换的标准分数,原始分转换为标准分数的公式:z=(X-X)/SDz=(X-X)/SD 其中,其中,
35、X X为任一原始分数,为任一原始分数,X X为样本平均数,为样本平均数,SDSD为样本标准差。为样本标准差。由于由于z z分数中经常出现小数点和负数,且单位过大,计算和使用不分数中经常出现小数点和负数,且单位过大,计算和使用不方便,因此通常将方便,因此通常将z z分数转换为:分数转换为:Z=A+BzZ=A+Bz 其中,其中,Z Z为转换后的标准分数,为转换后的标准分数,A A、B B为根据需要指定的常数。加上一个为根据需要指定的常数。加上一个常数是为了去掉常数是为了去掉负值负值,乘以一个常数是为了使单位变小从而去掉小,乘以一个常数是为了使单位变小从而去掉小数点。数点。常见的标准分数有:常见的标
36、准分数有:T T分数、标准九分、标准分数、标准九分、标准十分、标准二十分、离差智商等。十分、标准二十分、离差智商等。T T 分数是以分数是以5050为平均数,以为平均数,以1010为标准差;标准为标准差;标准九分是以九分是以5 5为平均数,以为平均数,以2 2为标准差;标准十分为标准差;标准十分是以为平均数,以为标准差;标准二十分是以是以为平均数,以为标准差;标准二十分是以1010为平均数,以为平均数,以3 3为标准差;使用最广、影响最为标准差;使用最广、影响最大的离差智商是以大的离差智商是以100100为平均数,以为平均数,以1515为标准差为标准差。(二)非线性转换的标准分数(二)非线性转
37、换的标准分数 当原始分数不是常态分布时,也可以通过非线当原始分数不是常态分布时,也可以通过非线性转换使之常态化。常态化过程主要是将原始性转换使之常态化。常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常分数转化为百分等级,再将百分等级转化为常态分布上相应的标准分数。态分布上相应的标准分数。在比内在比内-西蒙智力测验中,是用西蒙智力测验中,是用“心理年龄心理年龄”来表来表示智力高低。若一个儿童心理年龄高于其生理年龄示智力高低。若一个儿童心理年龄高于其生理年龄,则智力较一般儿童高;如果心理年龄低于其生理,则智力较一般儿童高;如果心理年龄低于其生理年龄年龄,则智力较一般儿童低。但在使用中
38、发现,单则智力较一般儿童低。但在使用中发现,单纯用心理年龄来表示智力高低的方法缺乏不同年龄纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性。于是提出了比率智商和离差智商儿童间的可比性。于是提出了比率智商和离差智商。(一)比率智商(一)比率智商(IQIQ)比率智商被定义为心理年龄比率智商被定义为心理年龄(MA)(MA)与实足年龄与实足年龄(CA)(CA)之比。为避免小数之比。为避免小数,将商数乘以将商数乘以100100,公式公式为:为:IQ=MA/CAIQ=MA/CA100100 由于个体智力增长是一个由快到慢再到停止的由于个体智力增长是一个由快到慢再到停止的过程,即心理年龄与实足年龄
39、并不同步增长过程,即心理年龄与实足年龄并不同步增长,所所以比率智商并不适合于年龄较大的被试。以比率智商并不适合于年龄较大的被试。(IQ=MA/CA100=20/40100=50)(二)离差智商(二)离差智商离差智商是一种以年龄组为样本计算而得到的标准分数离差智商是一种以年龄组为样本计算而得到的标准分数,为使为使其与传统的比率智商基本一致其与传统的比率智商基本一致,韦克斯勒将离差智商的平均数定韦克斯勒将离差智商的平均数定为为100,100,标准差定为标准差定为1515。所以离差智商建立在统计学的基础上。所以离差智商建立在统计学的基础上,表表示的是个体智力在年龄组中所处的位置示的是个体智力在年龄组
40、中所处的位置,因而是表示智力高低的因而是表示智力高低的一种理想的指标一种理想的指标,公式为:公式为:IQ=100+15(X-X)/SD 注意:从不同的测验获得的离差智商只有当注意:从不同的测验获得的离差智商只有当标准差相同或接近标准差相同或接近时才可以比较。时才可以比较。专栏专栏5-2 5-2 几种导出分数间的相互关系几种导出分数间的相互关系的的z z分数,分数,6060分的分的T T分数,在韦氏测验中分数,在韦氏测验中115115分的分的离离差智商分数,相当于差智商分数,相当于8484的百分等级。的百分等级。(见(见P368图)图)一、转换表法一、转换表法最简单而且最基本的表示常模的方法就是
41、最简单而且最基本的表示常模的方法就是转换表转换表,也叫常模表,也叫常模表。测验的使用者利用测验的使用者利用转换表转换表可将原始分数转换为与其对应的导出分数,可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。从而对测验的分数作出有意义的解释。简单的转换表简单的转换表/常模表就是将单项测验的原始分数转换成一种或几种导常模表就是将单项测验的原始分数转换成一种或几种导出分数;复杂的转换表出分数;复杂的转换表/常模表通常包括几个分测验或几种常模团体的常模表通常包括几个分测验或几种常模团体的原始分数与导出分数的对应关系。原始分数与导出分数的对应关系。二、剖面图法二、剖面图法 剖面图剖
42、面图就是将测验分数的转换关系用图形表示出就是将测验分数的转换关系用图形表示出来,从剖面图上来,从剖面图上可以很直观地看出被试在各个可以很直观地看出被试在各个分测验上的表现及其相对的位置。分测验上的表现及其相对的位置。16PF:乐群性(A)、聪慧性(B)、稳定性(C)、恃强性(E)、兴奋性(F)、有恒性(G)、敢为性(H)、敏感性(I)、怀疑性(L)、幻想性(M)、世故性(N)、忧虑性(O)、实验性(Q1)、独立性(Q2)、自律性(Q3)、紧张性(Q4)。第三节第三节 测验的信度测验的信度信度的概念信度的概念1信度信度评估的方法评估的方法2信度与测验分数的解释信度与测验分数的解释3影响信度的因素
43、影响信度的因素4 第一单元第一单元 信度的概念信度的概念一、信度的定义一、信度的定义 信度是指同一被试者在不同时间内用同一测验(或用另一套相信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。等的测验)重复测量,所得结果的一致程度。信度只受信度只受随机误差随机误差的影响。随机误差越大,信度越低。的影响。随机误差越大,信度越低。系统误系统误差差产生恒定效应,不影响信度。产生恒定效应,不影响信度。由与测量目的无关的、偶然的因素引起,而又不易控制误差,使多次测量产生了不一致的结果,其方向和大小变化是完全随机的。由与测量目的无关的变因引起的一种恒定而有规律的效
44、应。这种误差稳定地存在于每一次测量之中,此时尽管多次测量的结果非常一致,但实测结果仍旧与真实数值有所差异,是不正确的。二、信度的指标二、信度的指标1.1.信度系数与信度指数信度系数与信度指数 大部分情况下,信度是以信度系数为指标,它是一种相关系数。大部分情况下,信度是以信度系数为指标,它是一种相关系数。有时也用信度指数作为信度的指标。信度指数的平方就是信度系数有时也用信度指数作为信度的指标。信度指数的平方就是信度系数。2.2.测量标准误测量标准误 在测量标准误的公式中(公式在测量标准误的公式中(公式5-5),),r rxxxx是测验的信度系数。测量是测验的信度系数。测量的标准误与信度之间有互为
45、消长的关系:信度越高,标准误越小;信的标准误与信度之间有互为消长的关系:信度越高,标准误越小;信度越低,标准误越大。度越低,标准误越大。不同的信度反映测验误差的不同来源。不同的信度反映测验误差的不同来源。一、重测信度一、重测信度 重测信度又称稳定性系数。它的计算方法是采用重重测信度又称稳定性系数。它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被测法,即使用同一测验,在同样条件下对同一组被试前后施测两次,求两次得分间的相关系数。试前后施测两次,求两次得分间的相关系数。人的多数心理特征,如智力、性格、兴趣等,具有人的多数心理特征,如智力、性格、兴趣等,具有相对的稳定性,间隔一段时间
46、不会有很大变化。相对的稳定性,间隔一段时间不会有很大变化。重测最适宜的时距随测验的目的、性质和被试的特重测最适宜的时距随测验的目的、性质和被试的特点而异,点而异,一般是两周到四周较宜,间隔时间最好不一般是两周到四周较宜,间隔时间最好不超过六个月。超过六个月。二、复本信度二、复本信度复本信度又称等值性系数,是以两个等值但题目不同的测验来测量同一复本信度又称等值性系数,是以两个等值但题目不同的测验来测量同一群体,然后求得被试者在两个测验上得分的相关系数。群体,然后求得被试者在两个测验上得分的相关系数。复本信度反映的是测验在内容上的等值性。复本信度反映的是测验在内容上的等值性。复本信度也要考虑两个复
47、本实施的时间间隔。如果两个复本几乎是复本信度也要考虑两个复本实施的时间间隔。如果两个复本几乎是在同一时间内施测的,相关系数反映的才是不同复本的关系。如果在同一时间内施测的,相关系数反映的才是不同复本的关系。如果两个复本的施测相隔一段时间,则称两个复本的施测相隔一段时间,则称重测复本信度重测复本信度或或稳定与等值系数稳定与等值系数。年年5 5月多选题:月多选题:如果两个复本的施测相隔一段时间,则其信度如果两个复本的施测相隔一段时间,则其信度称为称为()()(A)(A)重测复本信度重测复本信度 (B)(B)重测信度重测信度 (C)(C)复本信度复本信度 (D)(D)稳定与等值系数稳定与等值系数 (
48、ADAD)复本信度的优点是能够避免重测信度的一些复本信度的优点是能够避免重测信度的一些问题,如记忆效果、学习效应等,但也有其问题,如记忆效果、学习效应等,但也有其局限性:其一,如果测量的行为易受练习的局限性:其一,如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除影响,则复本信度只能减少而不能完全消除这种影响;其二,由于第二个测验只改变了这种影响;其二,由于第二个测验只改变了题目的内容,已经掌握解题原则,可以很容题目的内容,已经掌握解题原则,可以很容易地迁移到同类问题上去;其三,对于许多易地迁移到同类问题上去;其三,对于许多测验来说,建立复本是十分困难的。测验来说,建立复本是十分困
49、难的。三、内部一致性信度三、内部一致性信度(一)分半信度(一)分半信度分半信度指采用分半法估计所得的信度系数。通常是在测验实施后将测验按分半信度指采用分半法估计所得的信度系数。通常是在测验实施后将测验按项目编号的奇数、偶数分为等值的两半,并分别计算每位受测者在两半测验项目编号的奇数、偶数分为等值的两半,并分别计算每位受测者在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了上的得分,求出这两半分数的相关系数。这个相关系数就代表了两半测验内两半测验内容容取样的一致程度。取样的一致程度。(二)同质性信度(二)同质性信度同质性主要代表测验内部同质性主要代表测验内部所有题目所有题目间的一
50、致性。间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,其测验为同质当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,其测验为同质的。相反,即使所有题目看起来好像测量同一特质,但相关很低或为负相关时,其的。相反,即使所有题目看起来好像测量同一特质,但相关很低或为负相关时,其测验为异质的。测验为异质的。四、评分者信度四、评分者信度 评分者信度用于测量不同评分者之间所产生的误评分者信度用于测量不同评分者之间所产生的误差。通常是随机抽取若干份测验卷,由两位评分差。通常是随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷者按评分标准分别给分,然后