1、第二章第二章 心理测验的编制心理测验的编制第一节第一节 编制测验的一般程序编制测验的一般程序第二节第二节 测题的编制技术测题的编制技术第三节第三节 测验的项目分析测验的项目分析第一节第一节 编制测验的一般程序编制测验的一般程序一、确定测验目的一、确定测验目的二、拟定编制计划二、拟定编制计划三、设计测验项目三、设计测验项目四、预测与四、预测与项目分析项目分析五、合成测验五、合成测验六、测验的标准化六、测验的标准化七、收集信度、效度资料七、收集信度、效度资料八、编写测验手册八、编写测验手册 确定测验目的确定测验目的明确测量对象明确测量对象 明确测量目标明确测量目标 明确测验用途明确测验用途解决测量
2、什么人的解决测量什么人的问题问题 :年龄、职:年龄、职业、性别等。业、性别等。描述?描述?预测?预测?诊断?诊断?解决测量什么心理特质的问题。解决测量什么心理特质的问题。(要对特定概念下定义)(要对特定概念下定义)拟定编制计划拟定编制计划 确定测验所包含的内容和各种技能确定测验所包含的内容和各种技能,以及每一种内容或技能在测验中的地位以及每一种内容或技能在测验中的地位.一是明确了应该编哪方面的测验项一是明确了应该编哪方面的测验项目以及多少测验题目,结束后可比照核目以及多少测验题目,结束后可比照核对测验项目是否反映了所要测量的领域;对测验项目是否反映了所要测量的领域;二是记分时可按计划中百分比确
3、定二是记分时可按计划中百分比确定每类测验项目的分数标准。每类测验项目的分数标准。工作内容工作内容用用 途途 中学生物细目表中学生物细目表测验内容测验内容知识知识理解理解应用应用合计合计生物特点分类生物特点分类生命历程生命历程环境生态环境生态生物实验生物实验合合 计计 912 6 3301216 8 440 912 6 330 30 40 20 10100小学自然常识命题细目表小学自然常识命题细目表教材内容教材内容知识知识理解理解应用应用分析分析综合综合评价评价基本知基本知识获得识获得了解原了解原理原则理原则应用原应用原理原则理原则分析因分析因果关系果关系综合系综合系统见解统见解建立判建立判断标
4、准断标准生物世界生物世界35632 1资源利用资源利用233110动力机械动力机械234201物质能量物质能量568321气象气象243220宇宙宇宙254100地球地球222110合计合计1822301383 设计测验项目设计测验项目搜集有关资料搜集有关资料 选择项目形式选择项目形式 编写和修订项目编写和修订项目 资料丰富且具有普遍性资料丰富且具有普遍性:直接选用国内外优秀的相关测题直接选用国内外优秀的相关测题;修改前人测验中的有关测题修改前人测验中的有关测题;根据临床经验自己编写根据临床经验自己编写 使受测者明了测验方法;使受测者明了测验方法;在完成测验时不会弄错;在完成测验时不会弄错;测
5、验的过程省时;测验的过程省时;计分省时省力,经济。计分省时省力,经济。测验项目的取样要具有代表性;测验项目的取样要具有代表性;项目的范围与测验计划相一致;项目的范围与测验计划相一致;项目数量要比最后所需的数量多出项目数量要比最后所需的数量多出2-3倍;倍;项目的难度必须符合测验的目的需要;项目的难度必须符合测验的目的需要;测验的说明简明清楚。测验的说明简明清楚。预测与项目分析预测与项目分析 预预 测测 项目分析项目分析预测时应注意的问题:预测时应注意的问题:1对象取自正式测验准备应对象取自正式测验准备应用的群体;用的群体;按正规测验的要求进行;按正规测验的要求进行;时间充裕;时间充裕;随时记录
6、被试的反应随时记录被试的反应。项目分析项目分析就是对就是对测验结果进行统测验结果进行统计分析,确定项计分析,确定项目的难度和区分目的难度和区分度及备选答案的度及备选答案的适宜性。适宜性。合成测验合成测验选择测验项目选择测验项目测验项目的编排测验项目的编排主要考虑:主要考虑:一是区分度。一般而言区分度越高越好;一是区分度。一般而言区分度越高越好;二是难度。没有绝对的标准。二是难度。没有绝对的标准。三是符合测验计划要求(目标、性质等)。三是符合测验计划要求(目标、性质等)。一般原则是先易后难。一般原则是先易后难。常见形式有两种:并列直进式常见形式有两种:并列直进式混合螺旋式混合螺旋式 编制复本编制
7、复本复本需要符合下列条件:复本需要符合下列条件:各份测验测量的是同一种心理特质;各份测验测量的是同一种心理特质;各份测验包括相同的内容范围,但题目不应各份测验包括相同的内容范围,但题目不应有重复;有重复;各份测验题型相同,题目数量相等,并且有各份测验题型相同,题目数量相等,并且有大体相同的难度分布。大体相同的难度分布。如何编制复本?如何编制复本?测验的标准化测验的标准化 测验的标准化测验的标准化是指测验的编制、施测、评分及解释测验分数是指测验的编制、施测、评分及解释测验分数的程度的一致性。的程度的一致性。?标准化的测验才可以用等距量表来统计分数标准化的测验才可以用等距量表来统计分数,使进一步的
8、使进一步的统计成为可能;常态化标准分数可参照常态曲线直接转换成百分等统计成为可能;常态化标准分数可参照常态曲线直接转换成百分等级,因而容易解释;允许将几个测验或量表上的分数做直接的比较。级,因而容易解释;允许将几个测验或量表上的分数做直接的比较。测验的标准化过程测验的标准化过程包括测验编制的标准化和测验使用的标准包括测验编制的标准化和测验使用的标准化。测验化。测验编制的标准化是测验标准化的前提。编制的标准化是测验标准化的前提。测验使用的标准化测验使用的标准化可分为施测过程的标准化、评分计分的标可分为施测过程的标准化、评分计分的标准化、分数解释标准化三个环节:准化、分数解释标准化三个环节:1施测
9、过程:指导语、施测情境、时限等的标准化。施测过程:指导语、施测情境、时限等的标准化。2评分计分:符合客观、准确、经济、实用四项原则。评分计分:符合客观、准确、经济、实用四项原则。3分数解释:常模参照和标准参照。分数解释:常模参照和标准参照。考研题考研题收集信度、效度资料收集信度、效度资料 信信 度度 效效 度度请听下章分解!请听下章分解!编写测验手册编写测验手册 具体包括:具体包括:1 1本测验的目的和功用。本测验的目的和功用。2 2测验的理论背景以及选择项目的根据。测验的理论背景以及选择项目的根据。3 3测验的实施方法、时限及注意事项。测验的实施方法、时限及注意事项。4 4测验的标准答案及记
10、分方法。测验的标准答案及记分方法。5 5常模表或其他有助于分数转换与解释的资料。常模表或其他有助于分数转换与解释的资料。6 6测验的信度、效度资料,包括信度系数、效测验的信度、效度资料,包括信度系数、效度系数以及这些数据是在什么情况下得到的。度系数以及这些数据是在什么情况下得到的。休息一下!休息一下!回回 想想 一一 下!下!一、命题的一般原则一、命题的一般原则1 1测题要符合测验目的;测题要符合测验目的;2 2内容取样要有代表性;内容取样要有代表性;3 3题目格式不要让被试产生误解;题目格式不要让被试产生误解;4 4文句要简明扼要,排除无关因素;文句要简明扼要,排除无关因素;5 5应有不致引
11、起争论的确定答案(创造力和人格测验除外);应有不致引起争论的确定答案(创造力和人格测验除外);6 6各个试题必须彼此独立,不可相互牵连;各个试题必须彼此独立,不可相互牵连;7 7题目不可含有暗示本题或其它答案的线索;题目不可含有暗示本题或其它答案的线索;8 8题目内容不要超过受测团体的知识能力;题目内容不要超过受测团体的知识能力;9 9所提出问题应避免涉及社会禁忌和个人隐私;所提出问题应避免涉及社会禁忌和个人隐私;1010施测与评分省时施测与评分省时.第二节第二节 测题的编制技术测题的编制技术 考研题考研题二、测题的种类及编制要求二、测题的种类及编制要求 一般来说主要有两种类型:一般来说主要有
12、两种类型:选择型选择型和和供应型供应型。选择型选择型常用的形式有判断题、选择题、句子匹配,常用的形式有判断题、选择题、句子匹配,尤其是前两者最为常用,由于这三种的主观性较尤其是前两者最为常用,由于这三种的主观性较小,因此常称为客观项目。小,因此常称为客观项目。供应型供应型常用的形式有简答法,论述法等。常用的形式有简答法,论述法等。(一)是非题(一)是非题 它通常是给被试一个句子要被试作出正误的判断。它通常是给被试一个句子要被试作出正误的判断。如:三角形的内角和是如:三角形的内角和是360360度。度。()再如:长江是我国第一大河流。(再如:长江是我国第一大河流。()1 1优点优点:编制容易,可
13、适用于各种教材;记分客观,取:编制容易,可适用于各种教材;记分客观,取样广泛。样广泛。2 2局限性局限性:仅能测量知识层次中最基本的结果,而无法:仅能测量知识层次中最基本的结果,而无法测量高层次的学习结果;受猜测因素的影响较大。测量高层次的学习结果;受猜测因素的影响较大。3 3编写原则编写原则 1 1)考核的内容应是重要的知识,应有考核价值;)考核的内容应是重要的知识,应有考核价值;2 2)题目应多是测量理解能力;)题目应多是测量理解能力;3 3)一个题目中只能有一个中心内容,或是一个重要概念,)一个题目中只能有一个中心内容,或是一个重要概念,避免两个以上的概念在同一题中出现;避免两个以上的概
14、念在同一题中出现;4 4)试题应做到是非界限分明,用词准确,不能引起争议;)试题应做到是非界限分明,用词准确,不能引起争议;5 5)题目陈述应简单明了,尽量用正面叙述,避免用否定)题目陈述应简单明了,尽量用正面叙述,避免用否定和双重否定的语句;和双重否定的语句;6 6)正句和误句的排列要随机化,且数量应大致相等)正句和误句的排列要随机化,且数量应大致相等;7 7)避免使用能引起歧义的词,如:)避免使用能引起歧义的词,如:“总是总是”“”“都都”“”“没没有一个有一个”“”“决不决不”;8 8)避免使用未经过界定的词,如:)避免使用未经过界定的词,如:“只有只有”“”“许许多多”“”“一些一些”
15、“”“很少很少”等等。等等。练习练习:完成下列是非题完成下列是非题()铁路将所有的大城市连接起来。)铁路将所有的大城市连接起来。()任何角都可能被二分。)任何角都可能被二分。()不可能用少于)不可能用少于3 3分分3030秒的时间跑完一英里路。秒的时间跑完一英里路。()有些战争本可以阻止。)有些战争本可以阻止。()人口普查每十年一次。)人口普查每十年一次。()在是非题里使用双重否定并不是不可取的。)在是非题里使用双重否定并不是不可取的。你觉得这些题目如何?为什么?你觉得这些题目如何?为什么?(二)选择题(二)选择题 选择题是由一个选择题是由一个“题干题干”和和“几个选项几个选项”组成的。组成的
16、。例如:使用选择题试卷进行测量,最大的困难是什么?例如:使用选择题试卷进行测量,最大的困难是什么?A试卷的编制;试卷的编制;B试卷的印刷;试卷的印刷;C试卷的评阅;试卷的评阅;1优点优点 1 1)可以用来测量学生不同层次的学习结果。)可以用来测量学生不同层次的学习结果。2 2)评分标准统一、客观。)评分标准统一、客观。3 3)可以加大试题容量,抽取广泛有效的代表性样本。)可以加大试题容量,抽取广泛有效的代表性样本。4 4)有利于考查被试思维的敏捷性和准确的判断力。)有利于考查被试思维的敏捷性和准确的判断力。5 5)采用大量的似真选择项使得结果易于诊断,通过对学)采用大量的似真选择项使得结果易于
17、诊断,通过对学生错误选项的选择反应这个线索,教师便于发现、分析生错误选项的选择反应这个线索,教师便于发现、分析学生在学习中存在的问题,以便及时纠正。学生在学习中存在的问题,以便及时纠正。2局限性局限性 1 1)编制良好的选择题较花时间,且要有专门的命题技巧。)编制良好的选择题较花时间,且要有专门的命题技巧。2 2)难以考核被试完全的推理能力,综合运用所学知识的)难以考核被试完全的推理能力,综合运用所学知识的能力、有效的总结能力、严密的表达能力和写作能力,能力、有效的总结能力、严密的表达能力和写作能力,对于被试的发散思维能力则更是如此。对于被试的发散思维能力则更是如此。3 3)无法测量被试的思维
18、过程。)无法测量被试的思维过程。4 4)被试能仅凭猜测而选中正确答案。)被试能仅凭猜测而选中正确答案。3编写原则编写原则 1 1)题干和意义完整并能表达一个确定的问题。)题干和意义完整并能表达一个确定的问题。2 2)题干和陈述要简明,避免出现不切题的内容。)题干和陈述要简明,避免出现不切题的内容。3 3)题干后面的选项不易过多,一般以四到五个选项为宜。)题干后面的选项不易过多,一般以四到五个选项为宜。4 4)在四到五个答案中错的选项不要过于明显,要和题干)在四到五个答案中错的选项不要过于明显,要和题干有相应的逻辑联系和似真性。有相应的逻辑联系和似真性。5 5)选项的文字表达力求简短精炼。)选项
19、的文字表达力求简短精炼。6 6)应尽量避免)应尽量避免“以上皆是以上皆是”“”“以上皆非以上皆非”的选项。的选项。7 7)对的答案和错的答案要随机排列,使被试无法猜测,)对的答案和错的答案要随机排列,使被试无法猜测,减少系统误差。减少系统误差。考研题考研题 练习:练习:完成下列选择题(单选)完成下列选择题(单选)()编制了世界上第一个标准化的心理测验。)编制了世界上第一个标准化的心理测验。A A孔子;孔子;B B冯特;冯特;C C麦柯尔;麦柯尔;D D比奈比奈()测验标准化的内容不包括:)测验标准化的内容不包括:A A测验编制;测验编制;B B测验的施测;测验的施测;C C测验的评分;测验的评
20、分;D D测测试的对象试的对象()是测验编制的第一步。)是测验编制的第一步。A A 明确测量对象;明确测量对象;B B 拟定编制计划;拟定编制计划;C C 选择测验项目;选择测验项目;D D 确定测验目的确定测验目的 你觉得这些题目如何?为什么?你觉得这些题目如何?为什么?(三)匹配题(三)匹配题 匹配题是一种变形的选择题。适用于测量概念与事实之匹配题是一种变形的选择题。适用于测量概念与事实之间的关系。这种测题在结构上包括两部分:一为问句选间的关系。这种测题在结构上包括两部分:一为问句选项,另一组为反应项目。项,另一组为反应项目。例如例如:问句项目:问句项目 反应项目反应项目 ()曹雪芹)曹雪
21、芹 1 1、三国演义、三国演义 ()蒲松龄)蒲松龄 2 2、红楼梦、红楼梦 ()罗贯中)罗贯中 3 3、西游记、西游记 ()吴承恩)吴承恩 4 4、聊斋志异、聊斋志异 5 5、水浒、水浒 1优点优点 1 1)具有选择法的优点。)具有选择法的优点。2 2)可用于测量对多个事物与知识的理解能力和)可用于测量对多个事物与知识的理解能力和对其相互关系的判断力。对其相互关系的判断力。3 3)它的突出特点是在较短的时间内测量大量相)它的突出特点是在较短的时间内测量大量相关联的事实材料。关联的事实材料。2缺点缺点 1 1)仅能测量低层次和教学目标,且易提供额外)仅能测量低层次和教学目标,且易提供额外的线索;
22、的线索;2 2)较难找到一些符合教育目标和学习结果的同)较难找到一些符合教育目标和学习结果的同质材料。质材料。3编写原则:编写原则:1 1)问句和反应项目在内容上要同质)问句和反应项目在内容上要同质;2 2)指导语中要讲清配合的依据)指导语中要讲清配合的依据;3 3)配对项目不能太多)配对项目不能太多,最多不超过最多不超过1010项项;4 4)同一组题目要印在同一页上)同一组题目要印在同一页上.(四)简答题(四)简答题 简答法是一种供应型的格式,它要求被试用一个简答法是一种供应型的格式,它要求被试用一个正确的短语或句子或较为简短的一段文字来完成正确的短语或句子或较为简短的一段文字来完成测题。测
23、题。就记忆的测量角度而言,简答法属于就记忆的测量角度而言,简答法属于“回忆法回忆法”.简答法的难度要高于前面讲述过的三种的难度。简答法的难度要高于前面讲述过的三种的难度。两种主要方式:两种主要方式:一是用直接疑问句,一是用不完一是用直接疑问句,一是用不完全陈述句,由被试在题目的空白处填写答案,后全陈述句,由被试在题目的空白处填写答案,后一种我们通常称为填空题。一种我们通常称为填空题。1 1优点优点 1 1)简答题的编写相对比较简单、灵活,不易受猜测的影)简答题的编写相对比较简单、灵活,不易受猜测的影响;响;2 2)简答题可以测量有关术语的知识、特定事实的知识、)简答题可以测量有关术语的知识、特
24、定事实的知识、原则的知识、方法和程序的知识等各种层次的知识目标,原则的知识、方法和程序的知识等各种层次的知识目标,也可以测量解决问题的能力,解决数字计算、使用数字也可以测量解决问题的能力,解决数字计算、使用数字符号的技能,解方程或平衡化学方程式等的能力;符号的技能,解方程或平衡化学方程式等的能力;3 3)简答题在各类题型中是最易于编制的一种,不用考虑)简答题在各类题型中是最易于编制的一种,不用考虑选项之间的同质性等问题。选项之间的同质性等问题。2 2缺点缺点 不能测量复杂的知识和能力,评分也不够客观且费时。不能测量复杂的知识和能力,评分也不够客观且费时。3、编写原则、编写原则 1)只能有一个答
25、案;只能有一个答案;2 2)不适宜测量零散琐碎的知识;)不适宜测量零散琐碎的知识;3 3)测量有重要意义的词类;)测量有重要意义的词类;4 4)题中不应有正确答案的线索;)题中不应有正确答案的线索;5 5)如果答案是数字)如果答案是数字,最好跟上单位;最好跟上单位;6 6)测题不能直接来自课本或参考书;)测题不能直接来自课本或参考书;7 7)测题中的空格不宜过多)测题中的空格不宜过多.(五)论述题(五)论述题 论述题是就一个问题阐明作者的观点、思想、意见的题目。论述题是就一个问题阐明作者的观点、思想、意见的题目。1优点优点:适合于测组织、综合和文字表达能力;编写容易,不允:适合于测组织、综合和
26、文字表达能力;编写容易,不允许猜测。许猜测。2缺点缺点:题目少,取样的代表性差;评分困难,且易受评分者主:题目少,取样的代表性差;评分困难,且易受评分者主观因素的影响。观因素的影响。3编写原则编写原则 1)要让被试知道答题的范围和方向;)要让被试知道答题的范围和方向;2)最好要求被试在新的情境下应用新的知识去解决新问题;)最好要求被试在新的情境下应用新的知识去解决新问题;3)题目不要过大或过小,数量要适当多些,内容要适当具体些;)题目不要过大或过小,数量要适当多些,内容要适当具体些;4)在测试前,对每一个题目应先编制些理想的答案,并对部分正)在测试前,对每一个题目应先编制些理想的答案,并对部分
27、正确回答如何计分做出尽可能的具体规定;确回答如何计分做出尽可能的具体规定;5)一般不要有任选题,因为两个论文题很难做到等值。)一般不要有任选题,因为两个论文题很难做到等值。(六)操作题(六)操作题 操作题是让被试进行实际操作的题目。如走迷津,拼操作题是让被试进行实际操作的题目。如走迷津,拼图形等。图形等。编写时要使被试明确知道要他干什么和在什么条件编写时要使被试明确知道要他干什么和在什么条件下干,如何使用什么工具,以及时间限制等。下干,如何使用什么工具,以及时间限制等。(七)联想题(七)联想题 联想题是让被试把与某个事物有关的事物写出来。联想题是让被试把与某个事物有关的事物写出来。例如:说出所
28、有圆形的东西,宜考查发散思维。例如:说出所有圆形的东西,宜考查发散思维。除了以上几种介绍的格式外,还有图解法、划消法、类除了以上几种介绍的格式外,还有图解法、划消法、类推法等。推法等。就就 到到 这这 里!里!你你 会会 了了 吗?吗?请编一道匹配题请编一道匹配题,各编三道选择、是非题!各编三道选择、是非题!(结合第一章)(结合第一章)第三节第三节 测验的项目分析测验的项目分析 项目分析:项目分析:指对测验或量表的项目指对测验或量表的项目定量定量和和定性定性的分析研究。的分析研究。定量分析包括:定量分析包括:(1 1)题目的难度分析。)题目的难度分析。难度指标是测验取舍题目与编排题目顺序的依据
29、。客观难度指标是测验取舍题目与编排题目顺序的依据。客观题以通过率为指标。通过率越高,项目难度越小,通过率越题以通过率为指标。通过率越高,项目难度越小,通过率越低,项目难度越大;非客观题以被试在某一项目的平均分与低,项目难度越大;非客观题以被试在某一项目的平均分与该项目的满分之比为难度指标。该项目的满分之比为难度指标。(2 2)题目的区分度分析。)题目的区分度分析。指一个项目是否能把某一团体的不同水平的人区分开。指一个项目是否能把某一团体的不同水平的人区分开。一般用题目得分与外在效标的相关系数,或与测验总分的相一般用题目得分与外在效标的相关系数,或与测验总分的相关系数为指标及求高低分组通过率之差
30、等方法获得。关系数为指标及求高低分组通过率之差等方法获得。定性分析定性分析即从题目的思想性、内容取样的适切性以及表达是即从题目的思想性、内容取样的适切性以及表达是否清楚等方面加以评鉴。否清楚等方面加以评鉴。(依据经验依据经验)考研题考研题 一、项目的难度一、项目的难度(一)项目难度的计算(以通过率表示)(一)项目难度的计算(以通过率表示)1、公式、公式 (1)二值计分)二值计分 P=R/N (R为答对该题的人数,为答对该题的人数,N为总人数)为总人数)(2)非二值计分)非二值计分 (为全体被试该题目的平均分,为全体被试该题目的平均分,X 为答对该题应得分数)为答对该题应得分数)XxP xP值越
31、大,难度越小。值越大,难度越小。(3)极端分组法:)极端分组法:以高低分组(以高低分组(27%)平均通过率表示的难度。)平均通过率表示的难度。P=(=高分组的通过率;高分组的通过率;=低分组的通过率)低分组的通过率)例例1:200人参加某项测验,在一填空题上高分组人参加某项测验,在一填空题上高分组48人通人通过,低分组过,低分组23人通过。试问该题的难度值是多少?人通过。试问该题的难度值是多少?P=0.66 例例2:在一次测试中,高分组与低分组各有:在一次测试中,高分组与低分组各有27人。其中高人。其中高分组答对第一题的有分组答对第一题的有20人,低分组答对第一题的有人,低分组答对第一题的有1
32、0人。人。试问该题的难度是多少?试问该题的难度是多少?P=0.562plphphpl(4)校正公式:在选择题中,由于允许猜测。)校正公式:在选择题中,由于允许猜测。可用纠正公式:可用纠正公式:CP=(CP=校正后的通过率;其中校正后的通过率;其中K为备选答案数;为备选答案数;P=实得通过率。)实得通过率。)例例3:某题有:某题有5个选项,该题通过的人数为个选项,该题通过的人数为0.75,试问校正后的通过率是多少?试问校正后的通过率是多少?(P=0.69)例例4:A项目三选一,项目三选一,P=0.50;B项目五择一项目五择一,P=0.45;请问哪一道题更难些请问哪一道题更难些?(CPA=0.25
33、;CPB=0.31)11kkp 2、难度水平的确定、难度水平的确定 效标参照测验、掌握测验:不考虑难度;效标参照测验、掌握测验:不考虑难度;对于选择题来说,难度一般应大于猜测概率;对于选择题来说,难度一般应大于猜测概率;选拔测验:难度选拔测验:难度=录取率;录取率;无论速度测验还是难度测验,一般都应防止得满无论速度测验还是难度测验,一般都应防止得满分,因为满分的意义是不明确的。分,因为满分的意义是不明确的。大体而言,难度为大体而言,难度为0.500.50时最理想,此时项目时最理想,此时项目具有最大的鉴别力。但在实际操作中,让所有项目具有最大的鉴别力。但在实际操作中,让所有项目难度都到达难度都到
34、达0.500.50困难很大,而且也不必要,一般只困难很大,而且也不必要,一般只需使项目的平均难度接近需使项目的平均难度接近0.500.50,而各个项目的难度,而各个项目的难度在在0.500.50 0.20 0.20之间变化。之间变化。(二)测验的难度(二)测验的难度 测验的难度依赖于题目的难度。测验的难度依赖于题目的难度。测验难度影响测验分数的分布形态。测验难度影响测验分数的分布形态。如何如何 调整?调整?低分低分 高分高分人数人数低分低分 高分高分人数人数难度低,负偏态。难度低,负偏态。难度高,正偏态难度高,正偏态 二、区分度(二、区分度(discrimination)(一)区分度的内涵:(
35、一)区分度的内涵:区分度(又称鉴别力)区分度(又称鉴别力)是指测验项目对被试的心理特征的是指测验项目对被试的心理特征的区分能力。区分能力。它有两层意思:它有两层意思:一是题目是不是测出了它要测验的那个心一是题目是不是测出了它要测验的那个心理特质;二是题目是否把被试团体作了有效的区分。理特质;二是题目是否把被试团体作了有效的区分。区分度(区分度(D D)的取值范围)的取值范围介于介于-1.00-1.00+1.00+1.00之间。之间。当当D D为正值时,称作积极区分;为正值时,称作积极区分;当当D D为负值时,称作消极区分;为负值时,称作消极区分;如果如果D D为为0 0,则称作无区分作用。,则
36、称作无区分作用。具有积极区分作用的项目具有积极区分作用的项目D D值越大,区分的效果越好。值越大,区分的效果越好。考研题考研题(二)区分度的计算方法(二)区分度的计算方法 1鉴别指数法鉴别指数法鉴别指数是项目分析中区分度的一个指标,即确定测验项目区分个鉴别指数是项目分析中区分度的一个指标,即确定测验项目区分个体所测能力高低的程度指标。项目分析的一个最简单的估计方法是体所测能力高低的程度指标。项目分析的一个最简单的估计方法是比较两个极端效标组,即将所有被试在某个测验上的分数从高到低比较两个极端效标组,即将所有被试在某个测验上的分数从高到低依序排列,划分出人数相等的高分组和低分组(一般取样本中处于
37、依序排列,划分出人数相等的高分组和低分组(一般取样本中处于两端两端27%的个案);分别求出此两组在每一题目上的通过率;再求的个案);分别求出此两组在每一题目上的通过率;再求出高分组与低分组通过率之差。可用下面公式表示。出高分组与低分组通过率之差。可用下面公式表示。D=其范围在其范围在-1.00-1.00+1.00+1.00之间。之间。1.00表示鉴别指数最高,表示鉴别指数最高,1.00表示表示鉴别指数最低。鉴别指数越高,题目的鉴别性能即区分能力越好。鉴别指数最低。鉴别指数越高,题目的鉴别性能即区分能力越好。plph 美国测验学家:伊贝尔(美国测验学家:伊贝尔(L.Ebel)提出鉴别指数的评价标
38、准:)提出鉴别指数的评价标准:区分度(区分度(D D)评评 价价0.400.40以上以上0.300.300.390.390.200.200.290.290.190.19以下以下非常良好!非常良好!良好,如能改进则更佳。良好,如能改进则更佳。尚可,仍需再改进。尚可,仍需再改进。劣,必须淘汰或加以修改。劣,必须淘汰或加以修改。例例1:100人参加某项测验,对其中四道题做对的人数人参加某项测验,对其中四道题做对的人数分布如表所求,试问这些试题的区分度分别是多少?分布如表所求,试问这些试题的区分度分别是多少?题题 做对人数做对人数 目目 高分组高分组 低分组低分组通过百分比通过百分比高分组高分组 低分
39、组低分组D1 27 241 27 242 12 12 12 13 6 83 6 84 22 124 22 121.00 0.890.44 0.040.22 0.300.81 0.440.110.40-0.08 0.37 2方差法方差法 方差表示一组数据离散程度。方差大,数据分散。被试方差表示一组数据离散程度。方差大,数据分散。被试在题上的得分越分散,则该试题鉴别力越大。在题上的得分越分散,则该试题鉴别力越大。当当n30时,属统计上的小样本,改用时,属统计上的小样本,改用nxxis)(221)(22 nxxis 3相关法相关法 即以项目分数与效标分数或测验总分的相关作为项目区即以项目分数与效标分
40、数或测验总分的相关作为项目区分度的指标。相关越高,项目区分度越高。分度的指标。相关越高,项目区分度越高。1)点二列相关)点二列相关 系数(客观题)系数(客观题)条件:项目是二值(条件:项目是二值(0、1)计分,总分是连续变量,则)计分,总分是连续变量,则计算项目与总分相关。计算项目与总分相关。:点二列相关系数;:点二列相关系数;:答对该题的被试在总分上的平均得分;:答对该题的被试在总分上的平均得分;P:该题难度;:该题难度;q:1-p;:全体被试的总分标准差:全体被试的总分标准差 :答错该题的被试在总分上的平均得分;:答错该题的被试在总分上的平均得分;rpbipqstxqxprpbirpbix
41、pstxq 2)二列相关(主观题)二列相关(主观题)条件:适用于连续的测量变量条件:适用于连续的测量变量.但其中一个变量因为某种但其中一个变量因为某种原因人为分成两类原因人为分成两类.=3)相关相关(两个二分变量两个二分变量)4)积差相关积差相关(论述题论述题)rbstxqxppq例例1:下表有:下表有20个学生语文测验总分以及在作文题个学生语文测验总分以及在作文题和一个选择题上的得分情况,假设作文和一个选择题上的得分情况,假设作文37分(包括分(包括37分)算通过,试计算作文题的区分度。分)算通过,试计算作文题的区分度。学生学生 1 2 3 4 5 6 7 8 9 10 11 12 13 1
42、4 15 16 17 18 19 20总分总分86 52 94 72 65 22 76 83 80 75 76 73 62 91 47 74 81 88 62 58作文题作文题得分得分47 37 55 27 22 10 35 42 46 39 40 41 38 52 21 39 42 48 29 27选择题选择题得分得分 1 0 0 1 1 0 0 1 1 1 1 0 1 1 0 1 1 0 0 0三、项目区分度与难度的关系三、项目区分度与难度的关系难度是区分度的必要条件。一般来说,难度越接近难度是区分度的必要条件。一般来说,难度越接近0.50,项目的区分项目的区分度越大度越大,难度越接近难度
43、越接近1.00或或0时时,项目的区分度越小。项目的区分度越小。难度和区分度都是相对的,绝对的难度和区分度是不存在的。难度和区分度都是相对的,绝对的难度和区分度是不存在的。P 最大鉴别值最大鉴别值 P 最大鉴别值最大鉴别值 1.00 0.00 .50 1.00 .90 0.20 .40 0.80 .80 0.40 .30 0.60 .70 0.60 .20 0.40 .60 0.80 .10 0.20 .00 0.00四、多重选择题的项目分析四、多重选择题的项目分析 具体分析的步骤如下:具体分析的步骤如下:(1)按被试测验的总分,从高到低依次排列试卷。)按被试测验的总分,从高到低依次排列试卷。(
44、2)从最高分依次向下取全部试卷的)从最高分依次向下取全部试卷的27%作为高分组。作为高分组。(3)从最低分依次向上取全部试卷的)从最低分依次向上取全部试卷的27%作为低分组。作为低分组。(4)分别登记高分组与低分组选中各选择项的人数(亦)分别登记高分组与低分组选中各选择项的人数(亦可将人数换为人数比例),然后登记。可将人数换为人数比例),然后登记。(5)根据登记结果进行选择项的质量分析。)根据登记结果进行选择项的质量分析。对选择项的反应模式注意从以下几方面进行分析:对选择项的反应模式注意从以下几方面进行分析:(1)如果正确的备选答案被所有的受测者所选择。)如果正确的备选答案被所有的受测者所选择
45、。说明该项目太容易或者可能是项目中提供某种暗示,答案过于明显。说明该项目太容易或者可能是项目中提供某种暗示,答案过于明显。(2)如果某个错误答案没有任何被试选择。)如果某个错误答案没有任何被试选择。说明该选项不具有迷惑性。一般除非有说明该选项不具有迷惑性。一般除非有2%以上的人选择,否则该备选以上的人选择,否则该备选答案应该修改或删掉。答案应该修改或删掉。(3)如果所有被试都选择了同一个错误答案。)如果所有被试都选择了同一个错误答案。可能是编制测验时把正确答案搞错了,也可能是在教学中发生了错误。可能是编制测验时把正确答案搞错了,也可能是在教学中发生了错误。(4)如果高分组被试的选择集中在两个答
46、案上,两者选择率相近。)如果高分组被试的选择集中在两个答案上,两者选择率相近。说明该题可能本来就有两种正确答案,或者在某种意义上另一个选择项说明该题可能本来就有两种正确答案,或者在某种意义上另一个选择项也有一定的道理。也有一定的道理。(5)如果高分组对正确答案的选择率与低分组相等或低于后者。)如果高分组对正确答案的选择率与低分组相等或低于后者。说明该题所考查的东西与被试水平无关,即不具有鉴别力,此题应删说明该题所考查的东西与被试水平无关,即不具有鉴别力,此题应删除或作大的修改。除或作大的修改。(6)如果一个题目被试未作答的人数较多(速度性测验除外),或选择)如果一个题目被试未作答的人数较多(速
47、度性测验除外),或选择各个备选答案的人数相等。各个备选答案的人数相等。说明该项目可能过难或题意不清,被试无法作答或凭猜测作答。说明该项目可能过难或题意不清,被试无法作答或凭猜测作答。例:下表为一个由例:下表为一个由370人参加的测验中的人参加的测验中的4道题的项目统计结果,道题的项目统计结果,据此表对此四题作分析评价。据此表对此四题作分析评价。题号题号组别组别选答人数选答人数正确正确答案答案难度难度P区分度区分度ABCD未答未答rPbD1高分组高分组592120B0.710.520.42低分组低分组225012l602高分组高分组581015161A0.420.330.32低分组低分组2621
48、153623高分组高分组1725282812D0.31一一0.04一一0.06低分组低分组25111934114高分组高分组14414365C0.120.080.04低分组低分组15610285(1)难度)难度。第一题的难度较小,第二题难度适中,第三、第四两。第一题的难度较小,第二题难度适中,第三、第四两题难度较大。题难度较大。(2)区分度)区分度。第一、第二两题的区分度符合要求具备良好的测题。第一、第二两题的区分度符合要求具备良好的测题的首要条件,第三、第四两题的区分度不够,第四题太小,而第的首要条件,第三、第四两题的区分度不够,第四题太小,而第三题则是负向的,此两题均为不良试题。三题则是负
49、向的,此两题均为不良试题。(3)各题的选项分析)各题的选项分析。第一题:正误答案配比较好。第一题:正误答案配比较好。第二题:除第二题:除C答案缺乏鉴别能力外,其余都不错。但值得注意的答案缺乏鉴别能力外,其余都不错。但值得注意的是为什么在是为什么在C答案上,高低分组的选答人数相同。答案上,高低分组的选答人数相同。第三题:未答的人数比例过大,且答案第三题:未答的人数比例过大,且答案B、C均属于负向的,高分均属于负向的,高分组选组选C的人数较多,等于选正确答案的人数较多,等于选正确答案D的人数,这些均要研究。的人数,这些均要研究。第四题:第四题:A项选答的人数较少,是否因为该选项错得太明显而缺项选答的人数较少,是否因为该选项错得太明显而缺乏似真性,另外乏似真性,另外D选项也有负向性,须找出原因适当加以修改。选项也有负向性,须找出原因适当加以修改。练习与思考 见分章测试题见分章测试题
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。