1、1关于物理命题关于物理命题 2013-11-14 2一、命题要想好些问题二、命题要注意的问题三、双向细目表3试卷在教育科研方面的功能试卷在教育科研方面的功能(1 1)导向功能)导向功能 各级各类学校都要实现国家规定的培养目标,测试各级各类学校都要实现国家规定的培养目标,测试对学校实现目标具有明显的导向作用,它能对学校对学校实现目标具有明显的导向作用,它能对学校教学改革定向导航,并提供动力保证教学改革定向导航,并提供动力保证 引导教师的日常教学引导教师的日常教学引导课程改革,倡导课程理念引导课程改革,倡导课程理念引导考试评价制度的改革引导考试评价制度的改革4在一份试卷中,如果某一难度档次的试题所
2、占的分数在一份试卷中,如果某一难度档次的试题所占的分数越多,就越能把与这一档次水平相当的学生的考分拉越多,就越能把与这一档次水平相当的学生的考分拉开。与此相反,如果某一难度档次的试题分数越少,开。与此相反,如果某一难度档次的试题分数越少,则将促使与这一档次相当的学生考分相互接近则将促使与这一档次相当的学生考分相互接近。(3 3)选拔功能)选拔功能测量结果具有极大的研究价值,它是教学改革实验中测量结果具有极大的研究价值,它是教学改革实验中检验其成效的必要环节和基本手段而且测试本身就检验其成效的必要环节和基本手段而且测试本身就是一种严肃的科学探讨是一种严肃的科学探讨 (2 2)研究功能)研究功能5
3、与命制一套试题相关的问题与命制一套试题相关的问题 相应概念相应概念考什么能力考什么能力 测量目标(细目表)测量目标(细目表)考什么内容考什么内容 内容标准(课标)内容标准(课标)用什么材料考用什么材料考 试题情景(编题)试题情景(编题)用什么方式考用什么方式考 题型题型问什么问题问什么问题 设问(具体试题)设问(具体试题)怎么回答怎么回答 应答规定应答规定给多少分给多少分 赋分赋分/ /评分评分难度预估难度预估 预估难度预估难度6判断内容标准重要与否,取决于: 课程标准规定 课程标准规定的课时数学科学科内容标准内容标准分分值值比例(比例(%)物理物理物质物质5运动和相互运动和相互作用作用40能
4、量能量457A、试题应该考查课程标准中规定的 内容标准 不能超标如果考生在完成试题任务过程中,没有用到相关学科内容领域的知识,那么考生表现出的就不是与学 科相关的特定行为,而是源自生活经验或课程标准以外知识的行为。其考试结果就无法成为推测考生掌握该学科知 识、技能情况的依据。8例:如图是一列电磁波的波形图,如图是一列电磁波的波形图,A、B间的距离为间的距离为750m,则这列波的波长,则这列波的波长为为_m,频率为,频率为_Hz(电磁(电磁波的传播速度等于光速)波的传播速度等于光速)(在给出公式的条件下,作简单计算,有超标嫌疑) AB9B、不要考不重要、很次要、或学生 都已掌握的内容 大规模教育
5、考试是抽样测评,理论上我们应该要求大规模教育考试是抽样测评,理论上我们应该要求考生尽可能多地完成试题,这样才能对考生的心理考生尽可能多地完成试题,这样才能对考生的心理特质做出比较有效的推测。特质做出比较有效的推测。 由于时间限制,我们要求考生完成的试题仅仅由于时间限制,我们要求考生完成的试题仅仅是所有可能的学科是所有可能的学科 试题集合中很少的一部分。我们试题集合中很少的一部分。我们需要用这很少一部分试题来推测考生需要用这很少一部分试题来推测考生 的心理结构或的心理结构或能力。能力。 从测量的角度看,就是用一个相对较小的样本,从测量的角度看,就是用一个相对较小的样本,做出推测。因此,选择的样本
6、就必须有代表性,即做出推测。因此,选择的样本就必须有代表性,即试题涉及的应该是学科的重要的内容领域。反之,试题涉及的应该是学科的重要的内容领域。反之,试题样本缺乏代表性,就不能将考试结果解释为学试题样本缺乏代表性,就不能将考试结果解释为学科能力的标志。科能力的标志。 10C、情景材料应该有教育意义 尽管试卷和试题不是教材,但它们仍然承载着教育功能,我们不能漠视试题和试卷的这种教育功能。 考生的世界观、价值观、人生观尚未定型,还处在人生的发展、变化的阶段。大规模教育考试是高利害考试,考生对考试中阅读的每一道试题的材料的印象可能远比其他材料深刻,这种材料可能会对考生产生更大的影响。 11例如:辽宁
7、号例如:辽宁号大连号大连号海洋号海洋号例如:神州十号例如:神州十号 12D、情景材料不能产生公平性问题考生经过情境材料刺激后,表现出的差异只能与预设的测量目标和相关的内容标准相关,与其他任何因素无关。这些因素有: 年龄、性别、地域、民族、家庭背景和生活经历差异v背景知识的差异v情景材料中的新概念、原理、方法等v材料的主题、内容、文体等方面的差异 13E、挑选的材料应该与学生学习经历过的材料有点类似性或是全新的材料如果使用的材料考生很熟悉,或者在平时的复习训练中经常用到过,测量的行为目标就可能转化为测量记忆内容,这样测量结果的效度就会降低。 材料在形式上或在内容主题上与考生复习训练中见过的材料不
8、相同,但涉及的概念、原理、获取信息的方法、解决问题的方法等应该是相同的或相似的 课本、报纸、新闻、学术刊物、硕士研究生论文和各种参考材料中,挑选一部分进行修改一般可以获得满足要求的材料。 命题教师只有了解学校的教学和学生的学习生活,选择的材料可能更有针对性。 14F每一道试题只能测量一个行为目标每一道试题只能测量一个行为目标例:(1)如图所示,R1=5、R2=10的两个电阻并联在电路中,闭合开关,电流表的示数为1.2A,求电路中的总电流;(2)根据串联电路的特点推导出串联电路的总电阻【行为目标】 第(1)题,理解串、并联电路电流的特点;第(2)题,能运用串联电路的特点推导出串联电路的总电阻。
9、R2R1AS15G 试题应该有明确的刺激情境试题应该有明确的刺激情境例如:例如: 下列说法正确的是下列说法正确的是 ( ) A光在同种均匀介质中沿直线传播光在同种均匀介质中沿直线传播B光的频率越大,波长越大光的频率越大,波长越大C光的波长越大,光子的能量越大光的波长越大,光子的能量越大 D光在真空中的传播速度为光在真空中的传播速度为3.0108m/s 例如:下列关于光的传播的说法正确的是例如:下列关于光的传播的说法正确的是 ( ) A光在同种均匀介质中沿直线传播光在同种均匀介质中沿直线传播B光只有在真空中是沿直线传播的光只有在真空中是沿直线传播的C光的传播速度是光的传播速度是D光的传播速度为光
10、的传播速度为3.0108m/s 16 H 选择情境材料必须考虑测量的认知目标和涉及的内容领域选择情境材料必须考虑测量的认知目标和涉及的内容领域 编撰试题前首先要考虑试题准备测量什么心理特质,该心理特质与哪个测量目标及行为目标相关,希望考生用什么内容领域的知识来解决问题。 试题的情景材料以及相关的设问必须诱导考生表现出相应的心理特质,为推测考生心理特质提供数据。 在实际命题过程中,相当多的命题教师在选择材料时,并未考虑要测量的行为目标,一般考虑较多的是要考什么学科内容。这样选择出来的材料往往不能测量设计的行为目标,达不到命题要求。 17 I 用新情境材料考查高水平的学习能力,不要用与教材相同的语
11、言,以免考查学生的简单记忆能力。 J 情境材料的呈现方式应该多样化。 应该用清晰、明确的语言和(或)图表表述情境材料。18二、试卷评价中的几个基本概念二、试卷评价中的几个基本概念1、信度、信度2、效度、效度 3、难度、难度4、区分度、区分度191、信度、信度(1 1)定义:测试结果的可靠性称为信度)定义:测试结果的可靠性称为信度 信度是指测量的一致性,如果专对考试而言,信度是指信度是指测量的一致性,如果专对考试而言,信度是指 不同次考试分数的一致性。不同次考试分数的一致性。通俗地说,信度就是考试成通俗地说,信度就是考试成 绩的可靠程度。绩的可靠程度。 测量学上认为:考试结果仅仅是在某一特定的时
12、候获得的测量学上认为:考试结果仅仅是在某一特定的时候获得的 考生行为的有限的测量。如果不能说明在不同的考试、不考生行为的有限的测量。如果不能说明在不同的考试、不 同的评分者、或同一行为领域不同的测试任务的情况下,同的评分者、或同一行为领域不同的测试任务的情况下, 测量结果的一致性,就不能认为考试结果是可靠的。测量结果的一致性,就不能认为考试结果是可靠的。20(2 2)影响信度的主要因素)影响信度的主要因素. . 考试方法因素考试方法因素题型题型 个人特质个人特质 随机因素随机因素 欺骗欺骗认知方式认知方式背景知识背景知识人群特征人群特征动机水平动机水平精神和情感状态精神和情感状态无法控制的考试
13、环境上的差异等无法控制的考试环境上的差异等作弊、舞弊等作弊、舞弊等考试设计、命题中要消除前两个因素的影响;考务安排中考试设计、命题中要消除前两个因素的影响;考务安排中要尽量减少后两个因素的影响。要尽量减少后两个因素的影响。212、效度、效度(1 1)定义:)定义:效度是指根据考试分数所作出的特定的推测的效度是指根据考试分数所作出的特定的推测的 适当、有意义和有用程度。适当、有意义和有用程度。 效度指的是考试结果解释的合理性,它不是指考试本身。效度指的是考试结果解释的合理性,它不是指考试本身。 我们有时出于方便,说我们有时出于方便,说“考试的效度考试的效度”,实际上正确的说,实际上正确的说法法
14、是对考试结果所做的解释的效度。是对考试结果所做的解释的效度。 效度是就程度而言的,不是要么有效,要么无效。因此,效度是就程度而言的,不是要么有效,要么无效。因此, 不要说考试结果有效或无效,而应该从确定程度的类型的不要说考试结果有效或无效,而应该从确定程度的类型的 角度来考虑效度,如高效度、中等效度和低效度。角度来考虑效度,如高效度、中等效度和低效度。 效度总是与考试结果的解释或某种特殊的用途有关。世界效度总是与考试结果的解释或某种特殊的用途有关。世界 上没有对所有目的都有效的考试。在讨论效度时,必须考上没有对所有目的都有效的考试。在讨论效度时,必须考 虑对考试结果所做出的专门解释或用途。考试
15、结果对做出虑对考试结果所做出的专门解释或用途。考试结果对做出 的每个不同的解释都有不同的效度。的每个不同的解释都有不同的效度。理解效度的概念理解效度的概念, ,知道怎知道怎样的试卷样的试卷( (题题) )的效度较的效度较高、中等、较低等高、中等、较低等22(2)(2)内容效度:内容效度是指测验内容与预定要测的内内容效度:内容效度是指测验内容与预定要测的内容之间的一致性程度也可以说是指测验内容对所要测容之间的一致性程度也可以说是指测验内容对所要测验的全部内容的取样代表性程度验的全部内容的取样代表性程度(3)(3)构想效度:构想效度是指测验成绩能够解释心理学构想效度:构想效度是指测验成绩能够解释心
16、理学理论上的某种结构或特质的程度。理论上的某种结构或特质的程度。 考试是从认知心理学的角度来看待考试结果反映考生心理考试是从认知心理学的角度来看待考试结果反映考生心理 结构的程度,也就是说从考察学生回答问题时发生的心理结构的程度,也就是说从考察学生回答问题时发生的心理 过程或思维过程的角度来看待结构效度的。使用某些问题过程或思维过程的角度来看待结构效度的。使用某些问题 或试题来测量思维能力时,需要问题或试题能够引发考生或试题来测量思维能力时,需要问题或试题能够引发考生 进行一定的思维活动,这个活动反过来引发考生显示出我进行一定的思维活动,这个活动反过来引发考生显示出我 们希望考生显示的行为。只
17、有在这样的情况下,问题才是们希望考生显示的行为。只有在这样的情况下,问题才是 有效的,得到的结果才能是考生某一心理结构的测度。有效的,得到的结果才能是考生某一心理结构的测度。 23 3、难度、难度(1 1)定义:)定义:难度是指试卷的难易程度。难度是指试卷的难易程度。(2 2)难度的计算:)难度的计算:P P= =R R/ /N N (客观题)(客观题) 或:或:P P= =X X/ /W W (主观题)(主观题) 式中式中: :P P:为难度值;:为难度值;R R:为答对该题的人数;:为答对该题的人数;N N:为参加:为参加 测试的总人数测试的总人数 ( (客观题客观题) ) P P:为难度
18、值;:为难度值;X X:该题的平均得分;:该题的平均得分;W W:为该题的满:为该题的满 分分 ( (主观题主观题) )P P值一般小于值一般小于1 1,P P值越大,表示试题越容易值越大,表示试题越容易. . 0.990.990.900.90:易:易0.890.890.800.80:较易:较易0.790.790.600.60:中等:中等0.590.590.400.40:较难:较难0.390.390.300.30:难:难理解难度的概念,知理解难度的概念,知道难度的计算方法道难度的计算方法24(3 3)难度与测试成绩的分布)难度与测试成绩的分布测验分数集中在高分端测验分数集中在高分端呈负偏态呈负
19、偏态测验分数集中在低分端测验分数集中在低分端呈正偏态呈正偏态25 4、区分度、区分度(1 1)定义:)定义:区分度是指测验对考生实际水平的区分程度区分度是指测验对考生实际水平的区分程度. (2 2)区分度的计算:)区分度的计算:D D= =P PH HP PL L (客观题)(客观题) 或或: : D D= =(X XH HX XL L)/ /N N(H HL L)(主观题)(主观题) 式中式中: :D D: :为区分度;为区分度;P PH H为高分组通过率;为高分组通过率;P PL L为低分组通过为低分组通过 率率 ( (客观题客观题) ) D D: :为区分度;为区分度;X XH H为高分
20、组测验总分;为高分组测验总分;X XL L为低分组测为低分组测 验总分;验总分;H H为该题最高得分;为该题最高得分;L L为该题最低得分;为该题最低得分;N N 为考生总人数的为考生总人数的25%25%最好知道区分度的最好知道区分度的概念和计算方法概念和计算方法26客观题区分度计算步骤:客观题区分度计算步骤: (1 1)由测验总分由高到低排序)由测验总分由高到低排序 (2 2)确定测验总分最高的)确定测验总分最高的27%27%的被试为高分组,最低的的被试为高分组,最低的 27%27%的被试为低分组的被试为低分组 (3 3)分别求出这两组被试通过的百分比)分别求出这两组被试通过的百分比 (4
21、4)将算得的有关数据代入)将算得的有关数据代入D D= =P PH HP PL L中中 主观题区分度计算步骤:主观题区分度计算步骤: (1 1)由测验总分由高到低排序)由测验总分由高到低排序 (2 2)确定测验总分最高的)确定测验总分最高的25%25%的被试为高分组,最低的的被试为高分组,最低的 25%25%的被试为低分组的被试为低分组 (3 3)统计高、低分组的该题所得总分和该题的最高、)统计高、低分组的该题所得总分和该题的最高、 最低得分最低得分 (4 4)将有关数据代入区分度计算公式)将有关数据代入区分度计算公式0.40.4以上:好以上:好0.300.300.390.39:良好,如能改进
22、则更佳:良好,如能改进则更佳0.200.200.290.29:尚可,仍需再改进:尚可,仍需再改进0.190.19以下:劣,必须淘汰或加以修改以下:劣,必须淘汰或加以修改27 (一)试卷研制的基本程序(一)试卷研制的基本程序 多次循环,直至满意多次循环,直至满意结构设计结构设计难度设计难度设计编题编题双向细目表双向细目表评分标准评分标准素材素材拼题组卷拼题组卷试题设计试题设计审校成卷审校成卷确定测试范围、难度比例、题型等基本要求;确定测试范围、难度比例、题型等基本要求;亮点试题的编制;亮点试题的编制;重点试题的编制;重点试题的编制;填写双向细目表;填写双向细目表;查补和调整;查补和调整;修改和确
23、定修改和确定 四、试卷的研制四、试卷的研制28v受测试时间和试题容量的限制,教育测验不可能覆盖所有受测试时间和试题容量的限制,教育测验不可能覆盖所有教育内容。教育测验内容只是教育内容的一个很小的抽样,教育内容。教育测验内容只是教育内容的一个很小的抽样,因此,良好的测验必须使测验试题的取样对教育内容和教因此,良好的测验必须使测验试题的取样对教育内容和教育目标有较高的代表性。测验试题要既能覆盖全部的教育育目标有较高的代表性。测验试题要既能覆盖全部的教育内容又能反映各部分内容和各认知层次的相对比重,通过内容又能反映各部分内容和各认知层次的相对比重,通过命题双向细目表可以较好地实现这样的要求。命题双向
24、细目表可以较好地实现这样的要求。命题双向细命题双向细目表就是设计测验的蓝图,它由测验目标、测验内容,预目表就是设计测验的蓝图,它由测验目标、测验内容,预设难度,测验目标和测验内容的比例,呈现题型等多个要设难度,测验目标和测验内容的比例,呈现题型等多个要素构成。素构成。(见双向细目表实例见双向细目表实例)。)。有时双向细目表可能是有时双向细目表可能是多个。多个。(1)双向细目表)双向细目表29一、双向细目表的突出特点在于:一、双向细目表的突出特点在于:v1、反映题型与难度、测验内容之间关系、反映题型与难度、测验内容之间关系v2、反映测验内容与测验目标关系、反映测验内容与测验目标关系v3、反映测验
25、内容与测验目标、题型之间关系、反映测验内容与测验目标、题型之间关系30三、三、 制作双向细目表的程序如下:制作双向细目表的程序如下:(1)列出课标的细目表 任何测验,都是针对具体的学科内容进行的。教学中要求学生掌握哪些知识内容,不同知识内容在该科教学中的相对重要性有多大,不同知识内容所应实现的知能目标是什么。这些都是测验设计中必须解决的问题。所以在编制细目表时,应先列出课标的细目表。31(2)列出各部分内容的权重 应根据教学内容在整体学科中的相对重要性,分配相应的比重。比重多以百分比表示。这个分配的百分比例,既是教学时间、精力分配的比例,也是测验试题数量、考试时间、分数分配的依据。这个比例,就
26、是说的“权重”。32(3)列出各种认知能力(学习水平)目标的权重 测验题不仅要对学科内容具有足够的覆盖率,也要涵盖所确定的学习水平目标,即识记、理解、应用、分析、综合、评价六级目标,应根据教学内容特点,对六级不同目标合理权重。确定目标权重时,除考虑学科特点外,还应适当强调高级目标的相对重要性,通过对这类目标分配以较大的权重,可以促进学生的智能发展。 33(5)审查各考查点的分配是否合理 审查包括两个方面:审查各级学习水平所占百分比的分配是否合理;审查各知识内容及各单元内容所占百分比是否合理。 通过以上的工作,就使试卷的内容效度有了可靠的保证,从表中就可以看出 34v同时应由命题人员单独、正式地
27、对试题解答一遍,以发现问题,加以改正。命题人员作答时,要注意以下几个问题:v (1)有效性。即测验题必须反映测验目的和测验内容方为有效。测验题反映测验内容越好,其有效性越高(同时也要看是否体现命题原则)。v (2)时间性。作答时间是否够用。比如100分钟的考试时间,出题人认真读题、认真作答应在5 0分钟内完成。v (3)合理性。答题量与赋分值是否合理,答题时间应和分值成正比。试题难度大、作答时间较长的,分值应大一些,反之亦然。 35v(4)简明性。文字表述是否易懂,要求文字表述一定简明,选用常用词,不用生造词,多用简单陈述句,少用多重复式句,特别注意尽量避免使用否定句。v (5)准确性。表述准
28、确,用词恰当,概念、原理引用正确不能含糊或有误,图表清晰、计算条件充分,包括标点符号、字母的正体、斜体使用都要准确。(如物理学科中:物理量为斜体,单位符号为正体)v (6)鉴别性。难度分布是否合理。36v(7)独立性。不出现相同或近似的试题,各题彼此独立,不能有相互启发的现象,试题与试题之间互不提示答案。v (8)针对性。试题要符合年龄特征,使试题的文字表述、信息量和作答方式适合于被试者。v (9)答案的科学性。这是最后必须重点看的内容,答案是否科学、合理,有没有争议,是否规范,评分是否可操作,是否易于控制评分误差。v 总之,制定命题双向细目表是一项非常复杂的工作,应严格遵循有关工作程序开展,以防止疏忽出错。37p 经常不断地学习,你就什么都知道。你知道得越多,你就越有力量p Study Constantly, And You Will Know Everything. The More You Know, The More Powerful You Will Be写在最后38Thank You在别人的演说中思考,在自己的故事里成长Thinking In Other PeopleS Speeches,Growing Up In Your Own Story讲师:XXXXXX XX年XX月XX日