试题编制原理及方法课件.ppt

上传人(卖家):三亚风情 文档编号:2867331 上传时间:2022-06-06 格式:PPT 页数:103 大小:1.05MB
下载 相关 举报
试题编制原理及方法课件.ppt_第1页
第1页 / 共103页
试题编制原理及方法课件.ppt_第2页
第2页 / 共103页
试题编制原理及方法课件.ppt_第3页
第3页 / 共103页
试题编制原理及方法课件.ppt_第4页
第4页 / 共103页
试题编制原理及方法课件.ppt_第5页
第5页 / 共103页
点击查看更多>>
资源描述

1、试题编制的原理与方法试题编制的原理与方法蔡铁权浙江师范大学课程与教学研究所一、试题类型二、小学数学核心素养三、试题背景材料的选择四、试题编制的质量要求五、客观性试题的编撰六、主观性试题的编撰七、开放性试题的编撰八、TIMSS和PISA评价项目简介常模参照考试 常模参照考试的主要目的是对学生进行排序。设计常模参照考试的基本出发点是考试结果能够有效的区分出学生的能力水平差异,并根据这个差异,从高分到低分对考生进行排序。常模参照考试结果确定的是考生在考生群体中的相对位置。常模参照考试试题的主要目的是要将不同的考生区分开。我国的高考就是通常意义的常模参照考试,大家熟知的美国SAT、TOEFL、GRE等

2、考试都是常模参照考试。标准参照考试 标准参照考试的目的是要确定学生知道什么,能够做什么,而不是对学生进行相互比较。标准参照考试根据考生在某个标准确定的目标上的表现水平来评价考生,通常对于教育考试而言,这个标准应该是课程标准。根据标准参照考试的考试结果,确定的是考生达到标准规定的水平。标准参照考试试题的主要目的是要确定考生的水平,因此试题必须以标准的目标和水平要求为依据。20世纪70年代到80年代,标准参照考试有两个涵义(Koretz D.M & Hamilton L.S,2006):(1)根据学生知道的知识报道考试结果;(2)采用划界分数(Cut Score)确定考生的等第。基于标准的教育考试

3、 基于标准的教育考试(Standards-based Assesment)的发展与美国兴起的基于标准的教育改革运动的发展密不可分。 基于标准的教育改革的一个核心思想是:制定严格的课程标准,建立与课程标准调整一致的考试(Koretz D.M & Hamilton L.S,2006)。这一考试评价具有以下重要的特征:(1)考试的内容规范的确定与课程的内容标准(content standards)调整(alignment)一致。(2)根据课程的表现标准(Performance Standards)报道学生在内容标准规定的知识、技能的学习方面达到的学业水平(因此,基于标准的考试又被称为水平参照考试)。

4、(3)在实际考试操作中,采用划界分数将学生的考试结果转换为与表现标准模式相一致的等第。(4)考试应该对学校教师的教学和学生的学习产生明显的影响,即利用基于标准的教育考试驱动课程教学和学生的学习。小学数学核心素养的构成(1)数学交流 数学素养是个体对个人的、社会的、职业性的、科学性等各种情境进行数学表述、运用和阐述的能力。经济合作与发展组织提出的学会与工具、与自己、与社会的互动指标也强调互动能力是核心素养的关键,是公民适应生活所需的共同素养。而且数学作为一种共同、共通的语言,不仅有助于人们与工具、与自己、与社会的交流互动,更能成为个体认识与理解世界的重要视角。(2)数学推理 推理作为理解抽象概念

5、的工具,是数学的基础及基本的 思维方式。小学阶段的数学推理主要主要包括含有归纳、类比等以经验和直觉为依据的合情推理,以及以确定法则为依据的演绎推理。通过观察、实验、分类活动逐步获得逐步获得对事物模式的识别形成猜想,以证据为基础对猜想进行判断或举出反例,并能对数学关系进行简单的推理。(3)运算能力 运算能力是学生数学学习的基础,也是日常生活必须的基本技能,包括笔算、心算、估算等这能培养学生有理有据、实事求是的科学精神,形成程序化的思考习惯,体会数学的简洁美。(4)空间观念 空间观念是对物理的形状、大小,物体与物体之间的方向、距离及其位置关系的一种直觉,有助于学生感知和把握对象的形态与变化,能对事

6、物的基本特征、位置关系、运动变化有初步的感知。(5)数据分析能力 面对大量复杂的数据,有能力从中发现规律,获取有意义的信息,对不实的信息进行批判,对信息加以解读和分析。养成学会用数据说话,同时形成求实的精神。(6)数学建模 现实世界中,很多问题和现象中存在着大量的关系和规律,可以从中抽象出恰当的 数学关系,将实际问题转化为数学问题,运用数学方法建立一个近似描述问题的数学结构,即模型。运用恰当的数学方法和工具,对数学问题求解。任何一道数学试题要求考试完成的思维任务或操作活动都是置于一定的背景材料之中的,因此,考生对背景材料的理解,对其完成试题要求的任务至关重要。从大量的考试试题分析中可以发现,试

7、题背景材料选择不当,往往是发生试题功能偏差试题在不同的考生群体间表现出与考试目的无关的功能性差异的重要来源之一。试题背景材料的选择(一)试题背景材料选择的基本考虑1背景材料应该与考试的测量目标以及试题欲测量的行为目标相关 考试结果解释和使用的效度完全取决于测量目标的实现程度,而考试测量目标的实现程度,又依赖于每道试题是否能够引导考生表现出试题要测量的行为。从这个意义上说,试题的背景材料给考生提供了一个统一平台上进行“表演”的机会。 许多不同种类的背景材料都可能引导考生表现出考试测量目标所要求的行为。然而,考试中试题所使用的材料应该是各类考生群体能够理解的材料,材料本身一般不会成为阻碍某一或某些

8、群体展示其能力的因素。如果选择的背景材料只有部分学校的考生很清楚或者居住在某个地区的考生很清楚,其他的考生不太容易获得详细的关于背景材料的信息,则这样的背景材料可能会导致试题功能偏差和考试的不公平。 在这种情况下,考试机构应该根据课程标准对学生的学习经历要求,对背景材料的选择做出决定。这样可以相对比较可靠地避免试题背景材料的选择给生活背景不同的考生群体造成应答障碍。2背景材料应该与考生的学习经历和生活经历相适应3背景材料提供的信息类型 从背景材料包含的信息与学生的学科知识关系看,材料中信息可分为有新知识的信息和无新知识的信息,有新知识的信息是指背景材料中包含考生未学过的知识,考生只有将材料中的

9、新知识整合到其现有的知识体系中才能应用的信息。 当背景材料中包含有新知识信息时,要考虑的一个重要问题就是考生的现有知识在深度和广度方面的局限性,他们能否理解这些新的知识,能否将新知识整合到现有的知识体系中;另一个问题是新知识的构建能力是否包含在试题要考查的行为中,如果不包括在其中,应考虑不要因为考生现有知识的局限而影响其考试成绩。 背景材料的信息量对考生完成指定的考试任务也非常重要。试题背景材料的信息量一般是正好。有时,命题教师为了考查学生选择信息的能力,提供的信息有较大的冗余,需要学生进行选择,并剔除多余的信息;有时信息不足,需要从其他方面获得信息,以完成指定的任务;有时提供的信息对考生完成

10、任务毫无帮助。 如果在试题中,要给考生过多的信息,让其进行选择和剔除,就需要考虑所要测量的行为目标的类型和完成考试任务的时间限制。如果给考生的信息不足,应该考虑考生能否从其信息储备中获得这些信息,以及推测的能力的类型。如果不考虑试题测量的行为目标的类型,很可能会导致考试的多维性,无法对考试结果做出确切的解释,降低考试的效度。因此,如果试题不是用来考查学生选择和处理信息的能力的话,一般背景材料中不要给考生冗余信息或信息不足。4背景材料的信息量 试题背景材料的信息与考生应答之间的关系主要包括两个方面,即关系的范围和关系的直接性。 关系的范围指的是完成试题的应答必须加工、处理的信息的数量,包括宽泛范

11、围和狭窄范围。宽泛范围任务要求考生加工处理的信息量大。狭窄范围只要求考生加工少量的信息就可完成任务。一般要求考生加工处理的信息量大的背景材料不要太多,太多了可能难以避免考生处理背景材料的能力对试题测量能力类型的影响。 关系的直接性是指期望的应答对所提供的信息的依赖程度,或者考生是否必须依赖其本身的背景知识来完成任务,包括直接关系和间接关系。直接关系指考生只需要依赖提供的信息就可完成应答。间接关系指背景材料只提供了考生完成任务所需的一部分信息。一般情况下,试题最好要求考生直接依赖试题材料提供的信息完成应答,某些间接的信息可以不提供给考生。5背景材料提供的信息与应答间的关系6背景材料的呈现方式应该

12、多样化 试题的背景材料有很多种类,最常见的是文字材料,此外图片和图表材料也是经常使用的背景材料,如各种数据示意图、几何图、统计图、结构图、数据表格等。试题的背景材料应该多样化,不要都是文字材料,也不要都是图示材料或图表材料。 要求试题背景材料呈现方式的多样化有两个方面的原因。 第一,这样可以使试卷卷面更加活泼、美观,增加考试的亲和力,提高考生应试的兴趣,使考生不至于因阅读大量文字材料感到疲劳、乏味,而影响水平的发挥。 第二,更重要的是以不同形式出现,可以使某个方面偏强的考生不会太讨巧。某些方面偏弱的考生有机会弥补其薄弱环节。例如,某些考生如果文字阅读能力比较强,则试题材料以文字形式呈现对其有利

13、;而文字阅读能力较弱的考生显然处于不利地位。 有时,同样的材料既可以用文字形式表示,又可以用图示形式表示,而且不同形式的材料都可以很好地服务于试题测量的行为目标,且材料都为考生所熟悉,如果对材料信息的处理能力不是试题要测量的行为目标,那么最好选择对材料加工要求较低的材料。7对背景材料的修改 对背景材料的修改应该以正确、简明、与测量目标相关性更大和模糊材料来源为原则,尽管有些材料(如图、表、数据)可以不经修改,拿过来就用,但大多数材料,尤其是文字材料,通常都需要进行修改才能够成为试题的背景材料。修改材料应该使其更加简明;在有错误的情况下,应该对其进行更正;修改材料的目的是为了达到试题的测量要求,

14、因此,修改材料应该使其与测量目标相关性更大。 此外,对材料的修改应该尽量让考生看不出材料的原始来源,以防止材料来源部门进行不必要的炒作。(二)如何对试题背景材料的选择作出规定 对试题背景材料的选择作出规定时,最为困难的是材料的类型。命题教师不希望选择的材料对任何一个群体产生不利。因此,选择材料的一个基本原则就是能够贴近学生的学习经历和生活经历。然而,学生的学习经历、生活经历与其就读的地区、学校和家庭密切相关,材料的选择很难同等程度地贴近每一考生的亚群体。在这种情况下,比较明智地是以课程标准提出的学习经历的要求为原则,选择背景材料,最大限度地保证所选材料的公平和公正。试题编制的质量要求试题的编制

15、不是随意的,试卷命题的质量直接关系到根据测验进行评估的有效性和正确性,对测验卷而言,其主要性能指标有信度和效度,对试题而言,其主要性能指标有难度和区分度。(一)信度的涵义及其计算方法信度(reliability)是指测验结果的可靠性程度,即测验所得的结果(实测分数)与学生实际水平(真分数)间的一致性程度。一次好的测验,如同一把好的尺子,对同一对象进行多次测量其结果仍保持不变。但在真实测验中,由于种种因素,如考生的紧张、焦虑,评分教师的主观因素等,实测分数和学生的真分数间总是存在测量误差,测量误差越小,则测验信度越高,信度实际上是对测验误差程度的一种描述。理论上,可以使用同一份试卷对同一组被试进

16、行两次测验,或者也可以编制两份平行测验卷让同一组被试进行测验,再来分析测验的信度,相应的,信度系数计算方法有:稳定性系数、等值性系数、等值稳定性系数、内部一致性系数、评分者一致性系数。1稳定性系数稳定性系数又称重测系数,是指用同一个测验在不同时间对同一组被试进行测试而得到的两次实测分数的相关系数。它的前提是两次测试的时间间隔不宜太长,因此假设学生在这小段时间内基本上未发生变化,所以测得的结果应该相对一致,也即测验结果应具有稳定性。学生在两次测验中的相对水平基本一致,即第一次高分的学生在第二次测验中也应有获得高分的趋势,这种稳定性表明测验是可信的。计算方法如下:其中,x和y分别是第一次和第二次测

17、试的分数,xy和 分别是两次测试的平均值,N是被试人数。NyyNxxNyxxyyyxxyyxxrxy/)(/)(/)()()(2222222等值性系数等值性系数,是运用两个互相等值(指难度、区分度、题型等因素尽可能相同),具体题目不同的两个测验,在最短时距内对同一组被试进行两次测试,以两次测试结果的相关系数计算的信度系数。此系数计算方法与稳定性系数计算法相同。3等值稳定性系数等值稳定性系数,类似于等值性系数,但相比于等值性系数,它是在适当长的时间内对同一组被试进行测试而得到的结果的相关系数,它能同时反映出试题内容的变化和被试知识积累等方面对其测试成绩的影响程度。计算法也与稳定性系数计算法相同。

18、 内部一致性系数是同一个测验的两个部分的得分之相关系数,它描述的是测验内部各题得分的一致性程度。这种方法在实际应用中比较多,因为人们都希望通过一次测验来估计测验的信度。其计算方法主要有两种:(1)分半法;(2)同质性法。(1)分半法 它是将测验平行地分成两份,如按编号分成成奇数题和偶数题,比较被试这两部分的实测分数间的相关性,进而来估计测验的信度。 根据分半法得到分测验 和 ,计算出相关系数 和 。计算公式同稳定性系数计算法,它代表的是半个测验的信度,因此需通过斯皮尔曼布朗公式进行矫正,矫正公式为:21xxr21xxr1x2x212112xxxxxxrrr 才为整个测验的信度。xxr4内部一致

19、性系数(2)同质性法 它是分半法的拓展,将一份试卷分成n个平行的部分,求这些平行部分的一致性程度,计算法如下:2121) 1(1xxxxxxrnnrr rxx为整个测验的信度,rx1+x2为n个平行部分的任意两个间的相关系数。当n=2时即为分半法的计算法。如把测验中的每个试题都看做是平行的,则计算法变为)1 (121xniiixxqpnnr其中,n为测验总题数,pi与qi分别为第i道试题上的答对率和答错率, 是测验总分的方差,这就是著名的库德查理森公式(KR-20)。该公式仅适用于估算由“对、错”分为两级评分的选择题组成测验卷的信度。2x)1 (1212xnixxxinnr一般测验都是由各种题

20、型的试题组成的,每个试题的满分也不一定相同,此时,计算法为:其中,n为测验的总试题数, 为第i题各被试得分方差, 为所有被试测验总分的方差,这就是著名的科隆巴赫 系数公式。ix22x5评分者一致性系数 在一般大规模考试中,为了保证评分的客观性,经常需要两个以上评分者对评价对象进行评分。如高考作文评分过程中,就由两名以上的教师对同一篇作文进行评分,以减少教师的主观判断的影响。因此,需对评分者的一致性程度进行考察。一般有三种计算方法:(1)斯皮尔曼等级相关法;(2)肯德尔和谐系数法;(3) 系数估计法。(1)斯皮尔曼等级相关法 两位评分者评N份试卷或同一名评分者先后两次评N份试卷时,可用斯皮尔曼等

21、级相关系数来计算评分者一致性系数,计算法为:) 1(6122NNDrxx其中,D为两位评分者对同一份试卷所评等级之差,N为试卷分数。(2)肯德尔和谐系数法 当两个以上评分者评N份试卷时,需要采用肯德尔和谐系数作为评分者信度的估计,计算法为:)(12132NNKSSWR 其中,W为肯德尔和谐系数,K为评分者人数,N为被评试卷总数,SSR表示R的离差平方,即NRRRRSSR222)(其中,R为每一个被试被评等级之总和。(3) 系数估计法 当两个以上的评分者对一组被试的测验结果评定时,此时评分者的可信度可用科隆巴赫 系数公式进行计算。(二)效度的涵义及其评估 效度(validity)即测验结果的有效

22、程度,就是测验实际所能测量出的所要测量的特性或能力的程度,即测验的正确性程度。例如,在某次数学测试中,我们想测量学生解决问题的能力,测出的竟是文字的理解能力,或者其他能力,那么此次测验的有效性就很低。 本质上说,效度描述的是测量结果与测量目的的关联程度。 内容效度是指测验的内容代表所要测量内容领域和学生预期反应的程度。对于数学学科而言,“所要测量内容领域”是指数学课程标准中设定的全部教学内容,“学生预期反应”是指学生学习这些内容后产生的效果或预期达到的程度,如对知识点的记忆、理解、掌握、应用等。 关于内容效度值的计算,目前还没有有效的公式。判定内容效度常用的方法是由数学专家教学专家根据所要测量

23、的能力的定义和内容范围的界定,以及各部分内容、目标所占的权重,对测验与所要测量的属性或教学目标进行比较,这种方法的缺点是专家教师的判断会带有一定的主观性。 也可以通过制作双向细目表来检验内容效度,如前面所制的“相互作用与运动规律”的双向细目表,分别由测验内容和测验知识的行为目标作为细目表的两维,如此就可以清楚地了解测验内容所代表预测内容的程度。1内容效度ix 校标关联效度是用测验分数和校标之间的相关系数表示测验效度的高低,校标就是检测效度的参照标准。测验与当前校标之间的关联程度称为同时效度,测验与将来校标之间的关联程度称为预测效度,这两者统称为校标关联效度。如用数学高考成绩作为校标来检验高中数

24、学会考成绩,两者之间的相关系数就是高中数学会考的同时效度,而用大学一年级的数学成绩作为校标来检验高考数学成绩,两者之间的相关系数就是高考的预测效度。 校标关联效度的计算方法主要是通过计算各种相关系数而求得。在一般测验中,常用学生近期若干次数学考试的平均成绩作为校标分数,计算某次测验的实测分数与校标分数之间的关系系数来估计校标关联度,计算公式如下:niniiiiniiyyxxyyxxr11221)()()( )(为n个学生的考试分数为n个学生的校标分数 iy 、 为相应的平均分xy2校标关联效度一般认为r 值大于或等于0.45即可(三)难度的涵义及其计算方法难度(item difficulty)

25、,也称容易度(facility),简单地说,即是指题目的难易程度,具体可描述为学习者对某道题目所做回答的正确答案的比例或百分比。比如在一测验中的一道题目,如果大多数的考生能答对,那表明该题的难度较小,相反,如果只有极少数的考生能作答,则说明该题的难度较大。根据测验题目的类型及分数特征,有两种计算难度的具体方法,分别为:(1)按平均得分计算难度系数(2)极端分组法计算难度系数。其中, 为被试在题目上的平均得分;W为该题的满分值。1按平均得分计算难度系数对于二分法(0与1,答错记0分,答对记1分)的试题计分方式,难度系数计算式如下:NRP 其中,R是指答对的人数;N则是指参与测验的总人数。对于连续

26、计分方式,难度系数计算式如下:WXP X2极端分组法计算难度系数 这个计算方法一般在参加测验人数比较多的情况下进行,因此此时再用上述方法会比较费时也费力。这时可将被试的得分从高到低进行排序,然后在两端分别截取人数比例相等(一般取27%)的高分组和低分组,分别计算这两组在该题上的得分率,并记为 和 ,最后按下面的公式来计算难度系数:HPLP2LHPPP(四)区分度的涵义及其计算方法 区分度是指试题对所要测量的被试的知识(能力)水平的区分能力,也即,测验结果反映被试的实际差异程度。在测验中,如果试题的区分度较好,那么能将学生的知识水平做出有效的区分,即实际水平高的学生一般能答对题目或得分数高,而实

27、际水平较低的学生一般不能答对题目或者得分数低。如果试题的区分度较差,水平高的学生和水平低的学生得分差不多,那就不能将学生的能力进行区别。区分度相应地也有其计算方法:(1)极端分组法;(2)积差相关法;(3)点二列相关法;(4)二列相关法1极端分组法这个方法与上面难度系数计算的第二种方法类似,也是从被试群体中确定两个组,高分组和低分组(一般取27%),计算出这两组在该题上的得分率 和 ,最后用下式计算试题的区分度:HPLPLHPPD一般对区分度的要求在0.4以上。 当两个变量都为正态连续变量且两者成线性关系时,此时两个变量间的相关称积差相关。数学试卷中的主观题的试题得分与测验总分都为连续变量,所

28、以可采用积差相关法计算试题的区分度,公式如下:niiniiniiiyyxxyyxxr12121)()()(其中,xi为考生i在该试题上的得分, 为所有考生在该题的平均分,yi为考生该次测验的总分, 为所有考生该次测验的总分平均分。xy2积差相关法3点二列相关法 两变量中一个为连续性变量,另一个为二分名义变量(如对与错),这时,可以用点二列相关表示两个变量之间的相关。如在数学测验中,选择题答对记6分,答错记0分,此时便可将选择题视为二分名义变量,测验总分视为连续性变量,因此,可采用点二列相关法计算选择题的区分度,公式为:pqxxrtqppb其中,rpb为试题的点二列相关系数,p为考生在该题的通过

29、率,q为考生的未通过率, 为通过该试题考生的测验总分的平均值, 为未通过该试题考生的测验总分的平均值, 为该次测验总分的标准差。qxpxt4二列相关法当两变量都为正态分布变量,但其中一个变量被人为地分成二分变量(如按一定的标准,将考生分为及格和不及格两类),这时用二列相关表示这两个变量之间的关系。数学测验中分数视为连续变量,而测验总分分为及格和不及格两类,则采用二列相关法计算试题的区分度,公式如下:ypqxxrtqpbi其中,rbi为某试题的点二列相关系数,p,q , , ,含义与点二列相关法中的计算公式中的变量相同,y为通过率p在正态分布中的纵线高度。qxpxt客观性试题的编撰宏观上看,试题

30、一般分为客观性试题和主观性试题,客观性试题主要是指其评分标准即答案不受主观因素的影响,其评分客观、方便,有利于保持评价的信度。客观性试题一般有单项选择题、多项选择题、填空题等。一、选择题的编撰(一)选择题的基本特征 选择题通常是由一个问题和一组备选答案组成,在很多情况下,一道或多道选择题还共有一段情景材料。选择题的问题可以是一个直接提问,也可以是一个不完整的陈述,它们就是选择题的题干。备选答案可以是文字、数字或符号等,备选答案中一般有一个或一个以上是正确的或最好的,它们被称为答案,其余的备选答案又称为干扰项或迷惑项。情景材料可以是文字、图、表、符号等,含有学生应答需要的相关信息。 在一般试卷中

31、,直接提问形式的题干和不完整陈述形式的题干,都很常见。一般直接提问形式的题干,问题呈现得比较清楚明确,不容易产生歧义;不完整陈述形式的题干更加简明,如果题干撰写得好,也能够比较清楚明确地呈现问题,但如果题干撰写有缺陷,就有可能产生歧义。与其他题型相比,选择题有以下几个基本优点:(1)应答一般不受考生应答倾向的影响,如果学生不知道答案,一般不会选择某一特定的选项;(2)干扰项的使用,使得考试结果具有一定的诊断功能,学生对错误选项的选择,可以揭示出其对问题理解上的错误,或者揭示出学校教学上存在的问题;(3)从覆盖面上讲,选择题的答案普遍比较简单,考生在短时间内能够完成较多的试题,使一份试卷有较宽的

32、知识和能力的覆盖面;(二)选择题的优缺点(4)从单个试题的考查面上讲,客观性试题考查的知识内容比较单一,因此能较正确地根据测验目的编制试题,从而能较准确地测量学生对某一知识点的掌握程度;(5)从评分方面讲,客观题的评分简单,而且准确,不会因为阅卷老师的主观判断而造成评分的偏差。 选择题也有其缺点,如不容易判断学生解题过程中使用的方法和思维;学生在选择答案时有很大的猜测性和随机性等等,这时就不能反映学生的真实水平。选择题具有适应性广、优点比较多的特点,但这并不等于选择题天生就具备这些特点,要使得选择题真正具备这些特点,在编撰选择题时,应该按照一些基本要求进行。1题干本身应该有意义,并以明确的问题

33、形式呈现 编撰选择题时应该保证题干中包含一个明确的问题,这个问题即使在没有备选项的情况下也有意义,同时,备选项具有比较好的同质性,以降低可能的猜测概率。2题干中不要包括无关的内容,选项中相同的内容应尽可能置于题干中 与考生应答无关的内容不会对考生答题有任何帮助,只会增加考生阅读的时间,甚至会干扰考生的应答。如果涉及的试题不是专门考查学生选择相关材料的能力的话,题干中应该删去这些无关的内容。(三)编撰选择题的要求3应答所要求的思维过程不要过于复杂 所有的客观题都是通过学生思维的结果对学生的能力或思维品质进行测量,如果思维过程过于复杂,既有比较强的分析要求,又有比较复杂的计算等过程,则当学生应答错

34、误时,就很难判断学生究竟是在哪一个环节上出现了问题,如果我们主要考察的是学生分析问题的能力,而过于复杂的计算过程可能会导致某些粗心的学生出错,这样的结果会导致对学生的分析能力作出不正确的判断。4所有的干扰项都应该似是而非 设置干扰项的目的是要迷惑哪些没有真正掌握测试内容的学生。对这些学生而言,干扰项与正确选项的迷惑力几乎是相同的。如果所有的干扰项与正确选项看起来都很相似,即所有的选项都是同质的,那么干扰项会更显得似是而非,测量效果就会更好,但是干扰项不应该迷惑真正掌握了测试内容的学生,否则这样的干扰项可能有问题。5避免题干与正确选项之间存在语言联系,以免阅读能力比较强的学生从中获得有用的线索。

35、 正确选项的表述看起来或听起来与题干存在语言联系,会给聪明的学生以语言线索,从而分析出正确答案;对于那些不知道正确答案的学生来说,这种语言联系是不允许出现的。从测量学的角度看,这样的试题也违反了局部独立的基本原则。然而,如果迷惑项的表述看起来或听起来与题干存在语言联系,可以增加迷惑项的迷惑能力,使得那些想依靠记忆和语言联系获得答案的考生上当,则未尝不可。6使正确应答随机分布在选项中,以防止学生觉察出正确选项的分布规律 有些命题教师喜欢将正确选项安排在中间,正确选项出现在A或D选项中的可能性较小,这样做易于为聪明的学生提供线索。(四)选择题的编撰 选择题是最常见的一种客观性题型。从测量功能的角度

36、看,它可以测量最简单的行为目标,也可以测量比较复杂的行为目标。从涉及到的内容领域看,它适合几乎所有的学科和所有的内容领域。因此,无论是在常模参照考试还是标准参照考试中,以选择题为代表的客观性题型都得到广泛的应用。正因为如此,要非常完整地列出选择题的测量功能是很困难的,但我们可以从对知识的理解、技能的应用以及对过程和方法的理解等角度大致列出选择题的主要测量功能。1测量对知识的记忆和理解(1)测量对一般事实性知识的记忆水平 对一般事实性知识的记忆是其他认知过程的基础,尽管现代教育不主张死记硬背,但对数学的学习而言,基本的事实性知识还是非常重要的,用选择题型测量考生对一般事实性知识的记忆水平是最常见

37、的一种测量方法。这种选择题题干最常用的动词包含:“是”、“属于”、“有”等,选择的对象常见的是“谁”、“什么”、“何时”、“何地”等。(2)测量对一般事实性知识的理解水平 对事实性知识的理解比记忆更加重要,在理解基础上的记忆往往比单纯的记忆更加长久。一般如果需要理解的知识在题干中,则选择项就是要学生理解的内容以及迷惑项,在这种情况下正确选项应该与事实性知识间存在逻辑联系,这种联系都是通过题干问题中的动词发生的;如果需要理解的知识在选项中,那么题干一般给出了需要理解的内容或规律,试题题干中的设问要求考生确定理解的事实性知识。2测量对基本原理的理解和应用能力 测量考生对基本原理的理解和应用能力,关

38、键是让学生在一种类似的或新的情景中,通过鉴别原理,应用基本原理来解释问题。显然,在新的情景中鉴别基本原理,应用基本原理来解释问题比在类似的情景中更加困难,对学生理解、应用基本原理的能力要求更高。命制这种测量功能的选择题关键在于两个方面,一是设计好两种不同的情景类似的和新的情景;二是要求考生解释的问题,如分析各种关系、解释因果关系、根据条件作出推论、对事物作出评价等。3测量基本技能的掌握水平 一般而言,单独测量学生的基本技能是比较困难的,因为学生基本技能的掌握和运用一般都是与基础知识相联的,正因为如此,国家课程标准将学生在各科学习中应该掌握的基础知识与基本技能结合在一起进行描述。4测量辨别、选择

39、、使用和评价过程或方法的能力 “过程与方法”作为学生学习的重要目标之一。对考试而言,测量学生对解决问题的过程和方法的辨认、选择、使用和评价能力应该成为重要的测量目标。学生也许知道解决问题的正确方法和过程,但不能解释它为什么是最好的;也许有些学生根本就不知道解决问题正确的方法和过程;也许有些学生知道一些,但又不完全了解。从测试的角度看,我们希望通过观察学生如何辨认、选择、使用和评价某一特定的方法或过程,来推测学生在这一方面的能力。利用选择题可以测试这方面的能力,让学生从可能的方法和过程中选择最佳的方法或过程,或者从可能的方法和过程中辨认正确的或不完全正确或错误的方法或过程,或者根据一系列的过程步

40、骤,理清过程中各步骤的逻辑关系等,此类试题可通过二段式纸笔测验进行,这样更便于教师发现学生解题过程中的思维和存在的错误理解。二、填空题的编撰(一)填空题的基本特征填空题一般使用直接提问的方式,由不完整的陈述句构成,这个不完整的陈述就是题干,空缺的部分往往是一些重要的部分,学生可以用一个词、短语、数字、符号、等式或公式等作出回答。其优点是学生必须提供答案,这就降低了学生通过猜测获得正确答案的可能性。他们需通过对知识的回忆、理解或计算来解决试卷所呈现的问题。(二)填空题编撰要求1题目应使要求的答案简洁具体。通过测验开始时的指导语,用恰当的短语表述问题。2不能直接引用教材上的陈述作为填空题的基础。因

41、为课本上的陈述脱离一定的背景,往往太概括、模糊不清。3如果答案要以数字单位的形式表示,要标明所求答案的类型,写清楚要求的精确程度。这样会使记分变得容易。4给题目答案留的空白长度应该一样而且都放在题目的右端。空白长度一样就不会给考生提供线索,答案放在问题的右边可以使记分更快、更准确。(三)填空题的编撰 填空题作为一种常见的客观性试题,在一般测验或考试中都会用到。它可以用来测量学生对数学史的了解程度,对数学概念、数学知识的认知和理解,也可以考察学生的应用能力。最近几年的考试中,也通过填空题的形式考察学生的探究能力、对探究步骤的熟悉程度和数据处理的能力。1测量数学史的了解程度 数学的发展进程体现了人

42、类探索和认识数形世界的现象、规律的历程,任何一种数学知识和理论体系都汇聚了无数数学工作者的智慧和汗水,他们经过几十年甚至上百年的努力才迈出实质性的一步,其发展过程包含着认识论和方法论的因素,也包含着探究的艰辛,更包含着丰富的“教书育人”的教育因素。因此,在新课程教学中需对数学史加以重视。2测量数学知识的认知和理解能力 数学的学习不是对具体知识点或概念的死记硬背,学生需对数学过程本质形成自己的认识和理解,才能很好地解决实际问题。主观性试题的编撰 这里的主观题是指必须通过人工阅卷,评分教师根据对评分标准的理解,进行评分的试题形式,因此带有一定的主观因素。主观题主要有简答题、问答题、论述题、分析题、

43、计算题、证明题、作图题。这几种题型的主要区别在于思维方式的要求、设问要求、答案的深度、广度和思维的层次等方面不同。不过他们都需要学生分析题目背景材料,通过一定的想象和联想,调动已有的知识和经验,有效组织答案。(一)简答题特征 数学简答题实质上是运用所学数学知识,找出题中所给条件和结论之间的内在联系,并用数学语言,言简意赅地把它表述出来的一种题型。 简答题有一些情景材料,并根据这些材料,对学生提出应答要求。简答题的设问角度灵活多变,答案简明扼要,考查的能力表现行为比较单一,涉及到的内容领域也较窄,内容范围相对较小。一、简答题的编撰(二)编撰简答题要求1问题不宜太复杂,以适合学生回答和方便阅卷者评

44、判为标准。学生能用简洁的数学学科语言正确解释材料中呈现的现象。2不宜直接取用教材的内容让学生作答,要着重避免答案就在书上的简答题,以免导致学生的死记硬背。3简答题可以从不同角度、不同方向考查学生对某一学科概念和规律的理解和运用,能对考生的答题做出有层次的评价,更真实地反映学生的数学水平。(三)简答题的编撰 根据教学目标、测验目的及简答题编撰的要求,编撰相应的试题。二、论述题的编撰(一)论述题特征 论述题分限制反应的论述题和扩展反应的论述题。限制反应的论述题总是限制内容和反应,内容常常受到有待讨论的主题范围的限制,有的还会在问题中简要地说明反映的形式,其结构更为紧凑,用它来测量运用某一个领域信息

45、进行解释和应用的能力是最有效的。扩展反应的论述题允许学生挑选任何他们认为相关的事实信息,他们还可以根据自己的最佳判断来组织相应的答案,整合并且评价他们认为合理的观点。这种论述题更有利于评价高级技能,但由于允许创造性表达使得评分的难度也大大增加。(二)编撰论述题要求1将论述题的使用对象限制在那些不能被客观题很好测量的学习结果,以最充分地实现对学生成就的评价。2设计问题应包含学习标准中的技能。命题要求学生展示由预期的学习结果所限定的成就。3给每个问题以适当的时间限制。命题者应该估计获得满意回答需要的时间一般是多少,命题者一定要考虑那些反应较慢的学生。4避免选做题的使用。如果这样,很显然学生参加的考

46、试也不一样,所以评价他们表现的统一基础也就没有了。这样测量学生的学业成就有失偏颇,而且可能会对学生的学习习惯带来不好的影响。(三)论述题的编撰 论述题相比较于简答题,对学生物理知识的理解能力、分析问题能力和语言表述能力的要求更高。如果试题背景材料选取得当,还可以对学生的“情感、态度与价值观”维度进行测量。三、分析题的编撰(一)分析题特征 在说明性材料中,可以给学生提供用来表现其理解、思维技巧和问题解决能力所需的一些背景知识。可以通过某种方式将材料所要求的阅读水平降低。(二)编撰分析题要求1挑选与课程目标相关的案例材料,必须简短而有意义,并且对于学生的课程经验和阅读水平来说应该是恰当的;2挑选对

47、学生来说是新的说明材料,最好是与教材中使用的很相像,但在内容和形式上又有所不同;3按照清楚、简明、解释价值更大的原则修改说明材料。修改说明材料和设计相关题目是相互依赖的过程,是一种循环往复的形式,直至产生清楚简洁的解释性分析题;4测验题目数与说明材料的长度成比例,这样可以提高考查效率;(三)分析题的编撰 分析题综合性强,主要考查学生从已有材料中获取信息的能力、综合分析能力和逻辑思维能力。四、计算题的编撰(一)计算题的特征 计算题是由基于一定的材料构成的试题形式,这些材料既可以是书面材料,也可以是图表材料,或者兼而有之;这些材料和试题组成了整个题的题干。相关的试题可以是一题,但多数情况下是若干道

48、试题组成一个系列,这些试题多数情况下需要学生进行分析并计算,它是物理考试中采用比较多的一种题型,这种题型可以考查学生对某个知识点的掌握情况,也可以在一个试题中涉及多个知识点。(二)编撰计算题的要求 计算题的编撰有一定的要求,不能为了计算的方便而随意凑数据,具体要求如下:1创设一定的情境,不能只是简单的罗列计算所需条件;2问题陈述的语言简明、易懂,避免无关或容易误导的线索;3假设的数据要合理,不能脱离现实情境;4考查学生对数学知识的综合应用,不要刻意追求试题的难度。(三)计算题的编撰 计算题一般都是应用型试题,可以考查学生对数学知识的理解程度、综合分析及运用能力。五、作图题的编撰(一)作图题的特

49、征 作图题指根据题目提出的各种要求,完成作图,并回答有关的问题。它是物理练习和测试中常见的题型。作图可以形象、直观地反映物理过程,有助于对物理问题的理解,培养分析和解决问题的能力。作图题的内容广泛,如根据数据作图、统计图表等。(二)编撰作图题的要求1试题给出的图示清晰、规范;2试题明确指出作图要求,且需留出足够的作图空间;(三)作图题的编撰 作图题一般出现在填空题或计算题中。此类试题不仅可以考查学生的基本作图能力以及读题的能力,还有利于培养学生分析论证的能力和严谨认真的科学态度。开放性试题的编撰一、开放性试题的含义 关于开放性试题的界定,有从其答案数目的个数、解答途径的方法的多样性、解答过程中

50、思维的特点等维度来进行的。一般认为开放题的界定应按照三个衡量标准:一是结论的开放性,即结论不唯一或解决问题的途径多样开放;二是结构复杂性,即认知过程包含复杂的认知行为;三是情境的真实性,即问题情境是真实情境。 因此,开放题应该是这样的试题,它是基于真实情境设计的,需要学生进行高级思维活动的,并且其解题途径与解题方法是多样的,正确答案可以是唯一的也可以是多个的试题 二、开放性试题的主要测量功能 开放性试题承载新的教育理念,一改传统的封闭性试题,并在这过程中得到发展,它越来越受到教育界的关注,通过对NAEP、PISA、TIMSS三项国际评价项目的横向比较研究发现,三者中开放性试题的比例分别为50%

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(试题编制原理及方法课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|