1、一、效度的概念一、效度的概念 效度(效度(ValidityValidity)是指是指测量结果测量结果的的准确性准确性和和有效有效性性的的程度程度,亦即测量是否达到了预期的目的。,亦即测量是否达到了预期的目的。第一,效度是一个相对的概念。第一,效度是一个相对的概念。1.1.测量的效度始终是对一定的测量目的而言的。测量的效度始终是对一定的测量目的而言的。2.2.测量的效度是相对于测量的结果而言的。测量的效度是相对于测量的结果而言的。第二,一种测验的效度只是高或低的问题。第二,一种测验的效度只是高或低的问题。第三,在教育测量中,效度问题比在其他领域的第三,在教育测量中,效度问题比在其他领域的测量中更
2、为重要。测量中更为重要。一、效度的概念一、效度的概念 这是因为:这是因为:教育测量的对象大多是精神现象,只能通过对其教育测量的对象大多是精神现象,只能通过对其具有可测性的外部表现(如语言或动作等)的测量,具有可测性的外部表现(如语言或动作等)的测量,以间接认识其心理活动、心理特征或知识水平等。以间接认识其心理活动、心理特征或知识水平等。学生的心理活动、心理特征与其外部表现之间,学生的心理活动、心理特征与其外部表现之间,一般仅具有相关关系而无函数关系,外部行为并不一般仅具有相关关系而无函数关系,外部行为并不能准确无误地反映某种心理状态。能准确无误地反映某种心理状态。教育测量的对象不是物而是有主观
3、能动性的人。教育测量的对象不是物而是有主观能动性的人。人能有意识地调节自己的外部行为,掩盖自己的内人能有意识地调节自己的外部行为,掩盖自己的内心活动,这就增加了认识其精神现象的难度。心活动,这就增加了认识其精神现象的难度。二、效度的统计学原理及其与信度的关系二、效度的统计学原理及其与信度的关系1 1、效度的统计学原理、效度的统计学原理在实际测量中,影响效度的主要因素是系统误差。在实际测量中,影响效度的主要因素是系统误差。因而在讨论效度时,还必须把真分数方差分解为两因而在讨论效度时,还必须把真分数方差分解为两个部分,一是潜在真分数方差(个部分,一是潜在真分数方差(V V2 2),),另一部分另一
4、部分是系统误差分数方差(是系统误差分数方差(I I2 2),它,它与由随机误差引与由随机误差引起的变异(起的变异(E E2 2)不同。不同。)22()12(2222222公式因而,公式EIVxIVT公式即:)之比,)实得分数方差(潜在真分数方差(定义为所以可以将效度222222222222x2V)32(1)(xIxxxEIxEIxxVxyxyrrr2 2、效度与信度的关系、效度与信度的关系V2I2E2V2I2E2V2I2E2根据公式(根据公式(2-22-2)和()和(2-32-3),可将效度与信度的关),可将效度与信度的关系图解于后:系图解于后:根据分析,可得结论如下根据分析,可得结论如下:1
5、)1)高信度是高效度的必要条高信度是高效度的必要条件,而非充分条件。件,而非充分条件。2)2)效度系数不会大于信度系数的效度系数不会大于信度系数的平方根。平方根。可以用下式表示:可以用下式表示:)公式(42xxxyrr高效度、高信度高效度、高信度低低效度、高信度效度、高信度低低效度、低信度效度、低信度三、效度的估计三、效度的估计 效度估计就是多方寻找证据来证明一个效度估计就是多方寻找证据来证明一个测验的有效性程度的过程。测验的有效性程度的过程。19741974年美国心理学会发行的年美国心理学会发行的教育和心教育和心理测量的标准理测量的标准一书将效度分为三大类:一书将效度分为三大类:内容效度、效
6、标关联效度和结构效度。内容效度、效标关联效度和结构效度。(一)内容效度(一)内容效度(Content validityContent validity)又称合理效度或逻辑程度,是指测验内又称合理效度或逻辑程度,是指测验内容或行为取样的代表性和适当程度;容或行为取样的代表性和适当程度;即即测验的内容范围、材料与所要测量的内测验的内容范围、材料与所要测量的内容范围、教育目标是否相符合;测验中容范围、教育目标是否相符合;测验中测题所引起的行为是否是所要测量的属测题所引起的行为是否是所要测量的属性的明确反应;测验的结果是否是一个性的明确反应;测验的结果是否是一个有代表性的行为样本。有代表性的行为样本。
7、估计内容效度的方法:估计内容效度的方法:估计内容效度的方法:估计内容效度的方法:(1 1)逻辑分析的方法。)逻辑分析的方法。其工作思路是请有关专家对测其工作思路是请有关专家对测验题目与原定内容范围的吻合程度作出判断。验题目与原定内容范围的吻合程度作出判断。(2 2)统计分析法。从同一个教学内容总体中抽取两套统计分析法。从同一个教学内容总体中抽取两套独立的平行测验,用这两个测验来测同一批被试,求其独立的平行测验,用这两个测验来测同一批被试,求其相关。若相关高,表明测验内容效度较高;若相关低,相关。若相关高,表明测验内容效度较高;若相关低,表示测验的内容效度较低。表示测验的内容效度较低。采用求统计
8、量的公式进行计算,其公式有以下三种形式:采用求统计量的公式进行计算,其公式有以下三种形式:内容效度主要应用于成就测验、学科测验、选拔和分类内容效度主要应用于成就测验、学科测验、选拔和分类职业测验。职业测验。内容效度不适合用于能力倾向和人格测验。内容效度不适合用于能力倾向和人格测验。(二)效标关联效度(二)效标关联效度 又可又可称为经验效度或统计效度,是以测验分数和称为经验效度或统计效度,是以测验分数和效标之间的相关系数来表示测验效度的高低的。效标之间的相关系数来表示测验效度的高低的。效标效标就是足以显示测验所欲测量的特性的变量或就是足以显示测验所欲测量的特性的变量或足以显示测验所欲预测的特性的
9、变量。它是用来足以显示测验所欲预测的特性的变量。它是用来检验测验效度的外在的、客观的标准和尺度。检验测验效度的外在的、客观的标准和尺度。效标关联效度又可分为效标关联效度又可分为同时效度同时效度和和预测效度预测效度。(用全国高考的成绩作为效标来检验高中毕业生会考的(用全国高考的成绩作为效标来检验高中毕业生会考的成绩,计算两者之间的相关系数就是会考的同时效度;成绩,计算两者之间的相关系数就是会考的同时效度;而用大学一年级的成绩作为效标来检验高考的成绩,计而用大学一年级的成绩作为效标来检验高考的成绩,计算两者的相关系数就是高考的预测效度。)算两者的相关系数就是高考的预测效度。)估计效标关联效度可采用
10、积差相关、二列相关或估计效标关联效度可采用积差相关、二列相关或点二列相关、四格相关和多元相关系数等计算各点二列相关、四格相关和多元相关系数等计算各种相关系数。种相关系数。1 1、用积差相关系数的方法估计效度、用积差相关系数的方法估计效度 积差相关积差相关,是计算两个变量线性相关的一种方法,由英国统计,是计算两个变量线性相关的一种方法,由英国统计学家学家皮尔逊皮尔逊提出,因此也称为皮尔逊提出,因此也称为皮尔逊(Pearson)(Pearson)相关。要使用相关。要使用积差相关必须同时积差相关必须同时具备如下几个条件具备如下几个条件:两个变量都是由测量获得的连续性数据,即等距或等比数据。两个变量都
11、是由测量获得的连续性数据,即等距或等比数据。两个变量的总体都呈正态分布,或接近正态分布,至少是单两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称分布,当然样本并不一定要正态。峰对称分布,当然样本并不一定要正态。必须是成对的数据,而且每对数据之间是相互独立的,即各必须是成对的数据,而且每对数据之间是相互独立的,即各自互不影响,本条件是难以检验的。自互不影响,本条件是难以检验的。两个变量之间呈线性关系。一般用描绘散点图的方式来观察,两个变量之间呈线性关系。一般用描绘散点图的方式来观察,最好是先各自转化为最好是先各自转化为Z Z分数,单位会统一些。分数,单位会统一些。例:例:某中学数学教研
12、组的教师积多年的教学法经验,认为刚入某中学数学教研组的教师积多年的教学法经验,认为刚入高中的学生学习立体几何感到困难的主要原因是空间想像力高中的学生学习立体几何感到困难的主要原因是空间想像力弱。弱。为了证明这个论点,他们让刚入高中的为了证明这个论点,他们让刚入高中的103103名学生作名学生作1010道道题,测量其空间想像力。为避免知道了某些学生的刚入高中题,测量其空间想像力。为避免知道了某些学生的刚入高中时的成绩影响以后考试的评分,试卷暂不评阅。立体几何学时的成绩影响以后考试的评分,试卷暂不评阅。立体几何学完后,进行考试,按得分多少把成绩分为五等(完后,进行考试,按得分多少把成绩分为五等(A
13、 A、B B、C C、D D、E E)分别得分别得5 5、4 4、3 3、2 2、1 1分。这时才评阅入学时的试卷,统分。这时才评阅入学时的试卷,统计出期末得计出期末得5 5、4 4、3 3、2 2、1 1分者在入学测验中分别答对分者在入学测验中分别答对1 1道题道题至至1010道题的人数(见表道题的人数(见表2-12-1)。)。就现有资料,用什么方法可以判断教师们的意见是否正确?就现有资料,用什么方法可以判断教师们的意见是否正确?表2-1:(答对的题数)1 2 3 4 5 6 7 8 9 10 所评的等级ABCDE54321 1 3 10 5 4 2 1 6 8 8 4 3 1 2 4 5
14、9 8 3 111 3 2 1 11 1 2 1 1解:(1)设期末考试的等第为y,空间想像力测验答对的题数为x,列出二重交叉次数分布表:X(答对的题数)1 2 3 4 5 6 7 8 9 10 Y所评的等级ABCDE54321 1 3 10 5 4 2 1 6 8 8 4 3 1 2 4 5 9 8 3 111 3 2 1 11 1 2 1 125313296合计2 4 10 14 20 20 17 9 5 2103(2)用积差相关系数公式计算效度系数:验的得分和的题数与期末测是指刚入学测验中答对标准差。是期末测验各人得分的对题数的标准差,是刚入学的测验各题答人得分平均数,是期末测验中的人数
15、的平均数,道题道题到是刚入学的测验中答对式中公式fxySSyxssyxNfxyryxyx103101)42(/12.1/)(58.3103619232331425510394.1103/)55.510(2)55.52(4)55.51(255.5103210591034221101/)(22222 NyyfSSyySxxNxxfSSyyxxx标准差。是期末测验各人得分的)(人得分平均数,是期末测验中)(道题的人数的平均数,道题到是刚入学的测验中答对对题数的标准差,是刚入学的测验各题答式中预测效度,前者对后者有一定的学习成绩有较高的相关体几何间想像力测验成绩与立相关系数较大,表明空)3(699.0
16、12.194.158.355.5103/22032203)15(1)510(2)59(4)58(5)57(10)56(3)55(1 xyrfxy二列相关二列相关 适用于两个变量就其实际含义而言是适用于两个变量就其实际含义而言是等距或等比数据,它们服从正态分布,等距或等比数据,它们服从正态分布,其中一列人为地划分为两类。其中一列人为地划分为两类。时的纵高。中从左到右概率值为指的是在整个正态曲线。比,的次数占总次数的百分是二分称名量表中一种量值的标准差。是该例连续变量全部变平均数。”相对应的连续变量的”或“是二分名称变量中“或公式pypqpSXXypqSXXrtqptqpb1015)-(2 点二列
17、相关点二列相关 适用于一列数据为等距或等比且总体服从正态分布(实适用于一列数据为等距或等比且总体服从正态分布(实际上只需要单峰对称分布,如分布),另一列变量是际上只需要单峰对称分布,如分布),另一列变量是按事物的性质划分为两类的变量,也可以是一个双峰分按事物的性质划分为两类的变量,也可以是一个双峰分布,人为划分为两类,如文盲与非文盲。这种相关系数布,人为划分为两类,如文盲与非文盲。这种相关系数多用于测验中评价题目的区分度。对选择题、判断题在多用于测验中评价题目的区分度。对选择题、判断题在整个测量中作用作出判断。整个测量中作用作出判断。基本计算公式:基本计算公式:。比,的次数占总次数的百分是二分
18、称名量表中一种量值的标准差。是该例连续变量全部变平均数。”相对应的连续变量的”或“是二分名称变量中“或公式pqpSXXpqSXXrtqptqppb1016)-(2 例:有例:有一位一位教师自编了一套测验题,用来预测学生教师自编了一套测验题,用来预测学生一年后的某科成绩,自编测验按百分制评分,一年一年后的某科成绩,自编测验按百分制评分,一年后考试评分只把学生分为及格者和不及格者。试就后考试评分只把学生分为及格者和不及格者。试就所获资料估计自编测验的预测效度。所获资料估计自编测验的预测效度。解:解:1)1)把两次测验成绩成对排列:把两次测验成绩成对排列:被试者被试者1 12 23 34 45 56
19、 67 78 89 91010 1111121213131414自编自编测验测验的成绩(的成绩(X X)6767 1010 20 44 60 43 61 10 26 23 30 18 35 2320 44 60 43 61 10 26 23 30 18 35 23一年后一年后考考试成绩(试成绩(Y Y)1 1 1 0 0 1 1 0 1 0 0 1 1 11 1 1 0 0 1 1 0 1 0 0 1 1 12)计算出二列相关公式所需统计量计算出二列相关公式所需统计量:绩。不能用来预测学生的成极低,个测验结果的预测效度相关系数极小,说明这)代入公式计算得:。比,的次数占总次数的百分是二分称名量
20、表中一种量值的标准差。是该例连续变量全部变平均数。”相对应的连续变量的”或“是二分名称变量中“或公式0.007 36.064.0125.1840.3367.33336.01,64.01491125.1840.335302310604467.33923351067016)-(2 pbttqpqptqppbrpqppqpSSXXXXpqSXXr(三)结构效度(三)结构效度(Construct validityConstruct validity)结构效度结构效度是指一个测量能实际测量出理论上的构想或是指一个测量能实际测量出理论上的构想或心理特性的程度。它的目的在于从心理学的理论观点心理特性的程度。
21、它的目的在于从心理学的理论观点就测验的结果加以解释和探讨。就测验的结果加以解释和探讨。这里的这里的结构结构的含义是心理学理论所涉及的抽象而属假的含义是心理学理论所涉及的抽象而属假设性的概念、构想、特性或变量,如智力、焦虑、机设性的概念、构想、特性或变量,如智力、焦虑、机械能力倾向、成就、动机等。械能力倾向、成就、动机等。结构效度主要用于智力测验、人格测验等一些心理测结构效度主要用于智力测验、人格测验等一些心理测验方面。验方面。例如:人的创造力可以分解为人的思维流畅性、灵活例如:人的创造力可以分解为人的思维流畅性、灵活性和创造性三大特性,并根据这三大特性编制测验,性和创造性三大特性,并根据这三大
22、特性编制测验,若有足够的证据来证明该测验确实可以测到这些特性,若有足够的证据来证明该测验确实可以测到这些特性,则认为该测验是个结构效度较高的创造力测验。则认为该测验是个结构效度较高的创造力测验。(1 1)结构效度的特点)结构效度的特点 结构效度的大小完全取决于事先假定的心理特结构效度的大小完全取决于事先假定的心理特质理论,一旦人们对同一种心理特质有着不同质理论,一旦人们对同一种心理特质有着不同的定义或假设,则会使得关于特质测验的结构的定义或假设,则会使得关于特质测验的结构效度的研究结果无法比较。效度的研究结果无法比较。当实际测量的资料无法证实我们的理论假设时,当实际测量的资料无法证实我们的理论
23、假设时,并不一定就表明该测验结构效度高。因为还有并不一定就表明该测验结构效度高。因为还有可能出现理论假设不成立,或者该实验设计不可能出现理论假设不成立,或者该实验设计不能对该假设作适当的检查等情况,这就使得结能对该假设作适当的检查等情况,这就使得结构效度的获取更为困难。构效度的获取更为困难。(2 2)建立结构效度的步骤)建立结构效度的步骤 A A、提出理论假设;提出理论假设;B B、根据假定结构拟定测题,编制测验;根据假定结构拟定测题,编制测验;C C、以测验结果为根据来验证假设结构中以测验结果为根据来验证假设结构中的各种因素是否成立。的各种因素是否成立。(3 3)结构效度的估计)结构效度的估
24、计 A A、因素分析法因素分析法 其目的是把一些具有错综复杂关系的因素归结其目的是把一些具有错综复杂关系的因素归结为数量较少的几个综合因素或称共同因素,并为数量较少的几个综合因素或称共同因素,并以此测验所测之特质对测验分数作出解释。以此测验所测之特质对测验分数作出解释。B B、多元特质多重方法矩阵法多元特质多重方法矩阵法 是由肯贝尔和菲斯克是由肯贝尔和菲斯克19591959年提出的最受欢迎的年提出的最受欢迎的一种结构效度的评估方法。一种结构效度的评估方法。这种方法的设想:若采用两种方法以上的方法这种方法的设想:若采用两种方法以上的方法去测量两种以上的特质,那么这些测量结果之去测量两种以上的特质
25、,那么这些测量结果之间可以形成一个多元特质多重方法矩阵。间可以形成一个多元特质多重方法矩阵。四、提高效度的方法四、提高效度的方法(一)各种效度系数的要求(一)各种效度系数的要求(二)影响效度的因素(二)影响效度的因素 测验的构成(要素)测验的构成(要素)测验实施方面(过程)测验实施方面(过程)被试主观状态方面被试主观状态方面 估计效度所依循的效标估计效度所依循的效标 样本方面样本方面四、提高效度的方法四、提高效度的方法(三)提高效度的方法:(三)提高效度的方法:1、控制系统误差、控制系统误差 2、精心编制量表、精心编制量表 3、妥善组织测验、妥善组织测验 4、扩充样本的容量和代表性、扩充样本的
26、容量和代表性 5、合理处理、合理处理效度和信度的关系效度和信度的关系 6、适当增加测验的长度适当增加测验的长度表表2.1 测验长度与信度和效度的关系测验长度与信度和效度的关系题数题数与原与原测验题数之比测验题数之比信度系数信度系数效度系数效度系数1020306012014048012361214480.3000.4620.5620.7200.8370.9110.9540.4000.4960.5480.6190.6680.6790.713第三节 难度及其计算 一、难度的概念一、难度的概念 难度是指测量试题的难易程度。难度是指测量试题的难易程度。一个题目的难度大小,除了所测的内一个题目的难度大小,
27、除了所测的内容本身的难易程度有关以外,还与测容本身的难易程度有关以外,还与测验的编制技术和被试的知识经验有关。验的编制技术和被试的知识经验有关。这就是说测验的难度具有相对性,正这就是说测验的难度具有相对性,正因为此,必须让试题通过实践来对难因为此,必须让试题通过实践来对难度作出检验。度作出检验。二、难度的计算(一)计算难度的基本公式(一)计算难度的基本公式 1 1、客观题难度的计算、客观题难度的计算 NRp 2、主观题难度的计算、主观题难度的计算表示此题的满分。)题上的平均得分,表示所有考生在某一道(KKXXp P表示难度指标,N表示参加考试的总人数,R表示答对某道客观题的人数。二、难度的计算
28、例例1 1:在:在100100个学生中,答对第一题的个学生中,答对第一题的3030人,答对人,答对第二题的第二题的6060人,求第一、二道题的难度?比较这人,求第一、二道题的难度?比较这两道题谁比谁难?两道题谁比谁难?例例2 2:某道论述题满分:某道论述题满分1212分,所有考生在这道题上分,所有考生在这道题上的平均得分为的平均得分为3.63.6分,求该题的难度?分,求该题的难度?例例3 3:语文测验第五题最高得分为:语文测验第五题最高得分为1212分,这道题考分,这道题考生的平均得分是生的平均得分是8.58.5分,求该题难度?分,求该题难度?例例4 4:6060人参加考试,某题满分为人参加考
29、试,某题满分为1212分,正确得分分,正确得分累积是累积是480480分,求该题难度?分,求该题难度?(二)用极端分组法计算试题的难度(二)用极端分组法计算试题的难度 1 1、用极端分组法计算客观题的难度、用极端分组法计算客观题的难度 具体步骤如下:具体步骤如下:1 1)先按测验总分的高低,按由高到低的顺序依次排)先按测验总分的高低,按由高到低的顺序依次排列试卷。列试卷。2 2)从得分最高的一份试卷开始依次向下选出全部试)从得分最高的一份试卷开始依次向下选出全部试卷的卷的27%27%作为高分组;从得分最低的一份试卷开始依作为高分组;从得分最低的一份试卷开始依次向上选出全部试卷的次向上选出全部试
30、卷的27%27%作为低分组。作为低分组。3 3)按计算公式计算难度)按计算公式计算难度为低分组的难度)为高分组的难度,(L2pppppHLH例题例题5 5:某区域某区域1000人参加考试,试卷第一题高人参加考试,试卷第一题高分组分组180人答对,低分组人答对,低分组60人答对,求人答对,求该题难度?该题难度?(约为约为0.44)0.44)如果该题满分为如果该题满分为10分,高分组得分总数分,高分组得分总数为为2100分,低分组得分总数为分,低分组得分总数为830分,分,求该题难度?求该题难度?2 2、用极端分组法计算论文试题难度、用极端分组法计算论文试题难度步骤如下:步骤如下:1 1)按测验得
31、分排列试卷,确定高分组与低分组,)按测验得分排列试卷,确定高分组与低分组,各占总人数的各占总人数的25%25%(方法同前)。(方法同前)。2 2)分别为高分组、低分组编制每道试题的分析表。)分别为高分组、低分组编制每道试题的分析表。3 3)按下列公式计算难度,)按下列公式计算难度,为最低分。是这道题的最高分,表示总人数的为低分组得分总和,为高分组得分总和,LH%25X)(22LnXLHnnLXXpHLH例:某道论文题,高分组得分总某道论文题,高分组得分总和为和为4040分,低分组得分总和为分,低分组得分总和为1515分,有分,有4040人参加考试,这道题最人参加考试,这道题最高得分为高得分为8
32、 8分,最低得分为分,最低得分为2 2分,分,则此题的难度为多少?则此题的难度为多少?(0.125)计算计算 解:依据主观题极端分组法计算公式解:依据主观题极端分组法计算公式 =0.125 28%254022%254021540 )(22LHnnLXXpLH三、难度的分析与控制三、难度的分析与控制 1 1、难度分析、难度分析 进行难度分析的主要目的是为了筛选题目。进行难度分析的主要目的是为了筛选题目。A A、测验题目难度水平的确定测验题目难度水平的确定 测验题目难度水平的适当与否,取决于测验的目的、测验题目难度水平的适当与否,取决于测验的目的、性质和题目的形成。性质和题目的形成。当当P P值接
33、近于值接近于0 0或接近于或接近于1 1时,即被试在该题上全部答对时,即被试在该题上全部答对或全部答错,则该题无法提供个体的信息。而只当或全部答错,则该题无法提供个体的信息。而只当P P值值接近于接近于0.500.50时,题目才能把被试做最大的程度的区分。时,题目才能把被试做最大的程度的区分。但在实际工作中,若每一题的难度值均为但在实际工作中,若每一题的难度值均为0.500.50,那么,那么此测验很可能只能区分出好与差两种极端被试的差异,此测验很可能只能区分出好与差两种极端被试的差异,却不能对各种被试作更精确的区分。因此,一般各题却不能对各种被试作更精确的区分。因此,一般各题的难度可在的难度可
34、在0.500.50+2020之间。之间。B B、测验难度对分数分布的影响测验难度对分数分布的影响 1)测验难度影响分数的分布形态。难度值越接近0,测验的难度就越大,测验分数就越是集中在低分端,其分数分布越呈现正偏态;反之,难度值越接近1.00,其难度就越小,测验分数越集中在高分端,分数分布呈负偏态。2)测验难度影响测验分数的离散程度 测验难度过大过小,都会造成测验分数偏离正态分布,从而使分数的全距缩小,使测验分数的离散程度变小。3)测验难度影响测验的鉴别能力 在测验中,考生之间相互配对比较的可能性越多,就越有利于准确地鉴别考生的不同能力。2 2、难度的控制、难度的控制 一般说来,影响题目难度的
35、主要因素有:一般说来,影响题目难度的主要因素有:考察知识点的多少;考察知识点的多少;考察能力的复杂程度或层次的高低;考察能力的复杂程度或层次的高低;考生对题目的熟悉态度;考生对题目的熟悉态度;命题的技巧。命题的技巧。难度控制:难度控制:正确估计考生水平;正确估计考生水平;弄清弄懂各知识点;弄清弄懂各知识点;掌握命题技巧。掌握命题技巧。第四节区分度及其计算 一、区分度的意义一、区分度的意义(一)区分度(一)区分度(Discrimination)是指测验对考是指测验对考生实际水平的区分程度,用符号生实际水平的区分程度,用符号D表示。又叫鉴表示。又叫鉴别力,它是评价试题质量,筛选试题的主要指标别力,
36、它是评价试题质量,筛选试题的主要指标与依据。与依据。区分度(区分度(D D)的取值范围介于)的取值范围介于-1.00+1.00-1.00+1.00之间,值之间,值越大,区分度的效果越佳。越大,区分度的效果越佳。区分度区分度D D00为正区分,为正区分,D0D0为负区分,为负区分,D=0D=0为零区分。为零区分。区分度的高低直接影响到测验的信度和效度。区分度的高低直接影响到测验的信度和效度。(二)区分度与测验信度、难度的关系 1 1、区分度与信度的关系(见下表、区分度与信度的关系(见下表2.22.2)这里是假定全部试题的难度均为这里是假定全部试题的难度均为0.500.50时所预测的信度系数。时所
37、预测的信度系数。区分度指的是平均值。区分度指的是平均值。可见,要想达到理想的测验信度,提高区分度是一可见,要想达到理想的测验信度,提高区分度是一 个好办法。个好办法。区分度区分度信度信度0.12250.12250.160.160.200.200.300.300.400.400.500.500.000.000.420.420.630.630.840.840.9150.9150.9490.949(二)区分度与难度的关系 表表2.32.3D D的最大值与试题难度的关系的最大值与试题难度的关系 由上表可知,难度适中,可使区分度达到最大值。由上表可知,难度适中,可使区分度达到最大值。难度难度区分度的最大
38、值区分度的最大值1.001.00.90.90.70.70.50.50.30.30.10.10.00.00.00.00.20.20.60.601.001.00.60.60.20.200000二、区分度的计算(一)用极端分组法计算区分度(一)用极端分组法计算区分度 1、客观题区分度的计算:、客观题区分度的计算:DPH PL 2、主观题区分度的计算:主观题区分度的计算:为最低分。是这道题的最高分,表示总人数的为低分组得分总和,为高分组得分总和,LH%25X)(LnXLHnXXDHLH二、区分度的计算 例例1 1:有道试题,高分组有有道试题,高分组有70%70%学生通过,低分学生通过,低分组有组有30
39、%30%的学生通过;而另一道题,高分的学生通过;而另一道题,高分组有组有40%40%学生通过,低分组有学生通过,低分组有70%70%学生通学生通过,求两题的各自区分度?过,求两题的各自区分度?例2:高分组高分组 低分组低分组 得分X 人次f 得分X 人次f 5 4 5 0 4 3 4 1 3 2 3 1 2 1 2 3 1 0 1 4 0 0 0 1例2:解:根据公式:)(LHnXXDLHn=10 H=5 L=0XH=54+43+32+21+10=40XL=50+41+31+23+14+01=17D=0.46(二)用内部一致性系数计算区分度(二)用内部一致性系数计算区分度 极端分组法分析通常只
40、在教师编制的课堂测绘极端分组法分析通常只在教师编制的课堂测绘中使用。在标准化的或大规模的测验中,多采中使用。在标准化的或大规模的测验中,多采用相关法分析试题的内部一致性。用相关法分析试题的内部一致性。由于测验总分属于连续变量,测验项目(试题)由于测验总分属于连续变量,测验项目(试题)多属二分称名变量(对、错或通过、不通过),多属二分称名变量(对、错或通过、不通过),所以,用相关法计算区分度时,多采用点二列所以,用相关法计算区分度时,多采用点二列相关、二列相关、相关、二列相关、系数等方法计算相关系数。系数等方法计算相关系数。(三)提高区分度的方法(三)提高区分度的方法 1 1、使题目的难度适中,使整个考试难度适中、使题目的难度适中,使整个考试难度适中 题目的难度适中可使区分度达到最大值,因此,题目的难度适中可使区分度达到最大值,因此,使难度适中是提高区分度的重要方法。使难度适中是提高区分度的重要方法。2 2、着重考察复杂的学习结果、着重考察复杂的学习结果 使高能学生得高分或低能学生得低分,使分数使高能学生得高分或低能学生得低分,使分数尽量分布在整个分数量尺上。尽量分布在整个分数量尺上。3 3、掌握区分度的评价标准。、掌握区分度的评价标准。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。