教育测量课件.pptx

上传人(卖家):三亚风情 文档编号:2929020 上传时间:2022-06-12 格式:PPTX 页数:122 大小:361.86KB
下载 相关 举报
教育测量课件.pptx_第1页
第1页 / 共122页
教育测量课件.pptx_第2页
第2页 / 共122页
教育测量课件.pptx_第3页
第3页 / 共122页
教育测量课件.pptx_第4页
第4页 / 共122页
教育测量课件.pptx_第5页
第5页 / 共122页
点击查看更多>>
资源描述

1、 第一章第一章 教育测量的基本原理教育测量的基本原理 第二章第二章 测验的性质、种类和功能测验的性质、种类和功能 第三章第三章 信度的理论定义、操作定义及其估计方法信度的理论定义、操作定义及其估计方法 第四章第四章 效度的理论定义、操作定义及其估计方法效度的理论定义、操作定义及其估计方法 第五章第五章 测题分析测题分析 第六章第六章 测验量表和常模测验量表和常模 第七章第七章 测验编制的步骤和方法测验编制的步骤和方法 第八章第八章 测验例举测验例举 总评成绩由总评成绩由平时成绩平时成绩考试成绩考试成绩组成组成 平时成绩占平时成绩占20,包括考勤和作业。,包括考勤和作业。 考试成绩占考试成绩占8

2、0,闭卷考试,时间为,闭卷考试,时间为2小时,小时,可以使用计算器。可以使用计算器。1、测量的定义、测量的定义 测量测量根据法则给事物分派数字。(史根据法则给事物分派数字。(史蒂文斯,蒂文斯,1951) 例例1:测量学生体重:测量学生体重 测量的属性:测量的属性:“体重体重” 规则:规则:“身穿极少量衣服,赤脚自然地站身穿极少量衣服,赤脚自然地站在体重计上在体重计上” 用来描述学生体重的数:用来描述学生体重的数:体重计上指示的体重计上指示的“数字数字” 例例2:评定学生道德品德:评定学生道德品德2、测量的三要素、测量的三要素 事物的属性事物的属性测量的对象测量的对象 物理属性:物理属性:长度、

3、重量、体积、温度、时长度、重量、体积、温度、时间等间等 心理属性:心理属性:智力、个性、能力、知识、技智力、个性、能力、知识、技能、态度、兴趣等能、态度、兴趣等 数字数字描述事物属性的符号描述事物属性的符号 同一性和区分性:同一性和区分性:每一个数的独特性每一个数的独特性 等级性或位次性:等级性或位次性:若干个数之间按其大小若干个数之间按其大小所形成的次序关系所形成的次序关系 等距性等距性 等比性等比性 规则规则给事物的属性分派数字的依据给事物的属性分派数字的依据 规则是指导我们如何测量的一种准则或方法。规则是指导我们如何测量的一种准则或方法。 当测量的其他条件相同时,使用不同的规则,当测量的

4、其他条件相同时,使用不同的规则,会产生不同的测量效果。会产生不同的测量效果。 规则的好坏,取决于制定规则的程序和所欲规则的好坏,取决于制定规则的程序和所欲测量的事物属性本身测量的事物属性本身 是否易于建立规则和便是否易于建立规则和便于操作规则于操作规则1、教育测量的定义、教育测量的定义 广义教育测量广义教育测量就是对于教育领域内的就是对于教育领域内的事物或现象,根据一定的客观标准,作缜密事物或现象,根据一定的客观标准,作缜密的考核,并依据一定的规则将考核的结果予的考核,并依据一定的规则将考核的结果予以数量的描述。以数量的描述。 狭义教育测量狭义教育测量是指对学生某些学科经过是指对学生某些学科经

5、过学习和训练之后,所获得的知识、技能的测学习和训练之后,所获得的知识、技能的测量。量。2、教育测量的两要素、教育测量的两要素 参照点参照点人为指定的相对零点人为指定的相对零点 单位单位无统一单位,也不符合等距要无统一单位,也不符合等距要求求 凡物之存在必有其数量凡物之存在必有其数量(桑代克,(桑代克,1918) 凡有数量的现象都可以测量凡有数量的现象都可以测量(麦柯尔,(麦柯尔,1923) 间接性间接性 相对性相对性 广义量表广义量表(scale)任何可以使事物数量化任何可以使事物数量化的值和量的渐进系列。的值和量的渐进系列。 测量的本质是根据某一法则将事物数量化测量的本质是根据某一法则将事物

6、数量化,即在一个定有参照点和单位的连续体上把即在一个定有参照点和单位的连续体上把事物的属性表现出来事物的属性表现出来,这个连续体即为量表这个连续体即为量表. 只要将预测的事物属性放在这个连续体的只要将预测的事物属性放在这个连续体的适当位置上适当位置上,看它们距离参照点的远近看它们距离参照点的远近,便会便会得到一个测量值得到一个测量值. 名称是测量中最简单的形式,即分类。名称是测量中最简单的形式,即分类。 在名称量表中,用来描述事物的数字仅仅是在名称量表中,用来描述事物的数字仅仅是代表事物的符号,只能区分事物的类别。代表事物的符号,只能区分事物的类别。 适用的统计方法:比率、百分比、适用的统计方

7、法:比率、百分比、相关系相关系数,数, 2检验。检验。 按某一标准对事物的属性进行分类,用来按某一标准对事物的属性进行分类,用来描述各个类别的数字不仅具有区分性,而描述各个类别的数字不仅具有区分性,而且还具有等级性,用这样的数字表示的量且还具有等级性,用这样的数字表示的量表称为等级量表或位次量表。表称为等级量表或位次量表。 量表上的数字不能进行加减乘除运算。量表上的数字不能进行加减乘除运算。 适用的统计方法:中位数、百分位数、等适用的统计方法:中位数、百分位数、等级相关系数、肯德尔和谐系数、符号检验、级相关系数、肯德尔和谐系数、符号检验、秩次检验、秩次方差分析。秩次检验、秩次方差分析。 有相等

8、单位和人定参照点的量表称为等距有相等单位和人定参照点的量表称为等距量表。量表。 量表上的数值不仅具有区分性、等级性,量表上的数值不仅具有区分性、等级性,还有等距性。还有等距性。 可以作加减运算,但不能作乘除运算。可以作加减运算,但不能作乘除运算。 适用的统计方法:算数平均数、标准差、适用的统计方法:算数平均数、标准差、积差相关系数、积差相关系数、Z检验、检验、t检验、检验、F检验。检验。 有相等单位和绝对零点的量表称为比率量有相等单位和绝对零点的量表称为比率量表。表。 量表上的数值可以进行加减乘除运算。量表上的数值可以进行加减乘除运算。 适用的统计方法:算数平均数、标准差、适用的统计方法:算数

9、平均数、标准差、积差相关系数、积差相关系数、Z检验、检验、t检验、检验、F检验、几检验、几何平均数、差异系数。何平均数、差异系数。 教育测量中上述四种量表都有。教育测量中上述四种量表都有。 心理(知识、技能)测验多属于等级量表。心理(知识、技能)测验多属于等级量表。 通常仍将测验分数作为等距量表来处理:通常仍将测验分数作为等距量表来处理:1、测验的定义、测验的定义 心理测验心理测验是一种对行为样本的客观和标准化是一种对行为样本的客观和标准化的测量(阿纳斯塔西,的测量(阿纳斯塔西,1967) 广义心理测验包括智力、人格、能力倾向、学业广义心理测验包括智力、人格、能力倾向、学业成就等测验。成就等测

10、验。 教育测验主要是学业成就测验,所以该定义也适教育测验主要是学业成就测验,所以该定义也适用于教育测验。用于教育测验。2、测验的三要素、测验的三要素 行为样本行为样本 测验的标准化测验的标准化 测验的客观性测验的客观性 行为样本行为样本对于所欲测量的心理属对于所欲测量的心理属性具有代表性的一组行为反应。性具有代表性的一组行为反应。 测验的标准化测验的标准化测验的编制、实施、测验的编制、实施、记分、分数的解释都按照统一的标准记分、分数的解释都按照统一的标准和严格的规定进行,使所有被试的测和严格的规定进行,使所有被试的测验条件一致。包括四方面:验条件一致。包括四方面: 测验材料的标准化测验材料的标

11、准化 测验实施的标准化测验实施的标准化 评分、记分的标准化评分、记分的标准化 测验分数解释的标准化测验分数解释的标准化 信度信度 效度效度 难度难度 区分度区分度1、测验本身、测验本身 测题本身的代表性测题本身的代表性 测题的数量测题的数量 测题的种类测题的种类2、测验实施、测验实施 测验情境测验情境 主试的影响主试的影响 意外干扰意外干扰3、被试状态、被试状态 生理状况生理状况 情绪状况情绪状况 练习因素练习因素(一)测验的准备(一)测验的准备1、主试准备、主试准备2、测验环境准备、测验环境准备 房间房间 座位座位 材料材料 人物人物3、被试准备、被试准备 时间选择时间选择 主试与被试建立和

12、睦关系主试与被试建立和睦关系(二)测验的实施(二)测验的实施 测验前期工作测验前期工作 测题的选定测题的选定 记录记录 正确对待被试的要求正确对待被试的要求 主试注意事项主试注意事项(三)测验结果解释(三)测验结果解释 被试测验前后的行为是否一致被试测验前后的行为是否一致 被试在强项和弱项测验内容方面的表现被试在强项和弱项测验内容方面的表现 被试的测验行为是不是一般行为,即测验被试的测验行为是不是一般行为,即测验表现是否代表在校或在家的行为表现是否代表在校或在家的行为 评定测验成绩一般不要采用绝对化的语言,评定测验成绩一般不要采用绝对化的语言,应该综合其他评定量表或评判标准作综合应该综合其他评

13、定量表或评判标准作综合界定界定1、根据测量的属性、根据测量的属性 智力测验智力测验 能力倾向测验能力倾向测验 人格测验人格测验 教育测验教育测验2、根据测验的标准化程度、根据测验的标准化程度 标准化测验标准化测验 教师自编测验教师自编测验3、根据测验的功能、根据测验的功能 普通测验和诊断测验普通测验和诊断测验 难度测验和速度测验难度测验和速度测验 预测测验和成绩测验预测测验和成绩测验4、根据记分标准、根据记分标准 常模参照测验常模参照测验 标准参照测验标准参照测验5、根据同时受测的人数、根据同时受测的人数 个别测验个别测验 团体测验团体测验6、根据测验所用的材料和形式、根据测验所用的材料和形式

14、 语言或文字测验语言或文字测验 非语言文字测验非语言文字测验 了解个别差异了解个别差异 检查和巩固学习检查和巩固学习 辨别智愚和分类安置辨别智愚和分类安置 选拔人才选拔人才 对比实验对比实验 考查学习努力程度考查学习努力程度 预测能力预测能力 指导就业指导就业 课程评价课程评价1、信度与误差的关系、信度与误差的关系(1)一般统计资料的三种误差)一般统计资料的三种误差 抽样误差抽样误差 测量误差测量误差 系统误差系统误差(2)信度与误差的关系)信度与误差的关系 抽样误差可以忽略不计抽样误差可以忽略不计 系统误差影响不大系统误差影响不大 测量误差是影响信度的主要原因测量误差是影响信度的主要原因2、

15、信度的理论定义、信度的理论定义 测验分数都包括两个部分:真分数测量测验分数都包括两个部分:真分数测量误差误差 信度是一组测验分数中真分数方差与获得信度是一组测验分数中真分数方差与获得分数方差的比率。分数方差的比率。 真分数理论的三个假设:真分数理论的三个假设: 误差分数的平均数等于零误差分数的平均数等于零 误差分数与真分数之间无相关误差分数与真分数之间无相关 两次测量的误差分数之间相关为零两次测量的误差分数之间相关为零 信度是同一个测验(或相等的两个、多个信度是同一个测验(或相等的两个、多个测验)对同一组被试实施两次或多次,所测验)对同一组被试实施两次或多次,所得结果的一致性程度,也即测验的可

16、靠性。得结果的一致性程度,也即测验的可靠性。 测验的信度以两次测验结果的相关系数表测验的信度以两次测验结果的相关系数表示。示。1、再测信度的定义、再测信度的定义 再测信度再测信度以同一个测验对同一组被试以同一个测验对同一组被试先后实施两次,所得结果的相关系数。先后实施两次,所得结果的相关系数。 若对同一组被试先后实施多次,可用每两若对同一组被试先后实施多次,可用每两次测验结果的相关系数之平均数来表示。次测验结果的相关系数之平均数来表示。 再测信度又称为稳定系数再测信度又称为稳定系数2、再测信度的估计方法、再测信度的估计方法 用原始数据计算用原始数据计算 用样本平均数和样本标准差计算用样本平均数

17、和样本标准差计算 用样本平均数和总体标准差的估计值计算用样本平均数和总体标准差的估计值计算学生序号学生序号第一次测验第一次测验第二次测验第二次测验120202202132121422205232362323723258242592526102626 优点优点 缺点缺点 异质性测验异质性测验 速度测验速度测验 运动技能测验运动技能测验1、复本信度的定义、复本信度的定义 复本信度复本信度等值性的两个测验对同一组被等值性的两个测验对同一组被试实施结果的一致性程度。试实施结果的一致性程度。 复本测验是指在性质、内容、题型、题数、复本测验是指在性质、内容、题型、题数、难度等方面都一致或相等的两个或多个测

18、难度等方面都一致或相等的两个或多个测验。验。 若复本的个数在两个以上,可用每两个复本测验若复本的个数在两个以上,可用每两个复本测验结果的相关系数之平均数来表示。结果的相关系数之平均数来表示。 复本信度系数分等值系数和稳定等值系数两种复本信度系数分等值系数和稳定等值系数两种2、复本信度的估计方法、复本信度的估计方法 用原始数据计算用原始数据计算 用样本平均数和样本标准差计算用样本平均数和样本标准差计算 用样本平均数和总体标准差的估计值计算用样本平均数和总体标准差的估计值计算学学生生序序号号12345678910 总总和和第第一一次次19 191817161515141312 158第第二二次次2

19、0 171818171513151212 157 优点优点 缺点缺点 是考察测验可靠性的最好方法是考察测验可靠性的最好方法 再测信度:再测信度:测验在不同时间的一致性测验在不同时间的一致性 复本信度:复本信度:测验的两种不同形式的一致性测验的两种不同形式的一致性 内在一致性信度:内在一致性信度:测验内部(测题之间的测验内部(测题之间的一致性)一致性) 斯皮尔曼布朗公式矫正法斯皮尔曼布朗公式矫正法 卢农公式矫正法卢农公式矫正法 弗拉南根公式矫正法弗拉南根公式矫正法 0、1记分测验的同质性信度记分测验的同质性信度 非非0、1记分测验的同质性信度记分测验的同质性信度 优点优点 缺点缺点 同质性测验同

20、质性测验 难度测验难度测验 评分者信度是指多位评分者对同一组被试评分者信度是指多位评分者对同一组被试作答反应评分的一致性程度作答反应评分的一致性程度 积差相关或等级相关估计法积差相关或等级相关估计法 系数估计法系数估计法 肯德尔和谐系数估计法肯德尔和谐系数估计法信度信度系数系数类型类型再测再测信度信度复本信复本信度(连度(连续)续)复本复本信度信度(间(间隔)隔)分半分半信度信度同质同质性信性信度度评分评分者信者信度度信度信度系数系数性质性质跨时跨时间间跨形式跨形式 跨时跨时间和间和形式形式跨项目或两跨项目或两个分半测验个分半测验跨评跨评分者分者误差误差方差方差来源来源时间时间取样取样内容取内

21、容取样样时间时间和内和内容取容取样样内容内容取样取样内容内容的异的异质性质性评分评分者之者之间差间差异异 效度效度一个测验对其所欲测量的属性能一个测验对其所欲测量的属性能够确实测到的程度,即测验的正确性。够确实测到的程度,即测验的正确性。 根据美国心理学会的标准,测验的效度分根据美国心理学会的标准,测验的效度分为三大类:为三大类: 效标关联效度效标关联效度 内容效度内容效度 结构效度结构效度 一个测验的有效性,总是就其特殊的目的、一个测验的有效性,总是就其特殊的目的、功能和适用范围而言的,并不是就任何目的、功能和适用范围而言的,并不是就任何目的、功能和任何适用范围而言的。功能和任何适用范围而言

22、的。 按照特定的目的精心编制的测验,其效度不按照特定的目的精心编制的测验,其效度不是全有全无的区别,只是程度上的不同。是全有全无的区别,只是程度上的不同。 效标关联效度是指以某一种测验分数与其效效标关联效度是指以某一种测验分数与其效标分数之间的相关来表示的效度,又称为统标分数之间的相关来表示的效度,又称为统计效度。计效度。 效标效标指确能显示或反映所欲测量的属性指确能显示或反映所欲测量的属性的变量。是考察检定测验效度的参照标准。的变量。是考察检定测验效度的参照标准。 智力测验效标智力测验效标学科成绩、教师评定等学科成绩、教师评定等级、受教育年限、年龄等。级、受教育年限、年龄等。 能力倾向测验效

23、标能力倾向测验效标特殊能力或特殊训特殊能力或特殊训练的成绩练的成绩 教育测验效标教育测验效标相应的学科成绩或教师相应的学科成绩或教师的等级评定的等级评定 职业兴趣测验职业兴趣测验实际工作成绩或记录实际工作成绩或记录 根据获得测验分数和效标分数的时间关系,根据获得测验分数和效标分数的时间关系,可以将效标关联效度分为同时效度和预测可以将效标关联效度分为同时效度和预测效度。效度。 同时效度同时效度以测验分数与现有效标分数以测验分数与现有效标分数之间的相关表示的效度。之间的相关表示的效度。 预测效度预测效度以被试的测验分数与其未来以被试的测验分数与其未来效标分数之间相关表示的效度。效标分数之间相关表示

24、的效度。 测验分数与效标分数之间的相关系数称为测验分数与效标分数之间的相关系数称为效标关联效度系数。效标关联效度系数。1、积差相关法、积差相关法 当测验分数和效标分数均为正态连续变量当测验分数和效标分数均为正态连续变量时采用时采用2、二列相关法、二列相关法 当测验分数和效标分数均为正态连续变量,当测验分数和效标分数均为正态连续变量,而其中一个变量被人为地分成二分变量时。而其中一个变量被人为地分成二分变量时。3、点二列相关法、点二列相关法 当测验分数和效标分数其中一个变量为连续当测验分数和效标分数其中一个变量为连续变量,而另一个为真正的二分变量或双峰分变量,而另一个为真正的二分变量或双峰分布变量

25、时。布变量时。4、等级相关法、等级相关法 当测验成绩和效标成绩两个都(或其中一个)当测验成绩和效标成绩两个都(或其中一个)以等级次序排列或以等级次序表示时。以等级次序排列或以等级次序表示时。5、四分相关及、四分相关及相关法相关法 当测验成绩和效标成绩都是二分变量或以当测验成绩和效标成绩都是二分变量或以二分变量表示时。二分变量表示时。6、列联相关、列联相关 当测验和效标成绩中有一个不止分为两个当测验和效标成绩中有一个不止分为两个类别时。类别时。1、概念及意义、概念及意义 内容效度内容效度指测验内容对所要测量的内容的代指测验内容对所要测量的内容的代表性程度。表性程度。2、建立过程、建立过程3、检定

26、方法、检定方法(1)逻辑判断法)逻辑判断法 一般由本学科的专家根据所欲测量属性的定义和一般由本学科的专家根据所欲测量属性的定义和测量内容范围的界定,以及各部分内容,各认识测量内容范围的界定,以及各部分内容,各认识层次的比重,用逻辑分析的方法对策得体性能是层次的比重,用逻辑分析的方法对策得体性能是否能代拨所欲测量的内容及教育目标作出判断。否能代拨所欲测量的内容及教育目标作出判断。(2)比较平均数差异的显著性)比较平均数差异的显著性 对同一组被试用一个测验的两个复本在某对同一组被试用一个测验的两个复本在某一学科教学或训练前后实施测验,根据两一学科教学或训练前后实施测验,根据两次测验成绩差异的显著性

27、来判断该测验内次测验成绩差异的显著性来判断该测验内容的有效性。容的有效性。(3)相关法)相关法 用反映同一内容的两个不同测验对同一组用反映同一内容的两个不同测验对同一组被试施测结果的相关系数表示。被试施测结果的相关系数表示。4、提高内容效度的方法、提高内容效度的方法 增加测题的同质性增加测题的同质性 专家小组平行作业法专家小组平行作业法 多人裁判法多人裁判法5、表面效度、表面效度 表面效度表面效度指测验在表面上使被试直觉感指测验在表面上使被试直觉感到的有效性程度。到的有效性程度。 为了使测验具有表面效度,必须根据测验的为了使测验具有表面效度,必须根据测验的性质、被试的年龄和知识背景来选择测验材

28、性质、被试的年龄和知识背景来选择测验材料和习惯用语。料和习惯用语。 表面效度不是测验的真正效度。表面效度不是测验的真正效度。1、概念、概念 指测验对于人的假设属性或理论概念测量指测验对于人的假设属性或理论概念测量到的程度。到的程度。2、建立过程、建立过程 对所欲测量的属性根据某种理论提出假定对所欲测量的属性根据某种理论提出假定的结构的结构 根据假定的结构拟定测题和编制测验根据假定的结构拟定测题和编制测验 寻求测验分数与其它评定之间的关系寻求测验分数与其它评定之间的关系 根据测验结构来验证假设结构中的各种因根据测验结构来验证假设结构中的各种因素是否成立素是否成立 修改测验,重新实施有关步骤修改测

29、验,重新实施有关步骤3、检定方法、检定方法 用内容效度为结构效度提供证据用内容效度为结构效度提供证据 用相容效度来确定结构效度用相容效度来确定结构效度 相容效度相容效度一个新编的尚待确定其结构的测验与一个新编的尚待确定其结构的测验与另一个已知其结构的测验共同测量相同结构的程另一个已知其结构的测验共同测量相同结构的程度。度。 多元特质与多重方法矩阵多元特质与多重方法矩阵 辐合效度辐合效度用多种方法对同一种特质进行测量,用多种方法对同一种特质进行测量,所得结果具有高相关。所得结果具有高相关。 辨别效度辨别效度用同一种方法对多种不同特质进行测用同一种方法对多种不同特质进行测量,所得结果的相关低于用多

30、种方法测量同一种量,所得结果的相关低于用多种方法测量同一种特质的相关。特质的相关。 积差相关系数表示的效度系数之检验积差相关系数表示的效度系数之检验 检验和检验检验和检验 测题难度指测题的难易程度测题难度指测题的难易程度 表示测题难易程度的数量称为测题的表示测题难易程度的数量称为测题的难度指数,用难度指数,用P表示。表示。(一)(一)0、1记分测题难度的估计记分测题难度的估计1、PR / n (所有被试该题答对的人数比率)(所有被试该题答对的人数比率)2、P( PH PL )/ 2(高分组和低分组答对(高分组和低分组答对人数比率的平均数)人数比率的平均数)(二)(二)0、1记分多重选择题难度的

31、校正记分多重选择题难度的校正 CP(kP1)/ (k1) 如果要比较两个选项数目不同的测题难度,如果要比较两个选项数目不同的测题难度,必须先用此公式对两测题的难度进行校正。必须先用此公式对两测题的难度进行校正。(三)非(三)非0、1记分测题难度的估计记分测题难度的估计 P所有被试该题得分的平均数所有被试该题得分的平均数 / 该题满分该题满分分数分数1、0、1记分测题的平均数和标准差记分测题的平均数和标准差 每个测题得分的平均数就是其难度指数每个测题得分的平均数就是其难度指数P 每个测题得分的标准差为每个测题得分的标准差为 pq2、测题难度的理论评价、测题难度的理论评价 测题方差的大小表示测题对

32、被试反应的鉴测题方差的大小表示测题对被试反应的鉴别能力别能力 中等难度(即难度指数中等难度(即难度指数P0.5)的测题鉴)的测题鉴别力最好别力最好3、测题难度的选择、测题难度的选择 测验中各测题难度的选择与测验的性质和目的有测验中各测题难度的选择与测验的性质和目的有关。关。 对于测量某门学科知识或技能掌握程度的测验来对于测量某门学科知识或技能掌握程度的测验来说,测验中大部分测题难度指数说,测验中大部分测题难度指数P分布在分布在0.350.65为宜,所有测题难度指数的平均数在为宜,所有测题难度指数的平均数在0.5左右左右为宜。为宜。 如果测验的目的在于选拔人才,测题难度指数的如果测验的目的在于选

33、拔人才,测题难度指数的平均数应根据录取率而定。平均数应根据录取率而定。 如果测验的目的在于测量速度,则要求所有的测如果测验的目的在于测量速度,则要求所有的测题难度指数接近相等。题难度指数接近相等。 测题难度还应该考虑接受测验的对象。测题难度还应该考虑接受测验的对象。(一)区分度的概念(一)区分度的概念 测题的区分度指测题对于被试反应的区分程度和测题的区分度指测题对于被试反应的区分程度和鉴别能力。鉴别能力。 区分度一般用某测题的得分与测验总分之间的相区分度一般用某测题的得分与测验总分之间的相关系数来表示。关系数来表示。(二)测题区分度的估计(二)测题区分度的估计1、0、1记分测题区分度的估计记分

34、测题区分度的估计 分组法:鉴别指数分组法:鉴别指数D PH PL 点二列相关法点二列相关法 二列相关法二列相关法2、非、非0、1记分测题区分度的估计记分测题区分度的估计 积差相关法积差相关法(一)测题效度的概念(一)测题效度的概念 测题效度是指测题分数与外部效标分数的测题效度是指测题分数与外部效标分数的相关程度。相关程度。 测题的效度对测验的效度有很大的贡献。测题的效度对测验的效度有很大的贡献。 如果把测验总分视为内部效标,测题的区如果把测验总分视为内部效标,测题的区分度就是测题的内部效标效度。分度就是测题的内部效标效度。 从测题效度对被试反应的鉴别能力来说,从测题效度对被试反应的鉴别能力来说

35、,它也是一种区分度。它也是一种区分度。(二)测题效度的估计方法(二)测题效度的估计方法 凡是可以用来估计测题区分度的方法都可凡是可以用来估计测题区分度的方法都可以用来估计测题的效度,只是将内部效标以用来估计测题的效度,只是将内部效标换成了外部效标而已。换成了外部效标而已。 可以采用二列相关、点二列相关、积差相可以采用二列相关、点二列相关、积差相关等。关等。 测题区分度和效度的取值范围都是测题区分度和效度的取值范围都是-11之之间。间。 如果区分度或效度为正值,其数值越大,如果区分度或效度为正值,其数值越大,则测题越好。则测题越好。测题鉴别指数评鉴测题鉴别指数评鉴鉴别指数鉴别指数D评鉴评鉴0.4

36、0以上以上非常好非常好0.300.39良好,最好修改良好,最好修改0.200.29尚可,仍需修改尚可,仍需修改0.19以下以下差,必须淘汰差,必须淘汰 如果测验的目的在于评定学生的学习成绩,如果测验的目的在于评定学生的学习成绩,而且测验是同质性的,则应选择区分度作而且测验是同质性的,则应选择区分度作为评价指标。为评价指标。 如果测验的目的在于预测被试未来的表现,如果测验的目的在于预测被试未来的表现,则应选择测题的效度作为评价指标。则应选择测题的效度作为评价指标。 对于人类心理属性的测量很少有绝对的测对于人类心理属性的测量很少有绝对的测度度 测验分数相同的增量很难代表相同的心理测验分数相同的增量

37、很难代表相同的心理增量增量 原始分数原始分数根据测验的记分标准,对被根据测验的记分标准,对被试的测验结果所计算出的测验分数。试的测验结果所计算出的测验分数。 对于同一个学生不同学科的原始分数,由对于同一个学生不同学科的原始分数,由于缺乏参照点和一定的单位,所以既不能于缺乏参照点和一定的单位,所以既不能相互比较,也不能相加求和。相互比较,也不能相加求和。 导出分数导出分数经过统计整理的,具有一定经过统计整理的,具有一定参照点和单位的,可以相互比较的分数。参照点和单位的,可以相互比较的分数。 常用的导出分数有百分等级、标准分数、常用的导出分数有百分等级、标准分数、年级等值分数、年龄等值分数。年级等

38、值分数、年龄等值分数。 对一个标准化样本施行某一个测验之后,对一个标准化样本施行某一个测验之后,将所获得的原始分数以常模(平均数)为将所获得的原始分数以常模(平均数)为参照点转换成某种导出分数,并以等值表参照点转换成某种导出分数,并以等值表的形式将原始分数与导出分数之间的对应的形式将原始分数与导出分数之间的对应值表示出来,这就是测验量表。值表示出来,这就是测验量表。 常用的测验量表有百分等级量表,标准分常用的测验量表有百分等级量表,标准分量表、年级量表和年龄量表。量表、年级量表和年龄量表。 常模常模某年级、某年龄或具有某种共同某年级、某年龄或具有某种共同特征的被试团体在某一测验上实际达到的特征

39、的被试团体在某一测验上实际达到的平均水平。平均水平。 常模是一个相对的数量,不适一种绝对的、常模是一个相对的数量,不适一种绝对的、永久性的、固定不变的标准。它会随着时永久性的、固定不变的标准。它会随着时间和空间的不同而变化。间和空间的不同而变化。 标准化样本标准化样本对于使用某测验的总体具对于使用某测验的总体具有代表性的那部分个体。有代表性的那部分个体。 标准标准某年级、某年龄或具有某种共同某年级、某年龄或具有某种共同特征的被试团体在某一测验上应当达到的特征的被试团体在某一测验上应当达到的水准。水准。 百分等级量表百分等级量表以标准化样本测验分数以标准化样本测验分数的中位数为参照点,以百分等级

40、(百分位)的中位数为参照点,以百分等级(百分位)为单位的测验量表。为单位的测验量表。 与百分等级相对应的原始分数称为该百分与百分等级相对应的原始分数称为该百分等级的百分位数。等级的百分位数。 根据标准化样本的测验分数计算出各相应根据标准化样本的测验分数计算出各相应的百分位数,即建立百分等级与原始分数的百分位数,即建立百分等级与原始分数的等值对照表,即为百分等级量表。的等值对照表,即为百分等级量表。(一)优点(一)优点 百分等级量表上的等级的意义容易被人理解。百分等级量表上的等级的意义容易被人理解。 同一被试在不同测验上的百分等级可以相互同一被试在不同测验上的百分等级可以相互比较。比较。 不同被

41、试在同一测验上的百分等级可以相互不同被试在同一测验上的百分等级可以相互比较。比较。 在较高层次的学校中,当年龄或年级量表不在较高层次的学校中,当年龄或年级量表不甚适用时,可采用百分量表。甚适用时,可采用百分量表。 百分等级可转换成标准分数。百分等级可转换成标准分数。(二)缺点(二)缺点 百分等级的单位距离不相等。百分等级的单位距离不相等。 在百分等级量表上,靠近分布中央的原始在百分等级量表上,靠近分布中央的原始分数稍有变化,其百分等级就会有较大的分数稍有变化,其百分等级就会有较大的变化。而靠近分布两端的原始分数,虽然变化。而靠近分布两端的原始分数,虽然变化较大,其百分等级却变化较小。变化较大,

42、其百分等级却变化较小。 百分等级量表属于四种测量量表种的等级百分等级量表属于四种测量量表种的等级或位次量表或位次量表 两个不同样本中的百分等级不能相互比较两个不同样本中的百分等级不能相互比较 百分等级量表对测验成绩的普遍水平不够百分等级量表对测验成绩的普遍水平不够敏感,与敏感,与T量表相比,其可靠性较差。量表相比,其可靠性较差。 标准分数量表是以平均分数为参照点,以标准分数量表是以平均分数为参照点,以标准差为单位的测验量表,其量表值称为标准差为单位的测验量表,其量表值称为标准分数。标准分数。 线性标准分数就是由原始分数转换成标准线性标准分数就是由原始分数转换成标准分数之后,只改变了分布的平均数

43、和标准分数之后,只改变了分布的平均数和标准差,并不改变分布的形态。差,并不改变分布的形态。 常见的线性标准分数有线性常见的线性标准分数有线性Z分数、线性分数、线性CEEB分数、线性分数、线性ITED分数、线性分数、线性T分数。分数。(一)线性(一)线性Z分数的含义分数的含义 线性线性Z分数是以平均数为分数是以平均数为0,标准差为,标准差为1的标准分的标准分数。数。 线性线性Z分数量表是线性分数量表是线性Z分数与原始分数的等值对分数与原始分数的等值对照表。照表。(二)线性(二)线性Z分数量表的编制方法分数量表的编制方法 根据标准化样本中每个被试测验的原始分数,计根据标准化样本中每个被试测验的原始

44、分数,计算其平均数及标准差。算其平均数及标准差。 根据公式计算原始分数全距中每一个原始分数的根据公式计算原始分数全距中每一个原始分数的线性线性Z分数。分数。(三)线性(三)线性Z分数量表的评价分数量表的评价1、优点、优点 线性线性Z分数的单位是等距的。分数的单位是等距的。 如果几个不同测验分数的分布形态是很相近如果几个不同测验分数的分布形态是很相近的,那么同一个被试在几个不同测验上的线的,那么同一个被试在几个不同测验上的线性性Z分数可以相互比较。分数可以相互比较。 如果几个不同测验分数的分布形态是很相近如果几个不同测验分数的分布形态是很相近的,可以将一个被试几个不同测验上的线性的,可以将一个被

45、试几个不同测验上的线性Z分数相加求和,或计算几个测验线性分数相加求和,或计算几个测验线性Z分数分数的平均数,同时还可以比较不同被试几个线的平均数,同时还可以比较不同被试几个线性性Z分数的总分或平均数。分数的总分或平均数。2、缺点、缺点 小于平均数的原始分数转换成线性小于平均数的原始分数转换成线性Z分数后分数后都是负值,这既不容易理解,也不便于运都是负值,这既不容易理解,也不便于运算。算。 标准化样本,线性标准化样本,线性Z分数的全距一般不超过分数的全距一般不超过6个单位,由于单位太大,难以区分个别被个单位,由于单位太大,难以区分个别被试测验成绩的差异,若要精确地区分个别试测验成绩的差异,若要精

46、确地区分个别被试的差异,线性被试的差异,线性Z分数的值在小数点后必分数的值在小数点后必须保留一到两位数字,这也不便于运算。须保留一到两位数字,这也不便于运算。 线性线性Z分数的分布形态与原始分数的分布形分数的分布形态与原始分数的分布形态完全一样。当两个测验的分布形态不同态完全一样。当两个测验的分布形态不同时,它们的线性时,它们的线性Z分数既不可以相互比较,分数既不可以相互比较,又不可以相加求和。又不可以相加求和。(一)线性(一)线性CEEB分数的意义及其量表的编制分数的意义及其量表的编制 CEEB分数是平均数为分数是平均数为500,标准差为,标准差为100的的线性标准分数。线性标准分数。 CE

47、EB100Z500 线性线性CEEB分数量表是线性分数量表是线性CEEB分数与原分数与原始分数的等值对照表。始分数的等值对照表。 先将原始分数全距中每一个原始分数转换成先将原始分数全距中每一个原始分数转换成线性线性Z分数。分数。 再利用上述公式将每个线性再利用上述公式将每个线性Z分数转换成线分数转换成线性性CEEB分数。分数。(二)线性(二)线性CEEB分数量表的评价分数量表的评价1、优点、优点 线性线性CEEB分数全为正数,容易理解,也便于运分数全为正数,容易理解,也便于运算。算。 线性线性CEEB分数的单位为分数的单位为1 / 100,大大小于线性,大大小于线性Z分数的单位分数的单位1,这

48、不仅使它全部变成了整数而不,这不仅使它全部变成了整数而不带小数,而且使其能精确地区分个别被试的差异。带小数,而且使其能精确地区分个别被试的差异。因而特别适用于大规模选拔性测验。因而特别适用于大规模选拔性测验。 尽管线性尽管线性CEEB分数是一种线性转换,并未改变分数是一种线性转换,并未改变原始分数的分布形态,但通常来说,它为一个被原始分数的分布形态,但通常来说,它为一个被试几种不同测验分数的相互比较及相加求和提供试几种不同测验分数的相互比较及相加求和提供了条件,也为不同被试之间多科总分的比较提供了条件,也为不同被试之间多科总分的比较提供了条件。了条件。2、缺点、缺点 两个分布形态不同的线性两个

49、分布形态不同的线性CEEB分数不可以分数不可以相互比较,也不可以相加求和。相互比较,也不可以相加求和。 对于单位不需要过细的测验来说,对于单位不需要过细的测验来说,CEEB分分数的数字太大,计算起来不甚方便。数的数字太大,计算起来不甚方便。 CEEB100Z500(大规模选拔性测验)(大规模选拔性测验) T10Z50(智力测验和教育测验)(智力测验和教育测验) 九段分数九段分数2Z5(辅导与咨询,军队选拔)(辅导与咨询,军队选拔) ITED5Z15(教育发展测验)(教育发展测验)(一)年级量表的含义及编制(一)年级量表的含义及编制 测验的原始分数与年级的等值对照表称为测验的原始分数与年级的等值

50、对照表称为年级量表。年级量表。 将某种测验施于由各年级组成的标准化样将某种测验施于由各年级组成的标准化样本,然后求出各年级测验分数的平均数本,然后求出各年级测验分数的平均数(或中位数),这些平均数与年级分数的(或中位数),这些平均数与年级分数的对应表就是年级量表。对应表就是年级量表。 一般将一个学年分成十个学月,然后再定一般将一个学年分成十个学月,然后再定出每一个学月相对应的原始分数。出每一个学月相对应的原始分数。(二)年级量表的评价(二)年级量表的评价 年级量表常会被误解年级量表常会被误解 年级量表不能比较不同测验的得分年级量表不能比较不同测验的得分 年级量表的可靠性较差年级量表的可靠性较差

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(教育测量课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|