1、教育测量与评价主讲人 万荣根1、为什么要学这一门课?、为什么要学这一门课?2、这门课主要解决什么问这门课主要解决什么问题?题?老师处罚学生出老师处罚学生出“奇招奇招”没上没上90分跪领考卷分跪领考卷 v据据重庆晚报重庆晚报报道,为报道,为“促使学生进步促使学生进步”,重庆涪陵城区第四小学(下,重庆涪陵城区第四小学(下简称城四小)一教师出简称城四小)一教师出“奇招奇招”:考试成绩:考试成绩90分以下的,都当众跪下,用分以下的,都当众跪下,用双膝走上讲台领考卷。双膝走上讲台领考卷。v19日下午日下午6时许,城四小一年级二班学生蒙蒙(化名)放学回家委屈地大时许,城四小一年级二班学生蒙蒙(化名)放学回
2、家委屈地大哭。父母一再追问后得知真相。哭。父母一再追问后得知真相。20日,蒙蒙和其他几个同学告诉记者,日,蒙蒙和其他几个同学告诉记者,19日语文单元测验发卷,教语文的张老师宣布,日语文单元测验发卷,教语文的张老师宣布,90分以下就算不及格,不及分以下就算不及格,不及格的人要从座位处跪着上讲台领卷子。之后,张站在讲台念姓名和成绩,格的人要从座位处跪着上讲台领卷子。之后,张站在讲台念姓名和成绩,被念到没上被念到没上90分的,在一声分的,在一声“跪跪”的命令下,就当众跪下行走,其他人哄的命令下,就当众跪下行走,其他人哄堂大笑。张老师接受采访时承认,自己确实让学生下跪了。该校校长表示,堂大笑。张老师接
3、受采访时承认,自己确实让学生下跪了。该校校长表示,他们将对该老师严肃处理。他们将对该老师严肃处理。v案例:案例:v香港大学面试题给中国教育的启示?香港大学面试题给中国教育的启示?v道道 与与 术术v回答:回答:v教得怎么样?教得怎么样?v育得怎么样?育得怎么样?序言v1、课程目标、课程目标能熟记并用自己的语言解释教育测评中的核心概能熟记并用自己的语言解释教育测评中的核心概念、原理;念、原理;能编制试卷并进行试卷质量分析、学生考试情况能编制试卷并进行试卷质量分析、学生考试情况分析分析能说出成长记录袋评价设计步骤并进行设计;能说出成长记录袋评价设计步骤并进行设计;能用自己的语言阐释教师教学工作评价
4、能用自己的语言阐释教师教学工作评价v2教学主要内容教育测评概述教育测评的质量特性学生评价之一:教师自编测验学生评价之二:发展性评价理念、考试改革、表现性评价、成长记录袋评价等教师教学工作评价v3学习要求及方式:选修课程前,明确自己的选课目的,也要预计到该门课程的学习困难;课堂教学中,善于记录教师、其他同学的观点,并进行分析与整理、提炼与总结;课堂讨论中,进行独立地思考,有观点的表达,以创造性思维表现自己的个性;活动参与中,要有学术自信,主动发言,敢于表达,真正做到提问、质疑和评判;课后活动中,自主、自觉地按时完成学习任务和作业。v4、考核方式v平时(40%)+期末(60%)v平时成绩=出勤(1
5、0%)+课堂讨论(20%)+作业(10%)作业:v1.试卷编制v学生在分组讨论完成测试计划表、双向细目表设计的基础上,每位同学根据相关试卷编制技术独立完成教育测量与评价课程的期末试卷编制及试卷的答案要点,符合相关的格式要求。在提交的最终作品时,包括测试计划表、双向细目表、试卷及答案要点。其中,测试计划表、双向细目表可以与小组其他成员相同,但试卷、答案要点不可雷同;每组各成员作品由一位同学收齐后统一提交。v2、课堂观察报告v自主确定选题,制订观察表格,完成观察报告;v作业要求:v每位同学根据自己的理解,结合讨论结果,自主完成与本组成员不同的评价设计;v不准相互抄袭,不准简单、敷衍了事;v按时完成
6、作业设计,当面提交作品(手写稿或打印稿均可)。v教师对每件作品评分后,返回各位同学,解疑答惑,适当修正;v全班交流,同学相互点评、教师点评。v3、双向细目表v按照自身的专业方向,选择小学一册教材内容,编制一份双向细目表,并写下自己的体会。网络相关v1http:/ v新思考网发展性评价专栏,包含学生评价、教师评价、学校评价、评价前沿等相关文献研究资料。v2http:/ 喇叭花网教学评价专栏,包含学生评价、教学评价等教育评价改革方面的最新文献研究资料。v3http:/ v教育部全国中小学教师继续教育网教学评价研究专栏,包含新课程评价改革的最新文献研究资料。课前小诊断:v请判断下列现象哪些属于教育测
7、量、哪些属于教育评价?v1、这本书的长度是36cmv2、考试v3、这次考试李明同学及格了v4、这次考试我们班90分以上的同学有10个同学,超过了一(3)班。第一章教育测评概述第一章教育测评概述学习目标:1、能定义教育测量和教育评价2、认识教育测量与教育评价之间的关系3、了解教育测量与教育评价的主要发展历程第一节教育测评基本问题第一节教育测评基本问题一、教育测量与教育评价的含义一、教育测量与教育评价的含义二、教育评价的基本问题二、教育评价的基本问题三、教育评价相关概念的辨析三、教育评价相关概念的辨析一、教育测量与评价的含义一、教育测量与评价的含义一、什么是测量(一)测量的定义v史蒂文斯:从广义而
8、言,测量系根据法则给事物分派数字。v此定义有三个特性:法则、事物、数字。1、法则v法则是测量的依据和准则,即我们根据什么来进行测量。2、事物v事物是测量的对象,确切地说,测量的对象是事物的属性。3、数字v测量结果的表现形式。测量结果以数字形式表现出来。说一说说一说v下列测量中的规则是什么下列测量中的规则是什么v1、测色盲、测色盲v2、测口算、测口算v3、测体重、测体重v4、测智商、测智商假同色原理v假同色图是利用假同色图是利用色调深浅程度相同色调深浅程度相同而而颜色不同的点颜色不同的点组成数字组成数字或图形,在自然光线下距离或图形,在自然光线下距离0.5m处识读。检查时色盲本应处识读。检查时色
9、盲本应放正,每一图不得超过放正,每一图不得超过5秒。色觉障碍者辨认困难,读错或秒。色觉障碍者辨认困难,读错或不能读出,可按照色盲表规定确认属于何种色觉异常。不能读出,可按照色盲表规定确认属于何种色觉异常。v口算口算就是用就是用脑计算脑计算,用口头叙述来记忆当时的结果。,用口头叙述来记忆当时的结果。不借助不借助任何实物进行简便运算任何实物进行简便运算的方法。的方法。(二)测量的三个要素v1、量具v依据某些科学原理和法则,发展出合适的量具或制定出科学的测量方案。如量表v量表是具有参照点,并以等价的单位制成,用数字确定某事物的某种属性的工具。v量表水平:v类别量表水平v顺序量表水平v等距量表水平v比
10、率量表水平2、单位v单位是我们计算的标准,是测量的基本要求,没单位就无法测量。3、参照点v参照点是确定的计算事物数量的起点。一般有两种:v绝对零点v相对零点。v教育测量的参照点一般也是相对的。二、什么是教育测量(一)教育测量的含义v教育测量是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。v一位老师说:教育测量就是考试v思考:思考:v教育测量与物理教育测量与物理测量的区别?测量的区别?(二)教育测量的特点 1、测量的间接性和推断性 2、测量对象的模糊性和测量误差的不可避免性 3、量表具有多样性,结果具有相对抽象性v2012年天津卷高考作文题:年天津卷高考作文题:v两
11、条鱼在河里游泳,老鱼问小鱼:河里两条鱼在河里游泳,老鱼问小鱼:河里的水质如何?小鱼说:我不知道水质是清澈的水质如何?小鱼说:我不知道水质是清澈还是浑浊。生活中有很多这样的小事情体现还是浑浊。生活中有很多这样的小事情体现大道理。根据你对这段材料的理解,写一篇大道理。根据你对这段材料的理解,写一篇作文,体裁不限,作文,体裁不限,800以上。以上。v请评分v误差误差16分,一篇高考作文的神奇经历分,一篇高考作文的神奇经历v2007年江苏高考有一篇作文的判分经历颇为曲折:三位老师年江苏高考有一篇作文的判分经历颇为曲折:三位老师分别给了分别给了36分、分、42分、分、38分,电脑依据程序自动选取相近的分
12、,电脑依据程序自动选取相近的分数,算出平均值分数,算出平均值37分。分。37分,眼看着就要成为这篇作文的分,眼看着就要成为这篇作文的最终分数。然而,这篇作文在被提交评审组前,被江苏省高最终分数。然而,这篇作文在被提交评审组前,被江苏省高考语文阅卷组组长、南师大教授何永康考语文阅卷组组长、南师大教授何永康“截获截获”,在反复看,在反复看了三遍之后,有终栽权的何教授打出了了三遍之后,有终栽权的何教授打出了53分。分。53分,成为这分,成为这篇作文的最终分数。篇作文的最终分数。v从从37分到分到53分,增加的这分,增加的这16分对于一篇高考作文来说,不啻分对于一篇高考作文来说,不啻是一趟是一趟“跳龙
13、门跳龙门”的神奇之旅。而改判加分的背后,颇有一的神奇之旅。而改判加分的背后,颇有一些值得深思的东西。些值得深思的东西。游戏游戏v这件冬装网上售价是这件冬装网上售价是400元,如果让你开个网店,元,如果让你开个网店,你会标价多少元?你会标价多少元?四、教育测量学的作用(一)有利于提高教育、教学的水平(二)有利于提高教育管理的水平(三)有利于发展教育研究的方法第二节教育评价概述一、什么是评价v评价就是根据某种价值观对事物及其属性进行判断、衡量,即对人或物作出好与坏、真与假、善与恶、美与丑、优与劣等的判断。评价意味着对某一事物的价值给予一般的衡量。v价值观在评价中起重要作用。价值是客观的,评价则具有
14、主观性。二、什么是教育评价二、什么是教育评价(一)早期的解释v泰勒:确定教育目标在实际上被理解到何种程度的过程.v日本学者:教育评价就是系统地、有步骤地从数量上测量或从性质上描述儿童的学习过程和结果,据此判定是否达到了所期望的教育目标的一种手段.v以教育目标为依据,评量学习结果达到目标的程度,就是教育评价.(二)60年代的界说v克龙巴赫:评价是为决策提供信息的过程.v另一种描述:教育评价是一种有系统地去寻找并收集信息资料,以便协助决策者在诸种可行的途径中择一而行的历程.v这种观点强调了评价的信息作用,扩大和拓宽了评价的功能、范围.(三)较深层的定义v斯克里文和豪斯:评价是一种对优缺点和价值的评
15、估,是一种既有描述又有判断的活动.v大桥正夫:教育评价就是对照教育目标,对教育行为产生的变化进行价值上的判断.(四)对教育评价的初步界定和理解v教育评价:教育评价是根据一定的教育价值观或教育目标,运用可行的科学手段,通过系统地搜集信息、分析解释,对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据的过程.v(五)教育评价与教育测量的关系v区别:测量关心的是数量的多少,评价关心的是价值的高低;测量是一种纯客观的过程,评价带有主观性;测量是一种单一的活动,评价则是一种综合活动.v联系:教育测量是教育评价获得数据资料的重要手段,评价只有在测量的基础上才能给予正确的判断,通过测量作出的评价才可
16、靠.只有通过评价的解释才能揭示测量的实际意义.v(六)教育评价与教育评估v在内容上有交叉,也有区别:教育评估可能有价值判断,也可能没有价值判断。v教育评价=教育评估;教育评价教育评估v教育评估=教育测量v习惯上,评估是“由一个组织或机构对这所学校或学科是否符合某一事先确定的质量标准作出鉴定的过程。v(七)教育测验与考试 第三节教育测评的发展历史一、教育测量的发展阶段(一)教育测量的萌芽阶段v1864年以前是主观经验性考试阶段。v在很久以前,西方各国学校广泛采用的是口试,对学生逐个进行口试,以评定学生的知识程度。后来学生日渐增多,这种口试方法对大批学生的评定带来困难。v欧洲学校的笔试开始于170
17、2年英国的剑桥大学,1854年美国波斯顿教委开始用笔试考查市所属学校学生。以后,西方各国相继用笔试来测评学生的成绩和能力。v主观经验性考试阶段,由于试题所覆盖的知识面窄,评分易受主观偏见的影响,测评的客观性大受影响。(二)教育测量的蓬勃兴起阶段v1864年,英国格林威治医学院教师费舍收集了许多学生的成绩,汇编成量表集一书,该书列有评定各科成绩的等级,评定学生成绩时,可将学生的成绩与量表上的样本等级相对照,以确定学生成绩的等第。这可以说是客观标准化测量的萌芽。v由于量表集仅是凭费舍个人经验和思想编制而成的,缺乏依据和科学分析,没有引起更多人的关注和研究。v在教育界引起人们对测验问题极大关注的是美
18、国莱斯的拼字测验。v1897年莱斯发表了他对20所学校3000余名学生所作的拼字测验研究接,测验表明:v8年中每天花45分钟进行拼字练习同每天花15分钟进行练习的成绩并没有多大的差别。这一结论引起争议,推动了对教育测量问题的研究。v后来心理测验的发展对教育测量的发展也起到极大的推动作用。v1879年冯特建立了心理学实验室,使用各种严密的测量方法来研究人的心理本质。v1882年,英国高尔顿建立人类学测验实验室,用统计方法来研究人的个别差异。v1905年比纳、西蒙编制了比纳西蒙智力量表。美国推孟修订比纳西蒙智力量表,提出了智力商数公式。他们在心理和教育测量方面作出了重大贡献。v1909年桑代克运用
19、统计学上的“等距原理”发明了编制量表的单位,编写书法量表 拼字量表等一系列标准测量工具,使教育测量走上科学化的道路。v桑因此被称为教育测量学的鼻祖。在桑的影响下,美国一时出现各种标准量表,如算术测验、书法测验、学科测验、个算术测验、书法测验、学科测验、个性测验、智力测验、兴趣测验等,在数性测验、智力测验、兴趣测验等,在数量上有量上有3000多种。多种。(三)教育测量的深入发展阶段v第一,由原来对学生知识的测量发展到重视学生思想品德的测量;v第二,由原来对学生学习成绩的测量发展到对教育教学改革方案等效益方面的测量;v第三,由原来的一般“常模参照性测验”即根据所得分数的常模,来进行考生之间的分数比
20、较,以选拔人才,发展到选用“目标参照性测验”即根据学生答对试题的比例来判断学生达到教育目标的程度,来确定学生是否完成学习任务,能否升级、毕业等。发展到这两者的结合;v第四,由原来的求同式试题测试发展到求异式试题和论文式试题;v第五,教育测量本身的理论研究与技术开发更加深入与完善。v随着教育测验运动的不断发展,人们逐渐认识到,教育测验尽管能使考试客观化、标准化,并能把人的能力换算成数字,甚至个别差异的程度也可以量化,但对学生的社会态度、兴趣、品德、性格等不能全部把握测量的准确性,需要进一步改革。二、教育评价的发展历程二、教育评价的发展历程v教育评价思想源于中国古代教育的考试,孕育于西方对教育测量
21、的批判,形成于“八年研究”的改革实践。(一)教育评价产生的历史渊源与社会背景v1中国古典教育评价萌生期(中国古典教育评价萌生期(606年以前)年以前)v先秦至魏晋南北朝时期,选士测评活动先秦至魏晋南北朝时期,选士测评活动 v西周、春秋:选士制(德行与道艺)西周、春秋:选士制(德行与道艺)v两汉:察举制(最早的试题;对策、射策;太学博士官)两汉:察举制(最早的试题;对策、射策;太学博士官)魏魏晋南北朝:九品中正制(曹操创建,上上、上中、上下晋南北朝:九品中正制(曹操创建,上上、上中、上下)v中国的科举制(隋炀帝大业二中国的科举制(隋炀帝大业二 年,公元年,公元606年)年)v科举制的特征:逐级考
22、核、制度完备、考场严格、科举制的特征:逐级考核、制度完备、考场严格、命命题规范题规范 v科举制的考核方法:口试、贴经、墨义、策间、诗科举制的考核方法:口试、贴经、墨义、策间、诗 赋赋 v2、西方教育测量运动的兴起v古代西方教育盛行以口头提问和实际操作来平定学生的学业。如古希腊哲学家授徒方式就是以评论、谈话为主,提倡辩论,注重思维训练。因此,考查学生能力偏重于口头提问和背诵。进入资本主义发展时期以后,学校和学生激增,口试因而被笔试代替,但笔试也有弊端,为追求测验、考试的客观性,受实验心理学、个别差异研究和智力测验的影响,20世纪初,在美国,教育测量取代传统的考试,并形成了一种趋势和运动;v20年
23、代末,由于新教育思潮的出现,教育测量已不能完全适应教育发展的需要,因而出现了对教育测量的批判。v(二)现代教育评价的发展阶段v1、教育评价的开创时期(八年研究)v(1)社会背景v美国经济大萧条v学校教育不适应社会需求v为了解决这一问题,以泰勒教授为首的评价委员会在新教育理论的指导下进行了为期八年的课程设置和成绩测试的改革实验,发表了“划时代的教育评价宣言”,提出了一系列的教育评价理论、原则和方法。v基本原则:(四个问题)基本原则:(四个问题)v1、应当帮助学生学习什么、应当帮助学生学习什么v2、应当提供什么学习经验、应当提供什么学习经验v3、怎样组织学习经验、怎样组织学习经验v4、怎样评价方案效果、怎样评价方案效果v最早倡导从“测验”转向“评价”的是美国教育评价与课程理论专家泰勒。被认为现代教育评价之父。v“八年研究”,史密斯-泰勒报告的发表,标志现代教育评价正式诞生。v基本思想:评价必须建立在清晰地陈述目标的基础上,根据目标来评价教育效果,促进目标的实现。v显著特点:教育评价方法论的实证化。v2、大发展时期v特点:教育评价理论、技术和方法迅速发展,模式多样化。教育评价方法论的实证化仍占主要地位,人文化倾向萌芽。v3、专业时期v特点:教育评价方法论的人文化倾向得到迅速发展,但实证化并未消失。