1、教育测量与评价教育测量与评价l 主讲教师:周荣秀主讲教师:周荣秀l 联系邮箱:联系邮箱:.绪论绪论学习意义学习意义 教学目标教学目标参考书目参考书目内容组织内容组织考核方式考核方式.一、课程学习的意义一、课程学习的意义l教育测量与评价是所有成功教学的基础,也是诸教育测量与评价是所有成功教学的基础,也是诸多教育决策的重要依据。多教育决策的重要依据。l“评价是所有成功教学的基础。评价是所有成功教学的基础。”格兰朗德格兰朗德l“评价是重要的意图不是为了证明,而是评价是重要的意图不是为了证明,而是为了改进。为了改进。”斯塔费尔比姆斯塔费尔比姆.一、课程学习的意义一、课程学习的意义l教育测量与评价是当今
2、世界教育科学研究的三教育测量与评价是当今世界教育科学研究的三大领域之一。大领域之一。l测量测量与评价与评价l基本基本理论研理论研究究l发展发展研究研究.国际性教育评价组织简介:国际性教育评价组织简介:l国际教育评估协会(International Association for Educational Assessment):1975年在瑞士日内瓦成立,当时有18个国家参加,其宗旨是帮助世界各地的教育机构通过发展和应用评价技术来提高教育质量和促进教育机会均等。lIAEA在20世纪80年代前后完成了两个重要的研究项目:l其一,研究与编写了教师用的评价指南,并译成各种文字,以帮助世界各地区教师提高
3、测验的技能;l其二,为准备出国深造的学生,用多种语言文字编写了熟练能力的国际测验,以便学生以其愿意使用的语言参加能力测验,然后附加所在国的语言测验。.国际性教育评价组织简介:国际性教育评价组织简介:l国际教育成就评价协会(International Association for the Evaluation of Educational Achievement):1962年成立。我国1984年参加了IEA。lIEA组织的宗旨是开展和促进教育的多国研究,尤其是对基础教育的质量进行比较研究,探讨共同的问题。.一、课程学习的意义一、课程学习的意义教育统计教育统计教育测量教育测量心理测量心理测量教育
4、评价教育评价教育科学研究方法教育科学研究方法教育督导教育督导教育评估教育评估教育测量与评价教育测量与评价.一、课程学习的意义一、课程学习的意义l教育测量与评价主要是研究对教育现象进教育测量与评价主要是研究对教育现象进行测量和价值判断的理论、方法和技术。行测量和价值判断的理论、方法和技术。l教育测量与评价教育测量与评价是一门应用性的学科,但是一门应用性的学科,但又是一门综合性的课程。又是一门综合性的课程。.一、课程学习的意义一、课程学习的意义l教育测量与评价在教育改革中具有重要的作用教育测量与评价在教育改革中具有重要的作用l教育改革常常以教育测量与评价的改革为突破口;教育改革常常以教育测量与评价
5、的改革为突破口;l考试与评价改革成为基础教育新课程改革的重要内考试与评价改革成为基础教育新课程改革的重要内容。容。.一、课程学习的意义一、课程学习的意义l教育测量与评价是教师的专业素养和能力教育测量与评价是教师的专业素养和能力l正确评价学生的发展是教师职业能力的重要组成部正确评价学生的发展是教师职业能力的重要组成部分;分;l国外教师教育普遍开设国外教师教育普遍开设“教育测量与评价教育测量与评价”类课程。类课程。.具备具备开展开展教测教测评价能力评价能力树立科学、先进的树立科学、先进的教育测评理念教育测评理念掌握教育测评的掌握教育测评的一般原理和方法一般原理和方法掌握教育测量与评价的基本概念、掌
6、握教育测量与评价的基本概念、了解教育测量与评价的形成和发展历史了解教育测量与评价的形成和发展历史二、教学目标二、教学目标.三、教学内容的组织三、教学内容的组织教学内容教学内容教育测量教育测量教育评价教育评价教育测量概述教育测量概述测量结果的整理和解释测量结果的整理和解释测验的编制与实施测验的编制与实施测量的质量指标测量的质量指标评价的理念与原则评价的理念与原则评价方案的编制与实施评价方案的编制与实施教育评价的方法教育评价的方法教育评价的应用教育评价的应用.四、教材和参考书四、教材和参考书l1.1.教育测量与评价华东师范大学出版社,黄光扬主编,教育测量与评价华东师范大学出版社,黄光扬主编,201
7、22012年。年。l2.2.教育评价学高等教育出版社,涂艳国主编,教育评价学高等教育出版社,涂艳国主编,20072007年。年。l3.3.教育测量与评价广东高等教育出版社,胡中锋主编,教育测量与评价广东高等教育出版社,胡中锋主编,19991999年。年。l3.3.如何进行教育评价华语教学出版社,单志艳著,如何进行教育评价华语教学出版社,单志艳著,20072007。l4.4.教育测量与评价高等教育出版社,王汉澜主编,教育测量与评价高等教育出版社,王汉澜主编,20022002年年8 8月。月。l5.5.教学中的测验与评价中国轻工业出版社,董奇主编,教学中的测验与评价中国轻工业出版社,董奇主编,20
8、032003年年1 1月。月。l6.6.教育测量学人民教育出版社,张敏强著,教育测量学人民教育出版社,张敏强著,19981998年年7 7月。月。l7.7.教育评价学人民教育出版社,陈玉琨著,教育评价学人民教育出版社,陈玉琨著,19991999年年1212月。月。l8.8.回归生活的中小学教育评价浙江大学出版社,贾群生著,回归生活的中小学教育评价浙江大学出版社,贾群生著,20042004年。年。.四、学习与考核方式l课堂讲授为主,辅之以课外集体讨论学习。课堂讲授为主,辅之以课外集体讨论学习。l结合各自的实际情况,学以致用,要求积结合各自的实际情况,学以致用,要求积极参与讨论,保质保量地完成作业
9、。极参与讨论,保质保量地完成作业。l计分办法:平时作业、考察占计分办法:平时作业、考察占3030,期末,期末考试考试7070。.第一章第一章 教育测量与评价的学科发展教育测量与评价的学科发展第一节教育测量与评价的基本问题第一节教育测量与评价的基本问题第二节教育测量与评价的发展历史第二节教育测量与评价的发展历史.第一节教育测量与评价的基本问题第一节教育测量与评价的基本问题n测量测量n教育测量教育测量n教育评价教育评价.一、测量的含义与要素一、测量的含义与要素n(一)测量的含义(一)测量的含义n史蒂文斯:从广义而言,测量系根据史蒂文斯:从广义而言,测量系根据法则给事物分派数字。法则给事物分派数字。
10、n测量这一定义包含了三方面的特性:测量这一定义包含了三方面的特性:n1 1、法则、法则给事物的属性分派数字的依据给事物的属性分派数字的依据n2 2、事物、事物测量的对象或目标测量的对象或目标n3 3、数字、数字描述事物属性的符号描述事物属性的符号.一、测量的含义与要素一、测量的含义与要素n(一)测量的含义(一)测量的含义测量即:测量即:n根据某些根据某些法则与程序法则与程序n用用数字数字n对事物对事物在量上在量上的的规定性规定性n予以予以确定和描述的过程确定和描述的过程.(二)测量的三要素(二)测量的三要素n1 1、单位、单位n具有明确的意义具有明确的意义n要有相等的价值要有相等的价值n2 2
11、、参照点、参照点n绝对零点绝对零点n相对零点相对零点n3 3、量表、量表n具有一定单位和参照点的连续体具有一定单位和参照点的连续体n具有准确性具有准确性n具备操作的简约性具备操作的简约性n教育测量工具:试卷教育测量工具:试卷 测试题测试题 重视命题的研究重视命题的研究.二、教育测量的含义与特点二、教育测量的含义与特点n(一)教育测量的含义:(一)教育测量的含义:教育测量即:教育测量即:n根据测量学的原理和方法根据测量学的原理和方法n针对学校教育影响下针对学校教育影响下学生各个方面学生各个方面的发展的发展n侧重从侧重从量的规定性上量的规定性上n予以确定和描述予以确定和描述的过程的过程n思考:思考
12、:n心理属性是否也可以客观地进行测量呢?心理属性是否也可以客观地进行测量呢?.二、教育测量的含义与特点二、教育测量的含义与特点n(一)教育测量的含义:(一)教育测量的含义:教育测量即:教育测量即:n根据测量学的原理和方法根据测量学的原理和方法n针对学校教育影响下针对学校教育影响下学生各个方面学生各个方面的发展的发展n侧重从侧重从量的规定性上量的规定性上n予以确定和描述予以确定和描述的过程的过程n思考:思考:n心理属性是否也可以客观地进行测量呢?心理属性是否也可以客观地进行测量呢?.两个理论基础:两个理论基础:n桑代克:无论什么东西,只要存在,总存在于数量之中。n精神与社会测量导论n麦克尔:任何
13、东西,存在于数量中的,都可以被测量。n麦柯尔(麦柯尔(W.A.mecallW.A.mecall),美国近代教育测量专家,近代西方教),美国近代教育测量专家,近代西方教育实验理论和方法在中国传播历程中的关键性人物。育实验理论和方法在中国传播历程中的关键性人物。n这两句话,看成是构成一切测验和量化评价的公理。.(二)教育测量的特点(二)教育测量的特点p1 1、测量结果的间接性和推断性、测量结果的间接性和推断性p2 2、测量对象的模糊性和测量误差、测量对象的模糊性和测量误差的不可避免性的不可避免性p3 3、量表具有多样性,结果具有相、量表具有多样性,结果具有相对抽象性对抽象性.量表的类型量表的类型n
14、1.1.类别量表(类别量表(norminal scalenorminal scale)称名量表称名量表 n2.2.顺序量表(顺序量表(ordinal scaleordinal scale)位次量表位次量表 n根据事物的特性和设定的法则在分类的基础上确定同类根据事物的特性和设定的法则在分类的基础上确定同类客体中各元素之间的相对顺序,只关心研究对象的顺序,客体中各元素之间的相对顺序,只关心研究对象的顺序,不问津间距是否一致。不问津间距是否一致。n3.3.等距量表等距量表(interval scale)(interval scale)间距量表间距量表 n在赋值时有相等的度量单位,采用相对零点,被测所
15、对在赋值时有相等的度量单位,采用相对零点,被测所对应的测量值由明确的距离关系应的测量值由明确的距离关系n4.4.比率量表比率量表(ratio scale)(ratio scale)n采用绝对零点,针对总体而不是样本,不但能确定一个采用绝对零点,针对总体而不是样本,不但能确定一个被测比另一个被测大(小)多少,而且还能得出其间的被测比另一个被测大(小)多少,而且还能得出其间的倍数关系倍数关系.有关量表水平的说明有关量表水平的说明n说明:说明:n事物的复杂性决定测量量表的不同层次和水平事物的复杂性决定测量量表的不同层次和水平n四种量表的测量水平由前往后逐渐提高,信息量不断增大,前一种量四种量表的测量
16、水平由前往后逐渐提高,信息量不断增大,前一种量表的特点和功能蕴涵于后一种量表之中。(定性、定量)表的特点和功能蕴涵于后一种量表之中。(定性、定量)n不可过分苛求测量的高层次不可过分苛求测量的高层次n不能把低层次量表的数据按高层次量表的意义理解或作统计处理不能把低层次量表的数据按高层次量表的意义理解或作统计处理n教育测量是在顺序量表上进行的,但需要用等距量表报告分数教育测量是在顺序量表上进行的,但需要用等距量表报告分数n加强命题的研究加强命题的研究n把原始分数转换到一个有相等单位的量表上,通常转化为标准分把原始分数转换到一个有相等单位的量表上,通常转化为标准分n教育测量中使用的量表:教育测量中使
17、用的量表:n百分量表百分量表n百分等级量表百分等级量表n标准分数(标准分数(Z Z)量表)量表nT T量表量表.问题思考:问题思考:n1 1、在百分制的评分方法中,、在百分制的评分方法中,6060分比分比5555分多分多5 5分,分,9090分比分比8585分多分多5 5分,这两个分,这两个相差的相差的5 5分,是否是由相等的标准来确分,是否是由相等的标准来确定的?定的?n2 2、一个在测量中得、一个在测量中得8080分的学生的知识分的学生的知识量是否等于在同一测验中得量是否等于在同一测验中得4040分学生分学生知识量的两倍?知识量的两倍?.结论:结论:n教育测量的度量单位是相对的,使得教育测
18、量具有教育测量的度量单位是相对的,使得教育测量具有不等距性和不稳定性。不等距性和不稳定性。n一个学生的学业成绩好坏、智力高低和能力大小等,一个学生的学业成绩好坏、智力高低和能力大小等,都是就其在所在团体的整个分数序列、行为序列中都是就其在所在团体的整个分数序列、行为序列中的地位来说的,其测量的分数单位,并非绝对的。的地位来说的,其测量的分数单位,并非绝对的。n为了使教育测量的分数具有可靠性、可比性,必须为了使教育测量的分数具有可靠性、可比性,必须根据标准测量的原理和方法,编制测验量表,制定根据标准测量的原理和方法,编制测验量表,制定科学的评分标准和方法,并将测量所得的原始分数科学的评分标准和方
19、法,并将测量所得的原始分数转换为可以直接比较的量表分数(百分等级分数、转换为可以直接比较的量表分数(百分等级分数、标准分数、标准分数、T T分数等)。分数等)。.三、教育评价的概念与特点三、教育评价的概念与特点n评价泛指评价泛指n衡量、判断衡量、判断n人物或事物的人物或事物的n价值价值教育评价:教育评价:由美国泰勒于由美国泰勒于19301930年首次提出,在美国国会年首次提出,在美国国会19651965年通过的初等及中等教育法案中得年通过的初等及中等教育法案中得以合法化。以合法化。.拉尔夫拉尔夫泰勒(泰勒(Ralph TylerRalph Tyler)“当代当代课程评价之父课程评价之父”、“现
20、代课程理论之父现代课程理论之父”n“评价过程在本质上是确定课程和教评价过程在本质上是确定课程和教学大纲在实际上实现教育目标的程度学大纲在实际上实现教育目标的程度的过程。的过程。”课程与教学的基本原理课程与教学的基本原理n(Basic Principles of Curriculum and Basic Principles of Curriculum and InstructionInstruction)被誉为)被誉为“现代课程理论的圣现代课程理论的圣经经”。.日本的桥本重治:日本的桥本重治:n“评价是与教育的目标和价值有明确关系评价是与教育的目标和价值有明确关系的概念,是按照教育目标和价值观
21、对学生的概念,是按照教育目标和价值观对学生的学习成果及教育计划的效果等进行测量的学习成果及教育计划的效果等进行测量的过程。因此,的过程。因此,评价评价概念的重点在于概念的重点在于以教育目标为标准的价值判断以教育目标为标准的价值判断。”.日本的桥本重治:日本的桥本重治:n他规纳出评价五大特点:他规纳出评价五大特点:n评价离开了教育目标就不能成立;评价离开了教育目标就不能成立;n评价是囊括性的;评价是囊括性的;n评价是连续的;评价是连续的;n评价不仅是教师进行的,学生自身也要展开评价不仅是教师进行的,学生自身也要展开自我评价和相互评价;自我评价和相互评价;n评价法必须提高到科学的高度。评价法必须提
22、高到科学的高度。.格兰朗德:格兰朗德:l评价是为了确定学生达到教学目标的程度,评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的(课堂)系统过收集、分析和解释信息的(课堂)系统过程。程。l一个完整的评价计划可用公式表达为:一个完整的评价计划可用公式表达为:评价测量(定量描述)非测量(定性评价测量(定量描述)非测量(定性描述)价值判断描述)价值判断.斯塔费尔比姆:斯塔费尔比姆:n“评价最重要的意图不是为了评价最重要的意图不是为了证明证明,而是为了,而是为了改进改进。”n“评价是一种划定、获取和提供叙述性和判断评价是一种划定、获取和提供叙述性和判断性信息的过程。这些信息涉及研究对象的目标
23、、性信息的过程。这些信息涉及研究对象的目标、设计、实施和影响的价值及优缺点,以便指导设计、实施和影响的价值及优缺点,以便指导如何决策、满足教学效能核定的需要,并增加如何决策、满足教学效能核定的需要,并增加对研究对象的了解。对研究对象的了解。”.美国教育评价标准委员会:美国教育评价标准委员会:“教育评价是对教育目标和它的优缺教育评价是对教育目标和它的优缺点与价值判断的系统调查,为教育决点与价值判断的系统调查,为教育决策提供依据的过程策提供依据的过程”。(。(19811981年提出)年提出).布鲁姆(布鲁姆(B.S.BloomB.S.Bloom):“据我看来,评价乃是系统收集证据据我看来,评价乃是
24、系统收集证据用以确定学习者实际上是否发生了某用以确定学习者实际上是否发生了某些变化些变化,确定学生个体变化的数量或确定学生个体变化的数量或程度。程度。”“评价是为了某个目的而进行的,对评价是为了某个目的而进行的,对各种想法、作品、解答、方法、资料各种想法、作品、解答、方法、资料等的价值作出判断的活动。等的价值作出判断的活动。.华东师范大学陈玉琨教授:华东师范大学陈玉琨教授:n教育评价是对教育活动满足社会与个体教育评价是对教育活动满足社会与个体需要的程度作出判断的活动,是对教育需要的程度作出判断的活动,是对教育活动现实的(已经取得的)或活动现实的(已经取得的)或潜在的潜在的(还未取得,但有可能取
25、得的)(还未取得,但有可能取得的)价值作价值作出判断出判断,以期达到教育,以期达到教育价值增值价值增值的过程。的过程。.教育评价的概念教育评价的概念p“教育评价教育评价”包含如下几个共同的要点:包含如下几个共同的要点:p第一,强调以教育目标为标准的价值判断过程;第一,强调以教育目标为标准的价值判断过程;p第二,强调用多种方法(测量和非测量)系统收集资第二,强调用多种方法(测量和非测量)系统收集资料与信息;料与信息;p第三,教育评价的对象应该是第三,教育评价的对象应该是“教育者的发展变化及教育者的发展变化及构成其变化的各种因素。构成其变化的各种因素。”这就既包括了学生评价,这就既包括了学生评价,
26、也包括了教师评价等与学生成长发展相关的所有因素。也包括了教师评价等与学生成长发展相关的所有因素。p第四,强调为学生发展和教育决策服务,评价的最终第四,强调为学生发展和教育决策服务,评价的最终目的是为了改进与发展。目的是为了改进与发展。p第五,不同时期,不同学者所提出的教育评价概念的第五,不同时期,不同学者所提出的教育评价概念的侧重点有所不同。侧重点有所不同。.教育评价教育评价注重效果:美国的泰勒(侧重课程评价)注重效果:美国的泰勒(侧重课程评价)格兰朗德和布卢姆基于教学评价和学生评价格兰朗德和布卢姆基于教学评价和学生评价注重注重资料的获得:(美)克龙巴赫、资料的获得:(美)克龙巴赫、斯塔弗尔比
27、姆斯塔弗尔比姆注重评价方法、手段:(中国)张秀理、注重评价方法、手段:(中国)张秀理、(日本)长谷川容(日本)长谷川容.教育评价的概念教育评价的概念n教育评价即:教育评价即:n根据一定的根据一定的标准(教育目标的达成与否)标准(教育目标的达成与否)n运用运用可行的方法(测量、非测量、系统收集资料信可行的方法(测量、非测量、系统收集资料信息的方法)息的方法)n对教育的对教育的要素要素、过程过程和和效果(教育计划、课程、学效果(教育计划、课程、学习结果、教育现象、教学活动、教育目标或程序)习结果、教育现象、教学活动、教育目标或程序)n进行进行价值评判的活动(为学生发展、教育决策等)价值评判的活动(
28、为学生发展、教育决策等).四、教育评价相关概念辨析四、教育评价相关概念辨析n教育测量与教育评价教育测量与教育评价n教育统计与教育评价教育统计与教育评价n教育评估与教育评价教育评估与教育评价.教育测量与教育评价教育测量与教育评价n二者的联系:二者的联系:n教育测量:根据一定的理论、规则,运用一定教育测量:根据一定的理论、规则,运用一定的测量工具对教育现象进行数量化描述的过程;的测量工具对教育现象进行数量化描述的过程;n教育测量为教育评价提供客观的数据信息,是教育测量为教育评价提供客观的数据信息,是教育评价的基础,教育评价要在教育测量所获教育评价的基础,教育评价要在教育测量所获得的客观信息的基础上
29、进行得的客观信息的基础上进行 。.教育测量与教育评价教育测量与教育评价n二者区别:二者区别:n测量测量:对事物数量特征的获得,强调数量化的:对事物数量特征的获得,强调数量化的方法与结果;方法与结果;评价评价:对教育现象客体的价值进:对教育现象客体的价值进行判断,强调定性与定量相结合的方法行判断,强调定性与定量相结合的方法n测量测量:客观性;:客观性;评价评价:客观性与主观性的两种:客观性与主观性的两种属性属性n测量测量:任务是对事物的量的认识;:任务是对事物的量的认识;评价评价:认识:认识活动,人的意识对实践活动及其结果的综合反活动,人的意识对实践活动及其结果的综合反映映.教育测量与教育统计教
30、育测量与教育统计n教育测量与统计是教育评价获取教育事实材料的一教育测量与统计是教育评价获取教育事实材料的一种定量手段。种定量手段。n教育统计教育统计运用数理统计的原理与方法,对教育运用数理统计的原理与方法,对教育测量获得的数据信息进行整理、描述、推断的过程。测量获得的数据信息进行整理、描述、推断的过程。n描述统计:计算一个学生各门功课的总成绩;计算一个描述统计:计算一个学生各门功课的总成绩;计算一个班级一门或多门课程成绩的平均分、标准差(常模);班级一门或多门课程成绩的平均分、标准差(常模);n推断统计:把学生个体成绩与全班平均分相比,对进步推断统计:把学生个体成绩与全班平均分相比,对进步情况
31、进行推断;把两个班级平均分相比较,对教材、教情况进行推断;把两个班级平均分相比较,对教材、教学方法效果进行推断。学方法效果进行推断。n因此:因此:n测量结果需要进行整理和描述。测量结果需要进行整理和描述。n统计在测量结果的基础上进行,测量结果是统计的前提;统计在测量结果的基础上进行,测量结果是统计的前提;n统计包括描述统计与推断统计。统计包括描述统计与推断统计。.n19041904年以前,教育测量的萌芽期年以前,教育测量的萌芽期n1904191519041915年,教育测量的开拓年,教育测量的开拓n1915-19301915-1930年,教育测量的兴盛期年,教育测量的兴盛期n1930-1940
32、1930-1940年,教育测量的批判期年,教育测量的批判期n1929-19331929-1933年,教育评价的产生年,教育评价的产生n1940-19571940-1957年,教育评价的平稳期年,教育评价的平稳期n1957197219571972年,批判泰勒模式时期年,批判泰勒模式时期n1972-1972-现在,专业化时期现在,专业化时期第二节第二节 教育测量与评价的发展历史教育测量与评价的发展历史.19041904年以前(教育测量的萌芽期)年以前(教育测量的萌芽期)n中国是考试制度的发源地中国是考试制度的发源地n606年以前,年以前,中国中国古典教育评价萌生期古典教育评价萌生期n先秦至魏晋南北
33、朝时期,选士测评活动先秦至魏晋南北朝时期,选士测评活动n西周、春秋:选士制(德行与道艺)西周、春秋:选士制(德行与道艺)n两汉:察举制(最早的试题;对策、射策;两汉:察举制(最早的试题;对策、射策;太学博士官)太学博士官)n魏晋南北朝:九品中正制(曹操创建,上上、魏晋南北朝:九品中正制(曹操创建,上上、上中、上下上中、上下).1904年以前(教育测量的萌芽期)n中国是考试制度的发源地中国是考试制度的发源地n606年年1905年,科举时期年,科举时期n隋唐以来至清末,科举考试为主要手段隋唐以来至清末,科举考试为主要手段n以封建礼教为基本标准,对个人学识德能进以封建礼教为基本标准,对个人学识德能进
34、行测评判断行测评判断n科举制的特征:逐级考核、制度完备、考场科举制的特征:逐级考核、制度完备、考场严格、命题规范严格、命题规范n科举制的考核方法:口试、贴经、墨义、策科举制的考核方法:口试、贴经、墨义、策间、诗赋间、诗赋.中国科举制度的世界地位中国科举制度的世界地位n(法)伏尔泰:(法)伏尔泰:“人类精神,肯定想象不人类精神,肯定想象不出比这样的政府更好的政府。在这个政出比这样的政府更好的政府。在这个政府里,重要的衙门彼此统属,任何事情府里,重要的衙门彼此统属,任何事情都在那里决定,而其成员,都是先经过都在那里决定,而其成员,都是先经过几场严格的考试的。几场严格的考试的。”.中国科举制度的世界
35、地位中国科举制度的世界地位n孙中山:孙中山:“现在各国的考试制度,差不多现在各国的考试制度,差不多都是学英国的。穷流溯源,英国的考试都是学英国的。穷流溯源,英国的考试制度,原来还是从我们中国学过去的。制度,原来还是从我们中国学过去的。”n英国在英国在1570-1870年期间,用英文出版有年期间,用英文出版有关中国文官制度和政治制度的书籍关中国文官制度和政治制度的书籍70多种,多种,大量介绍与研究中国的科举制度,极力主张大量介绍与研究中国的科举制度,极力主张英国政府实行中国式的文官考试制度。(英英国政府实行中国式的文官考试制度。(英国在国在1855年建立了文官考试制度。)年建立了文官考试制度。)
36、.n18451845年美国贺拉斯曼将年美国贺拉斯曼将“笔试笔试”引入美引入美国国n18641864年英国费舍的作业量表集年英国费舍的作业量表集n18971897年美国赖斯的拼字实验年美国赖斯的拼字实验.n1904年,桑代克精神与社会测量导论的问世,标志着以科学理论为指导的教育测量理论的诞生。n桑代克:无论什么东西,只要存在,总存在于数量之中n麦克尔:任何东西,存在于数量中的,都可以被测量n这两句话,看成是构成一切测验和量化评价的公理。n1909年,桑代克根据“等距原理”发明了编制量表的单位,编制了标准化的测验量表。1904191519041915年教育测量的开拓期年教育测量的开拓期.n在桑代克
37、的影响下,教育测量的运动轰轰烈在桑代克的影响下,教育测量的运动轰轰烈烈的开展:烈的开展:n测验品种有算术测验、书法测验、学科测验、测验品种有算术测验、书法测验、学科测验、智力测验、个性测验、兴趣测验等,在数量上智力测验、个性测验、兴趣测验等,在数量上已有已有30003000多种多种n2020世纪初,心理测验就已走上标准化与客观化世纪初,心理测验就已走上标准化与客观化的路程。的路程。n法国比纳等人法国比纳等人19051905年创编并发表了世界上第一个标准年创编并发表了世界上第一个标准化智力测验;化智力测验;n英国斯皮尔曼英国斯皮尔曼“能力结构二因素学说能力结构二因素学说”与英国著名的与英国著名的
38、1111岁儿童考试制度岁儿童考试制度n美国伍德沃斯的第一个标准化人格测验美国伍德沃斯的第一个标准化人格测验1915-19301915-1930年教育测量的兴盛期年教育测量的兴盛期.1930-19401930-1940年教育测量的批判期年教育测量的批判期.对教育测量批判的原因n教育测量虽然能使教育成就定量化、客观化、标准化;但毕竟不能测量出人的学力和人格的全部内容。n第一次大战以后,人们的教育观点发生了很大的变化,不在将教育看成是单纯的传授知识,而是将人的全面发展作为教育目标。而人的全面的重要因素如:社会道德、人的情绪态度、动机 兴趣、鉴赏力等是不能光靠测量的。.对教育测量批判的原因n教育测量存
39、在的弊端:教育测量存在的弊端:n为测量而测量,盲目追求量化,忽视教育服务对为测量而测量,盲目追求量化,忽视教育服务对象的整体目标与价值。象的整体目标与价值。n教育测量的理论基础只有心理学、统计学和测量教育测量的理论基础只有心理学、统计学和测量学,而没有教育学原理。学,而没有教育学原理。.教育评价产生的社会背景n19291933年席卷美国、波及全球的年席卷美国、波及全球的经济大萧条经济大萧条n社会与教育危机四起社会与教育危机四起n生产过剩、工厂倒闭、工人下岗生产过剩、工厂倒闭、工人下岗n学校因经济不景气,部分学校关闭,有学校因经济不景气,部分学校关闭,有些学校的班级减少。些学校的班级减少。n整个
40、社会和教育皆处于反省之中整个社会和教育皆处于反省之中.教育评价产生的社会背景n1930年美国有年美国有25%的失业,青年近乎的失业,青年近乎100%找不到工作,找不到工作,1910年年1417岁岁的青年的青年17%上大学,而到上大学,而到1930年上升年上升到到51%。n有相当一部分人上高中并不想上大学,有相当一部分人上高中并不想上大学,而当时的美国高中设课就是为了上大学而当时的美国高中设课就是为了上大学服务的,为此中学设课与失业青年的需服务的,为此中学设课与失业青年的需求就产生了尖锐的矛盾。求就产生了尖锐的矛盾。.美国的美国的“八年研究八年研究”是教育评价的催生剂是教育评价的催生剂n美国进步
41、主义联盟负责人美国进步主义联盟负责人艾钦艾钦于于1933194019331940年年领导了中学课程改革实验研究,其中课程评价领导了中学课程改革实验研究,其中课程评价委员会由俄亥俄州的州立大学教授委员会由俄亥俄州的州立大学教授泰勒泰勒主持,主持,这就是美国教育历史上著名的这就是美国教育历史上著名的“八年研究八年研究”,也是教育评价问世的开始。也是教育评价问世的开始。.八年研究的内容n泰勒教授选了泰勒教授选了30所参加实验的高中学生,所参加实验的高中学生,对这些学生进行了对这些学生进行了4年中学、年中学、4年大学学年大学学习的追踪研究,历时习的追踪研究,历时“八年八年”,这也是,这也是“八八年年”
42、研究的由来。研究的由来。.八年研究的内容n当时选进步学校和和传统学校学生各当时选进步学校和和传统学校学生各1475人,按性别、年龄、种族、学业能人,按性别、年龄、种族、学业能力倾向、家庭、社会环境、职业兴趣和力倾向、家庭、社会环境、职业兴趣和嗜好等基本原则进行一一配对,进行比嗜好等基本原则进行一一配对,进行比较。较。.八年研究的基本原则n评价是八年研究的有机组成部分,泰勒认为课评价是八年研究的有机组成部分,泰勒认为课程计划和编制必须回答以下四个基本问题:程计划和编制必须回答以下四个基本问题:n1、学校应帮助学生达到什么目标?、学校应帮助学生达到什么目标?n2、提供哪些教育经验才能实现这些目标?
43、、提供哪些教育经验才能实现这些目标?n3、怎样才能有效组织这些教育经验?、怎样才能有效组织这些教育经验?n4、怎样才能确定这些目标正在得到实现?、怎样才能确定这些目标正在得到实现?.八年研究的内容n结果发现:结果发现:n来自实验的学生在大学四年中,每年获学术性荣誉略多;来自实验的学生在大学四年中,每年获学术性荣誉略多;n具有更强的理智、好奇心和学习动机;具有更强的理智、好奇心和学习动机;n思维更精密、更系统、更客观;思维更精密、更系统、更客观;n对教育的意义有更清晰的看法;对教育的意义有更清晰的看法;n对新情况有更强的应变能力;对新情况有更强的应变能力;n具有更有效的解决问题的办法;具有更有效
44、的解决问题的办法;n更多的参加有组织的学习团体;更多的参加有组织的学习团体;n获得非学术的荣誉更多些;获得非学术的荣誉更多些;n对职业的选择有更好的定向;对职业的选择有更好的定向;n更积极的关注全国和全世界的事物。更积极的关注全国和全世界的事物。.新旧课程优劣的评价比较新旧课程优劣的评价比较学校学校类别类别教育目标教育目标市民市民信仰信仰独立独立活动活动协作协作精神精神记忆记忆活动活动平平均均分标 准标 准差差平平均均分分标标准准差差平平均均分分标标准准差差平 均平 均分分标 准标 准差差进步学校进步学校传统学校传统学校1230510868148815548673205053696533114
45、60375430492404444.教育评价的问世n八年研究后泰勒等人的研究结论是:n旧课程及其教育测验是教科书主义,测验内容只是要求学生记诵教材中的知识,是片面的,不能反映学生的全面发展。n泰勒提出:以全面发展的教育目标为核心和依据的两条相互依存的原理,即课程编制原理和评价活动原理,也就是“泰勒原理”.教育评价的创始人泰勒n在八年工作报告即在八年工作报告即史密斯史密斯泰勒报泰勒报告告中,中,第一次提出第一次提出“教育评价教育评价”,这个,这个报告被称为报告被称为“划时代的教育评价宣言划时代的教育评价宣言”,宣布了教育评价的诞生。宣布了教育评价的诞生。n给出了教育评价的原理、方法和手段,给出了
46、教育评价的原理、方法和手段,奠定了泰勒奠定了泰勒-“当代教育评价之父当代教育评价之父”的地的地位,同时也迎来了美国教育史上位,同时也迎来了美国教育史上“泰勒时泰勒时期期“到来。到来。.教育评价的发展n1940195719401957年教育评价的平稳期年教育评价的平稳期n特点:特点:n教育评价的理论在不断的进行深入研究教育评价的理论在不断的进行深入研究n布鲁姆完成教育目标分类学布鲁姆完成教育目标分类学n教育评价活动没有普及教育评价活动没有普及.评价的发展 n这与当时美国的历史背景有关,二战后,这与当时美国的历史背景有关,二战后,美国处于美国处于“筹划与享受生活的时代筹划与享受生活的时代”。n社会
47、对教育的发展很少提出新的要求。社会对教育的发展很少提出新的要求。.评价的发展n19571972批判泰勒模式时期n特点:特点:n1957年前苏联的人造卫星上天年前苏联的人造卫星上天n引发美国对教育的不满引发美国对教育的不满n开始批判泰勒教育模式开始批判泰勒教育模式.评价的发展n1972-现在 专业化时期n特点:特点:n高等学校出现了许多教育评价的硕士、博士、博高等学校出现了许多教育评价的硕士、博士、博士后专业点士后专业点n各类教育评价研究中心纷纷建立各类教育评价研究中心纷纷建立n美国有西密执安大学评价中心、洛杉矶加里福尼亚大美国有西密执安大学评价中心、洛杉矶加里福尼亚大学研究中心等学研究中心等n
48、教育评价专著、杂志大量出版教育评价专著、杂志大量出版n如:评价研究评价评论评价信息等如:评价研究评价评论评价信息等.六六 教育测量与评价理论的发展教育测量与评价理论的发展n1、测验的统计模型为教育测量学科发展提供了强有力的理论支持n20C50年代前后形成的经典测验理论(Classical Test Theory,简称CTT);n20C60年代创立的概化理论(GT)、项目反应理论(Item Response Theory,IRT)以及认知诊断理论;.六六 教育测量与评价理论的发展教育测量与评价理论的发展n2 2、教育目标分类学促进教育测量与教育、教育目标分类学促进教育测量与教育评价的学科整合。评
49、价的学科整合。n20C20C中叶以后,在泰勒行为目标评价理论的中叶以后,在泰勒行为目标评价理论的影响下,美国的布卢姆、克拉斯沃尔、哈罗影响下,美国的布卢姆、克拉斯沃尔、哈罗和辛普森等人相继完成了认知领域、情感领和辛普森等人相继完成了认知领域、情感领域和动作技能领域的教育目标分类。域和动作技能领域的教育目标分类。.六六 教育测量与评价理论的发展教育测量与评价理论的发展n3 3、教育评价学科内容的发展、教育评价学科内容的发展n泰勒行为目标模式泰勒行为目标模式n斯塔费尔比姆的斯塔费尔比姆的CIPPCIPP模式(模式(Context,Input,Process&Context,Input,Proces
50、s&ProductProduct)n斯克里文的目的游离模式斯克里文的目的游离模式(Goal free evaluation)(Goal free evaluation)n欧文斯的反对者模式欧文斯的反对者模式(Adeversary model)(Adeversary model)n斯塔克的应答模式斯塔克的应答模式(Responsive model)(Responsive model)n斯克里文提出的消费者导向模式斯克里文提出的消费者导向模式(Consumer-oriented(Consumer-oriented evaluation)evaluation)n自然探究模式(自然探究模式(Natur