1、2022-8-12教育质量评价教育质量评价教育质量评价2022-8-12教育质量评价第第5讲讲 教学内容教学内容5.1 教育评价概述教育评价概述5.2 教育评价的产生与发展教育评价的产生与发展5.3 教育评价的类型教育评价的类型5.4 教育评价的原则教育评价的原则5.5 教育评价的功能教育评价的功能5.6 教育评价研究的主要问题教育评价研究的主要问题5.7 教育评价方案的设计教育评价方案的设计2022-8-12教育质量评价5.1 教育评价概述教育评价概述 5.1.1 教育评价定义教育评价定义 泰勒(泰勒(Tyler,R.W.)在他们著名的)在他们著名的“八年八年研究研究”(1933-1940)
2、报告)报告史密斯史密斯泰勒报泰勒报告告中,首次提出中,首次提出“教育评价教育评价”的概念。认为,的概念。认为,“教育评价过程在本质上是确定课程和教学大教育评价过程在本质上是确定课程和教学大纲在实现教育目标的程度的过程。纲在实现教育目标的程度的过程。”这种观点认为教育评价就是以教育目标为依据,这种观点认为教育评价就是以教育目标为依据,评判学生学习结果达到教育目标的程度。评判学生学习结果达到教育目标的程度。2022-8-12教育质量评价 1963年,克龙巴赫(年,克龙巴赫(Cronbach,L.J.)在)在他的题为他的题为通过评价改进课程通过评价改进课程的论文中,对的论文中,对教育评价内涵的阐述是
3、:教育评价内涵的阐述是:“一个搜集和报告对一个搜集和报告对课程研制有指导意义的信息过程课程研制有指导意义的信息过程”。2022-8-12教育质量评价 1966年,斯塔弗尔比姆年,斯塔弗尔比姆(Stufflebeam,D.L.)在对泰勒评价理论提出异议的前提下,主在对泰勒评价理论提出异议的前提下,主张:张:“教育评价不应局限于评判决策者所确定的教教育评价不应局限于评判决策者所确定的教育目标所达到预期效果的程度,而应该是收集育目标所达到预期效果的程度,而应该是收集有关教育方案实施全过程及其成果的资料,为有关教育方案实施全过程及其成果的资料,为决策提供信息的过程决策提供信息的过程”。2022-8-1
4、2教育质量评价 1975年,比贝(年,比贝(Beeby,C.E.)把评价定)把评价定义为:义为:“系统地收集信息和解释证据的过程,在此基系统地收集信息和解释证据的过程,在此基础上作出价值判断,目的在于行动。础上作出价值判断,目的在于行动。”2022-8-12教育质量评价 美国学者格朗兰德:美国学者格朗兰德:教育评价教育评价=测量测量(量的记述)(量的记述)或或 非测量非测量(质的记述)(质的记述)+价值判断价值判断 (事实判断)(事实判断)(价值判断)(价值判断)T教育评价的基础是事实判断教育评价的基础是事实判断T教育评价的核心是价值判断教育评价的核心是价值判断1.评价手段可以是定性的,也可以
5、是定量的评价手段可以是定性的,也可以是定量的2022-8-12教育质量评价 1981年美国教育评价标准联合委员会对教年美国教育评价标准联合委员会对教育评价进行了综合性的界定,他们认为:育评价进行了综合性的界定,他们认为:T“教育评价是对教育目标和它的优缺点与价教育评价是对教育目标和它的优缺点与价值判断的系统调查,为教育决策提供依据的值判断的系统调查,为教育决策提供依据的过程。过程。”也可将教育评价定义为:也可将教育评价定义为:T教育评价是根据一定的目的和标准,采用科教育评价是根据一定的目的和标准,采用科学的态度和方法,对教育工作中的活动、人学的态度和方法,对教育工作中的活动、人员、管理和条件的
6、状态与绩效,进行质和量员、管理和条件的状态与绩效,进行质和量的价值判断。的价值判断。2022-8-12教育质量评价教育评价是根据一定的教育目标,运用可行的教育评价是根据一定的教育目标,运用可行的科学手段,通过系统地收集信息资料和分析整科学手段,通过系统地收集信息资料和分析整理,对教育活动、教育过程和教育结果进行价理,对教育活动、教育过程和教育结果进行价值判断,从而为教育决策提供依据的过程。值判断,从而为教育决策提供依据的过程。2022-8-12教育质量评价5.1.2 教育评价再认知教育评价再认知(1)教育评价的界定)教育评价的界定T 教育评价就是教育测验;教育评价就是教育测验;T 教育评价是一
7、种专业判断;教育评价是一种专业判断;T 教育评价是把实际表现与理想目标相比较教育评价是把实际表现与理想目标相比较的活动;的活动;T 教育评价是系统收集资料,为决策提供依教育评价是系统收集资料,为决策提供依据的活动。据的活动。2022-8-12教育质量评价(2)教育评价的特征)教育评价的特征T 教育评价教育评价=事实判断事实判断+价值判断价值判断T 教育评价是对教育过程及其结果的评价教育评价是对教育过程及其结果的评价T 教育评价必须以教育目标为基准教育评价必须以教育目标为基准T 教育评价是评价者与被评价者的双边合作教育评价是评价者与被评价者的双边合作活动活动2022-8-12教育质量评价(3)在
8、区别上理解教育评价)在区别上理解教育评价 教育评价与教育测量教育评价与教育测量联系:联系:教育测量是教育评价的基础,教育测量是对教教育测量是教育评价的基础,教育测量是对教育进行量的测定,所或得的结果是教育评价所育进行量的测定,所或得的结果是教育评价所需信息的主要的、可靠的来源,是对教育的状需信息的主要的、可靠的来源,是对教育的状态和价值进行客观判断的前提;态和价值进行客观判断的前提;教育测量的结果只有通过教育评价这个环节才教育测量的结果只有通过教育评价这个环节才能获得实际意义,否则便成了一堆抽象而枯燥能获得实际意义,否则便成了一堆抽象而枯燥的数字。的数字。2022-8-12教育质量评价区别:区
9、别:两者着眼点不同:教育测量是为了取得数据;两者着眼点不同:教育测量是为了取得数据;教育评价是要分析解释,对教育价值作出判断。教育评价是要分析解释,对教育价值作出判断。两者特点不同:教育测量是一种纯客观的过程,两者特点不同:教育测量是一种纯客观的过程,具有客观性特点;教育评价具有客观性与主体具有客观性特点;教育评价具有客观性与主体性相结合特点。性相结合特点。两者复杂程度不同:教育测量是对教育数量化两者复杂程度不同:教育测量是对教育数量化的描述,关心量的获得,活动较为单一;教育的描述,关心量的获得,活动较为单一;教育评价着眼于事物质的判定,含定性与定量分析,评价着眼于事物质的判定,含定性与定量分
10、析,活动是多重的。活动是多重的。2022-8-12教育质量评价 教育评价与教学评价教育评价与教学评价联系:教学评价是以教学为对象的教育评价,只是教教学评价是以教学为对象的教育评价,只是教育评价的一个方面,用逻辑学术语讲,教育评育评价的一个方面,用逻辑学术语讲,教育评价是一个上位概念,而教学评价仅是一个下位价是一个上位概念,而教学评价仅是一个下位概念。概念。区别:教育评价的范围比教学评价要广得多,它不仅教育评价的范围比教学评价要广得多,它不仅关注教学评价,还有学校管理评价、教师评价、关注教学评价,还有学校管理评价、教师评价、学生评价、课程评价、总务评价等等。学生评价、课程评价、总务评价等等。20
11、22-8-12教育质量评价 教育评价与教育督导教育评价与教育督导联系:联系:两者皆以党和国家的教育方针、政策、法规为两者皆以党和国家的教育方针、政策、法规为依据;依据;目的都是为了加强对教育工作的科学管理,全目的都是为了加强对教育工作的科学管理,全面提高教育质量;面提高教育质量;督导工作过程主要有监督、检查、评价、指导、督导工作过程主要有监督、检查、评价、指导、反馈若干环节,评价是诸环节的核心,无论是反馈若干环节,评价是诸环节的核心,无论是监督和检查,还是指导和反馈,都离不开评价监督和检查,还是指导和反馈,都离不开评价这个手段。这个手段。2022-8-12教育质量评价区别:区别:评价只是督导工
12、作内容的一部分,只构成督导评价只是督导工作内容的一部分,只构成督导工作的前提和基础,而不是其全部;工作的前提和基础,而不是其全部;督导工作中所使用的评价即督导评价是一种自督导工作中所使用的评价即督导评价是一种自上而下的他人评价,只是教育评价的一种形式,上而下的他人评价,只是教育评价的一种形式,而不是教育评价的全部。而不是教育评价的全部。2022-8-12教育质量评价5.1.3 教育评价的类别教育评价的类别(1)从评价主体上分)从评价主体上分T他人评价他人评价T自我评价自我评价(2)从评价标准上分)从评价标准上分T相对评价相对评价T绝对评价绝对评价T内差异评价内差异评价2022-8-12教育质量
13、评价(3)从评价功能上分)从评价功能上分T诊断性评价诊断性评价T形成性评价形成性评价T总结性评价总结性评价(4)从评价方法上分)从评价方法上分T定性评价定性评价T定量评价定量评价2022-8-12教育质量评价5.1.4 教育价值观的转变教育价值观的转变(1)教育既要考虑培养满足社会需要的学生,)教育既要考虑培养满足社会需要的学生,也要考虑促进个人发展需要也要考虑促进个人发展需要T社会需要社会需要个人发展需要个人发展需要(2)教育既要培养学生的共性,也应培养学)教育既要培养学生的共性,也应培养学生的个性生的个性T学生共性学生共性学生个性学生个性(3)教育既要促进学生的近期发展,也要促)教育既要促
14、进学生的近期发展,也要促进学生的可持续发展进学生的可持续发展T近期发展近期发展长远发展长远发展2022-8-12教育质量评价5.2 教育评价的发展教育评价的发展5.2.1 教育测评的发展教育测评的发展(1)中国古代教育测评)中国古代教育测评 中国是考试制度的发源地中国是考试制度的发源地根据根据学记学记记载,早在我国的西周时期,就记载,早在我国的西周时期,就实行了教育考评。所以,教育测评发生的最早实行了教育考评。所以,教育测评发生的最早源头在中国。源头在中国。2022-8-12教育质量评价 中国科举制度的世界地位中国科举制度的世界地位科举考试始于隋,兴盛完备于唐,废于清末,科举考试始于隋,兴盛完
15、备于唐,废于清末,是我国实行时间最长的一种选士制度,对我国是我国实行时间最长的一种选士制度,对我国乃至于对世界的考试制度有重要的影响。乃至于对世界的考试制度有重要的影响。科举制是通过分科考试来选取人才,科举制自科举制是通过分科考试来选取人才,科举制自产生后,就不断探索考试的方法,经过唐代产生后,就不断探索考试的方法,经过唐代200多年的发展,终于形成了多年的发展,终于形成了贴经、口试、墨贴经、口试、墨义、策问和诗赋义、策问和诗赋五种方法测试考生。五种方法测试考生。2022-8-12教育质量评价1)贴经)贴经把所试的经书任揭一页,将其左右两边挡住,把所试的经书任揭一页,将其左右两边挡住,中间只开
16、一行,再用纸帖盖住三字,令应试者中间只开一行,再用纸帖盖住三字,令应试者填出来。贴经是各科考试中普遍应用的方法。填出来。贴经是各科考试中普遍应用的方法。起初简单,只要把经书及注释熟读熟记就可以起初简单,只要把经书及注释熟读熟记就可以应付。后来时间久了,许多经文及注释都考过应付。后来时间久了,许多经文及注释都考过了,考生过多,需要淘汰,所以帖经的条目也了,考生过多,需要淘汰,所以帖经的条目也愈来愈难。有的贴经条目甚至是让帖年头月尾,愈来愈难。有的贴经条目甚至是让帖年头月尾,孤章绝句,完全是有意刁难考生。这种类似于孤章绝句,完全是有意刁难考生。这种类似于现代填空的贴经,主要考察考生的记诵能力,现代
17、填空的贴经,主要考察考生的记诵能力,对考生的其他能力是无法检查的。对考生的其他能力是无法检查的。2022-8-12教育质量评价2)口试)口试让考生当场口头回答问题。开始是由考官负责,让考生当场口头回答问题。开始是由考官负责,问答时并不作记录,后来出现了舞弊现象。建问答时并不作记录,后来出现了舞弊现象。建中二年(中二年(781年),中书舍知礼部贡举赵赞曾年),中书舍知礼部贡举赵赞曾奏请,以所问录于纸上,各令直书其文。元和奏请,以所问录于纸上,各令直书其文。元和二年(二年(807年),礼部贡院又清皇帝废除口试。年),礼部贡院又清皇帝废除口试。元和七年,权知礼部侍郎韦贯之奏请恢复口试。元和七年,权知
18、礼部侍郎韦贯之奏请恢复口试。口试的方法比较灵活,但随意性较大,确实有口试的方法比较灵活,但随意性较大,确实有复查无凭的缺点,容易给一些考官和考生提供复查无凭的缺点,容易给一些考官和考生提供联合舞弊的机会。联合舞弊的机会。2022-8-12教育质量评价3)墨义)墨义 一种简单的笔试问答。不需要考生发挥自己的一种简单的笔试问答。不需要考生发挥自己的思想,只需熟读熟记经文和注释就能答出。这思想,只需熟读熟记经文和注释就能答出。这种方法主要考察考生的记忆能力,也较简单,种方法主要考察考生的记忆能力,也较简单,所以一问便是几十条,甚至几百条。所以一问便是几十条,甚至几百条。如原问:如原问:“子谓子产有君
19、子之道四焉。所谓四子谓子产有君子之道四焉。所谓四者何也?者何也?”对曰:对曰:“其行己也恭,其事上也敬,其行己也恭,其事上也敬,其养民也惠,其使命也义。谨对。其养民也惠,其使命也义。谨对。”2022-8-12教育质量评价4)策问)策问要求考生针对当时社会政治、经济、文化等要求考生针对当时社会政治、经济、文化等方面出现的问题,发表自己的看法,类似于政方面出现的问题,发表自己的看法,类似于政治性的论文。策问的方法是从西汉时期发展而治性的论文。策问的方法是从西汉时期发展而来的,到了唐代更为人们做重视。来的,到了唐代更为人们做重视。2022-8-12教育质量评价策问策问让考生自由的发表自己的意见,相比
20、口试、让考生自由的发表自己的意见,相比口试、贴经和墨义来说,能够考察出一个人治国安邦贴经和墨义来说,能够考察出一个人治国安邦的才能,能够促使考生开动脑筋去思考一些现的才能,能够促使考生开动脑筋去思考一些现实问题,有利于人们思维水平的提高。正因为实问题,有利于人们思维水平的提高。正因为如此,唐代各科考试的最后取舍,大多取决于如此,唐代各科考试的最后取舍,大多取决于策问。但长期采用这种方法,造成了一般考生策问。但长期采用这种方法,造成了一般考生束书不观,只拿缀辑的旧策习读,以应付考试。束书不观,只拿缀辑的旧策习读,以应付考试。就连李白这样的名流,也未能脱俗。就连李白这样的名流,也未能脱俗。2022
21、-8-12教育质量评价5)诗赋)诗赋要求考生当场写作诗赋一篇,主要考察考生要求考生当场写作诗赋一篇,主要考察考生的文学修养和文学创作能力。诗赋考试驶于唐的文学修养和文学创作能力。诗赋考试驶于唐高宗永隆二年高宗永隆二年(681年年),吏部考功员外郎,吏部考功员外郎刘思立刘思立以进士科考试只考时务策,知识太狭窄为由,以进士科考试只考时务策,知识太狭窄为由,要求加试杂文,于是下令加试杂文两首。但此要求加试杂文,于是下令加试杂文两首。但此时考试仍以策问为主。至神龙元年时考试仍以策问为主。至神龙元年(705年年),才,才于策问之外增添了诗赋考试。后来唐朝的统治于策问之外增添了诗赋考试。后来唐朝的统治者也
22、喜好诗赋,诗赋在考试中起的作用便日渐者也喜好诗赋,诗赋在考试中起的作用便日渐增大了。增大了。2022-8-12教育质量评价诗赋考试在一定程度上推动了唐诗的繁荣发展,诗赋考试在一定程度上推动了唐诗的繁荣发展,唐诗的发展盛行也促使诗赋考试越来越为人们唐诗的发展盛行也促使诗赋考试越来越为人们所重视所重视.诗赋最终成为人们获取功名利禄的便捷诗赋最终成为人们获取功名利禄的便捷途径,以至于发展成为专门注重词藻、注重形途径,以至于发展成为专门注重词藻、注重形式而不重思想内容的创作风格,造成了相互抄式而不重思想内容的创作风格,造成了相互抄袭模仿的不良学风。袭模仿的不良学风。2022-8-12教育质量评价(2)
23、西方教育测量的发展)西方教育测量的发展 教育测量的诞生教育测量的诞生18世纪以前的西方各国,由于学校尚未普及世纪以前的西方各国,由于学校尚未普及,学校考试主要是口试。学校考试主要是口试。1720年,英国剑桥大学首先以笔试替代口试年,英国剑桥大学首先以笔试替代口试,开西方学校考试笔试之先河。开西方学校考试笔试之先河。1845年,美国初等学校普及,学生人数激增年,美国初等学校普及,学生人数激增,对毕业生一一口试已不可能,于是,美贺拉斯对毕业生一一口试已不可能,于是,美贺拉斯曼于曼于1847年引进笔试,取代口试。年引进笔试,取代口试。2022-8-12教育质量评价 教育测量的蓬勃兴起教育测量的蓬勃兴
24、起1864年,英国格林威治医院附属学校的教师年,英国格林威治医院附属学校的教师费舍,收集了许多学生成绩样本,汇集了一本费舍,收集了许多学生成绩样本,汇集了一本量表集量表集,作为度量学生各科成绩的标准,作为度量学生各科成绩的标准,这可以说是客观标准化测量的萌芽。这可以说是客观标准化测量的萌芽。引起人们对测验问题极大关注的是引起人们对测验问题极大关注的是美莱斯美莱斯博士博士的拼字测验。的拼字测验。2022-8-12教育质量评价20世纪初,世纪初,比纳比纳智力量表推出,智力量表推出,比纳比纳被称为智被称为智力测量鼻祖。力测量鼻祖。1904年,美国心理学家年,美国心理学家桑代克桑代克出版出版心理与心理
25、与社会测量学导论社会测量学导论,桑代克被称为教育测量鼻,桑代克被称为教育测量鼻祖。祖。2022-8-12教育质量评价1905年,法国心理学家比纳和西蒙编制了第年,法国心理学家比纳和西蒙编制了第一个诊断异常儿童智力的测验一个诊断异常儿童智力的测验,即著名的即著名的“比纳比纳-西蒙量表西蒙量表”(Binet-Simon Scale)。该量表包。该量表包括括30个项目,从易到难排列,以通过题数的多个项目,从易到难排列,以通过题数的多少作为鉴别智力高低的标准。少作为鉴别智力高低的标准。比纳认为,智力是一种判断的能力,创造的能比纳认为,智力是一种判断的能力,创造的能力,适应环境的能力。因而他从复杂任务入
26、手,力,适应环境的能力。因而他从复杂任务入手,着重测量判断、理解、推理等高级心理过程,着重测量判断、理解、推理等高级心理过程,即智力中的普通因素。即智力中的普通因素。2022-8-12教育质量评价美国斯坦福大学教授推孟美国斯坦福大学教授推孟(L.M.Terman)在在1916年修订了比纳年修订了比纳西蒙量表,即斯坦福西蒙量表,即斯坦福比比纳智力量表纳智力量表(Stanford-Binet Scale)。该测验有。该测验有90个项目,其最大特点是引入智力商数个项目,其最大特点是引入智力商数(intelligence quotient,IQ,简称智商,简称智商)的概念。的概念。所谓智商,就是心理年
27、龄所谓智商,就是心理年龄(MA)与实足年龄与实足年龄(chronological age,CA)之比,也称比率智商,之比,也称比率智商,作为比较人的聪明程度的相对指标。作为比较人的聪明程度的相对指标。2022-8-12教育质量评价(3)近代教育测量的发展)近代教育测量的发展教育测量量表的编制突破了过去单一答案的教育测量量表的编制突破了过去单一答案的求同思维题,发展到有了求异思维题和论文题求同思维题,发展到有了求异思维题和论文题;教育测量范围由过去偏重于学生学习成绩的教育测量范围由过去偏重于学生学习成绩的测量,发展到涉及课程设计、教材、教育改革测量,发展到涉及课程设计、教材、教育改革方案等的测量
28、;方案等的测量;教育测量由过去单一的常模参照性测验模式,教育测量由过去单一的常模参照性测验模式,发展到常模参照性测验与目标参照性测验相结发展到常模参照性测验与目标参照性测验相结合的模式;使教育测量本身的理论研究与技术合的模式;使教育测量本身的理论研究与技术开发更加深入与完善。开发更加深入与完善。2022-8-12教育质量评价 以以测量测量为标志的第一代教育评价为标志的第一代教育评价(桑代克时期(桑代克时期1900-1933)第一代教育评价出现在十九世纪后期至第一代教育评价出现在十九世纪后期至20世世纪纪30年代。英国的年代。英国的高尔顿高尔顿通过对个体差异的长通过对个体差异的长期研究,于期研究
29、,于1869年发表了年发表了遗传的天才遗传的天才一书,一书,揭开了教育测量的序幕。揭开了教育测量的序幕。1879年,德国的年,德国的冯特冯特在在莱比锡莱比锡首创了心理实验室,实验心理学家逐首创了心理实验室,实验心理学家逐步摸索出了一套测量方法,对教育测量的发展步摸索出了一套测量方法,对教育测量的发展产生了积极影响。十九世纪最后十年,各种测产生了积极影响。十九世纪最后十年,各种测量随着心理实验的发展层出不穷。量随着心理实验的发展层出不穷。2022-8-12教育质量评价1897年,美国的莱斯发表了他对年,美国的莱斯发表了他对20个学校的个学校的1600名学生所作的名学生所作的拼字测验拼字测验的结果
30、,更引起了的结果,更引起了人们对测验方法的普遍关注,对后来教育测量人们对测验方法的普遍关注,对后来教育测量的发展产生了深远的影响。在这种背景下,的发展产生了深远的影响。在这种背景下,1904年,美国的年,美国的桑代克桑代克发表了发表了心理与社会测心理与社会测量导论量导论一书,系统地介绍了统计方法和编制一书,系统地介绍了统计方法和编制测验的基本原理。该书的基本观点,为教育测测验的基本原理。该书的基本观点,为教育测量奠定了理论基础,对教育测量学的建设与发量奠定了理论基础,对教育测量学的建设与发展做出了巨大贡献。展做出了巨大贡献。2022-8-12教育质量评价“拼字测验拼字测验”结果结果表明:表明:
31、8年中每天花年中每天花45分钟时间进分钟时间进行拼字练习,同每天花行拼字练习,同每天花15分钟进行练习的成绩并没有分钟进行练习的成绩并没有多大的差别。这一结论尽管遭到了不少人的反对,但多大的差别。这一结论尽管遭到了不少人的反对,但它引起了人们对测验问题的普遍关心,推动了教育测它引起了人们对测验问题的普遍关心,推动了教育测验问题的研究。验问题的研究。中世纪以后,西方自然科学由于在方法论上引入了中世纪以后,西方自然科学由于在方法论上引入了测定、观察和实验,一些传统学科如物理学、化学、测定、观察和实验,一些传统学科如物理学、化学、医学、天文学等有了长足的发展。医学、天文学等有了长足的发展。1879年
32、,冯特在德年,冯特在德国莱比锡建立了第一个心理学实验室,为进一步揭示国莱比锡建立了第一个心理学实验室,为进一步揭示人的心理本质问题而设计了种种周密的实验方案与实人的心理本质问题而设计了种种周密的实验方案与实现方案的各种严密的测量方法。所有这些方法论的变现方案的各种严密的测量方法。所有这些方法论的变革促进了教育测量运动的兴起。革促进了教育测量运动的兴起。2022-8-12教育质量评价以后的几年中,以后的几年中,比纳比纳西蒙西蒙智力量表、智力量表、斯坦斯坦福福比纳比纳量表等心理测验的日趋定型对教育测量量表等心理测验的日趋定型对教育测量的标准化也产生了极其深刻的影响。所以,这的标准化也产生了极其深刻
33、的影响。所以,这时期评价就是选择测量工具、组织和实施测量、时期评价就是选择测量工具、组织和实施测量、提供测量数据。提供测量数据。为此,这一时期被称为为此,这一时期被称为“测量测量”时期。时期。2022-8-12教育质量评价教育测验教育测验是用数学方法对事物或现象进行描是用数学方法对事物或现象进行描述,是为了取得客观的数据,述,是为了取得客观的数据,客观性客观性是测验质是测验质量的首要指标。这种倾向在我国教育评价实践量的首要指标。这种倾向在我国教育评价实践中普遍存在,影响深远。其思想及理论来源于中普遍存在,影响深远。其思想及理论来源于美国的教育测验运动,主要应用于评价学生的美国的教育测验运动,主
34、要应用于评价学生的学业成绩。学业成绩。2022-8-12教育质量评价主要主要优点优点是:可以使学生学业的考查客观化、是:可以使学生学业的考查客观化、计量化和精确化,便于经常性和大规模的进行计量化和精确化,便于经常性和大规模的进行评价。评价。缺点缺点是:不易测量学生学业的全部,对学生的是:不易测量学生学业的全部,对学生的学习态度、兴趣、品行、性格等,都不能做出学习态度、兴趣、品行、性格等,都不能做出充分的说明。教育工作包括许多因素,要衡量充分的说明。教育工作包括许多因素,要衡量其好坏,不能只通过学生的学业成绩来考查,其好坏,不能只通过学生的学业成绩来考查,单靠教育测量的定量分析,是远远不够的。单
35、靠教育测量的定量分析,是远远不够的。2022-8-12教育质量评价 以以描述描述为标志的第二代教育评价为标志的第二代教育评价(1930-1940)第二代教育评价盛行于第二代教育评价盛行于20世纪世纪30到到40年代。年代。30年代以前,现代教育评价的概念尚未形成,年代以前,现代教育评价的概念尚未形成,教育测量与教育评价几乎是同义语教育测量与教育评价几乎是同义语。无论是我。无论是我国的科举,还是西方的心理测验和教育测量,国的科举,还是西方的心理测验和教育测量,所关心的仅是个体学力状况,追求的是量的大所关心的仅是个体学力状况,追求的是量的大小,而对人的全面了解和把握对学校乃至整个小,而对人的全面了
36、解和把握对学校乃至整个教育成就的评价并未正式提出来。教育成就的评价并未正式提出来。2022-8-12教育质量评价1933年罗斯福实行了年罗斯福实行了“经济的社会化政策经济的社会化政策”,这一经济政策的实行导致了大批青年没有就业这一经济政策的实行导致了大批青年没有就业的机会,只能涌向中学。而当时美国的高中课的机会,只能涌向中学。而当时美国的高中课程都是为升大学服务的,于是,中学课程和失程都是为升大学服务的,于是,中学课程和失业青年的需要之间产生了尖锐的矛盾。为了促业青年的需要之间产生了尖锐的矛盾。为了促进和保证课程改革的进行,美国进步主义教育进和保证课程改革的进行,美国进步主义教育协会进行了一项
37、课程内容改革的实验研究,从协会进行了一项课程内容改革的实验研究,从1932年到年到1940年历经八年完成,史称年历经八年完成,史称“八年研八年研究究”。2022-8-12教育质量评价为了评价其研究成果,组成了以泰勒为领导的为了评价其研究成果,组成了以泰勒为领导的教育评价委员会。通过这场研究,泰勒和他的教育评价委员会。通过这场研究,泰勒和他的同事们正式提出了教育评价的概念,即教育评同事们正式提出了教育评价的概念,即教育评价就是衡量实际活动达到教育目标的程度,测价就是衡量实际活动达到教育目标的程度,测量是它的手段。同时,还提出评价的原则和方量是它的手段。同时,还提出评价的原则和方法,即法,即“泰勒
38、模式泰勒模式”。“八年研究八年研究”实际上宣实际上宣告测量运动的终结,告测量运动的终结,使人们在思想上和行动上使人们在思想上和行动上接受了采用教育评价方法来描述教育效果这一接受了采用教育评价方法来描述教育效果这一观点,形成了一个以观点,形成了一个以“描述描述”为特征的评价时为特征的评价时代。代。2022-8-12教育质量评价 以以判断判断为标志的第三代教育评价为标志的第三代教育评价(1940-1970)第三代教育评价出现在第三代教育评价出现在20世纪世纪40年代末年代末50年年代初到代初到70年代。年代。1957年,前苏联第一颗人造卫年,前苏联第一颗人造卫星上天使美国大为震惊,促使美国投入大量
39、的星上天使美国大为震惊,促使美国投入大量的人力和财力进行大规模的教育改革,从而对教人力和财力进行大规模的教育改革,从而对教育评价也提出了新的要求。政府十分关注教育育评价也提出了新的要求。政府十分关注教育评价的开展,民众也迫切要求对学校的办学成评价的开展,民众也迫切要求对学校的办学成效进行鉴定和报告,使教育评价成了官方和民效进行鉴定和报告,使教育评价成了官方和民间共同关心的课题。间共同关心的课题。2022-8-12教育质量评价1963年,克龙巴赫发表了一篇题为年,克龙巴赫发表了一篇题为通过评通过评价改进课程价改进课程的文章,的文章,1967年斯克里芬发表了年斯克里芬发表了评价方法论评价方法论。他
40、们一方面对原先的评价理。他们一方面对原先的评价理论与方法提出质疑,同时对评价理论与方法进论与方法提出质疑,同时对评价理论与方法进行了更广泛和更深刻的研究和开拓。行了更广泛和更深刻的研究和开拓。他们认为他们认为评价不仅要以目标为中心,而且更要注重对决评价不仅要以目标为中心,而且更要注重对决策的评价。策的评价。也就是说,评价者不仅要关心课程也就是说,评价者不仅要关心课程制定者规定的目标,检验这些目标达到的程度,制定者规定的目标,检验这些目标达到的程度,更应注意对目标的合理性的判断,关心所作的更应注意对目标的合理性的判断,关心所作的决策和决策的依据。决策和决策的依据。2022-8-12教育质量评价1
41、967年,斯泰克发表了年,斯泰克发表了评价的面貌评价的面貌一文,一文,肯定了肯定了判断判断是评价的两大基本活动之一,同时是评价的两大基本活动之一,同时提出了一个完整的、包含描述与判断两个方面提出了一个完整的、包含描述与判断两个方面的评价模式。这样,判断就成了第三代教育评的评价模式。这样,判断就成了第三代教育评价的标志。价的标志。正如著名教育评价专家顾巴所说的:正如著名教育评价专家顾巴所说的:“60年代年代或者更确切地说或者更确切地说1967年以后,判断成了第三代年以后,判断成了第三代评价的标记。评价的标记。”2022-8-12教育质量评价 以同构为标志的第四代教育评价以同构为标志的第四代教育评
42、价(1970-至今)至今)20世纪世纪80年代,由美国印第安纳大学教育学年代,由美国印第安纳大学教育学院院枯巴教授枯巴教授和维德比尔大学高等教育学院副教和维德比尔大学高等教育学院副教授授林肯林肯创立了创立了“第四代教育评价第四代教育评价”理论。理论。“第第四代教育评价四代教育评价”的初步思想最早出现在他们合的初步思想最早出现在他们合写的写的有效的评价有效的评价(1981)和和自然主义的研自然主义的研究究(1985)两篇重要文章中。经过几年的潜心两篇重要文章中。经过几年的潜心研究,研究,1989年他们出版了名为年他们出版了名为第四代教育评第四代教育评价价的专著。的专著。2022-8-12教育质量
43、评价在这本书中,在这本书中,枯巴枯巴和和林肯林肯较为系统地阐述了这较为系统地阐述了这种新理论的基本观点和理论构架。种新理论的基本观点和理论构架。“第四代教第四代教育评价育评价”理论提出后,在美国引起了很大的反理论提出后,在美国引起了很大的反响,整个教育界几乎都为之震动了。主要内容响,整个教育界几乎都为之震动了。主要内容包括以下几点:包括以下几点:2022-8-12教育质量评价1)把评价看作是所有参与评价活动的人们,)把评价看作是所有参与评价活动的人们,特别是评价者与评价对象双方交互作用、共同特别是评价者与评价对象双方交互作用、共同建构统一观点的过程,评价结果也是其双方交建构统一观点的过程,评价
44、结果也是其双方交互作用的互作用的“产物产物”。2022-8-12教育质量评价2)提倡在评价中形成)提倡在评价中形成“全面参与全面参与”的意识和的意识和气氛。主张让参与的评价所有人都有机会发表气氛。主张让参与的评价所有人都有机会发表自己的意见,并要求评价者在评价中充分尊重自己的意见,并要求评价者在评价中充分尊重每个人的尊严、人格与隐私,所有参与评价的每个人的尊严、人格与隐私,所有参与评价的人都应是平等、合作的关系。人都应是平等、合作的关系。2022-8-12教育质量评价3)他们提出在评价中存在)他们提出在评价中存在“价值差异价值差异”。认。认为,参与评价的人们的价值观是各不相同的、为,参与评价的
45、人们的价值观是各不相同的、价值标准是存在差异的。这种价值标准是存在差异的。这种“差异差异”观点将观点将纠正传统评价理论价值是一致的、单一的观点。纠正传统评价理论价值是一致的、单一的观点。第四代评价观点的提出,在全世界教育领域中第四代评价观点的提出,在全世界教育领域中产生了很大的反响。产生了很大的反响。2022-8-12教育质量评价(4)多元评价理论的出现)多元评价理论的出现 多元智能理论是一种全新的有关人类智能结多元智能理论是一种全新的有关人类智能结构的理论,它的悄然兴起,不仅有力诠释了素构的理论,它的悄然兴起,不仅有力诠释了素质教育的基本理念,而且给我们的课程改革提质教育的基本理念,而且给我
46、们的课程改革提供了有力的理论支撑。该理论的提出者霍华供了有力的理论支撑。该理论的提出者霍华德德加德纳教授认为:加德纳教授认为:人的智力是由人的智力是由言语言语/语言智能、语言智能、音乐音乐/节奏智节奏智能、能、逻辑逻辑/数理智能,数理智能,视觉视觉/空间智能、空间智能、身体身体/运动智能、运动智能、交往交往/人际关系智能、人际关系智能、自知自知/自我认自我认知智能、知智能、自然观察自然观察智能等智能等8 8种以上智能构成。种以上智能构成。2022-8-12教育质量评价加德纳提出:世界上并不存在谁聪明谁不聪明加德纳提出:世界上并不存在谁聪明谁不聪明的问题,而是存在哪一方面聪明以及怎样聪明的问题,
47、而是存在哪一方面聪明以及怎样聪明的问题。非智力的心理因素如兴趣、情感、意的问题。非智力的心理因素如兴趣、情感、意志等对学习效果的关系极大,把非智力因素作志等对学习效果的关系极大,把非智力因素作为一个与知识能力平行的领域来评价,是现代为一个与知识能力平行的领域来评价,是现代社会对多元化人才的需求。社会对多元化人才的需求。1963年,美国政府正式提出要对教育的效能年,美国政府正式提出要对教育的效能和质量进行评价,并拨款支持。这段时间出现和质量进行评价,并拨款支持。这段时间出现了了40多种评价模式,教育评价呈现出一派生机多种评价模式,教育评价呈现出一派生机勃勃的局面。其中比较著名的有:勃勃的局面。其
48、中比较著名的有:2022-8-12教育质量评价 决策评价决策评价(CIPP)此类评价认为,此类评价认为,“评价最重要的意图不是为评价最重要的意图不是为了证明,而是为了改进了证明,而是为了改进”,评价不应单纯的以,评价不应单纯的以教学目标为中心,应以决策为代表的社会为中教学目标为中心,应以决策为代表的社会为中心。评价应为决策服务、为决策收集、组织和心。评价应为决策服务、为决策收集、组织和报告信息,它是报告信息,它是“为决策提供有用信息的过为决策提供有用信息的过程程”。1963年,克龙巴赫发表年,克龙巴赫发表通过评价改革课通过评价改革课程程,指出评价的内容不应仅仅是教学目标的,指出评价的内容不应仅
49、仅是教学目标的达到程度,而更应关心对教育决策及其所依据达到程度,而更应关心对教育决策及其所依据的准则的评价。为决策提供信息更应是评价的的准则的评价。为决策提供信息更应是评价的中心。中心。2022-8-12教育质量评价斯塔弗尔比姆斯塔弗尔比姆(D.L.Stufflebeam)是这一方法是这一方法的主要奠基者,他把评价过程分为四个阶段:的主要奠基者,他把评价过程分为四个阶段:T背景背景评价(评价(Context Evaluation);T输入输入评价(评价(Input);T过程过程评价(评价(Process);T成果成果评价(评价(Product)。)。被称为被称为CIPP评价模式。评价模式。20
50、22-8-12教育质量评价这类教育评价有三个明显的特点这类教育评价有三个明显的特点:T(1)明确提出评价为决策服务的思想;)明确提出评价为决策服务的思想;T(2)开始探讨目标本身的科学性和合理性,)开始探讨目标本身的科学性和合理性,即目标本身成为评价的对象,同时预期目标即目标本身成为评价的对象,同时预期目标之外的教学效果开始受到关注;之外的教学效果开始受到关注;T(3)正式提出形成性评价的思想,)正式提出形成性评价的思想,“评价评价的最主要目的不是为了证明,而是为了改的最主要目的不是为了证明,而是为了改进进”。2022-8-12教育质量评价 目标游离评价目标游离评价(Goal-free Eva