1、护理教育评估与评价 PPT课件n第一节第一节 概述概述n第二节第二节 教学评估教学评估n第三节第三节 教学评价教学评价n第四节第四节 试题的编制及质量分析试题的编制及质量分析第六章第六章 护理教学评估与评价护理教学评估与评价n了解:教学评估与评价的发展及了解:教学评估与评价的发展及其在护理教学中的意义其在护理教学中的意义n熟练掌握:教学评估的分类、有熟练掌握:教学评估的分类、有效评估的标准、教学评价模式、效评估的标准、教学评价模式、与评价过程与评价过程n重点掌握:教学评价的相关概念、重点掌握:教学评价的相关概念、常用方法、临床能力评估、教学常用方法、临床能力评估、教学评价的内容、试卷编制、试卷
2、的评价的内容、试卷编制、试卷的质量分析质量分析教学评估和评价伴随教学活动而自教学评估和评价伴随教学活动而自然产生和发展然产生和发展成为独立研究领域始于成为独立研究领域始于19世纪末世纪末最有代表性的国家是最有代表性的国家是美国美国发展过程大体经历发展过程大体经历3个时期个时期n 实际评估时可采用多种评估方式结合起来,实际评估时可采用多种评估方式结合起来,以相互弥补,以达全面、科学、准确以相互弥补,以达全面、科学、准确 可靠性(可靠性(ReliabilityReliability)区别性(区别性(DiscriminationDiscrimination)n是指评估对被评估对象反应是指评估对被评估
3、对象反应水平的水平的区分程度和鉴别能力区分程度和鉴别能力n用区分度表示用区分度表示n作用:区别能正确回答的人作用:区别能正确回答的人与不能正确回答的人与不能正确回答的人实用性(实用性(PracticalityPracticality)n也可称为可行性,是也可称为可行性,是指测试在应用上有无指测试在应用上有无时间、场所、经费等时间、场所、经费等的限制。的限制。n要求:评估标准应简要求:评估标准应简明可测量,评估的量明可测量,评估的量化方法方便易行,评化方法方便易行,评估的结果实事求是。估的结果实事求是。考核法、观察法、调查法、考核法、观察法、调查法、自陈法自陈法常用方法:观察法、常用方法:观察法
4、、笔试试笔试试卷卷、书面作业、口头报告、口、书面作业、口头报告、口试以及操作考试等。试以及操作考试等。要求:评估方式均应紧扣教要求:评估方式均应紧扣教学评估目的,且符合有效评估学评估目的,且符合有效评估标准标准有观察法、书面作业、口头报告、模拟考试等有观察法、书面作业、口头报告、模拟考试等四、教学评价内容四、教学评价内容四、教学评价内容四、教学评价内容四、教学评价内容四、教学评价内容四、教学评价内容四、教学评价内容第四节第四节 试卷的编制及质量分析试卷的编制及质量分析2.2.试卷编制的基本原则试卷编制的基本原则(1111条)条)2.2.试卷编制的基本原则(试卷编制的基本原则(1111条)条)2
5、.2.试卷编制的基本原则试卷编制的基本原则n绝对评分法绝对评分法分析法:是按照标准答案分析法:是按照标准答案看学生答对了多少,常常以百分制计。看学生答对了多少,常常以百分制计。优点:评分比较可靠优点:评分比较可靠n相对评分法相对评分法综合法:是指出学生属于综合法:是指出学生属于哪个档次,也哪个档次,也常用优、良、中、常用优、良、中、差来表示。差来表示。n指一个学生前面问题的回答情况指一个学生前面问题的回答情况对评分人评阅其后面的结果产生对评分人评阅其后面的结果产生影响。影响。n后果:评分不客观、不真实后果:评分不客观、不真实n主观性试卷应有反馈意见主观性试卷应有反馈意见n发放试卷给学生发放试卷
6、给学生n写出意见反馈写出意见反馈n论述题的论述题的优点优点n适用于评估高层次的认知能力适用于评估高层次的认知能力n考试对象可从不同侧面、广度考试对象可从不同侧面、广度和深度进行自由作答和深度进行自由作答n可用于考察学生多方面能力可用于考察学生多方面能力n可用于间接评估态度和价值观可用于间接评估态度和价值观n命题比客观性试题容易命题比客观性试题容易n论述题的论述题的缺点缺点n内容真实性低,分数可靠性低内容真实性低,分数可靠性低n评分困难评分困难n学生感到疲劳学生感到疲劳n分数可靠性低分数可靠性低n书写能力会影响分数书写能力会影响分数n选答会影响分数选答会影响分数2.2.客观性试题的编制客观性试题
7、的编制n评分客观公正,不受评分人主评分客观公正,不受评分人主观影响,完全取决于答卷人的观影响,完全取决于答卷人的知识水平;知识水平;n试卷内容的真实性高,教学大试卷内容的真实性高,教学大纲覆盖率面广;纲覆盖率面广;n节省阅卷时间;节省阅卷时间;n答卷人不易感到疲倦。答卷人不易感到疲倦。n客观性试题的种类客观性试题的种类n单项选择题单项选择题n多项选择题(又称反多项选择题(又称反选题)选题)n填空题填空题2.2.客观性试题的编制客观性试题的编制单选题单选题A 型题型题n结肠上皮属于(结肠上皮属于()主干部分主干部分nA 鳞状上皮鳞状上皮nB 立方形上皮立方形上皮nC 移行上皮移行上皮nD 柱状上
8、皮柱状上皮干扰部分干扰部分答案部分答案部分单项选择题单项选择题 nB 型题:型题:由三个以上备选答案,并列于若干个题由三个以上备选答案,并列于若干个题干前面,要求从中选出一个最佳答案干前面,要求从中选出一个最佳答案例如:例如:A 丝脉丝脉 B 洪脉洪脉 C 间歇脉间歇脉D 脉短绌脉短绌 E 缓脉缓脉1.1.高热病人的脉搏常表现为(高热病人的脉搏常表现为()2.大出血病人的脉搏常表现为(大出血病人的脉搏常表现为()多项选择题(多项选择题(X X型题)型题)n有有1 1个以上正确答案,或者说是将不个以上正确答案,或者说是将不正确的答案挑出,剩下的全都是正确正确的答案挑出,剩下的全都是正确的,故又称
9、为反选择题的,故又称为反选择题n例如:例如:表明可能发生心脏停博的项目有:(表明可能发生心脏停博的项目有:()A 呼吸停止呼吸停止 B 瞳孔散大瞳孔散大 C 胸痛胸痛 D 脉搏消失脉搏消失 E 腹痛腹痛出选择题的注意事项出选择题的注意事项n主干部分应做到:主干部分应做到:问题的陈述必须清楚;问题的陈述必须清楚;只给出必需的资料;只给出必需的资料;可出些较难的题,以测试高层次可出些较难的题,以测试高层次水平。水平。出选择题的注意事项出选择题的注意事项n选择项应该做到:选择项应该做到:3 3个或个或3 3个以上,以减少猜中的可能;个以上,以减少猜中的可能;应按逻辑或数字顺序排列;应按逻辑或数字顺序
10、排列;尽可能短,但应保证清楚;尽可能短,但应保证清楚;避免重复;避免重复;应是同类性质的内容。应是同类性质的内容。出选择题的注意事项出选择题的注意事项n干扰部分应该含有使人粗看起来似乎干扰部分应该含有使人粗看起来似乎正确的内容,从而起到干扰作用,应正确的内容,从而起到干扰作用,应该避免使用哪些一看就不正确、与问该避免使用哪些一看就不正确、与问题毫不相干的陈述做干扰项。题毫不相干的陈述做干扰项。nA A型题中答案部分应是唯一的一个最合型题中答案部分应是唯一的一个最合适的回答。适的回答。填空题填空题n要求学生将问题陈述中缺少的内容填入相应要求学生将问题陈述中缺少的内容填入相应的空格内,使陈述内容完
11、整、正确的空格内,使陈述内容完整、正确n主要用于测试学生对名词、概念掌握情况主要用于测试学生对名词、概念掌握情况n缺点:不适宜用于测试高层次能力缺点:不适宜用于测试高层次能力 适合于填空的答案不只适合于填空的答案不只1 1个,使评分出个,使评分出现不客观现象现不客观现象 可引导学生死记硬背可引导学生死记硬背n出题注意事项:出题注意事项:留出重要的词让学生填留出重要的词让学生填需填的字不能大多需填的字不能大多保证题目本身是正确的保证题目本身是正确的二、试卷的质量分析二、试卷的质量分析n目的:提高试卷质量,目的:提高试卷质量,保证通过试卷获得的信保证通过试卷获得的信息资料的可靠性息资料的可靠性n分
12、析指标:主要有难易分析指标:主要有难易度、区分度、信度及效度、区分度、信度及效度等度等(一)试卷的难度(一)试卷的难度n难度是指试卷的难易程度难度是指试卷的难易程度n通常用难度指数加以描述通常用难度指数加以描述n难度指数的计算方法有很多,较为简单易理解难度指数的计算方法有很多,较为简单易理解的是计算公式的是计算公式n客观试题:客观试题:P P R/NR/N n一般难度分布在一般难度分布在0.350.350.650.65为宜,若是选拔性考为宜,若是选拔性考试,则以试,则以0.20.20.40.4为宜为宜n P P越大,示答对的人数越多,题目越容易越大,示答对的人数越多,题目越容易n P P越小,
13、答对的人数越少,题目越难越小,答对的人数越少,题目越难n 题目太难或太容易,均无法区分被测试对象题目太难或太容易,均无法区分被测试对象之间的差别,同时测试的信度也很低;难度适之间的差别,同时测试的信度也很低;难度适中的题目测试的信度较高中的题目测试的信度较高n难度不是一个独立的指标,仅根据难度的高低难度不是一个独立的指标,仅根据难度的高低还不能对试卷作出质量判断还不能对试卷作出质量判断(一)试卷的难度(一)试卷的难度(二)试卷的效度(二)试卷的效度n效度是指试卷确能测量到的知识和能力的程度效度是指试卷确能测量到的知识和能力的程度n通常用内容效度和效标关联效度通常用内容效度和效标关联效度n内容效
14、度是指试卷是否测量到了具有代表性的教学内容效度是指试卷是否测量到了具有代表性的教学内容和达到了预期技能内容和达到了预期技能n试卷的内容效度鉴定:先看试卷是否达到测量目标试卷的内容效度鉴定:先看试卷是否达到测量目标要求,再看其覆盖面和学习水平是否达到考试蓝图要求,再看其覆盖面和学习水平是否达到考试蓝图设计要求,还看是否有偏题、怪题或过难过易题。设计要求,还看是否有偏题、怪题或过难过易题。例如,如果某一套发音技能测试题只考单一音例如,如果某一套发音技能测试题只考单一音素的发音,而不考查重读、语调或音素在词语中的素的发音,而不考查重读、语调或音素在词语中的发音,那么,该测试的内容效度就很低。发音,那
15、么,该测试的内容效度就很低。n效标关联效度是以一次认为是最有效的效标关联效度是以一次认为是最有效的测验成绩作为效标,计算出本次测验成测验成绩作为效标,计算出本次测验成绩与效标之间的相关系数(以绩与效标之间的相关系数(以r表示)表示)n相关系数的值在相关系数的值在1到到1之间,之间,r为为1表示正相关,表示正相关,r为为1表示负相关表示负相关n相关系数高,说明本次测验与效标的测相关系数高,说明本次测验与效标的测量效果一致,测验的效度就高量效果一致,测验的效度就高(二)试卷的效度(二)试卷的效度(三)试卷的信度(三)试卷的信度n是指试卷的一致性和可靠性的程度是指试卷的一致性和可靠性的程度n信度包括
16、:信度包括:内部一致性信度:内部一致性信度:主要反映一次测验内部部主要反映一次测验内部部分之间相关程度,追求其等同相关系数分之间相关程度,追求其等同相关系数 稳定性信度:稳定性信度:指同一测验先后两次在同一被指同一测验先后两次在同一被测总体中实施,两次测验结果的相关程度测总体中实施,两次测验结果的相关程度(四)试卷的区分度(四)试卷的区分度n是指试题区分被测者的特征差异或鉴别其优是指试题区分被测者的特征差异或鉴别其优劣、高低程度的能力劣、高低程度的能力n区分度(区分度(D)计算:)计算:客观试题:客观试题:D PH代表高分组中答对该题的人数;代表高分组中答对该题的人数;PL代表低分组中代表低分
17、组中答对该题的人数;答对该题的人数;N高低分组的总人数。高分组为总高低分组的总人数。高分组为总分前分前27%的被测者,低分组为总分后的被测者,低分组为总分后27%的被测者的被测者 (高分组该题的总分低分组该题的总分)(高分组该题的总分低分组该题的总分)高分组该题的总分高分组该题的总分+低分组该题的总分低分组该题的总分D 2注意注意(四)试卷的区分度(四)试卷的区分度(五)试卷质量的综合分析(五)试卷质量的综合分析n区分度与难度区分度与难度 区分度与难度有一定的交叉关系,在一区分度与难度有一定的交叉关系,在一定的范围内,难度值(定的范围内,难度值(P)越小,则区分)越小,则区分度(度(D)越高,
18、但是如果难度值过小,区)越高,但是如果难度值过小,区分度反而下降;如果难度过大,区分度分度反而下降;如果难度过大,区分度自然也难以保证。自然也难以保证。n难度与区分度难度与区分度nP 0.5D0.2可以认为试题难度适中,可以认为试题难度适中,区分度良好;区分度良好;nP0.2试题偏难,但仍然有较试题偏难,但仍然有较 好的区分度;好的区分度;nP0.5 D0.2 区分度较差,如果内容是区分度较差,如果内容是 学生必须掌握的,试题尚可使学生必须掌握的,试题尚可使用;用;nP0.5D0.2无区分度,又过分难,无区分度,又过分难,应该放弃不用。应该放弃不用。(五)试卷质量的综合分析(五)试卷质量的综合
19、分析n试题的区分度越大,试卷的信度越大,也即试题的区分度越大,试卷的信度越大,也即难度中等的题目组成的试卷的信度较大。难度中等的题目组成的试卷的信度较大。n试卷的区分度越大,测验的效度也就越高试卷的区分度越大,测验的效度也就越高(五)试卷质量的综合分析(五)试卷质量的综合分析n试卷要具有较高的效度,必须具有较高的信度;试卷要具有较高的效度,必须具有较高的信度;而较高的信度不能保证一定具有较高的效度。而较高的信度不能保证一定具有较高的效度。n教育是改变人类行动方式教育是改变人类行动方式的过程的过程n教学评价是一种衡量达到教学评价是一种衡量达到教学目标的过程教学目标的过程n应从各个方面对教学活动应
20、从各个方面对教学活动进行评估和评价进行评估和评价n评估和评价的方法不仅仅评估和评价的方法不仅仅是依靠纸和笔的测验是依靠纸和笔的测验,还包还包括观察、调查和评定括观察、调查和评定n正式评估指运用科学的正式评估指运用科学的方法和工具进行测试获方法和工具进行测试获得资料,并对不同的资得资料,并对不同的资料进行整理、分类、统料进行整理、分类、统计学处理和比较的过程计学处理和比较的过程n如期末考试、标准化考如期末考试、标准化考试、临床结业考核等均试、临床结业考核等均是正式评估是正式评估n资料被法定机构认可资料被法定机构认可n非正式评估则是个非正式评估则是个人的、主观的评估,人的、主观的评估,它可以是从对
21、学生它可以是从对学生每天行为的观察、每天行为的观察、学生的练习以及非学生的练习以及非正式的接触或交谈正式的接触或交谈中逐渐获得资料的中逐渐获得资料的过程。过程。定量评估定性评估定量评估定性评估n定量评估是指采用定量定量评估是指采用定量计算方法,对评估的内计算方法,对评估的内容进行数量化的过程容进行数量化的过程n如试卷测试后的成绩用如试卷测试后的成绩用百分制记录百分制记录n定性评估是使用描述性语言对评定性评估是使用描述性语言对评估对象估对象“质质”的特征程度、状态的特征程度、状态和性质等非量化的资料进行收集、和性质等非量化的资料进行收集、整理和分析的过程。整理和分析的过程。n如对某门课程考核标准
22、采用如对某门课程考核标准采用“及及格格”、“不及格不及格”n诊断性评估是教学活动开始前所诊断性评估是教学活动开始前所做的评估,目的:确定被评估者做的评估,目的:确定被评估者的状态水平、存在问题的状态水平、存在问题n形成性评估是指在教学活动运行形成性评估是指在教学活动运行过程中随时进行评估过程中随时进行评估n目的:及时了解动态过程的教学目的:及时了解动态过程的教学效果,及时反馈信息,以便及时效果,及时反馈信息,以便及时强化和及时调整,使教学活动在强化和及时调整,使教学活动在不断地监控中得到及时完善,顺不断地监控中得到及时完善,顺利达到预期目标。利达到预期目标。n强调改进强调改进n总结性评估是在教
23、学过程总结性评估是在教学过程某一阶段终结时,对其总某一阶段终结时,对其总体状态和阶段效果进行地体状态和阶段效果进行地评估评估n主要作用是进行阶段性总主要作用是进行阶段性总结结n强调结果,为强调结果,为今后改进今后改进提提供依据供依据又称目标导向评价模式或泰勒模式又称目标导向评价模式或泰勒模式主要内容是以目标为中心对活动结果进行评主要内容是以目标为中心对活动结果进行评价,判断目标达到的程度价,判断目标达到的程度不足:不足:“目标目标”的合理性如何判断?的合理性如何判断?非预期的教学目标要不要评非预期的教学目标要不要评价?如何评价?教学是否有价?如何评价?教学是否有统一目标?统一目标?美国学者斯塔
24、弗尔比姆美国学者斯塔弗尔比姆Stufflebeam于于1966年提出年提出主要步骤:主要步骤:4个个特点:以决策为导向,重视评价的改进功能,特点:以决策为导向,重视评价的改进功能,同时将诊断性评价、形成性评价、终结性评价同时将诊断性评价、形成性评价、终结性评价完整地结合在一起完整地结合在一起优点:既重视结果,又重视过程优点:既重视结果,又重视过程不足:评价过多,技术要求高,操作难度大不足:评价过多,技术要求高,操作难度大背景评价背景评价Context输入评价输入评价 Imput过程评价过程评价Process成果评价成果评价Productn无正式定义,无完整评价步骤,只是一种评价指无正式定义,无
25、完整评价步骤,只是一种评价指导思想和原则导思想和原则n主要观点:在教育活动过程中,不仅要关注预期主要观点:在教育活动过程中,不仅要关注预期教育效果,也要关注非预期效应,而且应对其作教育效果,也要关注非预期效应,而且应对其作出价值判断出价值判断n评价重点:实际教育活动的全部效应评价重点:实际教育活动的全部效应n特点:突破了目标的限制,可开阔评价者的视野,特点:突破了目标的限制,可开阔评价者的视野,具有一定实际作用具有一定实际作用n目的:降低方案、计划制定者主观意图对评价活目的:降低方案、计划制定者主观意图对评价活动的影响动的影响n采取准法律过程采取准法律过程评委会评委会审议形式,对方案正、反两方审议形式,对方案正、反两方面长短、得失进行评价面长短、得失进行评价n特点:特点:重视争议性意见,尤其是反重视争议性意见,尤其是反对意见;对意见;较充分反映各类人员较充分反映各类人员“多元多元的的”价值认识价值认识