1、对外汉语教学的测试和评估对外汉语教学的测试和评估 课后思考题课后思考题 一、相关概念一、相关概念 水平测试水平测试 成绩测试成绩测试 诊断测试诊断测试 潜能测试潜能测试 效度效度 信度信度 区分度区分度二、思考题二、思考题1 1、简述标准化试题与非标准化试题。、简述标准化试题与非标准化试题。2 2、简述主观性试题和客观性试题。、简述主观性试题和客观性试题。3 3、分立式试题和综合性试题。、分立式试题和综合性试题。对外汉语教学的测试和评估对外汉语教学的测试和评估 一、测试的类别一、测试的类别(一)水平测试:测量测试对象的第二语言水平。(一)水平测试:测量测试对象的第二语言水平。proficien
2、cy test 的结果也可以作为新生入学编班的依据。的结果也可以作为新生入学编班的依据。(二)成绩测试(二)成绩测试:课程或课型的测试,也称课程测试。课程或课型的测试,也称课程测试。achievement test(三)诊断测试:就某一具体内容的测试,目的是诊断测试:就某一具体内容的测试,目的是了解教与学中存在的问题了解教与学中存在的问题diagnostic test(四)潜能测试:检查测试对象学习第二语言的潜(四)潜能测试:检查测试对象学习第二语言的潜在能力,也称素质测试。在能力,也称素质测试。aptitude test 二、二、试卷设计试卷设计(一)(一)卷面构成卷面构成:一次考试中的一种
3、试卷叫一个卷面一次考试中的一种试卷叫一个卷面。卷面的种类有卷面的种类有:单项卷面、双项卷面、多项卷面:单项卷面、双项卷面、多项卷面(二)(二)题类题类 是试题总体性质的类别是试题总体性质的类别。1 1、标准化试题和非标准化试题、标准化试题和非标准化试题 2 2、主观性试题和客观性试题、主观性试题和客观性试题 3 3、分立式试题和综合性试题、分立式试题和综合性试题 命题过程及试题的可命题过程及试题的可靠性程度靠性程度阅卷评分阅卷评分试题试题 包含的测试内包含的测试内容的特点容的特点(三)(三)题型题型(一)(一)卷面构成卷面构成 卷面的种类卷面的种类:单项、双项、多项卷面:单项、双项、多项卷面
4、只测验一个项目的叫单项卷面,测验两个项目的只测验一个项目的叫单项卷面,测验两个项目的叫双项卷面,测验三个或四个项目的叫多项卷叫双项卷面,测验三个或四个项目的叫多项卷面面 单项四种:听力、说话单项四种:听力、说话(口语口语)、阅读、写作、阅读、写作(写话写话);双项六种:听和说、听和读、听和写、读和说、说双项六种:听和说、听和读、听和写、读和说、说和写、读和写;和写、读和写;多项四种:听读说、读写说、听读写、听读说写。多项四种:听读说、读写说、听读写、听读说写。(二)(二)题类题类(1)标准化试题和非标准化试题。这是从命题过程和试题的可靠性程度的角度划分出来的类。标准化试题是经过反复试测和筛选确
5、定下来的试题具有较高的可靠性和相对稳定性 非标准化试题一般是任课教师自己准备的试题,没有经过反复试测和筛选。(2)主观性试题和客观性试题这是从阅卷评分的角度划分出来的类。评分时需要阅卷人做出主观判断的叫主观性试题;有固定的客观评分标准、不需要阅卷人做出主观判断的叫客观性试题 例如,说话,写作(写话)等方面的试题部属于主观性试题,多项选择题属于客现性试题,这两类试题都有各自的优点和缺点。(3)分立式试题和综合性试题。这是根据试题所包含的测试内容的特点划分出来的类。对有关的语言点分别进行测验的试题叫分立式试题,对有关的言语技能和相应的言语交际技能进行综合测验的试题叫综合性试题。例如,填空、改错,多
6、项选择等题型都属于分立式试题,听力理解,说话,阅读理解以及写作(写话)等方面的试题都属于综合性试题。有些综合性试题中往往要包含分立式试题。例如,听力理解和阅读理解方面的试题往往要通过填空,多项选择等方式来完成,常用的综合性试题的题型 听力理解测试试题的常用题型听力理解测试试题的常用题型:(1)听后选择正确答案(双项、三项或多项选择)(2)听后填空 (3)听后填表常用的综合性试题的题型 阅读理解测试试题的常用题型阅读理解测试试题的常用题型:(1)读后选择正确答案(双项、三项或多项选择)(2)读后填空 (3)读后填表常用的综合性试题的题型 说话说话(口语口语)测试试题的常用题型测试试题的常用题型:
7、(1)回答问题 (2)看图说话或回答问题 (3)根据指定的题目自由表达 常用的综合性试题的题型 写作写作(写话写话)测试试题的常用题型测试试题的常用题型:(1)连句成段(把所给的几句话连成一段话并加标点符号,或用序号排定几句话的顺序)(2)看图回答问题,或写话,或作文 (3)写应用文或填表 (4)命题作文 由于各项言语技能之间有一定的连带关系,也可以出同时测试双项或多项技能的试题。常用的双项或多项技能测试试题的题型有:(1)听写(同时测验听和写的能力)(2)听后回答问题(口头回答 同时测验听和说的能力;笔头回答同时测验听和写的能力)(3)听后口头复述(同时测验听和说的能力)(4)听后写大意(同
8、时测验听和写的能力)(5)听课记笔记(测验边听边记的能力)(6)读后回答问题(口头回答一同时测验读和说的能力:笔头回答同时测验读和写的能力)(7)读后口头复述(同时测验读和说的能力)(8)读后写大意(同时测验读和写的能力)双项或多项技能试题的主要缺点是不容易判断某一项技能的成绩或水平是否受到其他技能的影响,因此难以难以做到测量的精密化精密化,也难以实现标准化标准化。大规模的正式测试不大规模的正式测试不宜采用这类试题。宜采用这类试题。常用的分立式试题的题型:语音测试试题的常用题型;语音测试试题的常用题型;1听写音节听写音节 2听时填声母韵母听时填声母韵母 3听时标调号听时标调号 4听时时标句重音
9、和语调听时时标句重音和语调 5朗读音节、词组,注意声、韵、调朗读音节、词组,注意声、韵、调 6朗读句子、短文,注意句重音和语调朗读句子、短文,注意句重音和语调 以上以上1 4是辨别音调能力的测验,是辨别音调能力的测验,5 6是语音表达能力的测验。是语音表达能力的测验。常用的分立式试题的题型 汉字测试试题的常用题型:汉字测试试题的常用题型:1给汉字注音给汉字注音 2在在组词、词组或句子中标出同音字组词、词组或句子中标出同音字 3在包含形同音异的一组词、词组或句子中给同形字注音在包含形同音异的一组词、词组或句子中给同形字注音 4在一组字,词,词组或句于中标出相同的偏旁、部首在一组字,词,词组或句于
10、中标出相同的偏旁、部首 5在所给的汉字中选择唯一恰当的填空在所给的汉字中选择唯一恰当的填空(双项、三项或多项选双项、三项或多项选择择)6改正错别字改正错别字 7根据拼音写汉字根据拼音写汉字 8听写汉字、词、词组、句子、短文听写汉字、词、词组、句子、短文 9用汉字填空用汉字填空(用汉字完成词、词组,句子、短文用汉字完成词、词组,句子、短文)以上以上15是认字能力的测验,是认字能力的测验,6是认字和写字能力的测是认字和写字能力的测验,验,79是写字能力的测验。是写字能力的测验。常用的分立式试题的题型 词汇测试试题的常用题型:1给学过的词注音 2选择适当的近义词填空 3选词填空(双项、三项或多项选择
11、检验词形和词义识别)4用汉语解释词义(口头或笔头)常用的分立式试题的题型 语法测试试题的常用题型:语法测试试题的常用题型:1改正错句 2把指定的词语放在可供选择的位置上(双项、三项或多项选择)3从所给的词语中选择适当的词语填空(双项、三项或多项选择)4综合填空三、试卷质量的衡量标准三、试卷质量的衡量标准1、效度:、效度:也叫有效性,是指是否达到测试目的。也叫有效性,是指是否达到测试目的。保证高效度应注意保证高效度应注意:试题内容的覆盖面要全;试题试题内容的覆盖面要全;试题量与测试时间要协调;避免试题间相互暗示答案。量与测试时间要协调;避免试题间相互暗示答案。保证高信度应注意保证高信度应注意:题
12、量要适中,题量越少,偶然:题量要适中,题量越少,偶然性越大,信度越低;性越大,信度越低;主观性试题信度较低,客观性试题信度较高。主观性试题信度较低,客观性试题信度较高。保证高区分度应注意保证高区分度应注意:试题的难度要保证一定的比:试题的难度要保证一定的比例和跨度。例和跨度。2、信度:、信度:指测试结果的可靠程度和稳定性。指测试结果的可靠程度和稳定性。3、区分度:、区分度:指测试区分受试者水平差异的性能。指测试区分受试者水平差异的性能。(1)效度(validity)保证卷面效度的关键是卷面的测试项目和测试内保证卷面效度的关键是卷面的测试项目和测试内容要与测试目的相一致。也就是说,该测的一定容要
13、与测试目的相一致。也就是说,该测的一定要测到,不该测的不要涉及。要测到,不该测的不要涉及。例如,如果要全面测量阅读理解能力,就必须设例如,如果要全面测量阅读理解能力,就必须设计含有有关的汉字、词汇、语法、文化、语用等计含有有关的汉字、词汇、语法、文化、语用等方面的知识的综合性阅读试题,而不应当设计只方面的知识的综合性阅读试题,而不应当设计只含有某一两个方面的知识的分立式试题。含有某一两个方面的知识的分立式试题。阅读理解必须有定的速度,因此卷面的长度必须与测试的时间相一致,如果卷面太短,就测不出阅读速度。这就是该测的一定要测到。又如,测量阅读理解能力只能设计测量阅读能力的单项卷面,如果试卷上既有
14、阅读方面的试题,又有写作方面的试题,就不能精确地测量出阅读理解能力。阅读理解既需要一定的语言知识,又需要一定的文化知识,如果文化知识太专,超过了多数测试对象的知识范围,也达不到测试目的,因为难以判断是语言能力方面的问题,还是文化能力方面的问题。这就是不该测的不要涉及。(2)信度(reliability)。信度也叫可靠性,是指同一个卷面和难易程度相同的试题用于水平基本相同的测试对象,测试结果是否基本相同。讲求信度的目的是保证试卷的稳定性,这对不同类型的测试有不同的意义。对水平测试来说,试卷的稳定性可以保证达到同一分数线的测试对象具有基本相同的水平;对成绩测试来说,试卷的稳定性除了可以保证达到同一
15、分数线的测试对象具有基本相同的水平以外,还可以反映教学的变化情况,如果这一届学生的成绩比上一届普遍提高了,就说明教学质量提高了;如果这届学生的成绩比上一届普遍降低了,就说明教学质量降低了。卷面信度是由多方面的因素决定的:一是卷面构成,对卷面构成的基本要求是测试项目安排合理,测试内容有一定的覆盖面和代表性。二是题数。难易程度相当的同类题型的题效越多,信度也越高。三是评分标准和评分办法。评分标准越客观,评分办法越科学,信度越高。与此有关的是题型。一般说来,主观性试题的信度较低,客观性试题的信度较高。(3)区分度。这是指试卷能不能客现地反映测试对象的水平差异。水平测试的目的是测量测试对象的语言水平,
16、要用同个卷面去测试水平相差悬殊的测试对象,所以试卷必须有相应的区分度。成绩测试最好也有一定的区分度。形成区分度的关键是卷面试题的难易程度有一定的跨度,卷面长度适度,卷面试题的排列由易到难逐渐过渡。如果难易程度跨度太小,就难以区分不同的水平;如果卷面太短或太长,应试者就难以得到充分发挥,水平较高者尤其难以得到充分发挥;如果不是由易到难逐渐过渡,应试者就不能正常发挥,水平较低者更不能正常发挥。中国汉语水平考试(HSK)介绍 中国汉语水平考试(HSK)是为测试母语非汉语者(包括外国人、华侨和中国少数民族考生)的汉语水平而设立的国家级标准化考试。中国汉语水平考试(HSK)由北京语言大学汉语水平考试中心
17、设计研制,包括基础汉语水平考试简写为HSK(基础),初、中等汉语水平考试简写为HSK(初、中等)和高等汉语水平考试简写为HSK(高等)。中国汉语水平考试(HSK)每年定期在中国国内和海外举办,凡考试成绩达到规定标准者,可获得相应等级的汉语水平证书。1.HSK的适用对象的适用对象 HSK(基础)适用于具有基础汉语水平的汉语学习者,也就是接受过100-800学时现代汉语正规教育的学习者(包括具有同等学历者)。HSK(初、中等)适用于具有初等和中等汉语水平的汉语学习者,也就是接受过400-2000学时现代汉语正规教育的学习者(包括具有同等学历者)。HSK(高等)适用于具有高等汉语水平的汉语学习者,也
18、就是接受过3000学时和3000学时以上的现代汉语正规教育的学习者(包括具有同等学历者)。2.汉语水平证书汉语水平证书的效力的效力(1)作为达到进中国高等院校入系学习专业或报考研究生所要求的实际汉语水平的证明。(2)作为汉语水平达到某种等级或免修相应级别汉语课程的证明。(3)作为聘用机构录用人员时评价其汉语水平的依据。3.主办单位和发证机关主办单位和发证机关 HSK的主办单位是国家汉语水平考试委员会,具体事务由国家汉语水平考试委员会办公室和北京语言大学汉语水平考试中心负责。4.考试时间和考点考试时间和考点 中国大陆地区,每年固定举办HSK考试。港澳台地区,以及国外考点,根据当地具体情况安排考试
19、。汉语水平考试每年定期在中国国内和海外同步举办。从2019年起,新HSK将会全面取代HSK。新HSK分笔试和口试两部分,笔试和口试是相互独立的。笔试共6级,新HSK一、二、三级为汉语入门测试,四级将与原HSK(基础)相对应,新HSK的五级将与原HSK(初中等)相对应,六级将与原HSK(高等)相对应。口试则采用录音形式,分为初级、中级和高级三个级别。凡考试成绩达到规定标准者,可获得相应等级的汉语水平考试成绩报告,亦有机会获得中国国家留学基金管理委员会颁发的“HSK优胜者奖学金”。通过HSK一级的考生可以理解并使用一些非常简单的汉语词语和句子,满足具体的交际需求,具备进一步学习汉语的能力。通过HS
20、K二级的考生可以用汉语就熟悉的日常话题进行简单而直接的交流,达到初级汉语优等水平。通过HSK三级的考生可以用汉语完成生活、学习、工作等方面的基本交际任务,在中国旅游时,可应对遇到的大部分交际任务。通过HSK四级的考生可以用汉语就较广泛领域的话题进行谈论,比较流利地与汉语为母语者进行交流。通过HSK五级的考生可以阅读汉语报刊杂志,欣赏汉语影视节目,用汉语进行较为完整的演讲。通过HSK六级的考生可以轻松地理解听到或读到的汉语信息,以口头或书面的形式用汉语流利地表达自己的见解。考试用途考试用途 新 HSK 延续原有HSK 一般(或通用)汉语能力考试的定位,面向成人汉语学习者。其成绩可以满足多元需求:1为院校招生、分班授课、课程免修、学分授予提供参考依据。2为用人机构录用、培训、晋升工作人员提供参考依据。3为汉语学习者了解、提高自己的汉语应用能力提供参考依据。4为相关汉语教学单位、培训机构评价教学或培训成效提供参考依据。Thank you