1、第八章第八章 测验常模测验常模内容内容l常用导出分数l常模编制第一节第一节 导出分数导出分数 l描述测验的结果通常用分数(score)来表示。在教育和心理学的测量领域里非常重视和谨慎对分数意义的解释,因为在多数埸合中,测验的原始分数只是一个数字符号,只有把分数与某些类型组或某些标准联系起来才能明白它的意义,如某学生期末考试数学得了88分,我们不能判断这个学生的成绩是好还是坏。再比如在某次心理测验中,某学生的分数是7分,如何评价分数的高低?若在全班同学中高于7分的只有3人,那么我们可以认为该学生的分数不低。反之如果低于7分的同学只有3人,该同学的分数属于低的了。l为了使原始分数有意义,同时也为了
2、使不同的原始分数可以进行比较,就必须把它们转换成具有一定的参照点或单位的测验量表上的数值(导出分数)。l1.导出分数导出分数:是在原始分数转换的基础上,按照一定的规则,经过统计处理后获得的具有一定参考点和单位,且可以相互比较的分数。l2.常用导出分数常用导出分数l(1)百分等级:应用最广的导出分数。原始分数的百分等级是指在一个群体的测验分数中,得分低于这个分数的人数的百分比。如某数学测验最高分92分,其百分等级为100,最低分为40分,其百分等级为0,某学生测验分数为54分,他处于第10个百分等级,即只有10%的学生的测验分数低于54分,记为P10=54。注意注意:它与考试的题数、难度均无关系
3、,只是用0100之间的数值来表示考生的能力等级。u计算公式:R为排名顺序号,N为被试总人数。例1:某被试在一次由50人参加的成绩测验中得80分,排名第9,计算该生成绩的百分等级。结论:该生成绩的百分等级为83,即比他成绩低的学生占全体学生的83%。NRPR50100100835050910010050100100NRPR百分位数的计算方法百分位数的计算方法pppfinpnLP)(1Pp表示百分位数p表示与百分位相对应的比数n表示总频数Lp表示百分位数所在组的下限n1表示小于百分位数所在组下限的频数总和fp表示百分位数所在组的频数i表示组距下面为48名学生数学分数的频数分布表,请计算第30百分位
4、数P30分数 频数 累积频数45-1 150-2 355-0 360-2 565-3 870-8 1675-7 2380-7 3085-7 3790-5 4295-6 48总和 48P30已知:P=30/100=0.3;n=48;L30=70;n1=8;f30=8;i=57485)8483.0(70)3.0(3013030finnLP图8-1 正态分布与百分等级的关系u评价:评价:l优势:简单易懂,应用广泛,不受原始分数分布的影响。在评价测验结果时,我们不仅要知道学生的原始分,更想知道这个原始分在团体中所处的相对位置。l劣势:只具有顺序性,不具有可加性,测量单位不相等(百分位数的单位是典型的不
5、相等的。靠近中央的分数转换成百分等级时差异被夸大了,而处在两端的,差异却被缩小了)。l(2)标准分数:标准分数:是一种具有相等单位的量数,又称Z分数。z分表示在分数分布中距离平均分有多少个标准差单位的相对位置。u计算公式:SXXZu评价:评价:优势:具有可比性、可加性,具有相等的单位,不受原始分单位的影响,但保留了原始分间的线性关系。劣势:使用前提是Z分数与原始分数的分布相同或相近。若两个分布的偏斜方向不同(正态、偏态),就要把原始分数转换成百分等级,通过查表,找到百分等级相对应的正态分布曲线的面积,求出Z值。图8-2 负偏态分布正态化图u标准分数的变式标准分数的变式T=10Z+50(T分数,
6、避免了z负分数的现象)IQ=15Z+100(韦氏智力测验)CEEB=100Z+500(美国大学入学考试标准分数)百分等级T分数百分等级T分数126.745551.26533.556052.531037.186553.851539.647055.242041.587556.742543.268058.423044.768560.363546.159062.824047.479566.454548.749973.265050.0099.980表8-1 正态分布下的百分等级与T分数的关系补充:标准分数在我国高考中的试点应用l美国、菲律宾、智利等国均在高校招生考试(大学入学考试)中使用标准分数,我国是
7、从20世纪80年代中期才在个别省的高考中引进标准分数,进行试点。l1985年率先在广东等省开展标准化考试的试点研究;l1989年标准化考试在全国推行(命题标准化、考务标准化、试卷评阅标准化、分数的解释和使用标准化);l1998年提出力争全国30个省正式使用标准分数制度,但至今仍未在全国普遍推广。再加上近几年高考科目改革呈多样化,目前在全国招生中,还存在着两种分数制度。l高考中使用原始分数的局限性u原始分数不能反映考试分数相对于团体的位置信息;u不同科目考试分数之间分数可比性较差;u各科标准差不同影响对科目权重的设计:各科分数的标准差大小,对各个科目分数在录取中的比重也有一定的影响。标准差大的科
8、目在录取中的比重就大(若各科的平均数相同)l(3)标准九分数:将原始分数分成9个部分的标准分数系统。图8-3 九段分数在正态曲线下的概率图8-4 标准九分与正态曲线面积的关系与平均数的关系图8-5 几种导出分数间的对应关系第二节第二节 常模常模l1.常模与常模团体常模与常模团体u常模常模:根据标准化样本的测验分数经过统计处理而建立起来的具有参照点和单位的测验量表(某年级、某年龄或具有某种共同特征的被试团体在某测验上实际达到的平均水平)。u常模团体常模团体(norm group):是由具有某种共同特征的人所组成的一个群体,或是该群体的一个样本;从测验目的所涉及到的被试总体中,按统计抽样方法获得的
9、被试样本团体。u根据评价参照系的不同,将测验分为两大类:(1)常模参照测验常模参照测验(norm-reference test)(2)标准参照测验标准参照测验(criterion-referenced test)u常模参照测验的评价参照系是一组人的平均水平。这组人通常是测验的被试总体的一个具有代表性的样本。这一类测验关注的问题是“他在哪儿”,关注被试的分数在这组人中的相对位置、或相对等级,通常用于对被试的排队排队和择优择优。常模参照性评价通过将某一被试与一组样本相比较后对其水平做出评价,这是一种相对评价。例如智力测验、高等学校入学考试等属于典型的常模参照性测验。u常模类型:全国常模、区域常模、
10、特殊群体常模、年龄常模、年级常模,百分等级常模和标准分常模等。u为了选择一个能较好地代表总体的样本,制定常模团体的注意事项:要充分考虑所选取被试的条件:年龄、性别、地区差别、社会经济地位差别等等诸多条件以及适当比例常模团体必须是所测群体的一个代表性样本样本大小要适当,要保证充分大的样本容量常模团体必须是近时的,要有时间性详细介绍取样过程注意一般常模与特殊常模的结合l2.主要常模参照分数主要常模参照分数(1)心理年龄(心理年龄(年龄尺度):首先将测试项目分成各年龄组,实施测验后将常模团体中每个年龄组的平均原始分数作为该年龄的常模。适合于体重、身高、智力等生理和心理特征变化明显婴儿到青少年时期。进
11、入到青春期和成年期后,年龄常模就没有太大的意义了。最初比奈量表就是用年龄量表。(2)年级当量:在教育测验中,分数的解释通常以某一年级的学生的平均分作为年级水平。平均分(原始分)年级(水平)193.2*274.2355.2436.2表8-2 斯坦福成绩中级I的段落理解测验 注:3.2指3年级的第二个月(引自桑代克&哈根,p126)例如:某学生的分数是35分,相当于5.2年级水平。这个分数可解释为“成绩相当于在5年级学习了2个月的一般学生的成绩”,若学生的分数是38分,可用插值公式算出。问题点问题点:3.2级到4.2级的能力增长不一定相当于6.2级到7.2级的能力增长。(3)发展顺序量表:格塞尔发
12、展顺序量表)发展顺序量表:格塞尔发展顺序量表l格塞尔认为,婴幼儿的行为系统的建立是一个有次序的过程,反映了神经系统的不断成长和功能的分化,因而可以把每个成熟阶段的行为模式作为智能诊断的依据。(4)商数:智力商数:智力年龄与实际年龄的比率教育商数:教育年龄与实际年龄的比率成就商数 教育年龄与智力年龄的比率100CAEAEQIQMACA100100100IQEQMAEAAQl3.呈现常模资料的方法呈现常模资料的方法(1)转化表:是一种最简单、最基本且最常用的呈现常模资料的方法,也称常模表。(2)剖析图:把一套测验中几个分测验分数用图表(图形)形式表示出来,可以很直观地看出被试在各个分测验中的表现及
13、其相对应的位置。原始分数百分等级标准分数329970319666308962297859286755275452264248253144242141231339226342113020126表8-3 ACT的百分等级与标准分数图8-6 韦氏儿童智力量表剖析图l常模参照测验的局限性(1)强调名次;(2)不适合诊断学生的学习困难或评价教师、教材的优缺点;(3)常模团体的不同影响对分数的解释。u常模团体在测验中的统计量:如平均、中数、标准差等,是用来比较测验分数的,是解释分数的基础。常模须有安定性,并有时间性(如使用几年前的常模不一定妥当)。u常模不同于普通意义上的“标准”。通常“标准”是指希望达到的目标,而常模是代表某一被试团体实际成绩。补充:补充:l根据评价参照系的不同,将测验分为两大类:1.常模参照测验(norm-reference test),2.标准参照测验(criterion-referenced test)。