1、第二章第二章 体育测量与评价的基础理论体育测量与评价的基础理论第一节第一节 体育测量的基础理论体育测量的基础理论 体育测量是体育教学、运动训练和体育科研的体育测量是体育教学、运动训练和体育科研的重要基础。只有实施科学的测量,才能获得准确而重要基础。只有实施科学的测量,才能获得准确而可靠的数据,并通过分析和研究,得出科学的结论。可靠的数据,并通过分析和研究,得出科学的结论。为了收集准确的资料,获得可靠的信息,达到为了收集准确的资料,获得可靠的信息,达到测量的目的,必须在体育测量的理论指导下实施测测量的目的,必须在体育测量的理论指导下实施测量。量。一、体育测量的基本概念一、体育测量的基本概念(一)
2、测量(一)测量测量(史蒂文斯):测量(史蒂文斯):是是根据法则给事物赋予数量。即根据法则给事物赋予数量。即用一定的法则给事物属性指派数字或符号的过程。用一定的法则给事物属性指派数字或符号的过程。体育测量:体育测量:是指依照一定的法则,对体育领域中事物是指依照一定的法则,对体育领域中事物的属性或特征赋予数量的过程。包括物理量测量和的属性或特征赋予数量的过程。包括物理量测量和非物理量测量。(内容和形式多样)非物理量测量。(内容和形式多样)A:A:物理量测量:物理量测量:身高、体重、跳高高度、跳远远身高、体重、跳高高度、跳远远度、血压等;度、血压等;B:B:非物理量测量:非物理量测量:有氧工作能力、
3、技战术水平、有氧工作能力、技战术水平、疲劳程度、心理素质、身体素质等。疲劳程度、心理素质、身体素质等。测验:测验:为了某种测量目的所进行的一系列测量构成的为了某种测量目的所进行的一系列测量构成的系统。系统。(二)测量的要素(二)测量的要素测量的要素:测量的要素:待测属性或特征、法则和数字符号。待测属性或特征、法则和数字符号。A.A.待测属性或特征:待测属性或特征:由于测量的目的就是反映事由于测量的目的就是反映事物的属性或特征,它是测量的第一要素。举例:物的属性或特征,它是测量的第一要素。举例:100100米、立定跳远、灵敏性、心理素质、技战术水平、米、立定跳远、灵敏性、心理素质、技战术水平、意
4、志品质等。意志品质等。B.B.法则:法则:能有效衡量事物属性的规则和尺度,或是能有效衡量事物属性的规则和尺度,或是能显示事物属性的程序。能显示事物属性的程序。举例:身高的测量、心理素质的测量举例:身高的测量、心理素质的测量 心理素质的测量(包含认识能力、情绪和情感品质、心理素质的测量(包含认识能力、情绪和情感品质、意志品质、气质和性格等。意志品质、气质和性格等。如测量智力量表:比如测量智力量表:比奈西蒙智力量表,韦克斯勒成人智力量表,瑞文奈西蒙智力量表,韦克斯勒成人智力量表,瑞文智力量表等)。智力量表等)。C.C.数字符号:数字符号:数字的含义与测量内容相关。数字的含义与测量内容相关。(三)测
5、量量表(三)测量量表测量量表:测量量表:是指测量所获得数据属性的表述规则是指测量所获得数据属性的表述规则(反映表示测量结果的数字符号的性质和类型)。(反映表示测量结果的数字符号的性质和类型)。这种规则由实数列的诸特性所决定的,这些特性这种规则由实数列的诸特性所决定的,这些特性包括:包括:A.A.顺序:顺序:两个或两个以上的实数有次序之分、两个或两个以上的实数有次序之分、大小之分;大小之分;B.B.距离:距离:两个实数之间的差距可以描述;两个实数之间的差距可以描述;C.C.原点:原点:对应于零位数的那一点(绝对零点和对应于零位数的那一点(绝对零点和相对零点)。相对零点)。测量量表的分类测量量表的
6、分类1 1、名称量表、名称量表 不含实数列的任一特性,即无顺序、无距离、不含实数列的任一特性,即无顺序、无距离、无原点。是各种测量尺度中含信息量最少、最低级无原点。是各种测量尺度中含信息量最少、最低级的一种测量尺度的一种测量尺度。(如运动员的号码)。(如运动员的号码)2 2、有序量表、有序量表 有序量表含有实数列的顺序特性,但无距离、有序量表含有实数列的顺序特性,但无距离、无原点。其信息量比名称量表要丰富,属于低等级无原点。其信息量比名称量表要丰富,属于低等级的测量尺度。的测量尺度。(比赛名次)(比赛名次)3 3、等距量表、等距量表 等距量表含有实数列的顺序、距离特性,但等距量表含有实数列的顺
7、序、距离特性,但无原点。等距量表又较有序量表含信息量多,属无原点。等距量表又较有序量表含信息量多,属高等级的测量尺度。(高等级的测量尺度。(角度、高度角度、高度)4 4、比例量表、比例量表 比例量表具有实数列顺序、距离、原点的全比例量表具有实数列顺序、距离、原点的全部特性。其含信息量最多,属于最高级量表。部特性。其含信息量最多,属于最高级量表。(运动水平、进步率、进步度运动水平、进步率、进步度)四种测量尺度的特征、功能和适用的统计分析方法四种测量尺度的特征、功能和适用的统计分析方法表:表:特点特点基本功能基本功能数字特征数字特征适用的统计方法适用的统计方法名称量表名称量表分类、标记分类、标记百
8、分比,卡方检验,列联相关系数百分比,卡方检验,列联相关系数有序量表有序量表顺序顺序可按照次序可按照次序排列排列中位数,百分位数,等级相关,非中位数,百分位数,等级相关,非参数检验参数检验等距量表等距量表距离距离差距的确定差距的确定与比较与比较算术平均数,标准差,积差相关,算术平均数,标准差,积差相关,参数检验参数检验比例量表比例量表原点原点比值的确定比值的确定与比较与比较几何均数几何均数(五)测量的类型:不同的分类标准(五)测量的类型:不同的分类标准A.A.按测量方法分类:直接测量和间接测量。按测量方法分类:直接测量和间接测量。B.B.按测量属性分类:物理量测量和非物理量测量。按测量属性分类:
9、物理量测量和非物理量测量。C.C.按测量的组织形式分类:连续性测量和横断面测按测量的组织形式分类:连续性测量和横断面测量。量。(六)体育测验的类型(六)体育测验的类型1、按测试者人数分类、按测试者人数分类(1)单个测试者的测验:以一个测试者的测量值)单个测试者的测验:以一个测试者的测量值作为受试者的测验值。如身高、体重等测验。作为受试者的测验值。如身高、体重等测验。(2)多个测试者的测验:多个测试者同时对某个)多个测试者的测验:多个测试者同时对某个受试者进行测量,以多个测试者测量结果的综合受试者进行测量,以多个测试者测量结果的综合值作为受试者的测验值值作为受试者的测验值。2、按重复测量次数分类
10、、按重复测量次数分类在体育测量中,测量次数的确定和测量结果取值方式在体育测量中,测量次数的确定和测量结果取值方式有以下几种情况:有以下几种情况:(1)测一次)测一次受试者需要承受极限生理负荷完成的测验。如受试者需要承受极限生理负荷完成的测验。如一般耐一般耐力测验力测验,一般只测一次。,一般只测一次。对于瞬时性、损伤性和操作难度大的测验对于瞬时性、损伤性和操作难度大的测验,如运动,如运动后即刻脉搏、血压、血乳酸、肌肉活检及其它生理后即刻脉搏、血压、血乳酸、肌肉活检及其它生理生化指标的测验。一般只测一次。生化指标的测验。一般只测一次。对于测量误差很小,可靠性较高的测验对于测量误差很小,可靠性较高的
11、测验,如形态测,如形态测量中的身高、体重等,一般只测一次。量中的身高、体重等,一般只测一次。(2)可以测)可以测2-3次或多次。次或多次。持续时间短的大强度非极限负荷的最大能力持续时间短的大强度非极限负荷的最大能力测验,如立定跳远、投掷和灵敏性等测验。测验,如立定跳远、投掷和灵敏性等测验。(3)重复次数较多的测验)重复次数较多的测验 对于负荷小,但测量结果波动大,敏感和易对于负荷小,但测量结果波动大,敏感和易受干扰的测量验,如反应时或感知觉测验,为减受干扰的测量验,如反应时或感知觉测验,为减少随机误差,重复测量的最佳次数为少随机误差,重复测量的最佳次数为30次。观测次。观测值可取测验的平均值或
12、总和,如果除去测验中的值可取测验的平均值或总和,如果除去测验中的最高和最低的成绩,取其余测验成绩的平均值作最高和最低的成绩,取其余测验成绩的平均值作为观测值则更好。为观测值则更好。(七)测量误差(七)测量误差定义:定义:是指与测量目的无关的变因产生效应,所引是指与测量目的无关的变因产生效应,所引起的观测值与真值之间的差异。起的观测值与真值之间的差异。误差的分类:误差的分类:1.1.随机误差随机误差 2.2.系统误差系统误差 3.3.过失误差过失误差 4.4.抽样误差抽样误差1 1 随机误差随机误差随机误差又称为随机误差又称为偶然误差偶然误差,指在测量中由一些主观,指在测量中由一些主观或客观或客
13、观偶然因素偶然因素引起,又不易控制的测量误差。引起,又不易控制的测量误差。随机误差随着测量次数的增加,其变化会呈现一定随机误差随着测量次数的增加,其变化会呈现一定规律性。它总是围绕被测量的真值波动规律性。它总是围绕被测量的真值波动(真值以真值以重复测试的均值为代表)。重复测试的均值为代表)。推论:除标准化测试外,推论:除标准化测试外,增加测量次数也是减少随增加测量次数也是减少随机误差的有效办法。机误差的有效办法。2 2 系统误差系统误差系统误差,是指在测量中,由于系统误差,是指在测量中,由于仪器未校正仪器未校正至测试要至测试要求,或对测量条件掌握过宽或过严,而使测量结求,或对测量条件掌握过宽或
14、过严,而使测量结果出现规律性的偏大或偏小。后果:使数据统计果出现规律性的偏大或偏小。后果:使数据统计结果偏离方向。结果偏离方向。消除办法:严格执行标准化测量,随时检查,及时发消除办法:严格执行标准化测量,随时检查,及时发现并纠正错误。现并纠正错误。另外,通过增加测量次数,也可以将由于测量方法掌另外,通过增加测量次数,也可以将由于测量方法掌握过宽或过严而产生的系统误差转化为随机误差,握过宽或过严而产生的系统误差转化为随机误差,使其降低到最低程度。使其降低到最低程度。3 3 过失误差过失误差过失误差,指在测量中由于过失误差,指在测量中由于测试者过失测试者过失所造成的误所造成的误差,如测错、读错、记
15、错。差,如测错、读错、记错。这类误差只要认真负责,这类误差只要认真负责,加强测试者的责任心,并加强测试者的责任心,并加强测试现场的监督检查加强测试现场的监督检查,严格管理并执行验收,严格管理并执行验收制度。制度。在最后资料整理过程中再进一步检查、鉴别、舍弃,在最后资料整理过程中再进一步检查、鉴别、舍弃,就会避免或减少由于过失误差而得出错误统计结就会避免或减少由于过失误差而得出错误统计结论。论。4 4 抽样误差抽样误差抽样误差是由于抽样误差是由于抽样的原因抽样的原因而引起样本统计量与总而引起样本统计量与总体参数之间的差异。体参数之间的差异。测量中虽严格遵守抽样原则,但不论用何种方法抽测量中虽严格
16、遵守抽样原则,但不论用何种方法抽样,从总体中抽取样本进行研究,样本统计量与样,从总体中抽取样本进行研究,样本统计量与总体参数都不会完全一致,这是因为个体之间差总体参数都不会完全一致,这是因为个体之间差异是客观存在的,异是客观存在的,即使采取随机抽样仍然无法避即使采取随机抽样仍然无法避免样本统计量与总体参数之间的差异。免样本统计量与总体参数之间的差异。经典测量理论的基本假设:经典测量理论的基本假设:真值的含义:真值的含义:“实测值实测值”(简称(简称X X):测量对象的某种测量内容):测量对象的某种测量内容(或特征)经测量后表现为一个数值。也称(或特征)经测量后表现为一个数值。也称“观测观测值值
17、”、“观测数观测数”、“测量所得的值测量所得的值”、“实测分实测分数数”、“观察分数观察分数”、“原始观测数原始观测数”等。等。“真值真值”,也称,也称“真分数真分数”(简称(简称T T):反映测):反映测量对象(或受试者)某种特征的真正水平(或能力)量对象(或受试者)某种特征的真正水平(或能力)的那个数据。的那个数据。T T和和X X的关系怎样?的关系怎样?测量误差可以使用下式表示:测量误差可以使用下式表示:E EX XT T (2 21 1)式中:式中:E E表示误差;表示误差;X X表示测量结果;表示测量结果;T T表示表示真值。真值。所有的被测事物或现象在特定的条件下,理论上所有的被测
18、事物或现象在特定的条件下,理论上都有一个对应的客观、实际值存在,我们称之为都有一个对应的客观、实际值存在,我们称之为“理理论真值论真值”。它只是个理想的概念,这在误差理论研究。它只是个理想的概念,这在误差理论研究中非常重要。为了进一步理解体育测量的误差,可人中非常重要。为了进一步理解体育测量的误差,可人为地把体育测量过程分为三个子过程。为地把体育测量过程分为三个子过程。1.1.测量过程的分解测量过程的分解 测量的目的在于了解被测事物或现象的真值。根据测量的目的在于了解被测事物或现象的真值。根据测量真值的近似可知性和体育测量的推测过程的基本特测量真值的近似可知性和体育测量的推测过程的基本特点,可
19、把测量过程分解位以下过程:点,可把测量过程分解位以下过程:式中:式中:X X指标测量值;指标测量值;T1T1现象真值;现象真值;T2T2指标真值;指标真值;T T待测真值待测真值。(1 1)第第I I过程过程:由测量值推测现象真值的过程。:由测量值推测现象真值的过程。(2 2)第第IIII过程过程:由现象真值推测指标真值的测量过程。:由现象真值推测指标真值的测量过程。(3 3)第第IIIIII过程过程:由指标真值推测属性的过程。:由指标真值推测属性的过程。TTTXIIIIII212.2.测量误差的分解测量误差的分解 公式(公式(2 21 1)给出了总测量误差,即由)给出了总测量误差,即由测量值
20、推测真值存在的误差。依据测量过测量值推测真值存在的误差。依据测量过程的分解,可以将总误差分解为程的分解,可以将总误差分解为测试者误测试者误差、受试者误差和指标误差差、受试者误差和指标误差三部分。三部分。误差的来源误差的来源 1.1.测试者测试者 2.2.受试者受试者 3.3.指标误差指标误差测试者误差测试者误差在第在第I I过程中,现象真值(过程中,现象真值(T T)是确定的,而测量)是确定的,而测量值(值(X X)与之有差异,很明显,误差来源是测)与之有差异,很明显,误差来源是测试者。第试者。第I I过程中的测量误差称为测试者的误过程中的测量误差称为测试者的误差。差。误差来源于测试者,(包括
21、测试者测量方法的正误差来源于测试者,(包括测试者测量方法的正确,对测量的重视程度,测量条件等。),这确,对测量的重视程度,测量条件等。),这类误差称为测试者误差。类误差称为测试者误差。受试者误差:受试者误差:在第在第IIII过程中,相对于过程中,相对于T T1 1来说,来说,T T2 2是确定的。该过是确定的。该过程的误差表现为现象真值与指标真值之间的差程的误差表现为现象真值与指标真值之间的差异。异。造成这种误差的原因有受试者本身、测量方法以及造成这种误差的原因有受试者本身、测量方法以及测试条件等多方面,但该误差最终是通过受试测试条件等多方面,但该误差最终是通过受试者表现出来的,所以该过程的误
22、差称为者表现出来的,所以该过程的误差称为受试者受试者误差误差。指标误差:指标误差:第第IIIIII过程是通过指标真值去推测属性的过程,其过程是通过指标真值去推测属性的过程,其误差大小主要决定于指标能否真实地反映测试误差大小主要决定于指标能否真实地反映测试属性。属性。如果测量指标中含有非待测属性的因素较多,那如果测量指标中含有非待测属性的因素较多,那么该过程的测量误差较大。所以,这一过程的么该过程的测量误差较大。所以,这一过程的误差主要来源于测量指标,又被称为指标误差。误差主要来源于测量指标,又被称为指标误差。以上所述为一般性的测量过程和测量误差的分解,以上所述为一般性的测量过程和测量误差的分解
23、,在实际应用中,具体到某一次测验,可能没在实际应用中,具体到某一次测验,可能没有三个过程,测量误差也可能不需要考虑三有三个过程,测量误差也可能不需要考虑三部分部分。例如例如,标枪我们一般不考虑测试者误差,而主要标枪我们一般不考虑测试者误差,而主要考虑受试者误差考虑受试者误差;而体操、武术等主管评分;而体操、武术等主管评分项目的比赛中,人们往往关心的是测试者的项目的比赛中,人们往往关心的是测试者的误差。误差。产生误差的原因:主观原因是造成误差的主要原因产生误差的原因:主观原因是造成误差的主要原因 受试者的具体情况:生理、心理状态和配合程度;受试者的具体情况:生理、心理状态和配合程度;测试人员状态
24、:熟练程度、知识水平、责任心;测试人员状态:熟练程度、知识水平、责任心;测量方法:测量方法自身所产生的误差;测量方法:测量方法自身所产生的误差;测试环境:温度、海拔、天气等;测试环境:温度、海拔、天气等;测试工具和仪器精度或不正确使用;测试工具和仪器精度或不正确使用;抽样误差中样本含量、抽样方法、样本量的代表性。抽样误差中样本含量、抽样方法、样本量的代表性。数学模型及其假设数学模型及其假设经典测量理论假定,实测值(经典测量理论假定,实测值(X X)与真值()与真值(T T)之间)之间是一种线性关系,并只相差一个随机误差(是一种线性关系,并只相差一个随机误差(E E):):X=T+E X=T+E
25、 1.1.测试者误差测试者误差客观性客观性 2.2.受试者误差受试者误差可靠性可靠性 3.3.指标误差指标误差 有效性有效性二、体育测量的客观性二、体育测量的客观性 一、客观性概述一、客观性概述 测量的客观性(又称评价的可靠性):是指同一测测量的客观性(又称评价的可靠性):是指同一测试者或两个以上试者或两个以上(含两个含两个)的测试者对同一受试者的测试者对同一受试者测量结果的一致性程度。测量结果的一致性程度。客观性是间接衡量是间接衡量第第I I过程中测量误差过程中测量误差(测试者误差)(测试者误差)大小的一种量度。大小的一种量度。所谓所谓间接衡量间接衡量是是指不同测试者对同一受试对象同时指不同
26、测试者对同一受试对象同时测量,通过测量结果的一致程度来衡量测试者误测量,通过测量结果的一致程度来衡量测试者误差大小。差大小。直观上看,如果测试者误差小,那么由不同的直观上看,如果测试者误差小,那么由不同的测试者对同一受试者实施测量时,会得出极为接近测试者对同一受试者实施测量时,会得出极为接近的测量结果,即所有测量值应具有较高的一致性;的测量结果,即所有测量值应具有较高的一致性;反之,如果不同测试者测量结果的一致程度低,则反之,如果不同测试者测量结果的一致程度低,则说明测试者的测量误差大。如果某一项测验的测试说明测试者的测量误差大。如果某一项测验的测试者误差小,则该测验的客观性高;反之,测验的客
27、者误差小,则该测验的客观性高;反之,测验的客观性低。观性低。体育中主要用于主观评分类的运动项目。体育中主要用于主观评分类的运动项目。例如体操或武术等测试中,数个裁判员对同一运动员例如体操或武术等测试中,数个裁判员对同一运动员进行评分,若他们所评的分数很接近,说明评分的进行评分,若他们所评的分数很接近,说明评分的客观性较高,反之则低。客观性较高,反之则低。测验的客观性定义测验的客观性定义 设从测验总体中随机抽取一名测试者(或若设从测验总体中随机抽取一名测试者(或若干名测试者)和一个受试对象,测验值为干名测试者)和一个受试对象,测验值为X X,根据,根据误差理论和测量过程的分解,测验的第误差理论和
28、测量过程的分解,测验的第I I过程误差过程误差模型为:模型为:X XT T1 1e e1 1 (2 23 3)式中,式中,T T1 1受试对象表现的现象值;受试对象表现的现象值;e e1 1测测试者造成的误差;试者造成的误差;e e1 1和和T T1 1相互独立。相互独立。从而:从而:(24)21212eTx 可见,客观系数是一个相对数,反映测试者的测量误差相对于个体差异的大小,若测量误差相对较大,则客观系数较小,反之亦反。客观性系数介于0和1之间。公式(25)定义的客观性系数是测验关于全体测试者和受试对象的客观性系数,即关于测验总体的客观性系数,称之为测验的总体客观性测验的总体客观性,也称测
29、验的客观性测验的客观性,一般总是未知的,实际应用中需要通过样本进行检验。测验的总体测验的总体 在体育测量中,测验本身对测试者和测试对在体育测量中,测验本身对测试者和测试对象都有一定的要求,我们称象都有一定的要求,我们称满足测验要求的所有满足测验要求的所有测试者和测试对象构成的全体称为测试者和测试对象构成的全体称为测验的总体测验的总体,记为(记为(A A、B B),),其中其中A A代表测试者,代表测试者,B B代表测试对代表测试对象。明确了测验的总体,也就明确了测验的适用象。明确了测验的总体,也就明确了测验的适用范围。范围。二、客观性的分类二、客观性的分类1 1、多人测量客观性多人测量客观性:
30、两名或两名以上的测试者对同:两名或两名以上的测试者对同一受试者测量结果的一致性程度。一受试者测量结果的一致性程度。原因原因:对测量尺度掌握不一样。:对测量尺度掌握不一样。提高方法提高方法:提高测试者测试水平、规定测试细则及:提高测试者测试水平、规定测试细则及严格控制测试条件等方法。严格控制测试条件等方法。2 2、一人测量客观性、一人测量客观性 同一测试者对同样事物多次重复测量结果同一测试者对同样事物多次重复测量结果的一致性程度。的一致性程度。对同一项包含主观因素较多的测量来说,难以在每对同一项包含主观因素较多的测量来说,难以在每次测量时,都保证尺度一致次测量时,都保证尺度一致。如对同一人的技术
31、。如对同一人的技术录像多次评分时录像多次评分时另外,同一人对不同受试者实施同样测量时,也存另外,同一人对不同受试者实施同样测量时,也存在客观问题在客观问题。三、客观性的检验方法三、客观性的检验方法 单个测试者的测验单个测试者的测验 抽取若干名测试者对同一受试者进行测量,以抽取若干名测试者对同一受试者进行测量,以便对测试者的误差做出估计。常用检验方法有两种:便对测试者的误差做出估计。常用检验方法有两种:(1 1)一致性系数()一致性系数(W W系数)法:测量值为受试者的成系数)法:测量值为受试者的成绩等级(名次)。绩等级(名次)。W=12S/mW=12S/m2 2(n(n3 3-n)-n)W:W
32、:为客观性系数为客观性系数;m:;m:为测试者人数为测试者人数;n:;n:为受试者为受试者人数人数;S:;S:为受试者名次之和的离均差平方和。为受试者名次之和的离均差平方和。(2 2)方差分析法)方差分析法 R=1-MSR=1-MS内内/MS/MS总总多个测试者的测验(主观评分项目比赛)多个测试者的测验(主观评分项目比赛)(1 1)裂半相关法)裂半相关法 (2 2)方差分析法)方差分析法 R=1-MSR=1-MS内内/MS/MS间间客观性常用于一些主观评分类项目,如体操、跳水、客观性常用于一些主观评分类项目,如体操、跳水、花样滑冰等体育比赛中。花样滑冰等体育比赛中。四、影响客观性的因素四、影响
33、客观性的因素 1、测试者水平、测试者水平 2、测试者的人数级、测试者的人数级 3、测试尺度:应尽可能明确规定测试细节并、测试尺度:应尽可能明确规定测试细节并且将其具体化,尽量减少测量中的主观因且将其具体化,尽量减少测量中的主观因素,实施标准化测量以提高测量的客观性。素,实施标准化测量以提高测量的客观性。4、测验的规范性、标准化程度、测验的规范性、标准化程度5、测量的指标特征:在条件允许的情况下,、测量的指标特征:在条件允许的情况下,应尽量选择可以定量测量的指标。应尽量选择可以定量测量的指标。三、体育测量的可靠性三、体育测量的可靠性(一一)可靠性概述可靠性概述 测量的可靠性测量的可靠性(信度信度
34、)在相同测量条件下,对在相同测量条件下,对同一批受试者使用相同测量手段,重复测量结果的同一批受试者使用相同测量手段,重复测量结果的一致性程度。一致性程度。(狭义的操作定义狭义的操作定义)。一般定义:测验。一般定义:测验结果的一贯性、一致性、再现性、稳定性。结果的一贯性、一致性、再现性、稳定性。间接衡量第间接衡量第过程中测量误差(受试者误差)过程中测量误差(受试者误差)大小的一种量度。大小的一种量度。测量中常用测量中常用R R表示可靠性系数。表示可靠性系数。例:某同学的身高为例:某同学的身高为178cm(178cm(真实值真实值-以重以重复测量的均值为代表复测量的均值为代表),第一次测量所得身高
35、为,第一次测量所得身高为177cm177cm,第二次测量所得身高为,第二次测量所得身高为179cm179cm,测量值与真,测量值与真实值中间的差值即为误差值。实值中间的差值即为误差值。X=T+EX=T+E;其中;其中(X(X实实测值测值;T;T测量的真值测量的真值;E;E测量误差值测量误差值)可靠性系数的范围(可靠性系数的范围(0 0,1 1)越接近)越接近1 1则可靠性越高则可靠性越高有些可靠性高的测量,如身高、体重等,这类指标只有些可靠性高的测量,如身高、体重等,这类指标只要保持与原测量条件一致,多次重复测量结果一致要保持与原测量条件一致,多次重复测量结果一致性程度较高。性程度较高。然而,
36、有些指标,如然而,有些指标,如VO2max,即使进行最严格的标准化和规,即使进行最严格的标准化和规范化测量,使用最精密的量具和仪器,由最有经验的测试范化测量,使用最精密的量具和仪器,由最有经验的测试人员进行测试,其测量结果还会存在人员进行测试,其测量结果还会存在定的误差。定的误差。这种误这种误差的大小,在很大程度上决定了测量的可靠性。差的大小,在很大程度上决定了测量的可靠性。从从“最严格的标准化和规范化测量,使用最精密的量具和仪最严格的标准化和规范化测量,使用最精密的量具和仪器,由最有经验的测试人员进行测试,其测量结果还会存器,由最有经验的测试人员进行测试,其测量结果还会存在在定的误差。定的误
37、差。”可以判断出:与测试人员无关,如果存可以判断出:与测试人员无关,如果存在误差,那么就应当是受试者自身造成的。在误差,那么就应当是受试者自身造成的。因此,可靠性就是衡量第因此,可靠性就是衡量第II过程的测量误差(受试者误差)大过程的测量误差(受试者误差)大小的一个客观性指标,有严格的统计学定义。小的一个客观性指标,有严格的统计学定义。根据可靠性数学理论,对一名受试者进行任何一次测根据可靠性数学理论,对一名受试者进行任何一次测量的结果(实测值),都是两个量的和,即量的结果(实测值),都是两个量的和,即被测量的真值被测量的真值与与由于不能被控制的受试者状态变化和随机误差而引起的由于不能被控制的受
38、试者状态变化和随机误差而引起的误差之误差之和和,这就是可靠性的理论依据,可用下面公式表示:,这就是可靠性的理论依据,可用下面公式表示:xi(x)x(T)x (e)式中式中xi为某次测量的实测值;为某次测量的实测值;x 为被测量的真值;为被测量的真值;x 为为由不能被控制的受试者状态变化和随机误差而引起的误差由不能被控制的受试者状态变化和随机误差而引起的误差。可靠性高低,是用可靠性高低,是用可靠性系数(或称信度系数)可靠性系数(或称信度系数)进行描述的。进行描述的。可靠件系数(可靠件系数(iiii),即真值方差与实测值方差之比。可靠性系数),即真值方差与实测值方差之比。可靠性系数可用下面公式表示
39、:可用下面公式表示:从上式可以看出,假如没有测量误差,即从上式可以看出,假如没有测量误差,即 0 0,则可靠性系数,则可靠性系数 iiii就等于就等于1 1。随着测量误差的增大,可靠性系数值也就越小。随着测量误差的增大,可靠性系数值也就越小。因此,因此,可以认为,测量的可靠性在很大程度上取决于测量误差的大小。可以认为,测量的可靠性在很大程度上取决于测量误差的大小。测量测量误差越小,可靠性越高。误差越小,可靠性越高。22222221ieieiiii2e(二)体育测验的可靠性检验(二)体育测验的可靠性检验1 1、频数等于、频数等于1 1的测验的测验 (1 1)两次重复测验)两次重复测验 (2 2)
40、多次重复测验:方差分析法)多次重复测验:方差分析法 R=1-MSR=1-MS内内/MS/MS总总2 2、频数大于、频数大于1 1的测验:方差分析法的测验:方差分析法 R=1-MSR=1-MS内内/MS/MS间间(三)可靠性的分类(三)可靠性的分类 测量的可靠性,人们习惯于将它分为测量的可靠性,人们习惯于将它分为3类:类:即即 一致可靠性 稳定可靠性 等价可靠性。1 1、一致性可靠性、一致性可靠性一致可靠性一致可靠性指同一天内,测试者对同一批受试者重复测量指同一天内,测试者对同一批受试者重复测量结果的一致程度。结果的一致程度。受试者人数较少时受试者人数较少时,在相同条件下进行重复测量。用测量,在
41、相同条件下进行重复测量。用测量再测量结果的相关系数估价其内部一致性程度。再测量结果的相关系数估价其内部一致性程度。大群体测量时大群体测量时,采用按人数比例随机抽样的方法,实施重,采用按人数比例随机抽样的方法,实施重复测量检验其可靠性。复测量检验其可靠性。2 2、稳定可靠性、稳定可靠性稳定可靠性稳定可靠性指两天或数天内,测试者对同一批受试者重复测指两天或数天内,测试者对同一批受试者重复测量结果的一致程度。量结果的一致程度。如果被测事物属性相对稳定如果被测事物属性相对稳定,即使间隔一定时间再测,结果,即使间隔一定时间再测,结果应当也一致的;若测量结果差异很大,说明这些指标信应当也一致的;若测量结果
42、差异很大,说明这些指标信度不高,不可靠。度不高,不可靠。在估价测量的稳定可靠性时,应注意根据不同测量指标,确在估价测量的稳定可靠性时,应注意根据不同测量指标,确定适宜的不同测量间隔时间,以避免因过长或过短的测定适宜的不同测量间隔时间,以避免因过长或过短的测量间隔时间而高估或低估测量稳定可靠性。量间隔时间而高估或低估测量稳定可靠性。如运动即刻的血乳酸值和几天之后的值。如运动即刻的血乳酸值和几天之后的值。3 3、等价可靠性、等价可靠性等价可靠性等价可靠性指在不同的测量时间,对受试者实施难度相同,指在不同的测量时间,对受试者实施难度相同,而方式或题目不同的同质测量结果的一致程度。而方式或题目不同的同
43、质测量结果的一致程度。等价可靠性常用于对受试者的理论知识测验。等价可靠性常用于对受试者的理论知识测验。另外在教学训练中也常用于检查学员技术掌握程度,或进另外在教学训练中也常用于检查学员技术掌握程度,或进行性格、智力等心理方面的测量。行性格、智力等心理方面的测量。(四)影响可靠性的因素(四)影响可靠性的因素影响可靠性的因素主要来自测量的随机误差和抽样误影响可靠性的因素主要来自测量的随机误差和抽样误差。差。1 1、测量误差、测量误差 影响可靠性的因素较多,但测量误差是影响可影响可靠性的因素较多,但测量误差是影响可靠性的直接因素。测量误差越大则可靠性越低;反靠性的直接因素。测量误差越大则可靠性越低;
44、反之,则可靠性越高。之,则可靠性越高。测试者;测试者;受试者;受试者;测试仪器;测试仪器;测试方测试方法;法;测试环境;测试环境;抽样误差:抽样方法、样本量、抽样误差:抽样方法、样本量、样本代表性。样本代表性。2 2、受试者个体差异和受试群体的能力水平、受试者个体差异和受试群体的能力水平 同一种测量手段,用于个体差异不同的群体同一种测量手段,用于个体差异不同的群体时,个体差异较大的群体,估价出的信度系数较时,个体差异较大的群体,估价出的信度系数较高,个体差异较小的群体信度系数较低。高,个体差异较小的群体信度系数较低。在某种能力水平上信度高的测验,对于其它在某种能力水平上信度高的测验,对于其它能
45、力水平的群体信度未必就高。能力水平的群体信度未必就高。例如:适应能力问卷在本科文化程度人群中例如:适应能力问卷在本科文化程度人群中使用重测信度可以,但用于小学文化程度的人群使用重测信度可以,但用于小学文化程度的人群信度未必够。信度未必够。3 3、重复测量的间隔时间、重复测量的间隔时间 重测信度、复本信度中,重复测量间隔时间重测信度、复本信度中,重复测量间隔时间越长,估价出的信度系数越低越长,估价出的信度系数越低 4 4、测量的长度、测量的长度 (组数、次数)(组数、次数)重测信度、复本信度中重复测量的次数,评重测信度、复本信度中重复测量的次数,评分者信度中的评分者人数,内部一致性信度中的分者信
46、度中的评分者人数,内部一致性信度中的题目数统称为测验的长度,长度越长信度越高,题目数统称为测验的长度,长度越长信度越高,但长度增加的同时测量工作量增加,其它影响影但长度增加的同时测量工作量增加,其它影响影响测量结果的因素也增加。响测量结果的因素也增加。5 5、测量指标的类型、测量指标的类型 稳定性高、不易变化的指标重测信度高;定稳定性高、不易变化的指标重测信度高;定性评分项目中,受主观因素影响小的指标评分者性评分项目中,受主观因素影响小的指标评分者信度高;信度高;6 6、测试细则、测试细则 测试细则详细准确的测量重测信度高;评分测试细则详细准确的测量重测信度高;评分规则详细准确的评分者信度高规
47、则详细准确的评分者信度高 7 7、估价可靠性时使用的方法、估价可靠性时使用的方法 如果同时可以使用几种方法估价信度系数,如果同时可以使用几种方法估价信度系数,可能计算结果会稍有不同。可能计算结果会稍有不同。8 8、测试人员的人数、水平、责任心等对评分者信度、测试人员的人数、水平、责任心等对评分者信度影响较大影响较大 可靠性程度的一般判断标准:可靠性程度的一般判断标准:(五)提高可靠性的方法(五)提高可靠性的方法 严格实施标准化的测量程序。包括测量仪器设备严格实施标准化的测量程序。包括测量仪器设备的标准化,测量方法的标准化,测量实施的标准的标准化,测量方法的标准化,测量实施的标准化。这样可以减少
48、随机误差和系统误差。化。这样可以减少随机误差和系统误差。适当增加测量的长度。在运动技术测量当中,增适当增加测量的长度。在运动技术测量当中,增加测量或测验的次数,在体育社会、教育心理测加测量或测验的次数,在体育社会、教育心理测量中,适当增加题目的数量。量中,适当增加题目的数量。适当地增加平行测验项目,可以增加对信度的检适当地增加平行测验项目,可以增加对信度的检验,获得更丰富的信息。验,获得更丰富的信息。适当增加样本含量,并提高抽样的科学性(使样适当增加样本含量,并提高抽样的科学性(使样本具有代表性),这样可以减少抽样误差。本具有代表性),这样可以减少抽样误差。测验的难度要适中,使受试者表现出应有
49、的成绩差测验的难度要适中,使受试者表现出应有的成绩差异。异。在选取受试者群体时,要兼顾他们的水平差异(最在选取受试者群体时,要兼顾他们的水平差异(最好接近正态)。好接近正态)。提高测试人员的责任心、业务素质和测量技巧,以提高测试人员的责任心、业务素质和测量技巧,以减少过失误差、系统误差和随机误差。减少过失误差、系统误差和随机误差。在有些测量中,要对受试者进行必要的宣传鼓动,在有些测量中,要对受试者进行必要的宣传鼓动,诱发其正确的动机和兴趣,使之事先对测量方法、诱发其正确的动机和兴趣,使之事先对测量方法、要求有所了解,更好地配合测试。尤其在机能测验要求有所了解,更好地配合测试。尤其在机能测验和运
50、动能力测验中,以及在量表测试过程中,正确和运动能力测验中,以及在量表测试过程中,正确的动机、认真的态度、全力以赴的作风将直接关系的动机、认真的态度、全力以赴的作风将直接关系到测量结果的准确与可靠。到测量结果的准确与可靠。重复测量时要考虑间隔时间的长短,以及要保证重复测量时要考虑间隔时间的长短,以及要保证两次测验的独立性(完整性)。两次测验的独立性(完整性)。要注意测量时间和环境的选择。如不要在大型赛要注意测量时间和环境的选择。如不要在大型赛事(如校运会)和重大节日(如国庆节)前后安事(如校运会)和重大节日(如国庆节)前后安排测试;测试要求适当充裕的时间;要注意考试排测试;测试要求适当充裕的时间