1、体体 育育 测测 量量 的的 科学性科学性北北 京京 体体 育育 大大 学学统计测量教研室统计测量教研室任任 弘弘 博士、副教授博士、副教授本科程主要内容:本科程主要内容:1 体育测量的科学性理论体育测量的科学性理论2 评价理论与方法评价理论与方法3 人体形态测量人体形态测量4、体质研究、体质研究 身体综合能力身体综合能力形态结构形态结构生理机能生理机能身体素质及基础运动能力身体素质及基础运动能力心理素质心理素质智力水平智力水平专项技术水平专项技术水平专项战术水平专项战术水平体体 育育 测测 量量 内内 容容形态结构形态结构 是身体各种能力的基础是身体各种能力的基础体格体格:身体各环节的长度、
2、宽度、围度和厚度:身体各环节的长度、宽度、围度和厚度体型体型:对人体某个阶段形态结构及组成成分的描述:对人体某个阶段形态结构及组成成分的描述身体成分身体成分:身体中的脂肪含量:身体中的脂肪含量体姿体姿:身体各部在空间的相对位置:身体各部在空间的相对位置骨龄骨龄:人体的生理年龄:人体的生理年龄生长发育成熟度生长发育成熟度:第二性征发育水平:第二性征发育水平生理机能:生理机能:是指人的整体及其组成的各器是指人的整体及其组成的各器 官、系统所表现的生命活力官、系统所表现的生命活力呼吸机能呼吸机能:肺活量、最大摄氧量肺活量、最大摄氧量 、循环机能循环机能:安静状态、定量负荷状态、最大负安静状态、定量负
3、荷状态、最大负 荷状态下心血管系统的机能反应荷状态下心血管系统的机能反应代谢机能:代谢机能:有氧代谢和无氧代谢有氧代谢和无氧代谢感觉机能感觉机能:肌肉用力感觉肌肉用力感觉平衡机能平衡机能:静态平衡和动态平衡静态平衡和动态平衡身体素质:身体素质:人体在运动中所表现出的速度、人体在运动中所表现出的速度、 力量、耐力、灵敏及柔韧等方力量、耐力、灵敏及柔韧等方 面的机能能力面的机能能力速度:速度:位移速度、动作速度和反应速度位移速度、动作速度和反应速度力量:力量:等张性力量和等长性力量等张性力量和等长性力量耐力:耐力:一般耐力、速度耐力、力量耐力一般耐力、速度耐力、力量耐力 和静力性耐力和静力性耐力柔
4、韧:柔韧:关节活动范围,受关节结构、跨过关节的肌肉、肌关节活动范围,受关节结构、跨过关节的肌肉、肌腱和韧带等因素的影响腱和韧带等因素的影响灵敏:灵敏:人体在各种复杂条件下快速、准确、协调地改变身人体在各种复杂条件下快速、准确、协调地改变身体姿势、运动方向和随机应变的能力体姿势、运动方向和随机应变的能力精神、心理因素精神、心理因素包括感觉、知觉、记忆、想象及思维;包括感觉、知觉、记忆、想象及思维;是满意、愉快、愤怒及烦恼等态度体验是满意、愉快、愤怒及烦恼等态度体验在认识和情感体验的基础上,人类为了满在认识和情感体验的基础上,人类为了满足某种需要,自觉地确定目的,指定计划,克服足某种需要,自觉地确
5、定目的,指定计划,克服困难而努力达到目的,这是人类的意志过程困难而努力达到目的,这是人类的意志过程。智力智力 智力是各种认识能力的总和。智力是各种认识能力的总和。是获得知是获得知识的能力,是认识、理解事物和运用知识与识的能力,是认识、理解事物和运用知识与经验解决问题的能力经验解决问题的能力 。包括:观察力、注意力、记忆力、想象力、包括:观察力、注意力、记忆力、想象力、思维力、创造力。思维力、创造力。 战术水平战术水平理论测验理论测验教练员评定教练员评定比赛观察比赛观察测量与评价的关系测量与评价的关系测量的可能性测量的可能性 只有当某种特征能够清楚地加以确定,只有当某种特征能够清楚地加以确定,并
6、对拟测个体的特性加以明确辨别,以至并对拟测个体的特性加以明确辨别,以至足以观测出其间差异时,才具有测量的意足以观测出其间差异时,才具有测量的意义和现实性。义和现实性。体育测量评价的发展趋势:体育测量评价的发展趋势:1、多学科、多部门协作;、多学科、多部门协作;2、与运动专项紧密结合;、与运动专项紧密结合;3、应用领域广泛、应用领域广泛 运动员竞技能力评定运动员竞技能力评定 运动员选材运动员选材 体质研究体质研究测量的科学性测量的科学性可靠性、有效性、客观性可靠性、有效性、客观性 ( 三性理论三性理论 ) 测量三性的讲解内容测量三性的讲解内容定义定义分类分类估价方法估价方法影响因素影响因素测量的
7、可靠性(信度测量的可靠性(信度ReliabilityReliability)一、可靠性的定义:一、可靠性的定义:1 1、狭义的操作定义:、狭义的操作定义:在相同条件下对同一批受在相同条件下对同一批受试对象使用相同的测量手段,重复测量结果的一试对象使用相同的测量手段,重复测量结果的一致程度。用可靠性系数致程度。用可靠性系数 r r 表示。(表示。(r r值越接近值越接近1 1,越可靠)越可靠)2 2、一般定义:、一般定义:测验结果的一贯性、一致性、再测验结果的一贯性、一致性、再现性、稳定性。(张力为)现性、稳定性。(张力为)r = 2T 2X = 2X - 2E 2X= 1 - 2E 2x3 3
8、、理论定义:、理论定义: X=T+E X=T+E信度反映的是测量结果受到随机误差影响的信度反映的是测量结果受到随机误差影响的程度,是评价测量质量的最基本的指标。它程度,是评价测量质量的最基本的指标。它是一个相对概念,并非绝对的有无,而是一是一个相对概念,并非绝对的有无,而是一个程度上或多或少的问题。没有一个测量是个程度上或多或少的问题。没有一个测量是绝对可靠的,只有测量结果可信程度的高和绝对可靠的,只有测量结果可信程度的高和低。低。可靠与不可靠?可靠与不可靠?内部一致性信度内部一致性信度1、稳定可靠性、稳定可靠性 (重测信度重测信度) :间隔一定时间,使:间隔一定时间,使用相同测量手段,对同一
9、批受试者重复测量,结用相同测量手段,对同一批受试者重复测量,结果的一致性程度。是估价可靠性最简单的方法。果的一致性程度。是估价可靠性最简单的方法。注意事项注意事项(1)信度系数受测验间隔时间影响:)信度系数受测验间隔时间影响:(2)不适用于考察难度的测验)不适用于考察难度的测验(3)被试在第二次测试时容易觉得枯燥)被试在第二次测试时容易觉得枯燥(4)费时、费力)费时、费力二、可靠性的分类:二、可靠性的分类:当同一测验的一种形式不适合实施两次时,就需要采用该当同一测验的一种形式不适合实施两次时,就需要采用该测验的另一平行测验(复本)。复本在测量内容、难度、测验的另一平行测验(复本)。复本在测量内
10、容、难度、平均数、标准差等方面应与原测验一样,否则估计的可靠平均数、标准差等方面应与原测验一样,否则估计的可靠性系数就会出现较大误差。性系数就会出现较大误差。注意事项注意事项(1)两次测验的题目要基本等值)两次测验的题目要基本等值同质测验同质测验(2)两次测验要尽可能在较短时间内进行)两次测验要尽可能在较短时间内进行(3)实际工作中,完全等值的测验很难找到)实际工作中,完全等值的测验很难找到2、等价可靠性、等价可靠性 (复本信度复本信度):同质测验、复本(问卷调查)同质测验、复本(问卷调查)测验的目的相同测验的目的相同难度相似难度相似方式(题目)不同方式(题目)不同前两种信度都需要两次测验,较
11、烦琐。根据前两种信度都需要两次测验,较烦琐。根据一次测验估价测验的信度称为内部一致信度。一次测验估价测验的信度称为内部一致信度。(1)裂半法)裂半法分半信度分半信度(2)克隆巴赫)克隆巴赫 系数法系数法同质性信度同质性信度3、内部一致可靠性、内部一致可靠性 (内部一致信度内部一致信度 ) :4、评分者信度、评分者信度客观性客观性定义:定义:多个评分者给同一批受试者评分多个评分者给同一批受试者评分时结果的一致程度。对于无法定量测量时结果的一致程度。对于无法定量测量只能定性评分的项目来说,评定结果的只能定性评分的项目来说,评定结果的信度受评价者主观因素的影响,故也称信度受评价者主观因素的影响,故也
12、称测量的测量的客观性客观性。5、同质性信度、同质性信度定义:定义:测验内部所有测题之间的一致程度。测验内部所有测题之间的一致程度。并非所有的测验都要求有较高的同质性信度。并非所有的测验都要求有较高的同质性信度。分半信度分半信度与与同质性信度同质性信度有时也和称为有时也和称为内部一致性信度内部一致性信度 三、可靠性的估价方法:三、可靠性的估价方法:积差相关法适用于:积差相关法适用于:(1)适用于两组变量可靠性的计算)适用于两组变量可靠性的计算(2)无系统误差)无系统误差1 Pearson 积差相关法积差相关法:重测信度重测信度和和复本信度复本信度的的 估价可以使用本方法。估价可以使用本方法。系统
13、误差:系统误差:由于测量工具不准确,或测试人员由于测量工具不准确,或测试人员 知识技术水平不同,致使测量结知识技术水平不同,致使测量结 果呈果呈规律性规律性偏大或偏小。偏大或偏小。重复测量时任何一次测量中有系统误差,都会重复测量时任何一次测量中有系统误差,都会使估价出来的信度系数偏高。使估价出来的信度系数偏高。补充知识:补充知识:例例1:对:对10名学生实施间隔一周的两次跳高测量,名学生实施间隔一周的两次跳高测量,结果如下,试估价测量的可靠性。结果如下,试估价测量的可靠性。编号编号 1 2 3 4 5 6 7 8 9 10X1 1.49 1.41 1.60 1.40 1.42 1.51 1.5
14、8 1.43 1.53 1.48 X2 1.51 1.48 1.64 1.39 1.47 1.55 1.61 1.41 1.57 1.54r = 0.938可靠吗?可靠吗?如何判断两次测验中有无系统误差?如何判断两次测验中有无系统误差?成对数据成对数据T检验检验如果如果t t (n )则两组数据间无显著性差异则两组数据间无显著性差异无系统误差无系统误差计算信度系数计算信度系数2、 裂半法(裂半法(分半信度)分半信度)将一个测验分成奇数题与偶数题两半,两将一个测验分成奇数题与偶数题两半,两部分结果的一致程度。部分结果的一致程度。适用于没有复本且只能进行一次测验的情适用于没有复本且只能进行一次测验
15、的情况下。况下。受试者受试者 测量题目测量题目 成绩总和成绩总和N=4 1 2 3 4 奇数次奇数次 偶数次偶数次 A 10 12 12 13 22 25 B 12 13 11 10 23 23 C 12 13 12 11 24 24 D 18 12 13 12 19 22 E 16 15 17 15 33 30例:对五名受试者进行四个问题的测验,例:对五名受试者进行四个问题的测验,估价测试数据可靠性。估价测试数据可靠性。2121212112rrr分半后计算相关系数的测量次数(题目数)只有实分半后计算相关系数的测量次数(题目数)只有实际的一半,这就降低了信度,为了得到整个测验的际的一半,这就降
16、低了信度,为了得到整个测验的信度系数,需要用斯皮尔曼信度系数,需要用斯皮尔曼-布朗公式修正。布朗公式修正。2121r:两半测验之间的相关系数两半测验之间的相关系数:整个测验的信度系数整个测验的信度系数r3、 抽样复测法抽样复测法 适用于大样本群体测量适用于大样本群体测量步骤:步骤:1、确定抽样比例及人数;、确定抽样比例及人数; 2、随机抽样,做好标记;、随机抽样,做好标记; 3、发给参加复测的受试对象测试卡片;、发给参加复测的受试对象测试卡片; 4、请受试者返回原测地点,在相同条件下重测;、请受试者返回原测地点,在相同条件下重测; 5、对比原测卡片和复测卡片,计算超出允许误差范围、对比原测卡片
17、和复测卡片,计算超出允许误差范围 的误差次数的误差次数N; 6、计算误差发生率计算误差发生率 P。P = N/测量次数测量次数 100% 如果如果P 5% ,可靠性较差可靠性较差4、 方差分析法(评分者信度)方差分析法(评分者信度)BWBWBMSMSMSMSMSr1MSB 组间方差组间方差 MSW 组内方差组内方差 例:例:2000年奥运会男子年奥运会男子10米跳台决米跳台决赛裁判员评分一致性检验赛裁判员评分一致性检验5、Spearman 等级相关等级相关两组变量两组变量(重测信度、复本信度、评分者信度)(重测信度、复本信度、评分者信度)如果测量数据不精准,只是定性评分或排名,可使用等级如果测
18、量数据不精准,只是定性评分或排名,可使用等级相关。相关。实际上等级相关对于定量测量的数据或定性评分的数据都实际上等级相关对于定量测量的数据或定性评分的数据都可以使用,但对于定量数据计算结果不如积差相关法准确。可以使用,但对于定量数据计算结果不如积差相关法准确。遗憾的是遗憾的是Excel中不能直接计算等级相关,需要用中不能直接计算等级相关,需要用Rank函函数先对数据进行排名,然后再用积差相关法计算数先对数据进行排名,然后再用积差相关法计算例:两名教师给例:两名教师给10名学生的考试卷进行名学生的考试卷进行评分,估价其评分者信度评分,估价其评分者信度6、肯德尔和谐系数法、肯德尔和谐系数法多人评分
19、信度多人评分信度由多人进行评分时评分者信度的估价方法由多人进行评分时评分者信度的估价方法适用于:多组顺序型数据适用于:多组顺序型数据缺点:缺点:Excel、SPSS中没有现成计算公式中没有现成计算公式)(nnmS3212较少使用较少使用7、克隆巴赫、克隆巴赫 系数系数内部一致性信度内部一致性信度 (同质性信度)(同质性信度) 用于估价多个项目或多个分测验所构成的测验合成用于估价多个项目或多个分测验所构成的测验合成得分的信度系数。需用得分的信度系数。需用SPSS统计软件计算统计软件计算Analyze Scale Reliability AnalysisReliability Coefficien
20、ts 10 items Alpha = .7205 Standardized item alpha = .7377信度估价方法总结信度估价方法总结重测信度:重测信度:积差相关法、等级相关法、方差分析法、积差相关法、等级相关法、方差分析法、 抽样复测法抽样复测法复本信度:复本信度:积差相关法、等级相关法、方差分析法积差相关法、等级相关法、方差分析法评分者信度:评分者信度:等级相关法、方差分析法、和谐系数法等级相关法、方差分析法、和谐系数法分半信度:分半信度:裂半法裂半法同质性信度:同质性信度:克隆巴赫克隆巴赫 系数系数0.95 0.99 非常可靠非常可靠0.90 0.94 可靠可靠0.80 0.
21、89 可靠性可以接受可靠性可以接受0.70 0.79 可靠性较差可靠性较差0.70 以下以下 一般认为不能使用一般认为不能使用可靠性程度的判断标准:可靠性程度的判断标准:1 、测量误差、测量误差(1)测试者)测试者 (2)受试者)受试者(3)测试仪器)测试仪器 (4)测试方法)测试方法(5)测试环境)测试环境(6)抽样误差:)抽样误差: 抽样方法、样本量、样本代表性抽样方法、样本量、样本代表性四、影响可靠性的因素:四、影响可靠性的因素:同一种测量手段,用于个体差异不同的群体时,同一种测量手段,用于个体差异不同的群体时,个体差异较大的群体,估价出的信度系数较高,个体差异较大的群体,估价出的信度系
22、数较高,个体差异较小的群体信度系数较低。个体差异较小的群体信度系数较低。2、受试者个体差异受试者个体差异22222221XEXEXXTr3、受试群体的能力水平、受试群体的能力水平在某种能力水平上信度高的测验,对于其它能力在某种能力水平上信度高的测验,对于其它能力水平的群体信度未必就高。水平的群体信度未必就高。例如:适应能力问卷在本科文化程度人群中使用例如:适应能力问卷在本科文化程度人群中使用重测信度可以,但用于小学文化程度的人群信度重测信度可以,但用于小学文化程度的人群信度未必够未必够 重测信度、复本信度中,重复重测信度、复本信度中,重复测量间隔时间越长,估价出的信测量间隔时间越长,估价出的信
23、度系数越低度系数越低3 重复测量的间隔时间重复测量的间隔时间 重测信度、复本信度中重复测量的次数,评分重测信度、复本信度中重复测量的次数,评分者信度中的评分者人数,内部一致性信度中的者信度中的评分者人数,内部一致性信度中的题目数统称为测验的长度,长度越长信度越高,题目数统称为测验的长度,长度越长信度越高,但长度增加的同时测量工作量增加,其它影响但长度增加的同时测量工作量增加,其它影响影响测量结果的因素也增加。影响测量结果的因素也增加。4 测量的长度测量的长度5 测量指标的类型测量指标的类型稳定性高、不易变化的指标重测信度高;稳定性高、不易变化的指标重测信度高;定性评分项目中,受主观因素影响小的
24、指定性评分项目中,受主观因素影响小的指标评分者信度高;标评分者信度高;6、测试细则、测试细则测试细则详细准确的测量重测信度高;测试细则详细准确的测量重测信度高;评分规则详细准确的评分者信度高评分规则详细准确的评分者信度高7 估价可靠性时使用的方法估价可靠性时使用的方法如果同时可以使用几种方法估价信度如果同时可以使用几种方法估价信度系数,可能计算结果会稍有不同。系数,可能计算结果会稍有不同。8、测试人员的人数、水平、责任心等、测试人员的人数、水平、责任心等对评分者信度影响较大对评分者信度影响较大五、提高可靠性的方法:五、提高可靠性的方法:(一)严格实施标准化的测量程序。包括测量仪器设备(一)严格
25、实施标准化的测量程序。包括测量仪器设备的标准化,测量方法的标准化,测量实施的标准化。这的标准化,测量方法的标准化,测量实施的标准化。这样可以减少随机误差和系统误差。样可以减少随机误差和系统误差。(二)适当增加测量的长度。在运动技术测量当中,增(二)适当增加测量的长度。在运动技术测量当中,增加测量或测验的次数,在体育社会、教育心理测量中,加测量或测验的次数,在体育社会、教育心理测量中,适当增加题目的数量。适当增加题目的数量。(三)适当地增加平行测验项目,可以增加对信度的检(三)适当地增加平行测验项目,可以增加对信度的检验,获得更丰富的信息。验,获得更丰富的信息。(四)适当增加样本含量,并提高抽样
26、的科学性(使样(四)适当增加样本含量,并提高抽样的科学性(使样本具有代表性),这样可以减少抽样误差。本具有代表性),这样可以减少抽样误差。(五)测验的难度要适中,使受试者表现出应有的成绩(五)测验的难度要适中,使受试者表现出应有的成绩差异。差异。(六)在选取受试者群体时,要兼顾他们的水平差异(六)在选取受试者群体时,要兼顾他们的水平差异(最好接近正态)。最好接近正态)。(七)提高测试人员的责任心、业务素质和测量技巧,(七)提高测试人员的责任心、业务素质和测量技巧,以减少过失误差、系统误差和随机误差。以减少过失误差、系统误差和随机误差。(八)在有些测量中,要对受试者进行必要的宣传鼓动(八)在有些
27、测量中,要对受试者进行必要的宣传鼓动,诱发其正确的动机和兴趣,使之事先对测量方法、要,诱发其正确的动机和兴趣,使之事先对测量方法、要求有所了解,更好地配合测试。尤其在机能测验和运动求有所了解,更好地配合测试。尤其在机能测验和运动能力测验中,以及在量表测试过程中,正确的动机、认能力测验中,以及在量表测试过程中,正确的动机、认真的态度、全力以赴的作风将直接关系到测量结果的准真的态度、全力以赴的作风将直接关系到测量结果的准确与可靠。确与可靠。(九)重复测量时要考虑间隔时间的长短,以及要保证(九)重复测量时要考虑间隔时间的长短,以及要保证两次测验的独立性(完整性)。两次测验的独立性(完整性)。(十)要
28、注意测量时间和环境的选择。如不要在大型赛(十)要注意测量时间和环境的选择。如不要在大型赛事(如校运会)和重大节日(如国庆节)前后安排测试事(如校运会)和重大节日(如国庆节)前后安排测试;测试要求适当充裕的时间;要注意考试环境的选择和;测试要求适当充裕的时间;要注意考试环境的选择和控制(如噪音太大、考场纪律混乱等)。控制(如噪音太大、考场纪律混乱等)。(十一)除了对可靠性进行定量的检验外,还可以通过(十一)除了对可靠性进行定量的检验外,还可以通过其它途径对信度检验进行补充和修正,例如:受试者的其它途径对信度检验进行补充和修正,例如:受试者的平时表现、出勤、作业、回答问题等是否与测试结果有平时表现
29、、出勤、作业、回答问题等是否与测试结果有特别大的出入等等。特别大的出入等等。 (十)要注意测量时间和环境的选择。如不要在大型赛事(十)要注意测量时间和环境的选择。如不要在大型赛事(如校运会)和重大节日(如国庆节)前后安排测试;测(如校运会)和重大节日(如国庆节)前后安排测试;测试要求适当充裕的时间;要注意考试环境的选择和控制(试要求适当充裕的时间;要注意考试环境的选择和控制(如噪音太大、考场纪律混乱等)。如噪音太大、考场纪律混乱等)。(十一)除了对可靠性进行定量的检验外,还可以通过其(十一)除了对可靠性进行定量的检验外,还可以通过其它途径对信度检验进行补充和修正,例如:受试者的平时它途径对信度
30、检验进行补充和修正,例如:受试者的平时表现、出勤、作业、回答问题等是否与测试结果有特别大表现、出勤、作业、回答问题等是否与测试结果有特别大的出入等等。的出入等等。 一、有效性的概念一、有效性的概念 1、操作定义:、操作定义:指所选择的测量手段在测量欲测指所选择的测量手段在测量欲测属性时的准确程度,即能测量的属性和要测量的属性时的准确程度,即能测量的属性和要测量的属性之间的一致程度。效度有两曾含义:属性之间的一致程度。效度有两曾含义:1、测、测量值与欲测属性之间的一致性;量值与欲测属性之间的一致性;2、测量值的可、测量值的可靠性靠性有效性用效度系数有效性用效度系数 r 表示,表示,-1 r 1测
31、量的有效性(效度测量的有效性(效度Validity)2、有效性的理论定义、有效性的理论定义效度是在一组测量中,与测量目效度是在一组测量中,与测量目的有关的真实变异数与总变异数的有关的真实变异数与总变异数的比值。的比值。22XVXYr2V2I2EX= V + I + ET由所要测量的变因引起的有效变异由所要测量的变因引起的有效变异2X2T2V222222222XIXXXIXTXITXYrr可靠性是有效性的必要条件,即要想有效可靠性是有效性的必要条件,即要想有效性高,可靠性必需高;有效性是可靠性的性高,可靠性必需高;有效性是可靠性的充分条件,即有效性高,可靠性一定高。充分条件,即有效性高,可靠性一
32、定高。同一测验的信度系数高于其效度系数。同一测验的信度系数高于其效度系数。二、有效性与可靠性的关系:二、有效性与可靠性的关系:三、有效性的分类:三、有效性的分类:1、内容效度、内容效度(Content Validity): (1) 所选择的测量内容反映总体属性的准确所选择的测量内容反映总体属性的准确程度。常用于理论知识的测验。程度。常用于理论知识的测验。 (2)考察考察内容效度内容效度的前提是:要有定义较完的前提是:要有定义较完整的总体属性的内容范围。整的总体属性的内容范围。(3)确定内容效度的方法)确定内容效度的方法A 专家调查:专家调查:一定数量专家逻辑分析的结果,一定数量专家逻辑分析的结
33、果, 也称逻辑效度。也称逻辑效度。B 统计分析统计分析相关计算相关计算:一项测验与公认有较好:一项测验与公认有较好内容效度的测验的相关越高,说明内容效度越好。内容效度的测验的相关越高,说明内容效度越好。如高中毕业前的摸底测验,其内容效度可与高考如高中毕业前的摸底测验,其内容效度可与高考成绩比较成绩比较(1)一组测量所包含的各种属性与总体属性的一组测量所包含的各种属性与总体属性的各种拟测成分在结构上的一致性程度。即可以实各种拟测成分在结构上的一致性程度。即可以实际操作的测验与理论上的构想的符合程度。常用际操作的测验与理论上的构想的符合程度。常用于心理与运动能力的成套测验。于心理与运动能力的成套测
34、验。2、构想效度、构想效度(Construct Validity):(2)确定构想效度的方法)确定构想效度的方法A 因素分析:因素分析:探索性和实证性因素分析探索性和实证性因素分析B 相关计算:相关计算:与已有的构想效度较好的与已有的构想效度较好的 测验的相关测验的相关C 聚合效度和区分效度聚合效度和区分效度(1)所选择的测量与效标之间的关联一致性程度所选择的测量与效标之间的关联一致性程度。(2)效标:)效标:即检验效度的标准,已被检验证明能即检验效度的标准,已被检验证明能 够作为参照标准,是一项有效性高的测量。够作为参照标准,是一项有效性高的测量。3、效标效度、效标效度(Criterion
35、Related Validity):):(实证效度)(实证效度)(3)体育测量中常用的效标:)体育测量中常用的效标:A 可定量测量的专项成绩:如可定量测量的专项成绩:如100米、跳远的成绩;米、跳远的成绩;B 比赛的名次或运动等级;比赛的名次或运动等级;C 具有数量特征的量:具有数量特征的量:100米跑的步频和步幅,米跑的步频和步幅, 跳远的助跑速度;跳远的助跑速度;D 合成效标:如体质评价总分、成套测验总分。合成效标:如体质评价总分、成套测验总分。E 标准的实验室结果:如水下称重法测得的身体成标准的实验室结果:如水下称重法测得的身体成分、用气体分析仪和电动跑台测得的最大吸氧量。分、用气体分析
36、仪和电动跑台测得的最大吸氧量。三、有效性的估价方法三、有效性的估价方法1 逻辑分析法:逻辑分析法: 专家调查法专家调查法2 积差相关法(等级相关法):积差相关法(等级相关法):3 因子分析(主成分分析)法:因子分析(主成分分析)法:4 逐步回归法:逐步回归法:5 指标鉴别力分析指标鉴别力分析例:为检验小腿长度能否反映短跑运动员的运动成例:为检验小腿长度能否反映短跑运动员的运动成绩,抽取绩,抽取14名运动员进行测试,结果如下,请检验名运动员进行测试,结果如下,请检验小腿长度反映运动员的短跑运动成绩的有效性。小腿长度反映运动员的短跑运动成绩的有效性。编号编号 小腿长小腿长 100m 跑跑 编号编号
37、 小腿长小腿长 100m 跑跑 1 32.5 13.2 8 33.9 12.3 2 27.9 13.8 9 31.4 12.1 3 29.7 13.1 10 30.5 13.2 4 31.1 12.6 11 30.8 12.6 5 28.7 13.9 12 33.1 11.8 6 29.8 14.2 13 28.8 13.6 7 32.2 11.9 14 31.1 12.2例:以例:以1987年全国地掷球男子单打决赛资料为例,计算年全国地掷球男子单打决赛资料为例,计算以滚靠技术成功率判断地掷球运动技术水平的有效性。以滚靠技术成功率判断地掷球运动技术水平的有效性。 比赛名次比赛名次 成功率成功率
38、 成功率排序成功率排序 序差(序差(d) d 1 29.2 2 -1 1 2 26.3 3 -1 1 3 31.2 1 2 4 4 19.4 6 2 4 5 25.7 4 1 1 6 21.7 5 1 1 7 19.3 7 0 0 8 16.9 8 0 0 ) 1(6122nndrs等级相关等级相关2d 两组数据之间的序差两组数据之间的序差sr 等级相关系数等级相关系数例:因子分析法进行效度检验例:因子分析法进行效度检验体质四因素模型因子分析各指标因子载荷(体质四因素模型因子分析各指标因子载荷(40岁以下)岁以下) 指指 标标 因因 子子 载载 荷荷 1 2 3 4 5仰卧起坐(俯卧撑)仰卧起
39、坐(俯卧撑) .966纵跳纵跳 .962抗病均分抗病均分 .811自然均分自然均分 .801社会均分社会均分 .759坐位体前屈坐位体前屈 .733肺活量肺活量 .675握力握力 .544单脚站立单脚站立 .719 选择反应时选择反应时 .707台阶指数台阶指数 .689体重体重/身高身高 .608因子因子 特征值特征值 贡献率贡献率 累计贡献率累计贡献率 因子权重因子权重1 1 1.991 16.595 16.595 0.25 1.991 16.595 16.595 0.252 2 1.934 1.934 16.11916.119 32.714 0.246 32.714 0.2463 3 1
40、.527 12.729 45.443 0.194 1.527 12.729 45.443 0.1944 4 1.219 10.155 55.598 0.155 1.219 10.155 55.598 0.1555 5 1.189 9.911 65.509 0.151 1.189 9.911 65.509 0.151体质四因素模型因子分析(体质四因素模型因子分析(4040岁以下)岁以下)例:羽毛球选材研究:例:羽毛球选材研究:第一轮初测指标体系(第一轮初测指标体系(共共 5 5类类2323项指标项指标)(1 1)机能指标:上、下肢无氧功率。)机能指标:上、下肢无氧功率。(2 2)素质指标:)素质
41、指标:2020米跑、米跑、400400米米5 5,1 1分钟跳绳,四角跑,分钟跳绳,四角跑,上肢对墙击球力度、立定跳远、纵跳。上肢对墙击球力度、立定跳远、纵跳。(3 3)技能指标:运动中持拍动作控制能力、用力感、关节)技能指标:运动中持拍动作控制能力、用力感、关节方向感。方向感。(4 4)心理指标:战术分析与决策,河内塔测试,:)心理指标:战术分析与决策,河内塔测试,:意志,意志,注意,动机,气质、个性稳定性、有恒性。注意,动机,气质、个性稳定性、有恒性。(5 5)形态指标:克托莱指数、上肢比例、下肢比例)形态指标:克托莱指数、上肢比例、下肢比例。 筛选指标的依据 专项理论:与制胜规律密切相关
42、的指标。专项理论:与制胜规律密切相关的指标。 方差分析:具有显著性差异的指标。方差分析:具有显著性差异的指标。 因子分析:类指标中因子载荷较大的指标因子分析:类指标中因子载荷较大的指标 综合评估:有差异但没有到达综合评估:有差异但没有到达0.050.05显著性水平,而从专显著性水平,而从专项理论角度分析该指标具有较强的代表性,也可考虑入选项理论角度分析该指标具有较强的代表性,也可考虑入选。指标筛选过程指标筛选过程1、初选指标:、初选指标:最初经专家调查,咨询和资料分析确定了最初经专家调查,咨询和资料分析确定了65个课题测试指标,测试中由于准确性原因,或难度大个课题测试指标,测试中由于准确性原因
43、,或难度大(如内分泌指标儿茶酚胺)剔除了(如内分泌指标儿茶酚胺)剔除了13个,确定了个,确定了52个研个研究指标究指标2、测试指标:、测试指标:对对52个指标采集后,经过专家分析和初步个指标采集后,经过专家分析和初步的数据统计处理,又淘汰了与成绩相关度非常低的指标,的数据统计处理,又淘汰了与成绩相关度非常低的指标,(男:(男:18个;女:个;女:14个)。个)。3、选材指标:、选材指标:经过分类逐步回归,确定:心理经过分类逐步回归,确定:心理8个,技术个,技术4个,机能个,机能5个,素质个,素质2个,男:个,男:13个;女:个;女:12个。个。5大类大类19项指标。项指标。例:射箭选材研究例:
44、射箭选材研究素质指标筛选素质指标筛选 Unstandardized CoefficientsStandardized Coefficientst Sig. BStd. ErrorBeta(Constant)1306.82149.441 26.432.000平衡能力-40.62313.951-.314-2.912.005上肢耐力.778.428.1961.820.073筛选结果(1 1)体能指标)体能指标 形态:克托莱指数,身高形态:克托莱指数,身高 机能:上肢无氧功率,下肢机能:上肢无氧功率,下肢5 5秒峰值功率,秒峰值功率, 下肢下肢3030秒平均功率秒平均功率 素质:立定跳远,专项跑动时素
45、质:立定跳远,专项跑动时(2 2)技战术能力:)技战术能力: 拍数拍数/ /回合回合 主动失误次数主动失误次数/ /总拍数总拍数(3 3)心理能力:)心理能力: 翻转反应时翻转反应时 操作思维步数操作思维步数 意志力意志力 指标鉴别性检验指标鉴别性检验 不同水平羽毛球男子运动员运动素质指标比较不同水平羽毛球男子运动员运动素质指标比较 立定跳远立定跳远( (m) m) 纵跳纵跳( (cm) 20cm) 20米米5(5(s) 1s) 1分钟跳绳分钟跳绳( (次次) )优秀组优秀组 2.61 2.610.14 48.640.14 48.644.72 19.114.72 19.110.60 123.7
46、50.60 123.759.249.24 一般组一般组 2.48 2.480.24 46.830.24 46.836.71 19.326.71 19.320.86 121.630.86 121.639.429.42协方差协方差 年龄年龄 0.01 0.01* * * 0.001 0.001* * * 0.001 0.001* * * 0.666 0.666 P P 值值 组别组别 0.05 0.05* * 0.596 0.676 0.432 0.596 0.676 0.432 四、影响有效性的因素四、影响有效性的因素1、受试群体特征:、受试群体特征:年龄、性别、能力的个体差异等;年龄、性别、能
47、力的个体差异等;2、样本含量及其代表性:、样本含量及其代表性:扩大样本含量,测量的可扩大样本含量,测量的可靠性提高,有效性也随之提高。应坚持随机抽样靠性提高,有效性也随之提高。应坚持随机抽样原则,以提高样本的代表性;原则,以提高样本的代表性;3、测量的可靠性:、测量的可靠性:可靠性是有效性的必要前提可靠性是有效性的必要前提4、效标的选择:、效标的选择:对于同一项测量手段,选择不同对于同一项测量手段,选择不同的效标,计算出来的效标有效性就不相同:的效标,计算出来的效标有效性就不相同:5、测量的难度与区分度:、测量的难度与区分度:测量难度适中时,区分测量难度适中时,区分度最高,有效性也会提高。度最高,有效性也会提高。测量的科学性专题作业测量的科学性专题作业1、归纳总结信度、效度的种类与估价方法、归纳总结信度、效度的种类与估价方法2、查阅有信度、效度检验的文献、查阅有信度、效度检验的文献5篇篇要求(要求(1)写明文章题目、作者、出处、时间)写明文章题目、作者、出处、时间 (2)估价信、效度的方法)估价信、效度的方法 (3)存在问题)存在问题 雷同作业无成绩雷同作业无成绩