1、LOGO第七章第七章 研究工具性能的测定研究工具性能的测定泰山医学院护理学院泰山医学院护理学院2022-6-21李李 蕾蕾2022-6-21教 学 目 标v掌握信度的概念和分类掌握信度的概念和分类v掌握效度的概念和分类掌握效度的概念和分类v掌握信度与效度的关系掌握信度与效度的关系v熟悉信度测量方法熟悉信度测量方法v熟悉效度的建立和测量的方法熟悉效度的建立和测量的方法v了解国外量表翻译的基本步骤了解国外量表翻译的基本步骤护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-212022-6-21你如何解释下述现象?你如何解释下述现象?一个很聪明的孩子,测得智商是一个很
2、聪明的孩子,测得智商是8080分分一个学习很好的学生,考试成绩为一个学习很好的学生,考试成绩为6060分分一个人缘很好的人,人际关系测量低于常一个人缘很好的人,人际关系测量低于常模值模值护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-212022-6-21 误差的含义误差的含义 在测量中与目的无关的因素所引起的在测量中与目的无关的因素所引起的不准确不准确或或不一致不一致效应。效应。不准确、不一致不准确、不一致不准确、一致不准确、一致准确、一致准确、一致测量误差测量误差护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21研究工具
3、的性能指标研究工具的性能指标v信度:可靠性(一致性)信度:可靠性(一致性)v效度:有效性效度:有效性2022-6-21无效度、无信度无效度、无信度有效度、有信度有效度、有信度无效度、有信度无效度、有信度2022-6-21效度效度信度信度表面效度表面效度内容效度内容效度效标效度效标效度结构效度结构效度评定者间信度评定者间信度重测信度重测信度内部一致性信度内部一致性信度复本信度复本信度2022-6-212022-6-21第一节第一节 信信 度度2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21一、信度的基本概念一、信度的基本概念 信度指研究工具
4、所获得结果的一致信度指研究工具所获得结果的一致程度。程度。 一个好的测量工具必须稳定可靠,即多一个好的测量工具必须稳定可靠,即多次测量的结果要保持一致。次测量的结果要保持一致。2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21信度的主要特征信度的主要特征v稳定性稳定性(stability)(stability)v内在一致性内在一致性(consistence)(consistence)v等同性等同性(equivalence)(equivalence)2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022
5、-6-21稳定性稳定性 用同一工具两次或多次测定同一研用同一工具两次或多次测定同一研究对象,所得结果的一致程度。一致程究对象,所得结果的一致程度。一致程度越高,工具的稳定性越好。度越高,工具的稳定性越好。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21内在一致性内在一致性组成研究工具的各项目之间的同质性组成研究工具的各项目之间的同质性 和内在相关性。内在相关性越大或同质性越和内在相关性。内在相关性越大或同质性越 好,工具的内在一致性越好,信度越高。好,工具的内在一致性越好,信度越高。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定202
6、2-6-21 等同性等同性 不同评定者使用相同工具同时测量相同不同评定者使用相同工具同时测量相同 对象时,评定者间的一致程度;或大致相同对象时,评定者间的一致程度;或大致相同 两个研究工具同时被用于研究对象,工具的两个研究工具同时被用于研究对象,工具的 一致程度。一致程度。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21二、信度的计算方法二、信度的计算方法折半信度评定者间信度复本信度护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21 (一)重测信度(一)重测信度(test-retest reliability)(test
7、-retest reliability)1.1.定义定义: : 用同一工具两次或多次测定同用同一工具两次或多次测定同一研究对象所得结果的一致程度。一研究对象所得结果的一致程度。 常表示研究工具的稳定性。一致常表示研究工具的稳定性。一致程度越高,重测信度越高,研究工具程度越高,重测信度越高,研究工具的稳定性越好。的稳定性越好。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-212.2.计算方法计算方法 使用研究工具对研究对象施行第一次测试使用研究工具对研究对象施行第一次测试, ,间隔一段时间后使用同一工具对同一研究对间隔一段时间后使用同一工具对同一研究对象进行重
8、测,然后计算两次资料的相关系数,象进行重测,然后计算两次资料的相关系数,该系数反映研究工具重测信度的高低。该系数反映研究工具重测信度的高低。 相关系数在相关系数在0 01 1之间,越接近之间,越接近1 1,说明重测信,说明重测信度越高。度越高。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定 研究对象研究对象第一次测试(第一次测试(X X) 第二次测试(第二次测试(Y Y)1 1232327272 2444438383 3353537374 4535349495 5444446466 6262628287 7323234348 8282825259 938383434101
9、039393636人格问卷重测数值表人格问卷重测数值表2022-6-21 第一次测试和第二次测试数据间的第一次测试和第二次测试数据间的相关系数即为人格问卷的重测信度。相关系数即为人格问卷的重测信度。 YX222222()()()()()()XYXYX X Y YnrX XY YXYXYnn 护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-213.使用重测信度需考虑的问题使用重测信度需考虑的问题(1)(1)两次测量之间的间隔时间:两次测量之间的间隔时间: 使第一次测量对第二次测量的结果使第一次测量对第二次测量的结果不会造成影响;不会造成影响; 在客观情况未发生改
10、变时进行;在客观情况未发生改变时进行;护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21时间间隔的把握时间间隔的把握v间隔时间越长,稳定性系数越低。适宜时间间隔间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至依照测验目的、性质及被试特点而定。几分钟至几年。几年。v年幼儿童,间隔要小;年长群体,间隔可大。年幼儿童,间隔要小;年长群体,间隔可大。 v一般间隔时间不超过六个月。(即不能让被试记一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,住上一次测验的内容,又不能让其特质发生变化,或对所学
11、知识产生遗忘)或对所学知识产生遗忘)2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21(2)(2)测量环境的一致测量环境的一致 尽量保证测量环境的一致,如相同尽量保证测量环境的一致,如相同的测试者、相同的测量程序、相同的的测试者、相同的测量程序、相同的测量时间、相同的测量环境等测量时间、相同的测量环境等2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21(3)(3)工具所测量的变量的性质:工具所测量的变量的性质: 对性质相对稳定的问题,如性格、对性质相对稳定的问题,如性格、价值观、生活质量
12、等进行测量,适宜用价值观、生活质量等进行测量,适宜用重测信度来表示研究工具的信度如何;重测信度来表示研究工具的信度如何; 对性质不稳定的问题,如情感、态对性质不稳定的问题,如情感、态度、知识等进行测量,则不宜使用重测度、知识等进行测量,则不宜使用重测信度来表示研究工具的信度如何。信度来表示研究工具的信度如何。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21(二)内在一致性信度(二)内在一致性信度v内在一致性(内在一致性(internal consistence)internal consistence)是指组成研究工具的各项目之间的同质是指组成研究工具的各
13、项目之间的同质性或内在相关性。性或内在相关性。内在相关性越好,说内在相关性越好,说明组成研究工具的各项目都在一致地测明组成研究工具的各项目都在一致地测量同一个问题或指标,也就是说明工具量同一个问题或指标,也就是说明工具的内在一致性越好,信度越高。的内在一致性越好,信度越高。2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21v折半信度折半信度vCronbachCronbach系数系数vKR-20KR-202022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21 1. 1.折半信度折半信度(spl
14、it-half reliability)(split-half reliability) 将将一种工具对一群人使用一次,将每一种工具对一群人使用一次,将每个人的结果分数按工具中各项目分成两组,个人的结果分数按工具中各项目分成两组,计算两组分数的相关系数。计算两组分数的相关系数。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21方法方法: : 前后折半法前后折半法 奇偶折半法奇偶折半法缺点缺点: : 不同的折半方法会导致不同的结果 一个10个条目的问卷可以有126种不同的折半方法!护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6
15、-212.Cronbach2.Cronbach系数系数v计算研究工具中所有项目间的平均相关程计算研究工具中所有项目间的平均相关程度,反映研究工具的内在一致。度,反映研究工具的内在一致。 K:测验的题目数;:测验的题目数; Si2 :某一题目分数的变异数;:某一题目分数的变异数; Sx2 :测验总分的变异数。:测验总分的变异数。 2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21 是是CronbachCronbach的一种特殊形式,用的一种特殊形式,用来反映研究工具的内在一致性。适用于二来反映研究工具的内在一致性。适用于二分制的研究工具,如回
16、答分制的研究工具,如回答“是是”或或“否否”、“正确正确”或或“错误错误”。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21表表1 PACIE各条目间相关矩阵各条目间相关矩阵项目项目面部面部表情表情声音声音/语言语言身体身体姿势姿势活动活动情绪情绪人际互动人际互动/交流交流生命生命体征体征睡眠睡眠总分总分面部表情面部表情-声音声音/语言语言0.69*-身体姿势身体姿势0.48*0.56*-活动活动0.55*0.62*0.35*-情绪情绪0.24*0.57* 0.21 0.19-人际互动人际互动/交流交流0.35*0.49*0.45*0.38*0.36*-生
17、命体征生命体征0.40*0.41*0.41*0.44*0.41*0.46*-睡眠睡眠0.67*0.54*0.57*0.41*0.28*0.41*0.46*-总分总分0.75*0.81*0.58*0.66*0.44*0.56*0.49*0.68*-注:注:*相关系数假设检验相关系数假设检验P0.05,*P0.01内部一致性信度内部一致性信度 量表总分的量表总分的Cronbach s Cronbach s 系数为系数为0.850.85。 护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21v表示研究工具的等同性(表示研究工具的等同性(equivalenceequi
18、valence)v评定者间信度(评定者间信度(interinterrater reliability)rater reliability) 不同的评定者使用相同工具,同时测量不同的评定者使用相同工具,同时测量相同对象时,计算一致性的程度。相同对象时,计算一致性的程度。 最简单的估计方法就是随机抽取若干份答最简单的估计方法就是随机抽取若干份答卷,由两个独立的评分者打分,再求每份卷,由两个独立的评分者打分,再求每份答卷两个评判分数的相关系数。答卷两个评判分数的相关系数。2022-6-21(三)评定者间信度(三)评定者间信度护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022
19、-6-21(四)复本信度(四)复本信度v任何测验只是所有可能题目中的一份取样(行为任何测验只是所有可能题目中的一份取样(行为样本),所以可编制许多平行的等值测验,叫做样本),所以可编制许多平行的等值测验,叫做复本。复本。v两个大致相同的研究工具同时被用于研究对象,两个大致相同的研究工具同时被用于研究对象,计算两种复本测量分数的相关系数,称为复本信计算两种复本测量分数的相关系数,称为复本信度(度(Alternate-form reliabilityAlternate-form reliability)。)。相关系数相关系数越大说明两个复本构成带来的变异越小。越大说明两个复本构成带来的变异越小。2
20、022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21A A卷:你是一个喜欢热闹的人吗?卷:你是一个喜欢热闹的人吗?1=1=绝对是绝对是 2=2=是是 3=3=不一定不一定 4=4=不是不是 5=5=绝对不是绝对不是2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21B B卷:你是一个喜欢安静的人吗?卷:你是一个喜欢安静的人吗?1=1=绝对是绝对是 2=2=是是 3=3=不一定不一定 4=4=不是不是 5=5=绝对不是绝对不是2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研
21、究工具性能的测定2022-6-21复本等值要符合下列条件:复本等值要符合下列条件:v 各份测验测量的是同一变量。各份测验测量的是同一变量。v 各份测验具有相同的形式。各份测验具有相同的形式。v 各份测验的题目不应重复。各份测验的题目不应重复。v 各份测验题目数量相等,难度和区分度大体相同。各份测验题目数量相等,难度和区分度大体相同。v 各份测验的分数分布(平均数和标准差)大致相等。各份测验的分数分布(平均数和标准差)大致相等。2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21研究工具信度的基本要求研究工具信度的基本要求1 1、通常通过预试验
22、测试研究工具的信度、通常通过预试验测试研究工具的信度2 2、报告研究工具的信度时,不仅要报告信度系数,、报告研究工具的信度时,不仅要报告信度系数,还应报告是何种信度,信度系数是如何计算的。还应报告是何种信度,信度系数是如何计算的。3 3、一般认为,研究工具重测信度和内部一致性信度、一般认为,研究工具重测信度和内部一致性信度系数应不小于系数应不小于0.70.7。而评定者信度和复本信度一般。而评定者信度和复本信度一般应达到应达到0.90.9以上。以上。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21第二节第二节 效效 度度(validity)2022-6-21
23、护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21一、效度的概念一、效度的概念v效度是测量的有效性,真正能反映他所期效度是测量的有效性,真正能反映他所期望研究的概念的程度,即一个工具对它所要望研究的概念的程度,即一个工具对它所要测量特质的准确程度。测量特质的准确程度。 效度回答两个问题:效度回答两个问题: 1.1.一个工具测评什么?一个工具测评什么? 2.2.一个工具对于所测量的变量,准到什么一个工具对于所测量的变量,准到什么程度?程度?2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21二、效度的测量二、
24、效度的测量v表面效度表面效度v内容效度内容效度v效标效度效标效度v结构效度结构效度2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-211 1、表面效度、表面效度(face validity)(face validity)v表面效度表面效度指测验给人的第一个印象指测验给人的第一个印象好像好像测测量甚么东西,而不是指测验事实上能测量量甚么东西,而不是指测验事实上能测量到什么东西。到什么东西。 2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21v 抑郁自评量表(SDS) A B C D EA B
25、 C D E1 1、我感到情绪沮丧,郁闷、我感到情绪沮丧,郁闷 2 2、我感到早晨心情最好、我感到早晨心情最好 3 3、我要哭或想哭、我要哭或想哭 4 4、我夜间睡眠不好、我夜间睡眠不好 5 5、我吃饭像平常一样多、我吃饭像平常一样多 6 6、我的性功能很正常、我的性功能很正常 7 7、我感到体重减轻、我感到体重减轻 8 8、我为便秘而烦恼、我为便秘而烦恼 9 9、我的心跳比平时快、我的心跳比平时快 1010、我无故感到疲劳、我无故感到疲劳 1111、我的头脑像往常一样清楚、我的头脑像往常一样清楚 1212、我做事情像平时一样不感到困难、我做事情像平时一样不感到困难 1313、我坐卧不安,难以
26、保持平静、我坐卧不安,难以保持平静 1414、我对未来感到有希望、我对未来感到有希望 1515、我比平时更容易激怒、我比平时更容易激怒 1616、我觉得作出决定是很容易的、我觉得作出决定是很容易的 1717、我感到自己是有用的和不可缺少的人、我感到自己是有用的和不可缺少的人 1818、我的生活很有意义、我的生活很有意义 1919、假若我死了别人会过得更好、假若我死了别人会过得更好 2020、我仍旧喜爱自己平时喜爱的东西、我仍旧喜爱自己平时喜爱的东西 2022-6-212022-6-21 表面效度表面效度是由评估人根据自己对所要测量是由评估人根据自己对所要测量概念的理解,尽其判断能力之所及来断定
27、概念的理解,尽其判断能力之所及来断定工具是否适当而做出的一种直觉判断。对工具是否适当而做出的一种直觉判断。对工具的效度用工具的效度用“有或无有或无”反映,未体现程反映,未体现程度。度。v表面效度一般不能作为工具质量的有力证表面效度一般不能作为工具质量的有力证据。据。2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-212 2、内容效度、内容效度( (content validitycontent validity) )v内容效度是根据理论基础及实际经验对工具内容效度是根据理论基础及实际经验对工具是否反映了所要测量的变量、是否包括足够是否反映了所
28、要测量的变量、是否包括足够的项目而且有恰当的内容分配比例所作出的的项目而且有恰当的内容分配比例所作出的判断。判断。指项目对欲测的内容或行为范围取样指项目对欲测的内容或行为范围取样的适当程度。的适当程度。2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21v一个测验要具备较好的内容效度必须满足两个条一个测验要具备较好的内容效度必须满足两个条件。件。 v要确定好内容范围,并使测验的全部项目均在要确定好内容范围,并使测验的全部项目均在此范围内。此范围内。v测验项目应是已界定的内容范围的代表性样本。测验项目应是已界定的内容范围的代表性样本。换句话说,
29、就是选出的项目能包含所测的内容范换句话说,就是选出的项目能包含所测的内容范围的主要方面,并且使各部分项目所占比例适当。围的主要方面,并且使各部分项目所占比例适当。具体做法是对内容范围进行系统分析,将该范围具体做法是对内容范围进行系统分析,将该范围划分为具体纲目,并对每个纲目作适当加权,然划分为具体纲目,并对每个纲目作适当加权,然后根据权重,从每个纲目中随机取样。后根据权重,从每个纲目中随机取样。 2022-6-212 2、内容效度、内容效度护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21v内容效度建立在大量文献查阅、工作经内容效度建立在大量文献查阅、工作经
30、验以及综合分析、判断的基础上,多由验以及综合分析、判断的基础上,多由有关专家委员会进行评议(专家效度有关专家委员会进行评议(专家效度) )。2022-6-212 2、内容效度、内容效度护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21实施要求:实施要求:1 1、专家人数、专家人数3-103-10人,以人,以5 5人较合适人较合适 2 2、专家的选择应与研究工具所涉及的领、专家的选择应与研究工具所涉及的领域有关域有关 3 3、两次评议时间最好间隔、两次评议时间最好间隔10-1410-14天天护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2
31、022-6-212022-6-21项目项目活动时活动时休息时休息时不相关不相关修改后修改后相关相关相关需相关需要小改要小改动动非常相非常相关关不相关不相关修改后修改后相关相关相关需相关需要小改要小改动动非常相非常相关关1.声音(非声音(非语言性)语言性):以以非词语形式非词语形式表达疼痛表达疼痛呻吟、叹气、呻吟、叹气、哼哼、哭泣、哼哼、哭泣、呼吸粗重呼吸粗重修改意见修改意见修改意见修改意见2.表情痛苦表情痛苦/退缩:皱眉、退缩:皱眉、闭眼抿唇、闭眼抿唇、咬牙、表情咬牙、表情扭曲扭曲修改意见修改意见修改意见修改意见 疼痛评分指南护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定
32、2022-6-21v内容效度的应用内容效度的应用 适合于测验所要测量的内容总体能够明确界定适合于测验所要测量的内容总体能够明确界定的情况的情况v主要缺点主要缺点 缺乏可靠的数量指标缺乏可靠的数量指标 妨碍各测验间的相互比较妨碍各测验间的相互比较2022-6-212 2、内容效度、内容效度护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-213 3、效标关联效度、效标关联效度(criterion-related validity)(criterion-related validity)v侧重反映研究工具与其他测量标准之侧重反映研究工具与其他测量标准之间的关系,考察
33、测验分数与效标的关间的关系,考察测验分数与效标的关系,属于实证效度系,属于实证效度, ,或统计效度。或统计效度。v根据测验的时间可分为:根据测验的时间可分为:同时效度(concurrent validity)预测效度(predictive validity)2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21预测效度与同时效度预测效度与同时效度 (1 1)同时效度:是指研究工具与现有标准同时效度:是指研究工具与现有标准之间的关系。之间的关系。如对一个人格测验的结果,如对一个人格测验的结果,可以用同学、家长对他人的评定作为效标。可以用同学、家长
34、对他人的评定作为效标。 (2 2)预测效度:测量工具作为未来情况预预测效度:测量工具作为未来情况预测指标的有效程度。测指标的有效程度。效标是过一段时间后效标是过一段时间后搜集得到。用智力测验的结果预测一个人搜集得到。用智力测验的结果预测一个人会不会成功,用人格测验预测人会不会患会不会成功,用人格测验预测人会不会患心理疾病。心理疾病。 2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21v同时效度的目的是检查测验测量现有的某同时效度的目的是检查测验测量现有的某种能力或特质的有效性,即描述当前状态种能力或特质的有效性,即描述当前状态时的有效性,而
35、预测效度则表明测验对某时的有效性,而预测效度则表明测验对某种行为的预测的有效性。种行为的预测的有效性。2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-214 4、结构效度、结构效度(construct validityconstruct validity) v反映工具与其所依据的理论或概念框架的反映工具与其所依据的理论或概念框架的相结合程度,是工具的内在属性。相结合程度,是工具的内在属性。v是指实验与理论之间的一致性,即实验是是指实验与理论之间的一致性,即实验是否真正测量到假设(构造)的理论。否真正测量到假设(构造)的理论。2022-6-21
36、护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21 重点是了解工具的内在属性,而不是使用工具测重点是了解工具的内在属性,而不是使用工具测得的分数。它主要回答得的分数。它主要回答“该工具到底在测量什该工具到底在测量什么?么?”,“使用该工具能否测量出被研究的抽象使用该工具能否测量出被研究的抽象概念?概念?”这类问题。这类问题。2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21 结构结构效度是目前最为严谨的一种建立效度是目前最为严谨的一种建立和测量研究工具效度的方法,也是最和测量研究工具效度的方法,也是最为复
37、杂的效度研究方法。为复杂的效度研究方法。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21例如:智力测验的结构效度检验例如:智力测验的结构效度检验v 对智力的构念,目前较为流行的观点认为智力代表了一个人获得、保对智力的构念,目前较为流行的观点认为智力代表了一个人获得、保持知识的能力,推理能力及适应环境的能力持知识的能力,推理能力及适应环境的能力 。v 根据智力的定义,可以推演出以下几点假设,根据智力的定义,可以推演出以下几点假设,1)智力不同于后天获)智力不同于后天获得的知识,因此与遗传因素有关,且更为稳定,得的知识,因此与遗传因素有关,且更为稳定,2)智力
38、会随着人的)智力会随着人的生理变化而发展变化,生理变化而发展变化,3)智力会影响人的学习成绩和事业成功。)智力会影响人的学习成绩和事业成功。v 为验证以上假设,可以从三方面着手:为验证以上假设,可以从三方面着手:1)计算同卵双生子、异卵双)计算同卵双生子、异卵双生子、其他同胞、非同胞间智商的相关,看相关系数是否依次降低;生子、其他同胞、非同胞间智商的相关,看相关系数是否依次降低;2)看智商与学业成绩间是否有高相关;)看智商与学业成绩间是否有高相关;3)智商是否随着年龄的增)智商是否随着年龄的增长而逐渐提高,在某一个阶段又是相对稳定的。长而逐渐提高,在某一个阶段又是相对稳定的。v 如果以上假设都
39、得到了证实,则说明所编的智力测验是有效的,如果如果以上假设都得到了证实,则说明所编的智力测验是有效的,如果假设得不到证实,则说明测验的效度不高。假设得不到证实,则说明测验的效度不高。 2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-212022-6-21癫痫生活质量量表癫痫生活质量量表2022-6-21v优势:优势: 促使研究者把着眼点放在提出假设、检验假设上,促使研究者把着眼点放在提出假设、检验假设上,使得测验成为理论研究的重要工具;使得测验成为理论研究的重要工具;v主要缺点:主要缺点: 有些构想概念模糊,没有一致的定义; 确定效度时没有明
40、确的操作步骤; 没有单一的数量指标来描述有效程度。2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21v主要通过因子分析,来判断结构效度。主要通过因子分析,来判断结构效度。v属于实证效度或统计效度。属于实证效度或统计效度。2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-212022-6-21信度高,并不保证效度就一定高;信度高,并不保证效度就一定高;但效度高的话,信度必然要高。但效度高的话,信度必然要高。信度是效度的必要条件。信度是效度的必要条件。护理研究护理研究 第七章第七章 研究工具性能
41、的测定研究工具性能的测定2022-6-21信度和效度关系信度和效度关系护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21 翻译和应用国外量表的原则:翻译和应用国外量表的原则: 1 1、不偏离原文的原意、不偏离原文的原意 2 2、适合中国的文化特点、适合中国的文化特点 3 3、译后的量表具有较好的信度和效度、译后的量表具有较好的信度和效度2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21翻译国外量表的步骤翻译国外量表的步骤
42、翻译回译检译护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-211 1、翻译、翻译l两个或多个既熟悉原量表语言又有较好汉两个或多个既熟悉原量表语言又有较好汉语功底的翻译者将国外量表翻译成中文;语功底的翻译者将国外量表翻译成中文;l注意直译与意译结合,使更适合中国文化注意直译与意译结合,使更适合中国文化特点;特点;l多个翻译版本进行集体讨论后形成中文版多个翻译版本进行集体讨论后形成中文版本的量表。本的量表。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-212 2、回译回译l请语言功底好、对源量表不知情的一位或多请语言功底好、对
43、源量表不知情的一位或多位翻译者将翻译成中文的量表再翻译回去;位翻译者将翻译成中文的量表再翻译回去;l将原量表与回译后的量表进行细致比较和分将原量表与回译后的量表进行细致比较和分析,找出不同的部分,并对中文版的相应内析,找出不同的部分,并对中文版的相应内容进行修改;容进行修改;l修改后的中文版进行表面效度检验。修改后的中文版进行表面效度检验。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-213 3、检译、检译l 寻找一定数量的既懂中文又懂源语言的样本对两寻找一定数量的既懂中文又懂源语言的样本对两种语言版本的量表进行作答,计算不同语言版本种语言版本的量表进行作答
44、,计算不同语言版本的量表得分的相关性。相关程度越高,表示两种的量表得分的相关性。相关程度越高,表示两种版本的等同性越好。版本的等同性越好。l 使用中文版本进行预试验,检测中文版量表的内使用中文版本进行预试验,检测中文版量表的内在一致性,并了解量表文字是否易于理解和符合在一致性,并了解量表文字是否易于理解和符合中国人的表达习惯。中国人的表达习惯。护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21脑卒中病人生活质量量表的编译脑卒中病人生活质量量表的编译 v 两两 位位 医学专家独立将量表从英文译成中文,医学专家独立将量表从英文译成中文,分别为译稿分别为译稿A1与
45、与A2v 两两 位位 专家对译稿专家对译稿A1,A 2进行讨论并总结修进行讨论并总结修改形成初稿改形成初稿B2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21v 通通 过过 两个核心工作组对初稿两个核心工作组对初稿B进行文化调适,进行文化调适,考察其概念等价性和语义等价性。一个核心工作考察其概念等价性和语义等价性。一个核心工作组由康复科医生组成,另一个核心工作组由脑卒组由康复科医生组成,另一个核心工作组由脑卒中患者组成。经过讨论,对初稿进一步修改,形中患者组成。经过讨论,对初稿进一步修改,形成成C稿。稿。v 另一位英文熟练的医学专家将另一位
46、英文熟练的医学专家将C稿逆向翻译为稿逆向翻译为英文。英文。v 核心工作组比较原文与回译稿,并对核心工作组比较原文与回译稿,并对C稿进行稿进行修改,形成修改,形成D稿。稿。2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21v 使用使用D稿对患者稿对患者/健康人群进行访问测试,检健康人群进行访问测试,检验其对内容的理解程度并进行修验其对内容的理解程度并进行修 改形成改形成E稿。稿。v E稿寄往稿寄往MAPI总部与其他版本交流比较,最总部与其他版本交流比较,最后定稿。后定稿。v 对量表进行心理测量学评价,即对其信度、对量表进行心理测量学评价,即对其信度、效度及反应度等性质进行考评。效度及反应度等性质进行考评。2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21举例举例v认知障碍老年人疼痛评估工具的研究认知障碍老年人疼痛评估工具的研究2022-6-21护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21教学目标回顾教学目标回顾护理研究护理研究 第七章第七章 研究工具性能的测定研究工具性能的测定2022-6-21