1、第六章第六章 临床研究的质量控制临床研究的质量控制 第一节 研究的真实性 第二节 研究的可靠性第一节 研究的真实性一、真实性一、真实性二、偏倚二、偏倚 三、选择偏倚三、选择偏倚四、信息偏倚四、信息偏倚五、混杂偏倚五、混杂偏倚六、交互作用的识别六、交互作用的识别1 1一、真实性一、真实性 真实性真实性 一系列观察或研究所作推论的正确及可靠程一系列观察或研究所作推论的正确及可靠程度,即所得结果反映了欲测试对象的真实情度,即所得结果反映了欲测试对象的真实情况。况。研究的真实性研究的真实性 在充分考虑了各种影响结论或推断的因素后,在充分考虑了各种影响结论或推断的因素后,将研究结果外推至样本以外人群时的
2、真实程将研究结果外推至样本以外人群时的真实程度,包括内部真实性和外部真实性。度,包括内部真实性和外部真实性。内部真实性内部真实性 internal validity 指一项能正确反映研究指一项能正确反映研究人群及目标人群真实状况的人群及目标人群真实状况的研究结果的外延性。研究结果的外延性。内部真实性强调研究结内部真实性强调研究结果是否无偏地反映了所研究果是否无偏地反映了所研究因素与疾病的真实联系。通因素与疾病的真实联系。通常受误差(随机误差和系统误差)影响。常受误差(随机误差和系统误差)影响。外部真实性外部真实性 external validity从研究中得出的联系可否被外推至不同时间、不同地
3、从研究中得出的联系可否被外推至不同时间、不同地区的不同人群。区的不同人群。1 1二、随机误差和系统误差二、随机误差和系统误差 误差可分为随机误差和系统误差。误差可分为随机误差和系统误差。以测量血压为例说明随机误差与系统误差之间的关系。以测量血压为例说明随机误差与系统误差之间的关系。某技术熟练医师测量某人舒张压先由动脉内插管动脉内插管反复测量,各次读数的均值为80mmHg80mmHg。此法虽然准确但在实际应用中有困难。再用血压计血压计反复测量,各次测量结果均在套管法测量值的右侧,其均值为90mmHg90mmHg。由血压计测量个体血压所得的数值相对于套管法测量的误差,即为系统误差系统误差,这显然是
4、由于检查器械和方法的不同所引起的。但是无论单用插管法测量还是单用血压计法依然有误差,这是随机误差随机误差,是由于机体血压本身就有瞬时变化和测量中的偶然因素所引起的,各自的变异结果均服从随机分布。观察 系统误差次数 随机误差 80 90 舒张压(mmHg)图2 动脉内插管法和血压计法测量舒张压值的分布 动脉内插管法血压计法随机误差第一节第一节 研究的真实性研究的真实性一、真实性一、真实性二、偏倚二、偏倚 三、选择偏倚三、选择偏倚四、信息偏倚四、信息偏倚五、混杂偏倚五、混杂偏倚六、交互作用的识别六、交互作用的识别二、偏倚二、偏倚(一)偏倚的定义(一)偏倚的定义 对所得观察资料的推理偏离真实值,或对
5、所得观察资料的推理偏离真实值,或自样本人群所得暴露变量与结果变量的联自样本人群所得暴露变量与结果变量的联系不能反映目标人群的暴露变量与结果变系不能反映目标人群的暴露变量与结果变量间的真实联系即谓之偏倚。量间的真实联系即谓之偏倚。偏倚是一种系统误差,具有方向性。偏倚是一种系统误差,具有方向性。正正方向,使原来的真实值被方向,使原来的真实值被夸大夸大,负负方向,使原来的真实值被方向,使原来的真实值被缩小缩小。(二)(二)偏倚的偏倚的方向方向偏向偏向A.B.C.颠倒偏倚颠倒偏倚 switchover bias 当当 RR(RR()0.50.5,RR()RR()1.51.5,或反之,即所产生的偏倚跨过
6、零效应值或反之,即所产生的偏倚跨过零效应值1.01.0,由保护效应偏离为危险效应,或由危险效应由保护效应偏离为危险效应,或由危险效应偏离为保护效应。偏离为保护效应。颠倒偏倚使偏倚的结论走向原真实情况颠倒偏倚使偏倚的结论走向原真实情况的反面,歪曲了真相。的反面,歪曲了真相。(三)偏倚的种类(三)偏倚的种类 临床研究从设计、实施、分析至推断过程中均临床研究从设计、实施、分析至推断过程中均可发生偏倚。偏倚可存在于各种类型的研究中。偏可发生偏倚。偏倚可存在于各种类型的研究中。偏倚发生的环节繁多,形式各异,大致可分为以下三倚发生的环节繁多,形式各异,大致可分为以下三类:类:1.1.选择偏倚选择偏倚:主要
7、发生在研究的设计阶段:主要发生在研究的设计阶段 如入院率偏倚、奈曼偏倚和检出征候偏倚等。如入院率偏倚、奈曼偏倚和检出征候偏倚等。2.2.信息偏倚信息偏倚:主要发生在研究的实施阶段:主要发生在研究的实施阶段 如报告偏倚、调查者偏倚和回忆偏倚等。如报告偏倚、调查者偏倚和回忆偏倚等。3.3.混杂偏倚混杂偏倚:主要发生在研究的设计和分析阶段:主要发生在研究的设计和分析阶段第一节 研究的真实性一、真实性一、真实性二、偏倚二、偏倚 三、选择偏倚三、选择偏倚四、信息偏倚四、信息偏倚五、混杂偏倚五、混杂偏倚六、交互作用的识别六、交互作用的识别三、三、选择偏倚选择偏倚 selection bias (一)定义(
8、一)定义 医学研究过程中,从按一定的条件纳入的研医学研究过程中,从按一定的条件纳入的研究对象中获得的有关因素与疾病的联系,不究对象中获得的有关因素与疾病的联系,不同于目标人群中该因素与疾病之间的真实联同于目标人群中该因素与疾病之间的真实联系,即认为有选择偏倚存在。系,即认为有选择偏倚存在。(二)种类(二)种类 1.1.检出征候偏倚检出征候偏倚 detection signal bias 由于某因素的存在而引起某种疾病症候出现,使患者由于某因素的存在而引起某种疾病症候出现,使患者提早就诊,导致该病的检出率增高,形成所研究因素与疾提早就诊,导致该病的检出率增高,形成所研究因素与疾病有关的假象。病有
9、关的假象。口服雌激素口服雌激素子宫内膜癌的关系子宫内膜癌的关系 服雌激素者易发生子宫出血而去医院就诊从而被发现服雌激素者易发生子宫出血而去医院就诊从而被发现子宫内膜癌而被选入病例组,因而病例组中选择地纳入大子宫内膜癌而被选入病例组,因而病例组中选择地纳入大量口服雌激素的子宫内膜癌患者。进一步分析可见服用雌量口服雌激素的子宫内膜癌患者。进一步分析可见服用雌激素的病人中激素的病人中7979为早期子宫内膜癌病人,未服用病例中为早期子宫内膜癌病人,未服用病例中早期病例为早期病例为5555。2.2.诊断偏倚诊断偏倚 diagnostic bias 当临床医生对暴露者与非暴露者采用不同的诊断或报告当临床医
10、生对暴露者与非暴露者采用不同的诊断或报告标准时,例如,疾病没有严格的统一诊断标准时,临床医标准时,例如,疾病没有严格的统一诊断标准时,临床医生可能根据所掌握的有关危险因素与疾病发生的知识诊断生可能根据所掌握的有关危险因素与疾病发生的知识诊断病人,从而使病例对照研究中病例的暴露史在研究开始前病人,从而使病例对照研究中病例的暴露史在研究开始前就部分设定。由此造成的诊断上的偏倚称为诊断偏倚。就部分设定。由此造成的诊断上的偏倚称为诊断偏倚。内用卫生棉条内用卫生棉条中毒性休克综合征中毒性休克综合征 医生获得上述两者之间的关系后,会有意或无意地将:医生获得上述两者之间的关系后,会有意或无意地将:有相关症状
11、有相关症状经期内用卫生棉条经期内用卫生棉条使用使用史史+的妇女,大多的妇女,大多经期内用卫生棉条使用史经期内用卫生棉条使用史-的妇女,较少的妇女,较少诊断:诊断:中毒性中毒性休克综休克综合征合征因而夸大了内用卫生棉条与中毒性休克综合征间的关系。因而夸大了内用卫生棉条与中毒性休克综合征间的关系。3.3.入院率偏倚入院率偏倚 admission rate bias 伯克森偏倚伯克森偏倚 Berksons bias 指在以医院为基础的病例对照研究中,指在以医院为基础的病例对照研究中,由于所比较各组入院率不同而导致的偏倚由于所比较各组入院率不同而导致的偏倚。表1 以社区为基础的病例对照研究中吸烟与疾病
12、A的关系 吸烟 不吸烟 总人数 吸烟者的比例 病例(A)200 800 1000 20 对照(B)200 800 1000 20 OR=(200800)/(200800)=1 设设:某人群中患某人群中患A A病和患病和患B B病者各为病者各为10001000人人,患患A A病和病和B B病的患者中各有病的患者中各有20%20%的人吸烟。的人吸烟。如表所示。如表所示。1A病又吸烟的200人中,(1)因A病住院率为50,其住院人数为100人(20050%)(2)吸烟者入院率为40%,则余下的100人(200-100)中,40人(10040)住院,合计合计:A病又吸烟者住院人数140人(100+40
13、)。2.病而不吸烟的800人中,因A病住院率为50%,住院人数为400人(80050%)。设:患A病的入院率为50%,B病的入院率为20%,吸烟者入院率为40%,这样实际住院人数应为:3 3B B病又吸烟的病又吸烟的200200人中,人中,(1)(1)因因B B病住院率为病住院率为2020,其住院人数为,其住院人数为4040人(人(20020020%20%););(2)(2)吸烟者入院率为吸烟者入院率为40%40%,则余下的,则余下的160160人(人(200-40200-40)中,)中,6464人(人(1601604040)住院,)住院,合计合计:B:B病又吸烟者住院人数病又吸烟者住院人数1
14、04104人人(40+64)(40+64)。4 4B B病而不吸烟的病而不吸烟的800800人中,人中,因因B B病住院率为病住院率为20%20%,住院人数为,住院人数为160160人(人(80080020%20%)。)。表2 以医院为基础的病例对照研究中吸烟与疾病A的关系 疾病 吸烟者 不吸烟者 总人数 吸烟者的比例 病例(A)140 400 540 25.93 对照(B)104 160 264 39.39 OR=(140OR=(140160)/(400160)/(400104)=0.54104)=0.54OR=15.5.现患病例现患病例新发病例偏倚新发病例偏倚 prevalence-inc
15、idence bias 奈曼偏倚,奈曼偏倚,Neyman bias 病例对照研究病例对照研究 队列研究队列研究 结论不一致结论不一致 往往只纳入现患病例往往只纳入现患病例或存活病例,即同时或存活病例,即同时纳入新、旧病例纳入新、旧病例.而不包括死亡病例和而不包括死亡病例和那些病程短的病例。那些病程短的病例。新发病例新发病例病情、病型、病程病情、病型、病程和预后等都不尽相和预后等都不尽相同,既往暴露状况同,既往暴露状况也各有特点。也各有特点。现患病例现患病例:相当部分可能为相当部分可能为“生物学上的强者生物学上的强者”有时会主动更改对危险因素的暴露有时会主动更改对危险因素的暴露P.985-35-
16、36.6.无应答偏倚无应答偏倚 nonresponse bias 现况调查中由于调查对象不合作或不参加调查,现况调查中由于调查对象不合作或不参加调查,降低了研究的应答率,或在病例对照研究和队列降低了研究的应答率,或在病例对照研究和队列研究中各比较组应答率的不同,从应答人群中得研究中各比较组应答率的不同,从应答人群中得出的有关研究因素与疾病的联系不能反映两者间出的有关研究因素与疾病的联系不能反映两者间的真实联系。的真实联系。无应答偏倚不仅影响对象的代表性,当使用缺失无应答偏倚不仅影响对象的代表性,当使用缺失值处理软件来处理无应答者和失访者资料时,产值处理软件来处理无应答者和失访者资料时,产生的偏
17、倚可同时涉及选择偏倚和信息偏倚。生的偏倚可同时涉及选择偏倚和信息偏倚。7.7.志愿者偏倚志愿者偏倚 volunteer bias 志愿参加观察研究者同非志愿者在关心健康、注志愿参加观察研究者同非志愿者在关心健康、注意饮食卫生及营养食疗、禁烟禁酒、坚持锻炼等方面意饮食卫生及营养食疗、禁烟禁酒、坚持锻炼等方面有系统差异,因志愿者常被入选为观察对象,而非志有系统差异,因志愿者常被入选为观察对象,而非志愿者常落选,故这样的观察或研究结果肯定存在选择愿者常落选,故这样的观察或研究结果肯定存在选择偏倚,这种偏倚称为志愿者偏倚偏倚,这种偏倚称为志愿者偏倚。例如,在例如,在体育锻炼预防冠心病体育锻炼预防冠心病
18、的观察研究中,志愿参加者作为的观察研究中,志愿参加者作为试验组,而将非志愿者作为对照,以比较该项措施的效果。这试验组,而将非志愿者作为对照,以比较该项措施的效果。这当然是得不出正确结论的当然是得不出正确结论的。8.8.失访偏倚失访偏倚 loss to follow-up bias 由于失访而引起的偏倚称为失访偏倚。由于失访而引起的偏倚称为失访偏倚。失访也是一种特殊的无应答形式,只是它主要发生在前瞻性失访也是一种特殊的无应答形式,只是它主要发生在前瞻性队列研究及临床试验中。队列研究及临床试验中。失访基本上有两种:失访基本上有两种:失访失访 被动失访,一般同所观察的暴露因素或结果被动失访,一般同所
19、观察的暴露因素或结果 无关,统计学处理时将这种失访当作截尾数据无关,统计学处理时将这种失访当作截尾数据 处理,若数量不大,不至于引起偏倚。处理,若数量不大,不至于引起偏倚。退出退出主动退出,一般同所研究的暴露因素或结果有关,主动退出,一般同所研究的暴露因素或结果有关,统计处理时也当作截尾数据处理。若数量较大,统计处理时也当作截尾数据处理。若数量较大,且与研究中的有关变量牵连,则将产生偏倚。且与研究中的有关变量牵连,则将产生偏倚。不能因为不能因为A组和组和B组失访人数相同而采纳,而应了解各组组失访人数相同而采纳,而应了解各组失访的可能原因及结局,从而纠正编倚。失访的可能原因及结局,从而纠正编倚。
20、失访产生的偏倚可同时涉及选择偏倚和信息偏倚。失访产生的偏倚可同时涉及选择偏倚和信息偏倚。(50/500)/(20/500)=2.5(30/450)/(20/450)=1.5P.99P.995-45-45-55-59.9.健康工人效应健康工人效应 healthy worker bias 在职业流行病学研究时,当选择接触某种职业危险在职业流行病学研究时,当选择接触某种职业危险因素的工人作为观察对象时,很可能这些工人都是因素的工人作为观察对象时,很可能这些工人都是留下来不易患所研究疾病的人群,而对该危险因素留下来不易患所研究疾病的人群,而对该危险因素敏感的那些工人可能早已转出而失访,由此可能会敏感的
21、那些工人可能早已转出而失访,由此可能会发现暴露于该因素者,某些疾病的死亡率或发病率发现暴露于该因素者,某些疾病的死亡率或发病率反而比一般人群低,这种偏倚称为健康工人效应。反而比一般人群低,这种偏倚称为健康工人效应。这并不能表明,木尘暴露可降低呼吸系统疾病的这并不能表明,木尘暴露可降低呼吸系统疾病的危险性。相反,这可能反映出健康工人效应。危险性。相反,这可能反映出健康工人效应。因为非暴露组人群中包括未从事家具制造业的人员或由于因为非暴露组人群中包括未从事家具制造业的人员或由于工种(劳动强度较大)的要求被排除在外的人员(身体条件较工种(劳动强度较大)的要求被排除在外的人员(身体条件较差或危险人群)
22、,因此所比较结果很可能是一种负偏倚。差或危险人群),因此所比较结果很可能是一种负偏倚。有人开展了一项历史性队列研究,来评价接有人开展了一项历史性队列研究,来评价接触木尘对呼吸系统疾病死亡率的影响。触木尘对呼吸系统疾病死亡率的影响。家具制造厂的工人家具制造厂的工人 暴露组暴露组全人群全人群非暴露组非暴露组(年龄、性别和种族等可比)呼吸系统疾病呼吸系统疾病的死亡率死亡率10.10.时间效应偏倚时间效应偏倚 time effect bias 许多慢性病,自接触有效暴露之日起至出现临床许多慢性病,自接触有效暴露之日起至出现临床表现止,其间经过一段漫长的潜隐过程,在此期表现止,其间经过一段漫长的潜隐过程
23、,在此期间他们实际上是有暴露史但未出现症状或未能用间他们实际上是有暴露史但未出现症状或未能用现有检查手段发现疾病的病人,因此,常被归入现有检查手段发现疾病的病人,因此,常被归入健康对照组内。如此产生的偏倚称为时间效应偏健康对照组内。如此产生的偏倚称为时间效应偏倚。倚。11.11.领先时间偏倚领先时间偏倚 lead time bias 有些慢性病,例如肿瘤,自临床表现出现并被诊断后,经治有些慢性病,例如肿瘤,自临床表现出现并被诊断后,经治疗,它的平均存活期是疗,它的平均存活期是2 2年。若在健康人群中进行筛检这类年。若在健康人群中进行筛检这类疾病,使这类病人在其症状出现前疾病,使这类病人在其症状
24、出现前3 3个月被检出,并被诊断个月被检出,并被诊断和治疗,平均存活期约和治疗,平均存活期约2 2年年3 3个月,于是认为,筛检能使该病个月,于是认为,筛检能使该病延长生存期平均约延长生存期平均约3 3个月。这实际上为领先时间偏倚。因为个月。这实际上为领先时间偏倚。因为延长的延长的 3 3个月是我们提早发现病人的时间,即领先时间,实个月是我们提早发现病人的时间,即领先时间,实际上病人的生存期自出现临床表现算起并未延长。际上病人的生存期自出现临床表现算起并未延长。筛检筛检症状出现症状出现诊断时间诊断时间存活时间存活时间2 2年年3 3个月个月2 2年年3 3个月个月(三三)选择偏倚的控制选择偏倚
25、的控制 1.1.研究设计阶段研究设计阶段 (1)(1)建立健全的健康监测系统建立健全的健康监测系统 控制选择偏倚的关键在于获取有代表性的研究控制选择偏倚的关键在于获取有代表性的研究样本,而只有建立健全的健康监测系统(样本,而只有建立健全的健康监测系统(health health information systeminformation system,HISHIS),掌握全人群有关暴),掌握全人群有关暴露和疾病的信息,才能最大限度地获取人群中有代露和疾病的信息,才能最大限度地获取人群中有代表性的样本。表性的样本。(2 2)采用严格科学的研究设计)采用严格科学的研究设计 在研究设计过程中应明确定
26、义目标人群和研究人群,根据研在研究设计过程中应明确定义目标人群和研究人群,根据研究的性质预测样本建立过程中可能产生的各种选择性偏倚,究的性质预测样本建立过程中可能产生的各种选择性偏倚,并采取相应的措施以减少或控制选择性偏倚的发生。若选择并采取相应的措施以减少或控制选择性偏倚的发生。若选择性偏倚可能与潜在的混杂因素有联系,则可通过对研究对象性偏倚可能与潜在的混杂因素有联系,则可通过对研究对象加以限制或精确地测量该因素,以便在分析过程中加以控制。加以限制或精确地测量该因素,以便在分析过程中加以控制。临床试验临床试验:随机分组随机分组 病例对照研究病例对照研究:病例类型病例类型 两种以上的对照两种以
27、上的对照 队列研究队列研究:多个比较组多个比较组 所有纳入研究的对象都必须符合事先设立的所有纳入研究的对象都必须符合事先设立的纳入标准,包括疾病诊断标准和暴露判别标纳入标准,包括疾病诊断标准和暴露判别标准。准。应尽可能选取合格的新发病例,应尽可能选取合格的新发病例,避免来自存活避免来自存活者的偏倚。者的偏倚。(3)明确对象纳入标准,明确对象纳入标准,统一疾病诊断和监测程序统一疾病诊断和监测程序2.2.资料收集阶段资料收集阶段(1 1)加强随访,提高应答率)加强随访,提高应答率 在队列研究和干预试验的实施过程中应动态地掌握整个队在队列研究和干预试验的实施过程中应动态地掌握整个队列的变迁,定期随访
28、、记录队列中有关暴露与疾病的变化,列的变迁,定期随访、记录队列中有关暴露与疾病的变化,做好研究的宣传和解释工作,减少中途退出和失访。做好研究的宣传和解释工作,减少中途退出和失访。现况调查中应尽量减少无应答的发生。可通过各种途径增现况调查中应尽量减少无应答的发生。可通过各种途径增加对象对研究意义的了解,减少研究结对象带来的不便。加对象对研究意义的了解,减少研究结对象带来的不便。当无应答率大于当无应答率大于1010时,应以无应答者的随机样本来比较时,应以无应答者的随机样本来比较其与应答者有关敏感信息的可比性,从而估计无应答偏倚其与应答者有关敏感信息的可比性,从而估计无应答偏倚对研究结果的影响程度。
29、对研究结果的影响程度。(2 2)尽可能收集有关暴露史的详细信息)尽可能收集有关暴露史的详细信息 暴露程度、时间、暴露改变以及原因暴露程度、时间、暴露改变以及原因 (3 3)确保疾病的诊断不是依据暴露史而得出)确保疾病的诊断不是依据暴露史而得出 3.3.数据分析阶段数据分析阶段 基线特征比较:基线特征比较:应答者应答者-无应答者无应答者 完成随访者完成随访者-中途退出者中途退出者 估计伯克森偏倚:不同对象入院率估计伯克森偏倚:不同对象入院率 第一节 研究的真实性一、真实性一、真实性二、偏倚二、偏倚 三、选择偏倚三、选择偏倚四、信息偏倚四、信息偏倚五、混杂偏倚五、混杂偏倚六、交互作用的识别六、交互
30、作用的识别 四、四、信息偏倚信息偏倚 information bias (一)定义一)定义 指研究实施过程中,由于所收集的有关暴露或疾病指研究实施过程中,由于所收集的有关暴露或疾病的信息不准确或不完整,造成对研究对象或结果的的信息不准确或不完整,造成对研究对象或结果的归类错误。信息偏倚可来自对各种医疗和监测记录归类错误。信息偏倚可来自对各种医疗和监测记录的摘录过程,也可来自调查表询问和疾病报告过程的摘录过程,也可来自调查表询问和疾病报告过程。又称又称 观察偏倚观察偏倚 observation bias 错分偏倚错分偏倚 misclassification bias(二)信息偏倚的种类(二)信息
31、偏倚的种类 1.1.错分偏倚错分偏倚 (1 1)回忆偏倚)回忆偏倚 recall bias所调查的因素发生于过去,由于调查者记忆失真或不完整造所调查的因素发生于过去,由于调查者记忆失真或不完整造成结论的系统误差成结论的系统误差。多见于病例对照研究和回顾性队列研究。多见于病例对照研究和回顾性队列研究。既往经历对病例和非病例的意义往往不同,病例组对既往暴露既往经历对病例和非病例的意义往往不同,病例组对既往暴露情况的记忆深度和详细程度通常较对照组为甚,由此造成了回情况的记忆深度和详细程度通常较对照组为甚,由此造成了回忆偏倚在各比较组中分布不同。忆偏倚在各比较组中分布不同。如果对象因种种原因如高龄、年
32、幼、重病或死亡不能直接如果对象因种种原因如高龄、年幼、重病或死亡不能直接应答而由其配偶、父母、子女或其他亲属代理时,所获得的准应答而由其配偶、父母、子女或其他亲属代理时,所获得的准确性还受到被询问代理者的记忆和对对象的了解程度的影响,确性还受到被询问代理者的记忆和对对象的了解程度的影响,由此导致的偏倚又称由此导致的偏倚又称代理者偏倚代理者偏倚(surrogate biassurrogate bias)。)。欲研究类风湿关节炎的家族史,发现类风湿关节炎的病人欲研究类风湿关节炎的家族史,发现类风湿关节炎的病人比对照更有可能提供阳性家族史。然而,再从病例家庭中未比对照更有可能提供阳性家族史。然而,再
33、从病例家庭中未患该病的同胞兄弟姐妹中调查发现,阳性家族史和对照组相患该病的同胞兄弟姐妹中调查发现,阳性家族史和对照组相比,这种联系就不存在了。比,这种联系就不存在了。(2 2)报告偏倚)报告偏倚 reporting bias 研究对象对某些信息的故意夸大或缩小。研究对象对某些信息的故意夸大或缩小。当暴露因素涉及到生活方式或隐私如饮酒、当暴露因素涉及到生活方式或隐私如饮酒、收入水平、婚姻生育史和性行为时,被研究对象收入水平、婚姻生育史和性行为时,被研究对象会因种种原因而隐瞒或编造有关信息,有时代理会因种种原因而隐瞒或编造有关信息,有时代理者也会为了病人或死者的声誉而故意隐瞒某些不者也会为了病人或
34、死者的声誉而故意隐瞒某些不良暴露史,从而影响了所提供信息的准确性,导良暴露史,从而影响了所提供信息的准确性,导致报告偏倚发生。致报告偏倚发生。报告偏倚的影响因其在各比较组的发生程度报告偏倚的影响因其在各比较组的发生程度而异,其作用同样是双向的。而异,其作用同样是双向的。(3 3)调查者偏倚)调查者偏倚 interviewer bias 调查者在收集、记录和解释来自研究对象的调查者在收集、记录和解释来自研究对象的信息时发生的偏倚称为调查者偏倚。信息时发生的偏倚称为调查者偏倚。由于研究者渴望建立并验证某些因素的作用,往往会由于研究者渴望建立并验证某些因素的作用,往往会尽其所能地去主动发现和诱导对象
35、提供所需要的信息,最尽其所能地去主动发现和诱导对象提供所需要的信息,最终影响了各比较组中对暴露或疾病状况的认定。终影响了各比较组中对暴露或疾病状况的认定。病例对照研究病例对照研究 暴露因素暴露因素 队列研究和干预试验队列研究和干预试验 诊断和发现疾病诊断和发现疾病 (4 4)测量偏倚)测量偏倚 measurement bias 由于研究中所使用的仪器、设备、试剂、方法由于研究中所使用的仪器、设备、试剂、方法和条件的不精良、不标准、不统一,或研究指标设和条件的不精良、不标准、不统一,或研究指标设定不合理、数据记录不完整定不合理、数据记录不完整,造成研究结果系统地造成研究结果系统地偏离其真值的现象
36、。偏离其真值的现象。可发生在各种流行病学研究的设计、实施和资可发生在各种流行病学研究的设计、实施和资料处理过程中。料处理过程中。例如,同一调查过程的不同调查点使用的仪器例如,同一调查过程的不同调查点使用的仪器型号,或使用年限不同,或精确度差异较大;各调型号,或使用年限不同,或精确度差异较大;各调查点对同一研究指标采用不同的实验室检测方法,查点对同一研究指标采用不同的实验室检测方法,或尽管使用同一检测方法,但其检测试剂的供货商、或尽管使用同一检测方法,但其检测试剂的供货商、品牌或批号不同等。品牌或批号不同等。(二)信息偏倚的种类(二)信息偏倚的种类1.1.错分偏倚错分偏倚2.2.均数回归趋势均数
37、回归趋势3.3.生态学偏倚生态学偏倚 生态学谬误是研究方法本身的局限性所致生态学谬误是研究方法本身的局限性所致(三)信息偏倚的测量(三)信息偏倚的测量 信息偏倚的主要表现形式为错误分类,无论是暴露信息偏倚的主要表现形式为错误分类,无论是暴露状态、疾病结果还是混杂因素都可发生错分。状态、疾病结果还是混杂因素都可发生错分。1.1.错分测量的灵敏度和特异度错分测量的灵敏度和特异度 对于错分,不管是病例对照研究还是队列研对于错分,不管是病例对照研究还是队列研究,都可根据错分的灵敏度和特异度来估计究,都可根据错分的灵敏度和特异度来估计其对危险度的影响,此处以病例对照研究为其对危险度的影响,此处以病例对照
38、研究为例来加以阐述。例来加以阐述。病例组:暴露对象被分类为暴露的概率病例组:暴露对象被分类为暴露的概率=灵敏度灵敏度 (Se)Se)非暴露对象被分类为非暴露的概率非暴露对象被分类为非暴露的概率=特异度特异度(Sp)Sp)Se=54/60=0.9 Sp=28/40=0.7对照组:对照组:Se=18/30=0.6 Sp=63/70=0.9 在有已知或估计的在有已知或估计的Se和和Sp的情况下,可计算调整的情况下,可计算调整的的OR。设:。设:a、b、c、d为调整前的四格表内相应为调整前的四格表内相应 值,值,A、B、C、D为调整后四格表内相应值为调整后四格表内相应值(表(表69)(四四)信息偏倚的
39、控制信息偏倚的控制 信息偏倚主要来自资料收集和解释过程中的不正确信息,信息偏倚主要来自资料收集和解释过程中的不正确信息,而产生这些不正确信息的原因可以是研究对象本身的记忆误而产生这些不正确信息的原因可以是研究对象本身的记忆误差,也可以由研究者的态度或方法不当所致,差,也可以由研究者的态度或方法不当所致,更重要的是在研究设计过程中对调查表设计、指标设立和检更重要的是在研究设计过程中对调查表设计、指标设立和检测方法的选择缺乏科学性和合理性。测方法的选择缺乏科学性和合理性。因此,控制信息偏倚就要在研究的不同阶段控制和消除影响因此,控制信息偏倚就要在研究的不同阶段控制和消除影响信息准确性的各种因素。信
40、息准确性的各种因素。1.1.研究设计阶段研究设计阶段 暴露因素暴露因素 有严格、客观的定义,并力求指标定量化。有严格、客观的定义,并力求指标定量化。疾病诊断标准疾病诊断标准 统一、明确统一、明确 调查表项目调查表项目 应易于理解和回答应易于理解和回答 获取研究对象配合和支持获取研究对象配合和支持 知情知情 同意同意 质量控制程序质量控制程序 严格培训调查员;定期检查资料的质量严格培训调查员;定期检查资料的质量2.2.资料收集阶段资料收集阶段 在研究中可对同一内容以不同的形式重复询问,以帮助对象在研究中可对同一内容以不同的形式重复询问,以帮助对象回忆并检验其应答的可信性。回忆并检验其应答的可信性
41、。可在询问中使用实物等定量可在询问中使用实物等定量,以便于对象理解并准确地定量。以便于对象理解并准确地定量。为了避免主观诱导对象,应严格培训调查员,尽可能为了避免主观诱导对象,应严格培训调查员,尽可能“盲法盲法”研究中的各种测量仪器、试剂和方法都应标准化。研究中的各种测量仪器、试剂和方法都应标准化。3.3.资料分析阶段资料分析阶段对错误分类的结果,可进一步在资料分析过程中加对错误分类的结果,可进一步在资料分析过程中加以测量、校正,必要时可进行相应的灵敏度分析。以测量、校正,必要时可进行相应的灵敏度分析。第一节第一节 研究的真实性研究的真实性一、真实性一、真实性二、偏倚二、偏倚 三、选择偏倚三、
42、选择偏倚四、信息偏倚四、信息偏倚五、混杂偏倚五、混杂偏倚六、交互作用六、交互作用五、五、混杂偏倚混杂偏倚 confounding bias (一)定义(一)定义 在流行病学研究中,由于一个或多个外来因素在流行病学研究中,由于一个或多个外来因素(又称第三因子)的存在,掩盖或夸大了研究因素(又称第三因子)的存在,掩盖或夸大了研究因素与疾病(或事件)的联系,从而部分或全部地歪曲与疾病(或事件)的联系,从而部分或全部地歪曲了两者之间的真实联系,称为混杂偏倚或混杂。引了两者之间的真实联系,称为混杂偏倚或混杂。引起混杂的因素称为混杂因子(起混杂的因素称为混杂因子(confounderconfounder)
43、。)。混杂可在队列研究中发生,也可在病例对照研混杂可在队列研究中发生,也可在病例对照研究中发生。究中发生。(二)形成混杂的条件(二)形成混杂的条件 假设:暴露因素假设:暴露因素 E E 研究的疾病研究的疾病D D 如果如果 混杂因子混杂因子F F 则应满足如下条件:则应满足如下条件:F F必须与必须与D D的发生有关,是该疾病的危险因素之一;的发生有关,是该疾病的危险因素之一;F F必须与必须与E E有统计学联系;有统计学联系;F F必须不是必须不是E E与与D D病因链上的中间环节或中间步骤。病因链上的中间环节或中间步骤。满足这些基本条件的满足这些基本条件的F F如果在所比较的各组间分如果在
44、所比较的各组间分布不均,就可导致混杂偏倚的发生。布不均,就可导致混杂偏倚的发生。在研究在研究体育锻炼体育锻炼心肌梗死心肌梗死的关系时,的关系时,年龄年龄可能影响两者之间的真实联系。可能影响两者之间的真实联系。非锻炼组非锻炼组锻炼组锻炼组 年轻者年轻者比例较高比例较高 年长者年长者比例较高比例较高心肌梗死心肌梗死危险性危险性 高估体育锻炼对心肌梗死保护作用高估体育锻炼对心肌梗死保护作用年龄因素产生混杂作用年龄因素产生混杂作用心肌梗死心肌梗死发生率发生率 在研究在研究体育锻炼体育锻炼心肌梗死心肌梗死的关系时,的关系时,每日水摄入量每日水摄入量不可能影响两者之间的真实联系。不可能影响两者之间的真实联
45、系。非锻炼组非锻炼组锻炼组锻炼组每日水每日水摄入量摄入量每日水摄入量并非心肌梗死的一个危险因子每日水摄入量并非心肌梗死的一个危险因子每日水摄入量每日水摄入量因素不产生混杂作用因素不产生混杂作用心肌梗死心肌梗死发生率发生率每日水每日水摄入量摄入量心肌梗死心肌梗死危险性危险性 在研究在研究体育锻炼体育锻炼心肌梗死心肌梗死的关系时,的关系时,体质指数体质指数不影响两者之间的真实联系。不影响两者之间的真实联系。非锻炼组非锻炼组锻炼组锻炼组体质体质指数指数锻炼锻炼 体质指数体质指数 心肌梗死危险心肌梗死危险心肌梗死心肌梗死发生率发生率体质体质指数指数不成为混杂因子不成为混杂因子中间环节中间环节(三)混杂
46、的判断和测量(三)混杂的判断和测量 1.1.判定混杂的依据判定混杂的依据 (1)(1)(2)(2)a aR RR R(F F)c cR RR R)(FaORcOR 或或1|ERRdf1|EORdf未控制混杂因素前未控制混杂因素前RRRR(OROR)与控制混杂因素后与控制混杂因素后RRRR(OROR)不等)不等即可疑的混杂因素应在即可疑的混杂因素应在无暴露因素存在的条件无暴露因素存在的条件下,同疾病间有联系。下,同疾病间有联系。或或1 D|fReR1 D|fReO或或(4)(4)可疑混杂因子可疑混杂因子F F不应是暴露变量同结果变量之不应是暴露变量同结果变量之间,或因果联系路径之间的一个中间变量
47、。间,或因果联系路径之间的一个中间变量。(3)可疑混杂因子在暴露组及非暴露可疑混杂因子在暴露组及非暴露组中的分布比例不等;或:混杂组中的分布比例不等;或:混杂因素应在无病例存在的条件下因素应在无病例存在的条件下(对照组中),同所研究的暴露(对照组中),同所研究的暴露因素间因素间OROR11。上述内容用箭头图总结如下:上述内容用箭头图总结如下:(1)-(3)混杂偏倚的几种情况;混杂偏倚的几种情况;其中(其中(3)表示)表示F是是F的伴随因子,的伴随因子,(4)-(8)无混杂偏倚存在,无混杂偏倚存在,(4)和和(5)为混杂条件不满足;为混杂条件不满足;(6)和和(7)为因果链;为因果链;(8)为复
48、合病因。为复合病因。5-35-32.2.混杂分析举例混杂分析举例 在一次非配对的病例对照研究中,在一次非配对的病例对照研究中,暴露因素为暴露因素为X X,疾病为,疾病为D D,潜在混杂因素为年龄,潜在混杂因素为年龄,研究结果如表研究结果如表5-65-6所示。所示。P.105P.10595170188230.)/()(cOR%805040,对对照照组组岁岁:病病例例组组 5-65-65-75-7 代表一般人群的对照组中,代表一般人群的对照组中,4040岁以下年龄组的暴露岁以下年龄组的暴露比例远低于比例远低于4040岁以上者。岁以上者。5-85-8 用用 Mantel-HaenszelMantel
49、-Haenszel计算的计算的 aORaOR为为 l.0l.0。从上述分析可见,从上述分析可见,X X与与 D D的调整前的调整前cORcOR为为1.91.9,但按年龄分,但按年龄分层后,层后,ORicORORicOR,OROR4040和和OROR4040相等,且相等,且 aORcORaORcOR,此时可,此时可认为年龄作为一个混杂因素,夸大了认为年龄作为一个混杂因素,夸大了X X与与D D间的真实联系。间的真实联系。5-95-9 cRR(cOR)分层后的分层后的RRi(ORi)或或cRR(cOR)aRR(aOR),混杂混杂 效应修饰效应修饰 effect modification cRRaR
50、R分层分层 RR相等相等以混杂为主以混杂为主 cRRaRR 分层分层RRi不等不等以效应修饰为主以效应修饰为主理论上,当样理论上,当样本足够大时,本足够大时,分分析析的的目目的的混杂作为一种偏倚,混杂作为一种偏倚,是为了从所得的联是为了从所得的联系中校正或去除其系中校正或去除其作用作用 效应修饰是两种或多种因素效应修饰是两种或多种因素共同存在时产生的相互作用,共同存在时产生的相互作用,是研究者所要研究、估计和是研究者所要研究、估计和报告的一种真实的存在报告的一种真实的存在3.3.正混杂和负混杂正混杂和负混杂 正混杂正混杂 由于混杂的存在,使暴露由于混杂的存在,使暴露-疾病之间的疾病之间的cRR