1、2022-12-281 第九章第九章 偏倚及其控制偏倚及其控制2022-12-282 在流行病学研究中,必须考虑研究结果的真在流行病学研究中,必须考虑研究结果的真实性(实性(ValidityValidity)。真实性指研究结果与真实)。真实性指研究结果与真实值相接近的程度。但值相接近的程度。但由于各种因素的影响,研由于各种因素的影响,研究结果与真实情况间往往存在一定差异究结果与真实情况间往往存在一定差异,即出,即出现现误差误差,有时甚至会得出错误结论。造成这种差有时甚至会得出错误结论。造成这种差异的原因有两个方面:一是机遇(异的原因有两个方面:一是机遇(ChanceChance),),另一个是
2、偏倚(另一个是偏倚(biasbias)。)。概概 述述2022-12-283 机遇引起的误差是机遇引起的误差是随机误差随机误差,是与抽样相伴随,是与抽样相伴随的,也称的,也称抽样误差抽样误差。一般。一般无法消除无法消除,但可通过医学,但可通过医学统计学方法予以限制、估计或评价。如:统计学方法予以限制、估计或评价。如:多次重复和增加研究的样本量;多次重复和增加研究的样本量;改善测量方法和工具;改善测量方法和工具;统一调查时间或被调查者的生理状态;统一调查时间或被调查者的生理状态;改善研究设计和抽样方案。改善研究设计和抽样方案。机遇与误差机遇与误差2022-12-284 偏倚(偏倚(BiasBia
3、s)是随机误差以外的误差是随机误差以外的误差,即即系统误差系统误差。由于设计、资料收集及分析方法不当所造成的差异由于设计、资料收集及分析方法不当所造成的差异;误差向量方向一致,不能通过增大样本量来克服它;误差向量方向一致,不能通过增大样本量来克服它;可避免且应该避免产生可避免且应该避免产生。(1 1)概念:)概念:偏倚是指研究过程中,由一些已知或可控制的因素偏倚是指研究过程中,由一些已知或可控制的因素引起的使研究结果或推论系统地偏离真实情况的误差。引起的使研究结果或推论系统地偏离真实情况的误差。偏倚与误差偏倚与误差2022-12-285研究的偏倚研究的偏倚 选择偏倚选择偏倚 信息偏倚信息偏倚
4、混杂偏倚混杂偏倚2022-12-286一、选择偏倚一、选择偏倚(selection bias)研究对象的选取过程中,由于选取方式不当,研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,由导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏倚。例如研究对象采用志此造成的偏倚称为选择偏倚。例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。愿者,方便样本,或者研究对象的无应答或失访等。来源:主要产生于研究的设计阶段,也可产生于资来源:主要产生于研究的设计阶段,也可产生于资料收集过程中的失访或无应答。料收集过程中的失访或无应答。2022-12
5、-287 描述性研究的选择偏倚描述性研究的选择偏倚 主要体现主要体现在样本对总体的代表性上 如不是采用随机抽样而是使用方便样本,或某些特定群体(志愿者、因特网利用者等)造成的外部效度(外推)受限问题。控制方法控制方法 尽量采用随机抽样,避免样本选取的偏向对特定群体的结果在外推上要谨慎等 2022-12-288 分析性研究的选择偏倚 主要体现主要体现 研究对象进入、排除、不参与或失访等与研究暴露或处理因素存在关联,由此增大或减少暴露与疾病、处理与效应的关联,导致效应估计的偏倚。控制方法控制方法选取具体环节或已选取人群的具体特征分析研究对象的选取是否同暴露或处理因素有关2022-12-289 常见
6、选择偏倚常见选择偏倚 入院率偏倚入院率偏倚 现患现患新发病例偏倚新发病例偏倚 无应答偏倚和志愿者偏倚无应答偏倚和志愿者偏倚 检出偏倚检出偏倚2022-12-2810 确定有无选择偏倚的关键 把握选取环节或已入选对象,是否存在人为增大或减少研究因素与结局的关联程度 控制方法 严密掌握对象选取的各个环节,注意选取对象的代表性,增加应答和减少失访等2022-12-2811二、信息偏倚二、信息偏倚(information bias)定 义 又称测量偏倚或观察偏倚,是指在研究资料收集、整理、编码和分析过程中出现的系统误差。来源可来源于研究者、研究对象及用于测量的仪器、设备及方法。2022-12-2812
7、信息偏倚的类型信息偏倚的类型 1.回忆偏倚回忆偏倚 由于研究对象对过去事件的回忆不准确所产生的系统误差。常发生于病对。(通常病例组往往表现为记忆准确性高于对照组)2.报告偏倚报告偏倚 是指由研究对象有意夸大或缩小某些信息而导致的偏倚。如调查青少年的吸烟史。3.调查者偏倚调查者偏倚 产生于调查者对研究对象有差异性地收集信息。采取盲法,可以降低调查者偏倚。2022-12-2813 为了减少错误分类以及改善测量的准确性,研究者们正在越来越多地使用生物学标记物(biological markers)。它们可以用来测量易感性、内暴露(实际进入体内)剂量或生物学效应(剂量)等。2022-12-2814三、
8、混杂偏倚(三、混杂偏倚(confounding bias)当研究某暴露因素与疾病之间的关系时,由于某个既与所研究的疾病有联系,又与所研究的暴露因素有联系的其他因素的影响,掩盖或夸大了所研究的暴露与疾病的联系。引起混杂偏倚的因素叫混杂因素。2022-12-2815混杂因素必须具备的基本特征是:混杂因素必须具备的基本特征是:(1 1)它必须同疾病有关联;)它必须同疾病有关联;(2 2)它)它必须必须同暴露(研究因素)存在统计同暴露(研究因素)存在统计学上的联系学上的联系/有关联;有关联;(3 3)它不是研究因素与研究疾病因果链上)它不是研究因素与研究疾病因果链上的中间环节或中间变量。的中间环节或中
9、间变量。具备以上条件的因素,如果在研究的比具备以上条件的因素,如果在研究的比较组中分布不均,即可导致混杂偏倚。较组中分布不均,即可导致混杂偏倚。2022-12-2816 判定原则 比较混杂因素调控前后的暴露因素效应估计值,如果存在有意义的差异,就产生了混杂偏倚。调控的统计方法 设计阶段:标准化率、分层和多变量分析 设计阶段:配比、随机化分配或限制进入 存在混杂的几种情况存在混杂的几种情况 1.E(饮酒饮酒)F(吸烟吸烟)D(肺癌肺癌)该例中,吸烟既是肺癌的一个独立危险因素,又该例中,吸烟既是肺癌的一个独立危险因素,又与饮酒有相关性,它的存在可能会引起混杂。与饮酒有相关性,它的存在可能会引起混杂
10、。2.E(吸烟吸烟)F(年龄年龄)D(肺癌肺癌)吸烟与年龄都是肺癌的危险因素,两者相互独立。吸烟与年龄都是肺癌的危险因素,两者相互独立。同时,吸烟与年龄间存在明显相关性。此时,年龄同时,吸烟与年龄间存在明显相关性。此时,年龄很可能成为混杂因素。很可能成为混杂因素。不不存在混杂的几种情况存在混杂的几种情况 1.E(乙肝病毒感染乙肝病毒感染)F(食含黄曲霉毒素食物食含黄曲霉毒素食物)D(肝癌肝癌)由于由于E与与F间无相关性,此时间无相关性,此时F不会成为混杂因子。不会成为混杂因子。2.E(同性恋)(同性恋)F(HIV感染)感染)D(AIDS)HIV感染是感染是E与与D关系间的一个中间环节,不会引关
11、系间的一个中间环节,不会引起混杂。起混杂。3.E(乙肝病毒感染)(乙肝病毒感染)F(慢活肝)(慢活肝)D(肝癌)(肝癌)F此时也是此时也是E与与D间的中间环节。间的中间环节。4.E(青霉素)(青霉素)D(青霉素过敏反映)(青霉素过敏反映)F(过敏体质)(过敏体质)此时此时E与与F是同一复合因子中的两个组成部分,是同一复合因子中的两个组成部分,缺少任何一个因素,则无缺少任何一个因素,则无D发生。发生。2022-12-2823偏倚的控制偏倚的控制 1 1)随机化分组随机化分组 目的是尽量保证可能的混杂因素目的是尽量保证可能的混杂因素在比较组间分布均衡,特别是分层随机分组的方在比较组间分布均衡,特别
12、是分层随机分组的方法。法。2 2)匹配匹配 即为研究对象选择对照时,使对照组成即为研究对象选择对照时,使对照组成员在可能引起混杂偏倚的一个或多个因素上与对员在可能引起混杂偏倚的一个或多个因素上与对照组保持一致,从而消除混杂因素对研究结的影照组保持一致,从而消除混杂因素对研究结的影响。响。3 3)限制限制 对研究对象进行限制的方法对研究对象进行限制的方法 即针对某些即针对某些可能的混杂因素,在设计时通过限制研究对象的可能的混杂因素,在设计时通过限制研究对象的入选条件,以达到控制混杂偏倚的目的。入选条件,以达到控制混杂偏倚的目的。1.设计阶段设计阶段 主要预防主要预防选择偏倚选择偏倚和和混杂偏倚混
13、杂偏倚2022-12-28242.2.资料收集阶段资料收集阶段-主要是控制主要是控制信息偏倚信息偏倚偏倚的控制偏倚的控制 1 1)使用统一的标准收集资料)使用统一的标准收集资料 如对实验组与对照组采用同样的调查方法和调查态度、如对实验组与对照组采用同样的调查方法和调查态度、对所用仪器、试剂等要标准化、要培训调查员等。对所用仪器、试剂等要标准化、要培训调查员等。2 2)采用)采用“盲法盲法”收集资料收集资料 3 3)采用客观研究指标)采用客观研究指标4 4)适当采用一些调查技巧)适当采用一些调查技巧做好宣传工作、调查手段要简便易行,易被接受;尽做好宣传工作、调查手段要简便易行,易被接受;尽可能减少无应答和失访。可能减少无应答和失访。2022-12-28253.3.资料分析阶段资料分析阶段-主要是控制主要是控制混杂偏倚混杂偏倚 偏倚的控制偏倚的控制 1 1)标准化标准化 选择一个标准的混杂因子构成,计算标选择一个标准的混杂因子构成,计算标准化死亡率、标化死亡比。准化死亡率、标化死亡比。2 2)分层分析分层分析 采用采用Mantal-HazenszelwMantal-Hazenszelw分层分析法。分层分析法。3 3)多因素分析多因素分析 如多元相关与回归、多元如多元相关与回归、多元LogisticLogistic回归等。回归等。