1、临床研究中的偏倚及控制临床研究中的偏倚及控制 中山大学肿瘤医院 临床试验研究中心Your site hereCTC第一部分第一部分 流行病学研究中的误差流行病学研究中的误差v 误差(error):实际观察值与客观真实值之差v 分类:n随机误差(random error):随机测量误差和随机抽样误差n系统误差/偏倚(systematic error/bias)临床科研中的各种系统误差被临床科研中的各种系统误差被称为称为偏倚偏倚(bias)Your site hereCTC举例:用动脉血压计测量某人血压(实际值为举例:用动脉血压计测量某人血压(实际值为80mmHg80mmHg),各次读数的均值为)
2、,各次读数的均值为100mmHg100mmHg80100舒张压(舒张压(mmHgmmHg)测测量量频频次次系统误差与随机误差间的关系系统误差与随机误差间的关系Your site hereCTC一一 两类两类误差特点误差特点v 随机误差特点:n没有固定方向和固定大小,一般呈正态分布n难以避免n可以用统计学方法控制、分析、估计v 系统误差特点:n有方向性n可消除Your site hereCTC二、随机误差和系统误差的区别二、随机误差和系统误差的区别随机误差系统误差/偏倚来源随机测量、抽样众多方向无固定方向有固定方向大小不固定固定控制方法增加样本量针对性采取相应措施Your site hereCT
3、C临床科学研究中的误差与样本的关系临床科学研究中的误差与样本的关系误差误差研究样本研究样本(来源(来源:Rothman,2002)系统误差系统误差(偏倚偏倚)随机误差随机误差(机遇机遇)Your site hereCTC偏倚产生的原因偏倚产生的原因设计不合理实施不严格资料分析不正确Your site hereCTC总总 体体规定纳入标准规定纳入标准和排出标准和排出标准确定适宜纳入试验的对象确定适宜纳入试验的对象防止选择性偏倚的措施防止选择性偏倚的措施确定样本含量确定样本含量按照随机化原则按照随机化原则分配试验对象分配试验对象得出试验结果得出试验结果选择统计分析方法进行统计分析选择统计分析方法进
4、行统计分析统计和专业结论统计和专业结论试验组试验组对照组对照组估计并分析估计并分析混杂因素混杂因素防止测量性偏倚,防止测量性偏倚,避免干扰、沾染、避免干扰、沾染、采用盲法增加依从性采用盲法增加依从性Your site hereCTC第二部分第二部分 偏倚偏倚v可以发生在设计、实施、分析和推论的各个阶段,种类很多,一般分为:v三大类n选择偏倚(selection bias)n信息偏倚(information bias)n混杂偏倚(confounding bias)Your site hereCTC一、选择偏倚一、选择偏倚v 选择偏倚(selection bias):由被选入的研究对象与未被选入者
5、特征上的差异所造成的系统误差。n主要产生于研究的设计阶段n多见于病例对照研究和现况研究n资料收集过程中的失访、无应答Your site hereCTC一、选择偏倚一、选择偏倚 常发生在研究的设计阶段Your site hereCTC选择偏倚的常见种类选择偏倚的常见种类n入院率偏倚(admission rate bias)n现患病例-新病例偏倚(prevalence-incidence bias)n无应答偏倚(non-respondent bias)n志愿者偏倚(volunteer bias)n检出征候偏倚(detection signal bias)n时间效应偏倚n排除偏倚(exclusive
6、 bias)n易感性偏倚(susceptibility bias)Your site hereCTC入院率偏倚(入院率偏倚(admission rate biasadmission rate bias)v 又称伯克森偏倚(Berksons bias),利用医院就诊或住院病人作为研究对象时,由于入院率或就诊机会不同而导致的偏倚n医院对患者的选择n患者对医院的选择Your site hereCTC入院率偏倚(Berksons bias)呼吸道疾病与骨关节疾病关系研究呼吸道疾病与骨关节疾病关系研究 骨关节疾病骨关节疾病 一般人群一般人群 住院病人住院病人 case control case cont
7、rol 17 207 5 15 _ 184 2376 18 219 OR=1.06 OR=4.06 呼吸道疾病呼吸道疾病Your site hereCTC皮肤癌外伤合计ORP实际人群有高血压757515011无高血压425425850合计5005001000住院率(皮肤癌=60%;外伤=25%;高血压40)有高血压5741980.5780.001无高血压255106361合计312147459Your site hereCTC入院率偏倚的入院率偏倚的控制控制n尽量从一般人群中获取样本n多个医院解决办法:1.选取社区病人,或选择两个或两个以上的对照组,一个来自于社区,一个对照组来自于医院不同科室
8、的病人,对不同对照组的结果进行比较来判断是否存在选择偏倚。2.病例的选择尽量不要在同一所医院,尽量在不同等级的医院中随机抽样,样本的代表性好些。Your site hereCTC现患病例现患病例-新病例偏倚新病例偏倚(prevalence-incidence bias)v 又称奈曼偏倚(Neyman bias):研究中选择现患病例为研究对象时,由于他们与新病例在某些特征或行为上的差异,而造成研究结果的偏倚。v 病例对照或现况研究中的病例为现患典型病例,不包括死亡、病程短、轻型或不典型病例,致使调查结果出现的系统误差。n现患病例与新病例的暴露状况、病情、病型、病程和预后等都不尽相同n现患病例可能
9、是“生物学上的强者”n患病例往往对自身所患疾病有所了解,有时会主动更改其对危险因素的暴露,导致了对危险因素与疾病关系的低估Your site hereCTC患病率或发病率偏倚患病率或发病率偏倚 轻症病例轻症病例一般病例一般病例重症病例重症病例死亡病例死亡病例Your site hereCTC例:Framingham心血管疾病研究n队列研究:高胆固醇者患冠心病OR值=2.4(有统计学意义)n病例对照研究:高胆固醇者患冠心病OR值=1.16(无统计学意义)原因:n冠心病存活者改变生活习惯(戒烟、体育锻炼、注意饮食)n冠心病存活者本身的胆固醇水平就低于死亡者v控制:n在病例对照研究和现况研究的病例选
10、择时,尽量选择新发病例Your site hereCTC无应答偏倚无应答偏倚(non-respondent bias)v 无应答者:调查研究中那些因各种原因不回答或不能回答所提出问题的人、不依研究设计接受治疗者。v 当无应答者和应答者在某些特征上不同,当一项调查中无应答者占一定比例时,就可以使研究的结果产生偏倚。n主要发生于现况调查n当无应答率较高时,如大于15%,从应答人群中得出的有关研究因素与疾病的联系不能反映两者间的真实联系Your site hereCTC志愿者偏倚志愿者偏倚(volunteer bias)v 主动加入研究的志愿者同非志愿者在关心健康、注意饮食卫生及营养食疗、禁烟禁酒、
11、坚持锻炼等方面有差异,当研究的暴露组或治疗组对象为志愿者时,在暴露的志愿者和非暴露的对照(主要为非志愿者)间的比较可能产生偏倚n暴露状态不同n在与疾病发生相关的其他很多方面也可能不同,如志愿者具有更强的自我保健意识n志愿者由于对疾病及其危险因素的了解较多,在回忆暴露情况时可能会过分强调其暴露程度;或因未患所研究疾病而对回忆暴露史不感兴趣Your site hereCTC检出征候偏倚检出征候偏倚征候指在疾病和暴露因素之外存在着一个因素,即一种临床症状或体征。该症候不是疾病的危险因素,但人们却因具有这种征候而去就诊,从而提高某病的早期病例的检出率,从而过高的估计了暴露程度,形成某征候与某疾病的虚假
12、联系,称为检出症候偏倚。例:口服雌激素和子宫内膜癌的关系。Your site hereCTC例:病例对照研究发现:服用雌激素与子宫内膜癌发病有正关联。病例对照研究发现:服用雌激素与子宫内膜癌发病有正关联。原因:雌激素促进子宫内膜生长,导致出血,频繁接受检查,促使早期发现子宫内膜癌患者。控制方法:对观察对象进入研究的条件加以限制,使得病例组和对照组间主要的非研究因素特征保持一致。(都是晚期病例,年龄等因素齐同)Your site hereCTC排除偏倚排除偏倚定义:在进行研究 对象的选择时,按照研究设计要求,那些对研究因素(干预措施)禁忌者、无法跟踪调查者、拒绝参加者、等不符合研究标准的研究对象
13、不能纳入研究计划。如果研究者没有按照对等的原则或标准从实验组和对照组中排除某些研究对象,导致研究因素与研究疾病之间的联系被错误估计称为排除偏倚。Your site hereCTC时间效应偏倚时间效应偏倚定义:许多疾病尤其是一些慢性病从接触暴露因素到发病需要很长时间,在这段时间内实际上这些人是有暴露史的,但是没有出现临床症状、体征或者未能应用现有的技术检测出来,而被错误的划入健康组或对照组,由此而产生的系统误差称为时间效应偏倚。(常导致研究结果被低估)控制:尽量选用最敏感、先进的检测技术或开展队列研究。Your site hereCTC选择偏倚的控制选择偏倚的控制1.研究设计阶段 n建立和利用健
14、康监测系统信息,尽可能使用发病率资料n采用严格科学的研究设计n明确对象纳入标准、统一疾病诊断和监测程序 2.资料收集阶段 n加强随访、提高应答率n在资料收集阶段尽可能多地收集有关暴露史的各种信息n确保疾病的诊断不是依据暴露史而得出3.数据分析阶段:n多因素分析:如COX回归分析Your site hereCTC二、信息偏倚二、信息偏倚v 信息偏倚(information bias):又称观察偏倚(observational bias)指在研究的实施阶段判断研究对象的暴露或疾病状况时发生的的系统误差。n可发生于各种类型的流行病学研究n可来自研究对象、研究者本身、用于测量的仪器、设备和方法Your
15、 site hereCTC信息偏倚信息偏倚常见种类常见种类v回忆偏倚v报告偏倚v测量偏倚v调查者偏倚v错分偏倚Your site hereCTC回忆偏倚(回忆偏倚(recall bias)v 定义:由于研究对象不能准确、完整地回忆以往发生的事情和经历时所产生的系统误差。n事件或因素频率低,被遗忘n事件久远n对调查事件的关心程度和回忆的认真程度v 例:n孕妇接受X线照射:医院记录与回忆符合率73%n流产史:前10年发生的,完整回忆率为82%;20年以前则为73%Your site hereCTC母母亲亲 怀怀孕孕时时服服药药史史 有有畸畸形形患患儿儿 无无畸畸形形患患儿儿 有有 a b 无无 c
16、 d 高估高估 “a”,或低估或低估“b”过高估计药物与新生过高估计药物与新生儿畸形的联系强度儿畸形的联系强度母亲怀孕时服药与新生儿畸形的关系母亲怀孕时服药与新生儿畸形的关系Your site hereCTC报告偏倚报告偏倚定义:研究对象有意夸大或缩小某些信息所导致的偏倚,称报告偏倚。常见于敏感问题的调查。如性乱史、中小学生吸烟及早恋史等,被调查者可能会隐瞒实情。但当调查职业病对健康的危害或环境污染时,被调查者可能会夸大某些信息。控制方法:采用敏感问题随机应答技术;或者间隔一段时间重复调查。Your site hereCTC测量偏倚测量偏倚 定义:由于研究中所用的仪器、设备、试剂、方法和检验条
17、件的不标准、不统一;或者研究指标设计不合理、记录不完整等原因造成的研究结果偏离真实值的现象称为测量偏倚。控制方法:1.试验试剂或检测手段在研究过程中保持不变。2.培训调查员,统一调查口径;Your site hereCTC错分偏倚错分偏倚定义:在暴露测量或疾病的判断测量中由于测量标准或诊断标准不统一,使得暴露或疾病状态的判断出现了不同程度的错分,从而导致的偏倚称为错分偏倚。Your site hereCTCv 差异错分:暴露或疾病的错误分类同研究分组有关,各比较组间存在差异;造成高估或低估效应值。v 无差异错分:暴露或疾病的错误分类同研究分组无关,各比较组间不存在差异;在多数情况下模糊了研究组
18、的差异。Your site hereCTC无 差 异 性 错 误 分 类 研研 究究 真真 实实 数数 据据 错错 误误 分分 类类 数数 据据 高 脂 肪膳 食 低 脂 肪 膳 食 高脂肪膳食 低 脂 肪 膳 食 心 肌 梗 死 6 0 4 0 心 肌 梗 死 4 8 5 2 对 照 4 0 6 0 对 照 3 2 6 8 O R=(6 06 0)/(4 04 0)=2.3 O R=(4 86 8)/(5 23 2)=2.0 差 异 性 错 误 分 类 研研 究究 真真 实实 数数 据据 错错 误误 分分 类类 数数 据据 高 脂 肪膳 食 低 脂 肪 膳 食 高脂肪膳食 低 脂 肪 膳 食
19、 心 肌 梗 死 6 0 4 0 心 肌 梗 死 6 0 4 0 对 照 4 0 6 0 对 照 3 2 6 8 O R=(6 06 0)/(4 04 0)=2.3 O R=(6 06 8)/(4 03 2)=3.2 图4 无 差 异 性 错 误 分 类 和 差 异 性 错 误 分 类 的 示 例 无差异性错误分类 研研究究真真实实数数据据 错错误误分分类类数数据据 高脂肪膳食 低脂肪 膳食 高脂肪膳食 低脂肪 膳食 心肌梗死 6 0 4 0 心肌梗死 4 8 5 2 对 照 4 0 6 0 对 照 3 2 6 8 O R=(6 06 0)/(4 04 0)=2.3 O R=(4 86 8)/
20、(5 23 2)=2.0 差异性错误分类 研研究究真真实实数数据据 错错误误分分类类数数据据 高脂肪膳食 低脂肪 膳食 高脂肪膳食 低脂肪 膳食 心肌梗死 6 0 4 0 心肌梗死 6 0 4 0 对 照 4 0 6 0 对 照 3 2 6 8 O R=(6 06 0)/(4 04 0)=2.3 O R=(6 06 8)/(4 03 2)=3.2 图3 无差异性错误分类和差异性错误分类的示例 Your site hereCTC信息偏倚的控制信息偏倚的控制v 明确细致的资料收集明确细致的资料收集方法和和严格的质量控制v 盲法的应用v 提高调查技巧提高调查技巧v 尽量采用客观指标v 诊断、测量方法
21、要统一v 研究中应用的仪器、设备、试剂等应事先确定并在研究开始以后保持不变v 正确整理和分析:资料校正资料校正Your site hereCTC三、混杂偏倚三、混杂偏倚v 混杂偏倚/混杂(confounding):在研究某因素与某疾病关联时,由于某个既与疾病有联系,又与所研究的因素有联系的外来因素的影响,掩盖或扩大了所研究的因素与疾病的联系强度,从而使两者之间的真正联系被错误的估计。v 混杂因素(confounder):引起混杂偏倚的外来因素(extraneous factor)称为混杂因素。Your site hereCTC混杂因素的混杂因素的3 3个基本特征个基本特征n混杂因素必须与所研究
22、疾病的发生有关,是该疾病的独立危险因素之一n混杂因素必须与所研究因素有关,且在比较的人群组中分布不均n混杂因素必须不是研究因素与疾病病因链上的中间环节或中间步骤Your site hereCTC食管癌食管癌饮饮 酒酒吸吸 烟烟双箭头线表示一般相关;单箭头线表示有因果联系。Your site hereCTC中年人少量饮酒与心肌梗塞危险性中年人少量饮酒与心肌梗塞危险性Your site hereCTC不同性别中年人少量饮酒与心肌梗塞危险性不同性别中年人少量饮酒与心肌梗塞危险性 男性男性 女性女性少量饮酒少量饮酒不饮酒不饮酒 少量饮酒少量饮酒不饮酒不饮酒心肌梗塞发病(例)心肌梗塞发病(例)12012
23、06060 20204040随访人年(人年)随访人年(人年)20,00020,00010,00010,000 10,00010,00020,00020,000发病率(发病率(1/1/千)千)6.006.006.006.00 2.002.002.002.00RR=1.0RR=1.0 RR=1.0RR=1.0Your site hereCTCYour site hereCTC混杂偏倚的判断和测量混杂偏倚的判断和测量v 设含有某可疑混杂因素f时,研究因素与疾病的效应估计值为cRR或cOR,称为粗RR或粗OR。v 按照该可疑混杂因素调整后的效应估计值,即排除掉该因素的可能混杂作用后的效应估计值,为aR
24、R(f)或aOR(f),称为调整RR或调整OR。(可用分层分析方法计算)v 当cRR=aRR(f),或,cOR=aOR(f)时,则f无混杂作用v 当cRRaRR(f),或,cORaOR(f)时,且分层后有f层和无f层的分层RRi或ORi相同,则f有混杂作用Your site hereCTC混杂偏倚的判断混杂偏倚的判断(1)正混杂偏倚:表示混杂因子夸大了暴露因素与疾病的关联。(2)负混杂偏倚:低估了暴露因素与疾病的关联程度。混杂偏倚及其方向与程度可以下式测量:()()()iiiiCRR CORaRR aORaRR aOR混杂偏倚Your site hereCTC 若值=0,为无混杂。值 0 时,
25、若为正值,为正混杂;若为负值,为负混杂。值的大小为混杂的程度Your site hereCTC 例:一个吸烟、饮酒与肺癌的关系的病例对照研究:吸烟与肺癌的关系 吸烟 病例 对照 合计 有 24 16 40 无 6 54 60 合计 30 70 100饮酒与肺癌的关系 饮酒 病例 对照 合计 有 20 30 50 无 10 40 50 合计 30 70 100 Your site hereCTCv(1)不考虑因素间的混杂作用,按单因素分析法分别分析吸烟、饮酒与肺癌的关系。v 吸烟:v 结果可见:吸烟与肺癌有关,吸烟的人群患肺癌的危险度为不吸烟人群的13.5倍。v 饮酒:v 结果可见:经单因素分析
26、,饮酒与肺癌有关,即饮酒的人群患肺癌的危险度为不饮酒人群的2.67倍5.131665424bcadOR67.230104020bcadORYour site hereCTC(2)考虑因素间的混杂作用,分析饮酒时将吸烟分为抽烟与不抽烟两层作分析;而分析吸烟时将饮酒分为饮酒与不饮酒两层作分析,其结果如下:饮酒与肺癌的关系(分层分析)肺癌 吸 烟 吸 烟 饮酒 饮酒 饮酒 饮酒 病例 18(a1)6(b1)2(a2)4(b2)对照 12(c1)4(d1)18(c2)36(d2)OR=1 OR=1 从分层分析的结果可见:无论吸烟人群还是不吸烟人群中,饮酒与肺癌均无关系。Your site hereCT
27、C 吸烟与肺癌的关系(分层分析)肺癌 饮酒 饮酒 吸烟 吸烟 吸烟 吸烟 病例 18(a1)2(b1)6(a2)4(b2)对照 12(c1)18(d1)4(c2)36(d2)OR=13.5OR=13.5 从分层分析可见:无论是在饮酒还是在不饮酒人群中,吸烟与肺癌均有关。Your site hereCTCv 结论:从此例可以看出,在分析饮酒与肺癌的关系时,由于受到吸烟这个混杂作用的影响,使得饮酒与肺癌的联系被夸大,把饮酒与肺癌无关歪曲成有关。因此,吸烟为研究饮酒与肺癌关系的正混杂因子,被夸大的作用称为正混杂作用。Your site hereCTC混杂偏倚的控制混杂偏倚的控制v 限制(restri
28、ction)v 匹配(matching)v 随机化(randomization)v 统计处理Your site hereCTC限制限制(restriction)v 提高可比性,限制在具有一定特征的对象中进行观察,以排除其他因素的干扰。v 但结论常有很大局限性,影响研究对象的代表性,使研究结果外推至一般人群时受限。Your site hereCTC匹配匹配(matching)v 匹配是指在为研究对象设立对照时,使病例和其对照在一个或多个潜在混杂因素上相同或相近,从而消除混杂因素对研究结果的影响n匹配的目的是为了控制混杂、提高研究的统计学效率n病例对照研究、队列研究和实验研究均可采用匹配Your site hereCTC随机化随机化(randomization)v 随机化是指以随机化原则将研究对象以同等的机率被分配在各处理组中,从而使潜在的混杂因素在各组间分布均衡。v 随机化多用于实验研究,尤其是临床试验Your site hereCTC统计处理方法统计处理方法v常用的估计和控制混杂偏倚的统计处理方法有:n分层分析n标准化n多因素分析 n敏感度分析Your site hereCTC小小 结结掌握偏倚的种类掌握各种偏倚的含义及相应的控制方法Your site hereCTC谢谢!