1、流行病学研究中的偏倚及其控制流行病学研究中的偏倚及其控制1、选择偏倚、选择偏倚2、信息偏倚、信息偏倚3、混杂偏倚、混杂偏倚误差(误差(error)(1)随机误差(抽样误差;)随机误差(抽样误差;random error):是因抽样产生的样本):是因抽样产生的样本统计量与总体参数之间的差异。即标准误(统计量与总体参数之间的差异。即标准误(standard error,SE)抽样误差与样本含量的关系:抽样误差与样本含量的关系:式中:式中:N 为样本含量为样本含量 为抽样误差(标准误)为抽样误差(标准误)为总体各变量值变异程度为总体各变量值变异程度(2)系统误差(偏倚;)系统误差(偏倚;system
2、atic error;bias):由某些不能准确):由某些不能准确定量但恒定的因素造成的,使调查结果偏离总体真值的误差。定量但恒定的因素造成的,使调查结果偏离总体真值的误差。来源:来源:1)受试者:抽样不随机;受试者本身变异)受试者:抽样不随机;受试者本身变异 2)观察者:倾向性暗示;个人技术偏差)观察者:倾向性暗示;个人技术偏差 3)仪器、试剂:仪器未校正,使用不当,发生故障;)仪器、试剂:仪器未校正,使用不当,发生故障;试剂未标准化;试剂未标准化;4)非试验性外环境因素:气象;照明;震动;声响)非试验性外环境因素:气象;照明;震动;声响Nx第一节第一节 选择偏倚(选择偏倚(select b
3、ias)一、定义:选入研究样本的研究对象与未被选入者之间特征差异造一、定义:选入研究样本的研究对象与未被选入者之间特征差异造成的系统误差。成的系统误差。二、种类二、种类(一)入院率偏倚(一)入院率偏倚(Berkson):以医院病人为研究对象时,由于入):以医院病人为研究对象时,由于入院率的不同而造成的偏差。例:院率的不同而造成的偏差。例:表表10-1 因不同住院率而住院的因不同住院率而住院的A、B患者及其与因素患者及其与因素X的关系的关系 造成不同疾病入院率不同的原因:医院技术特长;患者疾病严重程造成不同疾病入院率不同的原因:医院技术特长;患者疾病严重程度、经济状况、就诊方便程度等(医院、病人
4、双向选择)。度、经济状况、就诊方便程度等(医院、病人双向选择)。疾病疾病 暴露于暴露于X者者 非暴露于非暴露于X者者 合计合计 X暴露率暴露率(%)OR P实际人群实际人群 A(对照)(对照)200 800 1000 20 1 1 B(病例)(病例)200 800 1000 20 合计合计 400 1600 2000 20住院率(对照住院率(对照A=50%;病例;病例B=20%;暴露于因素;暴露于因素X者者40%)A(对照)(对照)140 400 540 25.9 1.86 0,有选择偏倚,有选择偏倚 OR0OR上例选择概率:上例选择概率:若若0,有选择偏倚,有选择偏倚 OR00 说明高估了说
5、明高估了OR值值)A 样本样本 B C DA0 B0C0 D0 a a A0/A b b B B0 0/B B g g C0/C d d D0/D三、控制三、控制1、对偏倚要有丰富的知识、对偏倚要有丰富的知识2、严格掌握研究对象的纳入和排除标准、严格掌握研究对象的纳入和排除标准3、提高应答率,降低失访率、提高应答率,降低失访率4、采用多种对照、采用多种对照第二节第二节 信息偏倚(观察偏倚;信息偏倚(观察偏倚;observational bias)一、定义:在从研究对象收取所需信息时产生的偏倚。其表现是使一、定义:在从研究对象收取所需信息时产生的偏倚。其表现是使研究对象的某种特征被错误分类(研究
6、对象的某种特征被错误分类(misclassification)。)。二、种类:二、种类:(一)回忆偏倚(一)回忆偏倚(recall bias):由于研究对象不能准确、完整地回):由于研究对象不能准确、完整地回忆以往发生的事情和经历时所产生的差异。忆以往发生的事情和经历时所产生的差异。原因:原因:1、事件或因素频率低,被遗忘。、事件或因素频率低,被遗忘。2、事件久远、事件久远 3、对调查事件的关心程度和回忆的认真程度、对调查事件的关心程度和回忆的认真程度 例:孕妇接受例:孕妇接受X线照射:医院记录与回忆符合率未线照射:医院记录与回忆符合率未73%流产史:前流产史:前10年发生的,完整回忆率为年发
7、生的,完整回忆率为82%;20年以前则年以前则为为73%(二)报告偏倚(说谎偏倚;(二)报告偏倚(说谎偏倚;reporting bias):由于研究对象有意):由于研究对象有意扩大或缩小某些信息造成的偏倚。扩大或缩小某些信息造成的偏倚。例:缩小信息:性乱史;青少年吸烟史例:缩小信息:性乱史;青少年吸烟史 扩大偏倚:职业危害(为获取福利)扩大偏倚:职业危害(为获取福利)(三)诊断怀疑偏倚(三)诊断怀疑偏倚(diagnosis suspicion bias):由于研究者和被):由于研究者和被研究者事先了解被研究者的暴露或分组情况,怀疑被研究者已经研究者事先了解被研究者的暴露或分组情况,怀疑被研究者
8、已经患病,或希望出现研究的阳性结果,因而在诊断或分析时做出带患病,或希望出现研究的阳性结果,因而在诊断或分析时做出带倾向性的判断。如对暴露组、或试验组的检查细致程度大于对照倾向性的判断。如对暴露组、或试验组的检查细致程度大于对照组。该偏倚常见于队列和实验研究,在病例对照研究种也存在。组。该偏倚常见于队列和实验研究,在病例对照研究种也存在。例:某项关于心脏病病因研究对冠心病猝死的定义为:若病例:某项关于心脏病病因研究对冠心病猝死的定义为:若病例发病数分钟内死亡,未发现其它病因,或生前史亦不能提供其例发病数分钟内死亡,未发现其它病因,或生前史亦不能提供其它死因,可认为是冠心病猝死。(造成突然死亡的
9、其它原因有蛛它死因,可认为是冠心病猝死。(造成突然死亡的其它原因有蛛网膜下腔出血、呼吸系统疾病等)网膜下腔出血、呼吸系统疾病等)(四)暴露怀疑偏倚(四)暴露怀疑偏倚(exposure suspicion bias):研究者事先了解):研究者事先了解研究对象的患病或结局,可能会对其以与对照组不可比的方法探研究对象的患病或结局,可能会对其以与对照组不可比的方法探询认为与某病或结局有关的因素。对同一组研究对象以不同的方询认为与某病或结局有关的因素。对同一组研究对象以不同的方法调查,结果会出现很大差异。法调查,结果会出现很大差异。例:儿童甲状腺癌患者放射性物质暴露史调查:在例:儿童甲状腺癌患者放射性物
10、质暴露史调查:在36例和例和22例例两组患儿中,以查找医疗记录法调查有暴露史者分别为两组患儿中,以查找医疗记录法调查有暴露史者分别为28%和和0,询问调查为询问调查为47%和和50%。(五)测量偏倚(五)测量偏倚(detection bias):对研究所需指标进行测量时产):对研究所需指标进行测量时产生的偏倚。原因:仪器不准;检验技术不熟;责任心不强。生的偏倚。原因:仪器不准;检验技术不熟;责任心不强。二、测量二、测量1、判断错误分类类型:以实际信息(客观检查、记录)获得的情况、判断错误分类类型:以实际信息(客观检查、记录)获得的情况为金标准,比较调查所得情况,计算特异度、灵敏度。为金标准,比
11、较调查所得情况,计算特异度、灵敏度。例:例:表表10-3 病例和对照组调查与实际暴露情况比较病例和对照组调查与实际暴露情况比较病例组:灵敏度病例组:灵敏度=54/60=0.90 特异度特异度=28/40=0.7对照组:灵敏度对照组:灵敏度=27/30=0.90 特异度特异度=49/70=0.7结论:无差异错误分类:两组特异度、灵敏度相等,即信息偏倚所结论:无差异错误分类:两组特异度、灵敏度相等,即信息偏倚所 值的错误分类等同地分配在两组(值的错误分类等同地分配在两组(ORxOR)有差异错误分类:两组特异度、灵敏度不等,即信息偏倚所有差异错误分类:两组特异度、灵敏度不等,即信息偏倚所 值的错误分
12、类不等同地分配在两组(值的错误分类不等同地分配在两组(ORxOR)调查调查 实际暴露情况(金标准)实际暴露情况(金标准)暴露暴露 病例病例 对照对照 .情况情况 +-合计合计 +-合计合计 +54 12 66 27 21 48 -6 28 34 3 49 52合计合计 60 40 100 30 70 1002、判断信息偏倚的方向和大小:、判断信息偏倚的方向和大小:比较以实际信息比较以实际信息OR值(值(OR)和调查信息和调查信息OR值(值(ORx)信息偏倚信息偏倚(ORx-OR)/OR 若若=0,无信息偏倚,无信息偏倚 ORx=OR 若若0,有信息偏倚,有信息偏倚 ORxOR上例选择概率:上例
13、选择概率:若若0,有信息偏倚,有信息偏倚 ORxOR此例:此例:OR=(6070)/(3040)=3.5 ORx=(6652)/(3448)=2.1 选择偏倚选择偏倚=(2.1-3.5)/3.5=-0.46 -0.46aRR(f),为正混杂,为正混杂,cRR高估了因素与疾病之关联高估了因素与疾病之关联 4)如如cRR aRR(f),为负混杂,为负混杂,cRR低估了因素与疾病之关联低估了因素与疾病之关联3、方向及程度、方向及程度:1)测量公式:)测量公式:混杂偏倚混杂偏倚=cRR-aRR(f)/aRR(f)2)判断)判断:若该值若该值=0,无混杂无混杂;若该值为正值,则为正混杂若该值为正值,则为
14、正混杂 若该值为负值,则为负混杂若该值为负值,则为负混杂例:以例:以病例对照研究病例对照研究一章中之实例一章中之实例 1、计算、计算cOR:表表5-5 口服避孕药口服避孕药(OC)与心肌梗死与心肌梗死(MI)关系关系 cOR=ad/bc=2.2OC 病例病例 对照对照 合计合计 +39(a)24(b)63(n1)-114(c)154(d)268(n0)合计合计 153(m1)178(m0)331(t)2、观察年龄与心肌梗死几口服避孕药之关联、观察年龄与心肌梗死几口服避孕药之关联 表表5-8 年龄与年龄与MI之关联之关联 OR=0.48;c c2 27.277.27 说明年龄与心肌梗死有说明年龄
15、与心肌梗死有联系联系(小年龄有保护作用)(小年龄有保护作用)。40岁岁 40岁岁MI 26 88对照对照 59 95 表表5-8 年龄与年龄与OC之关联之关联 OR=3.91;c c2 28.898.89 说明年龄与口服避孕药说明年龄与口服避孕药也有联系。也有联系。40岁岁 40岁岁OC 17 7对照对照 59 953、用、用Mantel-Haenszel法计算年龄调整后的法计算年龄调整后的OC与与MI的的aOR(f):表表5-7 口服避孕药与心机梗死关系病例对照研究按年龄口服避孕药与心机梗死关系病例对照研究按年龄 混杂偏倚混杂偏倚=(2.2-3.97)/3.97=-0.446 -0.440,
16、说明年龄对,说明年龄对OC与与MI之关联有混杂作用,使之关联有混杂作用,使OR值低估值低估了了44%。79.2)208/788()123/1726()208/9518()123/5921()/(/)/()(iiiiiiMHncbndafaOROR 40 40岁岁 .服服OC 未服未服OC 合计合计 服服OC 未服未服OC 合计合计 病例病例 21(a1)26(b1)47(m11)18(a2)88(b2)106(m12)对照对照 17(c1)59(d1)76(m01)7(c2)95(d2)102(m02)合计合计 38(n11)85(n01)123(t1)25(n12)183(n02)208(t
17、2)三、控制三、控制(一)限制(一)限制(restriction):设计时限制研究对象的入选):设计时限制研究对象的入选 条件。例:研究条件。例:研究OC与与MI关系时,如认为年龄为混关系时,如认为年龄为混 杂因素,可只选某一年龄组妇女为研究对象。杂因素,可只选某一年龄组妇女为研究对象。(二)匹配(二)匹配(matching):在实验和非实验研究中均可):在实验和非实验研究中均可 应用应用(三)随机化(三)随机化(randomization):使潜在的混杂因素在):使潜在的混杂因素在 各组分配均匀。常用于实验研究。各组分配均匀。常用于实验研究。(四)统计处理:分层、多因素分析(四)统计处理:分层、多因素分析