1、第九章 流行病学研究的真实性偏倚及其控制 Bias and Control南京医科大学公共卫生学院流行病与卫生统计学系南京医科大学公共卫生学院流行病与卫生统计学系地址:地址:南京市汉中路140号一号教学楼(南)307-1(210029)电话:电话:86-25-86862815 (o) 13851545125 (m) 电邮:电邮: 喻 荣 彬流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu1、如何认识和评价个体和群体的变异?如何认识和评价个体和群体的变异?2、随机误差和系统误差的区别?随机误差和系统误差的区别?3、有人研究有人研究HBsAg携带者孕
2、妇宫内传播携带者孕妇宫内传播HBV的频率,的频率, 共检查共检查16例引产死胎,其中例引产死胎,其中4例胎儿肝内例胎儿肝内HBsAg阳阳 性,从而得出性,从而得出HBsAg携带者孕妇发生宫内携带者孕妇发生宫内HBV传播传播 的频率高达的频率高达25%的结论。的结论。4、有人调查公鸭和母鸭患某病的情况,检查市场上出有人调查公鸭和母鸭患某病的情况,检查市场上出 售的公鸭售的公鸭3028只,母鸭只,母鸭239只,其患病率分别为只,其患病率分别为4.9% (148/3028)和)和19.7%(47/239)。因而作者得出某病母。因而作者得出某病母 鸭患病率比公鸭高的结论。鸭患病率比公鸭高的结论。问题与
3、案例讨论流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu5、有人调查喝生水与某病的关联,进行了病例对照研有人调查喝生水与某病的关联,进行了病例对照研 究。病例组当面询问其喝生水的情况,对照组用电究。病例组当面询问其喝生水的情况,对照组用电 话询问,结果如下:话询问,结果如下:喝生水喝生水 400 400不喝生水不喝生水 250 500病例组病例组 对照组对照组2.00OR 44.162,结论:结论:喝生水和某病有关联。喝生水和某病有关联。流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu 概述 第一节
4、 选择性偏倚 第二节 信息偏倚 第三节 混杂偏倚 总结讲课提纲流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu一、研究结果的变异性(variability)1: the quality of being subject to variation syn: variableness, variance ant: invariability, invariability 2: a quality of variability and lack of uniformity syn: unevenness ant: evenness, evenness
5、Variability流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu生物学变异生物学变异测量变异测量变异随机变异随机变异系统变异系统变异流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu变异性的水平变异性的水平变异的来源变异的来源个体水平个体水平个体生物学变异、测量误差个体生物学变异、测量误差群体水平群体水平个体间遗传学变异、环境变异、个体间遗传学变异、环境变异、测量误差测量误差样本水平样本水平抽样方式、样本大小、测量误差抽样方式、样本大小、测量误差流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬
6、Copyright by Rongbin Yu180 ,174,215,233,146,195205,188,190,170,164,162220,219,228,146,220,162,228219,164,190,188,233,195, ,215,170源群体源群体 样本样本A A 样本样本B B 样本样本C C 高胆固醇率 = 40%= 20% = 0% 高胆固醇率 = 25% (240mg/dL) 源群体与样本高胆固醇率的样本变异性示例源群体与样本高胆固醇率的样本变异性示例流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu 研究 A(研究
7、对象 200 人,随机分配到两组) 膳食改良组 降胆固醇药物组 0 5 10 15 五年内发生 心肌梗死风险(%) 研究 B(研究对象 2000 人,随机分配到两组) 膳食改良组 降胆固醇药物组 0 5 10 15 五年内发生 心肌梗死风险(%) 膳食与药物预防心机梗死的样本变异性示例膳食与药物预防心机梗死的样本变异性示例6%9%6%9%流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu二、研究的真实性和可靠性/准确性准确性/效度效度 validity, accuracy/可重复性可重复性/精密度精密度/信度信度 reliability, repr
8、oducibility, repeatability, precision流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu概念 研究收集的数据、分析结果和所得结论与客观实际的研究收集的数据、分析结果和所得结论与客观实际的符合程度。也称符合程度。也称“有效性有效性”、“效度效度”。Validity refers to the extent to which an assessment method produces accurate, meaningful, and useful measures of the skills and knowled
9、ge it was designed to assess. The primary issue is content validity, which is whether an assessment and instructional program align (match). 流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu随机误差随机误差系统误差系统误差影响真实性的因素真实性的两个方面内部真实性内部真实性外部真实性外部真实性Are we measuring what we think we are measuring? 流行病学教学工作室流
10、行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu内部真实性(内部真实性(internal validity) 定义 研究结果与实际研究对象真实情况的符合程度,回答研究结果与实际研究对象真实情况的符合程度,回答一个研究本身是否真实或有效。一个研究本身是否真实或有效。Internal Validity refers to the extent to which the findings of a study accurately represent the causal relationship between an exposure and an outcome in
11、 the particular circumstances of that study. The internal validity of a study can be suspect when certain types of biases in the design or conduct of a study could have affected outcomes, thereby obscuring the true direction, magnitude, or certainty of the effect. 流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright
12、by Rongbin Yu 限制研究对象类型限制研究对象类型 限定研究的环境条件限定研究的环境条件 限定干预措施限定干预措施改善措施流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu外部真实性(外部真实性(external validity) 研究结果与推论对象真实情况的符合程度,又称研究结果与推论对象真实情况的符合程度,又称普遍性普遍性(generalizability),回答一个研究能否推广应用到研回答一个研究能否推广应用到研究对象以外的人群。究对象以外的人群。External Validity refers to the extent to
13、which the findings obtained from an investigation conducted under particular circumstances can be generalized to other circumstances. To the extent that the circumstances of a particular investigation (e.g., patient characteristics or the manner of delivering a treatment) differ from the circumstanc
14、es of interest, the external validity of the findings of that investigation may be questioned. 流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu推论代表性不好,内部真实性可能好,而外部真实性差。推论代表性不好,内部真实性可能好,而外部真实性差。增加研究对象的增加研究对象的(如限制类型如年龄、职业、体质(如限制类型如年龄、职业、体质特征或疾病分型等),可改善内部真实性。特征或疾病分型等),可改善内部真实性。增加研究对象的增加研究对象的,可改善外部真实性。,
15、可改善外部真实性。在实际研究需综合考虑研究对象的同质性和异质性问题。在实际研究需综合考虑研究对象的同质性和异质性问题。内部真实性与外部真实性的联系内部真实性与外部真实性的联系流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu真实性差真实性差可靠性好可靠性好真实性好真实性好可靠性差可靠性差真实性 vs 可靠性流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu真实性 vs 可靠性真实性好真实性好可靠性好可靠性好真实性差真实性差可靠性差可靠性差流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyrigh
16、t by Rongbin Yu观测值观测值真实值真实值误差误差+随机误差随机误差系统误差系统误差+n随机分布的随机分布的, ,不可预测的不可预测的n不可避免的不可避免的n可估计误差大小可估计误差大小n通过增加样本量或重复测通过增加样本量或重复测量取均值可以减小量取均值可以减小n系统的偏离真实值系统的偏离真实值n可避免的可避免的n是必须控制的是必须控制的(偏倚(偏倚 bias)流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu观测值观测值真实值真实值误差误
17、差+随机误差随机误差系统误差系统误差+(偏倚(偏倚 bias)流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu误差样本大小随机误差随机误差系统误差系统误差流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu在流行病学研究设计和实施中由于方法的局限在流行病学研究设计和实施中由于方法的局限或错误所产生的或错误所产生的系统误差系统误差使研究结果系统地偏使研究结果系统地偏离真实值,以及离真实值,以及解释结果的片面性解释结果的片面性,称为偏倚,称为偏倚(bias)。)。三、偏倚 (bias)概念流行病学教学工作室
18、流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin YuBias (600-540BC)nBias是古典文化中七贤人之一是古典文化中七贤人之一nLydia国王克利萨斯向国王克利萨斯向Bias咨询建造、部署咨询建造、部署战舰防御爱奥尼亚人的最好方法,战舰防御爱奥尼亚人的最好方法,Bias为为了避免战争、流血,骗克利萨斯国王说,了避免战争、流血,骗克利萨斯国王说,爱奥尼亚人正在买马准备陆地战,后来,爱奥尼亚人正在买马准备陆地战,后来,Bias向克利萨斯国王承认说了谎,爱奥尼向克利萨斯国王承认说了谎,爱奥尼亚人实际上也在建造战舰,国王对亚人实际上也在建造战舰,国王对Bias的的
19、本意表示赞许,与爱奥尼亚人讲和。本意表示赞许,与爱奥尼亚人讲和。n后人将后人将“背离事实背离事实”称为称为“bias”。Hunter D. Father of all bias? BMJ 2002;324:1071流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu描述性研究分析性研究实验性研究偏倚的后果 样本对总体的推断出现系统误差样本对总体的推断出现系统误差 也可得出虚假和间接联系的假设得出虚假和间接联系的假设 产生虚假和间接联系的结论产生虚假和间接联系的结论流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbi
20、n Yu 统计学联系的本质 病因病因 + + 偏倚偏倚 + + 机遇机遇 偏倚可导致:偏倚可导致:虚假联系间接联系虚假联系间接联系 偏倚的种类 概括起来三大类 选择性偏倚选择性偏倚 信息偏倚信息偏倚 混杂偏倚混杂偏倚流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu 偏倚的方向 正向偏倚正向偏倚:Overestimate away from the null “1”负向偏倚负向偏倚:Underestimate toward the null “1”流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu1、定
21、义 由于选择研究对象方法上的错误或缺点使研由于选择研究对象方法上的错误或缺点使研 究结果系统地偏离真实值。究结果系统地偏离真实值。2、实质 被选入的研究对象与没有被选者被选入的研究对象与没有被选者特征上的差特征上的差 异异所造成,造成样本不能代表总体,所造成,造成样本不能代表总体,或或两个两个 样本(或两组研究对象)样本(或两组研究对象)不是来自同一总体不是来自同一总体, 后者造成研究之外的因素在两组分布不均衡。后者造成研究之外的因素在两组分布不均衡。流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu(1)任意挑拣样本结构)任意挑拣样本结构(sam
22、pling frame),即所谓,即所谓“典典型型 样本样本”。常见于现况研究和病例对照研究。常见于现况研究和病例对照研究(2)主观挑拣研究对象)主观挑拣研究对象 “随便抽样随便抽样”或或“随意抽样随意抽样” (3)失访或无应答)失访或无应答(lost to follow-up or non-respondent)(4)入院率的影响)入院率的影响(5)根据暴露信息作出诊断的病例,再用这类病例去)根据暴露信息作出诊断的病例,再用这类病例去 研究该暴露与疾病的联系。研究该暴露与疾病的联系。3、来源流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu4、种
23、类 入院率偏倚入院率偏倚(admission rate bias ) Berksons bias 现患病例或新发病例偏倚现患病例或新发病例偏倚(prevalence-incidence bias ) Neyman bias 检出信号偏倚检出信号偏倚(detection signal bias ) 易感性偏倚易感性偏倚(susceptibility bias ) 排除偏倚排除偏倚(exclusive bias 无应答偏倚无应答偏倚(non-respondent bias )流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu入院率偏倚入院率偏倚(adm
24、ission rate bias ) Berksons biasn选择性偏倚的一种形式,是指利用医院就诊或住院病选择性偏倚的一种形式,是指利用医院就诊或住院病人作为研究对象时,由于入院率的不同而导致的偏差。人作为研究对象时,由于入院率的不同而导致的偏差。n当利用医院病人作为病例和对照时,由于对照是医院当利用医院病人作为病例和对照时,由于对照是医院的某一部分病人,而不是全部目标人群的一个随机样本,的某一部分病人,而不是全部目标人群的一个随机样本,又由于病例只是该医院或某些医院的特定病例(因为病又由于病例只是该医院或某些医院的特定病例(因为病人对医院及医院对病人双方都有选择性),所以作为病人对医院
25、及医院对病人双方都有选择性),所以作为病例组的病例也不是全体病人的随机样本。由此产生的病例组的病例也不是全体病人的随机样本。由此产生的病例和对照就与人群中的研究对象存在着某些差异,难免例和对照就与人群中的研究对象存在着某些差异,难免产生偏倚。产生偏倚。流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu举例:入院率偏倚皮肤癌和高血压关系的病例对照研究皮肤癌和高血压关系的病例对照研究一、病例和对照的选择一、病例和对照的选择 病例组:病例组:皮肤癌患者皮肤癌患者 对照组:对照组:骨折患者骨折患者二、某社区全部人群调查结果二、某社区全部人群调查结果有高血压
26、有高血压无高血压无高血压合计皮肤癌患者皮肤癌患者120048006000骨折患者骨折患者120048006000合计2400960012000021OR 流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu三、某医院中调查全部病人的结果三、某医院中调查全部病人的结果假定三种疾病的入院率分别为:假定三种疾病的入院率分别为: 皮肤癌皮肤癌60% 骨折骨折25% 高血压高血压40%则有:则有: 皮肤癌 not 高血压0.648002880 骨折 not 高血压0.2548001200 皮肤癌 with 高血压0.612000.4(1200720)912 骨
27、折 with 高血压0.2512000.4(1200300)660有高血压有高血压无高血压无高血压合计皮肤癌患者皮肤癌患者91228803792骨折患者骨折患者66012001860合计157240805652)(0.65-0.51 0.58OR81.32流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu 现患病例或新发病例偏倚现患病例或新发病例偏倚(prevalence-incidence bias )n在进行病例对照研究或现况研究时,用于研究的病例在进行病例对照研究或现况研究时,用于研究的病例一般是研究时的一般是研究时的现患病人现患病人,不包括
28、死亡病例和那些病程,不包括死亡病例和那些病程短、轻型或不典型的病例。此外一些病人在患病后,有短、轻型或不典型的病例。此外一些病人在患病后,有可能会改变其原来对某些研究因素的暴露情况。可能会改变其原来对某些研究因素的暴露情况。n这样用于研究的病例类型显然会与队列研究或实验性这样用于研究的病例类型显然会与队列研究或实验性研究有所不同,如在队列研究中,研究者可以随访观察研究有所不同,如在队列研究中,研究者可以随访观察到各种临床类型的新病例。由此产生的偏倚称为现患病到各种临床类型的新病例。由此产生的偏倚称为现患病例新发病例偏倚。例新发病例偏倚。流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copy
29、right by Rongbin Yu检出症候偏倚检出症候偏倚(detection signal bias )n指某因素与某些疾病在病因学上虽无关联,但由于该指某因素与某些疾病在病因学上虽无关联,但由于该因素的存在而引起了该病相关症状或体征的出现,使因素的存在而引起了该病相关症状或体征的出现,使患者及早就诊,接受检查,从而使该人群有较高的检患者及早就诊,接受检查,从而使该人群有较高的检出率,以致得出该因素与该疾病相关联的错误结论。出率,以致得出该因素与该疾病相关联的错误结论。流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu1、雌激素可以刺激子宫内
30、膜生长,易出血,易被早期诊、雌激素可以刺激子宫内膜生长,易出血,易被早期诊断;未服雌激素者不易得到及早诊断。断;未服雌激素者不易得到及早诊断。2、 Ziel etc. 等的研究早期病人占的比例较高。等的研究早期病人占的比例较高。3、另一调查发现:另一调查发现:暴露雌激素的子宫内膜癌患者暴露雌激素的子宫内膜癌患者 79为早期病人为早期病人非暴露雌激素子宫内膜癌患者非暴露雌激素子宫内膜癌患者 55为早期病人为早期病人举例雌激素和子宫内膜癌的关系雌激素和子宫内膜癌的关系 ( Ziel etc. 1975)检出症候偏倚存在的原因分析检出症候偏倚存在的原因分析流行病学教学工作室流行病学教学工作室喻荣彬喻
31、荣彬 Copyright by Rongbin Yu易感性偏倚易感性偏倚(susceptibility bias )n研究对象暴露于某一可疑致病因素与否,与很多主、研究对象暴露于某一可疑致病因素与否,与很多主、客观因素有关。这些因素均可直接或间接地影响观察客观因素有关。这些因素均可直接或间接地影响观察人群或对照对所研究疾病的易感性,从而导致某因素人群或对照对所研究疾病的易感性,从而导致某因素与某疾病间的虚假联系,由此而产生的偏倚被称为易与某疾病间的虚假联系,由此而产生的偏倚被称为易感性偏倚。感性偏倚。健康工人效应(健康工人效应(healthy worker effect)职业流行病学研究队列研
32、究职业流行病学研究队列研究志愿者偏倚志愿者偏倚流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu 排除偏倚排除偏倚(exclusive bias )n在选择研究对象的过程中,没有按照既定的原则或标在选择研究对象的过程中,没有按照既定的原则或标准自观察组或对照组中排除某些不符合标准的研究对象准自观察组或对照组中排除某些不符合标准的研究对象所导致的对某因素与某疾病之间联系的错误估计,称为所导致的对某因素与某疾病之间联系的错误估计,称为排除偏倚。排除偏倚。例:例:阿司匹林与心肌梗死关系的病例对照研究阿司匹林与心肌梗死关系的病例对照研究不应包括慢性关节炎患
33、者不应包括慢性关节炎患者也不应包括慢性胃溃疡患者也不应包括慢性胃溃疡患者流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu方法:在理论上可以通过比较总人群与实际抽样人群研究在理论上可以通过比较总人群与实际抽样人群研究 疾病与暴露因素的分布的两个四格表进行测量。疾病与暴露因素的分布的两个四格表进行测量。 举例:以病例对照研究为例以病例对照研究为例5、测量流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin YuBCADOR 00000CBDAOR OROR0 OROROR 10选选择择偏偏倚倚总人群总人群样本人群
34、样本人群根据选择概率选择偏倚的大小和方向可表示为:选择偏倚的大小和方向可表示为:11OROR 01OROR 0若若选择偏倚选择偏倚 = 0,即,即 ,则不存在选择偏倚,则不存在选择偏倚若若选择偏倚选择偏倚 0,即,即 ,则存在选择偏倚,此时,则存在选择偏倚,此时若若选择偏倚选择偏倚 0 0,则存在选择偏倚,此时,则存在选择偏倚,此时若若信息偏倚信息偏倚 0 aRR( f ),则,则 f 为为正向混杂正向混杂,使,使cRR高估高估(4)若若)若若cRR 0 0,为正向混杂,为正向混杂 值值 0 0,为负向混杂,为负向混杂流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by
35、Rongbin Yu (1)限制()限制(restriction) (2)随机化()随机化(randomization) (3)匹配()匹配(matching) (4)层化或标化()层化或标化(stratification) (5)多因素分析,如)多因素分析,如Logistic回归分析等回归分析等6、控制设计阶段分析阶段流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu交互作用混杂作用定量关系,与真实性无关定量关系,与真实性无关定性关系,影响真实性定性关系,影响真实性与研究设计无关与研究设计无关设计阶段可预防设计阶段可预防研究感兴趣,需要做出报告的
36、方面研究感兴趣,需要做出报告的方面研究不感兴趣,需要控制的方面研究不感兴趣,需要控制的方面分层分析可揭示交互作用分层分析可揭示交互作用分层分析排除混杂作用分层分析排除混杂作用评价交互作用,看各层评价交互作用,看各层OR是否相等是否相等评价混杂,比较调整前后评价混杂,比较调整前后OR无交互作用:无交互作用:OR1=OR2=OR3有交互作用:有交互作用:OR1 OR2 OR3无混杂作用:无混杂作用:OR粗粗=OR调整调整有混杂作用:有混杂作用:OR粗粗 OR调整调整能用统计学显著性检验评价能用统计学显著性检验评价不能用显著性检验评价不能用显著性检验评价流行病学教学工作室流行病学教学工作室喻荣彬喻荣彬 Copyright by Rongbin Yu流行病学研究设计的主要目的是:流行病学研究设计的主要目的是:估计随机误估计随机误差、控制偏倚,凸现出真实的联系差、控制偏倚,凸现出真实的联系。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。