1、第六章 病例对照研究,Case-Control Study,钟秋安,副教授 公共卫生学院流行病学教研室 E-mail: zhongqa2010,1,Zika Virus infection,Microcephaly,2,学习目的,3,4,病例对照研究,5,第一节 概 述,概 念 基本原理与特点 用 途 研究类型,Exposure (risk factor ),Some exposures are acute, one-time episodes, never repeated in a subjects lifetime. Other exposures are long term, such
2、 as cigarette smoking or the use of oral contraceptives. Exposures may also be intermittent, such as pregnancy-induced hypertension, cold and so on.,6,基本原理,选择患有某特定疾病的病人作为病例,以不患有该病但具有可比性的个体作为对照; 回顾调查他们发病前对某个(些)研究因素的暴露情况,比较两组中暴露率和暴露水平的差异; 若两组差别有统计学意义,则可认为暴露因素与疾病之间存在着统计学上的关联。,7,+,+,a,c,b,d,The design o
3、f a case-control study,Colleting data retrospectively,comparison count exposure subjects,Cases,Controls,8,特 点,9,用 途,广泛探索影响因素 深入检验病因假说 研究健康状态等事件发生的影响 疾病预后因素的研究 临床疗效影响因素的研究,10,研究类型,11,1、非匹配病例对照研究,按与病例组可比的原则,根据样本的大小,选择一定数量的对照,数量不需成严格的比例关系,但对照的数量等于或多于病例。,12,Unmatched design,Target population,cases,contr
4、ols,13,2、匹配病例与对照研究,匹 配 或称配比(matching),即要求对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰。,14,频数匹配又称成组匹配(frequency matching) 匹配因素所占的比例在病例组与对照组一致。,匹配法(matching),Target population,cases,controls,Some characteristics,15,个体匹配(individual matching) 给每一个病例选择一个或几个对照,配成对(pair)或配成伍,使对照在某些因素或特征(如年龄、性别等)方面与其相配的病例相同或基本相同
5、。,Pair Matching,cases,controls,Target population,Some characteristics,16,匹配法注意事项,17,第二节 研究实例,Smoking,Lung cancer,18,非癌症病人对照,吸烟,+,+,19,吸纸烟者发生肺癌的危险性比吸烟斗者更大; 吸烟是肺癌发生的危险因素, OR=2.97, 95% CI: 1.82-4.85; 吸烟率较高的男性中关联强度更大, OR=8.71, 95% CI: 4.55-16.67, 且随着吸烟量增加,肺癌发生的危险性增大。,研究结果,20,第三节 研究设计与实施,确定研究目的与类型 确定研究因素
6、 确定研究对象 估计样本含量 资料收集,21,一、确定研究目的与类型,根据以往疾病分布研究或现况调查结果并结合文献,提出病因假设。,22,二、确定研究因素,23,基本原则 代表性 病例能代表总体的病例; 对照能代表产生病例的总体人群或源人群; 可比性 两组主要特征方面无明显差异。,三、研究对象,24,病例的选择,诊断可靠,尽量使用金标准; 选择确诊的新病例; 总体人群中的全部病例或者随机样本人群中的全部病例; 医院住院或门诊的病例; 社区病例。,1. 要 求,2. 来 源,25,对照的选择,候选对象必须来自产生病例的总体; 对照一旦发生所研究的疾病便成为病例 组的研究对象; 研究的总体人群或抽
7、样人群中具有代表 性的非病例; 医院中患有其他疾病的病人; 亲属、邻居、同事、同学等。,1. 要 求,2. 来 源,26,广泛探索病因,采用不匹配或频数匹配; 罕见病采用个体匹配; 匹配的因素不宜过多,避免发生“匹配过度(overmatching)”增加工作的难度。,选择适宜的对照形式要注意的原则,27,四、估计样本含量,(一)有关参数 病例组的暴露率(P1)和对照组暴露率(P0) 优势比(odds ratio, OR) 值 把握度1-,28,查表法 公式法: 近似公式:,(二)估计方法,29,五、资料收集,医院病案记录,疾病登记报告等摘录; 检测病人的标本或病人的环境获得; 对病例或对照的询
8、问调查中取得; 收集研究因素、其他可疑的因素及可能的混杂因素等。,30,Quiz,1、在研究吸烟与肺癌关系的病例对照研究中,选择支气管炎病人作对照,将: A、高估吸烟与肺癌之间的相互关系 B、有可能产生假阳性结果 C、使OR值增大 D、低估吸烟与肺癌之间的相互关系 E、对结果没有影响,31,第四节 资料分析,32,比较病例组与对照组在研究因素以外的其他主要特征方面有否可比性,两组非研究因素均衡,其暴露率的差异与发病有关。,均衡性检验,33,34,推断性分析策略,35,不同资料的统计分析,(一)非匹配或成组匹配设计的资料分析 2 检验 传统的四格表的专用公式 antel-Haenszel (M-
9、H)方法 OR计算与可信限的估计及其意义,36,OR 比值比,指病例组暴露因素的暴露比值与对照组该暴露因素的暴露比值之比。 公式 :OR=(a/c)/(b/d)=ad/bc,计算OR,37,OR特点 与RR一样,反映暴露者患某种疾病的危险性较无暴露者高的程度。 如果能满足2个条件 所研究疾病的发病率(死亡率)很低 病例对照研究中所选择的研究对象代表 性好 OR RR,38,39,口服避孕药(OC)与心肌梗死(MI) 的病例对照研究,OR 95%C.I.=,40,四格表的专用公式,M-H法公式,2 检验,41,其中E(a) 为a的期望值;V(a)为a的方差,两种方法计算结果一致,表明口服避孕药与
10、心肌梗死有联系,但联系强度如何,要计算OR。,42,Miettinen法的OR 95%C.I. : 结果表明口服避孕药者患心肌梗死的危险性是未服避孕药者的2.2倍,95%的可信范围是在 1.263.84 之间。,OR计算与可信限的估计及其意义,43,(二)个体匹配资料的分析(1:1配对资料),匹配资料是由病例与对照结合成对子,列成四格表的格式,表内的数字a、b、c、d 是病例与对照配成对的对子数;,44,1:1配对研究中疾病与暴露的关系,OR 95%C.I.=,45,95%的可信范围是在3.5426.45之间,外源性雌激素与子宫内膜癌关系的病例对照研究,外源性雌激素与子宫内膜癌配比资料,46,
11、表明经历外源性雌激素暴露史者患子宫内膜癌 的危险性是未经历者的9.67倍,95%的可信范围在 3.54 26.45 之间。,47,Case,Control,Pairs 1 2 3 4 62 63,exposed,unexposed,48,(三)分层的资料分析,考虑到年龄与口服避孕药有关,也与发生心 肌梗死有关,可能是个混杂因素。故可按年龄 分层,分为40岁和40岁两层,分层分析并 估计其作用大小。,49,按40岁、40岁进行分层,50,两层的OR均较不分层时OR(2.20)大; 分析在非暴露组中年龄与MI的关联,OR=0.48,2=7.27,说明年龄与MI有联系; 分析对照组中年龄与口服OC的
12、关联,OR=3.91,2=8.89,说明年龄与口服OC 有联系; 表明年龄为研究OC与MI时的混杂因素。,51,合并 合并,计算合并2与OR值,52,合并,合并,按年龄分层后服OC合并的2 计算,53,合并2与合并OR较未调整的2 (7.70)与OR(2.20)为高; 说明由于混杂因素年龄的作用,使暴露因素避孕药与心肌梗死的关联趋向于1; 口服避孕药者患心肌梗死的危险性是未服避孕药者的2.79倍,95%的可信范围是在1.555.01之间。,结 论,54,第五节 偏倚及其控制,55,选择偏倚 由于选入的研究对象与未选入的研究对象某些特征上存在差异而引起的误差; 信息偏倚 在收集整理信息过程中由于
13、测量暴露与结局的方法有缺陷造成的系统误差; 混杂偏倚 研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系。,56,入院率偏倚 现患病例-新发病例偏倚 检出征候偏倚,选择偏倚,57,定义 也叫Berkson偏倚,当利用医院病人作为病例和对照时,对照是医院的某一部分病人不是全体目标人群的一个随机样本,病例也只是该医院或某些医院的特定病例不是全体病人的随机样本,所以难免产生偏倚,特别是因为各种疾病的入院率不同导致病例组与对照组某些特征上的系统差异。 控制 从总体人群中选择所有或绝大多数符合诊断标准的病例;
14、从各医院中选取病例,从多病种中选择对照。,1. 入院率偏倚(admission rate bias),58,不同人群骨和运动器官与呼吸道疾病之间关系的OR值,举例:在一般人群中和住院病人中研究骨和运动器官疾病与呼吸道疾病之间的关系,由于研究来源的不同,OR值不同,(Sacket BJ,1979),59,定义 又称奈曼偏倚(Neyman bias),如果调查对象选自现患病例,即存活病例,可能得到更多的信息,但是其中很多信息可能只与存活有关,而未必与该病的发病有关,从而高估了某些暴露因素的病因作用;另一种情况是,某病的幸存者改变了生活习惯,从而降低了某个危险因素的水平,或当他们被调查时夸大或缩小了
15、病前生活习惯上的某些特征,导致某一因素与疾病的关联误差。 控制 调查时明确规定纳入标准为新发病例。,现2. 现患病例-新发病例偏倚(prevalence-incidence bias),60,定义 也称暴露偏倚,病人常因某些与致病无关的症状而就医,从而提高了早期病例的检出率,致使过高地估计了暴露程度而产生的系统误差。 举例 1975年Ziel所做的妇女服用复方雌激素与子宫内膜癌关系的病例对照研究:服用复方雌激素的妇女因导致阴道出血而就医,故被发现有早期子宫内膜癌的机会增多,从而得出复方雌激素与子宫内膜癌有关联的错误结论。 控制 延长收集病例的时间,超过由早期向中、晚期发生的时间。,3. 检出征
16、侯偏倚(detection signal bias),61,定义 病例对照研究主要是调查研究对象既往的暴露情况,由于被调查者记忆失真或不完整造成结论的系统误差。 原因 与调查时间和事件发生的时间间隔、事件的重要性、被调查者的构成以及询问技术有关。 控制 选择不易为人们所忘记的重要指标做调查; 重视问卷的提问方式和调查技术。,信息偏倚,1. 回忆偏倚(recall bias),62,来源 调查对象 调查者 原因 病例与对照的调查环境与条件不同调查技术、调查质量不高或差错以及仪器设备的问题。 控制 采用客观指征 认真做好调查技术培训 采取复查等方法做好质量控制 检查条件尽量一致 使用的检查仪器应精
17、良,2. 调查偏倚(investigation bias),63,特点 不易识别,不易确定,需认真细致地去解决。 控制的方法 匹配法 分层分析法 多因素分析,混杂偏倚,64,第六节 优点与局限性,优 点,样本量小,病例易获取,工作量不大,所 需人力、物力较少,易于进行,出结果快; 可同时对一种疾病的多种病因进行研究; 适合于对病因复杂、发病率低、潜伏期长 的疾病; 可以对治疗措施的疗效与副作用做出初步 评价。,65,易受回忆偏倚的影响; 选择合理的对照较困难; 结果的可靠性不如队列研究; 不能计算暴露与无暴露人群的发病率。,局限性,66,总 结,病例对照研究属于观察性研究,验证病因假设能力弱;
18、 病例对照研究设计主要有两种类型; 病例对照研究分析策略一般经由卡方检验、计算OR及其95%可信区间、以OR为主解释其分析结果三个步骤; 病例对照研究运用较广,是流行病学最基本、最重要的研究方法之一 。,67,Q & A,1、甲、乙两位医生欲研究冠心病与高胆固醇血症的相关性,采用不同方法却获得不同结论。 医生甲应用病例对照研究,数据整理如下: 医生乙应用队列研究,数据整理如下: 请分别结合OR值和RR值说明甲、乙两位医生各获得了什么结论?试分析两位医生获得不同结论的可能原因?,OR =1.16 (95%CI.:0.681.97),RR =2.20 (95%CI.:1.682.83),医生甲,医生乙,68,Thank you for your attention!,