医科大学精品课件：病例对照研究-周金华.pptx_163文库

资源描述

1、病例对照研究 Case-control Study 医学统计与流行病学系周金华 759886201 第一部分：要点复习目的要求 1、掌握病例对照研究的基本原理； 2、掌握病例对照研究的基本原则； 3、掌握常用指标的计算方法及资料整理分析方法。流行病学研究方法观察法描述流行病学分析流行病学横断面调查监测生态学研究产生假设病例对照研究队列研究检验假设实验法实验流行病学验证假设数理法理论流行病学临床试验现场试验社区干预吸烟/不吸烟人群中肺癌患者比例肺癌患者/正常人中吸烟的比例肺癌患者在研究人群中所占比例 A B C 病例对照研究原理图比较人数暴露疾

2、病 a/a+c b/b+d a c b d 病例对照研究基本原理以确诊的患有某特定疾病的病人作为病例，以不患有该病但具有可比性的个体作为对照；通过询问、实验室检查或复查病史，搜集研究对象既往各种可能的危险因素的暴露史，测量并比较病例组与对照组中各因素的暴露比例；经统计学检验，判断因素与疾病之间是否有统计学关联的观察性研究方法。病例对照研究的特点观察法，无干预；病例组和对照组，设立对照；由果到因：疾病暴露顺序；探索/检验病因假说。病例对照研究的优点 1.特别适用于罕见病研究（往往惟一可行）； 2.省钱、省力、省时间，易于组织实施； 3.不仅应用于病因探讨，还可广泛应用

3、于许多方面（疫苗免疫学效果的考核及爆发调查）； 4.可同时研究多个因素与某疾病的联系； 5.对研究对象多无损害。 1.不适于研究人群中暴露比例很低的因素； 2.选择偏倚、回忆偏倚难以避免； 3.论证因果关系能力不如队列研究； 4.不能计算发病率，只能计算OR值。病例对照研究的缺点研究类型研究类型成组的病例-对照研究（病例与对照不匹配）匹配的病例-对照研究（病例与对照匹配）频数匹配/成组匹配个体匹配探索检验匹配（matching）要求对照在某些因素或特征上与病例保持一致，使两组进行比较时排除匹配因素干扰的方法。 1、定义： 2、目的：提高研究效率，控制混杂因素

4、频数匹配（frequency matching）：使匹配因素在（各层）病例与对照中比例相同的匹配方法。个体匹配 (individual matching)：以病例和对照个体为单位进行匹配的方法交个体匹配。 1:1、1:2、1:3、1：R （1:4时效率最高）混杂因素 Confounding factor:亦称外来因素，是指与研究因素和研究疾病均有关，若在比较的人群中分布不均，可歪曲（夸大或缩小）研究因素与疾病之间真正联系的因素。（1）是所研究疾病的独立危险因素；（2）与所研究的暴露因素存在统计学联系；（3）不应是暴露因素与疾病因果链中的一个环节或中间变量。基本特征（必须

5、同时具备）：匹配过度（over-matching）把不必要的项目列入匹配，企图使病例与对照尽量一致，就可能徒然丢失信息，增加工作难度，结果反而降低了研究效率，这种情况称为匹配过度 (overmatching)。哪些情况不应该匹配？ v研究因素与疾病因果链中的中间变量不应匹配。如吸烟对血脂有影响，而血脂与心血管疾病有病因关系，如果研究吸烟与心血管病的病例对照研究中，按血脂水平将病例与对照配对，则吸烟与疾病的关联消失。 v只与可疑病因有关而与疾病无关的因素不应匹配。如避孕药的使用与宗教信仰有关，但宗教信仰与研究的疾病并无关联，故不应将宗教信仰作为匹配因素。 v可能是疾病的某一危

6、险因素。如在研究吸烟与肺癌的病例对照研究中，家族史不能作为匹配因素。几种不应该匹配的情况病例与对照的选择病例与对照选择的基本原则有两个：一是代表性：病例要足以代表总体的病例；对照要足以代表产生病例的总体人群或源人群；二是可比性：病例组与对照组在年龄、性别等主要特征方面无明显差异；病例的选择以医院为基础的（hospital-based）病例对照研究；以社区为基础的（community-based）病例对照研究。 1、病例选择要求：诊断可靠：尽量使用金标准；尽量选择确诊的新发病例，因为其回忆偏倚小，容易合作，被调查因素改变少。 2、病例：新发病例、现患病例、死亡病例

7、新发病例: 提供的信息较为可靠（推荐）；现患病例: 掺入疾病迁延及存活因素在内（存活者）；死亡病例: 信息准确性较差。病例的选择病例的来源： 1、被研究的总体人群中的全部病例或者总体中随机样本人群中的全部病例（社区）这些病例的代表性好，但调查工作比较困难，且耗费人力、物力较多； 2、医院住院或门诊的病例（医疗机构）这些病例比较合作，资料容易得到而且比较可靠，与对照的可比性好；代表性较差，会产生选择偏倚；不同类型的医疗机构，病人的特征不同。应结合研究目的，适当选择病人的来源。对照的选择排除选择偏倚；缩小信息偏倚；缩小不清楚或不能很好测量的变量引起的残余混杂；对照是

8、全人群的一个无偏样本。对照的样本的暴露率反映源人群的暴露水平，能代表产生病例的人群。对照的选择对照的来源社区对照：邻居、配偶对照医院对照（1）排除与研究暴露因素可能有关的病种，如研究吸烟与肺癌的关系，不能以慢性支气管炎病人作为对照；（2）最好不要只选择一种病种的病例作为对照；（3）多病种的选择有一定的稀释作用。对照选择是否恰当是病例对照研究成败的关键之一！ 1. 描述性统计（1）描述研究对象的一般特征（2）均衡性检验 2. 统计性推断（1）将资料整理为四格表/列联表；（2）暴露比例差异的显著性检验；（3）估计暴露因素疾病之间的联系强度；（4）结果解释。可能存在

9、哪些偏倚？得出什么结论？资料分析关联强度指标比值比（odds ratio, OR) 表示病例组某因素的暴露比值与对照组该因素暴露比值之比，反映暴露者的疾病危险性是非暴露者的多少倍。 OR 优势比RR 相对危险度概念不同用处不同相同之处病例组暴露和非暴露人数之比与对照组暴露和非暴露人数之比的比值 (比值比) 暴露组和非暴露组的发病率之比（率比）病例对照研究（不能计算发病率）队列研究都是说明疾病与暴露因素关联强度指标；都表示暴露组的疾病危险性是非暴露组的多少倍; 在疾病的发病率或患病率较低时，两者近似相等。病例对照研究能否计算RR值？不能。病例对照研究一般缺乏

10、暴露与非暴露的总体人数，且不能计算发病率/死亡率，故不能直接计算RR值。只能通过计算OR来估计RR。如果能满足2个条件所研究疾病的发病率（死亡率）很低（5%)；病例对照研究中所选择的研究对象代表性好； ORRR 一、成组匹配或不匹配资料的分析 1、整理四格表 2、病例组和对照组暴露率的比较： 3、暴露与疾病的联系强度OR： OR=病例组暴露比值/对照组暴露比=ad/bc OR的95%CI：二、不匹配分层资料的分析 1、按可能的混杂因素分层，每层整理成一个四格表，计算每层的值和OR；判断是否为混杂因素； 2、进行齐性检验（1）若两组资料同质，可计算合并OR值、合并值和ORMH

11、95%CI；（2）若两组资料不同质，不宜合并计算。 3、计算总的卡方值： 4、估计总OR值95%的可信区间： 1、计算各层的OR值：当两层的OR值接近时，说明两个资料是同质的 2、计算总的OR值：三、分级暴露资料的分析若能获得某暴露不同暴露水平的资料，可用以分析疾病和暴露的剂量反应关系，以增加因果推断的依据；分析步骤：（1）将资料整理归纳成列联表；（2）做卡方检验；（3）计算各分组的OR值通常以不暴露或最低水平的暴露为参照；（4）趋势检验。四、1：1配对资料的分析 1、病例组和对照组暴露率的比较： 2、暴露与疾病的联系强度： OR的95%CI： (适用于大样本) (校正

12、公式,b+c40) 偏倚及其控制（一）选择偏倚由于选入的研究对象与未选入的研究对象在某些特征上存在差异而引起的误差，这种偏倚常发生于研究的设计阶段。 1、入院率偏倚/ Berkson偏倚病例不是全体病人的随机样本，对照亦不是全体目标人群的随机样本；控制：设计阶段尽量采用随机选择研究对象，在多个医院选择对象等方法以减少偏倚程度。 2、现患病例-新发病例偏倚/ 奈曼偏倚（Neyman bias) 如果调查对象选自现患病例，所得的信息很多与存活有关，而未必与发病有关，从而高估暴露因素的病因作用；或改变生活习惯，降低危险因素的水平；这样调查的时候夸大或缩小病前某些特征，导致因素与疾

13、病的关联误差。控制：明确规定纳入标准为新发病例。 3、检出征候偏倚 / 暴露偏倚病人因与疾病无关的症状而就医，从而提高了早期病例的检出率，致过高的估计暴露的作用。控制：收集的病例中同时包括早、中、晚期病人。 4、时间效应倚倚某些疾病的早期病例在研究时归入非病例组，从而导致结论的误差；控制：尽量采用敏感的疾病早期检查技术，或开展观察期充分长的纵向调查。偏倚及其控制偏倚及其控制（二）信息偏倚又称观察偏倚或测量偏倚，是在收集整理信息过程中由于测量暴露与结局的方法有缺陷造成的系统误差。 1、回忆偏倚（recall bias）选择不易为人们所忘记的重要指标做调查，并重视问卷的

14、提问方式和调查技术，将有助于减少回忆偏倚。 2、调查偏倚尽量采用客观指征，选择合适的人选参加调查，做好调查技术培训，采取复查等做好质量控制，检查条件尽量一致，使用精良的检查仪器等。偏倚及其控制当我们研究某个因素与某种疾病的关联时，由于某个既与疾病有制约关系，又与所研究的暴露因素有联系的外来因素的影响，掩盖或夸大了所研究的暴露因素与疾病的联系，这种现象或影响称之为混杂偏倚，该外来因素叫混杂因素。设计阶段：限制、匹配资料分析阶段：标准化、分层分析、多因素分析（三）混杂偏倚控制：第二部分：课题讨论随着汽车的普及，我国车祸发生率和发生总数不断上升。为了遏制这一势头。需要

15、查明车祸发生的原因。请通过回答下列问题，设计一项病例对照研究，以探讨广州市车祸的发生原因。课题一交通事故：是指车辆、人员在特定道路通行过程中，由于当事人违反道路交通管理条例或民法通则应承担责任的行为而造成的人、畜伤亡和车、物损失的交通事件。通常将同等责任以上事故称为责任事故。其事故级别分为：重大及特大事故、一般事故、轻微事故。课题一课题一问题1：是采用频数匹配还是个体匹配的病例对照研究？或者两者均可？这两类病例对照研究的异同点是什么？各有何适用特征？答案提示：两者均可，频数匹配较好。共同点：目的相同，都在于提高研究效率和控制混杂因素；对已匹配的因素，无法分析

16、其与疾病的关系及与其他暴露因素的交互作用。课题一不同点：个体匹配是以病例和对照个体为单位进行匹配，1:R匹配，适用于罕见病或所能得到的符合规定的病例数很少的研究；个体匹配适用于对照在某定量指标的特定范围内与病例匹配，如要求对照与病例的年龄之差在3岁以内。频数匹配首先应当知道或估计出匹配变量每一层的病例数，然后从备选对照中选择对照，直至达到每层所要求的数目，不一定要绝对数相等，重要是比例相同，适用于广泛地探索疾病的危险因子。频数匹配适用于定量指标要求在一定范畴内匹配时，如年龄匹配，病例为5059岁组，则对照也应当为5059岁组。问题2：列出病例和对照的纳入和排除标准。

17、课题一参考答案：病例组纳入标准：近3个月内发生责任交通事故的肇事司机，事故级别为一般事故以上。碰撞类型包括机动车与机动车相撞、机动车与非机动车相撞。自愿参加本次调查，无重大精神疾病或智力障碍，能够清醒了解整个调查，并提供知情同意书；病例组排除标准：因特殊原因发生车祸（自然灾害，被人蓄意伤害发生车祸等）。参考答案：对照组纳入标准：以近3个月内未发生过交通事故的有机动车驾驶证的司机为对照, 自愿参加本次调查，无重大精神疾病或智力障碍，能够清醒了解整个调查，并提供知情同意书；对照组排除标准。课题一课题一问题3：从获得病例和对照的途径来看，有人群为基础的病例对照研究和以

18、医院为基础的病例对照研究，分别描述两者获得病例和对照的方法，病例和对照的获取原则是什么。参考答案：人群为基础的病例对照研究病例：由交警大队登记在册的曾经发生交通事故的机动车驾驶员；对照：没有发生过交通事故的机动车驾驶员。医院为基础的病例对照研究病例：因交通事故发生严重外伤而入院的机动车驾驶员；对照：医院其他科室的病人，有机动车驾驶证。课题一病例的选择以医院为基础的对照选择原则：由尽可能多的病种的病人组成；新发病人；不选择当前患多种疾病的病人；因已知与所研究的危险因素有关的病种病人不能作为对照。对病例的规定：“金标准”；对病例其他特征的规定：性别、年龄等；控制

19、非研究因素以增强两组可比性；保证病例达到标准：如病例报告确诊某癌症。排除选择偏倚；缩小信息偏倚；缩小不清楚或不能很好测量的变量引起的残余混杂；在满足真实性的要求和逻辑限制的前提下使统计把握度达到最大。对照的选择课题一问题4：估计样本量应考虑哪些因素？答案提示：计算样本量需要考虑：研究因素在对照组中的暴露率P；预期的该因素的效应强度，即相对危险度RR或暴露的比值比OR ；希望达到的检验的显著水平；希望达到的检验把握效度（1-）。课题一问题5 ：参考答案：文化程度与车祸关系：通常以不暴露或最低水平暴露组为参照组；本题中以大学及以上文化程度为参照组。

20、课题一高中文化程度： OR1=a1d/b1c=400*900/400*200=4.5，95%CI：3.75.5；初中文化程度： OR2=a2d/b2c=900*900/200*300=13.5，95%CI：11.016.5。卡方趋势检验：自由度为1的卡方趋势检验公式，参考课本 T1=400*1+900*2=2200 T2=800*1+1200*2=3200 T3=800*12+1200*22=5600 Var=1500*1600*(3100*5600-32002)/31002*(3100-1)=574 2=738.611，P0.01；结果说明剂量反应趋势有统计学意义，可知：随着文化程

21、度的降低车祸发生风险递增，呈现明显计量反应关系。除此，还可以通过比较两级的95%置信区间，没有相交，得出两级的差异有统计学意义，进而可以说明剂量反应趋势有统计学意义。课题三吸烟和饮酒可能与多种疾病相关，且二者又相互关联，从而使两者在疾病的关联研究中成为相互的混杂因素。一项病例对照研究探讨了饮酒量和吸烟对心脏病的影响，获得的数据如下：吸烟量分为吸烟与不吸；饮酒量分为中度饮酒和不饮酒。吸烟组中心脏病患者1400人，其中中度饮酒者为1260人，不饮酒者为140人；吸烟组对照800人，其中中度饮酒者为720人，不饮酒者为80人。不吸烟组病例600 人，其中中度饮酒者160人，

22、不饮酒者440人；不吸烟组对照1200人，其中中度饮酒者320人，不饮酒者880人。课题三 1.什么是混杂因素和混杂作用？在病例对照研究中，哪些因素可以控制混杂作用？ 2.根据以上研究结果，判断该病例对照研究是频数匹配还是个体匹配？ 3. 试分析饮酒与心脏病的关系，列出统计表格。 4.按吸烟分层，分析饮酒与心脏病的关系，列出表格，分别计算吸烟与不吸烟层饮酒与心脏病的关系（计算2、OR、OR的95%CI ）。 5.在对照组人群中，分析饮酒与吸烟的关系（计算2、OR、OR的 95%CI）。 6.在不饮酒人群中，分析吸烟与心脏病的关系（计算2、OR、OR 的95%CI）。 7.按吸烟分层后

23、，判断两层中饮酒与心脏病关系OR值的同质性。如同质，计算总OR值及其95%CI；如不同质，表示何意义？ 8.按饮酒与否分层，分析吸烟与心脏病的关系，列出统计表格？ 9.根据以上内容，总结利用分层分析方法控制混杂作用的步骤。问题1：什么是混杂因素和混杂作用？在病例对照研究中，哪些因素可以控制混杂作用？课题三答案提示：混杂因素亦称外来因素，是指与研究因素和研究疾病均有关，若在比较的人群中分布不均，可歪曲（夸大或缩小）研究因素与疾病之间真正联系的因素，混杂因素所起的作用就是混杂作用。控制：设计阶段：限制、匹配资料分析阶段：标准化、分层分析、多因素分析课题三问题2：根据以上研

24、究结果，判断该病例对照研究是频数匹配还是个体匹配？答案提示：频数匹配课题三问题3. 试分析饮酒与心脏病的关系，列出统计表格。 2=152.47，P0.001； OR=1420*960/1040*580=2.260; 95%CI：1.982.58 饮酒是心脏病的危险因素，饮酒导致心脏病的危险性是不饮酒组的2.26倍。病例对照饮酒14201040 不饮酒580960 答案提示：课题三问题4：按吸烟分层，分析饮酒与心脏病的关系，列出表格，分别计算吸烟与不吸烟层饮酒与心脏病的关系（计算、OR、OR的95%CI）答案提示：按是否吸烟分层，饮酒与心脏病的关系：课题三在吸烟中

25、：2 = 0.0，P=1.000， OR = (126080)(140720) = 1.0，95% CI：0.751.34；在不吸烟中：2=0.0，P =1.000， OR= (160880)(440320) = 1.0，95% CI：0.801.25。饮酒与心脏病的统计学关联是由于吸烟作为混杂因素引起，其实饮酒与心脏病并无统计学关联。课题三问题5：在对照组人群中，分析饮酒与吸烟的关系（计算、OR、OR的95%CI）答案提示：在对照人群中，吸烟与饮酒的关系： 2=771.37，P0.001； OR=720*880/320*80=24.75，饮酒人群中吸烟的是不饮酒人群中吸烟的

26、24.75倍，OR95%CI：19.0132.23。问题6：在不饮酒人群中，分析吸烟与心脏病的关系（计算、OR、OR的95%CI）课题三答案提示：在不饮酒人群中，吸烟与心脏病的关系：在不饮酒中：2=73.76，P0.001 OR=140*880/440*80=3.5 95%CI：2.64.7。怎样判断吸烟为混杂因素？（1）吸烟与饮酒有关；-问题5 （2）吸烟与心脏病有关；-问题6 （3）吸烟不是饮酒与心脏病关系的中间环节。吸烟是饮酒导致心脏病的一个混杂因素。课题三问题7：按吸烟分层后，判断两层中饮酒与心脏病关系 OR值的同质性。如同质，计算总OR值及其95%CI；如不

27、同质，表示何意义？答案提示：两层中OR齐性检验，P=1，所以两层OR同质，可以合并，两层合并后： =1 ，95% CI：0.841.19 。如不同质，表示吸烟与不吸烟中，饮酒发生心脏病的危险性不一致, 可能存在交互作用，不能合并，应分别报道。因此，控制吸烟后，饮酒和心脏病没有关联。课题三问题8：按饮酒与否分层，分析吸烟与心脏病的关系，列出统计表格？答案提示：按是否饮酒分层，吸烟与心脏病的关系：在饮酒中：2=145.4，P0.001； OR=（1260320）（160720）=3.5；95%CI：2.844.32 在不饮酒中：2=73.76，P0.001； OR=（14088

28、0）（44080）=3.5；95%CI：2.64.7 在饮酒与不饮酒中，吸烟导致心脏病的危险性都是3.5。课题三课题三问题9：根据以上内容，总结利用分层分析方法控制混杂作用的步骤。答案提示：（1）确定分层因素，分层列四格表；（2）分别计算各层的OR值；（3）检验各层OR值的同质性；（4）如果同质，计算并报告合并的OR值；（5）如果不同质，分别报告OR值。课题四问题1：可以采用哪些流行病学研究方法？较佳的是那种？答案提示：病例对照研究，队列研究等；较佳的是病例对照研究。 1. 病例对照研究可以用来探讨疾病的危险因素（多因一果），而队列研究常用于探讨已知因素对结局的

29、影响（一因多果）； 2. 病例对照研究适用于发病率低的疾病研究（题目表明仅部分人发展为慢性乙肝病持续携带者）。问题2：如果采用成组病例对照研究方法，病例和对照的纳入与排除标准分别是什么？并说明原因。课题四参考答案：病例组纳入标准：1.符合慢性乙型肝炎携带者诊断标准 A.血清HBsAg阳性史6个月以上； B.一年内连续随访3次或以上，血清ALT和AST均在正常范围，且无慢性肝炎的体征如肝掌，蜘蛛痣，脾大； C. 肝组织学检查无明显炎症，坏死或纤维化； D. HbeAg阳性，血清HBV DNA可检出。 2. 自愿参加本次调查，无重大精神疾病或智力障碍，能够清醒了解整个调查，并提供知

30、情同意书；病例组排除标准：合并其他肝炎病毒感染者；严重的基础疾病者，如心衰、肾衰等。课题四参考答案：对照组纳入标准：血清抗HBs 阳性且HBsAg阴性；自愿参加本次调查，无重大精神疾病或智力障碍，能够清醒了解整个调查，并提供知情同意书。对照组排除标准：注射过乙型肝炎疫苗者；严重的基础疾病者，如心衰、肾衰等. 问题3：研究因素应该包括哪些。课题四参考答案： A.一般情况：年龄、性别、民族、婚姻状况、职业、文化程度、经济状况、居住地 B.既往史：手术史、口腔诊疗史、内窥镜史、输血史、有偿献血史、创伤性美容史(纹眉、绣眉、眼线、纹身、打耳洞等)、针灸史、共用注射器或刮胡刀史、是否与HBsAg阳性者长期共同生活 C.乙肝易感基因作业自学内容：课题五作业：课题二（P4）交作业时间：5月29日前交至公共卫生学院722办公室周金华 Thank you!Thank you!Thank you!Thank you!

展开阅读全文