1、分析流行病学方法分析流行病学方法华中科技大学同济医学院公卫学院华中科技大学同济医学院公卫学院流行病与卫生统计学系流行病与卫生统计学系2n队列研究队列研究n病例对照研究病例对照研究 分析流行病学分析流行病学(analytical epidemiology)也称分析性研究()也称分析性研究(analytical study),是在描述性研究基础上进一步在),是在描述性研究基础上进一步在有选择的人群中观察可疑病因与疾病和健康有选择的人群中观察可疑病因与疾病和健康状况之间关联的一种研究方法。状况之间关联的一种研究方法。3一、队列研究一、队列研究n概念概念n用途用途n类型类型n研究对象的选择研究对象的选
2、择n资料的收集资料的收集n资料分析及结果解释资料分析及结果解释n优点和局限性优点和局限性4 队列研究队列研究(cohort study)是将一个范围)是将一个范围明确的人群按明确的人群按是否暴露是否暴露于可疑因素或于可疑因素或暴露程度暴露程度分为不同的亚组,追踪各组的结局并比较其差分为不同的亚组,追踪各组的结局并比较其差异,从而判定暴露因素与结局之间有无关联及异,从而判定暴露因素与结局之间有无关联及关联程度大小的一种关联程度大小的一种观察观察性研究方法。性研究方法。(一)概(一)概 念念5678暴露暴露(exposure) 指接触过某种物质、具备某种特征或处于某种状态。指接触过某种物质、具备某
3、种特征或处于某种状态。 队列队列(cohort) 根据人群进出队列的时间不同,分为根据人群进出队列的时间不同,分为 固定队列固定队列和和动态队列动态队列危险因素危险因素(risk factor) 泛指能引起某特定不良结局泛指能引起某特定不良结局(outcome),),或使或使其发生的概率增加的因子,包括个人行为、生活其发生的概率增加的因子,包括个人行为、生活方式、环境和遗传等多方面的因素。方式、环境和遗传等多方面的因素。9固定队列固定队列 Fixed Cohort研究开始研究开始研究结束研究结束出现结局出现结局未出现结局未出现结局10动态队列动态队列 Dynamic Cohort研究开始研究开
4、始研究结束研究结束出现结局出现结局失访失访11根据研究对象是否暴露于某研究因素或其不同水平将根据研究对象是否暴露于某研究因素或其不同水平将研究对象分成暴露组(研究对象分成暴露组(E E)与非暴露组()与非暴露组()随访一定时间,比较两组之间所研究结局随访一定时间,比较两组之间所研究结局(outcome)发生率的差异,以分析暴露因素与研究结局之间的关发生率的差异,以分析暴露因素与研究结局之间的关系系基本原理基本原理12N目标人群目标人群代表性代表性样本样本YE时间顺序时间顺序 暴露暴露结局结局YN13主要特点主要特点观察观察法法设立设立对照对照 由因到果由因到果,符合时间顺序,符合时间顺序确证确
5、证暴露和结局因果关系暴露和结局因果关系14(二)用途(二)用途检验(验证)病因假设检验(验证)病因假设描述疾病的自然史描述疾病的自然史15(三)研究类型(三)研究类型前瞻性队列研究前瞻性队列研究(prospective cohort study) 历史性队列研究历史性队列研究(historical cohort study)双向性队列研究双向性队列研究(ambispective cohort study) 16时间顺序时间顺序 过去过去 现在现在 将来将来 历史性队列历史性队列双向性队列双向性队列前瞻性队列前瞻性队列前瞻性收集资料前瞻性收集资料17 前瞻性队列研究前瞻性队列研究 Prospec
6、tive Cohort Study研究队列的确定是现在研究队列的确定是现在根据研究对象现在的暴露分组根据研究对象现在的暴露分组需要随访需要随访(follow-up)结局在将来某时刻出现结局在将来某时刻出现18 历史性队列研究历史性队列研究 Historical (Retrospective) Cohort Study根据研究开始时研究者掌握的有关研究对象既往根据研究开始时研究者掌握的有关研究对象既往的暴露情况的历史材料分组的暴露情况的历史材料分组不需要随访,研究开始时结局已出现不需要随访,研究开始时结局已出现19 双向性队列研究双向性队列研究 Mixed (Ambispective) Coho
7、rt Study研究队列的确定是过去研究队列的确定是过去根据研究对象既往的暴露情况分组根据研究对象既往的暴露情况分组需要随访需要随访部分结局可能已出现部分结局可能已出现20现场的代表性、配合度现场的代表性、配合度从目标人群中抽出的具有代表性的人从目标人群中抽出的具有代表性的人未患所研究疾病未患所研究疾病 分为暴露人群和非暴露人群分为暴露人群和非暴露人群(四)研究对象的选择(四)研究对象的选择21暴露人群选择暴露人群选择n特殊暴露人群特殊暴露人群n一般人群一般人群n有组织的人群团体有组织的人群团体22非暴露(对照)人群选择非暴露(对照)人群选择内对照内对照(internal controls)
8、一群研究对象内部一群研究对象内部外对照外对照(external controls) 一群研究对象外部一群研究对象外部总人口对照总人口对照(total population controls) 整个地区现成的发病或死亡资料整个地区现成的发病或死亡资料多重对照多重对照(multiple controls) 两种或以上的对照形式两种或以上的对照形式201200111112PPPPPPZPPZNP公式计算(公式计算(条件条件 (五)样本含量的估计(五)样本含量的估计影响样本量的因素影响样本量的因素 非暴露人群或全人群中所研究疾病的发病率非暴露人群或全人群中所研究疾病的发病率p0暴露人群与对照人群疾病发
9、病率之差暴露人群与对照人群疾病发病率之差P1-P0第一类错误概率第一类错误概率把握度把握度(power) 1- 已知已知 p p0 0=0.007=0.007,RR=2.5RR=2.5,=0.05=0.05,=0.1=0.1 计算样本量计算样本量 根据上述条件根据上述条件 Z=1.96, Z=1.282 ,q0=0.993 p1=p0RR=0.0175,q1=0.9825 代入公式得代入公式得 N=2310 考虑到失访,实际上每组需扩大考虑到失访,实际上每组需扩大10%10%,即,即25412541人人26 基线资料基线资料 随访和结局资料随访和结局资料(六)资料的收集(六)资料的收集27 基
10、线资料基线资料(baseline information)收集)收集 暴露于研究因素的信息暴露于研究因素的信息与结局有关的其他信息与结局有关的其他信息人口学资料人口学资料28 随访随访(follow-up)和和结局结局资料的收集资料的收集结局变量结局变量(outcome variable)()(也称结局,观察也称结局,观察 对象出现的预期结果指标)对象出现的预期结果指标)随访:对象、内容、方法、间隔、随访者随访:对象、内容、方法、间隔、随访者观察终点(观察终点(研究对象出现了预期的结局研究对象出现了预期的结局)观察终止时间(观察终止时间(整个随访工作截止的时间整个随访工作截止的时间)29查漏补
11、缺、资料入库查漏补缺、资料入库 统计描述(见病例统计描述(见病例- -对照研究部分)对照研究部分)统计推断统计推断 (七)资料的整理、分析及结果解释(七)资料的整理、分析及结果解释30 资料的基本整理模式资料的基本整理模式 率的计算率的计算 标化比标化比 暴露与发病关联强度估计暴露与发病关联强度估计 统计推断统计推断31资料的基本整理模式资料的基本整理模式病例病例非病例非病例合计合计暴露组暴露组aba+b=n1非暴露组非暴露组cdc+d=n0合计合计a+c=m1b+d=m0a+b+c+d=t暴露组发病率暴露组发病率=a/n=a/n1 1非暴露组发病率非暴露组发病率=c/n=c/n0 0队列研究
12、资料归纳整理表队列研究资料归纳整理表32率的计算率的计算 累积发病率累积发病率 发病密度发病密度33 适用于固定队列适用于固定队列 报告时必须注明时间长短报告时必须注明时间长短 累积累积发病率发病率 (cumulative incidence)CI=观察期内(累积)发病人数观察期内(累积)发病人数观察开始时的人口数观察开始时的人口数34 发病密度发病密度 (incidence density) 适用于动态队列适用于动态队列ID =观察期内发病人数观察期内发病人数观察人时数总和观察人时数总和观察人时数观察人时数=观察人数观察人数观察时间观察时间35标标 化化 比比适用于结局事件的发生率低,不宜直
13、接计算率时适用于结局事件的发生率低,不宜直接计算率时 E EO O理论死亡数理论死亡数实际死亡数实际死亡数SMRSMR标化比的意义标化比的意义 被研究人群发生(死于)某病的危险性是标准人被研究人群发生(死于)某病的危险性是标准人群的多少倍群的多少倍36暴露与疾病的关联强度暴露与疾病的关联强度 相对危险度相对危险度 归因危险度归因危险度 归因危险度百分比归因危险度百分比 人群归因危险度人群归因危险度 人群归因危险度百分比人群归因危险度百分比37 相对危险度相对危险度(Relative Risk,RRRR )是暴露组)是暴露组发病率(或死亡率)与非暴露组发病率(或死发病率(或死亡率)与非暴露组发病
14、率(或死亡率)的比值亡率)的比值010ncnaIIRRe 意义意义E发病或死亡的危险是发病或死亡的危险是的多少倍的多少倍暴露暴露组率组率非暴露非暴露组率组率38意义意义 吸烟者因肺癌死亡的危险是非吸烟者的吸烟者因肺癌死亡的危险是非吸烟者的10.710.7倍倍 吸烟者因心血管疾病死亡的危险是非吸烟者的吸烟者因心血管疾病死亡的危险是非吸烟者的1.71.7倍倍心血管疾病心血管疾病170.321.7吸烟者与非吸烟者死于不同疾病的吸烟者与非吸烟者死于不同疾病的RRRR肺癌肺癌疾病疾病296.7550.12吸烟者吸烟者4.69非吸烟者非吸烟者10.7RR(1/101/10万人年)万人年)39 归因危险度归
15、因危险度 (Attributable Risk, AR )是暴露组发病率与对照组发病率的差值。是暴露组发病率与对照组发病率的差值。 意义意义E E与与 人群比较,所增加的疾病发生数量人群比较,所增加的疾病发生数量ARAR值值 暴露因素消除后所减少的疾病数量暴露因素消除后所减少的疾病数量ca或或 1000 RRIIIRRAR010nnIIARe 40 意义意义RR RR 吸烟对肺癌的吸烟对肺癌的病因学病因学意义较大意义较大AR AR 戒烟对心血管疾病的预防作用较大戒烟对心血管疾病的预防作用较大 即即公共卫生公共卫生意义较大意义较大 RRRR与与ARAR的区别的区别心血管疾病心血管疾病肺癌肺癌疾病
16、疾病1.710.7RR126.43170.32296.7545.434.6950.12AR非吸烟者非吸烟者吸烟者吸烟者(1/101/10万人年)万人年)41 归因危险度百分比归因危险度百分比AR%AR%(病因分值(病因分值EFEF) 暴露人群中的发病或死亡归因于暴露的部分占该人暴露人群中的发病或死亡归因于暴露的部分占该人群全部发病或死亡的百分比群全部发病或死亡的百分比 RR 或或 %100%0 eIIIeAR%1001% RRAR42 人群归因危险度人群归因危险度 ( (population attributable risk, PAR) )是人群中某病是人群中某病发病率与非暴露人群该病发病率
17、的差值。发病率与非暴露人群该病发病率的差值。 意义意义一般人群与非暴露人群比较,所增加的疾病发生率一般人群与非暴露人群比较,所增加的疾病发生率的大小的大小PARPAR值值 暴露因素消除后所减少的疾病数量暴露因素消除后所减少的疾病数量 PAR= ItI0 I It t:总人群率:总人群率I Io o:非暴露组率:非暴露组率43 人群归因危险度百分比人群归因危险度百分比 PAR%PAR%是总人群因暴露于某因素所致的某病发病占是总人群因暴露于某因素所致的某病发病占总人群该病全部发病的百分比。总人群该病全部发病的百分比。 意义意义 PARPAR占总人群全部发病(或死亡)的百分比占总人群全部发病(或死亡
18、)的百分比 %100%0ttIIIPAR%100111%RRPRRPPARee或或 P Pe e:总人群的暴露比例:总人群的暴露比例二硫化碳长期低剂量的暴露与冠心病的关系二硫化碳长期低剂量的暴露与冠心病的关系 第二节第二节 实例研究实例研究二硫化碳(二硫化碳(CSCS2 2)神经系统毒物,抑制酶的活性,影响脂蛋白代谢,神经系统毒物,抑制酶的活性,影响脂蛋白代谢,造成心血管疾病造成心血管疾病长期接触低浓度长期接触低浓度CSCS2 2可引起慢性中毒和动脉粥样硬化可引起慢性中毒和动脉粥样硬化短时间接触高浓度的短时间接触高浓度的CSCS2 2蒸气可急性中毒蒸气可急性中毒第二节第二节 研究实例研究实例一
19、、确定研究因素一、确定研究因素 研究因素研究因素 长期低剂量的长期低剂量的CSCS2 2暴露暴露 定定 义义 在有在有CSCS2 2暴露但不至引起急性中毒的车暴露但不至引起急性中毒的车间工作间工作55年年第二节第二节 研究实例研究实例20世纪世纪60年代芬兰职业卫生研究所年代芬兰职业卫生研究所Hernberg和和Tolonen教授做的前瞻性队列研究教授做的前瞻性队列研究二、确定研究结局二、确定研究结局 心肌梗死心肌梗死血压变化血压变化 心电图的改变心电图的改变 心绞痛发作心绞痛发作第二节第二节 研究实例研究实例三、确定研究现场和人群三、确定研究现场和人群 暴露组暴露组 194219421967
20、1967年某粘纤厂年某粘纤厂2525至至6464岁,岁, 343343名男性工人名男性工人有有5 5年以上年以上CSCS2 2暴露史暴露史对照组对照组 年龄年龄3 3岁岁 出生地区相同出生地区相同 工种的体力消耗相当工种的体力消耗相当 在同一城市的造纸厂随机选择的在同一城市的造纸厂随机选择的343343名男性工人名男性工人 四、资料收集四、资料收集 查阅档案记录查阅档案记录 用药情况、既往车间用药情况、既往车间CSCS2 2的浓度等的浓度等询问询问 姓名、性别、年龄、工种及工作年限、吸烟、业姓名、性别、年龄、工种及工作年限、吸烟、业余时间的体力活动情况余时间的体力活动情况实验室检查实验室检查
21、血糖、血脂、血清胆固醇水平、血压、心电图、血糖、血脂、血清胆固醇水平、血压、心电图、心脏大小、体重及车间心脏大小、体重及车间CSCS2 2浓度的动态变化浓度的动态变化 第二节第二节 研究实例研究实例CSCS2 2暴露组发生心肌梗死的暴露组发生心肌梗死的RRRR为为3.573.57,两组致死性心肌梗死发生,两组致死性心肌梗死发生率和总的心肌梗死发生率差异有显著性率和总的心肌梗死发生率差异有显著性五、资料分析五、资料分析表表4-1 4-1 暴露组和对照组的心肌梗死发生率及暴露组和对照组的心肌梗死发生率及RRRR CS CS2 2在不同临床类型冠心病的发生中作用程度不同在不同临床类型冠心病的发生中作
22、用程度不同临床类型临床类型RRAR心肌梗塞心肌梗塞3.575.25致死性心肌梗塞致死性心肌梗塞4.693.21非致死性心肌梗塞非致死性心肌梗塞2.742.04心绞痛心绞痛1.8911.6心电图冠心样改变心电图冠心样改变1.46.1第二节第二节 研究实例研究实例表表4-2 CS4-2 CS2 2与不同临床类型冠心病的与不同临床类型冠心病的RRRR和和ARAR比较比较六、结六、结 论论 研究结果证实了长期低剂量研究结果证实了长期低剂量CS2暴露与冠心病暴露与冠心病的关系;的关系; CS2所致的冠心病,以致死性心肌梗死为主,所致的冠心病,以致死性心肌梗死为主,心绞痛及心电图等也有不同程度的表现;心绞
23、痛及心电图等也有不同程度的表现;措施措施 芬兰当局已于芬兰当局已于19721972年把年把CS2的车间最高容的车间最高容许浓度从许浓度从20ppm降至降至10ppm53 选择偏倚选择偏倚 失访偏倚失访偏倚 信息偏倚信息偏倚 混杂偏倚混杂偏倚偏倚及其控制偏倚及其控制54 产生原因产生原因 选择对象的方法不当选择对象的方法不当 最初选定参加研究的对象中有人拒绝参加最初选定参加研究的对象中有人拒绝参加 历史性队列研究中部分档案丢失或记录不全历史性队列研究中部分档案丢失或记录不全 志愿者队列志愿者队列 研究开始时未能发现早期病人等研究开始时未能发现早期病人等 预防为主,抽样方法正确,严格按规定标准选择
24、对象预防为主,抽样方法正确,严格按规定标准选择对象控控 制制选择偏倚选择偏倚 研究人群在一些重要因素方面与一般人群或待研究的总研究人群在一些重要因素方面与一般人群或待研究的总体人群存在差异,而导致研究结果的偏倚。体人群存在差异,而导致研究结果的偏倚。55控控 制制设计设计 : 选择便于随访的人群选择便于随访的人群 在计算的研究样本的基础上在计算的研究样本的基础上扩大扩大10%10% 实施:实施: 加强对随访员的管理加强对随访员的管理 制定随访计划和监测措施制定随访计划和监测措施 中期分析中期分析 整理资料整理资料 : 对于有缺项或漏项的对象进行补查对于有缺项或漏项的对象进行补查 研究对象研究对
25、象迁移迁移、外出外出、死于非终点疾病死于非终点疾病或或拒绝继拒绝继续参加观察续参加观察而而退出退出队列队列失访偏倚失访偏倚56疾病、暴露标准不明确疾病、暴露标准不明确检验仪器不精确、检验技术不熟检验仪器不精确、检验技术不熟询问技巧不佳记录错误,造假等询问技巧不佳记录错误,造假等产生原因产生原因 控控 制制提高临床诊断技术、明确各项标准提高临床诊断技术、明确各项标准选择精确稳定的测量方法选择精确稳定的测量方法事前调准仪器事前调准仪器严格实验操作规程严格实验操作规程同等对待每个研究对象同等对待每个研究对象培训调查员,提高技巧,统一标准培训调查员,提高技巧,统一标准信息偏倚信息偏倚57控控 制制设计
26、阶段设计阶段 限制研究对象,匹配限制研究对象,匹配分析阶段分析阶段 分层分析、标准化或多因素分析分层分析、标准化或多因素分析混杂偏倚混杂偏倚 与所研究因素和结果均有联系的与所研究因素和结果均有联系的第三因素第三因素在暴露在暴露组与对照组的分布不均衡,混淆了研究因素和结果间组与对照组的分布不均衡,混淆了研究因素和结果间的真实联系的真实联系58队列研究的优点队列研究的优点 直接获得暴露组和非暴露组的直接获得暴露组和非暴露组的发病率发病率或死亡率或死亡率 直接估计危险度直接估计危险度 符合时间顺序,符合时间顺序,验证病因的能力较强验证病因的能力较强 获得获得一种暴露与多种结局一种暴露与多种结局的关系
27、的关系 收集的资料完整可靠,收集的资料完整可靠,不存在回忆偏倚不存在回忆偏倚 可研究疾病的自然史可研究疾病的自然史59队列研究的局限性队列研究的局限性 不适于不适于发病率很低发病率很低的疾病的病因研究的疾病的病因研究 易发生易发生失访偏倚失访偏倚 耗时,耗人力、物力、财力耗时,耗人力、物力、财力 设计要求设计要求严密,资料的收集和分析难度较大严密,资料的收集和分析难度较大 随访过程中,已知变量的变化或未知变量的引入增随访过程中,已知变量的变化或未知变量的引入增加分析难度加分析难度60二、病例对照研究二、病例对照研究n概念概念n用途用途n种类种类n研究对象的选择研究对象的选择n样本含量估计样本含
28、量估计n资料的收集资料的收集n资料分析和结果解释资料分析和结果解释61病例对照研究(病例对照研究(case-control study) 也称也称回顾性研究回顾性研究(retrospective study),),选择患有和未患有某特定疾病的人群分别作选择患有和未患有某特定疾病的人群分别作为为病例病例组和组和对照对照组,调查两组人群过去组,调查两组人群过去暴露暴露于某种或某些可疑危险因素的比例,判断该于某种或某些可疑危险因素的比例,判断该暴露因素是否与该疾病有关联及其关联程度暴露因素是否与该疾病有关联及其关联程度大小的一种观察性研究方法。大小的一种观察性研究方法。(一)概(一)概 念念62以确
29、诊患某种特定疾病的病人作为以确诊患某种特定疾病的病人作为病例病例以不患该病但具有可比性的个体作为以不患该病但具有可比性的个体作为对照对照通过询问、实验室检查或复查病史,搜集既往危险通过询问、实验室检查或复查病史,搜集既往危险因素因素暴露史暴露史测量并比较两组各因素的测量并比较两组各因素的暴露比例暴露比例,经统计学检验,经统计学检验该因素与疾病之间是否存在该因素与疾病之间是否存在统计学联系统计学联系,以及,以及关联关联强度强度大小大小基本原理基本原理63病例对照研究示意图病例对照研究示意图暴露暴露非暴露非暴露暴露暴露非暴露非暴露病例病例对照对照比较比较时间时间收集资料的方向收集资料的方向研究起点
30、研究起点64病例对照研究特点病例对照研究特点 观察观察法(无干预)法(无干预) 由果至因由果至因研究研究 按按有无疾病有无疾病分组(一病与多因)分组(一病与多因)65(二)用途(二)用途初步初步检验检验病因假设病因假设提出病因线索提出病因线索评价防治策略和措施的效果评价防治策略和措施的效果66(三)病例对照研究的种类(三)病例对照研究的种类 非匹配非匹配 匹配匹配67病例与对照不匹配病例与对照不匹配 从设计所规定病例和对照人群中,分别抽从设计所规定病例和对照人群中,分别抽 取一定量的研究对象取一定量的研究对象 对照组人数对照组人数病例组人数病例组人数 选择对照没有特殊规定选择对照没有特殊规定6
31、8病例与对照匹配病例与对照匹配 匹匹 配配/ /配配 比比( (matching) )要求要求 对照在对照在某些因素或特征某些因素或特征上与病例保持一致上与病例保持一致目的目的 对两组进行比较时排除匹配因素的干扰对两组进行比较时排除匹配因素的干扰 分分 类类 频数匹配(频数匹配(frequency matching) 个体匹配(个体匹配(individual matching)69 匹配法注意事项匹配法注意事项 慎重选择匹配因素慎重选择匹配因素 可疑病因可疑病因不作为匹配因素不作为匹配因素 比例一般为比例一般为1:11:1,最多不超过,最多不超过1:4 1:4 避免避免 “匹配过度匹配过度(o
32、ver-matching)”匹配过度:将不必要的项目列入匹配,企图使病例与对照尽匹配过度:将不必要的项目列入匹配,企图使病例与对照尽量一致,就可能徒然丢失信息,增加工作难度,反而降低了量一致,就可能徒然丢失信息,增加工作难度,反而降低了研究效率,这种情况称为匹配过度。研究效率,这种情况称为匹配过度。 匹配的目的匹配的目的 提高研究效率提高研究效率 控制混杂因素的作用控制混杂因素的作用 70(四)研究对象的选择(四)研究对象的选择n病例的选择病例的选择n对照的选择对照的选择71选择病例时应考虑的问题选择病例时应考虑的问题疾病诊断标准(疾病诊断标准(公认的指标公认的指标)病例确诊时间(病例确诊时间
33、(首选新发病例首选新发病例)病例的代表性病例的代表性: 病情、疾病分型等方面代表总体,病情、疾病分型等方面代表总体,而且在人口学特征(年龄、性别、种族等)、所处的而且在人口学特征(年龄、性别、种族等)、所处的社会环境、生活环境与疾病发生有关的诸多方面也能社会环境、生活环境与疾病发生有关的诸多方面也能代表其总体代表其总体对病例某些特征的限制对病例某些特征的限制72病例的来源病例的来源来源于来源于医院医院的病例(的病例(hospital-based)优点:易收集、配合好、信息质量高优点:易收集、配合好、信息质量高缺点:外延性推论时受到限制,易发生选择偏倚缺点:外延性推论时受到限制,易发生选择偏倚来
34、源于来源于社区社区的病例(的病例(community-based)优点:外延性好优点:外延性好缺点:病例较难获得缺点:病例较难获得73选择对照时应考虑的问题选择对照时应考虑的问题确认对照的确认对照的标准标准对照的对照的代表性代表性对照与病例的对照与病例的可比性可比性对照不应患有与所研究因素有关的其他疾病对照不应患有与所研究因素有关的其他疾病可同时选择两种以上对照可同时选择两种以上对照74对照的来源对照的来源同一或多个医疗机构中诊断的其他疾病病例同一或多个医疗机构中诊断的其他疾病病例社区人口中未患该病的人社区人口中未患该病的人病例的邻居中未患该病的人病例的邻居中未患该病的人病例的配偶、同胞、亲戚
35、病例的配偶、同胞、亲戚病例的同事病例的同事75(五)样本含量的估计(五)样本含量的估计非匹配或频数匹配病例对照研究分类变量资料样非匹配或频数匹配病例对照研究分类变量资料样本含量的估计本含量的估计 公式还可简化为公式还可简化为20120011)p(pqpqpuqp2uN2201)p(p)u(uqp2N病例组暴露率病例组暴露率对照组暴露率对照组暴露率已知已知p0和和OR值时,可计算值时,可计算p1,公式为,公式为1)(ORp1pORp001761:11:1匹配设计匹配设计)qpqm/(pMMRR)RR/(1OR)OR/(1p)(pp)p(1/2um011022为:需要的总对子数其中,一致的对子数为
36、病例与对照暴露情况不5 . 0u77 资料来源资料来源 医院病案记录医院病案记录疾病登记报告等摘录疾病登记报告等摘录致病因素数据需检测病人的标本或环境获得致病因素数据需检测病人的标本或环境获得询问调查获得询问调查获得(六)资料的收集(六)资料的收集78X资料核查、整理(查漏补缺、纠错、编码、资料核查、整理(查漏补缺、纠错、编码、入库)入库)X统计描述统计描述X统计推断统计推断(七)资料整理、分析和结果解释(七)资料整理、分析和结果解释79统计描述统计描述n研究对象一般特征描述研究对象一般特征描述表明研究所选择对象代表了哪种特征的有限总体表明研究所选择对象代表了哪种特征的有限总体n比较组间均衡性
37、检验比较组间均衡性检验检验病例和对照之间除研究因素外的与疾病发生有检验病例和对照之间除研究因素外的与疾病发生有关的各种特征是否均衡可比关的各种特征是否均衡可比80统计推断统计推断n成组病例对照研究资料的分析成组病例对照研究资料的分析n1:1匹配病例对照研究资料的分析匹配病例对照研究资料的分析81d)c)(bd)(ab)(c(anbc)(ad221.1.列出资料整理表列出资料整理表2.2.假设检验(假设检验(2检验检验) 若差异有统计学意义,则说明暴露因素与疾病若差异有统计学意义,则说明暴露因素与疾病的关联很可能不是由抽样误差造成的。的关联很可能不是由抽样误差造成的。成组比较法资料的分析成组比较
38、法资料的分析 (非匹配与频数匹配资料非匹配与频数匹配资料)823.3.估计暴露与疾病的关联强度估计暴露与疾病的关联强度 比值比比值比(odds ratio,OR),也叫优势比、交),也叫优势比、交叉乘积比;叉乘积比;比值比值(odds)是指某事物发生的可能性)是指某事物发生的可能性与不发生的可能性之比。与不发生的可能性之比。bcbcadadb/db/da/ca/c对照组的暴露比值对照组的暴露比值病例组的暴露比值病例组的暴露比值ORORb/db/dd) d)d/(bd/(bd) d)b/(bb/(b对照组的暴露比值对照组的暴露比值a/ca/cc) c)c/(ac/(ac) c)a/(aa/(a病
39、例组的暴露比值病例组的暴露比值83 与相对危险度与相对危险度一样,优势比反映暴露者患一样,优势比反映暴露者患某种疾病的危险性较无暴露者高的程度。一定条某种疾病的危险性较无暴露者高的程度。一定条件下件下ORORRR。前提条件前提条件所研究疾病的发病率(死亡率)很低所研究疾病的发病率(死亡率)很低病例对照研究中所选择的研究对象代表性好病例对照研究中所选择的研究对象代表性好OROR值的意义值的意义844.4.OROR值可信区间估计值可信区间估计Miettinen法估计法估计OR值的值的95%可信区间计算公式:可信区间计算公式:Woolf法估计法估计OR值的值的95%可信区间计算公式:可信区间计算公式
40、:)/u(1UL2aOROR,ORVar(lnOR)1.96lnORlnOR95%CI其中其中OR自然对数方差为:自然对数方差为:1/d1/c1/b1/aVar(lnOR)85bcadOR87. 2126208243309OR)78.3,18.2(2/96.11)(OR 结果表明结果表明吸烟者患食管癌的危险性是不吸烟者的吸烟者患食管癌的危险性是不吸烟者的2.872.87倍,倍,95%95%的可信范围是在的可信范围是在2.182.183.783.78之间之间例例:一项食管癌与吸烟的病例对照研究资料整理见下表:一项食管癌与吸烟的病例对照研究资料整理见下表861:11:1配对资料的分析配对资料的分析
41、 匹配资料是由病例与对照结合成匹配资料是由病例与对照结合成对子对子,分析结,分析结果时不应把对子拆开分析果时不应把对子拆开分析 分析步骤与成组资料相同,只是计算公式不同分析步骤与成组资料相同,只是计算公式不同 87cb)(b22ccb)c-b(2211.1.列出四格表列出四格表2.2.假设检验(假设检验(2检验检验)b+c40时,使用校正公式时,使用校正公式883.3.计算计算OROR值值bcOR 4.4.计算计算OROR值的值的95%95%可信区间可信区间 计算方法同分组资料计算方法同分组资料89 例例:食管癌发病因素的:食管癌发病因素的1 1:1 1配对病例对照研究中发现,配对病例对照研究
42、中发现,吸烟与发病有关,资料归纳见下表吸烟与发病有关,资料归纳见下表2 2=11.28, OR=4.33=11.28, OR=4.33表明男性吸烟者患食管癌的危险性是不吸烟者的表明男性吸烟者患食管癌的危险性是不吸烟者的4.34.3倍倍 OR95%OR95%可信限可信限1 1. .8 84 4, ,1 10 0. .1 18 84 4. .3 33 3O OR R1 11 1. .2 28 81 1. .9 96 61 1 z z1 12 2研究背景研究背景美国波士顿美国波士顿Vincent纪念医院妇产科医生纪念医院妇产科医生Herbst发现发现 19661969年收治年收治7例阴道腺癌患者例阴
43、道腺癌患者, 年龄年龄1522岁岁过去年龄均大于过去年龄均大于25岁岁7例在例在1522岁之间岁之间7例全是腺癌例全是腺癌阴道癌占女性生殖系统癌的阴道癌占女性生殖系统癌的2%阴道腺癌仅占阴道癌的阴道腺癌仅占阴道癌的5%10%,非常罕见,非常罕见 Herbst对阴道腺癌危险因素进行探索对阴道腺癌危险因素进行探索 7例患者加上另一个医院例患者作为病例组例患者加上另一个医院例患者作为病例组 每个病人配每个病人配4个对照,共个对照,共32个对照个对照 调查员用调查表对病例、对照与她们的母亲进行调查员用调查表对病例、对照与她们的母亲进行了调查,经统计学处理后的主要结果见表了调查,经统计学处理后的主要结果
44、见表5-2研究方法研究方法研究结果研究结果93常见的偏倚及其控制常见的偏倚及其控制选择偏倚选择偏倚(selection bias)产生原因产生原因 选择的研究对象不能代表总体人群选择的研究对象不能代表总体人群最常见偏倚最常见偏倚 伯克森偏倚伯克森偏倚(Berksons bias) ) 选择医院的病人作为病例与对照,这些病人可以选择医院的病人作为病例与对照,这些病人可以因为种种原因造成入院率的差异因为种种原因造成入院率的差异 例如例如高血压、肿瘤、阑尾炎病人的入院率显然各不相高血压、肿瘤、阑尾炎病人的入院率显然各不相同入院率的不同就可造成偏倚。同入院率的不同就可造成偏倚。94选择偏倚的选择偏倚的
45、控制控制尽量合理地选择病例与对照尽量合理地选择病例与对照尽可能地从多家尽可能地从多家( (类类) )医院选择病例与对照医院选择病例与对照95信息偏倚信息偏倚(information bias) 回忆偏倚回忆偏倚 病例对照研究的主要弱点,很难完全避免病例对照研究的主要弱点,很难完全避免96混杂偏倚混杂偏倚(confounding bias) 病例对照研究遇到很多混杂因素病例对照研究遇到很多混杂因素 不易识别不易识别 不易确定不易确定 控制控制混杂因素作为匹配因素混杂因素作为匹配因素分层分析分层分析进行多因素分析进行多因素分析( (限制)限制)97 病例对照研究的病例对照研究的优点优点特别适用于少
46、见病、罕见病的研究特别适用于少见病、罕见病的研究省力、省钱、省时间,并易于组织实施省力、省钱、省时间,并易于组织实施还可用于疫苗免疫学效果考核及暴发调查等还可用于疫苗免疫学效果考核及暴发调查等可同时研究多个因素与某种疾病的联系可同时研究多个因素与某种疾病的联系对研究对象多无损害对研究对象多无损害病例对照研究的优缺点病例对照研究的优缺点98 病例对照研究的病例对照研究的局限性局限性不适于研究暴露比例很低的因素不适于研究暴露比例很低的因素选择偏倚难以避免选择偏倚难以避免暴露与疾病时间先后难以判断,信息真实性差暴露与疾病时间先后难以判断,信息真实性差存在回忆偏倚存在回忆偏倚易发生混杂偏倚易发生混杂偏倚不能计算发病率、死亡率等,因而不能直接分析相对不能计算发病率、死亡率等,因而不能直接分析相对危险度危险度