1、队列研究THE COHORT STUDY付朝伟复旦大学公共卫生学院教学目的 掌握队列研究的定义、特点、用途、类掌握队列研究的定义、特点、用途、类型及优缺点以及相关指标的计算和意义型及优缺点以及相关指标的计算和意义 熟悉队列研究的设计要点和实施方法以熟悉队列研究的设计要点和实施方法以及影响样本量的主要因素及影响样本量的主要因素 了解人时和标化率的计算了解人时和标化率的计算概 念将一个范围明确的将一个范围明确的人群人群按是否按是否暴露暴露于某可疑因素及于某可疑因素及其暴露程度分为不同的亚组,其暴露程度分为不同的亚组,追踪追踪其各自的结局,其各自的结局,比较不同亚组之间结局的差异,从而判定暴露因子比
2、较不同亚组之间结局的差异,从而判定暴露因子与结局之间有无因果关联及关联大小的一种与结局之间有无因果关联及关联大小的一种观察性观察性研究方法。研究方法。又称前瞻性研究、发病率研究、纵向研究、随访研又称前瞻性研究、发病率研究、纵向研究、随访研究、定群研究。究、定群研究。34特定人群特定人群范围内的范围内的研究对象研究对象出现某种结局出现某种结局(疾病疾病)不出现某种结局不出现某种结局出现某种结局(疾病)出现某种结局(疾病)不出现某种结局不出现某种结局研究开始研究开始前瞻性收集结局事件前瞻性收集结局事件队列研究的结构模式图队列研究的结构模式图暴露暴露非暴露非暴露特定人群特定人群-危险人群危险人群暴露
3、暴露-危险因素危险因素/保护因素保护因素前瞻性前瞻性-随访随访队列研究从研究因素着手,追踪发病或死亡,从“因”到“果”。主要用于主要用于检验病因检验病因假设假设,也可以也可以了解疾病自然了解疾病自然史、评价防控效果等史、评价防控效果等5特点分 类根据研究开始时病例是否发根据研究开始时病例是否发病病,主要分为主要分为:前瞻性队列研究前瞻性队列研究历史性队列研究历史性队列研究6前瞻性队列研究 研究开始时研究开始时,暴露因素已存在暴露因素已存在,但疾病尚但疾病尚未发生未发生 在随访过程中,可获取暴露因素变动情况在随访过程中,可获取暴露因素变动情况 属于规模巨大的研究属于规模巨大的研究7历史性队列研究
4、 研究开始时研究开始时,暴露与疾病均已发生暴露与疾病均已发生 先先追溯历史资料,研究暴露和非暴露组,追溯历史资料,研究暴露和非暴露组,然后通过各种途径查出研究对象的发病和然后通过各种途径查出研究对象的发病和死亡情况死亡情况 历史资料的完整性和真实性将影响到研究历史资料的完整性和真实性将影响到研究的可行性和结果可靠性的可行性和结果可靠性 缺乏混杂因素的资料,可能歪曲研究结果缺乏混杂因素的资料,可能歪曲研究结果8巢式病例对照研究 首先进行队列研究,收集每个队列成员首先进行队列研究,收集每个队列成员的暴露信息以及有关的混杂资料,确诊的暴露信息以及有关的混杂资料,确诊随访期间内发生的每一个病例,然后以
5、随访期间内发生的每一个病例,然后以队列中的病例为病例组,对照来自同一队列中的病例为病例组,对照来自同一个队列,进行病例对照研究。个队列,进行病例对照研究。兼顾队列与病例对照研究的特点兼顾队列与病例对照研究的特点910暴露组非暴露组暴露组非暴露组追溯收集已有的历史资料追溯收集已有的历史资料暴露组非暴露组随访收集资料历史性队列研究继续随访收集资料双向性队列研究前瞻性队列研究过去某时点现在将来某时点图7-2 队列研究类型示意图(前瞻性)(历史性)研究开始研究类型研究类型队列研究典型实例队列研究典型实例-吸烟与肺癌Doll Doll 和和 HillHill于于19511951开展的开展的 对象:在英国
6、登记的所有开业医生对象:在英国登记的所有开业医生 调查:信访调查:信访 方式:调查表方式:调查表 是否吸烟,吸烟量;是否吸烟,吸烟量;过去是否曾吸烟,现戒烟;过去是否曾吸烟,现戒烟;从未吸烟从未吸烟 结果:总死亡率结果:总死亡率0.65(0.65(不吸不吸0.07,0.07,吸烟吸烟 0.71)0.71)11队列研究的基本步骤 设计前的准备设计前的准备 制定研究计划制定研究计划 研究暴露因素的决定、分级及其标准的规定研究暴露因素的决定、分级及其标准的规定 研究对象的选择、分组方法研究对象的选择、分组方法 检验两组对象在主要指标方面的均衡性检验两组对象在主要指标方面的均衡性 追踪观察追踪观察 核
7、对资料、整理统计与分析核对资料、整理统计与分析12暴露的关键问题 暴露组的选择暴露组的选择 暴露因素的规定暴露因素的规定 暴露水平的分级暴露水平的分级 暴露因素的收集暴露因素的收集13暴露组的选择选择暴露组应考虑的问题 已经处于暴露因素中、能提供可靠的暴露已经处于暴露因素中、能提供可靠的暴露史、职业暴露史、职业暴露几种常见暴露组的人群社区人群社区人群职业人群职业人群医疗保险人群医疗保险人群其他特殊人群其他特殊人群14暴露因素的规定 必须有一个明确的规定必须有一个明确的规定 最好用定量或分级指标最好用定量或分级指标 能测定暴露剂量则更好能测定暴露剂量则更好15暴露水平的分级 可用定量资料分级,但
8、由于不易获得准可用定量资料分级,但由于不易获得准确的定量资料,故常用暴露水平分级。确的定量资料,故常用暴露水平分级。如分为:严重暴露、中度暴露、轻度暴如分为:严重暴露、中度暴露、轻度暴露、不暴露露、不暴露16暴露评价的可能问题 在对对象进行暴露程度分组时,还必须在对对象进行暴露程度分组时,还必须考虑其暴露的累积过程和不同暴露因素考虑其暴露的累积过程和不同暴露因素对疾病作用的诱导期等。对疾病作用的诱导期等。暴露强度具有点暴露特征,反映的是对暴露强度具有点暴露特征,反映的是对象某一时点的暴露水平,而在整个暴露象某一时点的暴露水平,而在整个暴露时期,暴露强度可以不断变化。时期,暴露强度可以不断变化。
9、17暴露资料的收集 有关记录有关记录 调查对象调查对象 医学检查医学检查 环境监测环境监测18非暴露组的选择 除未暴露于所研究的因素外,其它各种除未暴露于所研究的因素外,其它各种因素的影响或人群特征(年龄、性别、民因素的影响或人群特征(年龄、性别、民族、职业、文化程度等)应尽可能相同族、职业、文化程度等)应尽可能相同19非暴露组种类 内对照内对照 外对照外对照 与人群发病率或死亡率比较与人群发病率或死亡率比较20队列研究的样本含量有关计算样本量的几个问题 抽样方法抽样方法 暴露组与非暴露组的比例暴露组与非暴露组的比例 失访率失访率21样本大小的主要影响因素1.一类错误概率一类错误概率2.二二类
10、错误概率类错误概率3.一般人群(对照人群)中所研究疾病的发病率一般人群(对照人群)中所研究疾病的发病率p04.暴露的效应暴露的效应-发病率发病率之之差差2220120011)()2(ppqpqpZpqZN追踪观察 从常规登记中收集结果从常规登记中收集结果 定期对研究对象作健康检查定期对研究对象作健康检查23队列研究的资料分析队列研究的资料分析 率率 显著性检验显著性检验 联系强度等联系强度等24率的计算累积发病率累积发病率(cumulative incidencecumulative incidence,CIR)CIR)人群数量较多、人口比较稳定、资料比较整齐人群数量较多、人口比较稳定、资料比
11、较整齐 队列研究累积发病率资料整理表队列研究累积发病率资料整理表-暴露史暴露史 病例病例 非病例非病例 合合 计计 发病率发病率-有有 a b Na b N1 1=a+b a/N=a+b a/N1 1 无无 c d Nc d N0 0=c+d c/N=c+d c/N0 0 -合计合计 M M1 1=a+c M=a+c M0 0=b+d T M=b+d T M1 1/T/T -25发病密度(IDR)队列研究发病密度资料整理表队列研究发病密度资料整理表 -暴露史暴露史 病例病例 人时数人时数 发病率发病率 -有有 a Na N1 1 a/N a/N1 1 无无 c Nc N0 0 c/N c/N0
12、 0 -合计合计 M M1 1 T M T M1 1/T/T -26人时的计算计算原则为:从观察对象中剔除死亡,迁移及失去联系的人数从观察对象中剔除死亡,迁移及失去联系的人数,补充新加入补充新加入的人数折算人年。的人数折算人年。常用方法:精确法、寿命表法、简化的近似法精确法、寿命表法、简化的近似法 大样本人年的计算大样本人年的计算 以个人为单位计算暴露人年以个人为单位计算暴露人年 应用寿命表法来计算暴露人年应用寿命表法来计算暴露人年27联系强度的测量联系强度的测量相对危险度相对危险度(relative riskrelative risk,RR)RR)反映暴露与发病反映暴露与发病(或死亡或死亡)
13、的关联强度的的关联强度的 指标,是暴露组发病指标,是暴露组发病(死亡死亡)率与非暴露率与非暴露 组的发病组的发病(或死亡或死亡)率的比值。率的比值。Ie a/NIe a/N1 1 RR=-=-RR=-=-I I0 0 c/N c/N0 0 2829)(96.1)(%951111)(01LnCIRSELnCIRLnCIRCINbNaLnCIRSE)(96.1)(%9511)(LnIDRSELnIDRLnIDRCIbaLnIDRSE归因危险度归因危险度 ATTRIBUTABLE RISKATTRIBUTABLE RISK,ARAR完全由某因素所致的危险度。用暴露组的完全由某因素所致的危险度。用暴露
14、组的发病率发病率(或死亡率或死亡率)减去非暴露组的发病率减去非暴露组的发病率(或死亡率或死亡率)的余数表示之的余数表示之 AR=Ie-IAR=Ie-I0 0 =a/N=a/N1 1-c/N-c/N0 0 =I =I0 0RR-IRR-I0 0 =I=I0 0(RR-1)(RR-1)30RR与AR RRRR针对个体而言,具有病因学意义针对个体而言,具有病因学意义 ARAR针对群体而言,具有公共卫生学意义针对群体而言,具有公共卫生学意义31归因危险度百分比归因危险度百分比-AR%Ie-I Ie-I0 0 RR-1 RR-1AR%=-AR%=-100%=-100%=-100%100%Ie RR Ie
15、 RR32人群归因危险度人群归因危险度(POPULATION ATTRIBUTABLE POPULATION ATTRIBUTABLE RISKRISK,PARPAR)及人群归因危险度百分比及人群归因危险度百分比(PAR%PAR%)PAR=IPAR=It t-I-I0 0 I It t-I-I0 0 Pe(RR-1)Pe(RR-1)PAR%=-PAR%=-100%=-100%=-100%100%I It t Pe(RR-1)+1 Pe(RR-1)+133研究实例吸烟与肺癌死亡的前瞻性队列研究吸烟与肺癌死亡的前瞻性队列研究死亡率:不吸死亡率:不吸0.07,0.07,吸烟吸烟0.710.71,合计
16、,合计0.650.65 RR=10.1RR=10.1 AR=0.64 AR=0.64 AR%=90.1%AR%=90.1%PAR=0.48 PAR=0.48 PAR%=73.8%PAR%=73.8%34 剂量反应关系分析剂量反应关系分析 分层分析分层分析35标准化死亡率标准化死亡率比比(STANDARDIZED MORTALITY RATIO,SMR)暴露人群人数较少暴露人群人数较少,无法获得发病率或死亡无法获得发病率或死亡率资料率资料标准化死亡率比标准化死亡率比 研究人群中观察死亡数与以标准人口死亡率研究人群中观察死亡数与以标准人口死亡率计算的预期死亡数之比。计算的预期死亡数之比。aiai
17、SMR=-SMR=-100100 E(ai)E(ai)36标准化死亡率比(标准化死亡率比(SMRSMR)计算举例)计算举例37项目项目年龄年龄年份年份合计合计1950-541955-591960-64人年人年20-241,00050020025-291,0001,5001,00030-345005001,500观察死亡数观察死亡数20-242101525-2934230-34012人群死亡率人群死亡率(1/1000)20-241.81.81.625-291.71.51.530-341.91.81.7预期死亡数预期死亡数20-241.80.90.312.925-291.72.31.530-340
18、.90.92.6标准化死亡比例比标准化死亡比例比(STANDARDIZED MORTALITY PROPORTION RATIO,SPMR)SPMRSPMR 预期死亡值的计算是根据全人群某疾病死亡数与全预期死亡值的计算是根据全人群某疾病死亡数与全死因死亡数之比来计算,而不是用死亡率。死因死亡数之比来计算,而不是用死亡率。aiai SPMR=-SPMR=-100100 E(ai)E(ai)38标准化死亡比例比计算表标准化死亡比例比计算表39年龄组年龄组结核病死亡占全死结核病死亡占全死因的比例因的比例(1)工人死亡工人死亡人数人数(2)工人结核病预工人结核病预期死亡数期死亡数(3)工人结核病观工人
19、结核病观察死亡数察死亡数(4)20-6.2829218.341025-8.3035729.632030-9.0134130.722235-7.78109585.199845-5.19178492.5917455-3.68155457.1911260-642.77205156.81104合计合计370.47540队列研究中的偏倚与混杂队列研究中的偏倚与混杂 选择性偏倚选择性偏倚 失访偏倚(lost to follow-up)信息偏倚信息偏倚-错分偏倚(错分偏倚(misclassification bias)混杂偏倚混杂偏倚40偏倚的控制严格按规定选择研究对象严格按规定选择研究对象提高研究对象的依
20、从性提高研究对象的依从性提高设计水平,做好质量控制提高设计水平,做好质量控制分层分析和多因素分析分层分析和多因素分析41队列研究的优点队列研究的优点 可直接获得两个组的发病率或死亡率,并可可直接获得两个组的发病率或死亡率,并可直接获得直接获得RRRR 可减少收集资料过程中由主观因素带入的偏可减少收集资料过程中由主观因素带入的偏性性 在追踪观察中可以及时了解和记录对象某些在追踪观察中可以及时了解和记录对象某些特征或暴露情况的改变特征或暴露情况的改变 可以获得多种疾病的结局资料可以获得多种疾病的结局资料42队列研究的局限性队列研究的局限性 实施一次队列研究比较困难,且耗费较多实施一次队列研究比较困
21、难,且耗费较多的人力、资金和时间的人力、资金和时间 通过定期医学检查获得结局资料时,观察通过定期医学检查获得结局资料时,观察对象容易了解到研究目的而改变他们的行对象容易了解到研究目的而改变他们的行为,给资料分析带来了困难为,给资料分析带来了困难 不适用于发病率很低疾病的研究不适用于发病率很低疾病的研究43历史性队列研究历史性队列研究 所需时间短所需时间短 仅依靠一些记录资料、检查数据或个人仅依靠一些记录资料、检查数据或个人提供的资料提供的资料 需收集过去的暴露史需收集过去的暴露史 研究开始时疾病已发生或死亡研究开始时疾病已发生或死亡44三种流行病学方法的比较三种流行病学方法的比较45优点优点局
22、限性局限性率比,率差,率比,率差,PAROR,PAR(在一定在一定条件下条件下)相对危险度,归因危相对危险度,归因危险度,险度,PAR暴露与疾病联系指标暴露与疾病联系指标现患率、暴露率现患率、暴露率暴露百分率暴露百分率发病发病(死亡死亡)率率率率暴露者的患病情况或患暴露者的患病情况或患病者的暴露情况病者的暴露情况病例与对照过去的病例与对照过去的暴露情况暴露情况暴露者与未暴露组发暴露者与未暴露组发病或死亡情况病或死亡情况比较内容比较内容现况现况回顾性回顾性(果果-因因)前瞻性前瞻性(因因-果果)时间顺序时间顺序前两者之一前两者之一患病未患病患病未患病暴露未暴露暴露未暴露分组标准分组标准暴露者、现患者或存活暴露者、现患者或存活者者病例与对照病例与对照无病个体无病个体样本组成样本组成现况研究现况研究病例对照研究病例对照研究前瞻性队列研究前瞻性队列研究方法学特点方法学特点谢谢!46