1、队列研究分析性流行病学方法分析性流行病学方法基本概念基本概念队列研究又称定群研究、前瞻性研究、队列研究又称定群研究、前瞻性研究、随访研究或者纵向研究。根据以往有无随访研究或者纵向研究。根据以往有无暴露经历,研究者将人群分为暴露人群暴露经历,研究者将人群分为暴露人群和非暴露人群,在一定时期内,随访观和非暴露人群,在一定时期内,随访观察和比较两组人群的发病率和死亡率。察和比较两组人群的发病率和死亡率。定群研究是定群研究是“由因及果由因及果”的研究,的研究,它所验证的暴露因素在研究开始它所验证的暴露因素在研究开始前就已经存在了,研究者知道每前就已经存在了,研究者知道每个暴露对象的分组情况,这与病个暴
2、露对象的分组情况,这与病例对照研究不同。例对照研究不同。定群研究的目的是某特定暴露因定群研究的目的是某特定暴露因素对单一疾病发病率或死亡率的素对单一疾病发病率或死亡率的影响,但它同时可观察到暴露因影响,但它同时可观察到暴露因素对整个人体健康系统的影响。素对整个人体健康系统的影响。特点特点属于观察法;属于观察法;设立对照组;设立对照组;观察方向由因及果;观察方向由因及果;能验证暴露与疾病的因果关系。能验证暴露与疾病的因果关系。用用 途途检验病因假设;检验病因假设;评价自发的预防效果;评价自发的预防效果;描述疾病的自然史。描述疾病的自然史。种类种类前瞻性队列研究;前瞻性队列研究;历史历史性队列研究
3、;性队列研究;双向性队列研究。双向性队列研究。前瞻性队列研究属于规模巨大的研究,经过多年的随访,属于规模巨大的研究,经过多年的随访,有时只能观察到少数病例。为获得稳定有时只能观察到少数病例。为获得稳定的发病率,就需观察大量人群或延长随的发病率,就需观察大量人群或延长随访时期,这样需投入大量的经费。研究访时期,这样需投入大量的经费。研究的可行性除了与花费有关外,还与疾病的可行性除了与花费有关外,还与疾病的诱导期长短有关。诱导期越长,随访的诱导期长短有关。诱导期越长,随访时间越长,可行性越差。时间越长,可行性越差。回顾性队列研究又称历史性定群研究,其主要特点是在又称历史性定群研究,其主要特点是在研
4、究开始时,暴露和疾病均已发生。研研究开始时,暴露和疾病均已发生。研究者先追溯有关历史资料确定暴露组和究者先追溯有关历史资料确定暴露组和对照组,然后通过各种途径查出这些对对照组,然后通过各种途径查出这些对象的发病和死亡情况。回顾性的定群研象的发病和死亡情况。回顾性的定群研究依赖于历史记录,所以历史资料的完究依赖于历史记录,所以历史资料的完整性和真实性将影响研究结果的可靠性。整性和真实性将影响研究结果的可靠性。双向性队列研究指历史性队列研究之后,继续进行指历史性队列研究之后,继续进行前瞻性队列研究。这种研究具有以前瞻性队列研究。这种研究具有以上两种研究的特点。上两种研究的特点。实例 上世纪上世纪6
5、0年代末,有人注意到年代末,有人注意到CS2职业暴职业暴露能引起心血管病的死亡率升高,为此,露能引起心血管病的死亡率升高,为此,Tolonen设计了一个前瞻性研究。在一个粘设计了一个前瞻性研究。在一个粘胶纤维厂选择了胶纤维厂选择了1942-1967年有年有5年年CS2暴露暴露史的史的343名工人作为暴露组。同时,以年龄、名工人作为暴露组。同时,以年龄、出生地、工种作配比因素,在造纸厂选择出生地、工种作配比因素,在造纸厂选择343名工人作为非暴露组。以心肌梗塞作为名工人作为非暴露组。以心肌梗塞作为指标,研究指标,研究1967-1972年期间两个组的死亡年期间两个组的死亡与存活的心肌梗塞,计算发病
6、率。与存活的心肌梗塞,计算发病率。结果发生数五年发病率 RRRR95%CI暴露组25 7.3 3.651.4-9.6非暴露组7 2.0队列研究的指征要要有明确的研究目的和检验假设;有明确的研究目的和检验假设;所研究疾病的发病率和死亡率一般不应低于所研究疾病的发病率和死亡率一般不应低于5;要有把握获得观察人群的暴露资料;要有把握获得观察人群的暴露资料;要有确定发病或死亡等结局的简便而可靠的手段;要有确定发病或死亡等结局的简便而可靠的手段;应能获得足够数量的观察人群,且该人群能被长应能获得足够数量的观察人群,且该人群能被长期随访;期随访;要有足够的人力、物力和财力。要有足够的人力、物力和财力。定群
7、研究的实施定群研究的实施确定确定研究目的研究目的确定研究人群确定研究人群 研究人群的类型;研究人群的类型;暴露人群的选择;暴露人群的选择;非暴露人群的选择;非暴露人群的选择;确定研究因素确定研究因素暴露资料的收集暴露资料的收集确定研究结局确定研究结局如何进行随访如何进行随访随访期的定义随访期的定义研究对象的随访研究对象的随访暴露人群的选择暴露人群的选择特殊暴露人群:指具有某种特殊暴露经历特殊暴露人群:指具有某种特殊暴露经历的人群,如暴露于某种毒物、暴露于污染的人群,如暴露于某种毒物、暴露于污染的饮用水等。观察由单一暴露因素所导致的饮用水等。观察由单一暴露因素所导致的影响健康的多种效应。的影响健
8、康的多种效应。一般一般暴露人群:由具有不同暴露因素的个暴露人群:由具有不同暴露因素的个体组成,如研究因素包括饮用污染水、肝体组成,如研究因素包括饮用污染水、肝炎、黄曲霉毒素摄入量。炎、黄曲霉毒素摄入量。研究多种暴露与多种疾病之间的关系。研究多种暴露与多种疾病之间的关系。暴露资料的收集暴露资料的收集对暴露因素应进行定量,对暴露因素应进行定量,定量有利于增加定量有利于增加对疾病因果关系的可信性。除注意暴露的对疾病因果关系的可信性。除注意暴露的剂量外,还应考虑作用时间的长短和中间剂量外,还应考虑作用时间的长短和中间是否曾经停止过。是否曾经停止过。有关暴露因素的资料可以通过医学记录、有关暴露因素的资料
9、可以通过医学记录、工厂记录或者专门设计的调查表来收集。工厂记录或者专门设计的调查表来收集。非暴露人群的选择非暴露人群的选择是是由没有受到暴露因素影响的个体组由没有受到暴露因素影响的个体组成,在定群研究中作为暴露人群的对成,在定群研究中作为暴露人群的对照。分为三类:照。分为三类:内对照:这是最理想的对照;内对照:这是最理想的对照;外对照:在职业流行病学研究中多见;外对照:在职业流行病学研究中多见;一般社会人群对照;一般社会人群对照;内对照内对照同一研究人群中部分没有暴露或具有最低同一研究人群中部分没有暴露或具有最低暴露剂量的人员即为内对照。如,研究某暴露剂量的人员即为内对照。如,研究某人群吸烟与
10、疾病的关系,不吸烟者或少量人群吸烟与疾病的关系,不吸烟者或少量吸烟者即为内对照。是最理想的对照。除吸烟者即为内对照。是最理想的对照。除了暴露因素外,其他因素与暴露人群的可了暴露因素外,其他因素与暴露人群的可比性强。比性强。外对照外对照没有暴露或具有较低暴露水平的其他人没有暴露或具有较低暴露水平的其他人群属于外对照。在职业流行病学研究中群属于外对照。在职业流行病学研究中常用。如将具有某可疑暴露因素的某工常用。如将具有某可疑暴露因素的某工厂的全体工人作为暴露组,而无该暴露厂的全体工人作为暴露组,而无该暴露因素的其他工厂作为非暴露对照。因素的其他工厂作为非暴露对照。一般社会人群对照一般社会人群对照一
11、般人群的发病率和死亡率比较稳定且一般人群的发病率和死亡率比较稳定且容易获得,可节省大量的时间和经费。容易获得,可节省大量的时间和经费。缺点是提供的资料比较粗糙,有时会低缺点是提供的资料比较粗糙,有时会低估暴露与疾病之间的联系。估暴露与疾病之间的联系。随访期的定义随访期的定义每个研究对象的开始随访和终止随访的日期每个研究对象的开始随访和终止随访的日期应被定义。随访时间的长短取决于暴露与疾应被定义。随访时间的长短取决于暴露与疾病的联系强度,暴露因素作用越强,随访时病的联系强度,暴露因素作用越强,随访时间越短;随访时间的长短也与疾病的潜伏期间越短;随访时间的长短也与疾病的潜伏期有关,潜伏期短的疾病,
12、随访可以很快结束,有关,潜伏期短的疾病,随访可以很快结束,而潜伏期长的慢性病,随访时间可以延续许而潜伏期长的慢性病,随访时间可以延续许多年。多年。研究对象的随访研究对象的随访保证保证随访成功是定群研究的关键之一,随访的目随访成功是定群研究的关键之一,随访的目的有的有确定研究对象是否处于观察之中;确定研究对象是否处于观察之中;确定研究人群中的各种疾病事件;确定研究人群中的各种疾病事件;进一步收集有关暴露与混杂因素的资料。进一步收集有关暴露与混杂因素的资料。随访的方法:随访的方法:利用常规登记的人群和疾病资料,如职工人事登记资利用常规登记的人群和疾病资料,如职工人事登记资料、疾病报告卡、死亡证明等
13、;料、疾病报告卡、死亡证明等;特殊安排的随访,如家访、电话访问或通信等特殊安排的随访,如家访、电话访问或通信等。确定研究结局确定研究结局结局是指研究者预期的结果事件。如吸烟与结局是指研究者预期的结果事件。如吸烟与冠心病的关系,发生了冠心病即研究对象出冠心病的关系,发生了冠心病即研究对象出现了结局。结局不局限于发病,还可以是死现了结局。结局不局限于发病,还可以是死亡、各种化验指标(如血清中抗体、血脂、亡、各种化验指标(如血清中抗体、血脂、血糖)等。血糖)等。样本大小的计算样本大小的计算在设计阶段,需对样本大小进行计算,以便了解需在设计阶段,需对样本大小进行计算,以便了解需随访多少人才能发现暴露与
14、疾病之间的联系。需知随访多少人才能发现暴露与疾病之间的联系。需知道道4个参数:非暴露人群的发病率(个参数:非暴露人群的发病率(P0);暴露人);暴露人群的发病率(群的发病率(P1);所要求达到的显著性水平);所要求达到的显著性水平();要求达到的研究功效();要求达到的研究功效()20120011)(2PPQPQPQPN举例举例某定群研究欲观察放射线暴露与白血某定群研究欲观察放射线暴露与白血病的关系,已经知道一般人群白血病病的关系,已经知道一般人群白血病发病率是发病率是1/1/万,放射线暴露者发病率万,放射线暴露者发病率为为10/10/万,研究者将显著性水平定为万,研究者将显著性水平定为0.0
15、50.05,研究功效定义为,研究功效定义为0.100.10,Z Z0.050.05=1.96=1.96,Z Z0.100.10=1.28=1.28。计算所需样本。计算所需样本的大小?的大小?P0=0.0001,Q0=1-0.0001=0.9999;P1=0.001,Q1=0.999P=(P0+P1)/2=0.00055,Q=1-0.00055=0.999451424791.1424600000081.001154.0)0001.0001.0(9999.0001.0999.0001.028.199945.000055.0296.122N队列研究的资料分析队列研究的资料分析(一)率的计算(一)率的
16、计算 累积累积发病率(发病率(CI):当研究人群的数量较多,人口比较稳):当研究人群的数量较多,人口比较稳定时,以固定人口为分母,全年某疾病发病的累积总数做定时,以固定人口为分母,全年某疾病发病的累积总数做分子。分子。发病密度发病密度(ID):观察时间较长,人口很难稳定时,用总:观察时间较长,人口很难稳定时,用总 人数是不合理的,以人时为单位。人数是不合理的,以人时为单位。标化比:计算发病或死亡的比值。当研究对象数目较少,标化比:计算发病或死亡的比值。当研究对象数目较少,发病率较低,不宜计算率。发病率较低,不宜计算率。以全人口发病率或死亡率为标准,算出该观察人群的以全人口发病率或死亡率为标准,
17、算出该观察人群的理论发病人数,观察人群中实际发病(死亡)数与理理论发病人数,观察人群中实际发病(死亡)数与理论发病数之比,即得标化发病(死亡)比。论发病数之比,即得标化发病(死亡)比。SMR在职在职业业epide中常用中常用举例举例北方某市有北方某市有200万人口,其中万人口,其中HBsAg携带者携带者10万人,经万人,经1年的前瞻性研究发年的前瞻性研究发现,现,HBsAg携带者中发生原发性肝癌携带者中发生原发性肝癌250例,而非例,而非HBsAg携带者中仅发生携带者中仅发生95例,求其累积发病率和例,求其累积发病率和RR。举例举例某厂某厂20-2420-24岁组工人岁组工人500500名,某
18、年内名,某年内1 1人死于某癌症,已经知道该年全人口人死于某癌症,已经知道该年全人口20-2420-24岁组某癌症的死亡率为岁组某癌症的死亡率为1.81.8,求其求其SMRSMR。SMR=1.11SMR=1.11,即该工厂死于癌症的危险,即该工厂死于癌症的危险超过全人群的超过全人群的0.110.11倍。倍。(二)人时的计算(二)人时的计算当观察时间长,对象被观察的时间长短不当观察时间长,对象被观察的时间长短不一,以人为单位计算率不合理,较合理的一,以人为单位计算率不合理,较合理的方法是加入时间因素,用统一的标准来计方法是加入时间因素,用统一的标准来计算对象的暴露经历。以个人为单位,计算算对象的
19、暴露经历。以个人为单位,计算暴露人年,适用于样本量不大;使用寿命暴露人年,适用于样本量不大;使用寿命表法计算人年;表法计算人年;(三)率差异的显著性检验(三)率差异的显著性检验当样本量较大时,样本率的频数分布接近正态,当样本量较大时,样本率的频数分布接近正态,用用U检验来比较暴露组与对照组之间率的差异。检验来比较暴露组与对照组之间率的差异。220101ppssPP(四)暴露与发病关联指标计算(四)暴露与发病关联指标计算队列队列研究与病例对照研究的不同,可直接计算发研究与病例对照研究的不同,可直接计算发病率。常用:病率。常用:相对危险度(相对危险度(RRRR)归因危险度(归因危险度(ARAR)归
20、因危险度百分比归因危险度百分比人群归因危险度与人群归因危险度百分比人群归因危险度与人群归因危险度百分比队列研究资料整理相对危险度暴露组的发病(死亡)率与非暴露组的发病率之比。暴露组的发病(死亡)率与非暴露组的发病率之比。表明暴露组发病或死亡的危险是非暴露组的多少倍表明暴露组发病或死亡的危险是非暴露组的多少倍。010ncnaIIRRe归因危险度表明暴露组与对照组发病危险相差的绝对值,又表明暴露组与对照组发病危险相差的绝对值,又称率差,即危险特异地归因于暴露因素的程度。称率差,即危险特异地归因于暴露因素的程度。010ncnaIIARe010ncnaIIARe危险度比较疾病疾病吸烟者吸烟者(1/10
21、万人年万人年)非吸烟者非吸烟者RRAR肺癌肺癌48.334.4910.843.84心血管心血管疾病疾病294.67169.541.7125.13对个体而言,吸烟者患肺癌的危险比患心血管病对个体而言,吸烟者患肺癌的危险比患心血管病的危险性大。就人群而言,吸烟者引起心血管疾的危险性大。就人群而言,吸烟者引起心血管疾病的危害要大得多。前者具有病因学意义,后者病的危害要大得多。前者具有病因学意义,后者具有疾病预防和公共卫生学意义。具有疾病预防和公共卫生学意义。归因危险度百分比又称病因分值(又称病因分值(EF),指暴露人群中发病归),指暴露人群中发病归因于暴露的成分占全部病因的百分比。因于暴露的成分占全
22、部病因的百分比。eeIIIAR0%上例中,上例中,AR%=(48.33-4.49)/48.33=90.7%说明吸烟者中的肺癌不是完全由吸烟所致,说明吸烟者中的肺癌不是完全由吸烟所致,90.7%归因归因于吸烟。于吸烟。人群归因危险度(人群归因危险度(PAR)及百分比)及百分比 010ncnaIIARetttIIIPARIIPAR00%It代表全人群的率,代表全人群的率,I0代表非暴露组的率代表非暴露组的率练习吸烟吸烟者肺癌的年死亡率为者肺癌的年死亡率为0.960.96非吸烟者肺癌的年死亡率为非吸烟者肺癌的年死亡率为0.070.07全人群的肺癌的年死亡率为全人群的肺癌的年死亡率为0.560.56计
23、算计算RRRR、ARAR、AR%AR%、PARPAR、PAR%PAR%AnswerRR=13.7AR=0.89AR%=92.7%PAR=0.49 PAR%=87.5%队列研究中常见的偏倚及控制选择偏倚选择偏倚严格规定选择对象的标准严格规定选择对象的标准失访偏倚失访偏倚提高依从性提高依从性信息偏倚信息偏倚提高设计水平和调查质量提高设计水平和调查质量混杂偏倚混杂偏倚限制和匹配限制和匹配优点暴露发生在结局之前,资料可靠;暴露发生在结局之前,资料可靠;可直接计算发病率,可直接分析病因的作用;可直接计算发病率,可直接分析病因的作用;可同时观察一种暴露与多种疾病的关系;可同时观察一种暴露与多种疾病的关系;有助于了解疾病的自然史。有助于了解疾病的自然史。缺点不适用发病率低的疾病;不适用发病率低的疾病;对象不易保持依从性;对象不易保持依从性;研究费时、费钱、费力;研究费时、费钱、费力;研究设计要求相对严密。研究设计要求相对严密。