1、青岛大学公共卫生系流行病学与统计学教研室 流行病学方法流行病学方法第1页,共105页。队列研究队列研究cohort study 青岛大学公共卫生系流行病学与统计学教研室第2页,共105页。青岛大学公共卫生系流行病学与统计学教研室 队列研究(队列研究(cohort studycohort study)又称又称:前瞻性研究(前瞻性研究(prospective studyprospective study)定群研究(定群研究(cohort studycohort study)发生率研究(发生率研究(incidence studyincidence study)随访研究(随访研究(follow-up
2、studyfollow-up study)纵向研究(纵向研究(longitudinal studylongitudinal study)等)等目前常用的名称是队列研究、定群研究。目前常用的名称是队列研究、定群研究。前 言第3页,共105页。青岛大学公共卫生系流行病学与统计学教研室队列研究是分析流行病学研究中的重要方队列研究是分析流行病学研究中的重要方法,主要用于检验病因假设,法,主要用于检验病因假设,是研究暴露是研究暴露与结局关联的最佳设计类型与结局关联的最佳设计类型,它的它的时间顺序合时间顺序合理理,能够减少与确定暴露相关的偏倚能够减少与确定暴露相关的偏倚,可以直可以直接测量疾病危险指标接测
3、量疾病危险指标,还能研究一种因素还能研究一种因素的多种效应的多种效应,因此在因果关系的确定上比病因此在因果关系的确定上比病例对照研究更有说服力。例对照研究更有说服力。第4页,共105页。青岛大学公共卫生系流行病学与统计学教研室第一节第一节 概述概述第二节第二节 设计和实施设计和实施第三节第三节 资料的整理与分析资料的整理与分析第四节第四节 偏倚及其控制偏倚及其控制第五节第五节 优缺点优缺点第5页,共105页。青岛大学公共卫生系流行病学与统计学教研室基本概念基本概念特点特点种类种类用途用途 第一节概述第一节概述 第6页,共105页。青岛大学公共卫生系流行病学与统计学教研室基本概念基本概念n队列研
4、究队列研究 是选定暴露和未暴露于某种因素是选定暴露和未暴露于某种因素的两种人群,追踪其各自的发病结局,比的两种人群,追踪其各自的发病结局,比较两组发病结局的差异,从而判断暴露与较两组发病结局的差异,从而判断暴露与发病有无因果关联及关联大小的一种观察发病有无因果关联及关联大小的一种观察性研究方法。性研究方法。第7页,共105页。青岛大学公共卫生系流行病学与统计学教研室基本概念基本概念n1 队列(队列(cohort)原意是指古罗马军)原意是指古罗马军团中的一个分队,流行病学家加以借团中的一个分队,流行病学家加以借用,表示有共同经历或共同状态的一用,表示有共同经历或共同状态的一群人,例如一组出生队列
5、有相同的出群人,例如一组出生队列有相同的出生年代,一组吸烟队列有共同的吸烟生年代,一组吸烟队列有共同的吸烟经历。经历。第8页,共105页。青岛大学公共卫生系流行病学与统计学教研室基本概念基本概念n2 队列或群组队列或群组*指以下两种人群指以下两种人群 (1)泛指暴露于某事物或因素、具)泛指暴露于某事物或因素、具有共同特征的一群人。有共同特征的一群人。(2)指特定时间内出生并按此出生时)指特定时间内出生并按此出生时期确定的一组人,称为出生队列。期确定的一组人,称为出生队列。第9页,共105页。青岛大学公共卫生系流行病学与统计学教研室固定队列固定队列 Fixed Cohort研究开始研究开始研究结
6、束研究结束出现结局未出现结局根据人群进出队列的时间不同分类:根据人群进出队列的时间不同分类:第10页,共105页。青岛大学公共卫生系流行病学与统计学教研室动态队列动态队列 Dynamic Cohort研究开始研究开始研究结束研究结束出现结局出现结局失访失访第11页,共105页。青岛大学公共卫生系流行病学与统计学教研室基本概念基本概念n3.3.队列研究的分组队列研究的分组n4.4.队列研究检验的假设队列研究检验的假设n5.5.暴露暴露 与病例对照研究相似,指接触某与病例对照研究相似,指接触某种因素或具备某种特征或行为种因素或具备某种特征或行为n6.6.暴露因素暴露因素 泛指能影响人群发病率变动、
7、泛指能影响人群发病率变动、疾病结局的研究因素。疾病结局的研究因素。第12页,共105页。青岛大学公共卫生系流行病学与统计学教研室随访随访随访随访暴露组暴露组非暴露组非暴露组总体总体发病发病未发病未发病发病发病未发病未发病比例比例比例比例 队列研究的结构模式队列研究的结构模式基本概念基本概念第13页,共105页。青岛大学公共卫生系流行病学与统计学教研室特点特点(4个)1.1.自研究方法的性质上属于观察法自研究方法的性质上属于观察法 暴暴露是客观存在的,而不是人为给予的,且露是客观存在的,而不是人为给予的,且不施加任何干预措施。不施加任何干预措施。2.2.自设计上设立对照自设计上设立对照第14页,
8、共105页。青岛大学公共卫生系流行病学与统计学教研室特点特点(4个)n3.3.自研究方法方向上自研究方法方向上 属于纵向的、前属于纵向的、前瞻性、由瞻性、由“因因”及及“果果”的研究方法。的研究方法。n4.4.自病因研究的价值上自病因研究的价值上 能确证暴露与结能确证暴露与结局的因果联系局的因果联系 。且由于疾病是发生在事先。且由于疾病是发生在事先确定的暴露人群中,因此能准确地估计人确定的暴露人群中,因此能准确地估计人群发病的危险程度。群发病的危险程度。第15页,共105页。青岛大学公共卫生系流行病学与统计学教研室种类种类1.1.前瞻性队列研究前瞻性队列研究2.2.历史性队列研究历史性队列研究
9、3.3.双向性队列研究双向性队列研究第16页,共105页。青岛大学公共卫生系流行病学与统计学教研室种类种类1n1.前瞻性队列研究前瞻性队列研究 最适宜做因果关系的推论,最适宜做因果关系的推论,资料资料的偏倚较小,结果可信;缺点是所需的偏倚较小,结果可信;缺点是所需观察的人群样本很大,观察时间长、观察的人群样本很大,观察时间长、花费大,因而影响其可行性花费大,因而影响其可行性,特别是,特别是对于发病率低的慢性疾病更是如此。对于发病率低的慢性疾病更是如此。第17页,共105页。青岛大学公共卫生系流行病学与统计学教研室种类种类2n2.历史性队列研究历史性队列研究 研究开始时,暴露和疾病均已发研究开始
10、时,暴露和疾病均已发生,所以根据已有的资料来确定暴露生,所以根据已有的资料来确定暴露组和非暴露组,以及各研究对象的死组和非暴露组,以及各研究对象的死亡和疾病情况。回顾性队列研究结果亡和疾病情况。回顾性队列研究结果的可靠性完全取决于暴露与疾病资料的可靠性完全取决于暴露与疾病资料的完整性与准确性的完整性与准确性第18页,共105页。青岛大学公共卫生系流行病学与统计学教研室优点优点短期内完成资料的收集和分析短期内完成资料的收集和分析时间顺序仍是由因到果时间顺序仍是由因到果省时、省力、出结果快省时、省力、出结果快缺点缺点资料积累时未受到研究者的控制,内容上未必符资料积累时未受到研究者的控制,内容上未必
11、符合要求合要求需要足够完整可靠的过去某段时间有关研究需要足够完整可靠的过去某段时间有关研究对象的暴露和结局的历史记录或档案材料对象的暴露和结局的历史记录或档案材料 第19页,共105页。青岛大学公共卫生系流行病学与统计学教研室种类种类3n3.双向性队列研究双向性队列研究 最适宜于评价最适宜于评价对人体健康同时具有短期效应和长对人体健康同时具有短期效应和长期作用的暴露因素。期作用的暴露因素。第20页,共105页。青岛大学公共卫生系流行病学与统计学教研室暴露组暴露组非暴露组非暴露组暴露组暴露组非暴露组非暴露组回顾性地收集回顾性地收集已有的历史资料已有的历史资料回顾性地收集回顾性地收集已有的历史资料
12、已有的历史资料暴露组暴露组非暴露组非暴露组前瞻性前瞻性收集资料收集资料历史性历史性队列研究队列研究继续继续收集资料收集资料双向性双向性队列研究队列研究前瞻性前瞻性队列研究队列研究过去过去某时点某时点现在现在将来将来某时点某时点图图3 3 队列研究类型示意图队列研究类型示意图时间轴时间轴第21页,共105页。青岛大学公共卫生系流行病学与统计学教研室幽门螺杆菌感染与胃癌发生的病因学研究幽门螺杆菌感染与胃癌发生的病因学研究回顾性队列研究回顾性队列研究从常州市第一人民医院病理科的病理组织库中选取从常州市第一人民医院病理科的病理组织库中选取1988198819931993牟问,因消化不良或上腹部不适等症
13、状作胃牟问,因消化不良或上腹部不适等症状作胃镜检查并活检的非胃癌住院患者的组织切片符合入选和镜检查并活检的非胃癌住院患者的组织切片符合入选和排除标准的共排除标准的共943943例,以随访人群中胃癌发生为本研例,以随访人群中胃癌发生为本研究观察终点。究观察终点。第22页,共105页。青岛大学公共卫生系流行病学与统计学教研室本研究为同群体的回顾性队列研究,从入选日期本研究为同群体的回顾性队列研究,从入选日期(即初次胃镜即初次胃镜检查日期检查日期)起,随访记录患者胃部病变情况的变化及饮食、生活等起,随访记录患者胃部病变情况的变化及饮食、生活等方面情况,并调查胃癌的发生情况。不采取任何直接的干预措施。
14、方面情况,并调查胃癌的发生情况。不采取任何直接的干预措施。所有切片标本在上海中山医院统一阅片后,区分所有切片标本在上海中山医院统一阅片后,区分H Hpylonpylon感染情况,感染情况,对自然形成的对自然形成的H Hpylonpylon阳性和阴性两队列进行随访,随访期为阳性和阴性两队列进行随访,随访期为5 51010年。采用统一的调查问卷,进行家访或信访;有症状者予胃镜或年。采用统一的调查问卷,进行家访或信访;有症状者予胃镜或胃肠钡透等检查。胃癌确诊依据手术或胃镜加组织病理检查。随访胃肠钡透等检查。胃癌确诊依据手术或胃镜加组织病理检查。随访结束时间为结束时间为19991999年底。年底。幽门
15、螺杆菌感染与胃癌发生的病因学研究幽门螺杆菌感染与胃癌发生的病因学研究回顾性队列研究回顾性队列研究第23页,共105页。青岛大学公共卫生系流行病学与统计学教研室马鞍山市出生缺陷的队列研究马鞍山市出生缺陷的队列研究在安徽省马鞍山市四家妇幼保健机构设置调查点,在安徽省马鞍山市四家妇幼保健机构设置调查点,于于2008 2008 年年10 10 月月1 1 日至日至2009 2009 年年9 9 月月30 30 日期间对前来日期间对前来建立围产保健手册和孕期体检的孕妇进行问卷调查。建立围产保健手册和孕期体检的孕妇进行问卷调查。调查具体内容包括:孕妇及其丈夫的一般人口统计调查具体内容包括:孕妇及其丈夫的一
16、般人口统计学特征,夫妻双方孕前半年的环境暴露情况、孕妇学特征,夫妻双方孕前半年的环境暴露情况、孕妇孕早期的环境暴露情况,以及妊娠结局等。孕早期的环境暴露情况,以及妊娠结局等。第24页,共105页。青岛大学公共卫生系流行病学与统计学教研室研究观察起点为有偿供血人群研究观察起点为有偿供血人群HIVHIV感染时间感染时间(1995(1995年年前后前后),从感染到研究起点,从感染到研究起点20042004年年1111月期间的资料月期间的资料(尤其尤其AIDSAIDS诊断死亡资料诊断死亡资料),来自历史记录,来自历史记录(包括当地包括当地HIVHIVAIDSAIDS病例报告资料、流行病学资料、病例报告
17、资料、流行病学资料、AIDSAIDS患者患者医院或疾控部门的所有病历和随访记录、其他部门有关医院或疾控部门的所有病历和随访记录、其他部门有关记录以及当地有关非法采供记录以及当地有关非法采供iraira浆站信息等浆站信息等)和回顾和回顾调查调查(核补现有历史资料中缺失有误的必要信息核补现有历史资料中缺失有误的必要信息)。我国既往不安全有偿供血感染我国既往不安全有偿供血感染HIVHIV者自然史双向者自然史双向性队列研究性队列研究第25页,共105页。青岛大学公共卫生系流行病学与统计学教研室我国既往不安全有偿供血感染我国既往不安全有偿供血感染HIVHIV者自然史双向者自然史双向性队列研究性队列研究2
18、0052005年及以后资料来自课题现场调查年及以后资料来自课题现场调查(对新入选研究对象对新入选研究对象的相关调查,以入户调查方式为主,结合知情者访谈的相关调查,以入户调查方式为主,结合知情者访谈)和和随访调查随访调查(对未治疗者或发病死亡结局不明确者,每对未治疗者或发病死亡结局不明确者,每6 6个个月月1 1次随访以明确结局次随访以明确结局)。观察终点为。观察终点为20062006年年7 7月月2424日。日。第26页,共105页。青岛大学公共卫生系流行病学与统计学教研室用用 途途 1.1.检验病因假设检验病因假设 2.2.描述疾病的自然史描述疾病的自然史 3.3.评价自发的预防效果评价自发
19、的预防效果4.4.新药的上市后监测新药的上市后监测第27页,共105页。青岛大学公共卫生系流行病学与统计学教研室一、研究因素的确定一、研究因素的确定二、结局的确定二、结局的确定三、研究对象的选择三、研究对象的选择四、样本含量的估计四、样本含量的估计五、资料的收集五、资料的收集第二节设计和实施第二节设计和实施第28页,共105页。青岛大学公共卫生系流行病学与统计学教研室研究因素的确定研究因素的确定1n研究因素在队列研究中常称为暴露因子研究因素在队列研究中常称为暴露因子或暴露变量,在研究中要考虑如何选择、或暴露变量,在研究中要考虑如何选择、规定和测量。规定和测量。n一般应对暴露因素进行定量,除了一
20、般应对暴露因素进行定量,除了暴露暴露水平水平以外,还应考虑以外,还应考虑暴露的时间暴露的时间,以估计,以估计累积暴露剂量。同时还要考虑累积暴露剂量。同时还要考虑暴露方式暴露方式。第29页,共105页。青岛大学公共卫生系流行病学与统计学教研室研究因素的确定研究因素的确定2队列研究除了要确定主要的暴露因素队列研究除了要确定主要的暴露因素外,还应确定同时需要收集的其他暴外,还应确定同时需要收集的其他暴露因素资料及背景资料,包括各种可露因素资料及背景资料,包括各种可疑的混杂因素及研究对象的人口学特疑的混杂因素及研究对象的人口学特征,以利于对研究结果作深入分析。征,以利于对研究结果作深入分析。第30页,
21、共105页。青岛大学公共卫生系流行病学与统计学教研室结局的确定结局的确定1n结局变量(结局变量(outcome variableoutcome variable)也叫结果变量,简称为结局。也叫结果变量,简称为结局。是指随访观察中将出现的预期结果是指随访观察中将出现的预期结果事件,也即研究者希望追踪观察的事事件,也即研究者希望追踪观察的事件。结局就是队列研究观察的自然终件。结局就是队列研究观察的自然终点,它与观察期的终止不是一个概念。点,它与观察期的终止不是一个概念。第31页,共105页。青岛大学公共卫生系流行病学与统计学教研室结局的确定结局的确定2n结局变量的测定,应给出明确统一的结局变量的测
22、定,应给出明确统一的标准,并在研究的全过程中严格遵守。标准,并在研究的全过程中严格遵守。n对非预定结局(如疾病或死亡)的信对非预定结局(如疾病或死亡)的信息也要收集。息也要收集。第32页,共105页。青岛大学公共卫生系流行病学与统计学教研室研究对象的选择研究对象的选择 1n暴露人群的选择暴露人群的选择 1.1.特殊暴露人群特殊暴露人群 选择由于特殊原因暴露于特殊因素的人群作选择由于特殊原因暴露于特殊因素的人群作为暴露人群。如:接触过放射线、同位素治疗的为暴露人群。如:接触过放射线、同位素治疗的人,贫铀弹、原子弹受害者。人,贫铀弹、原子弹受害者。第33页,共105页。青岛大学公共卫生系流行病学与
23、统计学教研室研究对象的选择研究对象的选择 22 2 职业人群职业人群:(occupational exposure)(occupational exposure)选择由于特殊职业原因暴露于某种特选择由于特殊职业原因暴露于某种特殊危险因素的人群作为暴露人群,不但所殊危险因素的人群作为暴露人群,不但所需人数较少,而且较易发现暴露与疾病之需人数较少,而且较易发现暴露与疾病之间的关联。间的关联。第34页,共105页。青岛大学公共卫生系流行病学与统计学教研室研究对象的选择研究对象的选择 33.3.一般人群一般人群(general population)(general population)(1)一般居
24、民一般居民 选择一个地区的全部人口或其无偏样本选择一个地区的全部人口或其无偏样本中的暴露者作为暴露人群。中的暴露者作为暴露人群。如美国如美国Framingham地区高血压的研究中研地区高血压的研究中研究人群来自究人群来自Framingham小镇,当时该镇人口小镇,当时该镇人口2828,000000人,其中人,其中3062岁的岁的10,000人,在被选作观察人,在被选作观察样本的样本的6 6,500500人中,男女各半。人中,男女各半。第35页,共105页。青岛大学公共卫生系流行病学与统计学教研室研究对象的选择研究对象的选择 4(2)有组织的人群团体有组织的人群团体 选择有组织的人群作为一般人群
25、的选择有组织的人群作为一般人群的特殊形式,如学生、士兵、会员等。特殊形式,如学生、士兵、会员等。第36页,共105页。青岛大学公共卫生系流行病学与统计学教研室研究对象的选择研究对象的选择5n对照人群的选择对照人群的选择 做到暴露组与对照组有良好的可比性做到暴露组与对照组有良好的可比性是很不容易的,关键在于选择恰当的对照是很不容易的,关键在于选择恰当的对照人群。人群。1 1)内对照)内对照 3 3)总人口对照)总人口对照2 2)外对照)外对照 4 4)多重对照)多重对照第37页,共105页。青岛大学公共卫生系流行病学与统计学教研室研究对象的选择研究对象的选择6n内对照内对照 即先选择一组研究人群
26、,将其中暴露即先选择一组研究人群,将其中暴露于所研究因素的对象作为暴露组,其余非于所研究因素的对象作为暴露组,其余非暴露者即为非暴露组。暴露者即为非暴露组。当研究的暴露变量是定量变量时,可将暴当研究的暴露变量是定量变量时,可将暴露定量地分成若干亚组,而以最低亚组暴露的露定量地分成若干亚组,而以最低亚组暴露的人群定为对照组。人群定为对照组。第38页,共105页。青岛大学公共卫生系流行病学与统计学教研室研究对象的选择研究对象的选择7n特设对照特设对照 也称外对照也称外对照 当暴露人群选择的是职业人群或特殊暴露当暴露人群选择的是职业人群或特殊暴露人群时,往往不能从这些人群中选出对照,而人群时,往往不
27、能从这些人群中选出对照,而常需在该人群之外去寻找对照组,故名外对照。常需在该人群之外去寻找对照组,故名外对照。第39页,共105页。青岛大学公共卫生系流行病学与统计学教研室研究对象的选择研究对象的选择8n总人口对照总人口对照 这种对照可认为是外对照的一种,这种对照可认为是外对照的一种,但也可看作不设对照,因为它实际上并未但也可看作不设对照,因为它实际上并未与暴露组平行地设立一个对照组,而是利与暴露组平行地设立一个对照组,而是利用整个地区的现成发病或死亡的统计资料用整个地区的现成发病或死亡的统计资料即以全人口率为对照。即以全人口率为对照。n多重对照多重对照 或叫多种对照或叫多种对照第40页,共1
28、05页。青岛大学公共卫生系流行病学与统计学教研室样本含量的估计样本含量的估计1计算样本量时需考虑的几个问题计算样本量时需考虑的几个问题 1.1.抽样方法抽样方法 同现况调查同现况调查2.2.暴露组与非暴露组的比例暴露组与非暴露组的比例 一般说来,非暴一般说来,非暴露组的样本含量不宜少于暴露组的样本含量。露组的样本含量不宜少于暴露组的样本含量。3.3.预先估计失访率,适当扩大样本量。通常假设预先估计失访率,适当扩大样本量。通常假设失访率为失访率为10%10%。第41页,共105页。青岛大学公共卫生系流行病学与统计学教研室样本含量的估计样本含量的估计2影响样本含量的几个因素影响样本含量的几个因素
29、1.1.一般人群(对照人群)中所研究疾病的一般人群(对照人群)中所研究疾病的发病率发病率p p0 0 p p0 0越接近越接近0.50.5,所需样本量越小。,所需样本量越小。第42页,共105页。青岛大学公共卫生系流行病学与统计学教研室样本含量的估计样本含量的估计32.2.暴露组与对照组人群发病率之差暴露组与对照组人群发病率之差 用用p p1 1表示暴露组人群的发病率,用一般人表示暴露组人群的发病率,用一般人群发病率群发病率p p0 0代替对照组人群发病率,代替对照组人群发病率,d=pd=p1 1p p0 0为两组人群发病率之差,为两组人群发病率之差,d d值越值越大,所需样本量越小。大,所需
30、样本量越小。第43页,共105页。青岛大学公共卫生系流行病学与统计学教研室样本含量的估计样本含量的估计43.要求的第要求的第类错误(假阳性错误)类错误(假阳性错误)值值 通常取通常取=0.05=0.05或或0.010.01,取,取0.010.01时所需样本量较时所需样本量较0.050.05为大。为大。第44页,共105页。青岛大学公共卫生系流行病学与统计学教研室样本含量的估计样本含量的估计54.4.效力(效力(powerpower)又称把握度()又称把握度(1-1-),),为检验假设时出现第为检验假设时出现第类错误的概率,而类错误的概率,而1-1-为检验假设时能够避免假阴性的能力。通为检验假设
31、时能够避免假阴性的能力。通常取常取为为0.100.10,有时用,有时用0.200.20。第45页,共105页。青岛大学公共卫生系流行病学与统计学教研室样本含量的估计样本含量的估计6201110022ppqpqpzpqznn样本含量的计算样本含量的计算 式中式中p1与与p0分别代表暴露组与对照组的预分别代表暴露组与对照组的预期发病率,为两个发病率的平均值,期发病率,为两个发病率的平均值,q=1-p,Z和和Z为标准正态分布下的面积,可查为标准正态分布下的面积,可查表求得。表求得。第46页,共105页。青岛大学公共卫生系流行病学与统计学教研室样本含量的估计样本含量的估计7n样本含量的计算举例样本含量
32、的计算举例 用队列研究探讨孕妇暴露于某药物用队列研究探讨孕妇暴露于某药物与婴儿先天性心脏病之间的联系。已知与婴儿先天性心脏病之间的联系。已知非暴露孕妇所生婴儿的先天性心脏病发非暴露孕妇所生婴儿的先天性心脏病发病率(病率(p p0 0)为)为0.0070.007,估计该药物暴露的,估计该药物暴露的RRRR为为2.52.5,设,设=0.05=0.05(双侧),(双侧),=0.10=0.10,求调查所需的样本量。求调查所需的样本量。第47页,共105页。青岛大学公共卫生系流行病学与统计学教研室993.0,007.0,282.1,96.100 qpzz 9825.0,0175.0007.05.2101
33、 qpRRp 9877.0,0123.00175.0007.021 qp样本含量的估计样本含量的估计8n样本含量的计算举例样本含量的计算举例第48页,共105页。青岛大学公共卫生系流行病学与统计学教研室 2310007.00175.0993.0007.09825.00175.0282.19877.00123.0296.122 n样本含量的估计样本含量的估计9即暴露组与非暴露组各需即暴露组与非暴露组各需2310人。人。将上述数据代入将上述数据代入当当P0=0.07时时,N=203人人第49页,共105页。青岛大学公共卫生系流行病学与统计学教研室样本含量的估计样本含量的估计10 如果考虑失访的可能
34、性,尚需在此基础如果考虑失访的可能性,尚需在此基础上增加上增加10%10%的样本量,即两组各实际需要样本的样本量,即两组各实际需要样本数量为数量为n=2310n=2310(1+0.11+0.1)=2541=2541人。如果抽样人。如果抽样方法不是单纯随机抽样,还需适当增加样本量。方法不是单纯随机抽样,还需适当增加样本量。第50页,共105页。青岛大学公共卫生系流行病学与统计学教研室v 基线资料基线资料v 随访随访 资料的收集资料的收集第51页,共105页。青岛大学公共卫生系流行病学与统计学教研室资料的收集资料的收集 1(一)(一)基线资料的收集基线资料的收集 基线资料一般包括待研究的暴露因基线
35、资料一般包括待研究的暴露因素的暴露状况,疾病与健康状况,年素的暴露状况,疾病与健康状况,年龄、性别、职业、文化、婚姻等个人龄、性别、职业、文化、婚姻等个人状况,家庭环境、个人生活习惯及家状况,家庭环境、个人生活习惯及家族疾病史等。族疾病史等。第52页,共105页。青岛大学公共卫生系流行病学与统计学教研室资料的收集资料的收集2n获取基线资料的方式一般有下列四种:获取基线资料的方式一般有下列四种:1 1、查阅记录或档案、查阅记录或档案2 2、访问研究对象或其它能够提供信息的人、访问研究对象或其它能够提供信息的人3 3、对研究对象进行体格检查和实验室检查、对研究对象进行体格检查和实验室检查4 4、环
36、境调查与检测、环境调查与检测第53页,共105页。青岛大学公共卫生系流行病学与统计学教研室资料的收集资料的收集3 3(二)随访(二)随访n随访对象与方法随访对象与方法 对暴露组和对照组应采取相同的随访方对暴露组和对照组应采取相同的随访方法,且在整个随访过程中,随访方法应保法,且在整个随访过程中,随访方法应保持不变。持不变。n随访内容随访内容 一般与获取的基线资料内容一致,但此处收集的一般与获取的基线资料内容一致,但此处收集的重点是结局变量重点是结局变量第54页,共105页。青岛大学公共卫生系流行病学与统计学教研室资料的收集资料的收集4 4n观察终点观察终点 观察终点(观察终点(end-poin
37、tend-point)就是指研究对象就是指研究对象出现了预期的结果,达到了这个观察终点,出现了预期的结果,达到了这个观察终点,就不再对该研究对象继续随访。就不再对该研究对象继续随访。对观察终点的判断应在设计中订出明确对观察终点的判断应在设计中订出明确的标准,规定明确的判断方法,这种规定自的标准,规定明确的判断方法,这种规定自始至终不能改变。发现终点的方法要敏感、始至终不能改变。发现终点的方法要敏感、可靠、简单、易被接受。可靠、简单、易被接受。第55页,共105页。青岛大学公共卫生系流行病学与统计学教研室资料的收集资料的收集5 5n观察的终止时间观察的终止时间:观察终止时间是指整个观察终止时间是
38、指整个研究工作截止的时间。研究工作截止的时间。n随访的间隔:随访间隔与次数将视研究结局随访的间隔:随访间隔与次数将视研究结局的变化速度、研究的人力、物力等条件而定。的变化速度、研究的人力、物力等条件而定。一般慢性病的随访间隔期可定为一般慢性病的随访间隔期可定为1 12 2年。年。n随访者随访者 第56页,共105页。青岛大学公共卫生系流行病学与统计学教研室第三节资料的整理与分析第三节资料的整理与分析n一数据资料的整理一数据资料的整理n二队列研究资料的分析二队列研究资料的分析第57页,共105页。青岛大学公共卫生系流行病学与统计学教研室第三节资料的整理与分析第三节资料的整理与分析 队列研究资料归
39、纳整理表队列研究资料归纳整理表 组别组别 发病数发病数 未发病数未发病数 发病率发病率暴露组暴露组 a b a/(a+b)非暴露组非暴露组 c d c/(c+d)合计合计 a+c=m1 b+d=m0 a+b+c+d=T第58页,共105页。青岛大学公共卫生系流行病学与统计学教研室第三节资料的整理与分析第三节资料的整理与分析n(一一)率的计算率的计算n(二)率的差异显著性检验(二)率的差异显著性检验n(三)剂量(三)剂量反应关系分析反应关系分析n(四)计算暴露与发病的关联强度(四)计算暴露与发病的关联强度第59页,共105页。青岛大学公共卫生系流行病学与统计学教研室第三节资料的整理与分析第三节资
40、料的整理与分析(一一)率的计算率的计算n1累积发病率(累积发病率(cumulative incidence,CI)某某一一固定人群固定人群 在一定时期内某病新发生例在一定时期内某病新发生例数数(D)与时期开始总人数与时期开始总人数(N)之比。之比。第60页,共105页。青岛大学公共卫生系流行病学与统计学教研室第三节资料的整理与分析第三节资料的整理与分析累积发病率也就是一般所说的发病率。随累积发病率也就是一般所说的发病率。随访期越长,则病例发生越多,所以访期越长,则病例发生越多,所以CICI表示表示发病率的累积影响。发病率的累积影响。CICI又是平均危险度的又是平均危险度的一个指标,也就是一个人
41、在特定时期内发一个指标,也就是一个人在特定时期内发生该病的概率。生该病的概率。CIDN第61页,共105页。青岛大学公共卫生系流行病学与统计学教研室第三节资料的整理与分析第三节资料的整理与分析2.2.发病密度(发病密度(incidence densityincidence density,IDID):):当队列是一个动态人群时,观察人数变动较大(因失访、当队列是一个动态人群时,观察人数变动较大(因失访、迁移、死于他病、中途加入等),应该用发病密度来测迁移、死于他病、中途加入等),应该用发病密度来测量发病情况。量发病情况。发病密度是一定时期内的平均发病率。其分子仍是一个发病密度是一定时期内的平均
42、发病率。其分子仍是一个人群在一定时期内新发生的例数(人群在一定时期内新发生的例数(D D),分母则是该),分母则是该人群的每一成员所提供的人时(人群的每一成员所提供的人时(PT PT)的总和。)的总和。ID=D/PTID=D/PT 如:如:25/1025/10万人年万人年第62页,共105页。青岛大学公共卫生系流行病学与统计学教研室第三节资料的整理与分析第三节资料的整理与分析人时(人时(person-timeperson-time,PTPT)是观察人数乘以随访单)是观察人数乘以随访单位时间的积。时间单位常用年,故又称人年数位时间的积。时间单位常用年,故又称人年数(person-yearsper
43、son-years)。一定的人时(人年)数可)。一定的人时(人年)数可来自不同的人数与不同的观察时间。来自不同的人数与不同的观察时间。100100人年人年(prsy)=100(prsy)=100人人1 1年年 =200=200人人0.50.5年年 =50=50人人2 2年年第63页,共105页。青岛大学公共卫生系流行病学与统计学教研室人年的计算方法人年的计算方法1以个人为单位计算人年2动态人群人年计算3寿命表法计算人年第64页,共105页。青岛大学公共卫生系流行病学与统计学教研室3.3.标准化死亡比标准化死亡比 SMR(standardized mortality ratio)SMR(stan
44、dardized mortality ratio)即实际死亡(发病)数与预期死亡(发病)数之比。即实际死亡(发病)数与预期死亡(发病)数之比。aiEaiSMRai 是观察人群第是观察人群第 i 层年龄组的死亡观察数。层年龄组的死亡观察数。E(ai)是按标准人群年龄组死亡专率推算的第是按标准人群年龄组死亡专率推算的第 i 层年龄组层年龄组预期死亡数。预期死亡数。第65页,共105页。青岛大学公共卫生系流行病学与统计学教研室当以全人群资料作为对照时,研究对象数量较少且发当以全人群资料作为对照时,研究对象数量较少且发病率较低时,无论观察期长短都不宜计算率,而应该病率较低时,无论观察期长短都不宜计算率
45、,而应该以该指标衡量发病的强度。以该指标衡量发病的强度。某厂某厂2024岁组工人岁组工人500名,某年内名,某年内1人死于某癌症,已人死于某癌症,已知该年全人口知该年全人口2024岁组某癌症的死亡率是岁组某癌症的死亡率是1.8,求其求其SMR.11.19.018.15001SMR即某厂该年即某厂该年2024岁年龄组工人死于某癌症的危险超过相应岁年龄组工人死于某癌症的危险超过相应一般人群的一般人群的0.11倍。倍。第66页,共105页。青岛大学公共卫生系流行病学与统计学教研室总体总体SMR的可信区间:的可信区间:DEUDELpp;判断其有无意义应看该区间是否包含期望死亡数。判断其有无意义应看该区
46、间是否包含期望死亡数。不包含则有意义。不包含则有意义。式中式中LP和和UP表示按表示按Poisson分布所得死亡数可信区间分布所得死亡数可信区间的上限和下限;当实际死亡数的上限和下限;当实际死亡数D较大时较大时(50),),可可用正态近似法求得;当用正态近似法求得;当D50时,可用时,可用Poisson分布查表分布查表法求得;法求得;E(D)为预期死亡数。为预期死亡数。第67页,共105页。青岛大学公共卫生系流行病学与统计学教研室例:一个观察人群若干年后,观察期内例:一个观察人群若干年后,观察期内8080人人死于冠心病。选用该地区全人口的冠心病死死于冠心病。选用该地区全人口的冠心病死亡率作为标
47、准死亡率,计算得到预期死亡人亡率作为标准死亡率,计算得到预期死亡人数为数为7171人,求人,求SMRSMR。SMR=80/71=1.13SMR的的95%可信区间:可信区间:718096.180;718096.18062.4797.53,该区间包含了期望死亡数该区间包含了期望死亡数7171,可,可认为差别无统计学意义。认为差别无统计学意义。DEDDDEDD96.1,96.1第68页,共105页。青岛大学公共卫生系流行病学与统计学教研室(二)率的差异显著性检验(二)率的差异显著性检验组别组别 病例病例 非病例非病例 合计合计 发病率发病率暴露组暴露组 a b a+b=n1 a/n1非暴露组非暴露组
48、 c d c+d=n0 c/n0合计合计 a+c=m1 b+d=m0 a+b+c+d=T )()()()(22dbcadcbanbcadx 第三节资料的整理与分析第三节资料的整理与分析第69页,共105页。青岛大学公共卫生系流行病学与统计学教研室第三节资料的整理与分析第三节资料的整理与分析率的差异的显著性检验率的差异的显著性检验 n U U检验检验n 直接概率法直接概率法n 二项分布检验二项分布检验n 泊松分布检验泊松分布检验第70页,共105页。青岛大学公共卫生系流行病学与统计学教研室222221iiiiiiiixnxnNDNDxnNDxdNNx队列研究分级资料整理表队列研究分级资料整理表
49、暴露分级暴露分级 (0)(1)(2)(3)(xi)合计观察死亡数观察死亡数 d0 d1 d2 d3 di D观察人年数观察人年数 n0 n1 n2 n3 ni NXi是各暴露组剂量值,的是各暴露组剂量值,的di 是各剂量组死亡人数,是各剂量组死亡人数,ni是各是各剂量组暴露人年数。剂量组暴露人年数。(三)剂量(三)剂量反应关系分析反应关系分析第71页,共105页。青岛大学公共卫生系流行病学与统计学教研室第三节资料的整理与分析第三节资料的整理与分析(四)(四)计算暴露与发病的关联强度计算暴露与发病的关联强度1.相对危险度相对危险度 RR(relative risk)2.归因危险度归因危险度 AR
50、 AR(attributive riskattributive risk)3.3.归因危险度百分比归因危险度百分比 ARAR(attributive attributive risk percent risk percent)4.人群归因危险度人群归因危险度 PAR PAR(population population attributive risk attributive risk)5.5.人群归因危险度百分比人群归因危险度百分比 PARPPARP第72页,共105页。青岛大学公共卫生系流行病学与统计学教研室(四)计算暴露与发病的关联强度(四)计算暴露与发病的关联强度1.相对危险度相对危险度