1、实习三 队列研究,公共卫生学院 医学统计与流行病学系 吴虹 huangshanwuhong,【重要名词术语】,队列研究的基本原理 暴露人群和对照人群的选择 队列研究的效应评估指标,队列研究、前瞻性队列研究、回顾性队列研究、暴露、暴露人群、对照人群、相对危险度、归因危险度、归因危险度百分比,【需掌握知识点】,图3.1 流行病学研究方法(按设计类型分),队列研究的基本原理是什么?,图3.2 队列研究的结构模式图,队列研究的基本特点,属于观察法:暴露不是人为给予,不随机分配,客观存在 设立对照组:研究开始时按研究对象的暴露与否进行分组 由“因”及“果”:先知其因,再观其果 能确证因果联系:研究方向符
2、合因果顺序,可计算发病率和估计相对危险度,队列研究分为哪几种?,队列研究的资料整理分析,将资料整理成四格表或列联表,选择偏倚 研究人群在一些重要因素方面与一般人群或待研究的总体人群存在的差异。 控制 预防为主,抽样方法正确,严格按规定标准选择对象。 失访偏倚 研究对象因迁移、外出、死于非终点疾病或拒绝继续参加观察而退出队列所引起的偏倚。 控制 设计时 : 选择便于随访的人群;在计算的研究样本的基础上扩大10% 实施时:加强对随访员的管理;制定随访计划和监测措施;期中分析 整理资料时:对于有缺项或漏项的对象进行补查。,队列研究的常见偏倚,信息偏倚 在获取暴露、结局或其他信息时所出现的系统误差或偏
3、差 控制:提高临床诊断技术、明确各项标准;选择精确稳定的测量方法;事前调准仪器;严格实验操作规程;同等对待每个研究对象;培训调查员,提高技巧,统一标准 混杂偏倚 与所研究因素和结果均有联系的第三因素在暴露组与对照组的分布不均衡,混淆了研究因素和结果间的真实联系 控制 研究设计阶段:限制研究对象,匹配。 分析阶段: 分层分析、标准化或多因素分析。,队列研究的常见偏倚及控制方法,队列研究的优缺点,优点: 资料较可靠,不存在回忆偏倚; 可计算发病率和相对危险度; 一般可证实病因联系; 有助于了解疾病自然史,可对多种结局进行研究。,缺点: 不适用于发病率很低的疾病; 失访难以避免; 观察时间长,费人力
4、,花费高; 设计要求高,实施难度大。,课题一(P26),问题1 该研究的研究设计是什么?判断依据是什么?,该研究为前瞻性队列研究。 判断依据:先确定暴露水平,随访一段时间后,观察结局是否出现的时间顺序,由因及果。研究开始时所有研究对象均未出现研究结局。,问题2 该研究的暴露因素和结局分别是什么?,暴露因素是血脂水平(TC、TG水平) 结局指标是脑卒中事件(缺血性脑卒中),问题3 该研究的暴露组和对照组分别是什么?该研究的暴露人群属于什么人群?对照属于什么对照?,暴露组为较高的血脂水平组,在TC中为4.40-5.40mmol/L组和5.40 mmol/L组,在TG中为1.10-1.60mmol/
5、L组和1.60 mmol/L组。 对照组为血脂水平最低组,在TC中为4.40mmol/L组,在TG中为1.60 mmol/L组。暴露人群为一般人群;对照人群为内对照。,问题4 根据表3-1中的数据计算发病密度、RR、RR95%、AR、AR%,并填在表中。,18.8 33.5 36.2 18.9 29.0 41.2,问题5 解释上述各指标的含义,中、高TC水平组发生缺血性脑卒中的危险分别为低TC水平组的1.79(95%CI:1.27-2.51)及1.93(95%CI:1.38-2.70)倍。中、高TC水平组的人TC水平如果降低到4.40mmol/L,可以分别减少14.9(/10000人年)及17
6、.5(/10000人年)的缺血性脑卒中的发病。中、高TC水平组人群因较高TC水平而导致缺血性脑卒中的发病分别占总发病的44.1%及48.2%。 中、高TG水平组发生缺血性脑卒中的危险分别为低TG水平组的1.54(95%CI:1.09-2.17)及2.18(95%CI:1.58-3.02)倍。中、高TG水平组的人TG水平如果降低到1.10mmol/L,可以分别减少10.2(/10000人年)及22.3(/10000人年)的缺血性脑卒中的发病。中、高TG水平组人群因较高TG水平而导致缺血性脑卒中的发病分别占总发病的35.1%及51.8%。,课题二(P27),问题1 该研究的研究设计是什么?判断依据
7、是什么?这一研究设计与课题一的研究设计有何区别和联系?,该研究为回归性队列研究 判断依据为从调查开始的时点开始,往前收集确定暴露水平信息,研究对象是在过去某个时间进入队列的,之后对人群进行一段时间随访后,确定结局事件是否发生的时间顺序。仍旧是从因到果。 区别:1、资料收集的时间顺序上有所不同; 2、收集信息准确性前瞻性要比回顾性更准确; 3、回顾性开展比前瞻性的更方便,省时省力。 联系:研究设计类型相似,都是暴露在前,结局在后,从因及果。,问题2 该研究的研究假说、暴露因素和结局分别是什么?,研究假说:非职业性环境接触青石棉环境污染可能增加恶性肿瘤死亡的危险增加。 暴露因素:非职业性环境接触青
8、石棉。 结 局:恶性肿瘤,特别是肺癌、间皮瘤等的死亡发生,问题3 该研究的暴露组和对照组分别是什么?该研究的暴露人群属于什么人群?对照属于什么对照?,暴露组:有青石棉污染区的大姚县金碧镇的居民 对照组:无青石棉污染区的禄丰县金山镇的居民,该研究人群属于特殊暴露人群,对照属于外对照。 当选择职业人群或特殊暴露人群作为暴露人群时,不能从这些人群中选出对照, 需在该人群之外去寻找对照组,问题4 总结队列研究中暴露人群和对照人群的选择方法,各有何优缺点,暴露人群 职业人群:研究某种可疑的暴露因素与疾病或健康的关系,有关暴露与疾病的历史记录较全面、真实、可靠 特殊暴露人群:研究罕见的特殊暴露的唯一选择,
9、一般不允许进行前瞻性队列研究 一般人群:所研究的因素和疾病都是一般人群常见的,着眼于一般人群的防治,使得研究结果具有普遍性意义 4. 有组织的人群团体:一般人群的特殊形式,有组织,便于收集随访资料,职业和经历相似,具有可比性,对照人群 内对照:当研究变量为定量变量时,按暴露剂量分级,以最低暴露剂量水平人群为对照组,选定的研究对象既包含了对照组又包含了对照组,选取对照省事 外对照:当选择职业人群或特殊暴露人群为暴露人群时,需在该人群之外选择对照。优点是可以免受暴露组的影响但是寻找对照比较费力。 总人口对照:外对照的一种,也可看作不设对照。优点是资料容易获得缺点是资料比较粗糙,不详细,人群可比性差
10、。 多重对照:同时使用上述两种或两种以上的形式作为对照,减少便宜,增强结果的可靠性,但无疑增加了工作量。,问题5 体会两种类型的队列研究以及病例对照研究的区别和联系,相同点: 两种方法均属于队列研究,性质均为前瞻性,为分析性流行病学研究,均按照暴露与否进行分组。 二者的区别: 前瞻性队列研究的人群在现在按照暴露与否进入不同队列,而历史性队列研究的人群在过去某个时间进入队列; 前瞻性队列研究的结局需要追踪随访一定时间才能得到,而历史性队列研究的结局在研究开始时已发生; 前瞻性队列研究费时费力,历史性队列研究常利用现有档案资料进行分析,较省时省力。,表3-2 接触青石棉与各种肿瘤的发病情况,暴露组
11、与对照组的基本情况见表3-2,1)发病密度(ID):以观察人时为分母计算出的发病率,用于开放队列研究或者是封闭队列研究失访率较高时率的计算。,2)相对危险度(RR): 暴露组发病率与非暴露组发病率之比,RR表明暴露组发病或死亡的危险是非暴露组的多少倍,具有病因学意义。 RR=Ie/I0 3) 归因危险度(AR):又称为特异危险度,率差,超额危险度,是暴露组发病率与非暴露组发病率之差的绝对值。表示暴露因素的存在使暴露人群发病率增加或减少的部分。具有疾病预防和公共卫生学上的意义 AR=Ie-Io,4)归因危险度百分比(AR%):又称为病因分值(EF),指暴露人群中的发病或死亡归因于暴露的部分占全部
12、发病或死亡的百分比。 AR%=(IeIo)/Ie,问题6 根据表3-2中的数据计算RR、AR、AR%,填在表3-3中。,问题7 解释上述各指标的含义,以全肿瘤为例: Ie=(72/39430)10万/10万182.60/10万人年 Io=(60/48236) 10万/10万124.39/10万人年 RR= Ie / Io 1.47 表明接触青石棉人群发生全肿瘤死亡的危险性是不接触者的1.47倍。 RR95%CI=1.0445-2.0687 AR=Ie Io=58.21/10万人年 由于非职业性接触青石棉使暴露人群比未暴露时全肿瘤死亡的危险性增加58.21/10万人年 AR%= (Ie Io)
13、/ Ie 10058.21/182.60 100=31.88 说明在非职业性接触青石棉人群中,31.88的全肿瘤死亡是由于非职业性接触青石棉引起的。,课题三(P29),问题1 该研究的研究对象是什么?,问题2 为什么在选择研究对象时,要求肿瘤病例随访时间应1年?,要求肿瘤病例随访时间应1年的目的为了: 在研究BMI与肿瘤发病风险的时候,减少纳入研究开始便已经是肿瘤患者的研究对象,减少因果倒置的可能性。在研究BMI与肿瘤死亡关联的时候,确保对肿瘤病人有足够的随访时间,探讨肿瘤的生存率。,研究对象是开滦集团18岁的在职或退休职工,问题3 你认为该研究在研究对象的选择上是否存在问题?如有,你认为应该
14、如何选择研究对象,有,首先,对于肿瘤的研究对象来说,研究对象入选年龄可能偏小。在研究BMI与肿瘤发病关系的时候,应该排除研究开始时便已经有是肿瘤的病人,至少在计算发病的时候应该排除。 如果研究是在健康人基础上进行随访肿瘤发病,之后继续对发病病人随访到结局,这样研究的纳入标准可以一致。但应该设立排除标准。如果研究一开始同时研究BMI在健康人中发病的关系,以及在已经患有肿瘤病人中BMI与肿瘤死亡关系,则应该设立不同的纳入排除标准。,问题5 该研究属于何种流行病学研究?判断依据是什么?,前瞻性队列研究 判断依据:先确定暴露水平,随访一段时间后,观察结局是否出现的时间顺序,由因及果。,问题4 为什么要
15、对新发病例和死亡病例进行核实诊断?,确保研究结局信息的真实性和可靠性,避免信息偏倚,当观察时间长,难以保证人口稳定研究对象进入队列的时间可能先后不一; 在观察截至前,可能由于迁移他处、其他原因死亡或退出,造成失访; 研究对象出现终点结局的时间不同等原因均可造成每个对象的观察时间不一样。,问题6 该研究为什么要进行人年的计算?在什么情况下以观察人时为分母计算发病率,在什么情况下以观察人时为分母计算发病率,因为恶性肿瘤病人可能因为死亡而导致每个研究对象被观察的时间不一样,所以要进行人年计算。,人时的计算方法,(1)精确法:以个人为单位 精确但计算复杂,需要知道每个人的加入和退出时间 适用:样本不太
16、大时 (2)近似法:用平均人数乘以观察月(年)数得到总人月(年)数,计算简便,但不精确 适用:不知道每个队列成员进入和退出队列的具体时间 样本太大 对暴露人时精确性要求不高时 (3)寿命表法:当年进入队列的人作为1/2人年算,失访或出现结局的个人也作1/2人年算 适用:观察人数较多,要求有一定精度 计算简单,精确度较高,问题7 什么叫风险比(hazard ratio,HR)? HR有何含义?,风险比是暴露组/干预组与对照组发生结局事件风险的比值。 HR值的含义为暴露组/干预组发生结局事件的风险为对照组的多少倍。,问题8 为什么在cox比例风险回归模型分析BMI与肿瘤发病关系时,需要对其他变量进
17、行调整?这些调整的变量一般应具备什么特征?,因为可能存在混杂因素。 与暴露有关,与结局有关,不是暴露与结局的中间因素。,分层分析时指将研究人群根据某一特征分成互斥的两或多个层,在各个层中探讨暴露/干预与结局事件关联的一种分析方法。 分层分析可以探讨暴露/干预与结局的关联是否在各个层中一致,发现易感人群;可以控制混杂;也可以进一步提示研究的外推性范围。,问题9 什么叫分层分析? 为什么要做分层分析?,暴露组分别是超重和肥胖的研究对象 对照组是正常体重的研究对象 暴露人群属于有组织的人群团体 对照属于内对照,问题10 该研究的暴露组和对照组分别是什么? 暴露人群属于什么人群?对照属于什么对照?,问
18、题11 上述BMI与男性肺癌关系的aHR=0.59(95%CI=0.46-0.76)、肥胖与男性结直肠癌的aHR=1.39(95%CI=0.83-2.34)(P=0.139)、肥胖与女性乳腺癌的aHR=1.86(95%CI=1.05-3.31)(P=0.022),分别代表什么含义?,与正常男性相比,超重男性发生肺癌的风险为0.59(95%CI=0.46-0.76)倍,提示男性中与正常男性相比,超重为肺癌的保护因素。肥胖男性结直肠癌与正常对照组HR为1.39(95%CI=0.83-2.34),无统计学意义。与正常女性相比,肥胖女性发生乳腺癌的风险为1.86(95%CI=1.05-3.31)倍,提
19、示肥胖为女性发生乳腺癌的危险因素。,问题12 总结在队列研究中常用的评价疾病关联强度的指标有哪些?并解释其含义,相对危险度RR、归因危险度AR、归因危险度百分比AR%(病因分值EF)、人群归因危险度PAR、人群归因危险度百分比PAR% 1)相对危险度(RR): 暴露组发病率与非暴露组发病率之比,RR表明暴露组发病或死亡的危险是非暴露组的多少倍。 RR=Ie/I0 归因危险度(Attributable risk, AR),又称为特异危险度,率差,超额危险差,是暴露组发病率与非暴露组发病率之差。表示暴露可使人群比未暴露时增加的超额发病的数量。 AR=Ie-Io 3)归因危险度百分比(Percent attributable risk, AR%),又称为病因分值(Etiologic fraction, EF),指暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比。 AR%= (Ie Io) / Ie 4)人群归因危险度(Population attributable risk, PAR):全人群中由于暴露而导致的发病率增加。 PAR=It-IO 5)人群归因危险度百分比(PAR%):全人群中由于暴露引起的发病在全部发病中的比例。 PAR%=(It-IO)/ It100,作业:课题四 自学:课题五,