1、疾病预后研究,prognosis analysis,叶力 公共卫生学院 流行病学与卫生统计学系,在临床诊断和治疗的实践中无时无刻都要遇到对疾病预后的估价,医生、患者及家属十分关切的问题: 将发生什么结果(定性)? 发生不良结局的可能性有多大(定量)? 什么时候会发生(定时)? 对预后问题的研究也主要围绕着这三方面来进行。 而回答这些问题不能仅凭医生的临床经验和主观推断,还必须有真实可靠的科学依据。,前言,疾病预后研究,概述 预后研究设计及其偏倚控制 预后评估常用指标 生存分析,一、概述,1、疾病预后的概念 2、疾病预后因素 3、疾病自然史 4、临床病程,是指预测某种疾病发生以后可能出现的各种结
2、局及其频率。在疾病发生后,对疾病未来病程和结局的一种预测。 A prognosis is an estimate of the future of someone or something, especially about whether a patient will recover from an illness. 疾病在治疗后的转归:存活(survival)和死亡(death)两个结局。 存活者还可分为治愈、缓解、迁延、慢性化、恶化、复发、残疾及发生合并症等结局。,1. 疾病预后 (Prognosis),预后研究的意义(Significance of prognosis): (1)了解或
3、者明确各种疾病的发生、发展的规律性 以及判断各种不同结局发生的可能性; (2)研究影响疾病预后的各种因素 ; (3)用于正确评价治疗措施的效果,7,2、疾病预后因素,预后因素的概念 (prognosis factor) 能预测或改变疾病结局的发生时间与概率的因素,广义上,包括影响疾病结局的一切因素。,预后因素的种类,疾病本身特征 患者的机体状况 医疗条件,患者及医护人员的依从性 早期诊断、早期治疗 患者、家庭、社会因素,Factors that affect the prognosis of a desease are called prognostic factors,8,预后因素与危险因素
4、的区别 (1)危险因素 指能增加患某病危险的条件。即指健康人群中可使患病危险性增加的条件。 (2)二者区别 危险因素:健康 患病 预后因素:患病 结局,2、疾病预后因素,9,例:急性心肌梗死的危险因素和预后因素之间的差别,年龄 年龄 男性 女性 高血压 低血压 吸烟 吸烟 胆固醇 梗死部位 糖尿病 充血性心衰 室性心律不齐,健康 急性心梗发作 结局:死亡、恢复、心绞痛等。,预后因素,危险因素,一致,相反,相反,一致,2、疾病预后因素,疾病自然史(natural history of disease) 是指在不给任何治疗或干预措施的情况下,疾病从发生、发展到结局的整个过程。,3、疾病自然史,Th
5、e natural history of disease is the course a disease takes in individual people from its pathological onset until its eventual resolution through complete recovery or death.,四个时期 起始期 临床前期 临床期 结局发生,痊愈,死亡,病残,(initial stage),(subclinical stage),(clinical stage),(outcome ),疾病自然史的意义:早期诊断、早期治疗疾病,改善疾病的预后;判
6、断治疗效果,即预后的好坏;一些尚无有效治疗措施的疾病,Knowledge of the natural history of disease ranks alongside causal understanding in importance for disease prevention and control. Natural history of disease is one of the major elements of descriptive epidemiology,疾病自然史(natural history of disease),临床病程(clinical course)是指疾
7、病的临床期,即首次出现临床症状和体征一直到最后结局所经历的全过程,其中可经历各种不同医疗干预措施。 临床病程vs自然史 自然史是指从发生疾病到出现疾病结局的全过程,临床病程仅指其中的临床期;自然史无医疗干预措施,而临床病程伴有医疗干预措施。 在预后研究中,主要是研究临床病程及何种医疗干预措施能改变临床病程、改善预后。,4. 临床病程,设计类型 队列研究、病例对照研究、实验研究 实施步骤 常见偏倚及其控制,二、预后研究的设计方案及其偏倚控制,2.1 设计类型,疾病预后研究包括预后的评定及预后因素的研究。疾病有多种转归,转归又受多因素的影响,因而预后研究是多因多果的。 可选择研究因果关系的设计方案
8、,包括队列研究、病例对照研究、实验研究等。,1. 队列研究(cohort study)- 最优设计方案。,图91 队列研究示意图,a,b,c,d,研究方向:,暴露 疾病 人数,队列研究(cohort study) 应用于预后研究有以下优点: 可以追踪一个或多个队列; 在随访过程可观察多种类型疾病转归; 可同时论证多因多果的联系; 记录客观,论证力强。 队列研究的局限为:随访时间要足够长; 失访问题,队列研究可以是前瞻性或回顾性,如果有多年定期健康体检资料,可进行回顾性队列研究,则可在短期内完成论证力强的队列研究成果,此法值得提倡。,队列研究,2. 病例对照研究(case control stu
9、dy),研究人群,病例,对照,病例暴露,病例未暴露,对照暴露,对照未暴露,现在,过去,该研究根据疾病的不同结局(死亡与痊愈,有无并发症)而将全部研究病例分为病例组和对照组(如死亡者为病例组,痊愈者为对照组),进行回顾性分析,追溯产生该种结局的有关预后因素。,2. 病例对照研究 (Case-Control Study),优点:节省时间、人力、物力、财力,不需要长期随访,适用于一些少见的慢性疾病。 缺陷和局限性:资料收集时存在回忆性偏倚;只能提供事件的比值比(odds ratio:OR),而不是相对危险度(relative risk: RR);检验预后因素对疾病预后是否有影响的效力较弱。 单纯应用
10、病例对照研究设计预后研究说服力不强。,3. 实验研究(Clinical Trials),将患者随机分为治疗组和对照组,给予相应的临床治疗,随访观察和比较各种疾病的结局。 优点:是研究治疗措施的金标准,也可以用于研究各种预后因素的效果,检验因果关系的能力最强。 缺陷和局限性:每次只能检验一种或极少数的预后因素;条件要求高,难度很大;对照组不采用治疗(安慰剂)或其他疗效不佳的药物,伦理学上难以通过。,疾病预后研究很难采用 随机临床试验(randomised clinical trials),影响预后的研究因素不可能按研究者的意愿进行随机分配。暴露因素存在与否是取决于自然。 例如研究类风湿因子对类风
11、湿关节炎预后的影响,类风湿因子存在与否,及浓度高低是病例入组时已存在的,研究者不可能将病人随机地分为阴性组和阳性组。,横断面研究(cross-sectional study) 难以胜任疾病预后研究,因为它是一次性获取全部研究资料,不能计算时间生存率,一般来说也难以验证暴露因素与结局之间的关系。 只有当暴露因素一旦出现,长久不变者,如血型、基因位点、某些微生物感染后出现的终身抗体等,而且是以患某一不可治愈性疾病为结局的研究,方可以用横断面研究策略来推断暴露因素与结局之间的关系。,2.2 预后研究的实施步骤,(1) 确定研究问题,(2) 确定研究设计类型,(3) 确定研究对象,(4) 确定样本量,
12、(5)资料收集,(1) 确定研究因素 (determination of prognosis factors),可以从科学研究文献查出该疾病的预后因素或从回顾性队列研究中发现预后因素,并通过描述性研究及病例对照研究,初步证明为预后因素。 在此基础上,选择这些因素作为研究的预后因素。,(2) 确定研究结局 (determination of disease outcome),疾病结局的判断应该采用盲法。 一般来说,对非常客观的疾病结局如死亡,因为容易判断,而不需要采用盲法。 但是对需要通过一定的临床分析才能判断的疾病结局(如不稳定性心绞痛、暂时性脑缺血发作、心肌梗死)和难以判断的疾病结果(残疾、
13、生命质量)需要采用盲法,由不知情的其他医生判断,以避免疑诊偏倚和期望偏倚。 要求建立统一、公认的判断标准,根据研究目的不同,所关心的疾病结局也不同。,(3) 确定研究起点 (determination of zero time),根据研究目的,确定研究起点,即在疾病病程中从什么时点开始对疾病进行追踪,该时点又称之为“零点”(zero time)。,疾病病程是影响预后的一个重要因素,疾病病程的早、中、晚期的预后差异悬殊。 预后研究的研究对象最好是处于临床疾病的早期阶段,至少应该选择在同一病程阶段的患者,预后研究的结果才具有真实性。 如中风的预后研究应只包括首次中风患者,而不是多次中风患者。当然,
14、根据研究目的不同,如果仅想了解疾病的晚期预后,应该收集同一晚期阶段的病人。,确定研究起点(determination of zero time),(4)确定研究对象(determination of research subjects),研究对象的来源要具有代表性,即能代表目标患者人群。 同一种疾病选择来自不同级别医院的病例,其预后研究结果可以不同; 来源于病情严重程度构成不同的患者人群作为研究对象,其研究结果也会有差异。,研究者对纳入的研究对象有公认的疾病诊断标准、明确的研究纳入标准和排除标准,才能使研究样本具有一定的代表性,才能代表所研究的疾病人群。 但从另一角度来说,如果排除标准过多,将
15、难以保证足够的研究样本,并且推广性亦差,即外部真实性将受到影响。,(5)确定样本大小 (sample size),用公式计算(书本p117),两组率的比较,两组均数的比较,(6) 随访 (follow-up),研究对象的随访 研究对象失访过多,研究的真实性就会受到怀疑。保证随访成功是队列研究成功的关键之一。那么,究竟失访(lost to follow-up)多少会影响研究结果的真实性?具体到各种预后研究没有统一的答案。 一条建议:简单的“5和20规则”:失访5以下,产生的偏倚较小;大于20则将严重影响结果的真实性。,(7) 数据资料的收集和统计分析 (Statistical analysis)
16、 一般资料,暴露因素,结局,干扰因素,2.3 疾病预后研究中的 偏倚及控制,常见偏倚 (bias),零点偏倚(zero bias),零点是指被观察疾病的起点时刻。 零点偏倚:在疾病预后研究的随访过程中,不同的患者应用不同的随访起点,可影响研究结果的真实性,由此造成的偏倚称为零点偏倚。 所有被观察对象虽然不能同时发病,但是对每一对象观察的起始时刻应当是该疾病发展的同一起始阶段 控制:招募限制,尽可能统一观察的时间,集合偏倚(assembly bias),属于选择性偏倚范畴,指因不同来源病例集合造成的偏倚。包括患者的病程、病情和临床类型、是否合并其他疾病、患者的经济状况等,由于来源不同存在较大的差
17、异,而这些差异将对真实结果发生影响。,集合偏倚的控制,随机化(randomization) 限制(restriction),即增加排除标准,将已知存在混杂因素的对象不纳入研究,规定各比较组在人口学特征上近似或疾病特征上相同,把纳入研究对象限制在一狭窄特征范围内,以保证其一致性。 配对(matching):将某些影响预后的重要因素作为配对因素,使两组除研究因素外,其他对预后有影响的因素尽量相同,以此来消除混杂作用。 分层(stratification) 分析。它是一种最常用、最易检查有无偏倚的统计方法,尤其混杂性偏倚的方法。 多因素分析(multivariable analysis):是唯一能同
18、时调整多个变量的统计方法。目前在预后因素的分析中,采用此方法越来越多。,迁移性偏倚(migration bias),迁移性偏倚也是选择性偏倚的一种形式,指一个队列中的病人离开原有队列,迁移到队列或退出试验。如果发生的例数足够大,将影响预后结果的真实性。,测量性偏倚(measurement bias),一些客观、明确的疾病终点容易判断,如死亡、癌症等,很明确。 但是对于特殊死亡原因,亚临床疾病,副作用等,如果概念模糊,没有明确的判断标准,就容易出错,影响研究结果。 减少这类偏倚的方法:确保观察者的盲法;对结果事件的判断要有明确、仔细的尺度; 在研究的全过程中,对所有的病人要同样的方法去发现结果事
19、件。,失访偏倚(lost to follow up bias),指队列或实验性预后研究观察时间太长,研究对象因各种原因导致的流失。如退出、失去联系、其他原因造成的死亡等 “5和20规则” 控制:招募时选择依从性好的研究对象;各种补偿提高依从性,三 预后评估常用指标,Indicators of prognosis evaluation,疾病致死程度 病死率 (fatality rate) 疾病恢复情况 治愈率(cure rate) 缓解率(remission rate) 疾病结局构成 复发率(recurrence rate) 功能丧失率(disability rate) 致残率(disabili
20、ty rate) 生存情况 生存率(survival rate) 生存质量(quality of life),(书本p118-119),计算预后指标时,要注意的问题,1.生存率 适用于病程长、病情较重、致死性强的疾病的远期疗效观察。 2.病死率 适用于短时期、发生较大比例死亡的疾病。 3.治愈率 适用于病程短、不易引起死亡、疗效较为明显的疾病。,4.缓解率 适用于病程长、病情重、死亡少见但又不易治愈的疾病。 5.复发率 适用于病程长、反复发作、不易治愈的疾病。 6.致残率 适用于病程长、病死率低、病情重又极难治愈的疾病。,计算预后指标时,要注意的问题,随访期限应有明确的观察期限,或全部观察对象
21、出现某种结局为止; 明确记录终止随访的原因,如病人出现失效事件或失访; 明确各指标计算的起点,上述各率的计算,都应规定将病程的某一点作为零点; 两个率或多个率进行比较时必须在同质的情况下进行。,计算预后指标时,要注意的问题,生存分析 survival analysis,是对预后进行评价中,不仅要了解疾病的最终结局,还要了解在观察期内不同时间患者的变化情况,将两者综合考虑进行分析,用以反映疾病在不同时期的预后情况。是目前进行疾病预后研究的主要方法之一。,生存分析,survival analysis,48,四 生存分析,生存分析的基本概念和特点 生存率的计算方法 生存率的比较 疾病预后因素的分析方
22、法,1、生存分析的基本概念和特点,生存分析: 同时分析暴露因素对结局发生的风险及其发生时间两个变量的影响,称为生存分析,Survival analysis is a branch of statistics for analyzing the expected duration of time until one or more events happen, such as death in biological organisms and failure in mechanical systems.,(1)生存时间 (survival time):狭义的生存时间是指从观察开始到观察对象死亡所
23、经历的时间; 广义的生存时间是从规定观察起点到某一特定终点事件出现所经历的时间。生存时间由三个要点确定,即观察起点、终点事件和时间度量。 (2)完全数据 (completed data)和截尾数据 (censored data) 生存时间按在研究期内是否观察到终点事件将资料分为完全数据和截尾数据。完全数据是观察到终点事件出现;而截尾数据则没有观察到终点事件(失访、退出、人为终止观察等)。,1、生存分析的基本概念和特点,出现结局,研究开始,研究结束,零点时间,删失,2、生存资料收集的内容及特点,开始观察日期 终止日期 结局 相关的研究因素等,常存在截尾数据 效应变量有两个,生存资料收集的内容,生
24、存时间资料的特点,生存时间 结局,53,3、生存率的计算方法,常用的生存率计算方法有三种: (1)直接法:又称粗生存率法 (raw survival rate) 公式: 应用:直接法计算生存率简便,在病例较多时误差不大,但例数少时会出现后一年比前一年生存率高的不合理现象,这种方法获得资料效率低,目前该方法已经不再推荐使用。,(2)Kaplan-Meier分析法 是用概率乘法定理估计生存率,故又称为乘积极限(product-limit)法。 应用: 生存时间未分组的连续变量资料;该方法适合于小样本和大样本,可充分利用截尾数据,也不需要对被估计的资料分布做任何假定。随访观察的时间单位越小,估计的精
25、确性越高。,3、生存率的计算方法,表9-1 急性白血病某疗法生存率与标准误,3、生存率的计算方法,生存率标准误计算:计算公式如下,3、生存率的计算方法,本例计算P(x7)的95%CI=0.8071.960.0870=(0.6365,0.9775)。 由此可知急性白血病A疗法7周生存率的95%可信限为0.63650.9775。,生存率曲线 (Kaplan-Meier curves): 它是以时间t为横轴,生存率P(Xt)为纵轴,可直观地对某一病例任意时刻的生存率做出估计,其生存曲线称Kaplan-Meier曲线。如有两种或以上疗法,可再画一条或数条曲线以作比较。见图9-2 。,3、生存率的计算方
26、法,图9-2 急性白血病A疗法生存曲线,3、生存率的计算方法,(3)寿命表法 (Life tables) 寿命表法:也称间接法,是利用概率论的乘法定律估计各个观察组在任一特定随访时期患者的生存率。 应用:寿命表法适用于(1)按随访时间分段(2)大样本(50)。可充分利用各种数据,例如在随访期间内的失访者,观察年限不到的病例与死于其他原因者(不是死于所研究的疾病)。,3、生存率的计算方法,寿命表法:条件概率法,最常用。根据概率论的乘法定律,先分别计算出各年的生存概率,将各年的生存概率相乘,即得出患者进入观察后活过各年的生存率(累积生存率),实例:某大学附属医院401例胃癌根治手术寿命表生存分析。
27、按年代分成两组,一组为1961-1969年(表9-2 )共计95例,另一组为1973-1982年(表9-3 )共计252例。,3、生存率的计算方法,表9-2 95例胃癌根治手术后生存率寿命表计算(19611969年),(5)=(4)1/2(2)+(3) (7)=(6)/(5) =1(7) (10)=(8)(5) (11)=(7)/(10) (13)=(9)(1 2) (10)(13)各年生存率标准误的计算过程,3、生存率的计算方法,表9-3 252例胃癌根治手术后生存率寿命表计算(19731982年),3、生存率的计算方法,3、生存率的计算方法,生存率曲线:以横轴为术后年数,纵轴为生存率(%)
28、作图,即可得出生存率曲线(见图9-4 )。,Log-rank检验(时序检验) 应用:可用来比较两个或多个生存率。 基本思想:检验分析实际死亡数与理论死亡数之间的差别意义大小。 步骤:用上例比较两个时期胃癌根治术的生存率(表9-4),生存率的比较,66,计算卡方值:X2=(D-T)2/T) 本例=(57-40.942)2/40.942+(87-103.105)2/103.105=6.298+2.516=8.814, X2X2 (0.01),即8.8146.63,自由度=1,P0.01 结论:根据检验可以认为两个时期胃癌根治手术的生存率有显著差异。,三、生存率的比较,(1)多元回归:又称协方差分析
29、,用于定量反应分析。 应用:对因变量是定量反应指标并存有多个自变量的资料,多元回归是预后因素分析最常用的方法。多元线性回归要求因变量与各自变量之间具有线性关系;各例观测值相互独立;因变量具有相同的方差,并且服从正态分布。,4、疾病预后因素分析的方法,(2)Logistic回归模型(Logistic regression model) 当把患者分为有反应及无反应的定性反应时,如治愈与未愈、生存与死亡、发病与未发病等。这类资料由于Y是二项分类,因此用多元线性回归分析是不合适的。此时可用多元Logistic回归模型进行分析。 应用: Logistic回归是一种适用于变量为二项分类的多因素曲线模型,现
30、在也已用于因变量为多项分类资料的分析。,四、疾病预后因素分析的方法,注意:在进行疾病预后因素的Logistic回归分析时,首先把治疗及每个因素进行赋值Xi。,(3)Cox模型 (Coxs model) Cox模型是以顺序统计量为基础,对生存时间的分布形式没有严格的要求,它可以允许存在“截尾”(censoring)数据以及随访时间迟早不一、随访时间长短不一及资料失访的数据。,四、疾病预后因素分析的方法,在Cox模型中,强调某患者生存到t时刻的死亡风险,函数hi(t)是基础风险,是函数h0(t)与预后因素函数f(X)的乘积 即:hi(t)=h0(t)exp(1Xi1+2Xi2+pXip), 此式经
31、自然对数转变后为: Ln(hi (t)/h0(t)=1X1+2X2+pXp。 模型参数为回归系数,其临床意义是,当预后因素Xj每改变一个测量单位时所引起的相对风险度的自然对数改变量。,四、疾病预后因素分析的方法,生存分析围绕着这样一个精神,有多种计算方法,如寿命表法、Kaplan-Meier法等可以计算生存率,并可画出生存曲线,一目了然地估计不同时间的生存率。 除了计算生存率,临床研究更重要的是比较各组间的差异,生存分析在此有独到之处。 国内许多临床研究论文只运用t检验或X2检验比较前后或某个点上两组间的区别。对于随访资料,这显然是不科学的。 生存分析可以比较两条或多条生存曲线间的区别,如采用Log-rank检验等。,具体的运算方法:可以请教统计学的老师,或参考有关的统计学和统计软件的教科书。 作为临床医生搞科研,至少必须知道该研究需要记录哪些资料和如何建立数据库。,thank you for your attention!,Thank you for your attention,