1、问题1 在你学过的统计方法中,对于不能痊愈在你学过的统计方法中,对于不能痊愈的慢性病治疗效果的考核可用什么指标的慢性病治疗效果的考核可用什么指标和统计方法?和统计方法? (其结局都是死亡)(其结局都是死亡)引出新概念:生存时间 不仅要考察不仅要考察结局结局的好坏,还要考察经历的好坏,还要考察经历的的时间时间长短。长短。 对于能治愈疾病,看治愈时间的长短,对于能治愈疾病,看治愈时间的长短,对于不能治愈的疾病,看延长生存时间对于不能治愈的疾病,看延长生存时间的长短。的长短。问题2 采用随访研究可以研究生存时间,但此采用随访研究可以研究生存时间,但此时失访问题不可避免,怎么办?时失访问题不可避免,怎
2、么办? 例如例如,使用生存率(或有效率)指标,分使用生存率(或有效率)指标,分子是什么?分母是什么?子是什么?分母是什么?以3年生存率为例 3年期满的某病生存人数年期满的某病生存人数/期初某病观察期初某病观察总人数总人数 3年期满的某病生存人数年期满的某病生存人数/3年期满的某病年期满的某病观察总人数观察总人数 对象在期间失访如何处理?对象在期间失访如何处理?对上述对上述2个问题的解决办法个问题的解决办法p 应用一类对生存时间进行的统计分应用一类对生存时间进行的统计分析析生存分析:包括生存分析:包括1. 生存率估计(乘积极限法和寿命表法)生存率估计(乘积极限法和寿命表法)2. 生存率比较(生存
3、率比较(log-rank检验和检验和Breslow检验)检验)3. Cox模型模型第十七章第十七章生存分析生存分析第一节第一节 基本概念基本概念 在医学在医学, ,生物学研究中生物学研究中, ,常用到生存常用到生存分析分析 (Survival Analysis)(Survival Analysis)方法。例如方法。例如对于肿瘤等疾病的疗效及预后的考核对于肿瘤等疾病的疗效及预后的考核, ,通通常不用治愈率,有效率等表示,而用将常不用治愈率,有效率等表示,而用将来复发或死亡的时间长短表示来复发或死亡的时间长短表示, ,也即生存也即生存时间来表示。时间来表示。 所谓生存时间(所谓生存时间(survi
4、val timesurvival time)是)是指从某个标准时刻指从某个标准时刻( (如发病如发病, ,确诊确诊, ,开始治开始治疗或进行手术的时间疗或进行手术的时间) )算起至死亡或复发算起至死亡或复发为止的时间。为止的时间。 生存分析数据的三个特点:生存分析数据的三个特点:1.1.随访观察获得,同时考虑生存时间和生存结局随访观察获得,同时考虑生存时间和生存结局 2.2.有截尾数据(有截尾数据(censored data)censored data) 随访中未能知道病人的确切生存时间,只知随访中未能知道病人的确切生存时间,只知道病人的生存时间大于某时间。道病人的生存时间大于某时间。(1 1
5、)病人失访或因其他原因而死亡)病人失访或因其他原因而死亡-失访失访(2 2)到了研究的终止期病人尚未死亡)到了研究的终止期病人尚未死亡-终访终访截尾数据截尾数据可记为可记为t t+ +, ,如:如: 4 4+ + = = 生存时间大于生存时间大于4 4年。年。 虽然虽然截尾数据提供的信息是不完全的,但不截尾数据提供的信息是不完全的,但不能删去,因为这不仅损失了资料,而且会造成偏能删去,因为这不仅损失了资料,而且会造成偏性。性。3. 生存期的资料一般不服从正态分布。生存期的资料一般不服从正态分布。 由于上述原因,常用的统计方法不适用,而由于上述原因,常用的统计方法不适用,而要用特殊的统计方法。要
6、用特殊的统计方法。 生存分析是指对于生存时间这一指标进行分生存分析是指对于生存时间这一指标进行分析的一系列特殊的统计方法。析的一系列特殊的统计方法。例17-1 为了估计为了估计HIV(人类免疫缺陷病毒)阳性(人类免疫缺陷病毒)阳性患者的生存时间,某研究者进行了临床随访研患者的生存时间,某研究者进行了临床随访研究。研究对象是于究。研究对象是于2002年年1月月1日至日至2004年年12月月31日期间在某市确诊为日期间在某市确诊为HIV阳性者,随访这阳性者,随访这些对象直至死于些对象直至死于AIDS(艾滋病)或其并发症(艾滋病)或其并发症(status=1为死亡,为死亡,0为删失),研究截止日为删
7、失),研究截止日期为期为2008年年12月月31日。并记录每个研究对象日。并记录每个研究对象的性别(的性别(sex=1为男,为男, 0为女)、年龄(为女)、年龄(age,岁)、是否用药(岁)、是否用药(drug=1为用药,为用药,0为不用)。为不用)。表表17-1 10017-1 100名名HIVHIV阳性患者的生存时间(月)及阳性患者的生存时间(月)及其影响因素其影响因素 ID entdate enddate time sex age drug status 12004-10-72005-8-7100 27 1 1 22002-6-292002-7-29 10 47 1 0 32004-8-
8、22005-1-1 51 40 1 1 42004-4-52007-2-3341 37 0 1 52004-10-12004-10-31 10 33 1 1 62003-12-122004-1-11 10 42 1 1 72003-12-82008-9-5570 37 0 1 82003-2-142003-10-15 81 32 1 1 92002-1-102003-1-10120 37 1 0 10 2002-12-172004-7-15191 34 0 1 包括:包括:(1)(1)开始观察日期,终止观察日期开始观察日期,终止观察日期-生存时间生存时间(2)(2)结局(最终观察到的是死亡还是
9、存活)结局(最终观察到的是死亡还是存活) 死于该病死于该病-完全数据完全数据 存活或死于其他原因存活或死于其他原因-截尾数据截尾数据 每个生存期数据要用每个生存期数据要用2 2个变量表示:观察到的个变量表示:观察到的生存时间和是否截尾(如:用生存时间和是否截尾(如:用0 0表示截尾,用表示截尾,用1 1表示死亡;表示死亡;4 4+ + 用用4 4,0 0表示;表示;4 4用用4 4,1 1表示)。表示)。(3)(3)协变量协变量-各种影响生存期长短的因素。各种影响生存期长短的因素。随访资料的记录随访资料的记录-生存分析的数据生存分析的数据结构和要求结构和要求一、生存时间一、生存时间 是一个广义
10、的概念,是一个广义的概念,生存时间不一定专用于死生存时间不一定专用于死与活的情况与活的情况, ,生存时间生存时间( (存活时间存活时间) )可定义为从可定义为从某种起始事件到达某终点事件所经历的时间跨某种起始事件到达某终点事件所经历的时间跨度。度。 例如:例如:l 急性白血病病人治疗急性白血病病人治疗- -复发之间的缓解期复发之间的缓解期; ;l 冠心病病人在两次发作之间隔冠心病病人在两次发作之间隔; ;l 已作输卵管结扎的妇女从施行输卵管吻合手术后至受孕的时间间隔已作输卵管结扎的妇女从施行输卵管吻合手术后至受孕的时间间隔; ;l 在流行病学研究中在流行病学研究中, ,从开始接触危险因素到发病
11、所经历的时间;从开始接触危险因素到发病所经历的时间;l 住院到出院之间所花费的医疗费用;住院到出院之间所花费的医疗费用;l 从购买到失效期间某医疗设备被使用的次数;从购买到失效期间某医疗设备被使用的次数;l 从购买到第一次维修某车辆所行驶的总里程等。从购买到第一次维修某车辆所行驶的总里程等。l 结婚到离婚结婚到离婚l 投保投保( (人寿保险人寿保险) )到死亡到死亡l 开始戒烟开始戒烟( (毒毒) )到再次吸烟到再次吸烟( (毒毒) )l 。l 展开你的想象力,专业应用领域很广!展开你的想象力,专业应用领域很广! 结局(终点事件)的理解结局(终点事件)的理解l 死亡(生存)死亡(生存)l 复发
12、(白血病、第二次心肌梗死)复发(白血病、第二次心肌梗死)l 痊愈、好转痊愈、好转l 并发症(糖尿病的视网膜病变等)并发症(糖尿病的视网膜病变等)l 长出第一颗乳牙长出第一颗乳牙l 第一次来月经第一次来月经l 动物实验中发生肿瘤等动物实验中发生肿瘤等二、生存时间类型二、生存时间类型完全数据(完全数据(complete data)删失数据(删失数据(censored data,截尾数据)截尾数据) 随访研究示意随访研究示意(完全数据与截尾数据完全数据与截尾数据)观察起点观察起点观察终点观察终点5 6123 4 起点事件 终点事件 失访三、生存时间图示三、生存时间图示四四. . 生存率生存率(Sur
13、vival Rate)(Survival Rate) 又称为生存函数又称为生存函数, ,它表示一个病人的生存它表示一个病人的生存时间长于时间时间长于时间t t的概率的概率, ,用用S(tS(t) ) 表示:表示: s(ts(t)=P)=P(T T t t) 如如5 5年生存率:年生存率: s(5)=Ps(5)=P(T T 5 5) 如无删失数据,则生存率计算公式(17-3) 如有删失数据,则生存率计算公式(17-4) 式中pi(i=1,2,.,k)为各时段的生存概率。观察总例数时刻仍存活的例数ttTPtS)()(观察总例数时刻仍存活的例数ttTPtS)()(观察总例数时刻仍存活的例数ttTPt
14、S)()(观察总例数时刻仍存活的例数ttTPtS)()(kkkiptSpppptS*)(.*)(121生存率的计算生存率的计算五、死亡概率与生存概率五、死亡概率与生存概率 q 某 时 段 内 死 亡 人 数该 时 段 初 期 尚 存 活 的 人 数 P 某 时 段 内 存 活 人 数该 时 段 初 期 人 数1Pq 生存概率与生存率?生存概率与生存率? 下列关于生存概率和生存率的叙述,正确的是下列关于生存概率和生存率的叙述,正确的是 A二者均随时间增加而增大二者均随时间增加而增大 B二者均随时间增加而减小二者均随时间增加而减小 C生存概率是生存率的累积生存概率是生存率的累积 D生存率是生存概率
15、的累积生存率是生存概率的累积 E生存概率一定小于生存率生存概率一定小于生存率生存曲线 以生存时间为横轴,生存率为纵轴绘图,即所谓的Kaplan-Meier生存曲线生存曲线的绘制生存曲线的特征生存曲线的特征 它是一条下降的曲线它是一条下降的曲线, ,下降的坡度越陡下降的坡度越陡, ,表示生存率越低或生存时间越短表示生存率越低或生存时间越短, ,其斜率其斜率表示死亡速率。表示死亡速率。常见生存函数的类型示意六、风险函数(六、风险函数(hazard function) 风险函数表示一个生存到时间t的个体,在从t到 这一区间内死亡概率的极限,也就是一个生存到时间t的个体在时间t的瞬时死亡率(条件死亡速
16、率)。 tt0Pr( )limttTtt Tth tt 1( )iiitth tt死于区间 到内的病人数在 时生存的病人数 该区间包含的单位时间数风险函数图的意义风险函数图的意义 当用当用t t作横坐标作横坐标,h(t),h(t)为纵坐标所绘的曲线为纵坐标所绘的曲线, ,如递增如递增, ,则表示条件死亡速率随时间而增加则表示条件死亡速率随时间而增加, ,如平行于横轴如平行于横轴, ,则表示没有随时间而加速。则表示没有随时间而加速。常见风险函数的类型示意 风险函数的不同情况:风险函数的不同情况:常数,常数, 如:死于飞机失事。如:死于飞机失事。下降,下降, 如:意外伤害。如:意外伤害。先升后降,
17、先升后降, 如:交通事故。如:交通事故。上升,上升, 如:持续接触危险因素。如:持续接触危险因素。澡盆样,澡盆样, 如:人的一生如:人的一生。平均生存时间平均生存时间 由于生存时间的分布总是偏态的,故平由于生存时间的分布总是偏态的,故平均生存时间常用均生存时间常用中位生存时间中位生存时间(median survival time)来计算,其意义是)来计算,其意义是50的个体存活且有的个体存活且有50的个体死亡的时间,的个体死亡的时间,也即生存率为也即生存率为50时在生存曲线中所对时在生存曲线中所对应的生存时间。应的生存时间。 (1)估计生存函数及其他相关指标。)估计生存函数及其他相关指标。(2
18、)比较各组的生存函数。)比较各组的生存函数。(3)研究影响生存期长短的因素。)研究影响生存期长短的因素。(4)预测不同个体的预后。)预测不同个体的预后。生存分析目的与用途生存分析目的与用途第二节第二节 生存分析的统计方法生存分析的统计方法 非参数方法非参数方法 参数方法参数方法乘积乘积-极限法极限法 指数分布指数分布(又称又称Kaplan-Meier法法) Weibull分布分布寿命表方法寿命表方法 Gamma分布分布 logistic分布分布 对数正态分布对数正态分布 。 Kaplan-Meier法法 又称又称:乘积极限法乘积极限法( product-limit,PL法法)P(Tt)=S1S
19、2St 从随访开始到生存时间长于t年的生存率为:式中Si表示已生存表示已生存ti-1年条件下再生存一年年条件下再生存一年到达到达ti年的条件概率。年的条件概率。计算生存率 例17-2(P307)i表表17-4 17-4 甲种手术方式的生存率与标准误甲种手术方式的生存率与标准误生存曲线 以生存时间为横轴,生存率为纵轴绘图,即所谓的Kaplan-Meier生存曲线图 两组手术方式生存概率(Kaplan-Meier)曲线补充说明补充说明生存率的可信区间估计(正态近似法)100(1-)可信区间为: i/2iS( )S ttuSE平均生存时间 由于生存时间的分布总是偏态的,故平由于生存时间的分布总是偏态
20、的,故平均生存时间常用均生存时间常用中位生存时间中位生存时间(median survival time)来计算,其意义是)来计算,其意义是50的个体存活且有的个体存活且有50的个体死亡的时间,的个体死亡的时间,也即生存率为也即生存率为50时在生存曲线中所对时在生存曲线中所对应的生存时间。应的生存时间。 两种计算方法:图解法和线性内插法两种计算方法:图解法和线性内插法 图解法(使用图解法(使用spss生存率图编辑来说明生存率图编辑来说明其结果)其结果) 线性内插法:取线性内插法:取2个相继生存率,使得一个相继生存率,使得一个大于个大于0.5,一个小于,一个小于0.5,然后,以表,然后,以表17-
21、4为例计算甲组中位生存时间。为例计算甲组中位生存时间。 (8-10)/(8-百分位数百分位数)=(0.5652-0.4783)/(0.5652-0.50), t=9.50(月月)图 平均生存时间示意(Kaplan-Meier估计)生存率 寿命表法(lifetable method) 不作要求! 寿命表法计算生存率的基本原理是将整个随访时间划分为若干个时间区间,分别计算每个时间区间开始时的观察个体数、死亡数和失访数,进而计算每个时间区间的条件死亡率 和条件生存率 。根据概率的乘法原理,t时刻的生存率 为t时刻前各时间区间条件生存率的乘积。 1iiF t t1iiS t t iS tP310例17
22、3 不作要求!非参数方法非参数方法 参数方法参数方法时序时序(log-rank)检验检验 分布参数检验分布参数检验分层分层时序时序检验检验Gehan检验检验(广义广义Wilcoxon检验检验)Mantel-Haenszel检验检验logrank 检验检验 P311 例例174 H0: 两组生存过程相同 H1: 两组生存过程不同例甲、乙两种手术方法生存过程的例甲、乙两种手术方法生存过程的log-ranklog-rank检验计算表检验计算表 ti 死亡数死亡数 期初病例数期初病例数 理论死亡数理论死亡数 合计合计甲组甲组乙组乙组 甲组甲组 乙组乙组 Time dnin1i n2id*nA/n d*
23、nB/n1 34323201.6047 1.39532 14022180.5500 0.45003 33922171.6923 1.30774 3362115 . .5 3332112 . .6 5301812 . . 44 12 2 0 . .59 11 1 0 . .合计 23.809 12.191 死亡 存活 合计 甲组 1 22 23 乙组 2 18 20合计 3 40 43Ta=233/43=1.6047 死亡 存活 合计 甲组 0 22 22 乙组 1 17 18合计 1 39 40Ta=221/40=0.5500 死亡 存活 合计 甲组 1 21 22 乙组 2 15 17合计
24、3 36 39Ta=223/39=1.6923log-rank test 假设两组生存过程相同时 实际死亡数 理论死亡数甲组甲组 16 23.809乙组乙组 20 12.191 P0.01 可以认为两组的生存过程有差别。甲、乙两种疗法的生存率不同。22()7.56A TT 假设,我们再按年龄分组,例如,大于假设,我们再按年龄分组,例如,大于等于等于60和小于等于和小于等于60分为两组,进行分为两组,进行log-rank检验,也得到了一个小于检验,也得到了一个小于0.05的的P值,那么,这个研究是否可以得到两值,那么,这个研究是否可以得到两个结论,手术方法和年龄与生存有因果个结论,手术方法和年龄与生存有因果关系呢?以此类推,还可以对性别、疾关系呢?以此类推,还可以对性别、疾病分期分别进行研究,是否可以做出结病分期分别进行研究,是否可以做出结论呢?论呢?生存资料基本要求生存资料基本要求