医科大学精品课件:生存分析(研).ppt

上传人(卖家):金钥匙文档 文档编号:443585 上传时间:2020-04-07 格式:PPT 页数:91 大小:5.16MB
下载 相关 举报
医科大学精品课件:生存分析(研).ppt_第1页
第1页 / 共91页
医科大学精品课件:生存分析(研).ppt_第2页
第2页 / 共91页
医科大学精品课件:生存分析(研).ppt_第3页
第3页 / 共91页
医科大学精品课件:生存分析(研).ppt_第4页
第4页 / 共91页
医科大学精品课件:生存分析(研).ppt_第5页
第5页 / 共91页
点击查看更多>>
资源描述

1、19 生存分析,医学研究中,很多时候不仅需要分析疾病的结局状态如何,还需要分析达到该结局状态的所用时间。,引子:,例:为研究膀胱肿瘤患者手术后生存的影响因素,某医院泌尿外科医师选择 1996-2000 年间手术治疗的膀胱肿瘤患者30例进行了随访研究,截止日期2000年12月30日。期间通过查阅病历,电话和信访的方式调查了可能影响患者术后生存的因素,获得其生存结局情况(死亡与否)。,年龄:(岁) 肿瘤分级:I级=1;II级=2;III级=3 肿瘤大小/cm:3cm=1;3cm=2 是否复发(未复发=0;1=复发) 手术日期(月/日/年) 终止观察日期(月/日/年) 生存时间/月 生存结局(生存或

2、删失= 0;死亡= 1 ),影响因素/ 协变量,生存时间(time),结局事件(status),表19-2 30例膀胱肿瘤患者生存资料的原始记录表,三要素:,1. 生存时间(survival time) 从规定的观察起点到某一特定终点事件出现的时间长短。,终点事件,生存时间,观察起点,合格的 研究对象,出现结果 尚未出现结果 失访、脱落,随访研究(follow-up study)示意图,随机对象的临床试验研究:,时 间,研究截止时点 2000/12/30,死于冠心病,生存时间,2. 随访研究产生数据的类型:,完全数据: 在规定的观察期内,对某些观察对象观察到了终点事件发生,从起点到终点事件所经

3、历的时间,称为生存时间的完全数据(complete data)。 用符号“ t ”表示。 删失数据(截尾数据): 规定的观察期内,对某些观察对象,由于某种原因未能观察到病人的终点事件发生,并不知道其确切的生存时间,就象病人生存时间在未达到规定的终点就被截尾一样,称为生存时间的删失数据,又称截尾数据。 用符号“ t+ ”表示。,产生删失数据的常见原因有: 研究结束时终点事件尚未发生; 失访; 死于其它原因; 由于严重药物反应而终止观察或改变治疗措施。,特点:,同时考虑结局和生存时间两个因变量; 可处理生存时间分布不正态的问题; 可处理删失数据。,生存分析(survival analysis):将

4、终点事件和出现终点时间所经历的时间结合起来分析的一类统计分析。,生存分析简史:,1972年Cox提出比例风险模型( Proportional Hazard Model ),即Cox回归,已成为生存分析的标准统计方法。,16561742年寿命表;,1958年Kaplan-Meier提出刻画生存时间分布的乘积极限法;,1966年用Log-rank检验法可实现对生存曲线的组间比较;,生存率、死亡率、中位生存时间,生存曲线、中位生存时间,组间比较的假设检验 单因素分析,单因素分析及多因素分析,生存分析的作用: 以膀胱肿瘤患者术后生存的影响因素的随访资料分析为例,估计:根据样本生存资料,估计总体不同时间

5、生存率、生存曲线及中位生存期等; 比较:对不同特征组患者的生存状况进行比较,通过Log-rank 检验等,了解某因素与患者预后的关系。 影响因素分析:用Cox回归等方法,研究患者生存的影响因素;或调整某混杂因素后,研究某因素对生存的影响。 预测:对具有不同因素,水平的个体进行生存/预后预测。,回归分析,1个因变量Y,1个自变量X,2个以上自变量X,Y是数值变量,Y是分类型变量,常用的回归分析中分类:,19.1 概 述 。 19.2 生存率的估计 。 19.3 生存曲线的比较 。 19.4 Cox比例风险回归模型,19.1 生存分析的基本概念,针对单位时间的, 死亡概率(probability

6、of death):表示某单位时段开始存活的个体,在该时段内死亡的可能性;如年死亡概率。,年内有删失,则分母用校正人口数: 校正人口数 = 年初人口数删失例数/2,计算: 年内没有删失数据, 生存概率(probability of survival) :单位时段开始 时存活的个体,到该时段结束时仍然存活的可能性。, 生存率(survival rate) :0 时刻存活的个体经历 tk时个单位时间段后仍存活的可能性。,若资料中无删失数据时:,解:1. 各年生存概率 p1 = ( 5010 )/50 =0.80 p2 = ( 4010 )/40 =0.75 p3 = ( 3010 )/30 =0.

7、67 2. 3年生存率 S(3)=P(T3)=(5030)/50= 0.4 = p1 p2 p3,【举例】手术治疗50例肺癌病人,术后1,2,3年的 死亡数分别为10,10,10例,无截尾数据。试求各年的生存概率和3年生存率。,故生存率又称为累积生存概率(cumulative probability of survival ),它是随着时间的变化而变化 着的,是关于时间的函数,称为生存函数(survival function)。,若资料中有删失数据,则须分段计算生存概率,再应用概率乘法定理将分时段的生存概率相乘得到生存率:,区分:生存率生存概率 生存概率是针对单位时间而言的; 生存率是针对某个

8、较长时段的,是生存概率的累计结果。, 风险函数(hazard function) : t 时刻存活的个体在t 时刻的瞬时死亡率。,h(t)近似地等于t 时刻存活的个体在此后一个单位时段内的死亡概率。,生存期的四分位数间距: QP75-P25 是反映离散程度大小的指标。,中位生存期及四分位数间距,中位生存期(median survival time) :也称半数生存期,是生存时间中位数(M/P50),表示恰有50%的个体存活的时间,即生存率为50时对应的生存时间,是描述集中趋势的指标。 中位生存期越长,表示疾病的预后越好。,生存分析的基本步骤:,1.刻画生存时间的分布: 估计生存率(生存函数)、

9、 生存曲线,3.评价生存时间分布影响因子的效果,2.生存时间分布的组间比较,在不考虑其它混杂因素的情况下,利用寿命表法和Kaplan-Meier 法作生存时间的组间比较,拟合Cox回归模型等评价生存时间分布与多个影响因子之间的关系。,Log rank 检验,19.2 生存率的估计,估计生存率,大样本资料,已经整理成频数表: 用寿命表法,原始数据(小样本资料): 用Kaplan-Meier法,或称乘积极限法(product limit method)。,绘制生存曲线,19.2.1 寿命表法(life table method),例21-1 收集374名某恶性肿瘤患者的随访资料,取时间区间均为1年

10、,整理结果见下午表,试估计各年生存率。,【案例解析】,研究目的:生存分析,制作生存曲线; 资料特点:大样本已整理成频数表资料; 生存时间粗略且含有删失数据,寿命表法,1. 计算期初有效例数,注意删失数据 期初有效例数=期初病例数-期内删失数/2 2. 计算死亡概率、生存概率 死亡概率=期内死亡数/期初有效例数 生存概率=1-死亡概率 3. 计算生存率。 4. 作生存曲线。,步骤:,寿命表法,寿命表法曲线为折线。 该法只估计时段右端点的生存率,省略了时段内的生存率估计。,恶性肿瘤患者确诊后5 年内生存率下降较快,5 年后下降较平缓,说明确诊5年内该恶性肿瘤患者的死亡威胁较大。,中位生存期,【电脑

11、实现】 SPSS,1.数据录入:频数形式,生存分析寿命表法,【Time 】 生存时间(年) 【 Status 】0:删失数据 1:完全数据(死亡) 【 Freq 】频数,2. 加权,3. SPSS过程,4. 结果及结果输出:,19.2.2 乘积极限法kaplan-meier法,例19-2 按下表数据,14例膀胱肿瘤3.0cm患者和16例膀胱肿瘤3.0cm患者的生存时间(月)如下,试估计两组生存率。,【案例解析】,研究目的:生存分析,制作生存曲线; 资料特点:小样本/原始数据;含有删失数据,步骤:,乘积极限法kaplan-meier法,将生存时间由小到大依次排列, 在每个时间区间上,计算死亡人数

12、、删失人数、期初人数、死亡概率、生存概率和生存率。 作生存曲线。,Kaplan-Meier法生存曲线为阶梯形曲线。,【电脑实现】 SPSS,1.数据录入,生存分析Kaplan-Meier,【 Group 】 1: 3.0cm;2: 3.0cm 【 dtime 】 生存时间(月) 【 Status 】0:删失数据 1:完全数据(结局事件),2. SPSS过程,3. 结果及结果输出:,19.3 生存曲线的比较 (Log-rank 检验),【例19-3】 比较上例中膀胱肿瘤3.0cm患者和肿瘤3.0cm患者的生存曲线,就总体而言,两个生存函数是否有差别?,19.2.2 乘积极限法kaplan-mei

13、er法,例19-2 按下表数据,14例膀胱肿瘤3.0cm患者和16例膀胱肿瘤3.0cm患者的生存时间(月)如下,试估计两组生存率。,Log-rank检验:,作用:通过 检验对两组或多组生存曲线是否存在差异作出假设检验; 与普通 检验不同的是:它能充分利用生存时间(包括删失数据),而且能对各组的生存率作整体的比较; 其检验统计量近似地服从自由度为(组数-1)的 分布;若作两条生存曲线的差异性比较,自由度是 1, 。,检验过程:,【注意事项】 Log-rank检验可用于整条生存曲线的比较,也适用于寿命表资料及多组生存率间的比较; Log-rank检验属于单因素分析方法,其应用条件是除比较因素外,影

14、响生存率的各混杂因素在不同的组间均衡。否则,可采用Cox回归。 可计算两组死亡的相对危险度(relative ratio,RR),肿瘤3.0组对肿瘤3.0组:,意义:肿瘤3.0组的死亡风险是对肿瘤3.0组的2.69倍。,小结:,生存分析和资料的特点:有结局事件status、有生存时间time,还要考虑删失数据; 计算生存率:不能直接去计算,要考虑删失的数据;通过乘积极限法去计算,如果样本量大,则可用寿命表的方法。 两个生存曲线的比较:Log-Rank或说时序比较的方法,它是用 统计量来比较实际数据与理论数据之间的差异。,19.4 Cox比例风险回归模型,表19-2 30例膀胱肿瘤患者生存资料的

15、原始记录表,例:30例膀胱肿瘤患者的随访记录 ,欲作患者术后生存的影响因素分析。,1972年英国伦敦大学的Cox于提出的Cox回归模型:它以生存结局和生存时间为因变量,不要求资料服从特定的分布类型;能分析带有删失数据的资料,可实现多因素对生存的影响分析。,Cox回归模型的基本思想: 在风险函数与影响因子之间建立起类似于广义线性模型的关联,从而分析多个影响因子对生存状况的影响效果。,风险函数(hazard function) : t 时刻存活的个体在t 时刻的瞬时死亡率。,h(t)近似地等于t 时刻存活的个体在此后一个单位时段内的死亡概率。,2. Cox的模型结构:,h( t ):表示t 时刻存

16、活的个体,在协变量X1、X2、Xp的作用下,在t 时刻之后的一个单位时间内的死亡概率(风险率); h0( t ):基准风险函数(baseline hazard), 表示当X1=0、X2=0、Xp=0时,个体在t 时刻基准死亡率(风险率); i:各协变量的回归系数,需由样本资料作出估计。,2. 模型解释:任两个群体风险函数之比,即风险比 (risk ratio, RR或hazard ratio,HR)或相对危险度(RR),或,j的实际意义:在其他自变量固定不变的条件下,变量Xi每增加一个单位所引起的风险比的自然对数。 RRi的实际意义:在其它协变量不变的条件下,变量Xi每增加一个单位所引起的风险

17、比或相对危险度。,Cox回归模型拟合的基本步骤:,估计参数:0、 1、 2、 i,COX回归方程的假设检验,统计应用,部分似然估计,列出回归方程,回归系数的区间估计,1. 预测阳性事件的风险概率 2. 分析影响因素,定量描述其作用,举例: . 30例膀胱肿瘤患者的随访记录,试进行患者生存情况的影响因素分析。 。,【电脑实现】 SPSS,1.数据录入,生存分析Cox analysis,2. SPSS过程,3. 结果及结果输出:,列出Cox回归方程(风险函数表达式):,预后指数(Prognostic indes,PI):其取值越 大,则风险函数的取值越大,预后越差。,结果报告:,膀胱肿瘤死亡的影响

18、因素分析的多变量Cox回归的结果见下表示,结果表明:肿瘤分级(RR=5.367,95%CI 2.540 11.340,P0.001)、肿瘤大小(RR=2.939,95%CI 1.193 7.242,P=0.019) 、以及是否复发(RR=2.262,95%CI 1.080 6.560,P=0.033)与死亡有关。,Cox 回归的基本假定是比例风险假定(PH假定),即模型中的自变量效应不随时间而改变。 只有在满足该假定前提下,基于此模型的分析预测才是可靠有效的; PH假定的判断,最简单的是观察Kaplan-Meier生存曲线。,三、Cox 回归中PH假定及判断方法,Cox 回归中PH假定的判定方

19、法(1),Cox 回归中PH假定的判定方法(2),19.5 结果报告,结果报告:,生存率的估计:报告生存率估计方法、生存曲线及中位生存期,生存曲线比较:报告生存曲线、生存曲线的比较方法、检验统计量及其P值。,影响因素分析:报告变量筛选方法、检验水准、各变量RR值、RR值的95%置信区间及其P值。,附图:肿瘤3.0cm组和3.0cm组生存曲线 (K-M法),以Kaplan-Meier法估计肿瘤3.0cm组和3.0cm组的生存率,生存曲线如图1所示。其结果显示 :两组中位生存期分别为20个月和36个月;经log-rank检验, 两条曲线的差别有统计学意义,肿瘤3.0cm组的生存率高于肿瘤3.0cm

20、组的。,结果报告1:,结果报告2:,膀胱肿瘤死亡的影响因素分析见附表示,经多变量Cox比例风险回归分析显示,肿瘤分级(RR=5.367,95%CI 2.54011.340,P0.001)、肿瘤大小(RR=2.939,95%CI 1.1937.242,P0.02),以及是否复发(RR=2.662,95%CI 1.0806.560,P0.05)与死亡有关。 .,小 结,生存分析是将终点事件和达到终点事件所经历的时间结合起来分析的一种统计学方法,可用于生存率的估计、生存曲线比较、影响因素分析和生存预测。 生存曲线的非参数估计方法和寿命表法和Kaplan-Meier法,前者适用于大样本的分组资料;后者

21、适用于小样本或大样本未分组资料,两者均利用概率乘积法定理计算生存率。 Log-rank检验是两条或多条生存曲线比较的非参数方法之一,因其能对各组生存曲线作整体比较,实际工作中应用研究较多。 Cox模型属比例风险模型、乘法模型;Cox可用于影响因素分析、校正混杂因素后的组间比较以及多因素生存预测。,回归分析,简单线性:,多重线性:,logistic回归,线性回归,只1个X: (简单),多个X:,Cox回归,区分多重线性回归、logistic回归和Cox回归的异同。,案例分析(一),某医师收集30例肺癌术后患者的生存情况,有1例由于电话和地址错误无法随访到患者,他设计了以下几种处理方法: 把该病例

22、去掉; 把这例患者写入SPSS数据,但末次随访时间空白,让SPSS自动去分析; 因为某一天(比如2006年9月1日)想随访这例患者但是没有随访到,所以将末次随访时间写为随访当天的日期。另欲分析肺癌术后患者的中位生存期,计算结果为10个月,但是检查原始数据发现,生存时间为10个月的这个患者一直存活到随访结束,似乎与中位生存期的定义相矛盾。 .,请问: (1)该医师对这例失访患者的处理是否恰当?为什么?正确的处理方法是什么? (2)另有1例患者死于脑梗死,生存分析时应如何处理? (3)该医师的发现是否与中位生存期的定义相矛盾?为什么?.,答案: (1)该医师对这例失访患者的三种处理都不恰当。应作为

23、删失病例,删失生存时间的计算为从手术切除到最后一次随访的时间。 (2)死于脑梗死的病例同样应当作为删失病例。死于脑梗死的病例应当作删失病例,删失生存时间的计算为从手术切除到死于脑梗死的时间。 (3)属于概念不清而产生的怀疑。该医师的发现与中位生存期的定义并不矛盾,中位生存期不能与个体生存时间相混淆。,案例分析(二),评价A、B两种治疗方案对某病的治疗效果,A组(group0)12人,B组(group1)13人。患者分组后检查其肾功能(kidney),功能正常者记为0,异常者记为1。治疗后生存时间为time(天),生存结局status0表示删失,status1表示死亡。 .,甲医师以生存结局为观

24、察指标,整理得A、B两组死亡情况。考虑到例数较少,采用Fisher确切概率法,得P0.097,说明两种治疗方法疗效差别无统计学意义。,乙医师以生存时间为观察指标,考虑到肾功能是否异常为可能混杂因素,采用多重线性回归进行校正混杂因素后的组间生存时间比较,说明校正肾功能是否异常后,两种治疗方法疗效差别无统计学意义,与甲的结论一致。,请问: (1)甲医师和乙医师所采用的统计分析方法是否恰当?为什么? (2)针对原始数据和分析目的,指出正确的分析方法并说明理由。,案例辨析:甲医师和乙医师所采用的统计分析方法都不恰当。甲医师仅考虑生存结局,未考虑生存时间;乙医师仅考虑生存时间,未考虑生存结局,而且不该采用多重线性回归,因为生存时间并不服从正态分布。 正确做法:同时考虑生存结局和生存时间,采用Cox回归进行校正混杂因素后的组间比较。,THANK YOU!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(医科大学精品课件:生存分析(研).ppt)为本站会员(金钥匙文档)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|