1、生存分析生存分析n掌握生存资料的特点掌握生存资料的特点n掌握生存分析中生存概率、死亡概率、生存率等掌握生存分析中生存概率、死亡概率、生存率等指标的计算方法及含义指标的计算方法及含义n熟悉生存曲线的比较方法熟悉生存曲线的比较方法n掌握生存分析掌握生存分析SAS结果的阅读和解释结果的阅读和解释目的要求:目的要求:n蕴涵有结局和时间两方面信息;蕴涵有结局和时间两方面信息;n结局为两分类互斥事件;结局为两分类互斥事件;n通过随访收集资料;通过随访收集资料;n常因失访等原因造成生存时间数据不完整,常因失访等原因造成生存时间数据不完整,分布类型复杂。分布类型复杂。生存(随访)资料的特点:生存(随访)资料的
2、特点:n将研究对象的随访将研究对象的随访结局结局和随访和随访时间时间两个因素同时两个因素同时结合起来考虑的一种统计分析方法;结合起来考虑的一种统计分析方法;n能充分利用所获得的信息,达到较准确、全面地能充分利用所获得的信息,达到较准确、全面地评价和比较随访资料的目的。评价和比较随访资料的目的。生存分析生存分析生存分析中的重要概念生存分析中的重要概念n“死亡死亡”事件事件 失败事件失败事件(failure event)n生存时间生存时间(survival time)完全数据完全数据截尾数据(失访、退出、终止)截尾数据(失访、退出、终止)n死亡概率死亡概率(mortality probabilit
3、y)n生存概率生存概率(survival probability)n生存率生存率(survival rate)n中位生存时间中位生存时间(median survival time)n乘积极限法(乘积极限法(product-limit estimates)未分组未分组资料生存率的估计资料生存率的估计主要适用于主要适用于小样本小样本n寿命表法寿命表法(life-table method)l实质上是乘积极限法的一种近似实质上是乘积极限法的一种近似l样本含量较大时使用样本含量较大时使用l通常资料按随访时间分组,没有每个观察对象通常资料按随访时间分组,没有每个观察对象确切的生存时间确切的生存时间生存过程
4、的描述生存过程的描述生存过程的比较生存过程的比较对数秩检验对数秩检验(log-rank test)l一种一种非参数非参数检验方法,不要求生存时间符合某检验方法,不要求生存时间符合某特定的分布特定的分布l对分组资料和未分组资料均适用对分组资料和未分组资料均适用l是针对整个是针对整个生存曲线的比较生存曲线的比较,而非某个特定时,而非某个特定时间点生存率的比较间点生存率的比较l除需满足生存资料的基本要求外,还要求各样除需满足生存资料的基本要求外,还要求各样本生存曲线本生存曲线不能交叉不能交叉TTA22SAS程序程序n非参数法非参数法:乘积极限法、寿命表法等:乘积极限法、寿命表法等SAS过程:过程:L
5、IFETESTn参数法:指数分布法、威布尔分布法、对数正态参数法:指数分布法、威布尔分布法、对数正态回归分析法以及对数回归分析法以及对数logistic回归分析法等回归分析法等SAS过程:过程:LIFEREGn半参数法:半参数法:COX模型分析方法模型分析方法lSAS过程:过程:PHREG生存分析常用生存分析常用SAS程序程序n生存分析的非参数方法的生存分析的非参数方法的SAS过程过程n可用可用乘积极限法乘积极限法和和寿命表法寿命表法估计生存率和估计生存率和中位生存时间等中位生存时间等n用用对数秩检验对数秩检验、Wilcoxon检验、似然比检检验、似然比检验方法做生存曲线的分组比较验方法做生存
6、曲线的分组比较LIFETEST过程过程PROC LIFETEST 选项选项;TIME 生存时间变量生存时间变量*截尾指示变量截尾指示变量(值值);STRATA 分组变量名列;分组变量名列;TEST 分组变量名列;分组变量名列;FREQ 频数变量名列;频数变量名列;RUN;LIFETEST过程的语法格式过程的语法格式METHOD=分析方法分析方法 PL 乘积极限法(该选项为缺省值)乘积极限法(该选项为缺省值)LT 寿命表法寿命表法PLOTS=(绘制图形绘制图形),若有多个选项用逗号隔开,若有多个选项用逗号隔开 (S)以生存率以生存率*生存时间绘图;生存时间绘图;(LS)以以-logS(t)*生存
7、时间绘图;生存时间绘图;(LLS)以以log(-logS(t)*生存时间对数值绘图生存时间对数值绘图;(C)绘制有关截尾值情况的图形绘制有关截尾值情况的图形;(H)对风险函数做图,横纵坐标分别为对风险函数做图,横纵坐标分别为t、H(t)选选 项项Intervals=指定寿命表的区间端点指定寿命表的区间端点端点值以空格分隔,如端点值以空格分隔,如“intervals=10 30 50 70”端点值以逗号分隔,如端点值以逗号分隔,如“intervals=10,30,50,70”“a to b by c”的形式,如的形式,如“intervals=1 to 8”或或“intervals=1 to 8
8、by 2”选选 项(续)项(续)n为调用为调用LIFETEST过程所必需过程所必需n用以指定代表生存时间的变量用以指定代表生存时间的变量n语句形式如下:语句形式如下:TIME t n尖括号中的内容可省略尖括号中的内容可省略TIME 语句语句n主要用于指定分组变量主要用于指定分组变量nSAS结果会按指定的分组变量的不同水平分别结果会按指定的分组变量的不同水平分别给出生存率等相关指标的估计和描述给出生存率等相关指标的估计和描述nSAS结果会按指定的分组变量进行生存曲线的结果会按指定的分组变量进行生存曲线的比较比较STRATA 语句语句n指定需检验的变量指定需检验的变量n语句中的变量为数值型语句中的
9、变量为数值型,则为需要与生存变量进则为需要与生存变量进行关联性分析的协变量行关联性分析的协变量n语句中的变量为分组变量,则分组比较生存时语句中的变量为分组变量,则分组比较生存时间有无差别间有无差别nLifetest过程将通过两类秩检验统计量来检验过程将通过两类秩检验统计量来检验test变量与生存变量的关联性变量与生存变量的关联性某医师对26例肝癌患者首次肝移植失败后实施再次肝移植手术,并于再次移植术后开始随访,随访时间(月)和随访结果如表15.2第(2)、第(3)栏所示。试估计再次肝移植患者各时点生存率及其标准误、各时点总体生存率的95置信区间、中位生存时间,并绘制生存曲线。教材教材P203例
10、例15.1序号生存时间(月)死亡数期初病例数死亡概率生存概率 生存率生存率的标准误ktkdknk(1)(2)(3)(4)(5)(6)(7)(8)111261/261-1/260.961 50.037 7222252/251-2/250.884 60.062 732+0230/231-0/230.884 60.062 7431221/221-1/220.844 40.071 654+0210/211-0/210.844 40.071 6661201/201-1/200.802 20.079 5711+0190/191-0/190.802 20.079 58121181/181-1/180.757
11、 60.086 7kqkp()iSt()iSE S t 表15.226例肝癌患者再次移植术后估计生存率及其标准误估计(乘积极限法)data lt15_1;input t c f;/*t为生存时间变量为生存时间变量;c为截尾指示变量,为截尾指示变量,1为完整数据,为完整数据,0为截为截尾数据尾数据*/cards;1 1 1 2 1 2 2 0 1 3 1 1 4 0 1 6 1 1 11 0 1 12 1 1 14 1 2 16 0 1 18 0 1 20 1 1 22 0 1 23 0 1 26 1 1 35 0 1 36 0 1 39 0 1 42 0 1 45 0 1 50 1 1 51
12、0 1 55 1 1 60 0 1;proc lifetest plots=(s);/*调用调用lifetest过程,并绘制生存曲线,缺省情况下使过程,并绘制生存曲线,缺省情况下使用乘积极限法(用乘积极限法(pl)*/time t*c(0);/*C=0为截尾数据为截尾数据*/Freq f;run;教材教材P203例例15.1生存率死亡率注意:这里50%的点估计不是中位生存时间。某医师对324例肝癌患者肝移植后每半年随访1次,随访结果如表15.3第(2)栏第(4)栏所示,试估计各时点生存率及其标准误、各时点总体生存率的95置信区间、中位生存时间,并绘制生存曲线。教材教材P206例例15.2序号序
13、号i确诊后月数确诊后月数ti期内截尾人数期内截尾人数Ci期内死亡人数期内死亡人数Di103137262923121333418433524433630038736331842111教材教材P206例例15.2data lt15_2;do t=0 to 66 by 6;/*t为生存时间变量为生存时间变量*/do c=0 to 1;/*指定截尾变量指定截尾变量*/input f;/*f为频数变量,表示某个生存时间区间内死亡例数或截尾为频数变量,表示某个生存时间区间内死亡例数或截尾例数例数*/output;end;end;cards;31 37 29 2 13 33 4 33 4 33 0 38 3
14、 31 1 11 0 8 0 6 0 5 0 2;proc lifetest method=lt intervals=0 to 72 by 6 plots=(s);/*用寿命表法估计用寿命表法估计(lt),规定分组区间为,规定分组区间为6,绘制生存曲线,绘制生存曲线*/time t*c(0);/*C=0为截尾数据为截尾数据*/freq f;/*指明指明f为分析变量的频数为分析变量的频数,起到加权的作用,起到加权的作用*/run;这个表的结果和书上有一些出入,注意一下 某临床医生对26例肝炎后肝硬化、29例肝炎后肝硬化合并肝癌患者实施了肝移植手术,并从肝移植术后开始随访,两组患者肝移植术后随访时
15、间(月)和随访结果分别如表15.4第(2)和第(4)、第(5)、第(8)、第(9)栏所示,试比较肝炎后肝硬化和肝炎后肝硬化合并肝癌的预后是否有差别。教材教材P209例例15.3教材教材P209例例15.3序号序号时间时间(月月)肝炎后肝硬化肝炎后肝硬化肝炎后肝硬化合并肝癌肝炎后肝硬化合并肝癌期初人数死亡数截尾数期初人数死亡数截尾数itin1id1ic1in2id2ic2i(1)(2)(3)(4)(5)(7)(8)(9)1126102911222501271033241026114423012410552201231066211022007720012201data lt15_3;input g
16、 t c;cards;1 1 1 1 2 0 1 3 1 1 4 0 1 5 0 1 6 1 1 7 0 1 8 1 1 9 0 1 10 0 1 16 1 1 22 0 1 23 1 1 27 1 1 30 1 1 31 1 1 35 0 1 39 1 1 40 0 1 43 0 1 45 1 1 55 0 1 61 0 1 62 0 1 65 0 1 66 0 2 1 1 2 1 0 2 2 1 2 3 1 2 3 0 2 4 1 2 5 1 2 7 0 2 8 0 2 9 0 2 10 1 2 11 1 2 12 0 2 14 0 2 15 1 2 18 1 2 21 1 2 24 1 2 26 0 2 30 1 2 33 0 2 37 0 2 38 1 2 42 1 2 49 0 2 52 1 2 58 0 2 60 1 2 66 0;proc lifetest method=pl plots=(s);/*调用lifetest过程,方法为乘积极限法,并绘制生存曲线*/time t*c(0);strata g;/*按该变量进行分组分析*/run;教材教材P209例例15.3谢谢观看谢谢观看