1、欢迎来到医学课堂欢迎来到医学课堂1第十七章第十七章 生存分析生存分析(Survival Analysis)随访研究及统计分析2本章内容本章内容第一节第一节 生存分析的基本概念生存分析的基本概念第二节第二节 生存率的估计与生存曲线生存率的估计与生存曲线*第三节第三节 生存曲线的生存曲线的Log-rank检验检验第四节第四节 COX比例风险回归模型比例风险回归模型*第五节第五节 寿命表寿命表(不讲不讲)*要求掌握概念、方法、用途。要求掌握概念、方法、用途。3概概 述述 临床上疗效、预后的评价常用疾病临床上疗效、预后的评价常用疾病的结局指标:如有效率、治愈率、的结局指标:如有效率、治愈率、死亡率比较
2、。对于短期内能明确治死亡率比较。对于短期内能明确治疗效果的疾病是适用的。但对于远疗效果的疾病是适用的。但对于远期疗效,上述指标的评价不全面。期疗效,上述指标的评价不全面。4例例 某病的疗效比较某病的疗效比较 治愈率治愈率(%)平均治愈时间平均治愈时间(月月)甲药甲药 80 20 乙药乙药 81 12 疗效除了应评价疗效除了应评价“结局结局”的好坏,结局所的好坏,结局所经历时间长短也是评价疗效重要的指标。经历时间长短也是评价疗效重要的指标。5例例2:两种方法对疾病的疗效两种方法对疾病的疗效方法方法 治疗人数治疗人数 生存人数生存人数 生存率生存率%甲方法甲方法 100 20 20乙方法乙方法 1
3、00 50 50经经2检验检验 p0.05,乙法预后优于甲法。,乙法预后优于甲法。假定:假定:1.观察期间疾病的死亡率不随时间变化。观察期间疾病的死亡率不随时间变化。2.研究对象观察时间长度相等。研究对象观察时间长度相等。6随访研究随访研究随访研究随访研究(follow-up study)是医学中常用前是医学中常用前瞻性研究瞻性研究.例例:两种方法肾移植病人术后肾的生存时间两种方法肾移植病人术后肾的生存时间和结局和结局(生存率生存率)比较比较.例例:不同方法对某病人不同方法对某病人(癌症、反复发作疾病)癌症、反复发作疾病)生存时间生存时间(缓解时间缓解时间)与结局与结局(生存率生存率)比较比较
4、.该类数据通过随访得到,称为随访资料。该类数据通过随访得到,称为随访资料。7随访研究资料随访研究资料 当研究事件(当研究事件(y)的结局是两分类数据)的结局是两分类数据(发发生,不发生生,不发生),并且结局与时间(,并且结局与时间(t)有关,)有关,如同时收集事件发生的时间(如同时收集事件发生的时间(t),),该类数据该类数据称为随访资料,分析该数据的统计方法用生称为随访资料,分析该数据的统计方法用生存分析。存分析。生存分析是将生存分析是将“结局结局”与与“时间时间”两个因素两个因素结合一起研究的统计分析方法。结合一起研究的统计分析方法。8一、随访数据概念一、随访数据概念 1.分析的变量(分析
5、的变量(y)1)结局事件:结局事件:指结局出现的特征,如疾病的死指结局出现的特征,如疾病的死亡、复发、发生亡、复发、发生(y=1或或0)。2)时间间隔变量)时间间隔变量 记为(记为(t)t=结局事件出现日期结局事件出现日期 事件的起始日期事件的起始日期 (起始日期可规定(起始日期可规定:如诊断、用药、手术日期如诊断、用药、手术日期等)等),t的单位:可用年、月、周表示的单位:可用年、月、周表示 第一节第一节 生存分析的基本概念生存分析的基本概念92.截尾数据截尾数据 观察过程中个体因其他原因未观察到明确的观察过程中个体因其他原因未观察到明确的结局,结局,称为截尾称为截尾或删失数据或删失数据(c
6、ensored data)。)。截尾截尾原因有:原因有:失访,失访,退出研究,如其他原因死亡。退出研究,如其他原因死亡。研究研究时间结束,未出现结局事件。时间结束,未出现结局事件。截尾值截尾值(censored value):):时间(时间(t)=截尾截尾事件日期事件日期 起始事件日期起始事件日期记为记为t+。(。(例:例:10+月)月)103.生存数据的特点生存数据的特点1)完全数据:研究对象在规定研究期间提供确)完全数据:研究对象在规定研究期间提供确切的切的“时间和结局时间和结局”。2)截尾数据)截尾数据(t+):截尾数据虽然提供的信息不:截尾数据虽然提供的信息不完全,但提供了部分信息,如
7、完全,但提供了部分信息,如 t=10+年年9年。年。3)生存数据的结果变量()生存数据的结果变量(Y)有两个:有两个:时间(时间(t)值)值,t0 结局状态(结局状态(y)=“如死亡或截尾值如死亡或截尾值”11二二 资料的收集资料的收集(一)随访研究设计(一)随访研究设计1.明确研究对象的起始事件时间,如手术日期等。明确研究对象的起始事件时间,如手术日期等。2.明确结局事件:如死亡或复发。明确结局事件:如死亡或复发。3.明确研究跨度时间:如明确研究跨度时间:如2000年至年至2005年结束。年结束。4.记录个体影响结果(记录个体影响结果(y)的其他自变量。的其他自变量。12例:例:收集生存数据
8、和影响预后的因素收集生存数据和影响预后的因素。某病不同药后随访记录(天)某病不同药后随访记录(天)预后因素预后因素 随访记录随访记录病例病例 性别性别 处理处理 开始开始 终止终止 是否是否 生存生存 号号 组组 日期日期 日期日期 死亡死亡 时间时间1 1 A药药 98/07/12 98/11/29 1 1402 2 B药药 98/07/01 98/12/29 1 1603 1 A药药 98/08/22 98/11/29 0 994 2 B药药 98/10/20 98/11/25 车祸死亡车祸死亡 36 013(二)随访的方式二)随访的方式1.全部观察对象同时接受不同处理(起点相同)全部观察
9、对象同时接受不同处理(起点相同)随访方式:多见于动物实验(见图随访方式:多见于动物实验(见图17-1,a)2.观察对象在不同时间接受处理因素(起点不同)观察对象在不同时间接受处理因素(起点不同)随访方式:临床试验研究(见图随访方式:临床试验研究(见图17-1,b)14起始事件时间起始事件时间如给药如给药0研究结研究结束时间束时间tOO为为死亡死亡O 为截尾为截尾动物实验随访数据(图动物实验随访数据(图17-1,a)1590年年91年年92年年93年(研究结年(研究结束)束)死亡死亡失访失访死亡死亡一批病人不同时间进入研究的随访资料一批病人不同时间进入研究的随访资料起点起点存活存活起点起点起点起
10、点起点起点起点起点存活存活16资料整理和记录资料整理和记录某人研究手术方法治疗某人研究手术方法治疗23位肾上腺肿瘤病人的位肾上腺肿瘤病人的生存时间(月)如下:生存时间(月)如下:1,3,5(3),),6(3),),7,8,10(2),),14+,17,19+,20+,22+,26+,31+,34,34+,44,59注注:()括号内的数为相同时间点的人数括号内的数为相同时间点的人数数据另一种记录数据另一种记录:对象编号对象编号 生存时间生存时间(t)结局状态结局状态(0为截尾值为截尾值)1 1 1 2 14 017(三)生存分析主要研究的内容三)生存分析主要研究的内容1.统计描述:统计描述:计算
11、不同时间点(计算不同时间点(t)的生存率,的生存率,描述生存过程。描述生存过程。2.统计推断:统计推断:检验不同处理方式的生存过程检验不同处理方式的生存过程有无统计差别有无统计差别.3.自变量(自变量(x)对生存时间()对生存时间(t)的关系)的关系:影:影响生存时间的危险因素分析响生存时间的危险因素分析.18第二节第二节 生存率的估计与生存曲线生存率的估计与生存曲线(一)描述生存资料的几个指标(一)描述生存资料的几个指标1.不同时间点生存率不同时间点生存率 2.生存曲线生存曲线3.中位生存时间中位生存时间19几个率概念几个率概念死亡率、死亡概率、生存概率、生存率死亡率、死亡概率、生存概率、生
12、存率死亡率:表示在单位时间(年)内死亡发生死亡率:表示在单位时间(年)内死亡发生的频率(年平均死亡水平)。的频率(年平均死亡水平)。%1000某年的平均人数某年内死亡数某年死亡率20 死亡概率(死亡概率(F):):在某时间段在某时间段(t)开始存活的个体,开始存活的个体,死于死于(t+t)该时段内的可能性。该时段内的可能性。生存概率(生存概率(pi=1-F):):指某时间段开始存活的个体到该时间段结束指某时间段开始存活的个体到该时间段结束时仍存活的概率。时仍存活的概率。dFn某时间段内的死亡数某时间段初的观察数(17-1)某时间段初的观察数某时间段存活人数p死亡概率、生存概率死亡概率、生存概率
13、21生存率(生存率(survival rate)称为生存函数称为生存函数 记为记为S(t)S(t):指观察对象从:指观察对象从起始事件起始事件(如手术时间(如手术时间为为0点)点)开始开始,到,到t时刻仍存活的概率。常用时刻仍存活的概率。常用n年年生存率表示。生存率表示。()()itXns t时刻存活的人数年生存率观察的总人数时间时间ti,i=1,2,3n假设数据是完全数据,计算见例假设数据是完全数据,计算见例22例例:某病病人术后生存率某病病人术后生存率 生存生存 期初期初 死亡死亡 生存生存 死亡死亡 生存生存 生存率生存率 人数人数 人数人数 人数人数 概率概率 概率概率 0,1 100
14、 10 90 0.1 0.9 0.901,2 90 10 80 0.11 0.89 0.802,3 80 20 60 0.25 0.75 0.60 9.010090)1(s观察的总人数时刻存活的人数年生存率iittsn)()(its)(,1iitt80.010080)2(s23生存时间数据分析时整理示意图生存时间数据分析时整理示意图 死亡死亡 0 2 4 6 8 10 12 14 16 18 20 年“t”表示从研究起点到结局出现时表示从研究起点到结局出现时间间t失访失访失访失访死亡死亡死亡死亡死亡死亡24生存率生存率S(t)的概率乘法估计的概率乘法估计 S(t)也称累计生存概率,)也称累计生
15、存概率,t 时刻存活是时刻存活是t 时刻之前一直生存的累积。时刻之前一直生存的累积。概率乘法原理计算概率乘法原理计算(359页页)Pi 为某时间区间(为某时间区间(ti)的)的生存概率。假定生存概率。假定个体在各时段生存是独立。个体在各时段生存是独立。(公式(公式17-2)iiippppts.)(21252.生存曲线生存曲线:(:(survival curve)指各时点(指各时点(t)为横轴为横轴,生存率生存率S(t)为纵轴为纵轴,连连接一起的曲线图。描述生存率在各时点接一起的曲线图。描述生存率在各时点(t)的的变化过程。变化过程。3.半数生存期半数生存期(中位数生存时间)(中位数生存时间)即
16、生存率为即生存率为0.5时对应的时间(时对应的时间(t),描述一),描述一组数据平均生存时间。组数据平均生存时间。注:生存时间(注:生存时间(t)是正偏态分布。)是正偏态分布。26Survival Functions6050403020100Cum Survival(%)1.21.0.8.6.4.20.0-.2甲甲手术手术乙乙手术手术图图17-2 两种手术治疗方式术后病人生存曲线的比较两种手术治疗方式术后病人生存曲线的比较月月27(二)生存率估计的统计方法(二)生存率估计的统计方法(非参数方法)(非参数方法)1.小样本数据生存率计算小样本数据生存率计算*。用用 kaplan-Meier的乘积极
17、限法(的乘积极限法(product-limit method,PL法)法)方法:方法:1)将生存时间)将生存时间t由小到大排列。截尾值排在完由小到大排列。截尾值排在完全数据后,例:全数据后,例:20,20+2)列出)列出t时刻死亡数(时刻死亡数(d)3)生存率估计用概率乘法原理生存率估计用概率乘法原理例:例:17-1和表和表17-128例例17-1:某手术方法(甲法)治疗:某手术方法(甲法)治疗23例肾例肾上腺肿瘤病人后生存情况(讲义上腺肿瘤病人后生存情况(讲义358页)页)生存时间(生存时间(t,月),其中月),其中“+”者为截尾数据者为截尾数据 1,3,5(3),),6(3),),7,8,
18、10(2),14+,17,19+,20+,22+,26+,31+,34,34+,44,59计算生存率计算生存率s(t)和生存曲线和生存曲线29表表17-1 甲种手术后病人生存率的计算方法甲种手术后病人生存率的计算方法时间时间(月月)死亡死亡 期初期初 死亡死亡 生存生存 生存率生存率ti 人数人数 人数人数 概率概率 概率概率 1 1 23 0.043 0.957 0.9573 1 22 0.045 0.955 0.9145 3 21 0.143 0.857 0.7836 3 18 0.167 0.833 0.6527 1 15 0.067 0.933 0.6098 1 14 0.071 0.
19、929 0.56510 2 13 0.154 0.846 0.47814+0 11 0.000 1.000 0.478t t)(txp 30表表17-1资料甲手术描述指标资料甲手术描述指标(SPSS 软件软件)Survival Standard 95%Confidence Survival Standard 95%Confidence Time error Interval Time error IntervalMean:24.23 4.99 (14.44,34.01)Mean:24.23 4.99 (14.44,34.01)Median:10.00 6.96 (.00,23.63)Media
20、n:10.00 6.96 (.00,23.63)表表17-2资料乙手术描述指标资料乙手术描述指标 Survival Standard 95%ConfidenceSurvival Standard 95%Confidence Time Err Interval Time Err Interval Mean 7.80 1.18 (5.50,10.10)Mean 7.80 1.18 (5.50,10.10)Median 6.00 2.98 (0.16,11.84)Median 6.00 2.98 (0.16,11.84)312.大样本资料的生存分析方法大样本资料的生存分析方法寿命表法寿命表法(Lif
21、e-table method)表表17-3 2418例男性心绞痛病人生存率情况例男性心绞痛病人生存率情况术后术后 死亡死亡 截尾截尾 期初期初 校正校正 生存生存 生存率生存率年数年数 人数人数 人数人数 人数人数 人数人数 概率概率 (t+1)0-456 0 2418 2418 0.8114 0.81141-226 39 1962 1942.5 0.8837 0.7172-152 22 1697 1686 0.9098 0.6524校正人数校正人数=1962-39/2=1942.5 例例17-332寿命表法与寿命表法与PL的区别的区别1.计算在计算在 时间段的生存率。时间段的生存率。如如0-
22、1年、年、1-2年,年,时间段组距相等时间段组距相等。2.寿命表方法计算死亡概率,用寿命表方法计算死亡概率,用校正观察人数计校正观察人数计算。算。假定有截尾事件的人在各时间组内平均生假定有截尾事件的人在各时间组内平均生存为存为1/2时间。时间。死亡概率死亡概率=某时间组内死亡人数某时间组内死亡人数/校正观察人数校正观察人数(校正观察人数(校正观察人数=期初观察人数截尾人数期初观察人数截尾人数/2)1,()iitt33第三节第三节 生存曲线的统计检验生存曲线的统计检验 比较不同方法的生存率,常进行生存率曲比较不同方法的生存率,常进行生存率曲线间的比较。线间的比较。方法:时序检验(方法:时序检验(
23、Log-Rank test),可对两组),可对两组或多组生存率曲线做比较或多组生存率曲线做比较.检验假设:检验假设:H0:两总体的生存率曲线相同两总体的生存率曲线相同 H1:两总体的生存率曲线不同两总体的生存率曲线不同=0.05,如,如P,拒绝拒绝H034Log-rank检验检验检验统计量:检验统计量:该该2服从自由度服从自由度=比较组数比较组数1Ai 为某组各时点实际死亡频数合计为某组各时点实际死亡频数合计.Ti 为某组各时点期望死亡频数合计为某组各时点期望死亡频数合计i 表示比较组,表示比较组,i=1,2,k组组22()iiiATT 35Log-rank检验的基本思想检验的基本思想时间时间
24、 甲法手术组甲法手术组 乙法手术组乙法手术组 合计合计 t T1i T2i 1 23 1 1.605 20 2 1.395 43 3 2 22 0 0.550 18 1 0.450 40 1 1in1id2in2idinid1113231.60543iiidTnn2123201.39543iiidTnn表表17-4部分数据,部分数据,365页页按按两组合计两组合计死亡率计算死亡率计算各组理论频各组理论频数数(T).36两组生存率曲线的检验两组生存率曲线的检验 H0:s(t1)=s(t2)=组数组数-1=2-1,p0.01结论结论:两生存率曲线有统计差别两生存率曲线有统计差别,甲手术方法后生存甲
25、手术方法后生存率高于乙法率高于乙法.222(1623.809)(20 12.191)7.5623.80912.19163.656.721,01.02乙乙乙甲甲甲)()TTATTA222(37Survival Functions6050403020100Cum Survival(%)1.21.0.8.6.4.20.0-.2甲甲手术手术乙乙手术手术图图17-2 两种手术治疗方式术后病人生存曲线的比较两种手术治疗方式术后病人生存曲线的比较月月38第四节第四节 COX比例风险回归模型比例风险回归模型 COX模型用于分析生存事件与多个危险因素模型用于分析生存事件与多个危险因素(x)的回归关系,以确定的回
26、归关系,以确定X对预后的重要性对预后的重要性。生存数据(生存数据(y)的特殊性:的特殊性:事件结局事件结局y=1或或0,同时结局经历的时间(,同时结局经历的时间(t)。)。有截尾数据。有截尾数据。不能单用时间(不能单用时间(t)做多元线性回归或用结局做做多元线性回归或用结局做Logistic回归。回归。39一、一、Cox模型的基本形式模型的基本形式01122(,)()exp()mmh th tXXXXh(t,x):风险函数():风险函数(hazard function)表示具有某危险因素(表示具有某危险因素(x)的个体在的个体在t 时刻时刻的死亡风险率。的死亡风险率。公式公式17-15回归模型
27、回归模型40Cox模型及参数的意义模型及参数的意义 h(t,x)=h0(t)exp(x)方程由两部分组成:方程由两部分组成:1.h0(t):危险因素危险因素X=0时,在时,在ti 时刻的基时刻的基础风险死亡率。础风险死亡率。h0(t)是)是未知的。未知的。2.exp(x):危险因子的系数危险因子的系数假定假定Exp(X)与与t 变化无关的风险因子变化无关的风险因子41h(t,x)01.00.20.40.60.80()h t0()exp()h tx1234时间时间t死亡风险率死亡风险率比例风险率函数示意图比例风险率函数示意图假定在任何时刻假定在任何时刻t,死亡风险的比值是不变的。死亡风险的比值是
28、不变的。)exp()(2211xxth42COX回归模型又称为比例风险率模型回归模型又称为比例风险率模型(proportion hazard model,PH)模型的另一表达方式模型的另一表达方式)exp()(),(110 xthxthPHmmxxxthxth.)(),(ln22110或或).exp()(),(22110mmxxxthxthPH43COX回归系数回归系数的含义的含义某风险函数某风险函数exp()x01011010()exp(1)()exp()(,1)exp()(,0)()exp(0)()h th th t xh t xh th t)exp()(),(0 xthxth表示有危险因
29、素表示有危险因素(x=1)与无危险因素与无危险因素(x=0)的个的个体相比,两组死亡率相对危险度的对数值。体相比,两组死亡率相对危险度的对数值。RRe44相对危险度(相对危险度(Relative risk,RR)RR:指暴露于某种危险因素观察对象的发病指暴露于某种危险因素观察对象的发病(死亡)率(死亡)率(P1)与无暴露因素组观察对象与无暴露因素组观察对象发病(死亡)率(发病(死亡)率(P0)的比值。的比值。RR1说明有暴露因素存在,发生疾病危险性说明有暴露因素存在,发生疾病危险性相对于对照组的倍数,反映暴露因素与疾病相对于对照组的倍数,反映暴露因素与疾病的关联(因果)关系。的关联(因果)关系
30、。常用于前瞻性或队列常用于前瞻性或队列研究。研究。10pRRP暴露组的死亡率非暴露组的死亡率45COX模型回归系数(模型回归系数()在医学中的)在医学中的意义意义h(t,x)=h0(t)exp(x)反映某反映某X与死亡风险的关系与死亡风险的关系=0,表示某因素(表示某因素(X)与死亡风险无关。与死亡风险无关。0,是死亡的危险因素。,是死亡的危险因素。0,是死亡保护因素。是死亡保护因素。如有某危险因如有某危险因素素=1,无无=046 i 表示其他因素固定(不变)后,个表示其他因素固定(不变)后,个体有某有协变量(体有某有协变量(Xi=1)与(与(X=0)相比,)相比,死亡风险率相对危险度的对数值
31、,或死亡风险率相对危险度的对数值,或Xi每每增加一个单位,死亡风险增加增加一个单位,死亡风险增加i。01122(,)()exp()mmh th tXXXX 多因素多因素Cox回归模型回归模型i的概念的概念47例例368页页 探讨胃癌患者的预后因素探讨胃癌患者的预后因素:比较胃癌患者用不同方法后,对其生存时间比较胃癌患者用不同方法后,对其生存时间的预后因素分析,其中的预后因素分析,其中 X1(手术(手术=1,否,否=0)、)、X2(放射治疗(放射治疗=1,否,否=0)。)。数据记录和整理:数据记录和整理:患者编号患者编号 X1 X2 生存时间生存时间t 截尾截尾*1 1 0 20 1 2 0 1
32、 15 0*死亡死亡=1,截尾截尾=048得得COX模型:模型:(0.360)1e0.697RR0(,)()exp(0.360 1 0.333 2)h t xh txx10.360(0.333)2e0.716RR20.333 49 1的含义:做手术者的死亡风险是不做手术者的的含义:做手术者的死亡风险是不做手术者的69.7%。00()exp(0.360 1)(,11,20)(,10,20)()exp(0.360)h txh t xxh t xxh t1的含义的含义:控制其他因素后(放射因素),:控制其他因素后(放射因素),做做手术与不手术者相比,死亡风险的相对危险度。手术与不手术者相比,死亡风险
33、的相对危险度。X1(手术(手术=1,否,否=0)697.0)360.0exp(1RR5000()exp(0.360 1 0.333 1)(,1 1,2 1)exp(0.693)(,1 0,2 0)()h tht xxht xxh t exp(0.693)0.5RR 含义:两个方法都治疗的病人的死亡风险含义:两个方法都治疗的病人的死亡风险是不治疗病人的是不治疗病人的50%。如如 病人甲(病人甲(X1=1,X2=1)与)与 病人乙病人乙 (X1=0,X2=0)相比。)相比。51二二.COX模型的参数估计与假设检验模型的参数估计与假设检验(讲义(讲义368-371页)页)1.回归系数(回归系数(i)
34、的估计的估计 i采用最大似然法估计似然函数得到。采用最大似然法估计似然函数得到。2.回归系数(回归系数(i)的检验的检验 似然比函数和似然比函数和wald检验。检验。(不需要掌握)(不需要掌握)52三三 因素的筛选和最佳模型的建立因素的筛选和最佳模型的建立(讲义(讲义371页)页)采用逐步回归法筛选有统计意义的变量采用逐步回归法筛选有统计意义的变量逐步回归检验水准逐步回归检验水准:进入方程的检验水准为进入方程的检验水准为0.05或或0.10 变量保留在方程的水准为变量保留在方程的水准为0.1或或0.15 以上计算在统计软件(以上计算在统计软件(SAS、SPSS等)均可等)均可完成。完成。53四
35、、四、COX回归方程在生存分析中回归方程在生存分析中的主要应用的主要应用1.筛选对死亡风险预后的危险因素筛选对死亡风险预后的危险因素 估计危险因素估计危险因素(x)的回归系数(的回归系数(),得到相),得到相对危险度(对危险度(RR)和可信区间。)和可信区间。2.校正混杂因素,评价实验处理的效应校正混杂因素,评价实验处理的效应 例讲义例讲义 探讨胃癌患者的预后因素探讨胃癌患者的预后因素3.计算预后指数(计算预后指数(PI),),对个体预后风险做评对个体预后风险做评价。价。1122mmPIXXX(17-28)54五五 应用实例应用实例例例17-5 探讨探讨63例恶性肿瘤患者的预后例恶性肿瘤患者的
36、预后变量名变量名 变量变量 量化值量化值 X1 年龄年龄 岁岁X2 性别性别 男男1,女,女2X3 组织学类型组织学类型 高分化高分化1,低分化,低分化2X4 治疗方式治疗方式 传统传统 1,新方法,新方法2X5 淋巴节是否转移淋巴节是否转移 是是1 否否 2X6 肿瘤浸润程度肿瘤浸润程度 突破浆膜突破浆膜1 无无2Y 结局结局 死亡死亡 0 截尾截尾1t 生存时间生存时间 月月55数据录入格式数据录入格式63例恶性肿瘤患者的生存时间(例恶性肿瘤患者的生存时间(t,月),月)与预后因素与预后因素患者患者序号序号X1X1X2X2X3X3X4X4X5X5X6X6 t ty y1 154540 00
37、 00 01 10 052521 12 257570 01 11 10 00 051511 13 358580 00 01 11 11 135350 04 443431 11 10 01 10 01031031 1Y为结局,死亡为结局,死亡=0,截尾,截尾=1检验水准检验水准:进入水准为进入水准为0.05,剔除方程水准为剔除方程水准为0.0656采用逐步回归计算采用逐步回归计算表表17-7 COX模型筛选危险因素模型筛选危险因素变量变量 Sb p RR 95%可信区间可信区间X4 1.761 0.547 0.0013 5.822 1.98 17.03X5 0.931 0.444 0.0362
38、2.538 1.06 6.06X4:传统法传统法=1,新法新法=0,X5淋巴节转移淋巴节转移=1,未转移未转移=0COX模型表达模型表达h(t,x)=h0(t)exp(1.761X4+0.931X5)结论结论:传统法和淋巴节转移是影响肿瘤生存的传统法和淋巴节转移是影响肿瘤生存的不利因素不利因素.57例例:探讨胃癌患者的预后因素探讨胃癌患者的预后因素得得COX模型:模型:x1=手术手术,x2=放疗放疗(0.360)1e0.697RR0(,)()exp(0.360 1 0.333 2)h t xh txx10.360(0.333)2e0.716RR20.333 结论结论:手术效果优于放疗手术效果优
39、于放疗.问问:两种方法何者效果更好两种方法何者效果更好?58例:肺癌病人生存时间与有关因素的分析例:肺癌病人生存时间与有关因素的分析记录记录75例肺癌病人的生存时间(月)和例肺癌病人的生存时间(月)和18个可个可能与预后有关的因素能与预后有关的因素年龄、性别、得分、类型、分化、分期、淋巴年龄、性别、得分、类型、分化、分期、淋巴结侵犯、结侵犯、CEA、P53、P16、放疗、化疗、放疗、化疗、手术等手术等 分析目的:分析目的:1.筛选出与预后有关的主要危险因子筛选出与预后有关的主要危险因子2.对个体预后危险性进行评价对个体预后危险性进行评价59COX回归模型结果(逐步回归法回归模型结果(逐步回归法
40、)B SE Wald B Sig.Exp(B)年龄年龄 .064 .017 13.89 0.77 .000 1.066 性别性别 -.833 .425 3.839 -0.35 .040 .435 分期分期 .266 .141 3.585 0.51 .005 1.305 CEA .015 .007 4.2640.50 .039 1.015 NM -.360 .260 1.920 -0.31 .001.698B为标准化回归系数为标准化回归系数结论:结论:对生存率不利的因素:对生存率不利的因素:年龄、分期、年龄、分期、CEA 有利因素:有利因素:性别、性别、NM对生存率影响的作用依次为年龄、分期、对
41、生存率影响的作用依次为年龄、分期、CEA。60个体预后指数(个体预后指数(PI)X标准化变量值标准化变量值为标准化回归系数为标准化回归系数PI0,表示个体危险度为平均水平。表示个体危险度为平均水平。PI0,表示个体危险度大于平均水平。表示个体危险度大于平均水平。PI0,表示个体危险度小于平均水平。表示个体危险度小于平均水平。1122mmPIXXX1111XXXS17-3061年龄年龄 性别性别 分期分期 CEA NM 预后指数得分预后指数得分 72 1 7 80 1 2.23 46 1 3 15 2 -182 30 1 4 15 2 -2.58 50 2 5 20 2 -1.80 80 1 6
42、 130 1 3.22 56 1 4 59 1 0.007 75例肺癌病人预后的得分例肺癌病人预后的得分以上计算以上计算SAS和和SPSS软件均可直接得到软件均可直接得到62六六 Cox 模型应用的注意事项模型应用的注意事项Cox 模型要求模型要求1.样本例数不能太小,样本例数为变量个数的样本例数不能太小,样本例数为变量个数的5-20倍。倍。2 生存资料的截尾数据不能超过生存资料的截尾数据不能超过20%。要有一。要有一定发生结局事件例数。定发生结局事件例数。3.模型中某模型中某x因素有统计意义时因素有统计意义时,可能是因果关系可能是因果关系,有的是伴随关系有的是伴随关系.4.要求病人死亡风险不
43、随时间变化而变化,满要求病人死亡风险不随时间变化而变化,满足比例风险的要求。足比例风险的要求。63小小 结结1.随访资料主要特点:随访资料主要特点:个体的结局资料包含两项内容:生存个体的结局资料包含两项内容:生存时间和终点事件是否发生;数据中可以时间和终点事件是否发生;数据中可以有删失值。有删失值。2.生存时间一般不服从正态分布。这些使生存时间一般不服从正态分布。这些使得生存过程的统计描述、单因素统计检得生存过程的统计描述、单因素统计检验、多因素分析方法有其自身特点。验、多因素分析方法有其自身特点。643.生存分析的多因素分析常用生存分析的多因素分析常用Cox模型,也模型,也称比例危险率回归,主要用于筛选影响生称比例危险率回归,主要用于筛选影响生存率的因素和预测等。存率的因素和预测等。思考题:思考题:Cox模型与模型与Logistic回归有何不同?回归有何不同?生存分析的统计描述指标有那些?其概念生存分析的统计描述指标有那些?其概念两组随访资料的比较用什么检验?两组随访资料的比较用什么检验?65结结 束束 6667