生存分析医学课件.ppt

上传人(卖家):晟晟文业 文档编号:3760264 上传时间:2022-10-10 格式:PPT 页数:45 大小:1.09MB
下载 相关 举报
生存分析医学课件.ppt_第1页
第1页 / 共45页
生存分析医学课件.ppt_第2页
第2页 / 共45页
生存分析医学课件.ppt_第3页
第3页 / 共45页
生存分析医学课件.ppt_第4页
第4页 / 共45页
生存分析医学课件.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

1、生存分析医学课件一、概一、概 述述1.传统方法在分析随访资料时存在困难:传统方法在分析随访资料时存在困难:(1)时间和生存结局都成为了要关心的因素时间和生存结局都成为了要关心的因素如果将结局和时间均作为因变量拟和多元模型,由于时如果将结局和时间均作为因变量拟和多元模型,由于时间分布不明(一般不呈正态分布,在不同情况下的分布间分布不明(一般不呈正态分布,在不同情况下的分布规律也不同),拟和多元模型极为困难。规律也不同),拟和多元模型极为困难。(2)存在大量删失资料存在大量删失资料将失访数据无论是算作死亡还是存活都不合理,时间判将失访数据无论是算作死亡还是存活都不合理,时间判定存在难度。定存在难度

2、。失去联系;失去联系;无法观察到结局(死于其无法观察到结局(死于其他原因);他原因);研究截止。研究截止。2.生存分析的应用生存分析的应用可用于现场追踪研究、临床疗效试验、疾病预后分析等可用于现场追踪研究、临床疗效试验、疾病预后分析等与时间相关的分析,生存时间的涵义也随之扩展到更广与时间相关的分析,生存时间的涵义也随之扩展到更广义的范围,又称为时间义的范围,又称为时间-效应分析效应分析(time-effect analysis)。其研究内容主要包括其研究内容主要包括3方面内容:方面内容:(1)对生存状况进行统计描述(生存概率、生存率、中位生对生存状况进行统计描述(生存概率、生存率、中位生存期等

3、);存期等);(2)寻找影响生存时间的寻找影响生存时间的“危险因素危险因素”和和“保护因素保护因素”;(3)估计生存率和生存时间长短,进行预后评价。估计生存率和生存时间长短,进行预后评价。(4)产生删失的原因产生删失的原因失访:生存但中途失访,如拒绝访问、失去联系等。失访:生存但中途失访,如拒绝访问、失去联系等。退出:中途退出试验或改变治疗方案或死于其它与研究无退出:中途退出试验或改变治疗方案或死于其它与研究无关的原因。关的原因。终止:指研究结束时终点事件尚未发生。终止:指研究结束时终点事件尚未发生。研究起始研究起始研究终点研究终点*终点事件终点事件+截尾值截尾值+*+*(5)生存时间的特点:

4、生存时间的特点:同时考虑生存结局和生存时间;同时考虑生存结局和生存时间;生存时间可能含有删失数据;生存时间可能含有删失数据;生存时间的分布和常见的统计分布有明显不同,如呈指数生存时间的分布和常见的统计分布有明显不同,如呈指数分布分布Weibu11分布、对数正态分布、对数分布、对数正态分布、对数logistic分布、分布、gamma分布或更为复杂的分布,因此需有能分析这类数据分布或更为复杂的分布,因此需有能分析这类数据的特殊的统计方法;的特殊的统计方法;生存时间的影响因素多而复杂且不易控制。生存时间的影响因素多而复杂且不易控制。(6)死亡概率和生存概率死亡概率和生存概率 死亡概率死亡概率(pro

5、bability of death)表示某单位时段开始时存表示某单位时段开始时存活的个体在该时段内死亡的可能性,如年死亡概率表示活的个体在该时段内死亡的可能性,如年死亡概率表示年初尚存人口在今后年初尚存人口在今后1年内死亡的可能性。年内死亡的可能性。生存概率生存概率(probability of survival)表示某单位时段开始时表示某单位时段开始时存活的个体到该时段结束时仍存活的可能性,如年生存存活的个体到该时段结束时仍存活的可能性,如年生存概率表示年初尚存人口存活满一年的可能性。概率表示年初尚存人口存活满一年的可能性。某某时时段段初初人人口口数数某某时时段段死死亡亡人人数数 q某某时时

6、段段初初人人口口数数活活过过某某时时段段的的人人数数 p1 pq(7)生存率生存率生存率生存率(survival rate),又称累积生存概率,又称累积生存概率(cumulative probability of survival),指观察对象经历,指观察对象经历t个单位时段后个单位时段后仍存活的可能性。累积生存概率随着时间仍存活的可能性。累积生存概率随着时间t的变化而变化,的变化而变化,它是时间它是时间t的函数,称为生存函数的函数,称为生存函数(survival function)。如资料中无删失数据,则直接计算生存率。如资料中无删失数据,则直接计算生存率。若含有删失数据,须分时段计算生存概

7、率。若含有删失数据,须分时段计算生存概率。观观察察总总例例数数时时刻刻仍仍存存活活的的例例数数kktttTPSk )(ktkktpSppptTPSkk 121)(8)中位生存期中位生存期中位生存期中位生存期(median survival time)又称半数生存期,表又称半数生存期,表示恰有示恰有50%的个体尚存活的时间。中位生存期越长,表的个体尚存活的时间。中位生存期越长,表示疾病的预后越好;反之,预后越差。估计中位生存期示疾病的预后越好;反之,预后越差。估计中位生存期常用图解法或线性内播法。常用图解法或线性内播法。(9)风险函数风险函数风险函数风险函数(hazard function),表

8、示,表示t时刻存活的个体在时刻存活的个体在t时时刻的瞬时死亡率。刻的瞬时死亡率。t=1时,时,h(t)近似地等于近似地等于t时刻存活的个体在此后一个单时刻存活的个体在此后一个单位时段内的死亡概率。位时段内的死亡概率。ttttTtPlimtht T|0二、二、生存率估计生存率估计l 生存率估计主要有寿命表法和生存率估计主要有寿命表法和Kaplan-Meier法。法。1.寿命表法适用于大样本或粗略的生存时间资料;寿命表法适用于大样本或粗略的生存时间资料;2.Kaplan-Meier法适用于小样本或大样本且有精法适用于小样本或大样本且有精确生存时间的资料。确生存时间的资料。两者均应用定群寿命表的基本

9、原理,先求两者均应用定群寿命表的基本原理,先求出各个时段的生存概率,然后根据概率乘法定理出各个时段的生存概率,然后根据概率乘法定理计算生存率。计算生存率。1.寿命表法寿命表法l 当样本量较大时,通常将资料先整理成频数表形式,用寿当样本量较大时,通常将资料先整理成频数表形式,用寿命表法计算样本资料的生存率及生存率的标准误。寿命表命表法计算样本资料的生存率及生存率的标准误。寿命表法法(life table method)是采用编制定群寿命表的原理来计算是采用编制定群寿命表的原理来计算生存率,首先求出患者在治疗后或健康者在预防措施后各生存率,首先求出患者在治疗后或健康者在预防措施后各时期的生存概率,

10、然后根据概率的乘法法则,将各时期的时期的生存概率,然后根据概率的乘法法则,将各时期的生存概率相乘,即可得到自观察开始到各时点的生存率。生存概率相乘,即可得到自观察开始到各时点的生存率。表表1 寿命表法估计生存率计算表寿命表法估计生存率计算表 ijiippse1867图图1 某恶性肿瘤生存曲线(寿命表法)某恶性肿瘤生存曲线(寿命表法)1.曲线折线形:因不知道时段内生存率的变化规律,故用曲线折线形:因不知道时段内生存率的变化规律,故用直线连接各端点,形成一条折线。直线连接各端点,形成一条折线。2.曲线连续:可估计任意时点的纵坐标值(生存率)。曲线连续:可估计任意时点的纵坐标值(生存率)。3.曲线尾

11、部稳定性好:寿命表法用于大样本,通常最后一曲线尾部稳定性好:寿命表法用于大样本,通常最后一个时段仍有一定观察例数,故曲线尾部稳定性较好。个时段仍有一定观察例数,故曲线尾部稳定性较好。2.Kaplan-Meier法法图图3 肿瘤肿瘤3.0cm组和肿瘤组和肿瘤3cm组生存曲线组生存曲线(K-M法法)寿命表法死亡概率寿命表法死亡概率计算为当期死亡数计算为当期死亡数/有效例数。有效例数。K-M法的死亡概率法的死亡概率为当期死亡数为当期死亡数/期初期初例数。例数。生存曲线特点生存曲线特点(1)曲线左连续:每一级台阶的右端为断点,当前死亡时点曲线左连续:每一级台阶的右端为断点,当前死亡时点处的纵坐标值在下

12、一个台阶。处的纵坐标值在下一个台阶。(2)曲线阶梯形:不能用直线或曲线连接相邻的两个生存率曲线阶梯形:不能用直线或曲线连接相邻的两个生存率散点。平缓的生存曲线表示高生存率或较长生存期,陡散点。平缓的生存曲线表示高生存率或较长生存期,陡峭的生存曲线表示低生存率或较短生存期。峭的生存曲线表示低生存率或较短生存期。(3)曲线尾部不稳定曲线尾部不稳定:随着时间的增加,观察例数越来越少,:随着时间的增加,观察例数越来越少,误差越来越大,尾部极不稳定。多组比较时,常发生曲误差越来越大,尾部极不稳定。多组比较时,常发生曲线尾部交叉现象。线尾部交叉现象。(4)计算中位生存期:找到与生存率计算中位生存期:找到与

13、生存率50%相邻的上下两个生相邻的上下两个生存率及其生存时间,利用线性比例关系求解中位生存期。存率及其生存时间,利用线性比例关系求解中位生存期。3.生存率的区间估计生存率的区间估计 ijiittjjjjttdnndSSSE iittSSEzS 2 itiSlnlntv iiiittttSSlnSSEv SE itiv SEzexptS 2 避免生存率接近避免生存率接近0或或100%时,出现超过时,出现超过0,1的范围的范围三、生存率的比较三、生存率的比较 l 生存率比较的假设检验方法有参数法、半参数法生存率比较的假设检验方法有参数法、半参数法和非参数法。因医学研究中的生存时间资料大多和非参数法

14、。因医学研究中的生存时间资料大多为不规则分布或者分布未知,常采用非参数法进为不规则分布或者分布未知,常采用非参数法进行假设检验。非参数法是将生存率曲线作为整体行假设检验。非参数法是将生存率曲线作为整体进行曲线与曲线之间的比较,其进行曲线与曲线之间的比较,其零假设为各总体零假设为各总体生存率曲线相同。生存率曲线相同。l 常用的非参数检验方法有常用的非参数检验方法有log-rank检验检验(时序检(时序检验)、验)、Breslow检验检验和和Gehan比分检验等。比分检验等。1.时序时序(log-rank)检验检验l 由由Mantel等人于等人于1966年提出。年提出。l 基本思想:在无效假设成立

15、的前提下,根据不同处理各基本思想:在无效假设成立的前提下,根据不同处理各生存时期的期初观察人数和理论死亡概率计算出的理论生存时期的期初观察人数和理论死亡概率计算出的理论死亡数应该与实际死亡数相差不大;如果相差较大,则死亡数应该与实际死亡数相差不大;如果相差较大,则可认为生存曲线间有统计学差异。检验统计量近似服从可认为生存曲线间有统计学差异。检验统计量近似服从自由度为自由度为(组数一组数一1)的的c c2分布,分布,ggigiVTd22 c ciiiiigiigigdndnnnnnV 11表表2 肿瘤患者生存曲钱比较的肿瘤患者生存曲钱比较的log-rank检验计算表检验计算表NCRT 46670

16、301411.T 53330301412.T NCRT 48270291411.T 51720301412.T dndnnnnnViii 11dndnnnnnViii 11248901.V 248902.V 249701.V 249702.V ggigiVTd22 c c111 d5416171.T 162 d458492.T 806451.VVi 806451.VVi 3707806455416171122.c c112 0070.P ggigiiVTdw22 c ciiiiigiigiigdndnnnnnwV 1122.Breslow 检验检验l Breslow检验检验(又称又称Wilco

17、xon检验检验),c c2统计量计算如下。其统计量计算如下。其中,中,d、T、V等的意义同等的意义同log-rank检验,检验,wi为权重。为权重。Breslow检验取检验取wi=ni,log-rank检验可看作检验可看作wi=1。ni通常逐通常逐渐减小,所以渐减小,所以Breslow检验给组间死亡的近期差别更大的检验给组间死亡的近期差别更大的权重,即对近期差异敏感;而权重,即对近期差异敏感;而log-rank检给组间死亡的远检给组间死亡的远期差别更大的权重,即对远期差异敏感。期差别更大的权重,即对远期差异敏感。6372.c cLog-rank Test and Wilcoxon Testl

18、由于权重不同,由两种方法得到差别有统计学意由于权重不同,由两种方法得到差别有统计学意义的难易度随生存函数的不同而不同。义的难易度随生存函数的不同而不同。ALog-rank检验检验易有统计学意义易有统计学意义时间01生存率BWilcoxon检验检验易有统计学意义易有统计学意义时间01生存率C两种检验方法都两种检验方法都不易有统计学差异不易有统计学差异时间01生存率l Log-rank检验和检验和Breslow检验也适用于寿命表资料及多组检验也适用于寿命表资料及多组生存率间的比较。生存率间的比较。l 实际死亡数实际死亡数A与理论死亡数与理论死亡数T之比称为之比称为相对死亡比相对死亡比(relati

19、ve death ratio),R=A/T。则。则相对危险度相对危险度(relative risk,RR)估估计值为两组相对死亡比之比。计值为两组相对死亡比之比。l Log-rank检验属单因素分析方法,应用条件是除比较因素检验属单因素分析方法,应用条件是除比较因素外,影响生存率的各混杂因素组间均衡可比,否则应采用外,影响生存率的各混杂因素组间均衡可比,否则应采用Cox比例风险回归模型校正各混杂因素的影响。比例风险回归模型校正各混杂因素的影响。111 d5416171.T 162 d458492.T 3.0cm0时,时,exp(i)1,说明,说明Xi增加时风险函数增加,即增加时风险函数增加,即

20、Xi为危险因素;当为危险因素;当 i0时,时,exp(i)1,说明,说明Xi增加时风险函增加时风险函数下降,即数下降,即Xi为保护因素为保护因素.当当 i=0时,时,exp(i)=1,说明,说明Xi增增加时风险函数不变,即加时风险函数不变,即Xi为危险无关因素。为危险无关因素。jmimmjijiXXXXXXRRln 222111l 回归系数回归系数 i的估什借助的估什借助部分似然部分似然(partial likelihood)理论理论。Cox比例风险模型的似然函数可分解为两部分:第比例风险模型的似然函数可分解为两部分:第1部分与部分与h0(t)和和 有关,第有关,第2部分只与部分只与 有关,部

21、分似然估计只考虑有关,部分似然估计只考虑第第2部分,采用最大似然估计得到回归系数估计值。部分部分,采用最大似然估计得到回归系数估计值。部分似然估计的似然估计的最大优点最大优点是是不需确定基准风险函数不需确定基准风险函数h0(t)的形式的形式就能估计回归系数就能估计回归系数,部分似然估计的另一特性是,部分似然估计的另一特性是仅与生仅与生存时间的排序有关存时间的排序有关,而不是生存时间的数值大小,这意味,而不是生存时间的数值大小,这意味着生存时间的单调变换,如对生存时间加一个常数、乘以着生存时间的单调变换,如对生存时间加一个常数、乘以一个常数或取对数,都不会改变回归系数的括计值。一个常数或取对数,

22、都不会改变回归系数的括计值。回归系数的检验方法回归系数的检验方法l 有三种。有三种。Score检验:常用于模型中新变量的引入检验:常用于模型中新变量的引入;Wald检验:常用于模型中不重要变量的剔除;检验:常用于模型中不重要变量的剔除;似然比检验:常用于模型中不重要变量的剔除和似然比检验:常用于模型中不重要变量的剔除和新变量的引入。新变量的引入。l 以上三种检验方法均为以上三种检验方法均为c c2检验,自由度为模型中检验,自由度为模型中待检验的参数个数。待检验的参数个数。例例3:某医院泌尿外科医师选择:某医院泌尿外科医师选择1996-2000年间经手年间经手术治疗的膀胱肿瘤患者术治疗的膀胱肿瘤

23、患者30例,对可能影响膀胱肿例,对可能影响膀胱肿瘤术后生存的因素进行了调查,研究者不仅要看瘤术后生存的因素进行了调查,研究者不仅要看是否出现了感兴趣的终点事件或结局是否出现了感兴趣的终点事件或结局(死亡死亡),还,还关心出现该结局所经历的时间长短,研究数据录关心出现该结局所经历的时间长短,研究数据录入入SPSS。Cox 回归分析应用回归分析应用l 筛选危险因素:强行进入、前向逐步、后退逐步筛选危险因素:强行进入、前向逐步、后退逐步等方法;等方法;l 校正混杂因素:分析危险因素,增加混杂因素;校正混杂因素:分析危险因素,增加混杂因素;l 多因素生存预测:预后指数多因素生存预测:预后指数(prog

24、nostic index,PI)mmXXXexpthth 22110常数常数PI估计生存率估计生存率PH假定的检测假定的检测l 检查某协变量是否满足检查某协变量是否满足PH假定,最简单的方法是观察按假定,最简单的方法是观察按该变量分组的该变量分组的Kaplan-Meier生存曲线,若生存曲线交叉,生存曲线,若生存曲线交叉,提示不满足提示不满足PH假定。第二种方法是绘制按该变量分组的假定。第二种方法是绘制按该变量分组的ln-lnS(t)对生存时间对生存时间t的图,曲线应大致平行或等距,的图,曲线应大致平行或等距,如各协变量均满足或近似满足如各协变量均满足或近似满足PH假定,可直接应用基本假定,可

25、直接应用基本Cox模型。模型。tSlnln agesizegraderelapse五、条件五、条件Logistic回归分析回归分析l 在设计阶段采用配对(匹配)方法对可能的混杂因素加以在设计阶段采用配对(匹配)方法对可能的混杂因素加以控制,有助于提高研究效率和可靠性。所谓的匹配研究指控制,有助于提高研究效率和可靠性。所谓的匹配研究指的是在病例的是在病例-对照研究中,对每一个或几个病例配以性别、对照研究中,对每一个或几个病例配以性别、年龄或其它条件相似的一个年龄或其它条件相似的一个(1:1)或几个或几个(1:M)对照。对照。分析匹配资料的统计分析方法一般采用条件分析匹配资料的统计分析方法一般采用

26、条件Logistic回归分析。回归分析。l 条件条件Logistic回归分析的数学模型以及分析原理方法均和回归分析的数学模型以及分析原理方法均和非条件非条件Logistic回归分析类似。因为参数的估计公式涉及回归分析类似。因为参数的估计公式涉及到条件概率理论,所以称为条件到条件概率理论,所以称为条件Logistic回归分析。回归分析。包括包括SPSS和和SAS在内的多数统计软件都没有为配对在内的多数统计软件都没有为配对Logistic模型提供直接拟合的方法,可通过模型的原理,模型提供直接拟合的方法,可通过模型的原理,将数据格式略加变换后采用其他方法来拟合。有两种方将数据格式略加变换后采用其他方

27、法来拟合。有两种方法最为常用法最为常用:1.用变量差值拟合:只适用于用变量差值拟合:只适用于1:1配对的情况,需求出差值,配对的情况,需求出差值,必须将同一对的病例和对照录入在一条记录中,这和通必须将同一对的病例和对照录入在一条记录中,这和通常的数据录入格式不一致。常的数据录入格式不一致。2.用分层用分层Cox模型来拟合用分层模型来拟合用分层Cox模型来拟合配对模型来拟合配对Logistic模型的适用范围非常广,模型的适用范围非常广,l:1配对、配对、1:n配对和配对和n:m配对的配对的时候都可以使用,分析得到的参数估计值和检验结果也时候都可以使用,分析得到的参数估计值和检验结果也完全相同。完

28、全相同。l Cox回归分析中,完全不考虑各层的基线风险函数回归分析中,完全不考虑各层的基线风险函数h0(t),而协变量系数而协变量系数 则在所有层中保持不变。而且作为半参数则在所有层中保持不变。而且作为半参数方法,方法,Cox模型在拟合时并不估计基线风险函数模型在拟合时并不估计基线风险函数h0(t),只,只估计各协变量的系数值估计各协变量的系数值。这和条件。这和条件Logistic模型中不关心模型中不关心 0大小,只求出系数值大小,只求出系数值 的思路恰巧一致,同时两者都是的思路恰巧一致,同时两者都是采用的采用的最大似然法最大似然法进行拟合。因此我们可以利用它来拟合进行拟合。因此我们可以利用它

29、来拟合条件条件Logistic模型:给每一条记录一个虚拟的生存时间,模型:给每一条记录一个虚拟的生存时间,一般默认病例比对照的生存时间短一般默认病例比对照的生存时间短(两时间差距大小随便两时间差距大小随便)。把匹配因素作为分层因素,这样就可以消除匹配因素的作把匹配因素作为分层因素,这样就可以消除匹配因素的作用,从而实现条件用,从而实现条件Logistic回归。回归。虚拟变量虚拟变量匹配因素匹配因素病例、对照,病例、对照,表示状态表示状态表表3 条件条件Logistic回归分析结果回归分析结果思考题思考题l 线性回归、线性回归、logistic回归和回归和Cox回归的区别。回归的区别。l Cox回归对样本含量有什么要求回归对样本含量有什么要求?(完全数据为变(完全数据为变量数的量数的10倍)倍)l Cox回归要求各协变量满足回归要求各协变量满足PH假定,若发现某协假定,若发现某协变量不满足变量不满足PH假定怎么办假定怎么办?(分层)(分层)l 为什么寿命表法生存曲线为折线形,而为什么寿命表法生存曲线为折线形,而Kaplan-Meier法生存曲线为阶梯形法生存曲线为阶梯形?

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 医疗、心理类
版权提示 | 免责声明

1,本文(生存分析医学课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|