1、Survival Analysis 上述生存资料若按通常的方法进行分析,有两方面的问题有两方面的问题:1n年生存率有时出现后一年大于前一年的现象。年生存率有时出现后一年大于前一年的现象。100%nnn活满 年的人数年生存率观察满 年的人数表1 某地19741981年胃癌根治术后随访记录年份例数生存年数12345678197429282523191817171719752624191818181616197624211916141413197732272321181619782523201616197936312926198025231919814636合计2432131541208566463
2、317 1974年年1981年共手术年共手术243例,例,1974年手术年手术29例,例,术后术后1年内死亡年内死亡1例,活满例,活满1年的年的28例,到例,到1982年末,活满年末,活满8年的年的17例。以次类推。例。以次类推。观察满1年的243例,活满1年的213例:1年生存率=21310087.65%243观察满2年的病例243-46=197例,活满2年的共154例:2年生存率=15410078.17%1976年生存率=58.23%7年生存率=60.00%8年生存率=58.62%由于由于失访失访或或死于其它疾病死于其它疾病而终止观察而终止观察等原因,分析时,当作存活或本病死亡均等原因,分
3、析时,当作存活或本病死亡均不合理,当作未观察病例则损失信息。因不合理,当作未观察病例则损失信息。因此,在观察例数较少同时截尾数据较多时,此,在观察例数较少同时截尾数据较多时,此法很不理想。此法很不理想。2.某时点某时点生存率不能反映整个生存过程,比较时可生存率不能反映整个生存过程,比较时可能出现不正确的结论。能出现不正确的结论。分析生存资料的统计方法称为分析生存资料的统计方法称为生存分析生存分析(survival analysis)。它是将事件的。它是将事件的结局结局和发生和发生这种结局所这种结局所经历的时间经历的时间两个因素综合起来分析两个因素综合起来分析的一种统计方法。它能够处理截尾数据,
4、的一种统计方法。它能够处理截尾数据,并对整个生存过程进行分析或比较。并对整个生存过程进行分析或比较。1临床治疗方案或处理措施的效果评价。临床治疗方案或处理措施的效果评价。如恶如恶性肿瘤手术或化疗后性肿瘤手术或化疗后(转移或死亡前转移或死亡前)生存时间、生存时间、肾移植术后生存时间、心脏起搏器的保留时间、肾移植术后生存时间、心脏起搏器的保留时间、种植牙的保留时间等。种植牙的保留时间等。2疾病危险因素分析和疾病预后的影响因素分析。疾病危险因素分析和疾病预后的影响因素分析。如肺癌发病危险因素分析、肾移植手术效果的影如肺癌发病危险因素分析、肾移植手术效果的影响因素分析等。响因素分析等。3特殊人群卫生保
5、健措施的效果评价。特殊人群卫生保健措施的效果评价。如中老如中老年糖尿病预防效果评价、青少年控制吸烟的健康年糖尿病预防效果评价、青少年控制吸烟的健康教育干预试验效果评价、食管癌高发区干预措施教育干预试验效果评价、食管癌高发区干预措施的效果评价、不同种类宫内节育器的节育效果评的效果评价、不同种类宫内节育器的节育效果评价价(宫内保留时间或有效避孕时间宫内保留时间或有效避孕时间)、某疫苗接种、某疫苗接种效果评价效果评价(观察抗体滴度了解免疫力持续时间或观察抗体滴度了解免疫力持续时间或某病发病率某病发病率)等。等。一一终点事件终点事件 终点事件终点事件(terminal event)又称又称失效失效事件
6、事件(failure event)或或“死亡死亡”事件事件(death event),泛指标志某种,泛指标志某种措施失败或失效的事件,反映治疗效果特征的事件,措施失败或失效的事件,反映治疗效果特征的事件,是根据研究目的确定的。如乳腺癌术后死亡、白血是根据研究目的确定的。如乳腺癌术后死亡、白血病化疗后复发、肾移植术后的肾衰等,均可作为病化疗后复发、肾移植术后的肾衰等,均可作为“死亡死亡”事件。事件。二二生存时间生存时间 生存时间生存时间(survival time)也是一个广义概念,也是一个广义概念,泛指所关心的某现象的持续时间,即随访观察泛指所关心的某现象的持续时间,即随访观察持续的时间,常用
7、符号持续的时间,常用符号t表示。表示。表表2 6例乳腺癌患者术后随访记录例乳腺癌患者术后随访记录 患者患者编号编号观察记录观察记录生存天数生存天数t开始日期开始日期终止日期终止日期结局结局(死死=1,生,生=0)原因原因 102-09-0302-12-290死于肺癌死于肺癌118 202-09-1002-12-081转移死亡转移死亡90 302-09-1402-12-310研究终止研究终止108 402-08-2502-11-290失失 访访 96 502-10-0102-11-280死于车祸死于车祸 59 602-10-0402-12-281复发死亡复发死亡86 生存时间生存时间分为两种类型
8、:分为两种类型:1完全完全数据数据(complete data):指从观察起点到:指从观察起点到发生发生“死亡死亡”事件事件所经历的时间。提供了观察所经历的时间。提供了观察对象确切的生存时间。对象确切的生存时间。2截尾截尾数据数据(censored data):亦称截尾值:亦称截尾值(censored value)或终检值。指从观察起点到发或终检值。指从观察起点到发生生非非“死亡死亡”事件事件所经历的时间。所经历的时间。截尾截尾原因大致有三种情况:原因大致有三种情况:1.失访失访:未继续就诊、拒绝访问或搬迁而失去联系。:未继续就诊、拒绝访问或搬迁而失去联系。2.死于与研究疾病死于与研究疾病无关
9、无关的原因:由于其他原因死亡。的原因:由于其他原因死亡。3.研究研究终止终止:研究结束时终点事件尚未发生。:研究结束时终点事件尚未发生。截尾数据截尾数据不能提供完全的信息,真实的生存时间不能提供完全的信息,真实的生存时间未知,只知道比观察到的截尾时间长,常用符号未知,只知道比观察到的截尾时间长,常用符号“”表示。表示。生存资料生存资料的特点:的特点:1.有生存结局、生存时间有生存结局、生存时间2.有不确定数据(截尾数据)有不确定数据(截尾数据)3.分布呈指数分布、分布呈指数分布、Weibull分布、对数正分布、对数正态分布、对数态分布、对数logistic分布等分布等三三死亡概率死亡概率 死亡
10、概率死亡概率(probability of death)表示单位时表示单位时间段开始存活的个体,在该段时间内死亡的可间段开始存活的个体,在该段时间内死亡的可能性。符号能性。符号q表示。表示。q 某年内死亡人数某年年初人口数四四生存概率生存概率 生存概率生存概率(probability of survival)表示单位表示单位时间段开始存活的个体,到该段时间结束时仍时间段开始存活的个体,到该段时间结束时仍存活的可能性。符号存活的可能性。符号p表示。表示。p 某年活满一年人数某年年初人口数1pq 五五生存率生存率 生存率生存率(survival rate,survival function)表示表
11、示观察对象经历观察对象经历tk个个单位时间段后仍存活的可能性。单位时间段后仍存活的可能性。0()1S t。若。若无截尾数据无截尾数据,则,则()()kkktS tP Tt时刻仍存活的例数观察总例数 若若有截尾数据有截尾数据,须分时段计算生存概率。假,须分时段计算生存概率。假定观察对象在各个时段的生存事件独立,应用概定观察对象在各个时段的生存事件独立,应用概率乘法定理:率乘法定理:12()().kkkS tP Ttp pp pi某时段的生存概率,故生存率又称累积生存概率某时段的生存概率,故生存率又称累积生存概率(cumulative probabilityof survival)。图图1 生存概
12、率与生存率示意图生存概率与生存率示意图0231第第1年生存概率年生存概率第第2年生存概率年生存概率第第3年生存概率年生存概率1年生存率年生存率2年生存率年生存率3年生存率年生存率 生存率生存率也是一个广义概念,研究者定义的也是一个广义概念,研究者定义的“死亡死亡”事件不同,其含义亦不同。事件不同,其含义亦不同。白血病化疗的失败事件是白血病复发,生存率即白血病化疗的失败事件是白血病复发,生存率即为缓解率;为缓解率;预防接种腮腺炎疫苗后,接种儿童发生腮腺炎为预防接种腮腺炎疫苗后,接种儿童发生腮腺炎为失败事件,此时生存率为疫苗有效率;失败事件,此时生存率为疫苗有效率;安放宫内节育器,失败事件定义为因
13、节育器引起安放宫内节育器,失败事件定义为因节育器引起的腹痛、出血过多、感染等副作用,或带环受孕导致的腹痛、出血过多、感染等副作用,或带环受孕导致取出节育器,此时生存率即为节育器保留率。取出节育器,此时生存率即为节育器保留率。六六生存曲线生存曲线 生存曲线生存曲线(survival curve):以生存时间为以生存时间为横轴,将各个时点所对应的生存率连接在一起横轴,将各个时点所对应的生存率连接在一起的曲线图。的曲线图。图图2 生存曲线生存曲线七七中位生存时间中位生存时间 中位生存时间中位生存时间(median survival time):又又称半数生存期,表示恰好有称半数生存期,表示恰好有50
14、的个体尚存活的个体尚存活的的 时间。时间。估计方法:估计方法:图解图解法法 线性内插线性内插法法统计描述统计描述:计算生存率、绘制生存率曲线、:计算生存率、绘制生存率曲线、计算中位生存时间等。计算中位生存时间等。统计推断统计推断:估计总体生存率的可信区间、:估计总体生存率的可信区间、生存率曲线的比较。生存率曲线的比较。影响因素、预测 1.非参数法非参数法:特点是不论资料是什么样的分布类特点是不论资料是什么样的分布类型,只根据样本提供的顺序统计量对生存率进型,只根据样本提供的顺序统计量对生存率进行估计,常用行估计,常用乘积极限法乘积极限法和和寿命表法寿命表法。2.参数法参数法:特点是假定生存时间
15、服从于特定的参数特点是假定生存时间服从于特定的参数分布,根据已知分布的特点对影响生存的时间进分布,根据已知分布的特点对影响生存的时间进行分析,常用行分析,常用指数分布指数分布法、法、Weibull分布分布法、法、对数对数正态回归分析正态回归分析法和法和对数对数logistic回归分析法回归分析法。3.半参数法半参数法:介于参数法和非参数法之间,一般属介于参数法和非参数法之间,一般属多因素分析方法,用于探讨生存过程的主要影响多因素分析方法,用于探讨生存过程的主要影响因素,其经典方法是因素,其经典方法是Cox比例风险回归模型。比例风险回归模型。一、随访内容一、随访内容 1开始随访的时间开始随访的时
16、间:入:入(出出)院时间、确诊时院时间、确诊时间、开始治疗时间等可作为随访开始的时间。如间、开始治疗时间等可作为随访开始的时间。如乳腺癌的乳腺切除术后第一天或出院日、白血病乳腺癌的乳腺切除术后第一天或出院日、白血病化疗后缓解出院日等,也可规定开始治疗日为随化疗后缓解出院日等,也可规定开始治疗日为随访开始时间访开始时间。2随访的结局随访的结局和和终止随访的时间终止随访的时间 随访的结局可能有以下几种:随访的结局可能有以下几种:(2)失访失访:拒绝随访、失去联系或中途退出等。终:拒绝随访、失去联系或中途退出等。终止随访时间为最后一次访问时间。止随访时间为最后一次访问时间。(1)“死亡死亡”:泛指处
17、理措施失败的事件。如肿瘤:泛指处理措施失败的事件。如肿瘤化疗后的复发、肾移植因肾衰或与之有关的原因化疗后的复发、肾移植因肾衰或与之有关的原因而死亡等。终止随访时间为而死亡等。终止随访时间为“死亡死亡”时间。时间。(3)死于与死于与研究疾病研究疾病无关无关的原因的原因:终止随访时终止随访时间为死亡时间。间为死亡时间。(4)研究研究终止终止。研究终止时观察对象仍然存活。研究终止时观察对象仍然存活。终止随访时间为研究终止时间。终止随访时间为研究终止时间。3影响生存的有关因素影响生存的有关因素:如患者年龄、病情、:如患者年龄、病情、病程、术前健康等情况,以便分析这些因素对病程、术前健康等情况,以便分析
18、这些因素对生存率的影响。生存率的影响。二、随访方式二、随访方式 1全部观察对象同时接受处理措施,观察到全部观察对象同时接受处理措施,观察到最后一例出现结果或事先规定的随访截止时间。最后一例出现结果或事先规定的随访截止时间。03060901201501800.01.02.03.04.05.06.07.0 图图3 随访资料常见形式示意图随访资料常见形式示意图 2观察对象在不同时间接受处理措施,完成观察对象在不同时间接受处理措施,完成一定数量随访病例或按事先规定的时间停止随访。一定数量随访病例或按事先规定的时间停止随访。789101112130.01.02.03.04.05.06.07.0 图图4
19、随访资料常见形式示意图随访资料常见形式示意图 乘积极限法乘积极限法(product-limit estimate)又称又称Kaplan-Meier法,适用于法,适用于未分组未分组生存资料的分析。生存资料的分析。例例16-1 14例膀胱肿瘤例膀胱肿瘤3.0cm患者和患者和16例膀胱肿瘤例膀胱肿瘤3.03.0患者的生存时间(月)如下,患者的生存时间(月)如下,试估计两组各时点生存率试估计两组各时点生存率及其标准误、各时点总体生存率的及其标准误、各时点总体生存率的95%可信区间、中位可信区间、中位生存时间,并绘制生存曲线。生存时间,并绘制生存曲线。肿瘤肿瘤3.0cm14192628293236404
20、244+4553+5459+肿瘤肿瘤3.0cm67910111213202325273034374350表表3 肿瘤肿瘤3.0cm组生存率及标准误的计算组生存率及标准误的计算生存时间生存时间t死亡数死亡数dt期初病例数期初病例数nt截尾截尾数数ct死亡概率死亡概率qt生存概率生存概率pt生存率生存率S(t)生存率标准误生存率标准误SES(t)1411401/14=0.07140.92860.92680.06881911301/13=0.07690.92310.85720.09352611201/12=0.08330.91670.78580.10972811101/11=0.09090.9091
21、0.71440.12072911001/10=0.10000.90000.64290.128132190 1/9=0.11110.88890.57150.132336180 1/8=0.12500.87500.50010.133640170 1/7=0.14290.85710.42860.132342160 1/6=0.16670.83330.35710.128144051 0/5=0.00001.00000.35710.128145140 1/4=0.25000.75000.26780.123353031 0/3=0.00001.00000.26780.123354120 1/2=0.500
22、00.50000.13390.113059011 0/1=0.00001.00000.13390.1130 1生存时间生存时间t:由小到大排列,遇非截尾和截尾值相:由小到大排列,遇非截尾和截尾值相同,截尾值排后。同,截尾值排后。2死亡数死亡数dt:与生存时间:与生存时间t对应。注意:截尾值对应对应。注意:截尾值对应的个体未发生的个体未发生“死亡死亡”事件,故死亡数为事件,故死亡数为0。3期初病例数期初病例数nt,表示恰好在该时刻以前的病例数。,表示恰好在该时刻以前的病例数。如如n29为为10,表示恰好在,表示恰好在29月时点前有月时点前有10人存活。人存活。4死亡概率死亡概率qt,表示,表示t
23、月前的观察对象恰好在月前的观察对象恰好在t月时点月时点死亡的概率。死亡的概率。5生存概率生存概率pt,表示,表示t月前的观察对象恰好在月前的观察对象恰好在t月时点月时点存活的概率。存活的概率。6生存率生存率S(t)。表示该人群恰好活过。表示该人群恰好活过t 时刻的概率。它时刻的概率。它为小于和等于为小于和等于 t 时刻的各时点生存概率的乘积。时刻的各时点生存概率的乘积。7生存率的标准误生存率的标准误SES(t)。1()()()ttS tSE S tS tnd/2()()S tuSE S t 假定生存率近似服从正态分布,某时点总体生存率假定生存率近似服从正态分布,某时点总体生存率的的(1 1a)
24、可信区间,公式为:可信区间,公式为:本例本例28月总体生存率的月总体生存率的95可信区间:可信区间:0.7144 1.96 0.1207 即膀胱肿瘤即膀胱肿瘤3.0cm患者患者28月生存率的月生存率的95%可信区间为可信区间为47.7895.10%。生存曲线尾部的生存率不适合于用该法计算总体生存率的可信区间。生存曲线尾部的生存率不适合于用该法计算总体生存率的可信区间。由表由表3可见,中位生存时间估计在可见,中位生存时间估计在36月。月。采用采用内插法内插法计算:找到与生存率计算:找到与生存率50相邻的相邻的上下上下两个生两个生存率及存率及 其生存时间利用线性比例关系求解中位生存时间。其生存时间
25、利用线性比例关系求解中位生存时间。若各时间点生存率若各时间点生存率均均大于大于50,则无法估计中位生存,则无法估计中位生存时间。时间。若生存率若生存率0.5处所对应的曲线与处所对应的曲线与X轴平行,则中位生存轴平行,则中位生存时间不止一个。时间不止一个。图图5 肿瘤肿瘤3.0cm组生存曲线组生存曲线死亡时点生存率,死亡时点生存率,KaplanMeier法法生存曲线为生存曲线为阶梯形阶梯形曲线。曲线。拐点的纵坐标值拐点的纵坐标值在下一个台阶在下一个台阶曲曲线线高高度度下下降降坡坡度度图图6 肿瘤肿瘤3.0cm组和肿瘤组和肿瘤3.0cm生存曲线生存曲线 适用于适用于分组分组的生存资料。的生存资料。
26、实际工作中,随访结果常常实际工作中,随访结果常常没有没有每个每个观察对象观察对象确切确切的生存时间,只能获得按随的生存时间,只能获得按随访时间分组的资料。访时间分组的资料。当样本较大当样本较大(如如n 50)时,采用乘积极时,采用乘积极限法估计生存率及其标准误较为繁琐。限法估计生存率及其标准误较为繁琐。例例16-2 收集收集374名某恶性肿瘤患者随访资料,取时间区名某恶性肿瘤患者随访资料,取时间区间均为间均为1年,结果间下表,年,结果间下表,试估计生存率及其标准误,中试估计生存率及其标准误,中位生存时间,并绘制生存曲线。位生存时间,并绘制生存曲线。序号序号确诊后年数确诊后年数期内死亡数期内死亡
27、数期内截尾数期内截尾数期初病例数期初病例数 1090 0374 2176 0284 3251 0208 432512157 5420 5120 65 7 9 95 76 4 9 79 87 1 3 66 98 3 5 6210910 2 5 54表表4 某恶性肿瘤患者随访资料某恶性肿瘤患者随访资料大样本、分大样本、分组(生存时组(生存时间粗略)、间粗略)、截尾截尾 1.确诊后年数确诊后年数t:“0”表示从确诊日起不满一表示从确诊日起不满一年,年,“1”表示确诊后表示确诊后1年至不满年至不满2年,依次类推。年,依次类推。3期内截尾数期内截尾数ct:泛指具有截尾数据的人,表示:泛指具有截尾数据的人
28、,表示随访已满随访已满t年年,但在未满,但在未满t+1月期间失访的人。月期间失访的人。2期内死亡数期内死亡数dt:指期内死于某恶性肿瘤的人数。:指期内死于某恶性肿瘤的人数。4期初观察例数期初观察例数nt:指时刻:指时刻t以前的人数。以前的人数。5期初有效例数期初有效例数nt:相当于实际观察人时数。在:相当于实际观察人时数。在各年年初观察人数中减去同年截尾数的一半。各年年初观察人数中减去同年截尾数的一半。6死亡概率死亡概率qt,指活满,指活满t年的病人在年的病人在t1年内死亡的年内死亡的的概率。的概率。7生存概率生存概率pt,指活满,指活满t年的病人在年的病人在t1年内存活的年内存活的概率。概率
29、。8生存率生存率S(t),表示活过,表示活过t年年的概率。它为小于和等于的概率。它为小于和等于 t 时刻的各时点生存概率的乘积。时刻的各时点生存概率的乘积。9生存率的标准误生存率的标准误SES(t)。确诊后年确诊后年数数t期内死亡数期内死亡数dt期内截尾数期内截尾数ct期初病例数期初病例数nt期初有效例数期初有效例数nt死亡概率死亡概率qt生存概率生存概率pt生存率生存率S(t)生存率标准误生存率标准误SES(t)090 0374374.090/374.0=0.24060.75940.75940.0221176 0284284.076/284.0=0.26760.73240.55620.025
30、7251 0208208.051/208.0=0.4520.75480.41980.025532512157151.025/151.0=0.16560.83440.35030.0248420 5120117.520/117.5=0.17020.82980.29070.02395 7 9 95 90.5 7/90.5=0.07730.92270.26820.0235 6 4 9 79 74.5 4/74.5=0.05370.94630.25380.0233 7 1 3 66 64.5 1/64.5=0.01550.98450.2499 0.02338 3 5 62 59.5 3/59.5=0.0
31、5040.94960.23730.0232 910 2 5 54 51.5 2/51.5=0.03880.96120.22810.0232 表表5 寿命表法估计生存率计算表寿命表法估计生存率计算表图图7 某恶性肿瘤生存曲线(寿命表法)某恶性肿瘤生存曲线(寿命表法)折线形曲线,各折线形曲线,各组段对应的生存组段对应的生存率在上限处率在上限处每组内两个时点每组内两个时点生存率不相同,生存率不相同,不祥其变化规律。不祥其变化规律。中位生存时间中位生存时间图解法(23):(2)(0.55620.4198):(0.55620.5)t线性内插线性内插法法(23)(0.55620.5)22.410.5562
32、0.4198t(1)样本由随机抽样方法获得,并应有足够的数量;样本由随机抽样方法获得,并应有足够的数量;(2)死亡例数不能太少死亡例数不能太少(30);(3)截尾值比例不能太大;截尾值比例不能太大;(4)生存时间尽可能精确到天数,因为多数生存分析生存时间尽可能精确到天数,因为多数生存分析方法都在生存时间排序的基础上作统计处理的,即方法都在生存时间排序的基础上作统计处理的,即使是小小的舍入误差,也可能改变生存时间顺序而使是小小的舍入误差,也可能改变生存时间顺序而影响结果。影响结果。生存资料生存资料的基本要求:的基本要求:例例16-3 比较比较膀胱肿瘤膀胱肿瘤3.0cm患者和患者和16例膀胱肿瘤例
33、膀胱肿瘤3.03.0患者的患者的生存曲线是否有差别。生存曲线是否有差别。秩和检验?log-rank检验检验 对数秩检验,非参数检验法,其零假设为对数秩检验,非参数检验法,其零假设为两总体生存曲线相同,但检验过程一般不估计生两总体生存曲线相同,但检验过程一般不估计生存率,而利用死亡数和死亡率函数作统计推断。存率,而利用死亡数和死亡率函数作统计推断。22()gggATV(组数1)2基本思想基本思想:当:当H0成立时,根据成立时,根据t时点的死亡率,时点的死亡率,计算出各组的理论死亡数,则检验统计量:计算出各组的理论死亡数,则检验统计量:检验统计量检验统计量 近似服从近似服从 的的 分布。分布。2(
34、1)()1gigiiigiinnndVdninin22()A TT2(组数1)检验统计量检验统计量 近似服从近似服从 的的 分布。分布。2亦可用公式亦可用公式例例16-3 两条生存曲线比较步骤:两条生存曲线比较步骤:H0:两总体的生存曲线:两总体的生存曲线位置位置相同相同H1:两总体的生存曲线:两总体的生存曲线位置位置不同不同a 0.05 (1)将两组资料混合后统一按生存时间将两组资料混合后统一按生存时间(t)排序:排序:n1i、n2i分别表示两组观察病例数,分别表示两组观察病例数,ni n1in2i。(2)分别列出各组在时间分别列出各组在时间t的期初例数的期初例数ngi 和和dgi,两组,两
35、组合计的期初合计的期初例数例数ni和死亡例数和死亡例数 di。(3)计算各组在时间计算各组在时间t上的理论死亡上的理论死亡Tgi:giigiin dTn各时间各时间t上都对应一个四格表,以第一个上都对应一个四格表,以第一个6(月)为例:(月)为例:组别组别死亡数死亡数未死亡数未死亡数合计合计肿瘤肿瘤3.0cm01414肿瘤肿瘤3.0cm11516合计合计12930表表6 理论死亡数计算表(以第一个理论死亡数计算表(以第一个6月为例)月为例)(4)计算各组合计的实际死亡数和理论死亡计算各组合计的实际死亡数和理论死亡序号序号(1)时间时间(2)肿瘤肿瘤3.0cm肿瘤肿瘤3.0cm合计合计n1i(3
36、)d1i(4)T1i(5)V1i(6)n2i(7)d2i(8)T2i(9)V2i(10)ni(11)di(12)161400.46670.24891610.53330.2489301271400.48270.24971510.51720.2497291391400.50000.25001410.50000.2500281合计合计1117.54165.8064169.45845.806427 表表7 肿瘤肿瘤3.0cm和肿瘤和肿瘤3.0cm生存曲线比较的生存曲线比较的logrank检验计算表检验计算表 (5)计算计算 统计量统计量222(11 17.5416)7.375.806422(169.4
37、584)7.375.8064肿瘤肿瘤3.0cm:肿瘤肿瘤3.0cm:1 查界值表,查界值表,0.005P0.010,按,按a0.05水准,水准,拒绝拒绝H0,接受,接受H1,可认为两条生存曲线位置不同,可认为两条生存曲线位置不同,肿瘤肿瘤3.0cm患者生存率高于肿瘤患者生存率高于肿瘤3.0cm患者。患者。应用及注意事项应用及注意事项1.相对死亡比相对死亡比(relative death ratio):实际死亡数):实际死亡数A与与理论死亡数理论死亡数T之比,则相对危险度(之比,则相对危险度(relative risk,RR)估计值为两组相对死亡比率之比。估计值为两组相对死亡比率之比。肿瘤肿瘤3
38、.0cm患者与肿患者与肿瘤瘤3.0cm患者相比患者相比111222/11/17.54160.37/16/9.4584RA TRRRAT即肿瘤即肿瘤3.0cm患者死亡风险是肿瘤患者死亡风险是肿瘤3.0cm患者死亡风险患者死亡风险的的37;肿瘤;肿瘤3.0cm患者患者对对肿瘤肿瘤3.0cm患者患者RR2.69,即肿瘤即肿瘤3.0cm 患者死亡风险是肿瘤患者死亡风险是肿瘤3.0cm患者死亡风险患者死亡风险的的2.69倍倍。2.logrank检验:用于整条生存曲线的比较,若比较检验:用于整条生存曲线的比较,若比较两条生存曲线某时点的生存率,如两条生存曲线某时点的生存率,如2年生存率,按下式年生存率,按
39、下式例例16-1数据,肿瘤数据,肿瘤3.0cm患者组和肿瘤患者组和肿瘤3.0cm患者组患者组2年生存年生存率分别是率分别是0.8572和和0.4375,标准误分别为,标准误分别为0.0935和和0.1240,122212()()()()S tS tuSE S tSE S t220.85720.43752.700.09350.1240uP0.01,两组间,两组间2年生存率差别有统计学意义。年生存率差别有统计学意义。3.logrank检验:单因素分析,应用条件是除比较因素外,检验:单因素分析,应用条件是除比较因素外,影响生存率的各混杂因素组间均衡可比,否则采用影响生存率的各混杂因素组间均衡可比,否
40、则采用Cox比例比例风险回归模型。风险回归模型。若比较多个时点生存率,检验水准应取若比较多个时点生存率,检验水准应取Bonferroni校正,校正,即即 其中其中k为比较次数,以保证总的为比较次数,以保证总的型错误概率不超过型错误概率不超过 。/k对数秩检验也可用于对数秩检验也可用于三组三组生存曲线的比较生存曲线的比较。由对数秩检验过程可知,若每一时点由对数秩检验过程可知,若每一时点A组死亡率组死亡率都高一点都高一点(生存率低一点生存率低一点),则检验结果必然为,则检验结果必然为A不同不同于于B。因此,在比较的两条生存率曲线无交叉时,直。因此,在比较的两条生存率曲线无交叉时,直接用对数秩检验是合适的。反之,就需进一步分析原接用对数秩检验是合适的。反之,就需进一步分析原因,了解是否存在混杂因素的影响。因,了解是否存在混杂因素的影响。