1、肿瘤登记资料的统计分析肿瘤登记资料的统计分析 -生存分析生存分析河南省肿瘤防治研究办公室河南省肿瘤防治研究办公室孙喜斌孙喜斌电话电话 0371-65587346 13838063621Email 第1页,共72页。生存率生存率分析分析内容:内容:l 基本概念基本概念l 观察生存率观察生存率l 相对生存率相对生存率l 统计学检验统计学检验 第2页,共72页。基本概念基本概念生存分析是一类时间到事件变量数据的分析生存分析是一类时间到事件变量数据的分析(analysis of time-to-event data)。)。医学研究中用生存分析这一术语(工业工程医学研究中用生存分析这一术语(工业工程中则
2、称作寿命时间分析或失效时间分析)。中则称作寿命时间分析或失效时间分析)。时间到事件变量三个基本限定:时间到事件变量三个基本限定:1)起点的时间是明确的。)起点的时间是明确的。2)指标单位(时、天、月、年)要统一。)指标单位(时、天、月、年)要统一。3)事件发生的界定要明确。)事件发生的界定要明确。第3页,共72页。时间时间-事件变量由于存在截尾数据及反应变量事件变量由于存在截尾数据及反应变量往往呈非正态分布,故应用标准的统计方法往往呈非正态分布,故应用标准的统计方法处理是不合适的。处理是不合适的。生存率是一比例(不是率),但习惯上称作生存率是一比例(不是率),但习惯上称作率。率。生存率是肿瘤登
3、记数据的常用统计指标。生存率是肿瘤登记数据的常用统计指标。临床疗效评价中常用的痊愈率、有效率、病临床疗效评价中常用的痊愈率、有效率、病死率等百分率指标,其统计效能较差。死率等百分率指标,其统计效能较差。第4页,共72页。例子例子1人群人群110000人随访人随访3年年15人在人在1年内死亡年内死亡9985人在随访结束时人在随访结束时存活存活死亡率死亡率=5/10000(年(年)人群人群210000人随访人随访3年年15人在人在3年内死亡年内死亡9985人在随访结束时人在随访结束时存活存活死亡率死亡率=5/10000(年)第5页,共72页。例子例子2人群人群110000人随访人随访3年年15人在
4、人在1年内死亡年内死亡9985人在随访结束时人在随访结束时存活存活死亡率死亡率=5/10000(年)(年)人群人群210000人随访人随访3年年15人在人在3年内死亡年内死亡9985人在随访结束时人在随访结束时存活存活其中有其中有10人在结束时人在结束时失访失访死亡率死亡率=5/10000(年)(年)第6页,共72页。生存(失效)时间的界定生存(失效)时间的界定 癌症诊断到死亡的时间癌症诊断到死亡的时间 癌症临床实验中随机分组到死亡的时间癌症临床实验中随机分组到死亡的时间 随机分组到癌症复发的时间随机分组到癌症复发的时间 淋巴瘤治疗期间缓解到复发的时间淋巴瘤治疗期间缓解到复发的时间 HIV感染
5、到死亡的时间感染到死亡的时间 电灯(可)使用的时间电灯(可)使用的时间各学科中均涉及这类变量的处理。各学科中均涉及这类变量的处理。第7页,共72页。生存分析应用生存分析应用 研究群体的率在观察期内不一致(动态)研究群体的率在观察期内不一致(动态)关心生存时间的长短关心生存时间的长短 截尾观察存在截尾观察存在第8页,共72页。生存时间的计算生存时间的计算时间时间=开始的日期到:开始的日期到:1.研究(观察)结束的日期(研究对象仍存活)研究(观察)结束的日期(研究对象仍存活)2.退出研究的日期退出研究的日期3.死亡日期(如果对象在随访研究结束前死亡)死亡日期(如果对象在随访研究结束前死亡)第9页,
6、共72页。终检(终检(Censoring,截尾),截尾)截尾记录:被观察的个体在整个随访期间未有关注的事件(死截尾记录:被观察的个体在整个随访期间未有关注的事件(死亡、复发等)发生。亡、复发等)发生。截尾生存时间发生原因:截尾生存时间发生原因:1.观察期限已到观察期限已到2.失访,随访不完整失访,随访不完整3.不相关的事件发生(如,在癌症研究中,观察对象在随访期间死于不相关的事件发生(如,在癌症研究中,观察对象在随访期间死于意外伤害)意外伤害)失访终检(有信息性),终末终检(非信息)失访终检(有信息性),终末终检(非信息)终检要尽量避免,尤其是失访终检终检要尽量避免,尤其是失访终检第10页,共
7、72页。生存分析所需信息生存分析所需信息 观察对象的确定(癌肿、性别、地区、时观察对象的确定(癌肿、性别、地区、时期)期)起始点的限定起始点的限定 终点事件的限定(二项变量)终点事件的限定(二项变量)观察终点的确定(截至日期)观察终点的确定(截至日期)观察对象的生存时间观察对象的生存时间第11页,共72页。随访方法随访方法 死亡证书(生命统计系统)死亡证书(生命统计系统)人口登记系统人口登记系统 临床记录临床记录 信访信访 电话随访电话随访 家访家访第12页,共72页。观察生存率的计算方法观察生存率的计算方法直接法直接法寿命表法(寿命表法(Life-table method,actuarial
8、 method)极限乘积法(极限乘积法(Kaplan-Meier method)第13页,共72页。直接法直接法随访期结束时存活病人的比例随访期结束时存活病人的比例 每个观察对象均要随访够限定的期限(如每个观察对象均要随访够限定的期限(如5年,除非死亡事件发生)年,除非死亡事件发生)失访病例除外(不能处理截尾数据)失访病例除外(不能处理截尾数据)不考虑存活时间长短不考虑存活时间长短 信息丢失信息丢失 该方法基本不用,如果观察对象中没有终检病例,该法得到的生存率结果与该方法基本不用,如果观察对象中没有终检病例,该法得到的生存率结果与寿命表法和寿命表法和K-M法的结果相同。法的结果相同。中位生存时
9、间:中位生存时间:50%病人存活过的时间。病人存活过的时间。第14页,共72页。第15页,共72页。生存概率计算生存概率计算假如假如34例病例在观察期间(例病例在观察期间(5年)有年)有10例死例死亡,亡,24例存活,那么死亡概率为:例存活,那么死亡概率为:q=10/34=0.29=29%生存概率:生存概率:p=24/34=0.71=71%死亡概率死亡概率+生存概率生存概率=1 q+p=1P=1-0.29=0.71=71%第16页,共72页。寿命表法寿命表法 考虑到每个观察对象的生存过程考虑到每个观察对象的生存过程 包含终检观察数据包含终检观察数据第17页,共72页。失访的注释失访的注释(保险
10、统计的假定保险统计的假定)失访可定为截至日期前终检:失访终检失访可定为截至日期前终检:失访终检 失访终检是有信息的,越低越好。失访终检是有信息的,越低越好。(保险统计)假定:(保险统计)假定:1、平均考虑,在一随访时段内,失访病例将存活一半的时、平均考虑,在一随访时段内,失访病例将存活一半的时 间。间。2、这一时段内,每一失访病例贡献、这一时段内,每一失访病例贡献1/2的生存时间。的生存时间。3、失访病例的后续生存经历与该时段内随访完整病例的相同。、失访病例的后续生存经历与该时段内随访完整病例的相同。4、将、将1/2的失访病例看作完整数据的失访病例看作完整数据。第18页,共72页。寿命表(寿命
11、表(LT)法公式:)法公式:i=1,2,.,mi=1,2,.,m;用用 n n(t ti i)、d d(t ti i)、w w(t ti i)分别表示在时间分别表示在时间或随访区间或随访区间t t的期初存活病例数、期内死的期初存活病例数、期内死亡数、期内终检数。亡数、期内终检数。()()()()Std tn tw tLTiiii12第19页,共72页。有效观察病例数有效观察病例数l 总的生存人数是计算死亡概率的分母。总的生存人数是计算死亡概率的分母。l 失访减少了分母的数量。失访减少了分母的数量。l 有效观察数有效观察数 ni=ni-wi/2第20页,共72页。寿命表数据寿命表数据:某市某区某
12、市某区1972-791972-79年期间男性肺癌新病例随访结果年期间男性肺癌新病例随访结果 (截止时刻(截止时刻19791979年年1212月月31 31 日)日)确诊日期起确诊日期起 期内死亡期内死亡 其中死于其中死于 其中死于其他其中死于其他 生存者随访未满生存者随访未满随访期间随访期间 总例数总例数 肺癌肺癌 因因的例数的例数 个期间的例数个期间的例数 (包括期内失访包括期内失访)d w (1 1)(2 2)(3 3)(4 4)(5 5)0 0月月 291 290 1 34 291 290 1 343 3月月 210 210 0 12 210 210 0 126 6月月 138 138
13、0 27 138 138 0 279 9月月 92 92 0 12 92 92 0 121 1年年 206 203 3 21 206 203 3 212 2年年 45 45 0 9 45 45 0 93 3年年 8 8 0 11 8 8 0 114 4年年 4 4 0 11 4 4 0 115 5年年 21 21第21页,共72页。寿命表格式寿命表格式:某市某区某市某区1972-791972-79年期间男性肺癌观察生存率的计算年期间男性肺癌观察生存率的计算确诊日期起确诊日期起 期初观期初观 期内死亡期内死亡 有效观有效观 死亡概率死亡概率 生存概率生存概率 累积生存概率累积生存概率 随访期间随
14、访期间 察例数察例数 总例数总例数 察人数察人数 n d n n d n q q p p SR SR(1 1)(2 2)(3 3)(4 4)(5 5)(6 6)(7 7)0 0月月 1152 291 1135 1152 291 1135 0.2564 0.7436 0.74360.2564 0.7436 0.74363 3月月 827 210 821 827 210 8210.25580.2558 0.7442 0.5534 0.7442 0.55346 6月月 605 138 591.5 605 138 591.50.2333 0.7667 0.42430.2333 0.7667 0.424
15、39 9月月 440 91 434 440 91 434 0.2120 0.7880 0.2120 0.7880 0.33430.33431 1年年 336 206 325.5 336 206 325.50.6329 0.3671 0.12270.6329 0.3671 0.12272 2年年 109 45 104.5 109 45 104.5 0.4306 0.5694 0.06990.4306 0.5694 0.06993 3年年 55 8 49.5 55 8 49.5 0.1616 0.8384 0.05860.1616 0.8384 0.05864 4年年 36 4 30.5 36 4
16、 30.5 0.1311 0.8689 0.05090.1311 0.8689 0.05095 5年年 21 21 0.74360.74360.74420.74420.76670.76670.7880=0.7880=0.33430.3343 11353421115282112218272564.011352912558.0821210第22页,共72页。l估计各个时段的生存概率:估计各个时段的生存概率:期内死亡概率期内死亡概率=死亡数死亡数/有效观察人数有效观察人数 0 期初人数期初人数1152(n1)期内死亡人数期内死亡人数291(d1)期内终检人数期内终检人数34(w1)期内有效观察人数期
17、内有效观察人数 n1=1152-34/2=1135 该时段死亡概率该时段死亡概率 q1=291/1135=0.2564 该时段生存概率该时段生存概率 p1=1-0.2564=0.7436下一时段的期初人数下一时段的期初人数=上一期初人数上一期初人数-上一期内死亡人数上一期内死亡人数-上期内终检人数上期内终检人数 如如:3 期初人数期初人数=1152-291-34=827以此类推。以此类推。计算步骤第23页,共72页。l 计算累计生存概率(生存率)计算累计生存概率(生存率)各个时段的生存概率相乘即得(各年的)生存率。各个时段的生存概率相乘即得(各年的)生存率。生存率(生存率(Survival r
18、ate)=pnpn-1pn-2.p2p1如上表中的如上表中的9个月生存率个月生存率=0.74360.74360.74420.74420.76670.76670.7880=0.33430.7880=0.3343步骤:步骤:1 1、计算各时段死亡概率、计算各时段死亡概率2 2、计算各时段生存概率、计算各时段生存概率3 3、计算累计生存概率、计算累计生存概率 第24页,共72页。SPSS软件输出的寿命表结果累积生存率累积生存率第25页,共72页。极限乘积(极限乘积(K-M)法)法KM法计算公式法计算公式:i=1,2,.,mi=1,2,.,m;用用 n n(t ti i)、d d(t ti i)、分别
19、表示在时间、分别表示在时间t t的期初的期初存活病例数、期内死亡数。存活病例数、期内死亡数。()()()()Stn td tn tKMiiii第26页,共72页。Kaplan-meier 法计算法计算(黑色素瘤)观察生存率黑色素瘤)观察生存率治疗后月数治疗后月数(i)月初存活数月初存活数(ni)死亡数死亡数(di)退出数退出数(wi)死亡比例死亡比例(qi)生存比例生存比例(pi)累计生存率累计生存率(pi)050200.0400.9600.960148100.0210.9790.940247200.0430.9570.9003452*00.044843100.0231042100.02412
20、412*00.0491339100.0261538100.02618371*00.0271936100.0282135012734023032013331110.0320.9680.6773429100.0340.9660.654*非黑色素瘤死亡第27页,共72页。KM法说明病例生存时间升序排列。病例生存时间升序排列。区间的样本量渐进于区间的样本量渐进于0,分割区间数量倾向无穷大。,分割区间数量倾向无穷大。区间的长度取决于生存时间度量精度(年、月、天、小时区间的长度取决于生存时间度量精度(年、月、天、小时)。计算时仅考虑有事件发生或终检发生的区间,忽略其他区间。计算时仅考虑有事件发生或终检发生
21、的区间,忽略其他区间。终检数据只对分母有贡献(包括在分母内)。终检数据只对分母有贡献(包括在分母内)。第28页,共72页。Kaplan-Meier生存率曲线第29页,共72页。寿命表法与寿命表法与KM法比较法比较 基本相同基本相同 寿命表法较适用于成组数据寿命表法较适用于成组数据 生存指标的刻度连续,选用生存指标的刻度连续,选用KM法法 两种方法都是计算出两种方法都是计算出“观察生存率观察生存率”KM法的生存曲线是阶梯状的,每一阶梯代法的生存曲线是阶梯状的,每一阶梯代表发生了限定的事件;寿命表法的曲线是表发生了限定的事件;寿命表法的曲线是平滑的。平滑的。第30页,共72页。生存率的生存率的“竞
22、争竞争”死因调整死因调整l 原因别生存(原因别生存(Cause-specific survival)(校正生存校正生存-corrected survival rate;净生存净生存-Net survival)l 相对生存(相对生存(relative survival)第31页,共72页。原因别生存率原因别生存率 估计限定的癌症独立于其他死因的生存概估计限定的癌症独立于其他死因的生存概率(仅计算由于该种癌症死亡作为事件结率(仅计算由于该种癌症死亡作为事件结局的生存率)。局的生存率)。总体(观察)生存率总体(观察)生存率 终点终点=死亡死亡原因别(观察)生存率原因别(观察)生存率 终点终点=死于特
23、定的原因死于特定的原因计算方法同总体生存率一样,只是将死于其他(非特定)原计算方法同总体生存率一样,只是将死于其他(非特定)原因的病例作为终检观察数据处理(?)。因的病例作为终检观察数据处理(?)。这类指标在临床试验研究中运用较多(死亡原因易确定)。这类指标在临床试验研究中运用较多(死亡原因易确定)。第32页,共72页。人群为基础的肿瘤登记数据计算原因别生人群为基础的肿瘤登记数据计算原因别生存率存在难度:存率存在难度:死亡原因(死亡证书)死亡原因(死亡证书):未获得未获得 不准确不准确 编码错误编码错误l用相对生存率表达原因别生存指标用相对生存率表达原因别生存指标第33页,共72页。相对生存率
24、(相对生存率(relative survival rate)l较多地应用于人群为基础肿瘤登记资料较多地应用于人群为基础肿瘤登记资料l调整了竞争死因调整了竞争死因 不需要死因信息不需要死因信息 运用人口统计寿命表运用人口统计寿命表第34页,共72页。相对生存率定义相对生存率定义相对生存率相对生存率=(观察生存率(观察生存率/期望生存率)期望生存率)100 观察生存率为限定诊断时期内、限定性别、癌症种类及年龄的一观察生存率为限定诊断时期内、限定性别、癌症种类及年龄的一组病人的观察生存率(可由寿命表法及组病人的观察生存率(可由寿命表法及KM法计算获得)。法计算获得)。期望生存率是除了未患癌症外,其他
25、因素(时期、年龄、地期望生存率是除了未患癌症外,其他因素(时期、年龄、地区等混杂因素)与癌症组病人相同的普通人群(暴露于全部区等混杂因素)与癌症组病人相同的普通人群(暴露于全部死因风险)的生存率(该生存率从人口统计寿命表中计算获死因风险)的生存率(该生存率从人口统计寿命表中计算获取),即该组癌症病人的期望生存率。取),即该组癌症病人的期望生存率。第35页,共72页。相对生存率计算相对生存率计算 区间相对生存率:区间相对生存率:ri=pi/ei pi:区间观察生存率,:区间观察生存率,ei:区间期望生存:区间期望生存率率累计相对生存率:累计相对生存率:计算方法类似累计生存计算方法类似累计生存率的
26、算法,各期间相对生存率的乘积,即率的算法,各期间相对生存率的乘积,即得相应时间的相对生存率。得相应时间的相对生存率。第36页,共72页。累计相对生存率累计相对生存率累计相对生存率 1ri计算方法ri1r11r21rnr1r2 r1rn rn-1.r2 r11ri=ri=(pi /ei)=pi /ei第37页,共72页。简单计算说明例如某地一组男性患者的诊断时间集中在例如某地一组男性患者的诊断时间集中在19821982年年或相邻年份内,从人口寿命表得知,相当于或相邻年份内,从人口寿命表得知,相当于48-48-5252岁患者(假定用岁患者(假定用5050岁代表这组患者)的一般男岁代表这组患者)的一
27、般男性的五年生存概率为性的五年生存概率为1-0.034089=0.9659111-0.034089=0.965911,相,相当于当于53-5753-57岁患者(假定用岁患者(假定用5555岁代表这组患者)岁代表这组患者)的一般男性的五年生存概率为的一般男性的五年生存概率为1-0.064116=1-0.064116=0.9358840.935884,余类推。将一般人口寿命表内查得的,余类推。将一般人口寿命表内查得的生存概率求其平均数,就得到该组患者的五年期生存概率求其平均数,就得到该组患者的五年期望生存率。望生存率。第38页,共72页。简单算法简单算法设设P Pi i 为相当于第为相当于第i i
28、个(个(i=1,2,ni=1,2,n)患者的一般人群的五年生存概率,)患者的一般人群的五年生存概率,则所求的该组患者五年期望生存率(则所求的该组患者五年期望生存率(PP)为)为:再设再设n n个患者的五年观察生存率为个患者的五年观察生存率为P P,则五年相对生存率为,则五年相对生存率为:niiPnP11(%)100)(PPRSR第39页,共72页。例如:某地一组例如:某地一组19901994年诊断的年诊断的3565岁乳腺岁乳腺癌病人的癌病人的5年观察生存率为年观察生存率为0.57(57%),该地区),该地区相应时期相应时期3565岁一般人群女性的岁一般人群女性的5年期望生存率年期望生存率为为0
29、.94。那么这组乳腺癌病人的那么这组乳腺癌病人的5年相对生存率为:年相对生存率为:相对生存率相对生存率=(观察生存率(观察生存率/期望生存率)期望生存率)100 =0.57/0.94100=61%第40页,共72页。期望生存率的计算期望生存率的计算(Edeer)IDSexAge at dxYeardxSurvtimeExpected prob.of surviving the interval 1 2 3 4 55-y Cul.exp.survival1M728900.949000.943380.941160.937670.932570.73912F829100.920140.910550.8
30、98930.885480.874570.58343M739300.949290.944160.937670.937180.933290.7351.32F808780.93131.33M668680.96957.34M678780.96574.35F568690.995270.995310.994490.994200.993290.9729各病人各病人5年累计期望生存率年累计期望生存率=各年期望生存概率的乘积各年期望生存概率的乘积 =0.949000.94338-0.93257=0.739135例病人的例病人的5年累计期望生存率年累计期望生存率=各期望生存率合计各期望生存率合计/病人总数病人总数
31、 =(0.7391+0.5834+0.7351+-+0.9729)/35=0.8159 第41页,共72页。(1)11*()*()(1)*()*()lahatiPah tPtLaPah tPah i第42页,共72页。期望生存率的计算期望生存率的计算(Edeer)IDSexAge at dxYeardxSurvtimeExpected prob.of surviving the interval 1 2 3 4 51M728900.949002F829100.920149m649410.976790.97501.13f799320.944720.939070.93084.22F859230.8
32、85480.87475.0.858960.8457625M809140.903380.893600.886280.871860.8638534M678780.96574.35F568690.995270.995310.994490.994200.99329各年的期望生存率各年的期望生存率=每一病人的各年期望生存概率相加每一病人的各年期望生存概率相加/相应的病人总数相应的病人总数 1年期望生存率年期望生存率=(0.94900+0.92014+-+0.99527)/35=33.7398/35=0.96399 2年期望生存率年期望生存率=(0.97501+0.97943+-+0.99531)/27=
33、25.95746/27=0.9613935例病人的例病人的5年累计期望生存率年累计期望生存率=各年期望生存率的乘积各年期望生存率的乘积 =0.96399 0.96139 0.95859 0.955430.95847=0.81355各年的期望生存率 0.96399 0.96139 0.95859 0.95543 0.95847第43页,共72页。1()1*()*()*()*()()taaila ihaaPtPiP ah iPil i第44页,共72页。Hakulinen 法l首先生成期望寿命表首先生成期望寿命表il*(i)D*(i)v*(i)1l(1)d*(1)+*(1)v*(1)2l(2)d*
34、(2)+*(2)v*(2)3l(3)d*(3)+*(3)v*(3)4l(4)d*(4)+*(4)v*(4)5etc.第45页,共72页。Hakulinen 法l 计算区间的期望生存概率(与寿命表相同)计算区间的期望生存概率(与寿命表相同)l 计算总计的期望生存概率计算总计的期望生存概率*()*()1*()*()/2DiPilivi1*()*()tiPtpi第46页,共72页。Hakulinen 法 如果计算大于如果计算大于10年的相对生存率,这要用年的相对生存率,这要用Hakulinen法计算期望生存率(可靠、稳法计算期望生存率(可靠、稳定?)定?)。计算时较复杂计算时较复杂 统计程序的应用统
35、计程序的应用第47页,共72页。芬兰芬兰1985-1994年男性皮肤黑色素瘤年男性皮肤黑色素瘤5年观察生存率(年观察生存率(p)、期)、期望生存率(望生存率(p*)及相对生存率)及相对生存率(r)ageNpp*r15-28670.9470.9930.95430-442730.8560.9820.87245-595030.8240.9430.87460-744490.6790.8150.83375+2000.3960.5050.781第48页,共72页。上海市区肺癌生存率上海市区肺癌生存率(全人群全人群):1988-1991 观察生存率观察生存率OSR 相对生存率相对生存率RSR1年年3年年5年
36、年1年年3年年5年年男性男性31.512.59.932.613.912.0女性女性29.712.19.830.513.111.3第49页,共72页。生存率曲线生存率曲线00.10.20.30.40.50.60.70.8123456789101112131415随访时间(年)生存率观察生存率相对生存率第50页,共72页。表表 6-11 6-11 某市某时期男性膀胱癌生存资料的相对生存率某市某时期男性膀胱癌生存资料的相对生存率 I n d w n P CP CR 2I n d w n P CP CR 2*SECR SR 2SECR SR 2*SESR E1RSESR E1R 0-754 224 0
37、 754.0 0.70292 0.70292 0.72415 0.03429 0.72415 0.03429 0.72415 0-754 224 0 754.0 0.70292 0.70292 0.72415 0.03429 0.72415 0.03429 0.72415 1-530 106 0 530.0 0.80000 0.56233 0.59755 0.03840 0.59755 0.03840 0.597551-530 106 0 530.0 0.80000 0.56233 0.59755 0.03840 0.59755 0.03840 0.597552-424 85 0 424.0
38、0.79953 0.44960 0.49394 0.03981 0.49394 0.03981 0.49394 2-424 85 0 424.0 0.79953 0.44960 0.49394 0.03981 0.49394 0.03981 0.49394 3-339 59 0 339.0 0.82596 0.37135 0.42261 0.04005 0.42261 0.04005 0.42261 3-339 59 0 339.0 0.82596 0.37135 0.42261 0.04005 0.42261 0.04005 0.42261 4-280 21 1 279.5 0.92487
39、4-280 21 1 279.5 0.92487 0.343450.34345 0.405630.40563 0.04085 0.04085 0.405630.40563 0.04085 0.04085 0.405620.40562 5-258 17 0 258.0 0.93411 0.32082 0.39360 0.04172 0.39360 0.04172 0.39357 5-258 17 0 258.0 0.93411 0.32082 0.39360 0.04172 0.39360 0.04172 0.39357 6-241 21 0 241.0 0.91286 0.29287 0.37
40、384 0.04233 0.37384 0.04233 0.373796-241 21 0 241.0 0.91286 0.29287 0.37384 0.04233 0.37384 0.04233 0.373797-220 17 0 220.0 0.92273 0.27024 0.35964 0.04307 0.35964 0.04307 0.35957 7-220 17 0 220.0 0.92273 0.27024 0.35964 0.04307 0.35964 0.04307 0.35957 8-203 13 0 203.0 0.93596 0.25293 0.35152 0.0440
41、3 0.35152 0.04403 0.35143 8-203 13 0 203.0 0.93596 0.25293 0.35152 0.04403 0.35152 0.04403 0.35143 9-190 10 0 190.0 0.94737 9-190 10 0 190.0 0.94737 0.239620.23962 0.348260.34826 0.04522 0.04522 0.348260.34826 0.04522 0.04522 0.348140.34814 10-180 8 4 178.0 0.95506 0.22885 0.34843 0.04664 0.34843 0.
42、04664 0.3482610-180 8 4 178.0 0.95506 0.22885 0.34843 0.04664 0.34843 0.04664 0.3482611-168 7 48 144.0 0.95139 0.21772 0.34782 0.04837 0.34779 0.04836 0.34761 11-168 7 48 144.0 0.95139 0.21772 0.34782 0.04837 0.34779 0.04836 0.34761 P-P-观察生存率观察生存率(期间期间),CP-),CP-观察生存率观察生存率(累积累积)CR-CR-相对生存率相对生存率,SR-,S
43、R-相对生存率相对生存率,E1R-,E1R-相对生存率相对生存率第51页,共72页。期望生存率期望生存率 不同方法(E、及Hakulinen method)所得结果有所差别,应用时要标明。相对生存率的计算关键在可比一般人群(性别、年龄、时期、地区的一致)寿命表的选取及期望生存率的计算。我国期望生存率的计算?第52页,共72页。相对生存率的解释相对生存率的解释l相对生存率是癌症病人去除其他死亡危险(死亡竞争风险)后),相对生存率是癌症病人去除其他死亡危险(死亡竞争风险)后),评价癌症所产生的超额死亡率的综合指标。评价癌症所产生的超额死亡率的综合指标。l相对生存率等于相对生存率等于1表示观察生存与
44、期望生存相等,没有造成超额死表示观察生存与期望生存相等,没有造成超额死亡。亡。l时间时间t时的累计相对生存率可解释为假定只有该癌症为可能死亡原因时的累计相对生存率可解释为假定只有该癌症为可能死亡原因时,病人至少存活到时,病人至少存活到t时的比例。时的比例。l尽管计算期望生存率时,所考虑的癌症死亡也包括在一般人群的尽管计算期望生存率时,所考虑的癌症死亡也包括在一般人群的死亡风险中,实际估计时其影响很小,可以忽略不计。死亡风险中,实际估计时其影响很小,可以忽略不计。l相对生存率不是相对生存率不是“粗率粗率”,但也不是完全的年龄调整率。该指标,但也不是完全的年龄调整率。该指标只是对分母部分做了年龄调
45、整,未对分子部分进行调整。只是对分母部分做了年龄调整,未对分子部分进行调整。第53页,共72页。生存率的标准误和可信区间生存率的标准误和可信区间标准误是评价(计算)生存率不准确性的指标。标准误是评价(计算)生存率不准确性的指标。95%(99%)可信区间是取值范围,表示重复可信区间是取值范围,表示重复100次研究,所得指标有次研究,所得指标有95(99)次所在的区间范围。次所在的区间范围。直接法:直接法:P=限定年数的生存率限定年数的生存率;n=观察总数观察总数95%可信区间可信区间=p1.96Se(p)(1)()ppSe pn第54页,共72页。如一组如一组30例病人的观察生存率例病人的观察生
46、存率 57%则:则:Se(p)=0.09 95%区间区间=0.571.960.09 =0.390.750.57(1 0.57)30第55页,共72页。寿命表法标准误的计算寿命表法标准误的计算:Pi*i年累计观察生存率;年累计观察生存率;qi 区间死亡概率;区间死亡概率;ri 区间有效人数;区间有效人数;di 区间死亡数区间死亡数置信区间估计置信区间估计:95%CI pi*1.96 Se(pi*)(*)*iiiiiqse pprd*()iiiiidpr r d第56页,共72页。相对生存率的标准误相对生存率的标准误 Se(ri)=Se(pi*)期望生存率 95%可信区间:相对生存率1.96Se(
47、ri)第57页,共72页。统计学检验l 生存率比较生存率比较 l 生存期比较生存期比较 第58页,共72页。生存率比较生存率比较 U(Z)检验检验两组一年生存率:两组一年生存率:45%45%,40%40%两组一年生存率的标准误:两组一年生存率的标准误:0.12500.1250,0.11300.1130P0.05(U=1.96,P=0.05)P0.05(U=1.96,P=0.05)12222212|0.450.40|0.2967()()0.12500.1130ppUSE pSE p第59页,共72页。生存曲线(分布)比较生存曲线(分布)比较:Logrank检验检验(适用于寿命表和(适用于寿命表和
48、KM法)法)222212112EEOEEO222.0097.70097.7073903.82903.82802222 0.05O:观察期内实际死亡人数E:观察期内期望死亡人数第60页,共72页。期望死亡数期望死亡数第一组期望死亡数第一组期望死亡数=(区间内第一组死亡数(区间内第一组死亡数+区间内第二组的死亡数)区间内第二组的死亡数)/(区间内第一组存活数区间内第一组存活数+区区间内第二组的存活数)间内第二组的存活数)第一组有效观察数第一组有效观察数 第二组期望死亡数第二组期望死亡数=(区间内第一组死亡数(区间内第一组死亡数+区间内第二组的死亡数)区间内第二组的死亡数)/(区间内第一组存活数区间
49、内第一组存活数+区间内第二组的存活数)区间内第二组的存活数)第二组有效观察数第二组有效观察数存活数存活数=组内有效人数组内有效人数-组内死亡数组内死亡数第61页,共72页。Log-rank 检验的局限检验的局限 不提供生存曲线差异大小的指标不提供生存曲线差异大小的指标 生存曲线出现交叉检验不敏感生存曲线出现交叉检验不敏感 不能调整混杂因素不能调整混杂因素第62页,共72页。其他比较方法Wilcoxon 检验:检验:对各期间的观察人数加权。对各期间的观察人数加权。参数模型参数模型Cox 模型模型相对生存率模型相对生存率模型第63页,共72页。DCO病例处理病例处理 DCO病例病例 诊断日期不明,
50、诊断日期不明,生存时间生存时间=0 DCO 病例比例应尽量少病例比例应尽量少如果大于如果大于10%,则应分别报告包括,则应分别报告包括DCO病病例的生存率(降低了第一个观察期间的生例的生存率(降低了第一个观察期间的生存率)和排除存率)和排除DCO病例的生存率(高估了病例的生存率(高估了人群为基础数据的生存率)。人群为基础数据的生存率)。第64页,共72页。失访与生存率失访与生存率YearAlive at start of interval Died during intervalLost to follow-upInterval-specific surv.%13289165102194.12