1、生存分析生存分析Survival Analysis o 临床随访,又称为前瞻性研究(prospective study)o 两组肝移植的病人手术后的生存时间和结局o(1)结局及生存时间据需要考虑经典的统计分析方法不能同时分析结局和生存时间o(2)随访研究中研究对象可能会失访或死于其他疾病;或因研究经费和时间的限制不可能等到所有的对象都出现结局-截尾(censoring)或终检o 生存分析能解决以上问题例如,某肿瘤医院调查了例如,某肿瘤医院调查了1991-1995年间经手年间经手术治疗的大肠癌患者术治疗的大肠癌患者150例,对可能影响大肠例,对可能影响大肠癌术后生存时间的因素进行了调查,如性癌术
2、后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、别、年龄、组织学分类、肿瘤大小、DureS分期等。随访截止日期为分期等。随访截止日期为2000年年12月月30日,日,随访记录见下表。随访记录见下表。大肠癌影响因素量化表大肠癌影响因素量化表o生存分析生存分析(survival analysis)是将事件)是将事件的结果(终点事件)和出现这一结果所的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分经历的时间结合起来分析的一种统计分析方法。析方法。o生存分析不同于其它多因素分析的主要生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出区别点就是生存分
3、析考虑了每个观测出现某一结局的时间长短。现某一结局的时间长短。前前 言言第一节第一节 生存分析基本概念生存分析基本概念一、一、生存时间生存时间(survival time,failure time)o终点事件终点事件与与起始事件起始事件之间的时间间隔。之间的时间间隔。o终点事件指研究者所关心的特定结局。终点事件指研究者所关心的特定结局。o起始事件是反映研究对象生存过程的起起始事件是反映研究对象生存过程的起 始特征的事件。始特征的事件。生存时间举例生存时间举例 起始事件起始事件 终点事件终点事件 服药服药 痊愈痊愈 手术切除手术切除 死亡死亡 染毒染毒 死亡死亡 化疗化疗 缓解缓解 缓解缓解 复
4、发复发o终点事件和起始事件是相对而言的,终点事件和起始事件是相对而言的,它们都由研究目的决定,须在设计时它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,明确规定,并在研究期间严格遵守,不能随意改变。不能随意改变。生存时间的类型生存时间的类型1.完全数据完全数据(complete data)从起点至死亡(死于所研究疾病)所经历从起点至死亡(死于所研究疾病)所经历的时间。的时间。2.截尾数据截尾数据(删失数据,(删失数据,censored data)从起点至截尾点所经历的时间。从起点至截尾点所经历的时间。截尾原因:失访、死于其它疾病、观察结截尾原因:失访、死于其它疾病、观察结束时病
5、人尚存活等。束时病人尚存活等。例如,某肿瘤医院调查了例如,某肿瘤医院调查了1991-1995年间经手年间经手术治疗的大肠癌患者术治疗的大肠癌患者150例,对可能影响大肠例,对可能影响大肠癌术后生存时间的因素进行了调查,如性癌术后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、别、年龄、组织学分类、肿瘤大小、DureS分期等。随访截止日期为分期等。随访截止日期为2000年年12月月30日,日,随访记录见下表。随访记录见下表。生存时间生存时间o 生存时间的度量单位可以是年、月、生存时间的度量单位可以是年、月、日、小时等。常用符号日、小时等。常用符号t表示,截尾数据在表示,截尾数据在其
6、右上角标记其右上角标记“+”。o 生存资料的主要特点:生存资料的主要特点:n 含有截尾数据。特点:真实的生存时间未含有截尾数据。特点:真实的生存时间未知,只知道比观察到的截尾生存时间要长。知,只知道比观察到的截尾生存时间要长。n 生存时间的分布一般是偏态分布,指数分生存时间的分布一般是偏态分布,指数分布,布,weibull分布,对数正态分布等分布,对数正态分布等例102名黑色素瘤患者生存时间(月)如下中位生存期中位生存期o中位生存期(中位生存期(median survival time)又称半数生存期,表示恰好有又称半数生存期,表示恰好有50的的个体尚存活的时间。个体尚存活的时间。o中位生存期
7、越长,表示疾病的预后越中位生存期越长,表示疾病的预后越好;中位生存期越短,预后越差。好;中位生存期越短,预后越差。o估计中位生存期常用图解法或线性内估计中位生存期常用图解法或线性内插法。插法。二、死亡概率和生存概率二、死亡概率和生存概率o 死亡概率:指在某时间段内受试者死亡死亡概率:指在某时间段内受试者死亡的可能性记为的可能性记为q。生存概率:。生存概率:1-qo 如患者在如患者在20天前死亡天前死亡3人,尚有人,尚有16人活,人活,20天时有天时有2人死亡,人死亡,20天的死亡概率为天的死亡概率为2/16=0.125;死亡概率是;死亡概率是1-0.125=0.875.在在64天前死亡天前死亡
8、9人,尚有人,尚有10人存活,人存活,64天时天时失访失访1人,死亡人,死亡1人,故人,故64天时的死亡概率天时的死亡概率是是1/10=0.1,死亡概率是,死亡概率是0.9.o 可以看出,失访者在失访前的信息被利可以看出,失访者在失访前的信息被利用了,失访后不再加以考虑。用了,失访后不再加以考虑。o生存率:又称为生存函数,或累积生存生存率:又称为生存函数,或累积生存概率(概率(survival rate,survival function):指观察对象经历):指观察对象经历t个单位时个单位时段后仍存活的可能性。段后仍存活的可能性。S(t)理论上,观察时间越长,生存人数越少,理论上,观察时间越长
9、,生存人数越少,故生存率越低因此,故生存率越低因此,S(t)是单调下降)是单调下降的的期初观察例数年例数活满年生存率33条件生存概率和生存率的计算生存率计算方法:生存率计算方法:o 采用乘积-极限法(Product-Limit,PL法),又因为是Kaplan-Meier1958年提出,故又称为K-M法。采用条件概率乘积原理来估计生存率。o S(ti)=p1*p2*pi例 2 o 某医院泌尿外科于1979-1982年做了19例肾移植手术,拟了解肾移植后病人的生存时间(天)。规定对方开始时间为病人术后一天,死亡事件为改病人因与肾移植有关的各种原因而死亡。后改进手术方式,于1983-1986年又作了
10、14例,该资料如下(有+的数据表示该病人截尾)。计算各组的生存率。由例子可看出,生存率与条件生存概由例子可看出,生存率与条件生存概率不同。条件生存概率是单个时段的率不同。条件生存概率是单个时段的结果,而生存率实质上是累积条件生结果,而生存率实质上是累积条件生存概率(存概率(cumulative probability of survival),是多个时段的累积结果。),是多个时段的累积结果。例如,例如,3年生存率是第年生存率是第1年存活,第年存活,第2年年也存活,第也存活,第3年还存活的可能性。年还存活的可能性。o 实际死亡数与理论死亡数之比AA/TA与AB/TB 称为相对死亡比(relati
11、ve death rate),两组的相对死亡比之比称为风险比(hazard ratio),表示A组病人死亡风险是B组病人的多少倍。BBAATATAh/o生存曲线(生存曲线(survival curve)以观察(随访)时间为横轴,以生存率以观察(随访)时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线图。连接在一起的曲线图。o生存曲线是一条下降的曲线,分析时生存曲线是一条下降的曲线,分析时应注意曲线的高度和下降的坡度。平缓应注意曲线的高度和下降的坡度。平缓的生存曲线表示高生存率或较长生存的生存曲线表示高生存率或较长生存期,陡峭的生存曲线表示低
12、生存率或较期,陡峭的生存曲线表示低生存率或较短生存期。短生存期。o log-rank检验用于整条生存曲线的比较,检验用于整条生存曲线的比较,若比较两组某时间点处的生存率,则按下若比较两组某时间点处的生存率,则按下式计算:式计算:o 如比较多个时间点处生存率,检验水准应如比较多个时间点处生存率,检验水准应取取Bonferroni校正,即校正,即 ,其中,其中k为为比较的次数,以保证总的比较的次数,以保证总的I型错误概率不超型错误概率不超过过 。)()()()(221221tSSEtSSEtStSuk/总结:生存资料统计学处理方法总结:生存资料统计学处理方法(一)设计(一)设计o 目的:专业目的:
13、据专业知识确定。目的:专业目的:据专业知识确定。统计学目的:统计学目的:n 估计估计:根据样本生存资料估计总体生:根据样本生存资料估计总体生存率及其它有关指标(如中位生存期存率及其它有关指标(如中位生存期等),如根据脑瘤患者治疗后的生存等),如根据脑瘤患者治疗后的生存时间资料,估计不同时间的生存率、时间资料,估计不同时间的生存率、生存曲线以及中位生存期等。生存曲线以及中位生存期等。n 比较比较:对不同处理组生存率进行比较,如:对不同处理组生存率进行比较,如比较不同疗法治疗脑瘤的生存率,以了解比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。哪种治疗方案较优。n 影响因素分析影响因素分析:目
14、的是为了探索和了解:目的是为了探索和了解影响生存时间长短的因素,或平衡某些影响生存时间长短的因素,或平衡某些因素影响后,研究某个或某些因素对生因素影响后,研究某个或某些因素对生存率的影响。如为改善脑瘤病人的预后,存率的影响。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、病人的年龄、性别、病程、肿瘤分期、治疗方案等。治疗方案等。n 预测预测:具有不同因素水平的个体生存预:具有不同因素水平的个体生存预测,如根据脑瘤病人的年龄、性别、病测,如根据脑瘤病人的年龄、性别、病程、肿瘤分期、治疗方案等预测该病人程、肿瘤分期、治疗
15、方案等预测该病人t t年(月)生存率。年(月)生存率。o 方法:前瞻性队列研究方法:前瞻性队列研究 回顾性队列研究回顾性队列研究o 确定起始事件、终点事件、随访终止日确定起始事件、终点事件、随访终止日期、生存时间、截尾。期、生存时间、截尾。o 确定可能的影响因素、水平以及量化方确定可能的影响因素、水平以及量化方法。法。大肠癌影响因素量化表大肠癌影响因素量化表o 设计调查表:一览表:因素较少时。设计调查表:一览表:因素较少时。单一表:因素较多时。单一表:因素较多时。调查表中应包括调查表中应包括n 可能的影响因素可能的影响因素n 观察起点和终点(年、月、日)观察起点和终点(年、月、日)生存时间生存
16、时间n 生存结局生存结局o 样本含量样本含量:非截尾例数非截尾例数至少是可能影响因至少是可能影响因素的素的10倍。倍。(二)搜集资料(二)搜集资料o 可能的影响因素:可能的影响因素:从病历获得。从病历获得。o 生存时间及结局:生存时间及结局:n 短期可观察到的结局可从病历获得;短期可观察到的结局可从病历获得;n 长期结局一般不能从病历直接获得,通过长期结局一般不能从病历直接获得,通过信访、电话等得到。信访、电话等得到。(三)整理资料(三)整理资料o 认真检查、核对原始数据,包括影响因素、认真检查、核对原始数据,包括影响因素、生存时间和生存结局。生存时间和生存结局。o 尽量避免缺失值。尽量避免缺
17、失值。o 建立数据库建立数据库n FoxBase、Foxpro、Virual Foxpro等专业等专业数据库数据库n 统计软件数据库(统计软件数据库(SAS、SPSS等)等)n Office办公软件中的办公软件中的Excel、Access大肠癌生存资料大肠癌生存资料生存资料基本要求生存资料基本要求o 样本由随机抽样方法获得,要有一定的数量。样本由随机抽样方法获得,要有一定的数量。o 死亡例数不能太少。死亡例数不能太少。o 截尾比例不能太大。截尾比例不能太大。o 生存时间尽可能准确。因为常用的生存分析生存时间尽可能准确。因为常用的生存分析方法都在生存时间排序的基础上作统计处理,方法都在生存时间排
18、序的基础上作统计处理,即使是小小的舍入误差,也可能改变生存时即使是小小的舍入误差,也可能改变生存时间顺序而影响结果。间顺序而影响结果。o 缺项应尽量补齐。缺项应尽量补齐。(四)分析资料(四)分析资料o 估计估计:Kaplan-Meier法法o 比较比较:log-rank检验检验o 影响因素分析影响因素分析:Cox比例风险回归模型比例风险回归模型(Cox回归模型),是生存分析中最重要回归模型),是生存分析中最重要的模型之一。的模型之一。o 预测预测:Cox回归模型预测生存率。回归模型预测生存率。第四节第四节 Cox比例风险回归模型比例风险回归模型o Cox比例风险回归模型(比例风险回归模型(Co
19、xs proportional hazards regression model),简称),简称Cox回归回归模型。模型。o 该模型由英国统计学家该模型由英国统计学家D.R.Cox于于1972年提年提出,主要用于肿瘤和其它慢性病的预后分析,出,主要用于肿瘤和其它慢性病的预后分析,也可用于队列研究的病因探索。其优点:也可用于队列研究的病因探索。其优点:n 多因素分析方法多因素分析方法n 不考虑生存时间分布不考虑生存时间分布n 利用截尾数据利用截尾数据一、一、Cox模型的基本形式模型的基本形式h(t,X)t时刻风险函数、风险率或瞬时死亡时刻风险函数、风险率或瞬时死亡 率(率(hazard func
20、tion)。)。h0(t)基准风险函数,即所有变量都取基准风险函数,即所有变量都取0时时t 时刻风险函数。时刻风险函数。X1、X2、Xp协变量、影响因素、预后协变量、影响因素、预后 因素。因素。1、2、p回归系数。回归系数。)exp()(),(22110ppXXXthXthmmxbxbxbtt22110)()(lnCox比例风险模型o 一般0(t)不能由样本估计出,而只能估计出回归系数b1,b2,称为半参数模型,但这并不影响对各危险因素相对危险度的评估:o 比值:)()(比值mmxxxxxx2121,t,t 假设在任何时刻风险的比值是不变的,即等比例风险,对基线没有任何限制o0,RR1,说明变
21、量,说明变量X增加时,危增加时,危险率增加,即险率增加,即X是危险因素。是危险因素。o0,RR1,说明变量,说明变量X增加时,危增加时,危险率下降,即险率下降,即X是保护因素。是保护因素。o=0,RR=1,说明变量,说明变量X增加时,危增加时,危险率不变,即险率不变,即X是危险无关因素。是危险无关因素。ieRR二、参数估计与假设检验二、参数估计与假设检验(一)参数估计(一)参数估计 最大似然法最大似然法(二)假设检验(二)假设检验n 似然比检验(似然比检验(likelihood ratio test)n 得分检验(得分检验(score test)n Wald检验(检验(Wald test)例3
22、 cox回归实例o 为评价A、B两治疗方案对某病的治疗效果,A组(group=0)12人,B组(group=1)13人,病人分组后检验其肾功能(kiney),功能正常者记0,不正常者记为1;治疗后生存时间为stime(天);资料如下:问不同治疗方案及肾功能对病人的生存时间是否有影响?观察结果截尾时censor=0,否则censor=1.三、因素筛选与最优模型的建立三、因素筛选与最优模型的建立o 变量筛选方法变量筛选方法n 向前引入法(前进法)向前引入法(前进法)Forwardn 向后剔除法(后退法)向后剔除法(后退法)Backwardn 逐步引入逐步引入-剔除法(逐步法)剔除法(逐步法)Ste
23、pwiseo 检验水准检验水准n 初步的、探索性的研究,或变量数较少时,初步的、探索性的研究,或变量数较少时,可取可取0.10。n 设计严谨的、证实性的研究,或变量数较设计严谨的、证实性的研究,或变量数较多时,可取多时,可取0.05或或0.01。n 检验水准包括引入的检验水准和剔除的检检验水准包括引入的检验水准和剔除的检验水准。一般地,剔除验水准。一般地,剔除引入引入。分析结果(结果解释)分析结果(结果解释)o与生存相关的因素与生存相关的因素o因素作用大小及方向:保护因素还因素作用大小及方向:保护因素还是危险因素、相对危险度的大小。是危险因素、相对危险度的大小。o因素作用大小排序:标准化回归系
24、因素作用大小排序:标准化回归系数的绝对值。数的绝对值。分析结果(结果解释)分析结果(结果解释)p 个体的预后指数及预后分组:个体的预后指数及预后分组:预后指数(预后指数(prognostic index,PI)=预后指数越小,预后越好;预后指数越小,预后越好;预后指数越大,预后越差。预后指数越大,预后越差。ppXbXbXb2211)exp()(),(22110ppXbXbXbthXth分析结果(结果解释)分析结果(结果解释)n 例如:例如:传统治疗方式,淋巴结转移,传统治疗方式,淋巴结转移,PI2.6929 传统治疗方式,淋巴结无转移,传统治疗方式,淋巴结无转移,PI1.7616 新治疗方式,
25、淋巴结转移,新治疗方式,淋巴结转移,PI0.9313 新治疗方式,淋巴结无转移,新治疗方式,淋巴结无转移,PI0n 据据PI的大小可将病人分为不同的危险组,常见的大小可将病人分为不同的危险组,常见分三组(即低危组、中危组、高危组)或五组。分三组(即低危组、中危组、高危组)或五组。绘制分组的生存曲线,直观比较各危险组的生绘制分组的生存曲线,直观比较各危险组的生存情况,如中位生存期、存情况,如中位生存期、t年生存率等。年生存率等。549313.07616.1XXPI六、六、Cox模型的注意事项及应用范围模型的注意事项及应用范围(一)注意事项(一)注意事项o 设计阶段应注意的问题设计阶段应注意的问题
26、o 模型配合时应注意的问题模型配合时应注意的问题应用条件:除生存资料的基本要求外,还要求应用条件:除生存资料的基本要求外,还要求因素对生存时间的作用不随时间变化(比例因素对生存时间的作用不随时间变化(比例风险假定)。如观察年限超过风险假定)。如观察年限超过10年时,癌症年时,癌症手术后放疗的治疗作用可能逐渐消失,从而手术后放疗的治疗作用可能逐渐消失,从而不满足这一要求。不满足这一要求。o因素分析时应注意的问题因素分析时应注意的问题n 筛选变量时,考虑该指标是否容易收筛选变量时,考虑该指标是否容易收集、是否费用较高等临床因素。集、是否费用较高等临床因素。n 对连续变量,看其分布,如服从偏态对连续
27、变量,看其分布,如服从偏态分布,一般进行对数变换后参与计算。分布,一般进行对数变换后参与计算。n 选入模型的变量是统计学上的有关变选入模型的变量是统计学上的有关变量,不一定都与生存时间有因果关系。量,不一定都与生存时间有因果关系。其中某些变量可能只是伴随关系而已,其中某些变量可能只是伴随关系而已,未选入模型的变量不一定全是无关变未选入模型的变量不一定全是无关变量,要考虑是否模型内的某些变量代量,要考虑是否模型内的某些变量代替了它的作用,或因例数不够,或试替了它的作用,或因例数不够,或试验中对该变量进行了控制而引起。验中对该变量进行了控制而引起。n 检查可能的交互作用项是否显著(方法:检查可能的
28、交互作用项是否显著(方法:一次引入一个交互作用项,看其对应的回一次引入一个交互作用项,看其对应的回归系数是否为归系数是否为0)。)。n 模型拟合优度考察:据预后指数模型拟合优度考察:据预后指数PI分组,分组,比较各组基于比较各组基于Cox模型的生存曲线与基于模型的生存曲线与基于kaplan-Meier法估计的生存曲线,如两组法估计的生存曲线,如两组曲线吻合较好,表明曲线吻合较好,表明Cox模型拟合较好。模型拟合较好。n 生存率分析:生存曲线不能随意延长,也生存率分析:生存曲线不能随意延长,也不能轻易用于预测预报,经过大量研究所不能轻易用于预测预报,经过大量研究所得的生存曲线才有可能推广应用。得
29、的生存曲线才有可能推广应用。(二)适用范围(二)适用范围o 因素分析因素分析logistic回归模型可以作多因素分析,并可进行回归模型可以作多因素分析,并可进行相对危险度估计,但不考虑生存时间的长短,相对危险度估计,但不考虑生存时间的长短,不能处理随访中常见的截尾数据。不能处理随访中常见的截尾数据。Cox比例风比例风险回归模型具有险回归模型具有logistic回归模型的所有优点;回归模型的所有优点;同时考虑生存结局和生存时间的长短,可处理同时考虑生存结局和生存时间的长短,可处理截尾数据;且不考虑基准风险的分布。截尾数据;且不考虑基准风险的分布。o 生存预测生存预测n 强调设计的重要性强调设计的
30、重要性n 专业知识角度:选择疾病种类、终点事件、专业知识角度:选择疾病种类、终点事件、影响因素及结果的专业解释等。影响因素及结果的专业解释等。n 统计学角度:样本例数、因素的赋值、生统计学角度:样本例数、因素的赋值、生存时间准确到天数、因素筛选方法、结果存时间准确到天数、因素筛选方法、结果的统计学解释等的统计学解释等。小结(论文报告中应写明)小结(论文报告中应写明)1材料与方法材料与方法o 病例来源、起始事件、终点事件、观察终止病例来源、起始事件、终点事件、观察终止时间、截尾情况、随访结果的获得方法,样时间、截尾情况、随访结果的获得方法,样本含量、截尾例数及百分比本含量、截尾例数及百分比(%)
31、。o 建立数据库方法建立数据库方法o 统计学处理方法统计学处理方法 Kaplan-Meier法估计生存率法估计生存率 log-rank检验进行组间生存率比较检验进行组间生存率比较 Cox模型进行多因素分析模型进行多因素分析 2结果结果o 估计估计:Kaplan-Meier生存率及生存曲线。生存率及生存曲线。o 比较比较:log-rank检验卡方值及其检验卡方值及其P值。值。o 因素分析及预测因素分析及预测:n 变量赋值变量赋值(数量化方法数量化方法)表表n 变量统计描述:变量统计描述:各组病例数和构成比(分类变量)各组病例数和构成比(分类变量)均数和标准差(数值变量)均数和标准差(数值变量)n
32、 变量筛选方法及检验水准变量筛选方法及检验水准n Cox回归结果及统计解释回归结果及统计解释Cox回归与多元线性回归、回归与多元线性回归、logistic回归的比较回归的比较多元线性回归多元线性回归logisticlogistic回归回归Cox回归数据类型数据类型 Y Y数值变量数值变量Y Y分类变量分类变量Y Y二分类变量二分类变量+时间时间 X X数值变量、分类变量、等级变量数值变量、分类变量、等级变量模型结构模型结构变量筛选变量筛选 前进法;后退法;逐步法前进法;后退法;逐步法参数估计参数估计 最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法参数检验参数检验 F-testF-
33、testt-testt-test似然比检验似然比检验WaldWald检验检验 scorescore检验检验似然比检验似然比检验WaldWald检验检验 scorescore检验检验参数解释参数解释 回归系数回归系数b b优势比优势比ORORRR样本含量样本含量 至少变量数的至少变量数的1010倍倍至少变量数的至少变量数的2020倍倍非截尾例数至少变至少变量数的量数的1010倍倍应用应用因素分析因素分析预测预报预测预报 Y Y因素分析因素分析预测、判别预测、判别P(YP(Y1)1)因素分析因素分析生存预测生存预测 S(t)S(t)案例分析某研究者观察了确诊后采取同样方案进行化疗某研究者观察了确诊
34、后采取同样方案进行化疗的的26例急性混合型白血病患者,欲了解某种不例急性混合型白血病患者,欲了解某种不良染色体是否会影响患者病情的缓解,将治疗良染色体是否会影响患者病情的缓解,将治疗后后120天内症状是否缓解作为结果变量(缓解天内症状是否缓解作为结果变量(缓解0;未缓解;未缓解1),有无不良染色体作为研究),有无不良染色体作为研究因素。整理资料见下表。因素。整理资料见下表。有无不良染色体与缓解的关系有无不良染色体与缓解的关系o 这种情况下的结果并不可靠,原因是两个这种情况下的结果并不可靠,原因是两个比较组之间其它影响患者病情缓解的因素比较组之间其它影响患者病情缓解的因素不一定均衡,因而需要考虑
35、平衡其它可能不一定均衡,因而需要考虑平衡其它可能的影响因素如年龄(岁)、骨髓原幼细胞的影响因素如年龄(岁)、骨髓原幼细胞分组(分组(501;500)、)、CD34表表达(阳性达(阳性1;阴性;阴性0)、性别(男)、性别(男1;女女0)的作用。)的作用。多因素多因素logistic回归分析结果回归分析结果 因素因素 回归系数回归系数 Wald卡方卡方 P OR染染色体色体 1.457 1.161 0.281 4.29骨髓原幼骨髓原幼 2.961 4.778 0.029 19.2细胞分组细胞分组o 采用多因素采用多因素logistic回归分析,经逐步法按回归分析,经逐步法按0.10水准,平衡骨髓原
36、幼细胞分组后,有水准,平衡骨髓原幼细胞分组后,有无不良染色体不影响患者的缓解(无不良染色体不影响患者的缓解(P0.281)。)。o 有一位临床医生指出,仅考虑是否缓解还有一位临床医生指出,仅考虑是否缓解还不够,如果进一步利用缓解时间的长短来不够,如果进一步利用缓解时间的长短来进行分析,信息利用得更充分。进行分析,信息利用得更充分。o 费了很大辛苦,幸好查到了所有患者的缓费了很大辛苦,幸好查到了所有患者的缓解时间,于是采用解时间,于是采用log-rank检验比较有无检验比较有无不良染色体两组病人的生存曲线,得卡方不良染色体两组病人的生存曲线,得卡方1.28,P0.2579,仍然显示患者的缓解时,仍然显示患者的缓解时间与不良染色体无关。间与不良染色体无关。o 生存时间的比较仍然需要考虑组间的可比生存时间的比较仍然需要考虑组间的可比性,经多因素性,经多因素Cox回归分析,当检验水准回归分析,当检验水准0.10时的结果如下。时的结果如下。因素因素 回归系数回归系数 卡方卡方 P RR染色染色体体 1.838 3.709 0.054 6.29CD34 1.877 8.904 0.003 6.54骨髓原幼骨髓原幼 3.205 8.838 0.003 24.4细胞分组细胞分组