1、决策曲线分析及其在决策曲线分析及其在R语言中的实现语言中的实现导 师:杨土保 教授报告者:陈乐陶 决策曲线分析(决策曲线分析( Decision curve analysis ,DCA)最早由最早由Andrew J.Vickers和和Elena B.Elkin在在2006年年以题以题 Decision curve analysis: a novel method for evaluating prediction models 介绍并发表于介绍并发表于Medical Decision Making杂志上。杂志上。 作者以一项预测前列腺癌患者是否应该接受全精囊切除手术的研究展开作者以一项预测前列
2、腺癌患者是否应该接受全精囊切除手术的研究展开对对DCA的阐述。的阐述。DCA背景背景 Vickers引进引进DCA这种方法,在不同的这种方法,在不同的精囊浸润(精囊浸润(SVI)发生率下,权衡发生率下,权衡患者可能得到或损失的临床效益(如健康、经济、精神等方面),通过比患者可能得到或损失的临床效益(如健康、经济、精神等方面),通过比较净获益较净获益NB值的大小预测实施哪种手术方法。值的大小预测实施哪种手术方法。 无论使用哪一种治疗方法,都会遇到假阳性或假阴性的可能,在极端无论使用哪一种治疗方法,都会遇到假阳性或假阴性的可能,在极端情况下,可以使用适当的治疗方法尽量避免假阳性或假阴性带来的严重后
3、情况下,可以使用适当的治疗方法尽量避免假阳性或假阴性带来的严重后果。但当两种情况都无法避免时,就要找到一种能获得净获益值果。但当两种情况都无法避免时,就要找到一种能获得净获益值(Net Benefit,NB)最大(获益值最大(获益值-损失值)的办法损失值)的办法。Decision curve for a model to predict seminal vesicle invasion (SVI) in patients with prostate cancerSolid line: Prediction model. Dotted line: assume all patients have
4、 SVI. Thin line: assume no patients have SVI. The graph gives the expected net benefit per patient relative to no seminal vesicle tip removal in any patient DCA原理原理 ROC和和DCA都属于预测模型,都可以用来评价不同模型的优劣,但都属于预测模型,都可以用来评价不同模型的优劣,但ROC和和DCA在理论构建上有着本质区别在理论构建上有着本质区别。 ROC结合了所有灵敏度与特异度通过比较结合了所有灵敏度与特异度通过比较AUC决定预测模型的
5、准确性。决定预测模型的准确性。但在实际临床应用中,但在实际临床应用中,AUC值最大并不代表模型最优。值最大并不代表模型最优。DCA是用来预测临是用来预测临床结局变量的模型。床结局变量的模型。DCA最适用的情况是:有症状预示可能患病但未被最适用的情况是:有症状预示可能患病但未被确诊时,是否采取及采取何种筛查方法来诊断疾病。很显然,在极端情确诊时,是否采取及采取何种筛查方法来诊断疾病。很显然,在极端情况下如何抉择并不难,而在特定的区间概率范围内就依靠况下如何抉择并不难,而在特定的区间概率范围内就依靠DCA提供决策提供决策评价。评价。 ROC与与DCA的联系与区别的联系与区别ROCDCA结局指标二分
6、类有序多分类变量二分类变量统计学基础Logistic分析Logistic分析常用绘图软件SPSS、R软件R软件横、纵坐标1-特异度、灵敏度阈概率Pt、净获益NB判定指标AUC、最佳临界点NB判定标准单模型:临界点在左上最优多模型:AUC越大越好单模型:在两条极端曲线右上方的区域最优多模型:曲线在右上最优适用条件诊断模型诊断、预后模型意义判断诊断试验的准确性评价不同模型优劣预测结局变量评价不同模型优劣ROC与与DCA的区的区别别 为了更好的说明为了更好的说明DCA方法的应用,我们以一项前瞻性队列研究为例方法的应用,我们以一项前瞻性队列研究为例具体展示具体展示R语言的操作。该研究截取了随访时间长达
7、语言的操作。该研究截取了随访时间长达40年的年的Framingham心血管研究的部分数据,目的是为了探究不同影响因素与冠心病相关死心血管研究的部分数据,目的是为了探究不同影响因素与冠心病相关死亡结局的关系。数据样本量为亡结局的关系。数据样本量为4658,发生冠心病相关死亡的总数为,发生冠心病相关死亡的总数为1403,病死病死率为率为30%,自变量分别为,自变量分别为sex(性别)、(性别)、sbp(收缩压)、(收缩压)、dbp(舒张(舒张压)、压)、scl(血清胆固醇)、(血清胆固醇)、age(年龄)、(年龄)、bmi(身体质量指数)等,结(身体质量指数)等,结局变量为局变量为chdfate(
8、冠心病相关死亡结局)。(冠心病相关死亡结局)。 实例分析实例分析 R语语言言程程序序对三种不同模型进行比较的决策曲线分析图对三种不同模型进行比较的决策曲线分析图 目前目前DCA方法主要应用于预测诊断试验结局、术后结局及比较不同方法主要应用于预测诊断试验结局、术后结局及比较不同模型的优劣。例如预测前列腺癌患者存在模型的优劣。例如预测前列腺癌患者存在SVI的概率(预测诊断结局),的概率(预测诊断结局),预测心脏手术后患者的死亡率(预测术后结局),选择评价房颤患者口预测心脏手术后患者的死亡率(预测术后结局),选择评价房颤患者口服抗凝药出血风险的最优模型(比较不同模型优劣)。服抗凝药出血风险的最优模型
9、(比较不同模型优劣)。DCA应用应用在在PubMed上检索的不同发表年份下关于上检索的不同发表年份下关于DCA的发表文献数量趋势图的发表文献数量趋势图 ROC曲线、校正曲线及曲线、校正曲线及决策树决策树等评价方法主要注重在如何提高预测模等评价方法主要注重在如何提高预测模型的准确性,对模型之后的临床结局关注甚少。但往往临床结局的预测结型的准确性,对模型之后的临床结局关注甚少。但往往临床结局的预测结果会直接影响医生的决断,而一味的追求准确性可能会忽视患者真实的需果会直接影响医生的决断,而一味的追求准确性可能会忽视患者真实的需求。求。 DCA方法实质上是根据不同影响因素构建的模型来预测临床结局。通方法实质上是根据不同影响因素构建的模型来预测临床结局。通过预测不良事件发生的概率制定干预措施,从而改善患者健康,促进公共过预测不良事件发生的概率制定干预措施,从而改善患者健康,促进公共卫生领域的发展。卫生领域的发展。小结小结此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!