1、诊断性试验循证分析与评价诊断性试验循证分析与评价 授课教师:陈青山授课教师:陈青山暨南大学医学院流行病学教研室暨南大学医学院流行病学教研室意义:意义:提高临床医师的诊断水平提高临床医师的诊断水平J临床诊断需要研究高水平的诊断方法;J临床诊断需要对诊断性试验的临床价值进行科学的分析和评价。诊断性试验的概念诊断性试验的概念是对疾病进行诊断的试验方法诊断性试验的分类诊断性试验的分类实验室检查病理诊断影像诊断(如X线、CT、MRI、超声波以及放射性核素、纤维内镜、电镜等诊断方法)第一节 诊断性试验在临床医学中的重要性一、在循证医学实践中的临床意义一、在循证医学实践中的临床意义疾病诊断方法不断涌现新的诊
2、断性试验是否一定能超过原来的诊断新的诊断性试验是否一定能超过原来的诊断方法?方法?例如例如:诊断肺栓塞:诊断肺栓塞过去:过去:病史资料收集、D-二聚体检测近来:近来:CT、MRI、螺旋CT、CT肺动脉造影(CTPA)、MRI肺动脉造影(MRPA)这些方法各有千秋,虽然有的检查方法价格很贵,但均以无创性检查较为安全,由于特异度较低,有时肺栓塞的诊断,仍需多种检查的结果相互验证。目前确诊肺栓塞的“金标准”仍然是以有创的肺动脉造影(PAA)为依据,这说明近年来发展的螺旋CT、CT肺动脉造影、MRI肺动脉造影,并不优于过去的肺动脉造影。二、诊断性试验研究现状与发展方向二、诊断性试验研究现状与发展方向诊
3、断性试验较理想时J需要更可靠、更正确、更实用的诊断性试验;J原有基础上不断地研究和开发最好的诊断性试验 诊断性试验不理想时 J“组合性诊断标准”(constructing diagnostic criteria)l例如:1982年美国风湿学会建议的系统性红斑狼疮(SLE)诊断标准我国诊断性试验的研究不断发展我国诊断性试验的研究不断发展19851995年中华系列杂志中,共发表诊断性试验的论著50篇 19962000年中华检验医学杂志,共发表诊断性试验论著111篇 20012007年中华医学会6种核心杂志中共检出诊断性试验的论著5l篇 近近10年来快速诊断性试验年来快速诊断性试验(rapid di
4、agnostic tests,RDTs)在热带病研究中发展迅速在热带病研究中发展迅速 今后对诊断性试验的开发今后对诊断性试验的开发按照临床流行病学方法学创最佳证据的要求重视研究的质量事前做好设计方案、确定金标准和观测指标,而且对病例选择、样本含量、盲法试验、重复性试验等内容。第二节第二节 对诊断性试验研究评估的基本要求对诊断性试验研究评估的基本要求一、确定金标准一、确定金标准金标准定义:金标准定义:J指当前临床医师公认的诊断疾病最可靠的方法,指当前临床医师公认的诊断疾病最可靠的方法,也称为标准诊断。也称为标准诊断。金标准包括:金标准包括:J病理活检、手术发现、微生物培养、尸检、特殊病理活检、手
5、术发现、微生物培养、尸检、特殊检查和影像诊断,以及长期随访的结果检查和影像诊断,以及长期随访的结果。二、选择研究对象分组:分组:病例组(金标准确诊“有病”)对照组(金标准证实为“无病”的病例)病例组病例组:包括各型病例,以便诊断性试验的结果更具有临床实用价值。如:J典型和不典型病例;J早、中与晚期病例;J轻、中与重型病例;J有或无并发症者等对照组对照组:选用金标准证实无目标疾病的其他病例,特别是与该病容易混淆的病例,以期明确其鉴别诊断价值,J正常人一般不宜纳入对照组,否则可造成人为地夸大特异度样本含量样本含量确定定量资料参考值范围:J对照组的样本应满足100例(正态分布)或120例(非正态分布
6、);J病例组也应有100例特殊情况(罕见病例):J 对照组、病例组至少样本含量应在30例以上。参考临床流行病学样本含量的计算公式。三、盲法对比试验结果三、盲法对比试验结果 盲法与金标准进行同期对比,即要求判断试验结果的人不能预先知道,受检病例用金标准诊断为“有病”还是“无病”,以免发生疑诊偏倚,造成人为因素的影响。表表10-1 诊断试验四格表诊断试验四格表a(真阳性真阳性)b(假阳性假阳性)c(假阴性假阴性)d(真阴性真阴性)第三节第三节 循证医学中循证医学中 诊断性试验常用的指标诊断性试验常用的指标 一、敏感度一、敏感度(sensitivity,SEN)定义:诊断性试验检测为阳性的病例,在用
7、金标准确定为“有病”的病例中所占的比例。用途:敏感度愈高,则假阴性的病例(漏诊率)愈少,有助于筛查相应的疾病。公式:二、特异度二、特异度(specificity,SPE)定义:诊断性试验检测为阴性的病例,在用金标准确定为“无病”的病例中所占的比例。用途:特异度愈高,则假阳性的病例(误诊率)愈低,特别有助于确定诊断。公式:三、准确度三、准确度(accuracy,ACC)定义:诊断性试验检测为真阳性和真阴性病例总数,在全部被检病例数中所占的比例。公式:四、阳性预测值四、阳性预测值(positive predictive value,+PV)定义:诊断性试验检测为阳性的全部病例中,用金标准诊断为“有
8、病”病例所占的比例。公式:上4项指标是一般诊断性试验的常用指标:J敏感度和特异度是稳定而可靠的指标;J准确度和阳性预测值不具备很高的可信性l因为这两项指标与该试验患病率的高低有着相应的改变。Bayes公式,可看出阳性预测值波动的原因:五、诊断比值比五、诊断比值比(diagnostic odd ratio,DOR)定义:四格表中交叉乘积的比值用途:诊断性试验中相当稳定的指标公式:六、阳性似然比六、阳性似然比(positive likelihood ratio,+LR)定义:诊断性试验中,真阳性在“有病”患者中的比例与假阳性在“无病”例数中比例的比值。用途:诊断性试验阳性时患病与不患病机会的比值,
9、比值愈大则患病的概率愈大。公式:例例10-1 某诊断性试验的敏感度为90%,特异度为60%,如被检病例为1000例,当被检病例中的患病率增高时,阳性预测值和准确度均有较明显的改变,其结果如下:患病率=20%时:+PV=36%,ACC=66%,DOR=13.5患病率=60%时:+PV=77%,ACC=78%,DOR=13.5 当患病率增高时,+PV从36%上升到77%,ACC从66%上升到78%,说明这两项指标在同一项诊断性试验中并不是稳定指标,不宜用于评价诊断性试验的真实性和实用性。DOR的优越性较准确度为佳,在今后的研究和评价中,应该予以应用和推广。第四节第四节 诊断性试验诊断性试验 在循证
10、医学临床实践中的应用在循证医学临床实践中的应用 目的不同,对敏感度和特异度的要求不一:筛选病例、使漏诊率降低:选用敏感度高的诊断性试验确诊病例、使误诊率降低:选用特异度高的诊断性试验寻求最佳的临床证据,诊断性试验中常用:ROC曲线似然比的应用提高敏感度或特异度方法一、一、ROC曲线的应用曲线的应用ROC曲线(receiver operator characteristic curve)又称受试者工作特征曲线,在诊断性试验中应用的目的有两个:1、用于正常值临界点的选择2、用于优选性质类似的诊断性试验制图方法:制图方法:以该试验的敏感度(真阳性率)为纵坐标(Y轴),而以1-特异度(假阳性率)为横坐
11、标(X轴),依照连续分组测定的数据,分别计算SEN及SPE,按照平面几何方法,将给出各点联成曲线,即为ROC曲线判定方法:判定方法:曲线的各点中,距Y轴顶点直线距离最近的一点,即为正常值的最佳临界值。用该点数值区分正常与异常,其敏感度与特异度之和最大,而误诊及漏诊例数之和最小。若同一种疾病有两种或两种以上诊断性试验方法需要进行优选时,则可用ROC曲线进行比较。如图10-1所示:曲线顶点与纵坐标顶点最 接近者(如CT scan),就是 两者间最好的诊断性试验比较两条曲线下的面积 (area under curve,AUC),其面积大者为佳。J面积的计算和显著性检验,均可使用软件包(STATA)进
12、行运算例例l0-2 某医院采用餐后2小时血糖测定,对诊断糖尿病患者及非糖尿病患者进行连续检查,结果如表10-2,试问诊断糖尿病的临界值,应确定在哪一个数值最正确?表10-2 餐后2小时血糖测定及SEN与SPE将各组的数据,分别在纵坐标和横坐标上绘出并连成曲线,即为ROC曲线。如下图所示。在各点中距左上角直线距离最近的一点(曲线左起第4点),就是该试验的临界值。故诊断糖尿病餐后2H血糖 测定值,定为110mg/dl (6.11mmol/L)最为恰当。由表10-2可知:随血糖浓度的升高,敏感度下降而特异度升高。故敏感度和特异度中任一数值的提高,必然导致另一数值的降低。若临界值为100mg/dl(5
13、.55mmol/L):漏诊率(1-SEN)为11%,而有30%的非糖尿病受试者被误诊。若临界值为120mg/dl(9.66mmol/L):漏诊率(1-SEN)上升到29%,而误诊率(1-SPE)则为7.5%。当餐后血糖临界值定为110mg/dl(6.11mmol/L)时,该阈值的敏感度和特异度之和为最大、漏诊率和误诊率之和最小。因此,餐后血糖定为110mg/dl作为临界值最适当,恰与ROC曲线确定的临界值相同。二、似然比的临床应用二、似然比的临床应用综合评价诊断性试验的理想指标综合敏感度与特异度的临床意义可依据试验结果的阳性或阴性计算某病例患病的概率,以便在诊断性试验检测后,更确切地对患者进行
14、诊断阳性似然比(+LR):诊断性试验的真阳性率a/(a+c)与假阳性率b/(b+d)之间的比值;真阳性率 ,阳性似然比 。例例10-3 研究者对贫血患者,进行血清铁蛋白(ferritin)检查,选定65g/L(ng/ml)为临界值,当血清铁蛋白65g/L则诊断为缺铁性贫血,而65g/L,则为非缺铁性贫血;共计检查2579例贫血患者,结果见表10-3。根据表10-3可计算出一系列诊断指标,现将计算结果简述如下:表10-3 缺血性贫血患者血清铁蛋白检查结果 SEN=731/809=90.4%SPE=1500/1770=84.7%+LR=SEN/(1-SPE)=5.9 如将铁蛋白测定的计量资料进行分
15、层处理,则可计算不同检测水平的阳性似然比,如表10-4所示表10-4缺铁性贫血患者血清铁蛋白分层检验结果 阳性似然比的应用:阳性似然比的应用:确定某项检验或某项体征的阳性似然比 根据患者的病史、体征进行验前概率的估计 根据检测结果,应用阳性似然比,计算该病例患病的验后概率步骤如下:步骤如下:验前概率(pretest probability)=医师依据病史及体征做出的初步估计验前比值(pretest odds)=验后比值(post-test odds)=验前比值似然比验后概率(post-test probability)=验前概率)(验前概率-1验后比值)(验后比值1例例10-4一位农村妇女36
16、岁,面色不好,心慌乏力半年多,平时务农,每次月经量偏多,如何考虑患者的诊断?根据病史:务农、月经偏多、面色不好、乏力半年、可能有贫血及钩虫感染。初步诊断:依据病史,诊断缺铁性贫血(IDA)的可能性至少有60%(验前概率)。化验检查:Hb 65g/L,RBC 3.401012/L,血清铁蛋白20g/L(+LR=8.8)。验前概率=60%验前比值=0.60(1-0.60)=1.5验后比值=1.58.8=13.2验后概率=13.2(1+13.2)=0.93答:该女性患者IDA的验后概率为93%。J 验前概率是临床医生根据病史、体征等,估计该患者可能患病的概率;经诊断性试验(血红蛋白、铁蛋白)检查后,
17、可利用+LR计算验后概率,然后对患者最后诊断。J 上述病例经检查后,诊断缺铁性贫血的概率,从最初估计的60%提高到93%,确定诊断后就可及时给予相应的治疗;这说明阳性似然比在临床上确有很大的实用价值。注意事项:注意事项:只有验前概率=该试验的患病率时,验后概率=阳性预测值。否则,不能认为验后概率就等于阳性预测值。J例如,在表10-3各项数据中,可以计算患病率=8092579=31.4%,阳性预测值=73l100l=73.0%。假定某患者的验前概率为50%,+LR仍然是8.8,按上述方法计算验后概率为89.8%,该数值与诊断性试验的阳性预测值(73.0%)迥然不同。表10-5+LR和验前概率与验
18、后概率的关系*表中数据均为验后概率(%)由上表可知:如果阳性似然比较高,即使验前概率在较低情况下,验后概率也会有很大的增长 表10-6 部分常见病、诊断性试验结果的阳性似然比(1)接下页表10-6 部分常见病、诊断性试验结果的阳性似然比(2)为了提高患者的验后概率,如果一位患者有2项或2项以上的诊断性试验为阳性,就会有2个或2个以上的阳性似然比,然后将阳性似然比合并,就可以得到较高的验后概率,具体方法简述如下:验前概率=临床医师依据病史、体征做出的估计验前比值(pretest odds)=验后比值(post-test odds)=验前比值(+LR1)(+LR2)验后概率(post-test p
19、robability)=验前概率)(验前概率-1验后比值)(验后比值1例例10-5 患者为40岁男性,因胸前闷胀来院就诊,经仔细询问2年前曾有不典型心绞痛,经ECG检查ST水平下移2mm,试问该患者患有CHD的可能性有多大?解:40岁男性有胸前不适,估计患CHD的可能性有20%,根据表10.6不典型心绞痛的+LR=14,心电图ST下移2mm的+LRl=1l,现分别计算验前比值、验后比值及验后概率。验前概率:临床估计为0.20验前比值=0.20(1-0.20)=0.25验后比值=0.25141l=38.5验后概率=38.5(1+38.5)=97.5答:该患者患有CHD的概率为97%。三、提高诊断
20、性试验敏感度或特异度的方法三、提高诊断性试验敏感度或特异度的方法 1平行试验平行试验(parallel test)定义:为提高诊断的敏感度,同时对受检者进行几项目的相同的诊断性试验,只要有一项试验阳性,即可判断为患病者,这种方法称为平行试验或并联试验。意义:J凡是诊断试验阳性的患者均可诊断目标疾病,因而提高了敏感度,减少漏诊病例;J假阳性病例有所增高,此时应注意做好鉴别诊断。但凡诊断试验阴性者,则可排除目标疾病,在临床应用时甚为方便。表10-7 平行试验结果的判断方法平行试验计算敏感度及特异度的公式:平行试验SEN=SEN A+(1-SEN A)SEN B平行试验SPE=SPE ASPE B
21、例例10-6 试验A:SEN=65%,SPE=80%;试验B:SEN=75%,SPE=90%;计算两项平行试验合并后的敏感度与特异度。解:按照平行试验公式进行以下运算:平行试验SEN=0.65+(1-0.65)0.75=0.9 1平行试验SPE=0.800.90=0.72答:使用两种诊断性试验进行平行试验后,敏感度为91%较前有显著提高,这样可尽量减少目标疾病的漏诊,适用于大样本的筛查工作;但特异度下降明显,应注意误诊问题。2序列试验序列试验(serial test)定义:采用序贯方法进行两项或两项以上的诊断性试验,并且均取得阳性结果后,才作出疾病诊断的多项试验方法,称为序列试验或串联试验。序
22、列试验可提高SPE与+PV,而降低SEN与-PV;提高特异度目的在于确诊病例,使误诊率降到最低水平,从而有利于对患者及时给予正确的诊断和治疗。序列试验与平行试验不同之处,在于其必须每项试验均为阳性时才能够加以合并。序列试验计算敏感度及特异度的公式:J序列试验SEN(A+B)=SEN ASEN BJ序列试验SPE(A+B)=SPEA+(1-SPEA)SPE B例如例如:急性心肌梗死患者,不同的酶学测定结果SEN、SPE各有高低(表10-8),单项应用易发生假阳性造成误诊,如三项同时应用,则可提高确诊的概率,从而确定疾病的诊断。表10-8单项酶学测定的SEN与SPE 3项试验均为阳性时,依据表10
23、-8计算SEN及SPE的方法如下:SEN(A+B+C)=0.960.910.87=0.76SPE(A+B)=0.57+(1-0.57)0.74=0.89SPE(A+B+C)=0.89+(1-0.89)0.91=0.99 l如果要求三项结果均为阳性,才可确诊心肌梗死,则联合应用三项试验的SPE可高达99%,但是SEN则下降为76%。l本例应用序列试验,当3项试验结果均为阳性时,则诊断急性心肌梗死的概率可高达99%,误诊概率仅为1%,这就达到了循证医学诊断的预期目标。第五节第五节 诊断性试验证据的评估诊断性试验证据的评估 诊断性试验的评价标准诊断性试验的评价标准 表10-9 诊断性试验的评价标准
24、1是否用盲法将诊断性试验与参考标准是否用盲法将诊断性试验与参考标准(金金标准标准)进行独立的对比研究进行独立的对比研究?人工检测:避免偏倚,使该试验更具有科学性自动化分析检测仪:操作得当,结果真实 2该诊断性试验是否包括了适当的病谱该诊断性试验是否包括了适当的病谱?诊断性试验的受试患者应包括各型病例(轻、重、治疗、未治疗)以及个别易于混淆的病例例如,测定血中T3、T4诊断甲亢 测定血糖诊断糖尿病 测定肝功能、肾功能判断肝脏和肾脏受损情况J以上均是较好的诊断性试验 3诊断性试验的检测结果,是否会影响参诊断性试验的检测结果,是否会影响参考标准的应用考标准的应用?若使用的诊断标准不可靠,当新的诊断性
25、试验结果与原诊断出现差异时,须继续观察以明确患者的诊断,再进一步判断原来的标准诊断是否存有缺陷,以及新的诊断性试验是否真正可靠因此,在评价过程中,一方面要考虑原有金标准是否恰当,另一方面要考虑新的诊断性试验,是否真有新的发现。4如将该试验应用于另一组病例,是否也如将该试验应用于另一组病例,是否也具有真实性具有真实性?一项可靠的诊断性试验,在判断其真实性时,应考虑到该试验的重复性(reproducibility)。在新开展的病例组检测中,应该注意该组的患病率是否与以往的病例组不同,因为患病率不同的病例组,就不能使用阳性预测值和准确度作为评价的指标。5是否通过该项诊断性试验,能正确诊断是否通过该项
26、诊断性试验,能正确诊断或鉴别该患者有无特定的目标疾病或鉴别该患者有无特定的目标疾病?我们在临床上考虑初步诊断的可能性,就可认为是验前概率,通过诊断性试验得到了阳性似然比,就可以计算验后概率。在这个过程中,诊断性试验对我们的诊断性思维能起多大的作用,这就是该试验正确诊断疾病的能力;验后概率越高,说明该试验正确诊断目标疾病的能力就越强。例如例如:表10-5所示,当某个试验的+LR=10时,即使验前概率只有30%,但通过试验检测结果为阳性,其验后概率可高达81%,这就使我们的初步诊断有了更大的把握,也就可以说明该试验对临床诊断的重要性。6是否进行了分层似然比的计算是否进行了分层似然比的计算?要计算分
27、层似然比,须要有分层数据的原始资料,这样计算分层的阳性似然比,以便更确切地计算验后概率,使该试验的临床重要性有所提高。但此资料除非在开展临床流行病学或循证医学的单位,所进行的研究工作才会有这样的报道,一般文献报道的资料都很少涉及此项内容。例如:表10-4就是分层似然比的表格,假设某女性患者,因贫血就诊初步考虑缺铁性贫血的可能性(验前概率)有50%,另外的50%是其他原因的贫血,经检查血清铁蛋白结果为15g/L。查表10-4可知+LR=8.8;按公式计算其验后概率可达90%,大大肯定了我们最初的诊断,这说明分层的阳性似然比更具有临床诊断的重要性。7该试验是否能在本单位开展并能进行正该试验是否能在
28、本单位开展并能进行正确的检测确的检测?在报道的资料中,是否明确地叙述了试验的原理、试剂、操作步骤与方法、检测对象与注意事项;以便结合本单位隋况,考虑可否开展该项试验,有无经济效益等。例如:例如:设有专科门诊的医院,开展冠状动脉造影检查冠心病患者,或血液专科门诊开展血红蛋白电泳,检查长期患有小细胞贫血的患者,则阳性率较高,价值较大。如果这些检查用于基层医院,对一般的冠心病及贫血病人进行检测,不但前者会有风险存在,而且阳性率也很低,开展这样的试验实用价值不大,经济效益也会明显受到影响。8我们在临床上是否能够合理估算病人的我们在临床上是否能够合理估算病人的验前概率验前概率?合理的验前概率估计多与以下
29、三个因素有关:医师本人的临床经验;该病在当地的发生情况(群体的患病率);诊断性试验的应用范围是否符合我们的病例 在临床医师掌握以上基本情况后,如果新的诊断试验确实可靠,能够及时对目标疾病进行检测,这时对患者的验前概率进行恰当估计,通过检测就可以达到早期正确诊断的目的,体现诊断性试验的临床实用价值。9检测后得到的验后概率是否有助于我们检测后得到的验后概率是否有助于我们对患者的处理对患者的处理?利用+LR,计算验后概率是否跨越诊断-治疗阈值(见图10-3,阈值B)J跨越阈值:说明患者的诊断已经基本明确,应开始治疗,以使患者能及早获得最佳疗效;J未跨越阈值:进一步检查并给予适当治疗,以免延误病情。综合前述,循证医学对诊断性试验的3项9条评价标准,与临床流行病学应用的评价标准相比,要求更为严格、评估难度更高;从真实性、重要性和实用性三方面进行评估,然后提供循证医学在诊断方面的最佳证据。在应用中要体会各条标准的内涵,逐渐熟悉、逐步提高,并在每篇文献评价后,进行一个恰当的小结。Thanks!