1、诊断性试验的研究和评价诊断性试验的研究和评价 疾病的诊断和治疗是临床医学的两个主要组成疾病的诊断和治疗是临床医学的两个主要组成部分部分,正确的诊断是治疗的重要前提。正确的诊断是治疗的重要前提。随着现代科学技术和医学本身的发展,越来随着现代科学技术和医学本身的发展,越来越多的实验室检查及医疗仪器检查被引入临床,越多的实验室检查及医疗仪器检查被引入临床,这些对疾病的诊断也起着日益重要的作用。这些对疾病的诊断也起着日益重要的作用。引言引言第一节第一节 诊断性试验的概念和诊断性试验的概念和研究方法研究方法一、诊断性试验的概念一、诊断性试验的概念 诊断性试验(诊断性试验(Diagnostic TestD
2、iagnostic Test)是对)是对一种新的诊断方法一种新的诊断方法,包括症状、体征、化验包括症状、体征、化验与特殊检查的评价。与特殊检查的评价。v科学性、临床意义、实用性;科学性、临床意义、实用性;v实验室过渡到临床推广前必不可少的一步。实验室过渡到临床推广前必不可少的一步。用于诊断的指标可分为用于诊断的指标可分为:主观指标:主观指标:指由被诊断者的主诉而确定的;指由被诊断者的主诉而确定的;半客观(或半主观)指标:半客观(或半主观)指标:指根据诊断者的感指根据诊断者的感觉而加以判断的指标,如肿物的硬度,肺部啰音的觉而加以判断的指标,如肿物的硬度,肺部啰音的多少,脉象弦、滑等;多少,脉象弦
3、、滑等;客观指标:客观指标:能用客观仪器加以测量的。能用客观仪器加以测量的。如何对一个新的诊断指标进行研究和评价呢?如何对一个新的诊断指标进行研究和评价呢?将待评价的诊断试验与金标准诊断试验进行盲法将待评价的诊断试验与金标准诊断试验进行盲法同步(或先后)比较;同步(或先后)比较;金标准:金标准:指可靠、公认的诊断方法:指可靠、公认的诊断方法:活体检查、尸检、外科发现、特殊的影像诊活体检查、尸检、外科发现、特殊的影像诊断、长期随访临床观察等;断、长期随访临床观察等;二、基本方法二、基本方法:将研究人群准确地分为有病和无病两组将研究人群准确地分为有病和无病两组q 冠心病冠心病:冠状动脉造影冠状动脉
4、造影q 肿瘤肿瘤:病理学检查病理学检查q 肾结石肾结石:手术发现手术发现例:例:金标准具有创伤性,因此探求一些新的诊断金标准具有创伤性,因此探求一些新的诊断方法(诊断试验),并比较其与金标准的差别、方法(诊断试验),并比较其与金标准的差别、得失及推广价值有现实意义。得失及推广价值有现实意义。选择受试对象选择受试对象 (要有代表性)(要有代表性)确定样本含量确定样本含量 按金标准分组按金标准分组 (病例组和对照组病例组和对照组)进行诊断试验进行诊断试验 评价,结论评价,结论 (四格表)(四格表)三、具体方法和步骤三、具体方法和步骤:选择病例选择病例临床各型临床各型(轻、中、重轻、中、重)临床各期
5、临床各期(早、中、晚早、中、晚)有无并发症有无并发症选择对照选择对照*健康人健康人*未患该病而患其他疾病的病人未患该病而患其他疾病的病人v 对试验灵敏度的要求对试验灵敏度的要求v 对试验特异度的要求对试验特异度的要求v允许误差允许误差 样本含量与下列因素有关样本含量与下列因素有关表表1 1:诊断性试验与金标准检测结果的比较:诊断性试验与金标准检测结果的比较 金标准金标准 有病有病 无病无病 合计合计试验诊试验诊 阳性阳性 真阳性真阳性(a)(a)假阳性假阳性 (b)a(b)ab b断方法断方法 阴性阴性 假阴性假阴性(c)(c)真阴性真阴性 (d)c(d)cd d 合计合计 a ac bc b
6、d ad ab bc cd d SenSena/a/(a ac c)100100 金标准诊断为有病的病例中,诊断试验检测为金标准诊断为有病的病例中,诊断试验检测为阳性例数的比例。阳性例数的比例。敏感度越高,漏诊率(假阴性率,敏感度越高,漏诊率(假阴性率,)越少。)越少。漏诊率(假阴性率)敏感度漏诊率(假阴性率)敏感度四、评价指标四、评价指标:1.1.敏感度(敏感度(SensitivitySensitivity,SenSen,真阳性率):,真阳性率):SpeSped/d/(b bd d)100100 金标准诊断为无病的病例中,诊断试验检测为阴性金标准诊断为无病的病例中,诊断试验检测为阴性例数的比
7、例。例数的比例。特异度越高,误诊率(假阳性率,特异度越高,误诊率(假阳性率,)越少。)越少。误诊率(假阳性率)特异度误诊率(假阳性率)特异度2.2.特异度(特异度(SpecificitySpecificity,SpeSpe,真阴性率):,真阴性率):敏感度与特异度的关系敏感度与特异度的关系 人们希望所用的人们希望所用的诊断试验方法是灵敏度诊断试验方法是灵敏度和特异度都高的。但二和特异度都高的。但二者的关系为一个提高,者的关系为一个提高,则另一个下降。则另一个下降。血糖水平标血糖水平标准(准(mg/dLmg/dL)灵敏度()灵敏度()特异度()特异度()90 90 98.698.67.3 7.3
8、 100 100 97.1 97.1 25.3 25.3 110 92.9 92.9 48.4 48.4 12012088.6 88.6 68.2 68.2 130 81.4 82.4 82.4 140 140 74.3 91.2 160 55.7 98.6 98.6 180 50.0 50.0 99.8 99.8 例:不同血糖水平诊断糖尿病的灵敏度、特异度例:不同血糖水平诊断糖尿病的灵敏度、特异度以高敏感度为优先考虑:以高敏感度为优先考虑:疾病的漏诊可能造成严重后果。疾病的漏诊可能造成严重后果。诊断性试验的目的是为了排除疾病。诊断性试验的目的是为了排除疾病。在无症状人群中筛选病例,而该病的发
9、病率又在无症状人群中筛选病例,而该病的发病率又较低。较低。以高特异度作为优先考虑:以高特异度作为优先考虑:假阳性结果会导致病人肉体、精神或者经济上假阳性结果会导致病人肉体、精神或者经济上的严重危害时。的严重危害时。为了肯定诊断。这样,当试验结果是阳性时,为了肯定诊断。这样,当试验结果是阳性时,就有足够的把握确定诊断。就有足够的把握确定诊断。YIYI灵敏度灵敏度+特异度特异度-1-1 表示表示:约登指数越大,约登指数越大,其真实性亦越好。其真实性亦越好。3.3.约登指数约登指数(YoudensYoudens indxindx,YI)YI)阳性预告值:阳性预告值:PPVPPVa/a/(a ab b
10、)100100 表示:全部阳性例数中,表示:全部阳性例数中,“有病有病”患者(真阳性患者(真阳性)所占的比例。)所占的比例。4.4.阳性预测值(阳性预测值(Positive predictive valuePositive predictive value,PPVPPV)阴性预告值:阴性预告值:NPVNPVd/d/(c cd d)100100 表示:全部阴性例数中,表示:全部阴性例数中,“无病无病”者(真阴性者(真阴性)所占的比例。)所占的比例。5.5.阴性预测值(阴性预测值(Negative predictive valueNegative predictive value,NPVNPV)P
11、LR PLRSen/Sen/真阳性率真阳性率/假阳性率假阳性率 意义:诊断试验结果阳性时,患病与不患病机会意义:诊断试验结果阳性时,患病与不患病机会的比值。的比值。PLR PLR 患病概率患病概率6.6.阳性似然比(阳性似然比(positive likelihood ratiopositive likelihood ratio,PLRPLR):):NLR NLR /Spe/Spe 假阴性率假阴性率/真阴性率真阴性率 意义:诊断试验结果阴性时,患病与不患病机意义:诊断试验结果阴性时,患病与不患病机会的比值。会的比值。阴性似然比较大,表明当试验结果为阴性时患阴性似然比较大,表明当试验结果为阴性时患
12、病的可能性仍较大,因而排除该病的可能性不大。病的可能性仍较大,因而排除该病的可能性不大。7.7.阴性似然比(阴性似然比(Negative likelihood ratioNegative likelihood ratio,NLRNLR):):Acc Acc(a+da+d)/(a+b+c+da+b+c+d)诊断性试验检测为真阳性和真阴性,在总检例数中诊断性试验检测为真阳性和真阴性,在总检例数中的比例。的比例。8.8.准确度(准确度(accuracyaccuracy,Acc)Acc)PREV PREV (a+c)a+c)/(a+b+c+da+b+c+d)意义:经诊断试验检测的全部病例中,真正意义:
13、经诊断试验检测的全部病例中,真正“有病有病”患者所占的比例。患者所占的比例。在级别不同的医院中,某种疾病的患者集中程在级别不同的医院中,某种疾病的患者集中程度不同,故患病率差别较大,因而会影响阳性及阴度不同,故患病率差别较大,因而会影响阳性及阴性预测值的结果。性预测值的结果。9.9.患病率(患病率(prevalenceprevalence,prevprev):):诊断试验评价指标计算举例:诊断试验评价指标计算举例:表表1 1:医院就诊者心电图运动试验对冠状动脉狭窄病人的诊断结果:医院就诊者心电图运动试验对冠状动脉狭窄病人的诊断结果 冠状动脉狭窄冠状动脉狭窄 是是 否否 合计合计心心 电电 图图
14、 5555(a)(a)7 7(b)(b)62 62(a(ab)b)运动试验运动试验 49 49(c)(c)84 84(d)(d)133 133(c(cd)d)合合 计计 104 91 195104 91 195 (a(ac)c)(b(bd)d)表表1 1计算结果:计算结果:患病率患病率=(a=(ac)/(ac)/(ab bc cd)=104/195=53%d)=104/195=53%敏感度敏感度=a/(a=a/(ac)=55/104=53%c)=55/104=53%特异度特异度=d/(b=d/(bd)=84/91=92%d)=84/91=92%准确度准确度=(a=(ad)/(ad)/(ab b
15、c cd)=139/195=71%d)=139/195=71%阳性预测值阳性预测值=a/(a+b)=55/62=89%=a/(a+b)=55/62=89%阴性预测值阴性预测值=d/(c+d)=84/133=63%=d/(c+d)=84/133=63%阳性似然比阳性似然比=敏感度敏感度/(1-/(1-特异度特异度)=0.53/(1-0.92)=6.63)=0.53/(1-0.92)=6.63阴性似然比阴性似然比=(1-=(1-敏感度敏感度)/)/特异度特异度=(1-0.53)/0.92=0.5=(1-0.53)/0.92=0.5表表2:2:某社区冠心病高发区人群心电图运动试验对冠状动脉狭窄病人的
16、诊断结某社区冠心病高发区人群心电图运动试验对冠状动脉狭窄病人的诊断结果果 冠状动脉狭窄冠状动脉狭窄 是是 否否心心 电电 图图 55(a)(b)42 (a55(a)(b)42 (ab)97b)97运动试验运动试验 49(c)(d)478 (c49(c)(d)478 (cd)527d)527 合合 计计 104 520 624104 520 624 (a (ac)(bc)(bd)d)表表2 2计算结果:计算结果:患病率患病率=(a=(ac)/(ac)/(ab bc cd)=17%d)=17%敏感度敏感度=a/(a=a/(ac)=53%c)=53%特异度特异度=d/(b=d/(bd)=92%d)=
17、92%准确度准确度=(a=(ad)/(ad)/(ab bc cd)=85%d)=85%阳性预测值阳性预测值=a/(a+b)=57%=a/(a+b)=57%阴性预测值阴性预测值=d/(c+d)=91%=d/(c+d)=91%阳性似然比阳性似然比=敏感度敏感度/(1-/(1-特异度特异度)=6.63)=6.63阴性似然比阴性似然比=(1-=(1-敏感度敏感度)/)/特异度特异度=0.51=0.51第二节第二节 诊断性试验的应用诊断性试验的应用及临床意义及临床意义一、诊断试验指标的稳定性 随着检测范围的扩大,患病率随着检测范围的扩大,患病率 评价指评价指标的改变,可以有三种情况:标的改变,可以有三种
18、情况:v稳定的指标:稳定的指标:敏感度、特异度、敏感度、特异度、阳性阳性似然比似然比、阴性似然比阴性似然比v相对稳定的指标:相对稳定的指标:准确度准确度v不稳定的指标:不稳定的指标:阳性预测值、阴性预测值阳性预测值、阴性预测值二、二、受试者工作特性曲线(受试者工作特性曲线(R曲线)曲线)(一)(一)Receiver Operator Characteristic Receiver Operator Characteristic CurveCurve(二)它以敏感度(真阳性率)为纵坐标,(二)它以敏感度(真阳性率)为纵坐标,1 1特异度(假阳性率)为横坐标特异度(假阳性率)为横坐标血糖水平标血糖
19、水平标准(准(mg/dLmg/dL)灵敏度()灵敏度()特异度()特异度()90 90 98.698.67.3 7.3 100 100 97.1 97.1 25.3 25.3 110 92.9 92.9 48.4 48.4 12012088.6 88.6 68.2 68.2 130 81.4 82.4 82.4 140 140 74.3 91.2 160 55.7 98.6 98.6 180 50.0 50.0 99.8 99.8 例:不同血糖水平诊断糖尿病的灵敏度、特异度例:不同血糖水平诊断糖尿病的灵敏度、特异度敏敏 100100感感 A A 度度 8080%真真 6060阳阳 性性 404
20、0率率 2020 0 20 40 60 80 100 0 20 40 60 80 100 1-1-特异度特异度%(假阳性率)(假阳性率)图图1.1.糖尿病诊断中的曲线糖尿病诊断中的曲线最佳阈值的选择,如图中的点,此时的敏感度和特异度分最佳阈值的选择,如图中的点,此时的敏感度和特异度分别为和别为和(三)曲线用构图法除直观地表达了敏感度和(三)曲线用构图法除直观地表达了敏感度和特异度之间的关系外,还具有以下几个特性:特异度之间的关系外,还具有以下几个特性:l曲线常用来决定最佳阈值的选择曲线常用来决定最佳阈值的选择诊断性试验最佳诊断阈值一般为敏感度与特异诊断性试验最佳诊断阈值一般为敏感度与特异度之和
21、最高,而假阳性和假阴性之和最小的测试值度之和最高,而假阳性和假阴性之和最小的测试值所选的点从所选的点从ROCROC曲线看是接近左上角的测试值,曲线看是接近左上角的测试值,也即应尽量靠近左上角。也即应尽量靠近左上角。l 曲线下的面积,它代表该试验在各阈值判断正曲线下的面积,它代表该试验在各阈值判断正确(真阳性及真阴性)部分,代表诊断性试验确(真阳性及真阴性)部分,代表诊断性试验整体准确性或真实性,整体准确性或真实性,ROCROC曲线下面积越大则曲线下面积越大则该诊断性试验的准确性越高;该诊断性试验的准确性越高;l l 该曲线还可以用来直观地比较两种或两种以上该曲线还可以用来直观地比较两种或两种以
22、上的诊断性试验的诊断价值,以帮助临床医师作的诊断性试验的诊断价值,以帮助临床医师作出最佳选择。出最佳选择。三、三、采用联合试验采用联合试验 对于单个试验来说提高其敏感度或和对于单个试验来说提高其敏感度或和特异度是困难的,可以通过提高联合试验的特异度是困难的,可以通过提高联合试验的敏感度和特异度来达到提高诊断性试验效率敏感度和特异度来达到提高诊断性试验效率的目的。的目的。联合试验的方法有两种,即联合试验的方法有两种,即并联试验并联试验(平行试验)(平行试验)和和串联试验串联试验(系列试验)。(系列试验)。1 1并联试验:并联试验:同时进行多项诊断试验,在这些试验中只要有同时进行多项诊断试验,在这
23、些试验中只要有一项是阳性,即可认为有患病的证据,并联试验常一项是阳性,即可认为有患病的证据,并联试验常常应用于一些必须迅速确诊的危重症病人或急诊病常应用于一些必须迅速确诊的危重症病人或急诊病人人 优点:能提高敏感度和阴性预测值优点:能提高敏感度和阴性预测值 缺点:同时降低特异度、阳性预测值缺点:同时降低特异度、阳性预测值 并联敏感度敏感度并联敏感度敏感度A(1-敏感度敏感度A)敏感度敏感度B 并联特异度特异度并联特异度特异度A特异度特异度B例:例:并联试验对深部静脉血栓形成的诊断并联试验对深部静脉血栓形成的诊断 (与静脉造影术比较与静脉造影术比较)静脉造影术静脉造影术 阳性阳性 阴性阴性 合计
24、合计 阻抗阻抗 两项或任两项或任 阳性阳性 81 10 9181 10 91描记描记 一项一项和扫和扫 两项均两项均 阴性阴性 5 104 1095 104 109描描 合计合计 86 114 20086 114 200并联试验敏感度并联试验敏感度 特异度特异度2.2.串联试验串联试验 是指连续性地进行一系列试验中,要求每项是指连续性地进行一系列试验中,要求每项试验均为阳性,才可认为有患病的证据。只要任何试验均为阳性,才可认为有患病的证据。只要任何一试验出现阴性结果,则终止该系列试验。该联合一试验出现阴性结果,则终止该系列试验。该联合试验的方法适合于不急需迅速作出确诊的病人。试验的方法适合于不
25、急需迅速作出确诊的病人。优点:是可以提高特异度和阳性预测值优点:是可以提高特异度和阳性预测值 缺点:降低敏感度和阴性预测值缺点:降低敏感度和阴性预测值 串联特异度特异度串联特异度特异度A(1特异度特异度A)特异度特异度B串联敏感度敏感度串联敏感度敏感度A敏感度敏感度B 例:血清酶的串联试验对急性心肌梗塞的诊断例:血清酶的串联试验对急性心肌梗塞的诊断血清酶试验血清酶试验 敏感度敏感度 特异度特异度 0.96 0.570.96 0.57 0.91 0.740.91 0.74 0.87 0.910.87 0.91三项均阳性三项均阳性 0.78 0.950.78 0.95v并联试验适用于某些需要敏感度
26、较高的试验并联试验适用于某些需要敏感度较高的试验v串联试验适用于某些需要较高特异度的试验串联试验适用于某些需要较高特异度的试验第三节 诊断试验证据的评价原则 前面所述常用指标是判定一个诊断性试验前面所述常用指标是判定一个诊断性试验的临床价值和实用意义的重要指标,但是对一的临床价值和实用意义的重要指标,但是对一个诊断性试验进行科学的评价,不能只单纯看个诊断性试验进行科学的评价,不能只单纯看这几项指标的数值,还应考察这些数据的来源:这几项指标的数值,还应考察这些数据的来源:1.1.是否科学、真实?是否科学、真实?2.2.临床意义?临床意义?3.3.适用性和推广性?适用性和推广性?一、诊断试验证据的
27、真实性评价v1.是否设立了准确性高的标准方法(金标是否设立了准确性高的标准方法(金标准),并采用了盲法与它进行比较?准),并采用了盲法与它进行比较?标准方法本身的准确性是保证新方法准确性的标准方法本身的准确性是保证新方法准确性的关键,在评价一项诊断性实验的价值时,也应看该关键,在评价一项诊断性实验的价值时,也应看该研究过程中是否设立了准确性高的金标准作为对照。研究过程中是否设立了准确性高的金标准作为对照。盲法它包括两层意思:盲法它包括两层意思:1.1.进行诊断试验和解释试验结果应由不知道受试者进行诊断试验和解释试验结果应由不知道受试者金标准诊断结果的医师完成;金标准诊断结果的医师完成;2.2.
28、进行金标准检查和解释结果的医师也应是不知道进行金标准检查和解释结果的医师也应是不知道受试者诊断试验结果。受试者诊断试验结果。目的是避免研究者为了满足自己的意愿而主观目的是避免研究者为了满足自己的意愿而主观用事。用事。2.被检病例是否包括适当范围的病例(轻、重被检病例是否包括适当范围的病例(轻、重型,治疗与未治疗病例)以及个别容易混淆的型,治疗与未治疗病例)以及个别容易混淆的病例?病例?v与轻型或早期非典型病例相比,典型的重型病例在临与轻型或早期非典型病例相比,典型的重型病例在临床上是比较容易诊断的;床上是比较容易诊断的;v如果被检病例只包括了典型的重病人,那么该新诊断如果被检病例只包括了典型的
29、重病人,那么该新诊断试验方法的效果无疑会被夸大;试验方法的效果无疑会被夸大;v能对轻型,早期非典型病例作出正确的诊断应具有更能对轻型,早期非典型病例作出正确的诊断应具有更重要的临床实用价值;重要的临床实用价值;病例的筛选也是进行诊断试验研究关键的一环,应病例的筛选也是进行诊断试验研究关键的一环,应对病例的纳入标准作严格的规定对病例的纳入标准作严格的规定 如一些个体特征:如年龄、性别、体质等如一些个体特征:如年龄、性别、体质等 病例的不同来源:一般门诊与专家门诊病例的不同来源:一般门诊与专家门诊 患病率的不同和病人患病的病情严重程度患病率的不同和病人患病的病情严重程度3.试验结果的重复性如何?试
30、验结果的重复性如何?结果的重复性包括两层意思:结果的重复性包括两层意思:1.1.相同的实验条件下,该试验对同样的病人其结果的重相同的实验条件下,该试验对同样的病人其结果的重复性如何;复性如何;2.2.按照研究者报导的方法,其它医院试验结果的重复性按照研究者报导的方法,其它医院试验结果的重复性如何。如何。4.试验中所确定的参照值(正常值,截断值)试验中所确定的参照值(正常值,截断值)是否可靠?是否可靠?参照值是否可靠主要与若干因素有关:参照值是否可靠主要与若干因素有关:研究对象的纳入标准;研究对象的纳入标准;样本是否具有同质性,能否代表总体;样本是否具有同质性,能否代表总体;测量是否避免了偏移等
31、。测量是否避免了偏移等。如何选用参照值的临界点或参照值范围,应权如何选用参照值的临界点或参照值范围,应权衡该参照值的确定对观察对象判断后所造成的误诊衡该参照值的确定对观察对象判断后所造成的误诊及漏诊,来审核该参照值是否合理;并考虑影响试及漏诊,来审核该参照值是否合理;并考虑影响试验可靠的各因素,审核该参照值的可靠性。验可靠的各因素,审核该参照值的可靠性。(二)诊断试验的临床意义?v 5.诊断指标的计算是否正确,是否具有临诊断指标的计算是否正确,是否具有临床意义?床意义?敏感度、特异度、预测值、似然比敏感度、特异度、预测值、似然比(三)诊断试验的临床适用性?v6.6.该方法的临床实用价值如何,是
32、否值得在临床推广应用?该方法的临床实用价值如何,是否值得在临床推广应用?一个诊断试验只有当其对某病具有诊断价值时,才考一个诊断试验只有当其对某病具有诊断价值时,才考虑应用于临床,统计学上的显著性差异只是表明该差异由虑应用于临床,统计学上的显著性差异只是表明该差异由机遇造成的概率很小,可以认为确实存在差异,但并不表机遇造成的概率很小,可以认为确实存在差异,但并不表示该差异在临床上有意义。示该差异在临床上有意义。v 7.7.该方法在临床推广应用的可行性如何?该方法在临床推广应用的可行性如何?该方法是否方便,是否具有危险性,在实施时是否需该方法是否方便,是否具有危险性,在实施时是否需要推迟治疗,如果需要推迟治疗是否会给病人带来危害等,要推迟治疗,如果需要推迟治疗是否会给病人带来危害等,试验的费用是否过高,仪器设备是否易于推广等。试验的费用是否过高,仪器设备是否易于推广等。本节重点v什么是诊断试验?如何列出诊断试验四格表?什么是诊断试验?如何列出诊断试验四格表?v名词解释:敏感度、特异度、阳性名词解释:敏感度、特异度、阳性/阴性似然阴性似然比、阳性比、阳性/阴性预测值、串联试验、并联试验、阴性预测值、串联试验、并联试验、ROC曲线?曲线?v诊断试验证据的评价原则?诊断试验证据的评价原则?