1、第七章第七章 诊断试验评价诊断试验评价1内容内容u 概述概述u诊断试验的评价诊断试验的评价u提高提高诊断试验诊断试验效率的方法效率的方法u诊断试验评价的设计诊断试验评价的设计2第一节第一节 概述概述3 临床诊断疾病的方法与指标不断更新,临床诊断疾病的方法与指标不断更新,并被医生大量应用于各种各样的患者。并被医生大量应用于各种各样的患者。患者交费、等待、楼上楼下地跑来跑去,患者交费、等待、楼上楼下地跑来跑去,伴随着疾病带来的痛苦,作为医生是否伴随着疾病带来的痛苦,作为医生是否清楚哪些检查才是对诊断疾病有用的?清楚哪些检查才是对诊断疾病有用的?4第一节第一节 概述概述诊断试验诊断试验(diagno
2、stic testdiagnostic test)的)的概概念念 是指应用各种实验、医疗仪器等手段是指应用各种实验、医疗仪器等手段对病人进行检查,以确定或排除疾病的对病人进行检查,以确定或排除疾病的试验方法。试验方法。5诊断试验的范畴诊断试验的范畴v各种实验室检查各种实验室检查v病史和体检获得的临床资料病史和体检获得的临床资料vX X线、线、B B超、核素等影像学检查超、核素等影像学检查v各种临床公认的诊断标准各种临床公认的诊断标准6诊断试验评价的意义诊断试验评价的意义v1 1、对诊断试验的应用价值进行科学评价。、对诊断试验的应用价值进行科学评价。v2 2、为临床医生合理选用诊断试验并正确解释
3、其结果提供科、为临床医生合理选用诊断试验并正确解释其结果提供科学依据。学依据。v临床和科研工作中怎样选择诊断试验临床和科研工作中怎样选择诊断试验?诊断疾病:灵敏度和特异度高诊断疾病:灵敏度和特异度高诊断无症状患者:简便、经济、安全易接受诊断无症状患者:简便、经济、安全易接受疾病随访:重复性好疾病随访:重复性好,影响因素少影响因素少7诊断试验的目的诊断试验的目的:是把病人与可疑有病、但实际无是把病人与可疑有病、但实际无病的人区别开来,以便对确诊的病的人区别开来,以便对确诊的病人给予相应的治疗病人给予相应的治疗。8为什么要评价诊断试验为什么要评价诊断试验v新的诊断试验方法不断被提出新的诊断试验方法
4、不断被提出v现有诊断方法缺陷需要新的方法现有诊断方法缺陷需要新的方法v对诊断结果的解释(指导临床实践)对诊断结果的解释(指导临床实践)阳性结果阳性结果 阴性结果阴性结果 是否受患病率的影响是否受患病率的影响9上海医科大学临床流行病学中心上海医科大学临床流行病学中心调查结果调查结果v抽查了有关诊断试验评价的论著抽查了有关诊断试验评价的论著112112篇篇 19851985、19951995年在年在5 5种中华医学会系列杂志发表种中华医学会系列杂志发表v结果:结果:90%90%以上的论著设计不合理以上的论著设计不合理 缺乏金标准:缺乏金标准:1818篇进行评价篇进行评价 仅有阳性率:仅有阳性率:4
5、040篇(无敏感度、特异度等评价篇(无敏感度、特异度等评价 指标)指标)用用LRLR(似然比)和(似然比)和AUCROCAUCROC(ROCROC曲线下面积):曲线下面积):0 0http:/ 诊断试验的评价诊断试验的评价12诊断实验的评价主要包括:诊断实验的评价主要包括:v 真实性(真实性(validityvalidity)v 可靠性可靠性 (reliability)(reliability)v 实用性实用性13特特定定人人群群金标准金标准病病人人非非病病人人待评价诊断方法待评价诊断方法阳性阳性阴性阴性阴性阴性阳性阳性图图2 2 筛检筛检/诊断试验的评价程序诊断试验的评价程序滨州医学院流行病
6、学教研室滨州医学院流行病学教研室14金标准金标准 诊断试验诊断试验 有病有病无病无病合计合计 阳性阳性真阳性真阳性a假阳性假阳性ba+b阴性阴性假阴性假阴性c真阴性真阴性dc+d合计合计a+cb+dN表表1 1 诊断试验评价整理表诊断试验评价整理表 整理评价结果整理评价结果151 1、真实性(、真实性(validityvalidity)诊断试验所获得的测量值与实际值诊断试验所获得的测量值与实际值相符合的程度相符合的程度,亦称亦称效度效度,又称准,又称准确性。确性。161 1、灵敏度与假阴性率、灵敏度与假阴性率v 灵敏度灵敏度 (sensitivity)(sensitivity)(真阳性率真阳性
7、率)即实际有病而按该诊断试验被正确即实际有病而按该诊断试验被正确地判为有病的百分比。反映诊断试验地判为有病的百分比。反映诊断试验发现病人的能力。发现病人的能力。%CAA100灵敏度17u 假阴性率假阴性率 (false negative rate)(false negative rate)(漏诊漏诊率率)即实际有病而被该诊断试验错误地判即实际有病而被该诊断试验错误地判段为无病的百分比。段为无病的百分比。反映的是诊断试验漏诊病人的情况。反映的是诊断试验漏诊病人的情况。%CAC100假阴性率182 2、特异度与假阳性率、特异度与假阳性率 u 特异度特异度 (specificity(specific
8、ity、Sp)(Sp)(真阴性真阴性率率)实际无病按该诊断试验被正确地判为实际无病按该诊断试验被正确地判为无病的百分比。反映诊断试验确定非病无病的百分比。反映诊断试验确定非病人的能力。人的能力。%100DBD特异度19u 假阳性率假阳性率 (false positive rate(false positive rate、FP)FP)(误诊率误诊率)即实际无病,但根据该诊断试验被定即实际无病,但根据该诊断试验被定为有病的百分比。反映的是诊断试验误为有病的百分比。反映的是诊断试验误诊病人的情况。诊病人的情况。%DBB100假阳性率203 3、约登指数(、约登指数(Youdens indexYoud
9、ens index,YIYI)又叫正确指数又叫正确指数 ,反映诊断试验发现病,反映诊断试验发现病人与非病人的总能力。人与非病人的总能力。YI=YI=Se+Sp-1Se+Sp-1(灵敏度特异度)(灵敏度特异度)1 1 1 1(假阳性率假阴性率)(假阳性率假阴性率)r r值范围在值范围在0101之间之间v r r越大,准确性越高,与实际越符合越大,准确性越高,与实际越符合真阳性率真阴性率214 4 符合率(符合率(agreement rateagreement rate)v概念:概念:是指诊断试验中真阳性和真阴性之和占是指诊断试验中真阳性和真阴性之和占受检人数的比例,也是诊断试验结果与受检人数的比
10、例,也是诊断试验结果与金标准结果的符合程度。反映正确诊断金标准结果的符合程度。反映正确诊断患者与排除非患者的能力。患者与排除非患者的能力。v计算:计算:符合率符合率=(a+da+d)/N/N诊断诊断试验试验病病人人对对照照+ab-cd225 5、预测值、预测值反映诊断试验结果与实际结果符合的概率反映诊断试验结果与实际结果符合的概率v阳性预测值阳性预测值 (positive predictive value,+PVpositive predictive value,+PV)v阴性预测值阴性预测值 (negative predictive value,-PVnegative predictive
11、value,-PV)23u 阳性预测值阳性预测值(+PV+PV):是指诊断是指诊断试验阳性结果中真正有病的概率。试验阳性结果中真正有病的概率。%100BAAPV24u 阴性预测值阴性预测值(-PV-PV):是指诊断是指诊断试验阴性结果中真正无病的概率。试验阴性结果中真正无病的概率。%100DCDPV25例例 阳性预测值的计算阳性预测值的计算vAFPAFP诊断肝癌,灵敏度诊断肝癌,灵敏度8080,特异度,特异度9090v患病率患病率10/1010/10万人万人肝癌肝癌非肝癌非肝癌AFP+AFP+8 8 9999 9999 10007 10007+PV=0.08%+PV=0.08%AFP-AFP-
12、2 28999189991 89993 89993TotalTotal 10109999099990100000100000Pre=10/10Pre=10/10万万266.6.似然比似然比 (likelihood ratio,LR)(likelihood ratio,LR)诊断试验阳性或阴性的结果分别在诊断试验阳性或阴性的结果分别在患者中出现的概率与非患者中出现患者中出现的概率与非患者中出现的概率之比。的概率之比。是一个相对稳定的综合性评价指标,是一个相对稳定的综合性评价指标,不受患病率影响。不受患病率影响。27u 阳性似然比阳性似然比 诊断试验结果的真阳性率与假阳性诊断试验结果的真阳性率与假
13、阳性率之比。比值越大诊断价值越高。率之比。比值越大诊断价值越高。特异度灵敏度假阳性率真阳性率1LR28u 阴性似然比阴性似然比 诊断试验结果的假阴性率与真阴性率诊断试验结果的假阴性率与真阴性率之比。比值越小诊断价值越高。之比。比值越小诊断价值越高。特异度灵敏度真阴性率假阴性率1LR29例题例题 计算计算 酶联吸附法酶联吸附法(ELISAELISA)检查科萨奇病毒检查科萨奇病毒B B感感染与微量中和法染与微量中和法(金标准)(金标准)结果比较:结果比较:Elisa法法微量中和法微量中和法合计合计CoxB阳性阳性CoxB阴性阴性CoxB阳性阳性(a)85(b)40125CoxB阴阴(c)15(d)
14、160175合计合计10020030030评价Elisa法诊断萨奇病毒B感染的真实性的几个指标v灵敏度和假阴性率(85%、15%)v特异度和假阳性率(80%、20%)v约登指数(65%)v符合率(81.67%)v预测值(阳性和阴性)(阳性68%、阴性91.43%)v似然比(阳性和阴性)(阳性4.25、阴性0.19)31(二)有关真实性评价指标的关系及(二)有关真实性评价指标的关系及其应用其应用v1、灵敏度和特异度的关系:两个指标是评价一项诊断试验真实性的基本指标。理想化的诊断试验二者应均为100%,现实不大 可能。32(二)各种真实性评价标的关系(二)各种真实性评价标的关系受检眼数无青光眼无青
15、光眼青光眼青光眼对大多数诊断试验而言,患者与非患者检查结果的分布总有不同程度的重叠。当试验方法和阳性标准固定时,灵敏度和特异度是恒定的。两个指标会随着诊断试验标准的改变而改变。33选择诊断标准的原则如下:选择诊断标准的原则如下:1)1)选择高灵敏度诊断试验选择高灵敏度诊断试验,目的是尽,目的是尽可能发现可疑病人,可能发现可疑病人,避免漏诊避免漏诊。某种疾病的早期发现、早期诊断将使病人获某种疾病的早期发现、早期诊断将使病人获得有效治疗和康复,漏诊将会造成严重后果。得有效治疗和康复,漏诊将会造成严重后果。34)选择高特异度诊断试验,避免误诊。)选择高特异度诊断试验,避免误诊。误诊将会对病人造成严重
16、的心理、生理和经济误诊将会对病人造成严重的心理、生理和经济上的影响。上的影响。对某种疾病的诊断持怀疑态度,需确定诊断。对某种疾病的诊断持怀疑态度,需确定诊断。)选择灵敏度和特异度均较高的诊断试验)选择灵敏度和特异度均较高的诊断试验如果某种疾病漏诊和误诊同等重要,应将诊断如果某种疾病漏诊和误诊同等重要,应将诊断试验阳性界值定在灵敏度和特异度均较高的位置试验阳性界值定在灵敏度和特异度均较高的位置或或在在正确诊断指数正确诊断指数最大处。最大处。352 2、预测值与灵敏度、特异度、患、预测值与灵敏度、特异度、患病率的关系病率的关系 影响预测值的因素:影响预测值的因素:(1 1)疾病的患病率:灵敏度和特
17、异度不变时,)疾病的患病率:灵敏度和特异度不变时,阳性预测值随患病率上升而上升,阴性预测值随阳性预测值随患病率上升而上升,阴性预测值随患病率的上升而下降,患病率对阳性预测值的影患病率的上升而下降,患病率对阳性预测值的影响更明显。响更明显。(2 2)灵敏度:患病率不变时,灵敏度越高的试)灵敏度:患病率不变时,灵敏度越高的试验,阴性预测值越高。验,阴性预测值越高。(3 3)特异度:患病率不变时,特异性越高的试)特异度:患病率不变时,特异性越高的试验,阳性预测值越高。验,阳性预测值越高。36预测值、患病率、特异预测值、患病率、特异度、灵敏度之间的关系度、灵敏度之间的关系%100)1()1(peeSp
18、SPSPPVP P:患病率:患病率 S Se e:灵敏度灵敏度S Sp p:特异度特异度%100)1()1()1(eppSpSPSPPV37预测值与患病率 感染率感染率受检人受检人数数实际感实际感染染未感染未感染真阳真阳性性假阳假阳性性+PV1/万万10000010999909.910000.009910/万万10000010099900999990.09021%1000001000990009909900.500010%1000001000009000099909000.9167备注:阳性预测值随患病率上升而上升。38患病率患病率(%)(%)灵敏灵敏度度(%)(%)特异特异度度(%)(%)筛
19、检筛检结果结果诊断诊断 合计合计 阳性预阳性预测值测值(%)(%)阴性预阴性预测值测值(%)(%)糖尿病糖尿病非糖尿病非糖尿病1.522.999.834205463.0 11698309946 98.8 合计合计150985010000 1.544.399.0669816440.2 8497529836 99.1 合计合计150985010000 摘自摘自(流行病学进展流行病学进展第第4 4卷,施侣元,卷,施侣元,1986)1986)表表2 2患病率相同,灵敏度、特异度不同时糖尿病筛检结果患病率相同,灵敏度、特异度不同时糖尿病筛检结果备注:患病率不变时,灵敏度越高的试验,阴性预测值越高。患病率
20、备注:患病率不变时,灵敏度越高的试验,阴性预测值越高。患病率不变时,特异性越高的试验,阳性预测值越高。不变时,特异性越高的试验,阳性预测值越高。滨州医学院流行病学教研室滨州医学院流行病学教研室39灵敏度、特异度均为灵敏度、特异度均为 95%,不同现患率的阳性与阴性预测值:,不同现患率的阳性与阴性预测值:现患率现患率(%)阳性预测值阳性预测值(%)阴性预测值阴性预测值(%)1 16.1 99.9 2 27.9 99.9 5 50.0 99.7 10 67.9 99.4 20 82.6 98.7 59 95.0 95.0 75 98.3 83.7 100 100.0 备注:灵敏度和特异度不变时,阳
21、性预测值随患病率上升而上升,备注:灵敏度和特异度不变时,阳性预测值随患病率上升而上升,阴性预测值随患病率的上升而下降,患病率对阳性预测值的影响阴性预测值随患病率的上升而下降,患病率对阳性预测值的影响更明显更明显。40么么么么方面vSds绝对是假的1008060402020 40 60 80 10042u 与预测值有关的因素与预测值有关的因素:患病率患病率:患病率越高,阳性预测值越高患病率越高,阳性预测值越高v患病率不变时患病率不变时,灵敏度越高,阴性预测值,灵敏度越高,阴性预测值越高;特异度越高,阳性预测值越高。越高;特异度越高,阳性预测值越高。v灵敏度与特异度不变灵敏度与特异度不变,患病率与
22、阳性预测值成正比患病率与阳性预测值成正比,与阴性预测值与阴性预测值成反比。成反比。43(三)(三)ROCROC曲线法曲线法Receiver Operator Characteristic Curve,Receiver Operator Characteristic Curve,ROCROC曲线曲线v受试者工作特征曲线受试者工作特征曲线vROCROC曲线是用真阳性率曲线是用真阳性率(灵敏度灵敏度)和假阳性和假阳性率率(1-(1-特异度特异度)作图所得曲线;作图所得曲线;表示灵敏度和特异度之间的关系。表示灵敏度和特异度之间的关系。44例例1 1、CKCK试验诊断心肌梗死试验诊断心肌梗死(灵敏度和特
23、异度灵敏度和特异度)心肌梗死组心肌梗死组 CKCK水平水平无心肌梗死组无心肌梗死组35354804800 0 8 84404400 0 7 74004000 015153603600 019193203200 013139 97 7(42%)(42%)2802801 11 11818133133240240129(99%)129(99%)1 119192002001 121211601600 030301201205 53030215(93%)215(93%)808016168 8131315154040114(88%)114(88%)2626 2 2 0 088882302301301304
24、5CKCK诊断心梗的诊断心梗的ROCROC曲线曲线 假阳性率假阳性率 真阳性率(灵敏度)真阳性率(灵敏度)截断点:截断点:灵敏度和灵敏度和特异度相特异度相对较高对较高特异度特异度46CKCK和和EKGEKG诊断心梗诊断心梗ROCROC曲线曲线比较比较 假阳性率假阳性率真阳性率(灵敏度)曲线顶点与纵坐标曲线顶点与纵坐标更接近者,属于更更接近者,属于更好的诊断试验好的诊断试验47ROCROC曲线的用途曲线的用途v用于最佳的诊断试验分界值的选择用于最佳的诊断试验分界值的选择;v比较两种或两种以上诊断试验的价值比较两种或两种以上诊断试验的价值.48ROCROC曲线的优点与局限性曲线的优点与局限性v优点
25、优点简单、直观;综合反映灵敏度与特异度;与人群患病率无关v局限性局限性不反映样本量;不反映样本量;不直接显示判断值。不直接显示判断值。49 休息一下50 二、诊断试验可靠性二、诊断试验可靠性(reliability)(reliability)的评价的评价 指诊断试验在相同条件下进行重复操作指诊断试验在相同条件下进行重复操作获得相同结果的稳定程度。又称信度、获得相同结果的稳定程度。又称信度、精确度或可重复性。精确度或可重复性。可靠性的评价主要是检验测量变异的可靠性的评价主要是检验测量变异的大小。大小。51(一)影响可靠性的因素:(一)影响可靠性的因素:v1.1.受试对象生物学变异受试对象生物学变
26、异 个体内变异(同一指标在同一受试者身上重复测量,时间、个体内变异(同一指标在同一受试者身上重复测量,时间、地点、生理、情绪影响,结果不同)和个体间变异地点、生理、情绪影响,结果不同)和个体间变异v2.2.观察变异观察变异:指观察者对测量结果判断的不一致而导致:指观察者对测量结果判断的不一致而导致的差异,不同的观察者技术熟练不同,同一观察者不同的差异,不同的观察者技术熟练不同,同一观察者不同时间不同地点结果不同。时间不同地点结果不同。v3.3.试验方法的差异试验方法的差异:方法不稳定,仪器、试剂、温度等:方法不稳定,仪器、试剂、温度等条件和环境变化,结果出现误差。条件和环境变化,结果出现误差。
27、52(二)评价可靠性的指标(二)评价可靠性的指标变异系数变异系数 (coefficient of variance,CV)coefficient of variance,CV)符合率符合率 (agreement rate,or accuracy)(agreement rate,or accuracy)诊断试验一致性分析(诊断试验一致性分析(kappakappa值值)53v当某试验做当某试验做定量测定定量测定时,可用变异系数来时,可用变异系数来表示可靠性。变异系数是所测指标的标准表示可靠性。变异系数是所测指标的标准差和均数之比。差和均数之比。v比值越小,可靠性越好。比值越小,可靠性越好。变异系数
28、(变异系数(CVCV)=测定值均数的标准差测定值均数的标准差/测定值均数测定值均数542 2 符合率符合率概念:又称准确度。概念:又称准确度。定性测定定性测定中,同一批研究对象中,同一批研究对象两次实验结果均为阳性与均为阴性的人数占所有进两次实验结果均为阳性与均为阴性的人数占所有进行实验人数的比率。行实验人数的比率。可用于两个医师诊断同一组病人,或者同一医师两可用于两个医师诊断同一组病人,或者同一医师两次诊断同一组病人的结果。次诊断同一组病人的结果。%100)dbddcdcaabaa(41553.3.诊断试验一致性分析诊断试验一致性分析 KappaKappa值计算值计算v衡量临床医生的诊断水平
29、如何,他们之间对同一人群的诊断结果是否存在差异,可采用Kappa值分析。vKappa值表示不同操作者对同一试验结果,或同一操作者不同时间判断同一批结果的一致性强度的指标。vKappa值考虑了机遇因素对一致性的影响并加以校正,从而提高了判断的有效性。563.3.诊断试验一致性分析诊断试验一致性分析 KappaKappa值计算值计算 甲、乙医生阅读同样甲、乙医生阅读同样100100张胸部张胸部X X线片的诊断一致性线片的诊断一致性 甲医生甲医生肺门淋巴结核肺门淋巴结核正常正常乙乙医医生生肺门淋巴结核肺门淋巴结核 46 a 10 b 56(r1)正常正常 12 c32 d 44(r2)58(c1)4
30、2(c2)100 N 观察一致率观察一致率(p(po o)=)=(a+da+d)/N /N p po o=46+32/100=78%=46+32/100=78%机遇一致率机遇一致率(p(pc c)=(r)=(r1 1 c c1 1)/N+()/N+(r r2 2 c c2 2)/N/N)/N/N p pc c=(56=(56 58)/100+(4458)/100+(44 42)/100)/100 42)/100)/100=51%=51%非机遇一致率非机遇一致率=1-p=1-pc c 非机遇一致率非机遇一致率=100%-=100%-51%=49%51%=49%实际一致率实际一致率=p=po o-
31、p-pc c 实际一致率实际一致率=78%-51%=27%78%-51%=27%KappaKappa值值=(p po o-p-pc c/(1-p 1-p c c)KappaKappa值值 =27%/49%=0.55=27%/49%=0.5557KappaKappa值计算值计算 甲医生两次阅读同样甲医生两次阅读同样100100张胸部张胸部X X线片的一致率线片的一致率观察一致率观察一致率(p(po o)=)=(a+da+d)/N /N p po o=69+19/100=88%=69+19/100=88%机遇一致率机遇一致率(p(pc c)=(r)=(r1 1 c c1 1)/N+()/N+(r
32、r2 2 c c2 2)/N)/N)/N)/N p pc c=(80=(80 70)/100+(2070)/100+(20 30)/100)/100=62%30)/100)/100=62%非机遇一致率非机遇一致率=1-p=1-pc c 非机遇一致率非机遇一致率=100%-62=100%-62%=38%=38%实际一致率实际一致率=p=po o-p-pc c 实际一致率实际一致率=88=88%-62%=26%-62%=26%KappaKappa值值=(po-pcpo-pc)/(1-pc 1-pc)KappaKappa值值 =26%/38%=0.68=26%/38%=0.68 第第1次次肺门淋巴结
33、核肺门淋巴结核 正常正常第第2次次肺门淋巴结核肺门淋巴结核 69 a11 b 80(r1)正常正常 1 c19 d 20(r2)70(c1)30(c2)100(N)58KappaKappa值判断标准值判断标准 KappaKappa值值 一致性强度一致性强度 1 1 完全一致完全一致 -1 -1 完全不一致完全不一致 0 0 完全由机遇所致完全由机遇所致 0.40.75 0.40.75 中度、高度一致中度、高度一致 0.75 0.75 极好的一致性极好的一致性 0.40 0.40 一致性差一致性差59三、诊断试验的实用性评价三、诊断试验的实用性评价1.1.简单实用?简单实用?2.2.迅速用于临床
34、?迅速用于临床?3.3.步骤、方法、仪器设备、试剂。注意步骤、方法、仪器设备、试剂。注意事项?事项?4.4.病人和患者接受?病人和患者接受?-伦理、创伤性伦理、创伤性5.5.成本成本:社会效益、经济效益、成本效益社会效益、经济效益、成本效益60第三节第三节 提高诊断试验效率的方法提高诊断试验效率的方法61前列腺酸性磷酸酶对前列腺癌的试验阳性预测值前列腺酸性磷酸酶对前列腺癌的试验阳性预测值(灵敏度(灵敏度 70%,特异度,特异度 90%)检测对象检测对象 现患率现患率(1/10 万万)阳阳性预测值性预测值(%)男性一般人群男性一般人群 3.5 0.4 75 岁以上男性岁以上男性 500 5.6
35、有可疑前列腺结节者有可疑前列腺结节者 50000 93.0 一、选择患病率高的人群一、选择患病率高的人群灵敏度与特异度不变,灵敏度与特异度不变,患病率与阳性预测值成正比患病率与阳性预测值成正比62二、联合试验二、联合试验 1)1)串联串联 :系列试验:系列试验 :A A和和B B 只有全部试验皆为阳性,才认为是阳性(有病)只有全部试验皆为阳性,才认为是阳性(有病)增加了特异度;但降低了灵敏度和增大了漏诊。增加了特异度;但降低了灵敏度和增大了漏诊。63串联试验适用于:1 1、虽然有几项试验方法,但是单项试验特异度不高、虽然有几项试验方法,但是单项试验特异度不高2 2、慢性病,不一定需要迅速作出诊
36、断,但需要增加正确性、慢性病,不一定需要迅速作出诊断,但需要增加正确性3 3、诊断某冰的某项试验危险昂贵,可先选择简单安全的试验、诊断某冰的某项试验危险昂贵,可先选择简单安全的试验串联。串联。串联试验的灵敏度串联试验的灵敏度=A=A试验的灵敏度试验的灵敏度 B B试验的灵敏度试验的灵敏度串联试验的特异度串联试验的特异度=A=A试验的特异度试验的特异度+B+B试验的特异度试验的特异度(1-A1-A试验的特异度)试验的特异度)原则:先用特异度高的试验再用灵敏度高的试验,减少成本,原则:先用特异度高的试验再用灵敏度高的试验,减少成本,提高效率。提高效率。642)2)并联并联:平行试验:平行试验 :A
37、 A或或B B 只要有一个试验为阳性,就判定为阳性(有病)只要有一个试验为阳性,就判定为阳性(有病)提高了灵敏度,但特异度下降和增大了误诊。提高了灵敏度,但特异度下降和增大了误诊。65并联试验适用于并联试验适用于:1 1、疾病对人群影响很大,目前尚未找到一种、疾病对人群影响很大,目前尚未找到一种高灵敏的试验有效确诊,但已有几项现存的高灵敏的试验有效确诊,但已有几项现存的不太灵敏的试验不太灵敏的试验2 2、对于住院或急症病人、复诊困难的病人、对于住院或急症病人、复诊困难的病人、医疗条件不足的病人,急需做诊断。医疗条件不足的病人,急需做诊断。并联试验的灵敏度并联试验的灵敏度=A=A试验的灵敏度试验
38、的灵敏度+B+B试验的试验的灵敏度灵敏度(1-A1-A试验的灵敏度)试验的灵敏度)并联试验的特异度并联试验的特异度=A=A试验的特异度试验的特异度 B B试验的试验的特异度特异度66平行试验与系列试验对灵敏度、特异度及预测值的影响平行试验与系列试验对灵敏度、特异度及预测值的影响(现患率(现患率 20%)灵敏度灵敏度(%)特异度特异度(%)阳性预测值阳性预测值(%)阴性预测值阴性预测值(%)A 试验试验 80 60 33 92 B 试验试验 90 90 69 97 A 或或 B(平行平行)98 54 35 99 A 和和 B(系列系列)72 96 82 93 6768第四节第四节 诊断试验评价的
39、设计诊断试验评价的设计69基本方法v确定金标准v研究对象和选择和分组v同步盲法测试研究对象并比较v考虑样本含量和代表性70一、确定金标准一、确定金标准 金标准(金标准(Gold standardGold standard):是指当):是指当前医学界公认的诊断或排除某病最可前医学界公认的诊断或排除某病最可靠的诊断方法。靠的诊断方法。这种公认的、可靠的、准确的这种公认的、可靠的、准确的诊断方法,在诊断试验中称之为。诊断方法,在诊断试验中称之为。The best available The best available test that is used as comparison is calle
40、d the GOLD test that is used as comparison is called the GOLD STANDARDSTANDARD 如病理检查如病理检查(活检、尸检活检、尸检)、手术探查、病原体的分离及抗体检测、手术探查、病原体的分离及抗体检测、特殊影象学检查等。有些疾病尚无特异性诊断标准,则以专家制特殊影象学检查等。有些疾病尚无特异性诊断标准,则以专家制订、得到公认的临床诊断标准为依据订、得到公认的临床诊断标准为依据。将研究人群准确地分为有病和无病两组将研究人群准确地分为有病和无病两组71v 冠心病冠心病:冠状动脉造影冠状动脉造影v 肿瘤肿瘤:病理学检查病理学检查v
41、 肾结石肾结石:手术发现手术发现例:例:金标准具有创伤性,因此探求一些新的金标准具有创伤性,因此探求一些新的诊断方法(诊断试验),并比较其与金标准诊断方法(诊断试验),并比较其与金标准的差别、得失及推广价值有现实意义。的差别、得失及推广价值有现实意义。72二、研究对象的选择二、研究对象的选择诊断试验的研究对象应是临床上所见到诊断试验的研究对象应是临床上所见到的病人,包括两类人群:一类是用金标的病人,包括两类人群:一类是用金标准确诊的准确诊的“有病有病”的病人,一类是用金的病人,一类是用金标准证实为标准证实为“无病无病”的对照人群的对照人群病例组应包括各种临床类型的病例;病例组应包括各种临床类型
42、的病例;73临床各型临床各型 (轻、中、重轻、中、重 )临床各期临床各期 (早、中、晚早、中、晚 )有无并发症有无并发症对照:对照:在临床表现上与目标病例容易混淆的病例,这在临床表现上与目标病例容易混淆的病例,这样的对照具有鉴别诊断的价值;样的对照具有鉴别诊断的价值;正常人一般不纳入对照组正常人一般不纳入对照组选择对照组在年龄、性别及某些重要的生理状选择对照组在年龄、性别及某些重要的生理状态方面与病例组具有可比性态方面与病例组具有可比性 74必须遵循随机化的原则。而必须遵循随机化的原则。而且病例组和对照组应该同时且病例组和对照组应该同时进入研究,同时接受进入研究,同时接受“金标金标准准”的检测
43、。的检测。75三、样本含量的估计三、样本含量的估计预先设置待评价筛检试验的灵敏度待评价筛检试验的灵敏度待评价筛检试验的特异度待评价筛检试验的特异度 容许误差容许误差 76当灵敏度和特异度均接近当灵敏度和特异度均接近50%50%时,可时,可用近似公式如下计算样本量。用近似公式如下计算样本量。当灵敏度或特异度小于当灵敏度或特异度小于20%20%或大于或大于80%80%时,资料呈偏态分布,可用公式时,资料呈偏态分布,可用公式如下计算样本量。如下计算样本量。22)1(ppun21)1(/(sin/3.57ppun77 四、确定诊断试验的分界值(截断四、确定诊断试验的分界值(截断点、阈值、临界点):点、
44、阈值、临界点):v均数加减标准差法(正态分布)均数加减标准差法(正态分布)v百分位数法(偏态或类型不确定)百分位数法(偏态或类型不确定)v临床判断法临床判断法vROCROC曲线法曲线法78五、与金标准五、与金标准同步同步进行进行盲法盲法比较比较v用金标准将研究对象分为病人和非病人两组,用待评价的诊断方法对研究对象同步盲法测量,并将两次测量结果进行比较,并用评价指标评价诊断试验的诊断价值。v同步:同时间、同地区、同人群v盲法:测量者不了解其他情况。79思思 考考 题题1 1、一项诊断试验可以从哪几个方面进行、一项诊断试验可以从哪几个方面进行评价?评价?2 2、如何提高诊断试验的效率?、如何提高诊断试验的效率?80!81