1、第十章诊断性试验循证分析与评价(优选)第十章诊断性试验循证分析与评价How to Use an Article About a Diagnostic TestRoman Jaeschke,Gordon H.Guyatt,David L.Sackett,and the Evidence Based Medicine Working Group Based on the Users Guides to Evidencebased Medicine and reproduced with permission from JAMA.(1994;271(5):389391)and(1994;271(9)
2、:703707).Copyright 1995,American Medical Association.循证医学循证医学 Evidencebased Medicine 王家王家良,人民卫生出版社良,人民卫生出版社2005年年8月月本节课内容的出处3医学是一门不确定性的医学是一门不确定性的科学和可能性的艺术科学和可能性的艺术 William OslerMedicine is a science of uncertainty and an art of probability.第一节第一节 诊断性试验在临床医学中的重要性诊断性试验在临床医学中的重要性45循证诊断循证诊断6诊断性试验发展方向 快速
3、诊断试验(快速诊断试验(RDTs)因此,今后对诊断性试验的开发,因此,今后对诊断性试验的开发,要按照临床流行病学的方法学创最佳证要按照临床流行病学的方法学创最佳证据的要求,重视研究的质量,需要事前据的要求,重视研究的质量,需要事前做好设计方案、确定金标准和观察指标做好设计方案、确定金标准和观察指标,而且对病例选择、样本含量、盲法试,而且对病例选择、样本含量、盲法试验、重复性试验等内容。验、重复性试验等内容。7阴性 5 126 13循证医学教研室李白艳、鲍遇海研究的结果可靠吗?ROC曲线在同一种疾病的两种或两种以上的诊断性试验的诊断中进行优选区分诊断试验正常和异常的临界点会影响灵敏度和特异度。敏
4、感度越高,漏诊率(1SEN)越少,易误诊,有助于排除相应的疾病。Total 10000 90000 100000 Pre=10000/10万AFP+8 9999 10007+PV=0.(prevalence,PREV=a+c/a+b+c+d)Total100099000100000 Pre=1000/10万例10l 某医院采用餐后2h血糖测定,对诊断糖尿病者及非糖尿病患者进行连续检查,结果如表102,试问诊断糖尿病的临界值应确定在哪一个数值最正确?在该研究中,造影有三种结果低度可能 39 39/251=0.Total23020702300Pre=10%1、研究结果的可重复性及结果解释能否满足我
5、的工作环境?如果病例分析中的老年女性病人验前概率是70%;3、研究结果是否会改变我的治疗决策?8价值,甚至作为筛选手段。但后来的研究发现,如价值,甚至作为筛选手段。但后来的研究发现,如果将病人人群扩展到早期结直肠癌病人和其他癌症果将病人人群扩展到早期结直肠癌病人和其他癌症病人以及其他消化道疾病,癌胚抗原的诊断准确度病人以及其他消化道疾病,癌胚抗原的诊断准确度就明显下降。因此,癌胚抗原已不再作为诊断和筛就明显下降。因此,癌胚抗原已不再作为诊断和筛选指标,只作为结直肠癌病人的随访指标。选指标,只作为结直肠癌病人的随访指标。9CK+215(93.验后概率1/(1+1)0.低度可能 39 39/251
6、=0.循证医学教研室李白艳、鲍遇海验后概率=验后比数/(1+验后比数)一、敏感度(sensitivity,SEN=a/a+c)阳性似然比是真阳性率与假阳性率之比。它只能帮助我们校正验前概率而得出验后概率,能明确的告诉我们此试验诊断的意义。155 273 273/630=0.循证医学教研室李白艳、鲍遇海ROC曲线是用真阳性率(灵敏度)和假阳性率(1特异度)作图所得曲线;为了校正“验证偏倚”,PIOPED研究设立了第二个“金标准”。二、似然比(likelihood ratio)的临床应用指当前临床医师公认的诊断疾病最可靠的方法,也称标准诊断。试验+a(a/a+c)b(b/b+d)+LR=Sen/(
7、1Spe)William Osler)时,该阈值的敏感度和特异度之和为最大这时漏诊率和误诊率之和最小。+LR=a/a+c /b/b+d特异度越高,误诊率(1SPE)越低,易漏诊。如果将临界值定为130mgL(722mmolI。当餐后血糖临界值定为110rugI。试验方法是否描述得足够详细,以便让别人重复其试验?合计 251 630 881155 273 273/630=0.Totala+cb+da+b+c+d)时,该阈值的敏感度和特异度之和为最大这时漏诊率和误诊率之和最小。第一节 诊断性试验在临床医学中的重要性一个78岁的老年妇女,胃大部切除术后10天,近24小时出现气短且逐渐加重;敏感度越高
8、,漏诊率(1SEN)越少,易误诊,有助于排除相应的疾病。CK151822(88%)1837PV=99%(prevalence,PREV=a+c/a+b+c+d)AFP 2089910 899302、研究结果能否用于我的病人?1990;263:27532759患病率10/10万人如果病例分析中的老年女性病人验前概率是70%;阴性 149 616 765Totala+cb+da+b+c+d10 金标准金标准 有病有病 无病无病 合计合计 阳性阳性 真阳性(真阳性(A A)假阳性假阳性 (B B)A AB B 阴性阴性 假阴性(假阴性(C C)真阴性真阴性 (D D)C CD D 合计合计 A AC
9、 BC BD AD AB BC CD D四格表的排列四格表的排列诊断诊断试验试验11 诊断性试验检测为阳性的病例在用金标准确定为诊断性试验检测为阳性的病例在用金标准确定为“有病有病”的病例中所占的比例。的病例中所占的比例。,易误诊,易误诊,有助于排除相应的疾病。,有助于排除相应的疾病。12验后概率=验后比数/(1+验后比数)=42.合计 251 630 8811990;263:27532759判断新诊断性试验的临床价值,应当将其结果与金标准诊断的结果进行同步对比,评估时要求每个病例,必须都有两项(即金标准与新试验)检查的结果,并按要求列出四格表。肺血管造影和V/Q扫描结果的关系似然比是真阳性率
10、与假阳性率之比。2.第一节 诊断性试验在临床医学中的重要性因此,他们断定癌胚抗原在诊断结直肠癌方面很有价值,甚至作为筛选手段。Total23020702300Pre=10%(包括136个“正常或接近正常”和“低度可能”但未行肺血管造影的病人及14个造影结果“不确定”的病人)二、似然比(likelihood ratio)的临床应用第五节诊断性试验研究结果的评价制图方法是以该试验的敏感度(真阳性率)为纵坐标(Y轴),而以l一特异度(假阳性率)为横坐标(X轴),依照连续分组测定的数据,分别计算SEN及SPE,按照平面几何的方法,将绘出各点联成曲线。Totala+cb+da+b+c+dTotala+c
11、b+da+b+c+d判断新诊断性试验的临床价值,应当将其结果与金标准诊断的结果进行同步对比,评估时要求每个病例,必须都有两项(即金标准与新试验)检查的结果,并按要求列出四格表。故诊断糖尿病餐后2h血糖测量值,定为110mgdl(61lmmolL)最为恰当。Copyright 1995,American Medical Association.在该研究中,造影有三种结果但是,作ROC曲线不能只靠一、二次试验结果,就想找到正确的临界点,一般要求最少有5组连续分组测定数据用以制图,才能达到预期的要求。敏感度/(1特异度)如Thomson在36例晚期结直肠癌病人的诊断试验中,发现有35例病人癌胚抗原(
12、Carcinoembryonicantigen)升高,而在正常人和其他的病人则癌胚抗原水平很低。诊断性试验检测为阴性的受试者在用金标准确定为诊断性试验检测为阴性的受试者在用金标准确定为“无病无病”的受的受试者中所占的比例试者中所占的比例 易漏诊。易漏诊。有助于确定诊断。有助于确定诊断。13 1415 诊断性试验检测为阳性的全部病例中,用金标准诊断诊断性试验检测为阳性的全部病例中,用金标准诊断为为“有病有病”的病例所占的比例。的病例所占的比例。16 灵敏度越高的试验,阴性预测值越高;灵敏度越高的试验,阴性预测值越高;特异度越高的试验,阳性预测值越高;特异度越高的试验,阳性预测值越高;患病率的高低
13、对预测值的影响更大。患病率的高低对预测值的影响更大。17 经诊断性试验检测的全部病例中,真正经诊断性试验检测的全部病例中,真正“有病有病”患者所占的比例。患者所占的比例。在级别不同在级别不同的医院中,某种疾病的患者集中程度不的医院中,某种疾病的患者集中程度不同,故患病率差别大,从而影响阳性预同,故患病率差别大,从而影响阳性预测值的结果。测值的结果。18监护病房监护病房CKCK诊断心梗诊断心梗(CK80=CK)(CK80=CK)心梗心梗无心梗无心梗CK+CK+215(93%)215(93%)1616231231+PV=93%+PV=93%CKCK1515114(88%)114(88%)12912
14、9PV=88%PV=88%TotalTotal230230130130360360Pre=64%Pre=64%普通医院普通医院CKCK诊断心梗诊断心梗(CK80=CK)(CK4040岁岁人群人群肝癌肝癌非肝癌非肝癌AFP+AFP+800 800 9900 9900 10700 10700+PV=7.48%+PV=7.48%AFPAFP 200 200 89100 89100 89300 89300TotalTotal10001000 9900099000100000 Pre=1000/10100000 Pre=1000/10万万22 AFPAFP诊断诊断肝癌,肝癌,灵灵敏度敏度8080,特,特
15、异异度度9090 HBsAg(+)HBsAg(+)年年龄龄4040岁岁 肝硬化人群肝硬化人群 肝癌肝癌 非肝癌非肝癌 AFP+AFP+8000 9000 17000 8000 9000 17000 +PV=47.06%+PV=47.06%AFPAFP 2000 81000 83000 2000 81000 83000 TotalTotal 10000 90000 100000 10000 90000 100000 Pre=10000/10Pre=10000/10万万23AFPAFP诊断诊断肝癌,肝癌,灵灵敏度敏度8080,特,特异异度度9090患病率患病率10/1010/10万人万人肝癌肝癌非
16、肝癌非肝癌AFP+AFP+8 8 9999 9999 10007 10007+PV=0.08%+PV=0.08%AFPAFP 2 2 89991 89993 89991 89993TotalTotal 10 10 99990 100000 99990 100000Pre=10/10Pre=10/10万万 24 R O C 曲 线 又 称 受 试 者 工 作 特 征 曲 线曲 线 又 称 受 试 者 工 作 特 征 曲 线(ROC(Receiver Operating Characteristic)curve)在诊断性试验中应用的目的有二。在诊断性试验中应用的目的有二。其一用于正常值临界点的选择
17、其一用于正常值临界点的选择 其二用于优选性质类似的诊断性试验其二用于优选性质类似的诊断性试验 25 受试者工作特性曲线受试者工作特性曲线(Receiver Operator Characteristic Curve,ROC曲线曲线)ROC曲线是用真阳性率曲线是用真阳性率(灵敏度灵敏度)和和假阳性率假阳性率(1特异度特异度)作图所得曲线;作图所得曲线;26 制图方法是以该试验的敏感度制图方法是以该试验的敏感度(真阳性率真阳性率)为纵坐标为纵坐标(Y轴轴),而以,而以l一一特异度特异度(假阳性率假阳性率)为横坐标为横坐标(X轴轴),依照连续分组测定的数据,分别计依照连续分组测定的数据,分别计算算S
18、EN及及SPE,按照平面几何的方,按照平面几何的方法,将绘出各点联成曲线。即为法,将绘出各点联成曲线。即为ROC曲线。在曲线的各点中,距曲线。在曲线的各点中,距Y轴顶点直线距离最近的一点,即为轴顶点直线距离最近的一点,即为正常值的最佳临界值。正常值的最佳临界值。27 用该点数值区分正常与异常,其用该点数值区分正常与异常,其敏感度及特异度都比较高,而误诊敏感度及特异度都比较高,而误诊及漏诊例数之和最小。但是,作及漏诊例数之和最小。但是,作ROC曲线不能只靠一、二次试验结曲线不能只靠一、二次试验结果,就想找到正确的临界点,一般果,就想找到正确的临界点,一般要求最少有要求最少有5组连续分组测定数据组
19、连续分组测定数据用以制图,才能达到预期的要求。用以制图,才能达到预期的要求。表示灵敏度和特异度之间的关系。表示灵敏度和特异度之间的关系。28 例例10l 某医院采用餐后某医院采用餐后2h血糖测定,对诊血糖测定,对诊断糖尿病者及非糖尿病患者进行连续检查,断糖尿病者及非糖尿病患者进行连续检查,结果如表结果如表102,试问诊断糖尿病的临界值应,试问诊断糖尿病的临界值应确定在哪一个数值最正确确定在哪一个数值最正确?表中列出了表中列出了SEN及及lSPE,分别将各组,分别将各组的的SEN及及lSPE数据,分别在纵坐标和数据,分别在纵坐标和横坐标上绘出并连成曲线,即为横坐标上绘出并连成曲线,即为ROC曲曲
20、线。如图线。如图102在各点之中,距左上角直在各点之中,距左上角直线距离最近的一点线距离最近的一点(曲线左起第曲线左起第4点点),就,就是该试验的临界值。故诊断糖尿病餐后是该试验的临界值。故诊断糖尿病餐后2 h 血 糖 测 量 值,定 为血 糖 测 量 值,定 为 1 1 0 m g dl(61lmmolL)最为恰当。最为恰当。29Total10099900100000Pre=100/10万31%)231+LR=7.ROC曲线又称受试者工作特征曲线(ROC(Receiver Operating Characteristic)curve)在诊断性试验中应用的目的有二。二、研究的结果是什么?(pr
21、evalence,PREV=a+c/a+b+c+d)(555mmolL)为临界值,则糖尿病的漏诊率(1SEN)为11,而有30的非糖尿病受试者被误诊。第一节 诊断性试验在临床医学中的重要性用金标准将患者,正确区分“有病”或“无病”。评价诊断试验的各种指标Results of the Prospective Investigation of Pulmonary Embolism Diagnosis(PIOPED)ROC曲线是用真阳性率(灵敏度)和假阳性率(1特异度)作图所得曲线;验后比数=验前比数似然比ROC曲线是用真阳性率(灵敏度)和假阳性率(1特异度)作图所得曲线;Copyright 199
22、5,American Medical Association.例某患者女性45岁,胸痛就诊,患冠心病概率为多少?因此,敏感度和特异度中任何一个数值的提高,必然导致另一数值的降低。406 14 14/630=0.肝癌非肝癌 在表在表102中,随着血糖浓度的升高,敏感中,随着血糖浓度的升高,敏感度下降而特异度升高。因此,敏感度和特度下降而特异度升高。因此,敏感度和特异度中任何一个数值的提高,必然导致另异度中任何一个数值的提高,必然导致另一数值的降低。如选用餐后血糖一数值的降低。如选用餐后血糖100mgdl。(555mmolL)为临界值,则糖尿病为临界值,则糖尿病的漏诊率的漏诊率(1SEN)为为11
23、,而有,而有30的非的非糖尿病受试者被误诊。如果将临界值定为糖尿病受试者被误诊。如果将临界值定为130mgL(722mmolI。),则可使漏,则可使漏诊率诊率(1SEN)上升到上升到36,而误诊率,而误诊率(1SPE)仅为仅为3。当餐后血糖临界值定为。当餐后血糖临界值定为110rugI。(61lmmol1。)时,该阈值时,该阈值的敏感度和特异度之和为最大这时漏诊的敏感度和特异度之和为最大这时漏诊率和误诊率之和最小。因此,餐后血糖定率和误诊率之和最小。因此,餐后血糖定为为110mgI作为临界值最适当,恰与作为临界值最适当,恰与ROC曲线确定的临界值相同。曲线确定的临界值相同。30CPK CPK
24、和和 EKGEKG 诊断心梗诊断心梗ROCROC曲线曲线比较比较 假阳性率假阳性率真阳性率(灵敏度)真阳性率(灵敏度)31 ROC曲线在同一种疾病的两种曲线在同一种疾病的两种或两种以上的诊断性试验的诊或两种以上的诊断性试验的诊断中进行优选断中进行优选 可将两种诊断性试验的可将两种诊断性试验的ROC,曲线作图,如图曲线作图,如图101所示,凡所示,凡曲线顶点与纵坐标顶点最接近曲线顶点与纵坐标顶点最接近者者(如如CT scag),就是二者之间,就是二者之间最好的诊断性试验。最好的诊断性试验。漏诊率漏诊率(1SEN)误诊率误诊率(1SPE)图1 01 放射性核素扫描(RN)与CT扫描诊断脑肿瘤的RO
25、C曲线32(likelihood ratio)似然比是诊断性试验综合评价的理想指标,似然比是诊断性试验综合评价的理想指标,它综合了敏感度与特异度的临床意义,而且可它综合了敏感度与特异度的临床意义,而且可依据试验结果的阳性或阴性,计算某病例患病依据试验结果的阳性或阴性,计算某病例患病的概率,以便在诊断性试验检测后,更确切地的概率,以便在诊断性试验检测后,更确切地对患者作出诊断。对患者作出诊断。阳性似然比是阳性似然比是。通。通俗地说,俗地说,33疾病疾病非疾病非疾病试验试验+a(a/a+c)a(a/a+c)b(b/b+d)b(b/b+d)+LR=Sen/(1Spe)+LR=Sen/(1Spe)试验
26、试验c(c/a+c)c(c/a+c)d(d/b+d)d(d/b+d)LR=(1Sen)/SpeLR=(1Sen)/SpeTotalTotala+ca+cb+db+da+b+c+da+b+c+dSen=Sen=灵灵敏度;敏度;Spe=Spe=特特异异度,度,LR=LR=似然比似然比阳阳性似然比(性似然比(positive likelihood ratio,+LR positive likelihood ratio,+LR)诊断诊断性性试验试验中,中,真阳真阳性在性在“有病有病”患者中的比例患者中的比例与与假假阳阳性在无病例性在无病例数数中比例的比中比例的比值值。表明。表明诊断诊断性性试试验阳验阳
27、性性时时患病机患病机会会的比的比值值,比,比值值越大越大则则患病的患病的概概率率越大。越大。+LR=a/a+c /b/b+d +LR=a/a+c /b/b+d =Sen/1Spe =Sen/1Spe34例例 监护监护病房病房CKCK诊断诊断心梗心梗(CK80=CK)(CK80=CK)心梗心梗无心梗无心梗CK+CK+215(93.48%)16(12.31%)215(93.48%)16(12.31%)231 231+LR=7.6+LR=7.6CK 15(6.52%)114(87.69%)129 CK 15(6.52%)114(87.69%)129 LR=0.07LR=0.07TotalTotal2
28、3023013013036036035似然比的特点和应用似然比的特点和应用 比灵敏度和特异度更稳定,不受患病率的比灵敏度和特异度更稳定,不受患病率的影响;影响;用于估计疾病概率;用于估计疾病概率;更科学地描述诊断试验更科学地描述诊断试验36验前概率、验后概率(验前概率、验后概率(Pretest probabilityPretest probability)验前概率是指进行某项诊断试验前病人患验前概率是指进行某项诊断试验前病人患某种疾病的估计概率。由于诊断试验不某种疾病的估计概率。由于诊断试验不可能确切告诉我们病人是否有病。它只可能确切告诉我们病人是否有病。它只能帮助我们校正验前概率而得出验后概
29、能帮助我们校正验前概率而得出验后概率,能明确的告诉我们此试验诊断的意率,能明确的告诉我们此试验诊断的意义。义。验前比数验前比数=验前概率验前概率/(1/(1验前概率验前概率)验后比数验后比数=验前比数似然比验前比数似然比验后概率验后概率=验后比数验后比数/(1+/(1+验后比数验后比数)37例某患者女性例某患者女性4545岁,胸痛就诊,患冠心病概率为多少?岁,胸痛就诊,患冠心病概率为多少?文献资料,患病率文献资料,患病率1 1若患者有典型心绞痛,其似然比若患者有典型心绞痛,其似然比=100=100验前比验前比0.01/(10.01)0.01/(10.01)0.010.01验后比验后比0.010
30、.011001001 1验后概率验后概率1/(1+1)1/(1+1)0.50.550%50%若患者心电图检查若患者心电图检查STST段压低段压低2.2mm2.2mm,其似然比,其似然比1111验后比验后比验前比似然比验前比似然比1 111111111验后概率验后概率11/(111/(111)11)919138 一个78岁的老年妇女,胃大部切除术后10天,近24小时出现气短且逐渐加重;同时感胸部不适,深呼吸时加重。体检发现腹部术区局部压痛,双肺底散在湿罗音。胸片显示右侧少量胸膜渗液。血气分析示PO2 70,氧饱和度 92%。ECG仅示非特异性改变。该病人虽然术后一直用5000 U肝素一天两次以预
31、防深静脉血栓,但肺通气灌注扫描(V/Q scan)提示“中度可能”肺栓塞。肺栓塞能不能诊断?是否开始全量的抗凝治疗?病例分析39若患者有典型心绞痛,其似然比=100监护病房CK诊断心梗(CK80=CK)AFP+8 9999 10007+PV=0.判断新诊断性试验的临床价值,应当将其结果与金标准诊断的结果进行同步对比,评估时要求每个病例,必须都有两项(即金标准与新试验)检查的结果,并按要求列出四格表。验前概率(Pretest probability)的概念阳性似然比是真阳性率与假阳性率之比。似然比是真阳性率与假阳性率之比。肺血管造影和V/Q扫描结果的关系区分诊断试验正常和异常的临界点会影响灵敏度
32、和特异度。中度可能 105 105/251=0.循证医学 Evidencebased Medicine 王家良,人民卫生出版社2005年8月但是,作ROC曲线不能只靠一、二次试验结果,就想找到正确的临界点,一般要求最少有5组连续分组测定数据用以制图,才能达到预期的要求。验后概率=验后比数/(1+验后比数)可将两种诊断性试验的ROC,曲线作图,如图101所示,凡曲线顶点与纵坐标顶点最接近者(如CT scag),就是二者之间最好的诊断性试验。评价诊断试验的各种指标)时,该阈值的敏感度和特异度之和为最大这时漏诊率和误诊率之和最小。中度可能 105 217因此,他们断定癌胚抗原在诊断结直肠癌方面很有价
33、值,甚至作为筛选手段。循证医学教研室李白艳、鲍遇海 40?证据等级金字塔(The Evidence Pyramid)循证医学教研室李白艳、鲍遇海 41Value of the Ventilation/Perfusion Scan in Acute Pulmonary EmbolismResults of the Prospective Investigation of Pulmonary Embolism Diagnosis(PIOPED)JAMA.1990;263:2753275942循证医学教研室李白艳、鲍遇海 43循证医学教研室李白艳、鲍遇海 44当试验方法和阳性标准固定时,每个诊断试验
34、的灵敏度和特异度是恒定的。循证医学教研室李白艳、鲍遇海患病率10/10万人循证医学教研室李白艳、鲍遇海验后比数=验前比数似然比因此,餐后血糖定为110mgI作为临界值最适当,恰与ROC曲线确定的临界值相同。3、研究结果是否会改变我的治疗决策?有肺栓塞有栓塞 无栓塞 合计阴性 149 616 765用金标准将患者,正确区分“有病”或“无病”。肺血管造影(包括136个“正常或接近正常”和“低度可能”但未行肺血管造影的病人及14个造影结果“不确定”的病人)验后概率=验后比数/(1+验后比数)=42.31%)231+LR=7.161-7(1969).1990;263:27532759若患者心电图检查S
35、T段压低2.验前概率、验后概率(Pretest probability)阳性似然比是真阳性率与假阳性率之比。但病人的V/Q扫描为中度可能(似然比为1.AFP 200 89100 89300 一一.研究的结果可靠吗?研究的结果可靠吗?1 1、有无与、有无与“金标准金标准”行行“盲法盲法”比较?比较?2 2、被检人群的代表性是否足够大?是否包括不同严重程度?、被检人群的代表性是否足够大?是否包括不同严重程度?3 3、治疗和未治疗的病人?是否包括了适当的疾病谱?包括容易、治疗和未治疗的病人?是否包括了适当的疾病谱?包括容易混淆的疾病?混淆的疾病?4 4、试验研究的结果有否影响病人做、试验研究的结果有
36、否影响病人做“金标准金标准”检验?检验?5 5、试验研究方法是否详细描述?别人能否重复其试验?、试验研究方法是否详细描述?别人能否重复其试验?二、研究的结果是什么二、研究的结果是什么?有否计算似然比有否计算似然比(likelihood ratio)(likelihood ratio)或提供计算似然比所需的数据?或提供计算似然比所需的数据?三三.结果对我的病人有无帮助?结果对我的病人有无帮助?1 1、研究结果的可重复性及结果解释能否满足我的工作环境?、研究结果的可重复性及结果解释能否满足我的工作环境?2 2、研究结果能否用于我的病人?、研究结果能否用于我的病人?3 3、研究结果是否会改变我的治疗
37、决策?、研究结果是否会改变我的治疗决策?4 4、病人是否因该试验而获益?、病人是否因该试验而获益?45研究结果 在在PIOPEDPIOPED研究中,研究中,731731个怀个怀疑肺栓塞的病人进行了疑肺栓塞的病人进行了V/QV/Q扫描和肺血扫描和肺血管造影。肺血管造影是肺栓塞诊断的管造影。肺血管造影是肺栓塞诊断的“金标准金标准”。1.1.在该研究中,造影有三种结在该研究中,造影有三种结果果 有肺栓塞有肺栓塞不能确定不能确定无肺栓塞。无肺栓塞。2.V/Q 2.V/Q扫描结果分四级扫描结果分四级 高度可能高度可能中度可能中度可能低度可能低度可能正常或接近正常正常或接近正常 46一.研究结果的可靠性判
38、断1.1.有无与有无与“金标准金标准”行行“盲法盲法”比较?比较?“金标准金标准”在在PIOPEDPIOPED研究中,他们选研究中,他们选用肺血管造影作为用肺血管造影作为“金标准金标准”“盲盲 法法”在在PIOPEDPIOPED研究中,作者虽研究中,作者虽然没有明确声明然没有明确声明“盲法盲法”的使用,但从其的使用,但从其试验整个过程来看,他们是严格采用试验整个过程来看,他们是严格采用“盲盲 法法”的的 47 2.2.被检人群情况被检人群情况 诊断性试验的真正价值在于它能够鉴别目标疾病诊断性试验的真正价值在于它能够鉴别目标疾病与其他容易混淆的疾病或状态。与其他容易混淆的疾病或状态。因此在诊断性
39、试验中,被检人群的因此在诊断性试验中,被检人群的情况应尽可能与临床实际场景相同。应包括早、中、晚期病人,轻、中、重病人、经过、情况应尽可能与临床实际场景相同。应包括早、中、晚期病人,轻、中、重病人、经过、未经过治疗的病人以及容易混淆的疾病。病人人群的代表性还应足够大,以确保检测差异未经过治疗的病人以及容易混淆的疾病。病人人群的代表性还应足够大,以确保检测差异不是由年龄、性别、饮食、活动等非疾病因素所造成。不是由年龄、性别、饮食、活动等非疾病因素所造成。Thomson DMP,Krupey J,Freedman SO,Gold P.The radioimmunoassay of circulat
40、ing carcinoembryonic antigen of the human digestive system.Proceedings of the National Academy of Sciences of the United States of America 64.161-7(1969).48验证偏倚 为了校正为了校正“验证偏倚验证偏倚”,PIOPEDPIOPED研究设立了第二个研究设立了第二个“金标准金标准”。他们对。他们对136136个个“正常或接近正常正常或接近正常”和和“低低度可能度可能”但未行肺血管造影的病人及但未行肺血管造影的病人及1414个造影结果个造影结果“不
41、不确定确定”的病人进行了一年的随访,未行抗凝治疗。结果的病人进行了一年的随访,未行抗凝治疗。结果无一例出现临床确定的肺栓塞。他们将这些病人并入无无一例出现临床确定的肺栓塞。他们将这些病人并入无肺栓塞组,见表肺栓塞组,见表2.2.这样,仍有这样,仍有5050个病人不能确定。部分是个病人不能确定。部分是“中度可能中度可能”或或“高度可能高度可能”的病人,部分是未能随访的造影结果的病人,部分是未能随访的造影结果“不确定不确定”的病人。的病人。49 (包括136个“正常或接近正常”和“低度可能”但未行肺血管造影的病人及14个造影结果“不确定”的病人)V/Q扫描 肺血管造影 有肺栓塞 无肺栓塞 高度可能
42、 102 14 中度可能 105 217 低度可能 39 273(199)正常或接近正常 5 126(50)合 计 251 630(480)50Spe=特异度,LR=似然比敏感度越高,漏诊率(1SEN)越少,易误诊,有助于排除相应的疾病。区分诊断试验正常和异常的临界点会影响灵敏度和特异度。阴性 149 616 765通俗地说,是指有病的病人呈现阳性的可能性是无病的病人呈现阳性的可能性的多少倍。单盲是指在诊断性试验中,判断试验的 人不知道该病例用金标准诊断“有病或无病。48%)16(12.)时,该阈值的敏感度和特异度之和为最大这时漏诊率和误诊率之和最小。+PV=a/a+b)例10l 某医院采用餐
43、后2h血糖测定,对诊断糖尿病者及非糖尿病患者进行连续检查,结果如表102,试问诊断糖尿病的临界值应确定在哪一个数值最正确?制图方法是以该试验的敏感度(真阳性率)为纵坐标(Y轴),而以l一特异度(假阳性率)为横坐标(X轴),依照连续分组测定的数据,分别计算SEN及SPE,按照平面几何的方法,将绘出各点联成曲线。(优选)第十章诊断性试验循证分析与评价因此,敏感度和特异度中任何一个数值的提高,必然导致另一数值的降低。肺血管造影是肺栓塞诊断的“金标准”。普通医院CK诊断心梗(CK80=CK)在该研究中,造影有三种结果图1 01 放射性核素扫描(RN)与CT扫描诊断脑肿瘤的ROC曲线如果知道超声心动图的
44、结果,我们很可能“听到”原先未听到的杂音)2.在PIOPED研究中,被检人群资料均详细交代,病人亦包括高度可能、中度可能和低度可能的肺栓塞病人患病率10/10万人4.4.试验方法是否描述得足够详细,以试验方法是否描述得足够详细,以便让别人重复其试验?便让别人重复其试验?试验方法的描述应包括病人的准备试验方法的描述应包括病人的准备(饮食、应避免的药物、检验后应注意的(饮食、应避免的药物、检验后应注意的事项)、试验过程、试验仪器、试剂、数事项)、试验过程、试验仪器、试剂、数据分析及解释方法等。据分析及解释方法等。51二研究结果分析二研究结果分析 是否计算似然比(是否计算似然比(likelihood
45、 ratio)或给出)或给出计算该比所需的数据?计算该比所需的数据?验前概率(验前概率(Pretest probability)的概念)的概念 验前概率是指进行某项诊断试验前病人患验前概率是指进行某项诊断试验前病人患某种疾病的估计概率。由于诊断试验不可能某种疾病的估计概率。由于诊断试验不可能确切告诉我们病人是否有病。它只能帮助我确切告诉我们病人是否有病。它只能帮助我们校正验前概率而得出验后概率,能明确的们校正验前概率而得出验后概率,能明确的告诉我们此试验诊断的意义。告诉我们此试验诊断的意义。似然比(似然比(likelihood ratio)是针对个体的概率。)是针对个体的概率。似然比是真阳性率
46、与假阳性率之比。通俗似然比是真阳性率与假阳性率之比。通俗地说,是指有病的病人呈现阳性的可能性是地说,是指有病的病人呈现阳性的可能性是无病的病人呈现阳性的可能性的多少倍。无病的病人呈现阳性的可能性的多少倍。敏感度敏感度/(1特异度特异度)52 肺栓塞肺栓塞 V/QV/Q扫描扫描 有有 无无 人数人数 比例比例 人数人数 比例比例 似然比似然比高度可能高度可能 102 102/251=0.406 14 14/630=0.022 18.3102 102/251=0.406 14 14/630=0.022 18.3中度可能中度可能 105 105/251=0.418 217 217/630=0.344
47、 1.2 105 105/251=0.418 217 217/630=0.344 1.2 低度可能低度可能 39 39/251=0.155 273 273/630=0.433 0.3639 39/251=0.155 273 273/630=0.433 0.36正常或接近正常正常或接近正常 5 5/251=0.020 126 126/630=0.200 0.10 5 5/251=0.020 126 126/630=0.200 0.10 合合 计计 251 630251 630 表表3.3.53 如果病例分析中的老年女性病如果病例分析中的老年女性病人验前概率是人验前概率是70%70%;V/QV/Q
48、扫描为扫描为高度可能高度可能(似然比为似然比为18.3)18.3)验前比数验前比数=验前概率验前概率/(1/(1验前概率验前概率)=0.7/(1=0.7/(1 0.7)=2.30.7)=2.3验后比数验后比数=验前比数似然比验前比数似然比=2.3=2.318.3=42.118.3=42.1验后概率验后概率=验后比数验后比数/(1+/(1+验后比数验后比数)=42.1/(1+42.1)=0.98=42.1/(1+42.1)=0.98 但病人的但病人的V/QV/Q扫描为中度可能扫描为中度可能(似然比为似然比为1.2)1.2)验后比数验后比数=验前比数似然比验前比数似然比=2.3=2.31.2=2.
49、761.2=2.76验后概率验后概率=验后比数验后比数/(1+/(1+验后比数验后比数)=2.76/(1+2.76)=0.73=2.76/(1+2.76)=0.7354用金标准将患者,正确区分“有病”或“无病”。二、研究的结果是什么?ROC曲线是用真阳性率(灵敏度)和假阳性率(1特异度)作图所得曲线;结果无一例出现临床确定的肺栓塞。AFP诊断肝癌,灵敏度80,特异度90”双盲:检测者不知道被检测者是否有病;敏感度越高,漏诊率(1SEN)越少,易误诊,有助于排除相应的疾病。区分诊断试验正常和异常的临界点会影响灵敏度和特异度。在该研究中,造影有三种结果+LR=a/a+c /b/b+dCopyrig
50、ht 1995,American Medical Association.例10l 某医院采用餐后2h血糖测定,对诊断糖尿病者及非糖尿病患者进行连续检查,结果如表102,试问诊断糖尿病的临界值应确定在哪一个数值最正确?区分诊断试验正常和异常的临界点会影响灵敏度和特异度。病人人群的代表性还应足够大,以确保检测差异不是由年龄、性别、饮食、活动等非疾病因素所造成。灵敏度越高的试验,阴性预测值越高;它只能帮助我们校正验前概率而得出验后概率,能明确的告诉我们此试验诊断的意义。人数 比例 人数 比例 似然比3、研究结果是否会改变我的治疗决策?指当前临床医师公认的诊断疾病最可靠的方法,也称标准诊断。患病率1