1、第十章第十章 诊断性试验循证分析与评价诊断性试验循证分析与评价诊断性试验循证分析与评价诊断性试验循证分析与评价2 ,.,.,.()().,.循证医学循证医学 王家良,人民卫生出版社年月王家良,人民卫生出版社年月本节课内容的出处3医学是一门不确定性的医学是一门不确定性的科学和可能性的艺术科学和可能性的艺术 .第一节第一节 诊断性试验在临床医学中的重要性诊断性试验在临床医学中的重要性45循证诊断循证诊断6诊断性试验发展方向 快速诊断试验()快速诊断试验()因此,今后对诊断性试验的开发,因此,今后对诊断性试验的开发,要按照临床流行病学的方法学创最佳证要按照临床流行病学的方法学创最佳证据的要求,重视研
2、究的质量,需要事前据的要求,重视研究的质量,需要事前做好设计方案、确定金标准和观察指标做好设计方案、确定金标准和观察指标,而且对病例选择、样本含量、盲法试,而且对病例选择、样本含量、盲法试验、重复性试验等内容。验、重复性试验等内容。78研究发现,如果将病人人群扩展到早期结直肠癌病研究发现,如果将病人人群扩展到早期结直肠癌病人和其他癌症病人以及其他消化道疾病,癌胚抗原人和其他癌症病人以及其他消化道疾病,癌胚抗原的诊断准确度就明显下降。因此,癌胚抗原已不再的诊断准确度就明显下降。因此,癌胚抗原已不再作为诊断和筛选指标,只作为结直肠癌病人的随访作为诊断和筛选指标,只作为结直肠癌病人的随访指标。指标。
3、910 金标准金标准 有病有病 无病无病 合计合计 阳性阳性 真阳性()真阳性()假阳性假阳性()()阴性阴性 假阴性()假阴性()真阴性真阴性()()合计合计 四格表的排列四格表的排列诊断诊断试验试验111213 灵敏度和特异度的特点141516 灵敏度越高的试验,阴性预测值越高;灵敏度越高的试验,阴性预测值越高;特异度越高的试验,阳性预测值越高;特异度越高的试验,阳性预测值越高;患病率的高低对预测值的影响更大。患病率的高低对预测值的影响更大。1718监护病房诊断心梗监护病房诊断心梗()()心梗心梗无心梗无心梗()()()()普通医院诊断心梗普通医院诊断心梗()(岁岁人群人群肝癌肝癌非肝癌非
4、肝癌 万万22 诊断诊断肝癌,肝癌,灵灵敏度,特敏度,特异异度度()()年年龄龄 岁岁 肝硬化人群肝硬化人群 肝癌肝癌 非肝癌非肝癌 万万23诊断诊断肝癌,肝癌,灵灵敏度,特敏度,特异异度度患病率万人患病率万人肝癌肝癌非肝癌非肝癌 万万 2425 受试者工作特性曲线受试者工作特性曲线(,曲线曲线)曲线是用真阳性率曲线是用真阳性率(灵敏度灵敏度)和假阳性和假阳性率率(特异度特异度)作图所得曲线;作图所得曲线;26 制图方法是以该试验的敏感度制图方法是以该试验的敏感度(真阳性率真阳性率)为纵坐标为纵坐标(轴轴),而以一特,而以一特异度异度(假阳性率假阳性率)为横坐标为横坐标(轴轴),依照,依照连续
5、分组测定的数据,分别计算及,连续分组测定的数据,分别计算及,按照平面几何的方法,将绘出各点按照平面几何的方法,将绘出各点联成曲线。即为曲线。在曲线的各联成曲线。即为曲线。在曲线的各点中,距轴顶点直线距离最近的一点中,距轴顶点直线距离最近的一点,即为正常值的最佳临界值。点,即为正常值的最佳临界值。27 用该点数值区分正常与异常,其用该点数值区分正常与异常,其敏感度及特异度都比较高,而误诊敏感度及特异度都比较高,而误诊及漏诊例数之和最小。但是,作曲及漏诊例数之和最小。但是,作曲线不能只靠一、二次试验结果,就线不能只靠一、二次试验结果,就想找到正确的临界点,一般要求最想找到正确的临界点,一般要求最少
6、有组连续分组测定数据用以制图,少有组连续分组测定数据用以制图,才能达到预期的要求。表示灵敏度才能达到预期的要求。表示灵敏度和特异度之间的关系。和特异度之间的关系。28 例例 某医院采用餐后血糖测定,对诊断糖某医院采用餐后血糖测定,对诊断糖尿病者及非糖尿病患者进行连续检查,结果尿病者及非糖尿病患者进行连续检查,结果如表如表,试问诊断糖尿病的临界值应确定在,试问诊断糖尿病的临界值应确定在哪一个数值最正确哪一个数值最正确?表中列出了及表中列出了及,分别将各组的及,分别将各组的及数据,分别数据,分别在纵坐标和横坐标上绘出并连成曲线,即为在纵坐标和横坐标上绘出并连成曲线,即为曲线。如图曲线。如图在各点之
7、中,距左上角直线距在各点之中,距左上角直线距离最近的一点离最近的一点(曲线左起第点曲线左起第点),就是该试验,就是该试验的临界值。故诊断糖尿病餐后血糖测量值,的临界值。故诊断糖尿病餐后血糖测量值,定为定为()最为恰当。最为恰当。29 在表中,随着血糖浓度的升高,敏感度下在表中,随着血糖浓度的升高,敏感度下降而特异度升高。因此,敏感度和特异度降而特异度升高。因此,敏感度和特异度中任何一个数值的提高,必然导致另一数中任何一个数值的提高,必然导致另一数值的降低。如选用餐后血糖。值的降低。如选用餐后血糖。()为为临界值,则糖尿病的漏诊率临界值,则糖尿病的漏诊率()为,而为,而有的非糖尿病受试者被误诊。
8、如果将临有的非糖尿病受试者被误诊。如果将临界值定为界值定为(。),则可使漏诊率,则可使漏诊率()上升到,而误诊率上升到,而误诊率()仅为。当餐后仅为。当餐后血糖临界值定为。血糖临界值定为。(。)时,该阈值时,该阈值的敏感度和特异度之和为最大这时漏诊的敏感度和特异度之和为最大这时漏诊率和误诊率之和最小。因此,餐后血糖定率和误诊率之和最小。因此,餐后血糖定为作为临界值最适当,恰与曲线确定为作为临界值最适当,恰与曲线确定的临界值相同。的临界值相同。30 和和 诊断心梗曲线比较诊断心梗曲线比较 假阳性率假阳性率真阳性率(灵敏度)真阳性率(灵敏度)31 曲线在同一种疾病的两种或两曲线在同一种疾病的两种或
9、两种以上的诊断性试验的诊断中种以上的诊断性试验的诊断中进行优选:进行优选:可将两种诊断性试验的,曲线可将两种诊断性试验的,曲线作图,如图作图,如图所示,凡曲线顶所示,凡曲线顶点与纵坐标顶点最接近者点与纵坐标顶点最接近者(如如),就是二者之间最好的诊断性试就是二者之间最好的诊断性试验。验。漏诊率漏诊率()误诊率误诊率()图 放射性核素扫描()与扫描诊断脑肿瘤的曲线3233疾病疾病非疾病非疾病试验试验()()()()()()试验试验()()()()()()灵灵敏度;特敏度;特异异度,似然比度,似然比阳阳性似然比(性似然比()诊断诊断性性试验试验中,中,真阳真阳性在性在“有病有病”患者中的比例患者中
10、的比例与与假假阳阳性在无病例性在无病例数数中比例的比中比例的比值值。表明。表明诊断诊断性性试试验阳验阳性性时时患病机患病机会会的比的比值值,比,比值值越大越大则则患病的患病的概概率率越大。越大。34例例 监护监护病房病房诊断诊断心梗心梗()()心梗心梗无心梗无心梗()()()()()()()()35似然比的特点和应用似然比的特点和应用 比灵敏度和特异度更稳定,不受患病率的比灵敏度和特异度更稳定,不受患病率的影响;影响;用于估计疾病概率;用于估计疾病概率;更科学地描述诊断试验更科学地描述诊断试验36验前概率、验后概率(验前概率、验后概率()验前概率是指进行某项诊断试验前病人患验前概率是指进行某项
11、诊断试验前病人患某种疾病的估计概率。由于诊断试验不某种疾病的估计概率。由于诊断试验不可能确切告诉我们病人是否有病。它只可能确切告诉我们病人是否有病。它只能帮助我们校正验前概率而得出验后概能帮助我们校正验前概率而得出验后概率,能明确的告诉我们此试验诊断的意率,能明确的告诉我们此试验诊断的意义。义。验前比数验前概率验前比数验前概率(验前概率验前概率)验后比数验前比数似然比验后比数验前比数似然比验后概率验后比数验后概率验后比数(验后比数验后比数)37例:某患者女性岁,胸痛就诊,患冠心病概率为多少?例:某患者女性岁,胸痛就诊,患冠心病概率为多少?文献资料,患病率文献资料,患病率若患者有典型心绞痛,其似
12、然比若患者有典型心绞痛,其似然比验前比验前比()()验后比验后比验后概率验后概率()()若患者心电图检查段压低,其似然比若患者心电图检查段压低,其似然比验后比验后比验前比似然比验前比似然比验后概率验后概率()38 一个岁的老年妇女,胃大部切除术后天,近小时出现气短且逐渐加重;同时感胸部不适,深呼吸时加重。体检发现腹部术区局部压痛,双肺底散在湿罗音。胸片显示右侧少量胸膜渗液。血气分析示,氧饱和度。仅示非特异性改变。该病人虽然术后一直用 肝素一天两次以预防深静脉血栓,但肺通气灌注扫描()提示“中度可能”肺栓塞。肺栓塞能不能诊断?是否开始全量的抗凝治疗?病例分析39?证据等级金字塔()40 ().4
13、1424344 一一.研究的结果可靠吗?研究的结果可靠吗?、有无与、有无与“金标准金标准”行行“盲法盲法”比较?比较?、被检人群的代表性是否足够大?是否包括不同严重程度?、被检人群的代表性是否足够大?是否包括不同严重程度?、治疗和未治疗的病人?是否包括了适当的疾病谱?包括容易混淆、治疗和未治疗的病人?是否包括了适当的疾病谱?包括容易混淆的疾病?的疾病?、试验研究的结果有否影响病人做、试验研究的结果有否影响病人做“金标准金标准”检验?检验?、试验研究方法是否详细描述?别人能否重复其试验?、试验研究方法是否详细描述?别人能否重复其试验?二、研究的结果是什么二、研究的结果是什么?有否计算似然比有否计
14、算似然比()()或提供计算似然比所需的数据?或提供计算似然比所需的数据?三三.结果对我的病人有无帮助?结果对我的病人有无帮助?、研究结果的可重复性及结果解释能否满足我的工作环境?、研究结果的可重复性及结果解释能否满足我的工作环境?、研究结果能否用于我的病人?、研究结果能否用于我的病人?、研究结果是否会改变我的治疗决策?、研究结果是否会改变我的治疗决策?、病人是否因该试验而获益?、病人是否因该试验而获益?45研究结果 在研究中,个怀疑肺栓塞的在研究中,个怀疑肺栓塞的病人进行了扫描和肺血管造影。肺血管病人进行了扫描和肺血管造影。肺血管造影是肺栓塞诊断的造影是肺栓塞诊断的“金标准金标准”。.在该研究
15、中,造影有三种结果:在该研究中,造影有三种结果:有肺栓塞有肺栓塞不能确定不能确定无肺栓塞。无肺栓塞。扫描结果分四级:扫描结果分四级:高度可能高度可能中度可能中度可能低度可能低度可能正常或接近正常正常或接近正常 46一.研究结果的可靠性判断.有无与有无与“金标准金标准”行行“盲法盲法”比较?比较?“金标准金标准”在研究中,他们选用肺血管在研究中,他们选用肺血管造影作为造影作为“金标准金标准”“盲盲 法法”:在研究中,作者虽然没有在研究中,作者虽然没有明确声明明确声明“盲法盲法”的使用,但从其试验整的使用,但从其试验整个过程来看,他们是严格采用个过程来看,他们是严格采用“盲盲 法法”的的 47.被
16、检人群情况被检人群情况 诊断性试验的真正价值在于它能够鉴别目标疾病与其他容易混淆的疾病诊断性试验的真正价值在于它能够鉴别目标疾病与其他容易混淆的疾病或状态。因此在诊断性试验中,被检人群的情况应尽可能与临床实际场景相同。或状态。因此在诊断性试验中,被检人群的情况应尽可能与临床实际场景相同。应包括早、中、晚期病人,轻、中、重病人、经过、未经过治疗的病人以及容应包括早、中、晚期病人,轻、中、重病人、经过、未经过治疗的病人以及容易混淆的疾病。病人人群的代表性还应足够大,以确保检测差异不是由年龄、易混淆的疾病。病人人群的代表性还应足够大,以确保检测差异不是由年龄、性别、饮食、活动等非疾病因素所造成。性别
17、、饮食、活动等非疾病因素所造成。在研究中,被检人群资料均详细交代,病人亦包括高度可能、中度可能和低在研究中,被检人群资料均详细交代,病人亦包括高度可能、中度可能和低度可能的肺栓塞病人度可能的肺栓塞病人 ,.().48验证偏倚 为了校正为了校正“验证偏倚验证偏倚”,研究设立了第二个,研究设立了第二个“金标金标准准”。他们对个。他们对个“正常或接近正常正常或接近正常”和和“低度可能低度可能”但但未行肺血管造影的病人及个造影结果未行肺血管造影的病人及个造影结果“不确定不确定”的病人的病人进行了一年的随访,未行抗凝治疗。结果无一例出现临进行了一年的随访,未行抗凝治疗。结果无一例出现临床确定的肺栓塞。他
18、们将这些病人并入无肺栓塞组,见床确定的肺栓塞。他们将这些病人并入无肺栓塞组,见表表.这样,仍有个病人不能确定。部分是这样,仍有个病人不能确定。部分是“中度可能中度可能”或或“高度可能高度可能”的病人,部分是未能随访的造影结果的病人,部分是未能随访的造影结果“不确定不确定”的病人。的病人。49正常或接近正常正常或接近正常()()合合计计()()50.试验方法是否描述得足够详细,以便试验方法是否描述得足够详细,以便让别人重复其试验?让别人重复其试验?试验方法的描述应包括病人的试验方法的描述应包括病人的准备(饮食、应避免的药物、检验后准备(饮食、应避免的药物、检验后应注意的事项)、试验过程、试验仪应
19、注意的事项)、试验过程、试验仪器、试剂、数据分析及解释方法等。器、试剂、数据分析及解释方法等。51二研究结果分析二研究结果分析 是否计算似然比(是否计算似然比()或给出计算该比所需)或给出计算该比所需的数据?的数据?验前概率(验前概率()的概念)的概念 验前概率是指进行某项诊断试验前病人患验前概率是指进行某项诊断试验前病人患某种疾病的估计概率。由于诊断试验不可能某种疾病的估计概率。由于诊断试验不可能确切告诉我们病人是否有病。它只能帮助我确切告诉我们病人是否有病。它只能帮助我们校正验前概率而得出验后概率,能明确的们校正验前概率而得出验后概率,能明确的告诉我们此试验诊断的意义。告诉我们此试验诊断的
20、意义。似然比(似然比()是针对个体的概率。)是针对个体的概率。似然比是真阳性率与假阳性率之比。通俗似然比是真阳性率与假阳性率之比。通俗地说,是指有病的病人呈现阳性的可能性是地说,是指有病的病人呈现阳性的可能性是无病的病人呈现阳性的可能性的多少倍。无病的病人呈现阳性的可能性的多少倍。敏感度敏感度(特异度特异度)52 肺栓塞肺栓塞 扫描扫描 有有 无无 人数人数 比例比例 人数人数 比例比例 似然比似然比高度可能高度可能 中度可能中度可能 低度可能低度可能 正常或接近正常正常或接近正常 合合 计计 表表.53 如果病例分析中的老年女性病如果病例分析中的老年女性病人验前概率是;扫描为高度可能人验前概
21、率是;扫描为高度可能(似然比为似然比为):验前比数验前概率验前比数验前概率(验前概率验前概率)()验后比数验前比数似然比验后比数验前比数似然比验后概率验后比数验后概率验后比数(验后比数验后比数)()()但病人的扫描为中度可能但病人的扫描为中度可能(似似然比为然比为):验后比数验前比数似然比验后比数验前比数似然比验后概率验后比数验后概率验后比数(验后比数验后比数)()()54敏感度敏感度特异度特异度阳性似然比阳性似然比阴性似然比阴性似然比 肺血管造影肺血管造影 有栓塞有栓塞 无栓塞无栓塞 合计合计 阳性阳性 阴性阴性 合计合计 表表.扫描与肺血管造影比较(设高度可能为阳性)扫描与肺血管造影比较(
22、设高度可能为阳性)扫描表表.扫描与肺血管造影比较(设正常或接近正常为阴性)扫描与肺血管造影比较(设正常或接近正常为阴性)肺血管造影肺血管造影 有栓塞有栓塞 无栓塞无栓塞 合计合计阳性阳性 阴性阴性 合计合计 扫描敏感度敏感度特异度特异度阳性似然比阳性似然比阴性似然比阴性似然比敏感度高易误诊,特异度高易漏诊敏感度高易误诊,特异度高易漏诊55三三.结果对我的病人有无帮助?结果对我的病人有无帮助?研究结果的可重复性及结果解释能否满足研究结果的可重复性及结果解释能否满足我的工作环境?我的工作环境?有价值的试验诊断应该能在相有价值的试验诊断应该能在相同的病人身上获得相同的结果。但由同的病人身上获得相同的
23、结果。但由于工作环境的差异,有两个因素影响于工作环境的差异,有两个因素影响其可重复性及结果解释:其可重复性及结果解释:)试验本身:我的医院有相同的机)试验本身:我的医院有相同的机器、试剂和人员能重复这个试器、试剂和人员能重复这个试 验吗?验吗?)结果解释:我的医院有人能解读)结果解释:我的医院有人能解读这个试验结果吗?(如:、片等这个试验结果吗?(如:、片等)56、研究结果能否用于我的病人?、研究结果能否用于我的病人?意指我的病人的诊治环境是否与研究中意指我的病人的诊治环境是否与研究中的类似,是否符合研究中的纳入标准而且的类似,是否符合研究中的纳入标准而且不属其排除标准?不属其排除标准?、研究
24、结果是否会改变我的治疗决策?、研究结果是否会改变我的治疗决策?、病人是否因该试验而获益?、病人是否因该试验而获益?参照参照 、作出决策。作出决策。571.1.敏感度敏感度()():()():意指有病的多少为阳性意指有病的多少为阳性2.2.特异度特异度()():()():意指无病的多少为阴性意指无病的多少为阴性3.3.准确度准确度()()():()()():意指真阳性和真阴性所占比例意指真阳性和真阴性所占比例4.4.患病率患病率()()():()()():意指有病病人所占比例意指有病病人所占比例5.5.阳性预测值阳性预测值()():)():意指阳性中多少真有病意指阳性中多少真有病6.6.阴性预测
25、值阴性预测值()():)():意指阴性中多少真无病意指阴性中多少真无病7.7.阳性似然比阳性似然比()敏感度敏感度(特异度特异度):):意指真阳性率是假阳性率的多少倍意指真阳性率是假阳性率的多少倍8.8.阴性似然比阴性似然比()()(敏感度敏感度)特异度特异度:意指假阴性率是真阴性率的多少倍意指假阴性率是真阴性率的多少倍9.9.漏诊率漏诊率()()()()10.10.误诊率误诊率()()()()11.11.验前比验前概率验前比验前概率(验前概率验前概率)()()()()12.12.验后比验前比似然比验后比验前比似然比 13.13.验后概率验后比验后概率验后比(验后比验后比)()()()()58
26、 一一.研究的结果可靠吗?研究的结果可靠吗?、有无与、有无与“金标准金标准”行行“盲法盲法”比较?比较?、被检人群的代表性是否足够大?是否包括不同严重程度?、被检人群的代表性是否足够大?是否包括不同严重程度?、治疗和未治疗的病人?是否包括了适当的疾病谱?包括容易混淆、治疗和未治疗的病人?是否包括了适当的疾病谱?包括容易混淆的疾病?的疾病?、试验研究的结果有否影响病人做、试验研究的结果有否影响病人做“金标准金标准”检验?检验?、试验研究方法是否详细描述?别人能否重复其试验?、试验研究方法是否详细描述?别人能否重复其试验?二、研究的结果是什么二、研究的结果是什么?有否计算似然比有否计算似然比()()或提供计算似然比所需的数据?或提供计算似然比所需的数据?三三.结果对我的病人有无帮助?结果对我的病人有无帮助?、研究结果的可重复性及结果解释能否满足我的工作环境?、研究结果的可重复性及结果解释能否满足我的工作环境?、研究结果能否用于我的病人?、研究结果能否用于我的病人?、研究结果是否会改变我的治疗决策?、研究结果是否会改变我的治疗决策?、病人是否因该试验而获益?、病人是否因该试验而获益?59谢谢!60