1、第八章 筛检与诊断试验的评价,钟秋安,副教授 公共卫生学院流行病学教研室 E-mail: zhongqa2010,Evaluation of Screening and Diagnostic Test,疾病自然史与筛检示意图,开始暴露,出现症状,临床前可检查期,疾病发生,临床诊断,治疗,如果疾病在临床前期出现一些可以识别的异常特征,如肿瘤的早期标识物(biomarkers)、血压升高、血脂升高等,则可使用一种或多种方法将其查出,并对其做进一步的诊断和治疗,则可延缓疾病的发展,改善其预后。,易感期,临床前期,临床期,残疾、死亡,康 复,疾病自然史与筛检示意图,开始暴露,出现症状,临床前可检查期,
2、疾病发生,临床诊断,治疗,筛检,康 复,残疾、死亡,易感期,临床前期,临床期,诊 断,学习目的,第一节 概 述,第四节 提高试验效率的办法,第三节 筛检与诊断试验的评价,第二节 设计与实施,第五节 试验中的常见偏倚,第一节 概 述,一、概 念,(一)筛检(screening) 是运用快速、简便的试验、检查或其他措施,在健康人群中将可疑病人或有缺陷但表面健康的人同真正无病的人区别开来。是早期发现可疑病人的一种措施, 不是对疾病做出诊断。,用于筛检的检测方法称为筛检试验 (screening test),方 法:问卷询问、体格检查、内镜检查、X线检查、血清学检查、生物化学、基因检查。,(二)诊断试
3、验,诊断试验(diagnostic test)是指应用实验、仪器设备等手段检查就诊者,对疾病进行诊断的一切检测方法。,包括各种实验室检查(生物化学、免疫学、微生物学、寄生虫学、病理学等),影像诊断(超声波、CT、X线、核磁共振等),仪器检查(心电图、脑电图、核素扫描、内窥镜等),还包括病史询问、体格检查等。,筛检试验与诊断试验的区别,对象不同 健康或表面健康人 患者或可疑患者,要求不同 快速、简便、高灵敏度 科学性、准确性,费用不同 简单、廉价 一般花费较贵,8-1,按筛检对象的范围 按筛检项目的多少,整群筛检 (mass screening) 目标筛检 (targeted screening
4、),单项筛检(single screening) 多项筛检(multiple screening),分 类,二、筛检分类和实施原则,实施原则,第二节 设计与实施,一、确定“金标准” “金标准”是指当前临床医学界公认的诊断疾病的最可靠的方法,或者以一种被广泛接受或认可的具有高度灵敏度和特异度的诊断方法。也称为标准诊断。 通常包括:活检、手术发现、微生物培养、尸检、特殊检查和影像诊断,以及长期随访的结果。,二、选择研究对象,选择受试对象的原则:受试对象应能代表诊断试验可能应用的目标人群。 病例组:指用金标准确诊“有病”的病例。应包含典型的、不典型病例,早、中、晚期病例,轻、中、重病例、有和无并发症
5、的患者。 对照组:是指用金标准证实没有目标疾病的其他病例,特别是与该病容易混淆的病例。正常人一般不宜纳入对照组。,三、盲法判定与结果比较,同步金标准方法与待评价方法同 时间、同地区、同人群中进行; 盲法测量者不了解情况; 比较与金标准的结果进行比较。,四、确定诊断试验的界值,选用试验指标的类别,确定界值的原则,区别正常和异常,mmHg,140,160,120,8-2,病人与非病人某项检测值频数分布示意图,选择诊断标准的原则 早期或及时诊断治疗效果理想的疾病,如果漏诊会造成严重后果,需要提高诊断试验的灵敏度; 治疗效果不理想的疾病,如果误诊会造成严重后果,需要提高诊断试验的特异度; 如果漏诊和误
6、诊同等重要,应将诊断标准定在灵敏度和特异度均较高的位置。,均数加减标准差 百分位数法 临床判断法 ROC曲线法,确定诊断试验界值的方法,受试者工作特性曲线 (receiver operator characteristic curve, ROC),是以灵敏度为纵坐标,假阳性率(1-特异度)为横坐标作图得出的曲线,是确定诊断界值较为理想的一种方法。 ROC曲线被用来直观地确定诊断界值,一般选择曲线上尽量靠近左上方那一点定为截断点即诊断标准,此处试验的灵敏度和特异度均较高,假阳性率和假阴性率最小。,ROC曲线也可用来比较两种或多种筛检试验的诊断价值。除了直观比较的方法外,还可计算ROC曲线下的面积
7、。,第三节 筛检与诊断试验的评价,诊断试验评价就是将待评试验与诊断目标疾病的标准方法,即“金标准”(gold standard),进行同步盲法比较,判定该方法对疾病“诊断”的真实性、可靠性、收益。,诊断试验的评价,一、真实性的评价,真实性的指标 真实性(validity),亦称有效性,指测量值与实际值相符合的程度。,用于评价真实性的指标有:,灵敏度与假阴性率 特异度与假阳性率 似然比 正确指数,灵敏度(sensitivity),又称真阳性率(true positive rate),即实际有病而按该筛检试验的标准被正确地判为有病的百分比。 它反映了筛检试验发现病人的能力。,(一)灵敏度与假阴性率
8、,假阴性率(false negative rate),又称漏诊率,指实际有病,根据筛检试验被确定为无病的百分比。 它反映的是筛检试验漏诊病人的情况。,特异度(specificity),又称真阴性率(true negative rate),即实际无病按筛检标准被正确地判为无病的百分比。 它反映了筛检试验确定非病人的能力。,(二)特异度与假阳性率,假阳性率(false positive rate),又称误诊率,即实际无病,但根据筛检被判为有病的百分比。 它反映的是筛检试验误诊病人的情况。,(三)似然比,似然比(likelihood ratio, LR)属于同时反映灵敏度和特异度的复合指标,即有病者
9、中得出某一筛检试验结果的概率与无病者得出这一概率的比值。 该指标全面反映了筛检试验的诊断价值,非常稳定。 它的计算只涉及灵敏度与特异度,不受患病率的影响。,阳性似然比(positive likelihood ratio,LR),是筛检结果的真阳性率与假阳性率之比。 该指标反映了筛检试验正确判断阳性的可能性是错误判断阳性可能性的倍数。 比值越大,试验结果阳性时为真阳性的概率越大。,阴性似然比是筛检结果的假阴性率与真阴性率之比。 该指标表示错误判断阴性的可能性是正确判断阴性可能性的倍数。 比值越小,试验结果阴性时为真阴性的可能性越大。,阴性似然比(negative likelihood ratio
10、, LR),也称约登指数(Youdens index),是灵敏度与特异度之和减去1,表示筛检方法发现真正病人与非病人的总能力。 正确指数的范围在01之间。指数越大,其真实性越高。 正确指数 = (灵敏度 + 特异度) 1 =1 (假阴性率 + 假阳性率),(四)正确指数,人群某病患病状况与诊断结果的关系,理想的试验是灵敏度和特异度都为100%,即病人和非病人的检测值之间没有重叠,但实际上大多数医学检查的正常值和异常值在分布上有重叠。,(五)灵敏度和特异度的关系,如果将诊断界值右移,特异度增高而灵敏度降低,假阴性率(漏诊率)增加; 反之,将诊断界值左移,特异度降低而灵敏度增高,假阳性率(误诊率)
11、增加。,糖尿病血糖试验不同血糖水平的灵敏度和特异度分布,二、可靠性的评价,可靠性(reliability)又称信度,指某一试验方法在相同条件下重复测量同一受试者时,所获结果的一致性。 结果的一致程度越高,表明诊断试验所用检测方法的稳定程度越好,可靠性越高。,1.标准差和变异系数(coefficient of variance, CV),标准差和变异系数的值越小,表示可重复性越好,精密度越高。反之,可重复性就越差,精密度越低。 变异系数为标准差与算术均数之比。 变异系数(CV) =(标准差/算术均数)100%,2.符合率,符合率(agreement/consistency rate),又称一致率
12、,是筛检试验判定的结果与标准诊断的结果相同的数占总受检人数的比例。,3. Kappa值,Kappa值=实际一致性/非机遇一致性,该值考虑了机遇因素对一致性的影响并加以校正,提高了判断的有效性。,Kappa值判断标准,影响可靠性的因素,受试对象的生物学差异 试验因素所致的差异 观察者的变异,三、收 益,1.预测值(predictive value, PV),阳性预测值,阳性预测值(positive predictive value, PPV): 是指试验阳性结果中真正患病(真阳性)的比例。,阴性预测值,阴性预测值(negative predictive value, NPV)是指筛检试验阴性者不
13、患目标疾病的可能性。,以血清肌酸激酶诊断急性心肌梗死试验为例计算PPV和NPV :,筛检试验的灵敏度越高,阴性预测值越高; 筛检试验的特异度越高,阳性预测值越高; 预测值还与受检人群目标疾病患病率(P)的高低密切相关。,2.预测值与灵敏度、特异度、患病率的关系,阳性预测值、阴性预测值与患病率、灵敏度和特异度的关系,可用以下公式表示:,在灵敏度、特异度和患病率不同水平时某人群糖尿病筛检的结果,第四节 提高试验效率的办法,一、选择患病率高的人群 (即高危人群),当试验的灵敏度和特异度不变时,阳性预测值随患病率升高而增大,而阳性预测值越大,试验的价值和效率也越高。高危人群中的患病率要明显高于普通人群
14、,显然,将高危人群作为研究对象可提高试验的价值和效率。,1. 并联试验(parallel test)也称平行试验,是多个试验同时进行,只要有一个阳性就可判为平行试验阳性,认为疾病的证据存在。其优点是灵敏度提高,不易漏诊,缺点是特异度降低,误诊增多。,二、采用联合试验方法,2. 串联试验(series test)也称系列试验,是多个试验相继进行,前一个试验结果阳性就接着做下一个试验,一旦出现阴性结果就可判为系列试验阴性,作为无病处理,终止试验。只有各试验结果全部阳性才能判为系列试验阳性。该方法的优点是特异度提高,误诊减少,但灵敏度下降,漏诊增加。,联合试验诊断糖尿病的结果,第五节 试验中的常见偏
15、倚,领先时间(lead time)是指通过筛检试验,在慢性病自然史的早期阶段,在症状出现前提前做出诊断,从而赢得提前治疗疾病的时间。 领先时间偏倚是指筛检诊断时间和临床诊断时间之差被解释为因筛检而延长的生存时间。,1.领先时间偏倚,2.病程长短偏倚,小 结,筛检就是用一些方法将人群中表面健康但可能患病的人查出,以便早期治疗,改善其预后。 评价筛检试验真实性的指标主要有灵敏度、特异度、阳性似然比与阴性似然比。 影响筛检试验可靠性的因素有受试对象、观察者和实验室条件。 筛检效果的评价可从个体受益、社会受益的生物学和社会经济学方面进行,同时要注意避免领先时间偏倚、病程长短偏倚。,Q & A,1.适宜筛检的疾病应具备哪些特点? 2.如何提高筛检或诊断试验的收益?,Thank you for your attention!,