1、北京大学公共卫生学院流行病与卫生统计学系詹思延l临床诊断临床诊断:临床医师根据病人的症状、体征、实验室检临床医师根据病人的症状、体征、实验室检查、影像学检查等资料,融合临床医师本人的专业知查、影像学检查等资料,融合临床医师本人的专业知识和临床经验,对疾病做出临床判断。识和临床经验,对疾病做出临床判断。l诊断试验主要是在用诊断试验主要是在用“金标准(金标准(gold standard)”确确诊的患有某病和未患有该病的小样本中实施的一种评诊的患有某病和未患有该病的小样本中实施的一种评价研究,目的旨在对某种诊断技术的诊断特性做出科价研究,目的旨在对某种诊断技术的诊断特性做出科学的界定。学的界定。l将
2、循证医学的原则运用到检验医学中就称循证检验医学(EBLM)。提供最佳检测结果以协助临床作出诊断、治疗和预防的抉择。证实与评估检验结果的准确、可靠、有效与经济性能。对实验研究和文献进行评估,不断改进现行医学检验技术。(Moore RA.Concepts and principles of evidence-based laboratory medicine.Am Clin Lab.1999 Jan-Feb;18(1):24-5.)检验项目的循证评价(李萍,2007)l评估方法或技术的精密度、准确性、特异性、分析范围、生物学变异等。l即评估该诊断实验的临床灵敏度、临床特异性、预测值、似然比等。某方
3、法具有好的临床敏感性和特异性是被采用的先决条件。l临床诊断试验主要是在用“金标准(gold standard)”确诊的患有某病和未患有该病的小样本中实施的一种评价研究,目的旨在对某种诊断技术的诊断特性做出科学的界定。(Januzzi et al,Circulation.2010;121(10):1227-34.)l评估对诊断决策和治疗决策的影响。即评价检验项目的使用是否改善了诊断、治疗和预防策略,使病人得到了最佳健康服务的结果。诊断策略治疗策略患者结局l1993-2001年,76693名55-74岁美国男性被随机分为PSA筛查(38343)和对照组(38350)。7-10年随访。N Engl
4、Med J 2009;360:1310-9l即评估投入产出比。评价其是否减少了病人的住院时间、减少了工作人员、节省了有关设施和资源,病人结果如何等。Prostate cancerFramework for cost-effectiveness and health-related quality of life(HRQL)measurements.诊断性能评价 金标准 阳性 病人 特 阴性 定 新诊断技术 人 阳性 群 非病人 阴性 金标准 病人 非病人 合计 阳性 A B A+B 新诊断技术 阴性 C D C+D 合计 A+C B+D N 评 价 指 标 图 5-1 临床诊断试验研究程序 l
5、指目前医学界公认的诊断某种疾病最准确的方法指目前医学界公认的诊断某种疾病最准确的方法。活体病理组织检查、手术探查、尸体解剖一些诊断技术作为疾病确诊的依据专家的意见并为学术界所公认长期随访所获得的确切诊断“循环推论(circular reasoning)”(臧焰,秦晓光,2002)研究对象应能代表诊断技术可能应用的靶人群。研究对象应能代表诊断技术可能应用的靶人群。病例组应当包括所研究疾病的各种临床类型:轻、病例组应当包括所研究疾病的各种临床类型:轻、中、重型,早、中、晚期,典型的和不典型的,有中、重型,早、中、晚期,典型的和不典型的,有和没有并发症者,治疗过的与末治疗过的。和没有并发症者,治疗过
6、的与末治疗过的。非病例组应选自确实无该病的其他病例,并且还应非病例组应选自确实无该病的其他病例,并且还应该包括容易与该病产生混淆的其他疾病,这主要是该包括容易与该病产生混淆的其他疾病,这主要是为了考察诊断技术的临床鉴别诊断的能力。为了考察诊断技术的临床鉴别诊断的能力。ppun12式中n为所需样本量;u为正态分布中累积概率等于2/时的u值,例如960.105.0u或576.201.0u;为容许误差,一般取总体率%1100可信区间宽度的一半;p为所研究的新诊断技术的灵敏度(sensitivity,SN)和特异度(specificity,SP)的估计值。18l引自引自:李俊,胡永华李俊,胡永华.筛查
7、方法及评价的研究进展筛查方法及评价的研究进展流行病学进展流行病学进展第第1010卷卷lRelationship between Sample Size with Sensitivity19lp close to 50%lp80%20lNCSS-PASS Proportions21lNCSS-PASS ROC Curve金标准 病人 非病人 合计 阳性 真阳性 A 假阳性 B A+B 新诊断技术 阴性 C 假阴性 D 真阴性 C+D 合计 A+C B+D N 临床诊断试验研究的评价临床诊断试验研究的评价真实性:准确度(accuracy)和效度(validity)可靠性:Reliability可行
8、性:结果的整理l灵敏度灵敏度指病人组中经诊断试验查出阳性人数的比例(a/a+c);真阳性率病人组中经诊断试验查出阴性人数的比例(c/a+c)即为假阴性率,又称漏诊率;l假阴性率1灵敏度是 否阳性ab阴性cdl特异度特异度指非病人组中经诊断试验查出阴性人数的比例(d/b+d);真阴性率经诊断试验查出阳性人数的比例(b/b+d)即为假阳性率,又称误诊率;l假阳性率1特异度是 否阳性ab阴性cd表 1 缺铁性贫血的临床诊断试验结果 病人 非病人 合计 阳性 72 26 98 血清铁蛋白试验 阴性 9 150 159 合计 81 176 257 根据上述计算公式可得:%.%CAASN898810081
9、72100%.%DBDSP2385100176150100%.%CACFNR1111100819100%.%DBBFPR771410017626100 心肌梗死组 CK水平无心肌梗死组354800 84400 7400015360019320013 280118 240 119200121160030120530 80813 40 26 2 088230130911133129lSe=91/230=42%lSp=129/130=99%心肌梗死组 CK水平无心肌梗死组354800 84400 7400015360019320013 280118 240 119200121160030120530
10、 80813 40 26 2 0882301302151615114lSe=215/230=93%lSp=114/130=88%l当试验方法和阳性标准固定时,每个诊断试验的灵敏度和特异度是恒定的。l区分诊断试验正常和异常的临界点会影响灵敏度和特异度。l灵敏度高的试验适用于:灵敏度高的试验适用于:疾病漏诊可能会造成严重后果;有几个假设诊断,为排除某病的诊断;用于筛检无症状病人而该病的发病率又比较低,当试验结果呈阴性时,价值更大。l特异度高的试验适用于:特异度高的试验适用于:凡假阳性结果会导致病人精神和肉体上严重危害时;要肯定诊断时,当试验结果呈阳性时,价值更大。l受试者工作特性曲线(Receiv
11、er Operator Characteristic Curve,ROC曲线)ROC曲线是用真阳性率(灵敏度)和假阳性率(1-特异度)作图所得曲线;表示灵敏度和特异度之间的关系。假阳性率 真阳性率(灵敏度)假阳性率假阳性率真阳性率(灵敏度)lROC还可用于比较两种或两种以上诊断试验的价值似然比(Likelihood ratio,LR)l病人中出现某种检测结果的概率与非病人中出现相应结果的概率之比,说明病人出现该结果的机会是非病人的多少倍。阳性似然比(+LR):真阳性率和假阳性率之比阴性似然比(-LR):假阴性率和真阴性率之比l监护病房CK诊断心梗(CK80=CK-)心梗无心梗CK+215(93
12、.48%)16(12.31%)231+LR=7.6CK-15(6.52%)114(87.69%)129-LR=0.07Total230130360l比灵敏度和特异度更稳定,不受患病率的影响;l用于估计患病概率;l更科学地描述诊断试验。l计量资料用标准差异及变异系数来表示 CV=SD/Ml计数资料用观察符合率与Kappa值表示 Kappa值是排除了机遇一致率后的观察一致率l预测值:阳性预测值指诊断试验阳性结果中真正患病的比例(a/a+b)阴性预测值指诊断试验阴性结果中真正未患病的比例(d/c+d)l预测值反映的是临床诊断试验后患病与否的可能性(概率)验后概率或后验概率是否阳性ab阴性cd心肌梗死
13、组 CK水平无心肌梗死组354800 84400 740001536001932001391(42%)28011 +PV=99%18133240129(99%)1 -PV=48%19200121160030120530215(93%)80168 +PV=93%131540114(88%)26 -PV=88%2 088230130l灵敏度越高的试验,阴性预测值越高;l特异度越高的试验,阳性预测值越高;l患病率的高低对预测值的影响更大。l监护病房CK诊断心梗(CK80=CK-)心梗无心梗CK+215(93%)16231+PV=93%CK-15114(88%)129-PV=88%Total23013
14、0360Pre=64%l普通医院CK诊断心梗(CK80=CK-)心梗无心梗CK+215(93%)248463+PV=46%CK-151822(88%)1837-PV=99%Total23020702300Pre=10%l在患病率高的人群中使用l采用联合试验的方法项目组合?平行试验(并联):同时做几项,任何一个阳性即定为阳性,全阴平行试验(并联):同时做几项,任何一个阳性即定为阳性,全阴性方定为阴性。提高灵敏度和阴性预测值性方定为阴性。提高灵敏度和阴性预测值(漏诊减少,误诊增加漏诊减少,误诊增加)。系列试验系列试验(串联):(串联):同时做几项,全部试验阳性才定为阳性,其它同时做几项,全部试验阳
15、性才定为阳性,其它定为阴性。提高特异度和阳性预测值定为阴性。提高特异度和阳性预测值(误诊减少但漏诊增加误诊减少但漏诊增加)。41TEST 1(Blood Sugar)Sensitivity=70%Specificity=80%TEST 2(Glucose Tolerance Test)Sensitivity=90%Specificity=90%Net Sensitivity=315/500=63%Net Specificity=(7600+1710)/9500=98%并联试验:%.%SN269310089261382268%.%SP713510011240 触诊:%.%SN2220100892
16、268%.%SP11741001124021121 红外线扫描:%.%SN55591008913868%.%SP1865100112402193 X 线摄片:%.%SN158310089263828%.%SP5753100112401910 首先,将验前概率转化为验前比(pretest odds):验前概率验前概率验前比1 公式 5.15 其次,通过似然比计算验后比(posttest odds)。如果检查结果为阳性用阳性似然比,如果检查结果为阴性用阴性似然比。似然比验前比验后比 公式 5.16 最后,将验后比转化为验后概率:验后比验后比验后概率1 公式 5.17 l一位35岁无症状女性在健康检
17、查时发现心电图运动试验阳性(ST段压低1mm)。根据文献报道,3039岁年龄段无症状女性患冠心病的概率为0.3%,且心电图运动试验ST段压低1mm时的阳性似然比为5.9。问该患者患冠心病的可能性有多大?003.0003.01003.01验前概率验前概率验前比 018.09.5003.0似然比验前比验后比 018.0018.01018.01验后比验后比验后概率 l研究结果是否真实?研究结果是否真实?是否同参照标准进行独立的盲法比较研究人群是否包括临床上试验该试验的各种病人所评价的试验结果有没有影响参照标准检查的实施诊断试验的方法描述是否详细,能否重复l研究结果是什么?研究结果是什么?验前概率、似
18、然比、灵敏度、特异度l研究结果是否有助于我的病人研究结果是否有助于我的病人能否改变我对病人的治疗,最后给病人获益Citation:Are the results of this diagnostic study valid?Was there an independent,blind comparison with a reference(“gold”)standard of diagnosis?Was the diagnostic test evaluated in an appropriate spectrum of patients(like those in whom it would
19、 be used in practice)?Was the reference standard applied regardless of the diagnostic test result?Was the test(or cluster of tests)validated in a second,independent group of patients?Target disorder Present Absent Totals Positive a b a+b Diagnostic test result Negative c d c+d Totals a+c b+d a+b+c+d
20、 Target disorder(iron deficiency anemia)Present Absent Totals Positive(65 mmol/L)731 a 270 b 1001 a+b Diagnostic test result(serum ferritin)Negative (65 mmol/L)78 c 1500 d 1578 c+d Totals 809 a+c 1770 b+d 2579 a+b+c+d Sensitivity=a/(a+c)=731/809=90%Specificity=d/(b+d)=1500/1770=85%Likelihood ratio f
21、or a positive test result=LR+=sens/(1-spec)=90%/15%=6Likelihood ratio for a negative test result=LR-=(1-sens)/spec=10%/85%=0.12Positive Predictive Value=a/(a+b)=731/1001=73%Negative Predictive Value=d/(c+d)=1500/1578=95%Pre-test probability(prevalence)=(a+c)/(a+b+c+d)=809/2579=32%Pre-test odds=preva
22、lence/(1-prevalence)=31%/69%=0.45Post-test odds=pre-test odds LRPost-test probability=post-test odds/(post-test odds+1)Is the diagnostic test available,affordable,accurate,and precise in your setting?Can you generate a clinically sensible estimate of your patients pre-test probability(from personal
23、experience,prevalence statistics,practice databases,or primary studies)?Are the study patients similar to your own?Is it unlikely that the disease possibilities or probabilities have changed since the evidence was gathered?Will the resulting post-test probabilities affect your management and help yo
24、ur patient?Could it move you across a test-treatment threshold?Would your patient be a willing partner in carrying it out?Would the consequences of the test help your patient?地址:北京市海淀区学院路38号北京大学医学部 北京大学公共卫生学院518室 北京大学循证医学中心邮编:100083电话:86-10-8280 5162传真:86-10-8280 5162E-mail:siyan-Website:http:/ ThanksThanks