1、筛检和诊断试验的评价筛检和诊断试验的评价筛检和诊断试验的评价筛检和诊断试验的评价 对筛检和诊断试验的评价,除考虑方法本身对筛检和诊断试验的评价,除考虑方法本身的安全和操作上的简单、快速、方便及价格低廉的安全和操作上的简单、快速、方便及价格低廉等因素外,还要考虑试验的真实性、可靠性及收等因素外,还要考虑试验的真实性、可靠性及收益三个方面。益三个方面。真实性真实性可靠性可靠性收益收益 标准标准病理学标准病理学标准(组织活检和尸体解剖组织活检和尸体解剖)外科手术发现或特殊的影像诊断外科手术发现或特殊的影像诊断长期临床随访结果长期临床随访结果公认地综合临床诊断标准公认地综合临床诊断标准金标准是相对的,
2、选择应结合临床具体情金标准是相对的,选择应结合临床具体情况况评价筛检试验的指标评价筛检试验的四格表评价筛检试验的四格表 标准筛检试验 病例组 非病例组 合计阳性 a(真阳性)b(假阳性)a+b阴性 c(假阴性)d(真阴性)c+d合计a+c b+d a+b+c+d灵敏度=a/a+c100 阳性预测值=a/a+b 100特异度=d/b+d 100 阴性预测值=d/c+d 100准确度=a+d/a+b+c+d 100 患病率=a+c/a+b+c+d 100灵敏度指筛检方法能将实际有病的人正确地判为患者灵敏度指筛检方法能将实际有病的人正确地判为患者的能力的能力(a/a+c)(a/a+c)100100
3、;假阴性率,又称漏诊率是指筛检方法能将实际有病的假阴性率,又称漏诊率是指筛检方法能将实际有病的人错判为非患者的比例人错判为非患者的比例(c/a+c)(c/a+c)100100;。是是 否否阳性阳性ab阴性阴性cd真实性真实性特异度指筛检试验能将实际无病的人正确判为非患特异度指筛检试验能将实际无病的人正确判为非患者的比例者的比例(d/b+d)(d/b+d)100100 ;假阳性率,又称误诊率指筛检试验将实际无病的人假阳性率,又称误诊率指筛检试验将实际无病的人错判为患者的比例错判为患者的比例(b/b+d)(b/b+d)100100 ;假阳性率假阳性率1 1特异度。特异度。是是 否否阳性阳性ab阴性
4、阴性cd 某人应用酶联免疫吸附试验法(某人应用酶联免疫吸附试验法(ELISAELISA)检测血清中癌胚抗原(检测血清中癌胚抗原(CEACEA)以筛检结、直)以筛检结、直肠癌。应用该筛检试验对部分结、直肠癌病肠癌。应用该筛检试验对部分结、直肠癌病人和正常人血清中的人和正常人血清中的CEACEA进行检测,结果如进行检测,结果如下表。下表。结、直肠癌病人与正常人血清结、直肠癌病人与正常人血清CEACEA测定结果测定结果假阴性率假阴性率=1-Se=3/17=17.65%假阳性率假阳性率=1-Sp=2/101=1.98%阳性预测值阳性预测值=14/16=87.5阴性预测值阴性预测值=99/102=97.
5、06灵敏度和特异度的特点灵敏度和特异度的特点可靠性可靠性 指经筛检后能使多少原来未发现的病指经筛检后能使多少原来未发现的病人得到诊断和治疗。人得到诊断和治疗。评价指标:评价指标:阳性预测值阳性预测值阴性预测值阴性预测值筛检试验的收益筛检试验的收益预测值预测值 预测值的影响因素预测值的影响因素 肝细胞癌病人血清中小扁豆凝集素结合肝细胞癌病人血清中小扁豆凝集素结合型型1 1-抗胰蛋白酶(抗胰蛋白酶(LCA-LCA-1 1 AT AT)占总)占总 1 1 AT AT的百分率明显高于正常人。应用的百分率明显高于正常人。应用LCA-LCA-1 1 AT AT检测来筛检肝细胞癌时,确检测来筛检肝细胞癌时,
6、确定不同的筛检阳性标准将有不同的灵敏度和定不同的筛检阳性标准将有不同的灵敏度和特异度,两者关系如下表。特异度,两者关系如下表。不同诊断阳性标准条件下的灵敏度和特异度不同诊断阳性标准条件下的灵敏度和特异度 现某市工业区的肝癌现患率为现某市工业区的肝癌现患率为40/1040/10万,万,市效区为市效区为20/1020/10万。根据上述资料,若分别万。根据上述资料,若分别选用选用1616和和1919作为诊断阳性标准,分别在作为诊断阳性标准,分别在两区各筛检两区各筛检5050万人。请计算不同条件下(不万人。请计算不同条件下(不同阳性标准、不同现患率人群)的预期筛检同阳性标准、不同现患率人群)的预期筛检
7、结果和阳性预测值。结果和阳性预测值。阳性标准阳性标准1616时时PVPV(+):):Se=99.00,Sp=90.00Se=99.00,Sp=90.00工业区(工业区(P=40/10P=40/10万)万)肝癌病人肝癌病人 正常人正常人 合计合计+198 198 49980 50178 49980 50178-2 2 449820 449822 449820 449822 TotalTotal 200 200 499800 499800 50 50万万 PV+=PV+=0.390.39%市效区(市效区(P=20/10P=20/10万)万)肝癌病人肝癌病人 正常人正常人 合计合计+99 99 49
8、990 49990 50089 50089-1 1 449910 449911 449910 449911 TotalTotal 100 100 499900 499900 50 50万万 PV+=PV+=0.200.20%阳性标准阳性标准1919时时PVPV(+):):Se=95.00,Sp=99.00Se=95.00,Sp=99.00工业区(工业区(P=40/10P=40/10万)万)肝癌病人肝癌病人 正常人正常人合计合计+190 190 4998 5188 4998 5188-10 10 494802 494812 494802 494812 TotalTotal 200 200 499
9、800 4998005050万万 PV+=PV+=3.663.66%市效区(市效区(P=20/10P=20/10万)万)肝癌病人肝癌病人 正常人正常人 合计合计+95 95 4999 5094 4999 5094-5 5 494901 494906 494901 494906 TotalTotal 100 100 499900 499900 50 50万万 PV+=PV+=1.861.86%评价指标:金标准是相对的,选择应结合临床具体情况灵敏度=a/a+c100 阳性预测值=a/a+b 1002、并联试验(平行试验)阴性结果判断-只要有一项为“-”,即诊断为“-”。患病率灵敏度-2 44982
10、0 449822当试验方法确定后,试验的灵敏度和特异度就已固定。+95 4999 5094阳性结果判断-各项均为“+”时,即诊断为“+”;患病率灵敏度(1-患病率)(1特异度)评价指标:假阴性率,又称漏诊率是指筛检方法能将实际有病的人错判为非患者的比例(c/a+c)100;当临床医生面临着需要一种很敏感的试验,而手中只有两项或两项以上不太敏感的试验时,采用并联试验最合适。a)当假阳性及假阴性的重要性相等时,一般可把诊断标准定在灵敏度=特异度的分界限处;而实际上,正常人与病人的数值经常有重叠的现象。现某市工业区的肝癌现患率为40/10万,市效区为20/10万。当试验结果呈连续性数据时,区分正常与
11、异常的临界点的确定将会出现不同临界点下试验的灵敏度和特异度,如图所示:患病率:当患病率:当SeSe、SpSp不变时,不同患病率的不变时,不同患病率的人群中,预测值不同。患病率人群中,预测值不同。患病率低时低时,PVPV(+)下降下降;患病率;患病率高时高时,PVPV(+)上升上升。在患病率稳定时,在患病率稳定时,SeSe升高升高,PVPV(+)下降下降。在患病率稳定时,在患病率稳定时,SpSp升高升高,PVPV(+)上升上升。预测值的影响因素预测值的影响因素预测值的计算预测值的计算 患病率灵敏度患病率灵敏度患病率灵敏度患病率灵敏度(1-(1-患病率患病率)(1)(1特异度特异度)PV+=PV+
12、=(1-(1-患病率患病率)特异度特异度(1-(1-患病率患病率)特异度患病率特异度患病率(1(1灵敏度灵敏度)PV+=PV+=阳性预测值阳性预测值阴性预测值阴性预测值筛检和诊断试验的指标与标准筛检和诊断试验的指标与标准:试验的指标试验的指标血糖值血糖值 筛检指标确定之后,就应该确定一个阳筛检指标确定之后,就应该确定一个阳性标准(或界限)用以区别正常与异常(病性标准(或界限)用以区别正常与异常(病人或非病人)。人或非病人)。理想状态下,病人和非病人之间应有一理想状态下,病人和非病人之间应有一严格的界限,将病人与非病人完全区分开来。严格的界限,将病人与非病人完全区分开来。而实际上,正常人与病人的
13、数值经常有重叠而实际上,正常人与病人的数值经常有重叠的现象。见下图。的现象。见下图。筛检试验的判定标准筛检试验的判定标准若用正态曲线图表示:若用正态曲线图表示:无病有病 正常病人A BC返回返回 但实际上这种情况是很少见到的,而更多见到的却但实际上这种情况是很少见到的,而更多见到的却是正常人与病人分布处于相互重叠状态,只是程度不同是正常人与病人分布处于相互重叠状态,只是程度不同而已。当试验结果呈连续性数据时,区分正常与异常的而已。当试验结果呈连续性数据时,区分正常与异常的临界点的确定将会出现不同临界点下试验的灵敏度和特临界点的确定将会出现不同临界点下试验的灵敏度和特异度,异度,如图所示如图所示
14、:A:灵敏度最高:灵敏度最高=100,漏诊率,漏诊率=0,误诊率最高。,误诊率最高。B:特异度最高:特异度最高=100,误诊率,误诊率=0,漏诊率最高。,漏诊率最高。C:灵敏度:灵敏度=特异度,漏诊率特异度,漏诊率=误诊率误诊率=50 在临床诊断过程中,我们究竟应将诊断标在临床诊断过程中,我们究竟应将诊断标准定在何处较理想呢?这需要依据疾病本身的准定在何处较理想呢?这需要依据疾病本身的特点及诊断的目的来加以确定。通常确定诊断特点及诊断的目的来加以确定。通常确定诊断界限需依据以下界限需依据以下原则:原则:a)当假阳性及假阴性的重要性相等时,一般可当假阳性及假阴性的重要性相等时,一般可把诊断标准定
15、在把诊断标准定在灵敏度灵敏度=特异度特异度的分界限处;的分界限处;b)b)当漏诊可能导致严重后果,或当有几个诊断假设时,当漏诊可能导致严重后果,或当有几个诊断假设时,为排除某病的诊断或用于筛检无症状病人而该病的发为排除某病的诊断或用于筛检无症状病人而该病的发病率又较低时,此时应选择灵敏度高的诊断标准;病率又较低时,此时应选择灵敏度高的诊断标准;标标准左移,准左移,此时特异度下降,假阳性率上升,导致筛检此时特异度下降,假阳性率上升,导致筛检成本高;成本高;无病无病有病有病 正常正常病人病人A BCc)c)对于治疗效果不理想,进一步确诊和治疗费用较昂对于治疗效果不理想,进一步确诊和治疗费用较昂贵,
16、易导致对病人精神及肉体上的严重危害或为了用贵,易导致对病人精神及肉体上的严重危害或为了用于肯定诊断时,此时应选择特异度高的诊断标准。于肯定诊断时,此时应选择特异度高的诊断标准。标标准右移,准右移,其代价是灵敏度下降,假阴性率上升,漏诊其代价是灵敏度下降,假阴性率上升,漏诊率上升。率上升。无病无病有病有病 正常正常病人病人A BC(parallel test)parallel test)提高筛检试验质量的方法提高筛检试验质量的方法l 阳性结果判断阳性结果判断-各项均为各项均为“+”“+”时,即诊断为时,即诊断为“+”“+”;l 阴性结果判断阴性结果判断-只要有一只要有一项为项为“-”“-”,即诊
17、断为,即诊断为“-”“-”。阴性预测值=99/102=97.Se高,Sp就降低,同样的,Sp高,Se就降低假阴性率1灵敏度。患病率灵敏度(1-患病率)(1特异度)筛检指标确定之后,就应该确定一个阳性标准(或界限)用以区别正常与异常(病人或非病人)。应用该筛检试验对部分结、直肠癌病人和正常人血清中的CEA进行检测,结果如下表。患病率低时,PV(+)下降;1、串联试验(系列试验)当试验方法确定后,试验的灵敏度和特异度就已固定。由此可见,并联联合试验提高诊断试验灵敏度和阴性预测值,但同时降低了特异度及阳性预测值,漏诊率下降,假阳性上升,误诊率上升。阴性预测值=99/102=97.由此可见,串联联合试
18、验提高了诊断试验由此可见,串联联合试验提高了诊断试验的特异度和阳性预测值,但同时降低了灵敏的特异度和阳性预测值,但同时降低了灵敏度和阴性预测值,也就是说串联试验降低了度和阴性预测值,也就是说串联试验降低了假阳性率,即误诊率,但漏诊会随之上升。假阳性率,即误诊率,但漏诊会随之上升。所以,当临床医师所用的各项单项试验的特所以,当临床医师所用的各项单项试验的特异度均不高时,采用异度均不高时,采用 串联试验最合适,该种串联试验最合适,该种方法临床上主要用于慢性病的诊断方法临床上主要用于慢性病的诊断.当病人急需确诊,或是某种试验较昂贵当病人急需确诊,或是某种试验较昂贵或有创伤具有危险性,多先使用简单、安
19、或有创伤具有危险性,多先使用简单、安全的试验,认为有可疑时,再进一步做昂全的试验,认为有可疑时,再进一步做昂贵或有创伤的试验,一般先需做特异度高贵或有创伤的试验,一般先需做特异度高的单项试验,后做特异度低的单项试验,的单项试验,后做特异度低的单项试验,这样,可使接受两种试验的病例数减少,这样,可使接受两种试验的病例数减少,减少工作量。减少工作量。阳性结果判断阳性结果判断-只要有一项只要有一项为为“+”“+”时就判断为时就判断为“+”“+”。阴性结果判断阴性结果判断-所有均所有均为为“-”“-”时,就判断为时,就判断为“-”“-”。由此可见,并联联合试验提高诊断试验由此可见,并联联合试验提高诊断
20、试验灵敏度和阴性预测值,但同时降低了特异度灵敏度和阴性预测值,但同时降低了特异度及阳性预测值,漏诊率下降,假阳性上升,及阳性预测值,漏诊率下降,假阳性上升,误诊率上升。当临床医生面临着需要一种很误诊率上升。当临床医生面临着需要一种很敏感的试验,而手中只有两项或两项以上不敏感的试验,而手中只有两项或两项以上不太敏感的试验时,采用并联试验最合适。太敏感的试验时,采用并联试验最合适。当试验方法确定后,试验的灵敏度和特异当试验方法确定后,试验的灵敏度和特异度就已固定。此时,选择患病率高的人群进行度就已固定。此时,选择患病率高的人群进行筛检,是提高效率的有效手段。选择患病率高筛检,是提高效率的有效手段。选择患病率高的人群,一方面可使新发现的病例数增加;另的人群,一方面可使新发现的病例数增加;另一方面可使阳性预测值升高,试验成本下降,一方面可使阳性预测值升高,试验成本下降,其结果使试验的效率提高。其结果使试验的效率提高。