1、教学目标与要求教学目标与要求v掌握:诊断试验、金标准的概念;诊断试验结果与患病掌握:诊断试验、金标准的概念;诊断试验结果与患病情况的关系;参考范围、临界值与医学决定水平的概念;情况的关系;参考范围、临界值与医学决定水平的概念;诊断试验的准确性、有效性和可靠性评价的常见指标;诊断试验的准确性、有效性和可靠性评价的常见指标;曲线的概念、制作与应用。曲线的概念、制作与应用。v熟悉:参考范围的建立;参考范围概念的正确使用。熟悉:参考范围的建立;参考范围概念的正确使用。v了解:医学决定水平的制定;诊断试验样本含量的估计;了解:医学决定水平的制定;诊断试验样本含量的估计;曲线下面积的计算。曲线下面积的计算
2、。1临床诊断试验临床诊断试验():临床上用于确定或排除疾病的方:临床上用于确定或排除疾病的方法或项目。法或项目。临床生物化学诊断试验:临床生物化学实验室中用于临床生物化学诊断试验:临床生物化学实验室中用于疾病筛查、诊断和监测的方法或项目。疾病筛查、诊断和监测的方法或项目。诊断试验的诊断性能评价:方法或项目与疾病之间的诊断试验的诊断性能评价:方法或项目与疾病之间的关系,评价该方法或项目对某种疾病的诊断价值。关系,评价该方法或项目对某种疾病的诊断价值。临临 床床 诊诊 断断 试试 验验2第一节参考范围第一节参考范围 一、参考范围的建立一、参考范围的建立3v1参考个体参考个体按预定标准选择的正常个体
3、。按预定标准选择的正常个体。v 纳入标准:地区、民族、性别、年龄段等;纳入标准:地区、民族、性别、年龄段等;v 排除标准:不能有血压不正常、器质性疾病、乙肝阳性、排除标准:不能有血压不正常、器质性疾病、乙肝阳性、近期的急性感染、输血或手术、用药、妊娠或哺乳等。近期的急性感染、输血或手术、用药、妊娠或哺乳等。v2参考总体参考总体所有参考个体的集合。所有参考个体的集合。v3参考抽样组参考抽样组参考总体的抽样,又称参考样本。参考总体的抽样,又称参考样本。v4参考值参考值每一个参考个体的检测值。每一个参考个体的检测值。v5参考值范围参考值范围各个参考值剔除离群值并补充数据后的各个参考值剔除离群值并补充
4、数据后的集合范围。集合范围。(一)基本概念(一)基本概念 4v6参考值区间参考值区间包含包含95的参考总体的参考值范围。的参考总体的参考值范围。v双侧正态(均数法):双侧正态(均数法):1.96s,即(,即(1.96s)(1.96s);双侧偏态(百分位数法):);双侧偏态(百分位数法):2.5位数位数(P2.5)的参考限)的参考限97.5位数(位数(P2.5)的参考限。)的参考限。v单侧正态:单侧正态:1.65s以下或以下或 1.65s以上;单侧偏态:以上;单侧偏态:P5的参考以下或的参考以下或P95的参考限以上。的参考限以上。v 参考范围参考范围xxxxx5 标准标准 参考个体(按预定标准选
5、择的参考个体(按预定标准选择的个体)个体)组成组成 参考人群(包括尽可能多的参参考人群(包括尽可能多的参考个体)考个体)选出选出 参考组参考组 测定测定 参考值参考值 分析分析 分布特征(正态、偏态)分布特征(正态、偏态)统计统计 参考值限度参考值限度 指定指定 参考范围(参考值区间)参考范围(参考值区间)(二)参考值和参考范围制定步骤(二)参考值和参考范围制定步骤6(三)建立参考值注意事项(三)建立参考值注意事项正确选择受检对象正确选择受检对象具有代表性。具有代表性。合理规定参考人群的条件,如年龄、性别、民族,以及标合理规定参考人群的条件,如年龄、性别、民族,以及标本采集的时间和地区因素等。
6、本采集的时间和地区因素等。保证一定数量的受检人数,一般应有保证一定数量的受检人数,一般应有100100例以上,若分布呈例以上,若分布呈偏态时应在偏态时应在120120例以上,特殊情况至少也应例以上,特殊情况至少也应3030例以上。例以上。测定方法标准化,保证结果的可靠性和可比性。测定方法标准化,保证结果的可靠性和可比性。根据专业知识确定单、双侧位界,严格按照统计要求进行根据专业知识确定单、双侧位界,严格按照统计要求进行测定结果的处理。测定结果的处理。7二、参考范围的引用(可移植性)二、参考范围的引用(可移植性)群体参考范围可来于文献报告群体参考范围可来于文献报告(注意:仪器厂商与商品试剂盒提供
7、的参考范(注意:仪器厂商与商品试剂盒提供的参考范围不可轻易引用)围不可轻易引用)引进一种新方法,应该首先进行小样本量的参引进一种新方法,应该首先进行小样本量的参考值调查,如果结果与文献或厂家提供的数据考值调查,如果结果与文献或厂家提供的数据相一致,就可以不再调查,否则应做进一步的相一致,就可以不再调查,否则应做进一步的调查,确定本实验室的参考范围。调查,确定本实验室的参考范围。8三、在临床应用中应注意的问题三、在临床应用中应注意的问题参考范围的使用有一定的范围,仅适合于符合参考范围的使用有一定的范围,仅适合于符合参考个体要求的参考人群。参考个体要求的参考人群。参考范围仅覆盖研究人群的参考范围仅
8、覆盖研究人群的95%95%,因此,参考,因此,参考值范围不能盲目地作为正常与疾病的分界点。值范围不能盲目地作为正常与疾病的分界点。综合评估。注意年龄、性别、饮食、药物、个综合评估。注意年龄、性别、饮食、药物、个人习惯和体力锻炼等因素的影响。人习惯和体力锻炼等因素的影响。检测方法与参考范围或参考值的关系。检测方法与参考范围或参考值的关系。9 临界值(临界值():划分诊断试验结果正常与异常划分诊断试验结果正常与异常的界值。的界值。又称阈值、分界值、鉴别值、指定值、诊又称阈值、分界值、鉴别值、指定值、诊断界值、截断点等。断界值、截断点等。一、临界值一、临界值 第二节临界值与医学决定水平第二节临界值与
9、医学决定水平 10:医学决定水平,:医学决定水平,D:临界值:临界值正常人和病人分布曲线正常人和病人分布曲线 临界值的选择临界值的选择11医学决定水平(医学决定水平(,):临床上按照不同病情给予不同处理的,):临床上按照不同病情给予不同处理的指标阈值。指标阈值。用或表示,用来排除或确定某一临床情况或预告将会出现某用或表示,用来排除或确定某一临床情况或预告将会出现某一生理变化现象。一生理变化现象。二、医学决定水平二、医学决定水平 12A、正常人参考范围、正常人参考范围B、无关疾病患者的参考范围、无关疾病患者的参考范围 C、有关疾病患者分型、分期的测定值、有关疾病患者分型、分期的测定值D、文献资料
10、及医生意见、文献资料及医生意见(一)医学决定水平的制定依据(一)医学决定水平的制定依据 13血清指标(单位)血清指标(单位)参考范围参考范围*()()3.75.33.05.87.5()()138146115135150()()9810990112总总()()2.252.651.752.753.38()()2.99.321018()6213350140530()()0.150.410.120.470.63()()3.906.502.46.5010.4()()0.221.980.222.04.4()()3.305.232.486.610.0()1.720.52540350()()355020355
11、2()()6080456080()成人()成人40150 儿童儿童5035050135400()()5302060300()()8302060300()()10120602001500()()100320200450800()()11033090225370()()530154515014不同指标的数量、数值不同不同指标的数量、数值不同:A低、高低、高B低、低、高低、低、高C低、高、高低、高、高 不同实验室的水平值也略有不同。不同实验室的水平值也略有不同。(二)医学决定水平的水平值模式(二)医学决定水平的水平值模式15“低、高低、高”模式模式血清氯参考范围:血清氯参考范围:98109;有二个:
12、有二个:90、112。90时,应加做其他检查以确诊或排除:严重呕吐、时,应加做其他检查以确诊或排除:严重呕吐、腹泻等胃肠道丢失。长期限制氯化钠的摄入。代谢性腹泻等胃肠道丢失。长期限制氯化钠的摄入。代谢性碱中毒。艾迪生病。碱中毒。艾迪生病。112时,应加做其他检查以确诊或排除:高氯血症时,应加做其他检查以确诊或排除:高氯血症性代谢性酸中毒。氯化物摄入过多。高钠血症:失水性代谢性酸中毒。氯化物摄入过多。高钠血症:失水大于失盐,氯化物相对浓度增高。大于失盐,氯化物相对浓度增高。医学决定水平的临床应用举例医学决定水平的临床应用举例 16“低、低、高低、低、高”模式模式血清清蛋白()参考范围:血清清蛋白
13、()参考范围:3550,有三个:有三个:20、35、52。20表示肝病患者的预后严重;表示肝病患者的预后严重;35为检查低清蛋白血症的界值;为检查低清蛋白血症的界值;52则稍高于参考范围上限,可排除许多假阳性。则稍高于参考范围上限,可排除许多假阳性。医学决定水平的临床应用举例医学决定水平的临床应用举例 17“低、高、高低、高、高”模式模式血清总钙参考范围:血清总钙参考范围:2.252.65,有三个:有三个:1.75、2.75、3.38。1.75时,应加做其他检查以明确病人发生低时,应加做其他检查以明确病人发生低血钙抽搐的可能性,并采取预防措施;血钙抽搐的可能性,并采取预防措施;2.75 时,应
14、加做其他检查以确诊或排除原时,应加做其他检查以确诊或排除原发性副甲亢的诊断;发性副甲亢的诊断;3.38时,考虑为高血钙昏迷,应及时做出诊时,考虑为高血钙昏迷,应及时做出诊断,不得延误。断,不得延误。医学决定水平的临床应用举例医学决定水平的临床应用举例 18金标准(金标准():当前为临床医学界公认的诊断某种疾病):当前为临床医学界公认的诊断某种疾病最可靠的诊断方法,可通过活检、尸检、外科手术、随访最可靠的诊断方法,可通过活检、尸检、外科手术、随访等所作出的决定性诊断,又称确诊试验。等所作出的决定性诊断,又称确诊试验。诊断肿瘤的金标准一般是病理学检查,诊断肿瘤的金标准一般是病理学检查,诊断冠心病的
15、金标准是冠状动脉造影,诊断冠心病的金标准是冠状动脉造影,诊断肾炎的金标准是肾活检,诊断肾炎的金标准是肾活检,诊断胆结石的金标准是手术所见,诊断胆结石的金标准是手术所见,诊断心肌病的金标准是心肌活检等。诊断心肌病的金标准是心肌活检等。第三节诊断试验的指标与评价第三节诊断试验的指标与评价 金标准金标准有一些疾病目前尚无金标准,由专业学术委员会或世有一些疾病目前尚无金标准,由专业学术委员会或世界卫生组织()制定的诊断标准。界卫生组织()制定的诊断标准。参考标准参考标准19类风湿关节炎患者类风湿关节炎患者血清血清6、与性激素水平的变化、与性激素水平的变化20 确立金标准后,再与诊断试验同步盲法测确立金
16、标准后,再与诊断试验同步盲法测量研究对象。量研究对象。据金标准将研究对象划分为据金标准将研究对象划分为“有某病有某病”、“无某病无某病”,据诊断试验的临界值将其划分为,据诊断试验的临界值将其划分为“阳性阳性”、“阴性阴性”结果,然后整理出相应的四结果,然后整理出相应的四格表计算准确性、有效性等评价指标。格表计算准确性、有效性等评价指标。研究程序研究程序21诊断试验诊断试验结果结果金标准诊断金标准诊断有某病(病例组)有某病(病例组)无某病(对照组)无某病(对照组)阳性阳性 (a)(b)阴性阴性 (c)(d)诊断试验的四格表诊断试验的四格表 真阳性(真阳性(,):金标准确诊为有某病且诊断试验检出为
17、阳性的例,):金标准确诊为有某病且诊断试验检出为阳性的例数。数。假阳性(假阳性(,):金标准确诊为无某病且诊断试验检出为阳性的例,):金标准确诊为无某病且诊断试验检出为阳性的例数。数。真阴性(真阴性(,):金标准确诊为无某病且诊断试验检出为阴性的例,):金标准确诊为无某病且诊断试验检出为阴性的例数。数。假阴性(假阴性(,):金标准确诊为有某病且诊断试验检出为阴性的例,):金标准确诊为有某病且诊断试验检出为阴性的例数。数。22例例 诊断性能指标计算诊断性能指标计算已知用金标准确定原发性肝癌病人已知用金标准确定原发性肝癌病人6060名,非名,非原发性肝癌原发性肝癌400400名;血清以名;血清以3
18、030为判断值,为判断值,共检测出共检测出6565人为原发性肝癌,其中有人为原发性肝癌,其中有8 8人为假人为假阳性。阳性。计算诊断敏感度、诊断特异度、漏诊率、误计算诊断敏感度、诊断特异度、漏诊率、误诊率、阳性拟然比、阴性似然比。诊率、阳性拟然比、阴性似然比。231.准确性评价指标:又称为真实性评价指标,包准确性评价指标:又称为真实性评价指标,包括如灵敏度、特异度和准确度等。括如灵敏度、特异度和准确度等。2.有效性评价指标:包括预测值、流行率和似然有效性评价指标:包括预测值、流行率和似然比等。比等。3.可靠性评价指标:重复进行试验得到相同结果可靠性评价指标:重复进行试验得到相同结果的稳定程度,
19、包括变异系数、符合率等。的稳定程度,包括变异系数、符合率等。一、诊断试验的指标一、诊断试验的指标241.灵敏度与漏诊率灵敏度与漏诊率 2.特异度与误诊率特异度与误诊率 3.准确度准确度(一)诊断试验的准确性评价指标(一)诊断试验的准确性评价指标4正确指数正确指数 又称尤登指数(又称尤登指数(,),)115指数指数 又称为总一致性指数,公式为:又称为总一致性指数,公式为:)dc)(ca()db)(ba()bcad(2251.灵敏度灵敏度灵敏度(,)又称敏感性、真阳性率(灵敏度(,)又称敏感性、真阳性率(,)。,)。在患病者中,应用该诊断试验检查得到阳性结果的在患病者中,应用该诊断试验检查得到阳性
20、结果的百分比。百分比。真阳性真阳性灵敏度灵敏度100%真阳性假阴性真阳性假阴性灵敏度灵敏度=反映诊断试验正确地识别患病者的能力反映诊断试验正确地识别患病者的能力,该值愈大愈好。该值愈大愈好。%100理论阳性数实际检出阳性数%100%100caaFNTPTP26理想试验的诊断敏感度为理想试验的诊断敏感度为100%100%。敏感度高的诊断试验,用于敏感度高的诊断试验,用于 普查或定期健康体验,能筛选某一普查或定期健康体验,能筛选某一疾病。以防漏诊。疾病。以防漏诊。拟诊为某种疾病时,可起到排除某拟诊为某种疾病时,可起到排除某一诊断或早期确诊。一诊断或早期确诊。272.特异度特异度特异度(特异度(,)
21、又称特异性、真阴性率()又称特异性、真阴性率(,)。,)。在非某病者中,应用该试验获得阴性结果的百分比。在非某病者中,应用该试验获得阴性结果的百分比。真阴性真阴性特异度特异度100%假阳性真阴性假阳性真阴性 反映诊断试验正确地鉴别非患者的能力,该值愈大愈好。反映诊断试验正确地鉴别非患者的能力,该值愈大愈好。诊断特异度诊断特异度=%100数全部受检的未患病者总实际检出结果为阴性数%100100dbdTNFPTN28理想试验的诊断特异度为理想试验的诊断特异度为100%100%。特异度高的诊断试验对临床某些疾病的特异度高的诊断试验对临床某些疾病的确诊有很大帮助,以防误诊。确诊有很大帮助,以防误诊。2
22、93.漏诊率和误诊率漏诊率和误诊率漏诊率(漏诊率(),又称假阴性率(),又称假阴性率(,),)反映将患者诊断错误的概率,该值愈小愈好。反映将患者诊断错误的概率,该值愈小愈好。与灵敏度互补的指标,漏诊率(与灵敏度互补的指标,漏诊率()1误诊率(误诊率(),又称假阳性率(),又称假阳性率(,),)反映将非患者诊断错误的概率,该值愈小愈好。反映将非患者诊断错误的概率,该值愈小愈好。与特异度互补的指标,误诊率(与特异度互补的指标,误诊率()1304.诊断一致性指标反映诊断试验结果与患某病情况的一致反映诊断试验结果与患某病情况的一致性程度。性程度。主要指标主要指标诊断准确度诊断准确度指数指数31(1)诊
23、断准确度(,)诊断准确度(,)又称总符合率、诊断效率(又称总符合率、诊断效率():在患病和非患病者中,用诊断试验能准确划分患者和在患病和非患病者中,用诊断试验能准确划分患者和非患病者的百分比。非患病者的百分比。真阳性真阴性真阳性真阴性诊断准确度诊断准确度 100%真阳性假阳性真阴性假阴性真阳性假阳性真阴性假阴性 反映诊断试验正确诊断患者与非患者的能力。反映诊断试验正确诊断患者与非患者的能力。32(2)指数)指数又称为一致性,比较稳定,不易受发病率的影响。又称为一致性,比较稳定,不易受发病率的影响。2()指数指数 (ab)(bd)(ac)(cb)其值于其值于01之间变动,其值愈大,诊断试验与金之
24、间变动,其值愈大,诊断试验与金标准的一致性愈好。一般在标准的一致性愈好。一般在0.75以上时被认为具以上时被认为具有高度的一致性。有高度的一致性。33(3)正确指数)正确指数又称尤登指数(又称尤登指数(,),)表示诊断试验发现真正的患某病和非患某病者表示诊断试验发现真正的患某病和非患某病者的总能力的总能力。11其值于其值于01之间变动,其值愈大,诊断试验的之间变动,其值愈大,诊断试验的真实性愈好。真实性愈好。34诊断试验结诊断试验结果果金标准诊断金标准诊断总计总计指标指标有某病有某病(病例组)(病例组)无某病无某病(对照组)(对照组)阳性阳性(a)(b)()阳性预测值阳性预测值()=阴性阴性(
25、c)(d)()阴性预测值阴性预测值()=总计总计 ()()()准确度()准确度()指标指标灵敏度灵敏度()特异度特异度()流行率(流行率(P)=漏诊率假漏诊率假阴性率阴性率1灵敏度灵敏度误诊率假误诊率假阳性率阳性率1 特异度特异度%100 FNTPTP%100TNFPTN%100P FTPTP%100NNN FTT%100FNTNFPTPTNTP%100TNFPFNTPFNTP诊断试验结果与常见评价指标诊断试验结果与常见评价指标 351.预测值预测值2.流行率流行率3.似然比似然比(二)诊断试验的有效性评价指标(二)诊断试验的有效性评价指标36临床诊断与诊断概率诊断试验与疾病诊断诊断试验与疾病
26、诊断诊断试验的任务是为临床医师对疾病的诊断提供证据。诊断试验的任务是为临床医师对疾病的诊断提供证据。诊断试验的结果不等于诊断。诊断试验的结果不等于诊断。验前概率和验后概率验前概率和验后概率临床医师对就诊者可能患何种病的初步印象的量化指标,称为临床医师对就诊者可能患何种病的初步印象的量化指标,称为验前概率(验前概率()。)。结合诊断试验的结果,得出就诊者患病可能性大小的估计称之结合诊断试验的结果,得出就诊者患病可能性大小的估计称之为验后概率(为验后概率(),也称为预测值。),也称为预测值。371.预测值预测值(预测值(,):也称预告值,诊断试验预示金标准,):也称预告值,诊断试验预示金标准结果的
27、程度如何结果的程度如何。包括阳性预测值和阴性预测值,分别表示诊断试验包括阳性预测值和阴性预测值,分别表示诊断试验结果确定或排除某种疾病存在与否的诊断概率。结果确定或排除某种疾病存在与否的诊断概率。预测值受流行率的影响。预测值受流行率的影响。38(1)阳性预测值)阳性预测值(,或,或)阳性预测值(患病的试验后可能性):在诊断阳性预测值(患病的试验后可能性):在诊断试验结果为阳性的人数中,真正患病者所占的试验结果为阳性的人数中,真正患病者所占的百分率,即试验结果阳性者属于真病例的概率。百分率,即试验结果阳性者属于真病例的概率。真阳性真阳性阳性预测值阳性预测值100%真阳性假阳性真阳性假阳性39(2
28、)阴性预测值)阴性预测值(,或,或)阴性预测值:在诊断试验结果为阴性的人中,非患病者阴性预测值:在诊断试验结果为阴性的人中,非患病者所占的百分率,即试验结果阴性者属于非病例的概率。所占的百分率,即试验结果阴性者属于非病例的概率。也叫非患病的试验后可能性。也叫非患病的试验后可能性。真阴性真阴性阴性预测值阴性预测值100%真阴性假阴性真阴性假阴性402.流行率(,流行率(,P)表示在受检对象的总人数中,真正患病者所占的百分率,表示在受检对象的总人数中,真正患病者所占的百分率,也叫患病的试验前可能性或患病率。也叫患病的试验前可能性或患病率。真阳性假阴性真阳性假阴性流行率流行率 100%真阳性假阳性真
29、阴性假阴性真阳性假阳性真阴性假阴性 41流行率的特性流行率的特性可从流行病学调查资料查知,也可以是临床医师在可从流行病学调查资料查知,也可以是临床医师在长期的医疗实践中,对门诊就诊者患某病的比例的长期的医疗实践中,对门诊就诊者患某病的比例的经验认识。经验认识。由于不同的地区、不同级别的医院、普通医院和专由于不同的地区、不同级别的医院、普通医院和专科医院,其就诊者的组成差别可能很大,同样的疾科医院,其就诊者的组成差别可能很大,同样的疾病在不同的医院的流行率也不同。病在不同的医院的流行率也不同。临床医师必须根据具体情况确定流行率,才能得出临床医师必须根据具体情况确定流行率,才能得出较为准确的阳性预
30、测值。较为准确的阳性预测值。42流行率对阳性预测值的影响流行率对阳性预测值的影响 流行率流行率(%)阳性预测值(阳性预测值(%)敏感度敏感度=95%=95%特异度特异度=95%=95%敏感度敏感度=99%=99%特异度特异度=99%=99%0.10.11.91.99.09.01.01.016.116.150.050.02.02.027.927.966.966.95.05.050.050.083.983.950.050.095.095.099.099.0433.似然比 验后概率较之验前概率的符合程度和变化方向的特验后概率较之验前概率的符合程度和变化方向的特性量化指标称为似然比(性量化指标称为似然
31、比(,)。,)。似然比又称拟然比,包括阳性似然比和阴性似然比。似然比又称拟然比,包括阳性似然比和阴性似然比。拟然比性质稳定,不因流行率的改变而改变。拟然比性质稳定,不因流行率的改变而改变。44(1)阳性似然比)阳性似然比(,或(),或()阳性似然比:用诊断试验检测患病人群的阳性率与非患阳性似然比:用诊断试验检测患病人群的阳性率与非患病人群的阳性率之间的比值,即真阳性率与假阳性率之病人群的阳性率之间的比值,即真阳性率与假阳性率之比。比。可用以描述诊断试验阳性时,患病与不患病的机会比。可用以描述诊断试验阳性时,患病与不患病的机会比。灵敏度灵敏度 真阳性率真阳性率阳性似然比阳性似然比 1特异度特异度
32、 假阳性率假阳性率 45(2)阴性似然比)阴性似然比(,或(),或()阴性似然比:用诊断试验检测患病人群中的阴性率与阴性似然比:用诊断试验检测患病人群中的阴性率与非患病人群的阴性率之间的比值,即假阴性率与真阴非患病人群的阴性率之间的比值,即假阴性率与真阴性率之比。性率之比。可用以描述诊断试验阴性时,患病与不患病的机会比。可用以描述诊断试验阴性时,患病与不患病的机会比。1灵敏度灵敏度 假阴性率假阴性率阴性似然比阴性似然比 特异度特异度 真阴性率真阴性率 46似然比直接判断一个诊断试验好坏似然比直接判断一个诊断试验好坏()1.0,当试验结果为阳性时,试验提示患病可能性增高能当试验结果为阳性时,试验
33、提示患病可能性增高能力的一种度量。力的一种度量。()2.0-5.0,认为该试验不太好;认为该试验不太好;()10.0,认为是好的。,认为是好的。()1.0,当试验结果为阴性时,试验提示患病可能性降低能当试验结果为阴性时,试验提示患病可能性降低能力的一种度量。力的一种度量。()0.50.2,认为该试验不太好,认为该试验不太好,()0.1,可认为是好的试验。,可认为是好的试验。47可靠性(),又称重复性()、精密度():可靠性(),又称重复性()、精密度():诊断诊断试验在完全相同的条件下进行重复试验得到相同结果的稳定试验在完全相同的条件下进行重复试验得到相同结果的稳定程度。程度。1.变异系数或标
34、准差变异系数或标准差2.符合率两名操作者同时对比检测,列四格表计算。符符合率两名操作者同时对比检测,列四格表计算。符合率愈高,试验的可靠性愈好合率愈高,试验的可靠性愈好。符合率符合率 dcbada(三)诊断试验的可靠性评价指标(三)诊断试验的可靠性评价指标481.变异系数和标准差变异系数和标准差评价计量资料精密度的指标。评价计量资料精密度的指标。变异系数有利于相互比较。变异系数有利于相互比较。测定值均数的标准差测定值均数的标准差变异系数变异系数 100%测定值均数测定值均数492.总符合率总符合率评价计数资料可靠性的指标。评价计数资料可靠性的指标。方法方法用同一诊断试验方法对同一批受检对象进用
35、同一诊断试验方法对同一批受检对象进行重复检测,将检测结果列四格表,然后行重复检测,将检测结果列四格表,然后用上述公式计算总复合率、指数等指标,用上述公式计算总复合率、指数等指标,进行可靠性评估。进行可靠性评估。总符合率愈高,试验的可靠性愈好。总符合率愈高,试验的可靠性愈好。503.影响可靠性的因素影响可靠性的因素生物学变异生物学变异包括研究对象的个体内变异和个体间的变异。包括研究对象的个体内变异和个体间的变异。观察者的变异观察者的变异由观察者对测定结果判断的不一致所致的差由观察者对测定结果判断的不一致所致的差异。异。同一观察者内的变异(如不同时间、条件时)同一观察者内的变异(如不同时间、条件时
36、)和不同观察者之间的变异。和不同观察者之间的变异。试验方法差异试验方法差异包括仪器、药品和试剂、以及条件等因素引包括仪器、药品和试剂、以及条件等因素引起的变异。起的变异。511.金标准应有可靠性金标准应有可靠性2.研究对象应有代表性与可比性研究对象应有代表性与可比性3.样本含量应足够样本含量应足够4.诊断指标与方法应标准、具体、可靠诊断指标与方法应标准、具体、可靠5.金标准与诊断试验应同步盲法测量金标准与诊断试验应同步盲法测量6.临界值的选择应合理临界值的选择应合理7.诊断试验应具有临床实用性诊断试验应具有临床实用性 二、评价诊断试验的要点二、评价诊断试验的要点521.金标准一般都是由专业学术
37、委员会或制定,包括若干金标准一般都是由专业学术委员会或制定,包括若干条款。但在一些疾病没有金标准时其所制定的诊断标准可作条款。但在一些疾病没有金标准时其所制定的诊断标准可作为参考标准。为参考标准。2.实际诊断时金标准的测试结果是不是可靠。在使用金标实际诊断时金标准的测试结果是不是可靠。在使用金标准时必须按其条款进行,确保测试结果的可靠性,避免产生准时必须按其条款进行,确保测试结果的可靠性,避免产生偏倚。偏倚。(一)金标准应有可靠性(一)金标准应有可靠性53 受试者分为病例组和对照组。均应按照按性别、受试者分为病例组和对照组。均应按照按性别、年龄、身高、生理期、职业、地域等分层抽样,并年龄、身高
38、、生理期、职业、地域等分层抽样,并且:且:1.病例组:应包括各型病例,如典型和不典型病病例组:应包括各型病例,如典型和不典型病例,轻、中、重型病例,早、中、晚期病例,有、例,轻、中、重型病例,早、中、晚期病例,有、无并发症病例,经过治疗与未经过治疗的病例。病无并发症病例,经过治疗与未经过治疗的病例。病例组的来源:包括一般人群、特殊人群、普通门诊例组的来源:包括一般人群、特殊人群、普通门诊或专科门诊。或专科门诊。2.对照组:包括健康人和有其他疾病的患者,特对照组:包括健康人和有其他疾病的患者,特别是要有容易被混淆而需要鉴别的其他疾病病例。别是要有容易被混淆而需要鉴别的其他疾病病例。(二)研究对象
39、应有代表性与可比性(二)研究对象应有代表性与可比性54 样本含量样本含量n的计算公式:的计算公式:总体率的估计值总体率的估计值P:灵敏度或特异度。当:灵敏度或特异度。当P为灵敏为灵敏度时,度时,n为病例组例数;当为病例组例数;当P为特异度时,为特异度时,n为对照组为对照组例数。例数。为允许误差(样本率总体率),常取总体率为允许误差(样本率总体率),常取总体率可信区间间距的一半。可信区间间距的一半。为第一类错误(应该接受但被拒绝因而误诊或为第一类错误(应该接受但被拒绝因而误诊或“弃真弃真”)的概率)的概率 是对应可信度为是对应可信度为1的正态离差(正态分布的的正态离差(正态分布的面积),查面积)
40、,查u值表,有单侧与双侧之分,一般值表,有单侧与双侧之分,一般取值取值0.05,单侧,单侧 1.64,双侧,双侧 1.96。(三)样本含量应足够(三)样本含量应足够 22)1(nPPuuuu55例:测定血清肌酸激酶()的阳性结果(例:测定血清肌酸激酶()的阳性结果(200)诊断急性心肌梗死(),据初步试验资料,其灵敏度诊断急性心肌梗死(),据初步试验资料,其灵敏度为为 0.9,特异度为,特异度为0.85,设定,设定为为0.05,为为0.08,试估,试估计所需样本含量。计所需样本含量。已知已知P1=0.9,P2=0.85,双侧,双侧1.96,0.08,按样本含量计算公式:按样本含量计算公式:因此
41、,该诊断试验需要病人因此,该诊断试验需要病人54例,无的对照组例,无的对照组77例。例。样本含量举例样本含量举例 u54)08.0()9.01)(9.0()96.1(n22177)08.0()85.01)(85.0()96.1(n22256v1.三类诊断指标要标准、具体:主观指标:如研究对象三类诊断指标要标准、具体:主观指标:如研究对象的主诉;半主观指标(或半客观指标):如观察者看到的的主诉;半主观指标(或半客观指标):如观察者看到的体征;客观指标:如用仪器测量的数据。体征;客观指标:如用仪器测量的数据。v2.诊断方法应标准、可靠:如方法与材料的详细描述,受诊断方法应标准、可靠:如方法与材料的
42、详细描述,受试者是否需要限制饮食、禁用某药、试验前后的注意事项、试者是否需要限制饮食、禁用某药、试验前后的注意事项、有无副反应等,都要有具体的标准。有无副反应等,都要有具体的标准。v同一操作者、其他医疗单位在相同条件下进行重复试验同一操作者、其他医疗单位在相同条件下进行重复试验时结果都应相同,使诊断试验具有可靠性。时结果都应相同,使诊断试验具有可靠性。(四)诊断指标与方法应标准、具体、可靠(四)诊断指标与方法应标准、具体、可靠 57金标准与待评价诊断方法进行同步盲法测量比金标准与待评价诊断方法进行同步盲法测量比较。较。盲法:试验操作者不知道谁有某病,谁无某盲法:试验操作者不知道谁有某病,谁无某
43、病;病;医生也不知道谁的结果阳性,谁的结医生也不知道谁的结果阳性,谁的结果阴性。果阴性。同步:同时间、同地区、同人群。同步:同时间、同地区、同人群。(五)金标准与诊断试验应同步盲法测量(五)金标准与诊断试验应同步盲法测量 58 按受试者工作特征曲线的构建程序,一般先取按受试者工作特征曲线的构建程序,一般先取多个临界值,计算评价指标如灵敏度或特异度等,多个临界值,计算评价指标如灵敏度或特异度等,再进行比较,选取假阴性和假阳性最少时的值确定再进行比较,选取假阴性和假阳性最少时的值确定为合理的临界值。为合理的临界值。(六)临界值的选择应合理(六)临界值的选择应合理 59实用性:该试验需用何种仪器、试
44、剂,是否实用性:该试验需用何种仪器、试剂,是否安全、方便、费用低廉,病人能否接受,对病人安全、方便、费用低廉,病人能否接受,对病人有无损害、有无毒副作用等。有无损害、有无毒副作用等。(七)诊断试验应具有临床实用性(七)诊断试验应具有临床实用性 601.选择高患病率的人群来提高阳性预告值选择高患病率的人群来提高阳性预告值 公式:当诊断方法的敏感度与特异度不变时,阳性预告公式:当诊断方法的敏感度与特异度不变时,阳性预告值随患病率(患病率、验前概率)的升高而变大。值随患病率(患病率、验前概率)的升高而变大。2.利用联合试验来提高诊断灵敏度或特异度利用联合试验来提高诊断灵敏度或特异度 联合试验:联合试
45、验:平行试验可提高诊断灵敏度平行试验可提高诊断灵敏度,但降低了特异度,但降低了特异度;系列试验可提高诊断特异度,但降低了灵敏度。系列试验可提高诊断特异度,但降低了灵敏度。三、提高临床诊断效率的方法三、提高临床诊断效率的方法 61平行试验与系列试验的区别平行试验与系列试验的区别 诊断试验诊断试验试验试验A试验试验B平行试平行试验验系列试系列试验验模式模式1模式模式2模式模式3模式模式462第四节受试者工作特征曲线第四节受试者工作特征曲线一、基本概念一、基本概念 以灵敏度为纵坐以灵敏度为纵坐标、(标、(1特异度)为特异度)为横坐标,将相对应的横坐标,将相对应的各临界值连接起来的各临界值连接起来的折
46、线图,称为受试者折线图,称为受试者工作特征曲线工作特征曲线(,曲,曲线线),简称受试者工作,简称受试者工作曲线。曲线。63 二、的构建二、的构建根据金标准诊断结果将诊断试验数据分段、设定各临界值、划分四格表,再计算各临界值下的真阳性率、假阳性率,最后绘制曲线,计算曲线下面积(,)。64 例例1果糖胺()诊断糖尿病()。收集无糖尿果糖胺()诊断糖尿病()。收集无糖尿病血清病血清55例、有糖尿病血清例、有糖尿病血清74例,测定含量。选取例,测定含量。选取4个截断点(个截断点(1.30、1.50、1.70、1.90将检测值分成将检测值分成5个个部分:部分:正常(正常(1.30)、)、大致正常大致正常
47、1.30,1.50)、)、可疑可疑1.50,1.70)、)、大致异常大致异常1.70,1.90)和)和异常(异常(1.90),评估患糖尿病的可能性。),评估患糖尿病的可能性。试做曲线,计算与标准误()。试做曲线,计算与标准误()。曲线举例曲线举例 65果糖胺在果糖胺在4个临界值时的分类评价指标个临界值时的分类评价指标 结果()结果()1.301.50 1.701.90 糖尿病糖尿病无糖无糖尿病尿病糖尿病糖尿病无糖无糖尿病尿病糖尿糖尿病病无糖无糖尿病尿病糖尿糖尿病病无糖无糖尿病尿病阳性阳性73287110601440阴性阴性12734514543055灵敏度灵敏度()特异度特异度()1特异度特异
48、度0.98650.49090.5091(71/74)=0.9595(45/55)=0.81820.18180.81080.98180.01820.59461066 以真阳性率以真阳性率(灵敏度)为纵(灵敏度)为纵坐标、假阳性率坐标、假阳性率(1特异度)为特异度)为横坐标,将相对横坐标,将相对应的各临界值应的各临界值(截断点)连接(截断点)连接起来得到曲线。起来得到曲线。曲线的绘制曲线的绘制 67与标准误()的计算与标准误()的计算68的取值范围的取值范围的理论取值范围在的理论取值范围在1.0和和0.5之间。之间。在在0.5的情况下,越接近于的情况下,越接近于1,说明诊断效果越好。,说明诊断效果
49、越好。在在0.50.7时有较低准确性,在时有较低准确性,在0.70.9时有一定时有一定准确性,在准确性,在0.9以上时有较高准确性。以上时有较高准确性。0.5时,说明诊断方法完全不起作用,无诊断价值。时,说明诊断方法完全不起作用,无诊断价值。69的判断的判断 判断标准:在判断标准:在0.9以上时有较高准确性。以上时有较高准确性。本例本例 95的置信区间为:的置信区间为:1.960.96361.960.01470.9348,0.9924该区间大于该区间大于0.9,表明果糖胺对糖尿病的诊断价,表明果糖胺对糖尿病的诊断价值较高。值较高。70500名收入冠心病监护室的病人,在入院当天抽血作检查,名收入
50、冠心病监护室的病人,在入院当天抽血作检查,结果分布见下表。医生在不知道结果的情况下,根据心电图结结果分布见下表。医生在不知道结果的情况下,根据心电图结果和临床报告,确诊果和临床报告,确诊300名病人患心肌梗死,其它名病人患心肌梗死,其它200名无心肌名无心肌梗死。梗死。活性()活性()10179180359360539540719720899900有心梗(人)有心梗(人)419851005735无心梗(人)无心梗(人)1443415520结果分布表结果分布表 曲线举例曲线举例 271试问:试问:从定性上观察,活性与心肌梗死有何关系?从定性上观察,活性与心肌梗死有何关系?从表中可以选定从表中可以