1、研究生课程研究生课程临床科研设计临床科研设计张 焜 和南昌大学第一附属医院江西省消化疾病研究所临床科研设计诊断1主讲内容主讲内容第一讲 临床研究概述第二讲 临床研究设计第三讲 临床研究质控第四讲 诊断研究第五讲 治疗研究第六讲 病因研究第七讲 预后研究临床科研设计诊断2主讲内容主讲内容第一讲 临床研究概述第二讲 临床研究设计第三讲 临床研究质控第四讲 诊断研究第五讲 治疗研究第六讲 病因研究第七讲 预后研究临床科研设计诊断3诊断研究的重要性诊断研究的重要性 诊断研究:建立诊断新方法,评价现有诊断方法 是正确认识诊断试验临床价值的基础 如:CEA初期认为结肠癌特异,后证实并非如此 是临床上正确选
2、择诊断试验的依据 诊断疾病:排除用高灵敏试验,肯定用高特异试验 判断轻重:既能判有无,又能判轻重 筛查疾病:灵敏而特异,且简单易行 判断疗效:易重复对比 随访疾病:重复性好,即精密度高 估计预后:与预后密切相关临床科研设计诊断463篇论文没有回答好一个问题篇论文没有回答好一个问题临床科研设计诊断5诊断试验研究设计模式诊断试验研究设计模式研究对象研究对象试验组(有病)试验组(有病)对照组(无病)对照组(无病)诊断金标准诊断金标准诊断试验诊断试验诊断试验诊断试验有病有病无病无病无病无病有病有病临床科研设计诊断6诊断研究:研究对象诊断研究:研究对象 病例组应具代表性,包括该病的各种临床状态:轻、中、
3、重型 早、中、晚期 典型与非典型 治疗与未治疗 并发病有或无 对照组应确无该病的其他病例,且包括易与该病混淆的疾病 研究对象应为同期连续样本,或随机抽样,不能由研究者随意选择临床科研设计诊断7诊断研究:诊断金标准诊断研究:诊断金标准 选择当前公认的最可靠的诊断方法为参照标准 病理诊断(组织学、尸检)手术诊断 公认的临床诊断标准(如急性风湿热的Jones标准)诊治指南(共识意见)临床随访得出的肯定诊断 不同的研究应选不同的标准,如肿瘤应选病理 诊断金标准选择不当,将分组错误导致错分偏倚临床科研设计诊断8诊断研究:样本估算诊断研究:样本估算要达到有统计学意义的最小样本,按公式计算 n:所需样本大小
4、 ua:正态分布中累积概率为a/2的值(u0.05=1.96):允许误差,一般定在0.050.10 p:灵敏度(计算病例组样本)或特异度(计算对照组样本)22)1(ppuna临床科研设计诊断9诊断研究:进行试验诊断研究:进行试验 获取诊断试验相关的定量或定性数据 盲法判定结果:要求判定试验结果者不知道研究对象被金标准判分为“有病”或“无病”可以减少人为的主观偏差,保证结果的真实性 如不使用盲法,在遇到可疑结果时,“有病”者可能判为阳性,“无病”者可能判为阴性临床科研设计诊断10正常参考值的确定正常参考值的确定1、均数加减标准差法 凡超出平均值加减2个标准差范围者为异常 要求数据为正态分布,分布
5、两侧的2.5%为异常2、百分位数法 取95%的测定值为正常范围:2.5%97.5%、5%100%、095%不要求数据正态分布,但误差较大,样本应 120例3、ROC曲线法 绘制ROC曲线确定最佳临界值临床科研设计诊断11诊断试验:评价指标诊断试验:评价指标根据试验结果列出四格表,计算诊断试验评价指标灵敏度=a/(a+c);特异度=d/(b+d);准确度=(a+d)/N;阳性预测值=a/(a+b);阴性预测值=d/(c+d);患病率=(a+c)/N;阳性似然比=a/(a+c)/b/(b+d);阴性似然比=c/(a+c)/d/(b+d)标准诊断方法合计病例组对照组诊断试验a (真阳性)b (假阳性
6、)a+bc (假阴性)d (真阴性)c+d合计a+cb+dN临床科研设计诊断12诊断试验评价指标的意义诊断试验评价指标的意义 诊断试验真实性的评价指标 灵敏度(Sensitivity)特异度(Specificity)预测值(Predictive value)似然比(Likelihood ratio)诊断试验精确性的评价指标 标准差(Standard deviation)变异系数(Coefficient of variability)观察符合率与卡帕值(Kappa)临床科研设计诊断13评价指标的意义:灵敏度评价指标的意义:灵敏度 诊断试验在病例组的阳性率(真阳性率)漏诊率=假阴性率=1 灵敏度
7、越灵敏的试验漏诊越少 高灵敏度试验适用于:漏诊可能造成严重后果者 为了排除某项诊断(阴性结果时)筛选无症状的早期病人临床科研设计诊断14评价指标的意义:特异度评价指标的意义:特异度 诊断试验在对照组的阴性率(真阴性率)误诊率=假阳性率=1 特异度 越特异的试验误诊越少 高特异度试验适用于:误诊会导致患者精神或肉体严重损害时 为了肯定某项诊断(阳性结果时)临床科研设计诊断15灵敏度和特异度的关系灵敏度和特异度的关系 理想的诊断试验:灵敏度和特异度均100%灵敏度100%:一个不漏(不漏诊一个病人)特异度100%:一个不错(不误诊一个病人)实际的诊断试验:灵敏度和特异度反向变化dcabC2C1C3
8、0 AFP(实际)肝癌非肝癌C1肝癌非肝癌0 AFP(理想)临床科研设计诊断16不同阳性界值时的灵敏度和特异度不同阳性界值时的灵敏度和特异度不同CPK水平为阳性界值时诊断心梗的灵敏度和特异度不同CPK水平的临界点=280 IU=80 IU=40 IU=1 IU心梗非心梗心梗非心梗心梗非心梗心梗非心梗97121516228422301301331291511428800a/(a+c)=42%a/(a+c)=93%a/(a+c)=99%a/(a+c)=100%d/(b+d)=99%d/(b+d)=88%d/(b+d)=68%d/(b+d)=0%临床科研设计诊断17选择最佳阳性界值:选择最佳阳性界值
9、:ROC曲线曲线受试者工作特性曲线(ROC曲线)(Receiver operator characteristic curve)真阳性率和假阳性率作图所得的曲线 表示灵敏度和特异度的关系 最佳阳性界值:最靠近左上角的一点 假阴性和假阳性之和最小 准确度最高 错判最少临床科研设计诊断18CPK受试者工作特性曲线受试者工作特性曲线1.00.90.80.70.60.50.40.30.20.101.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.10灵敏度特异度临床科研设计诊断19ROC曲线对诊断试验的评估价值曲线对诊断试验的评估价值 ROC曲线是一种全面、准确评价诊断试验的非
10、常有效方法,可用来比较两种或两种以上的诊断试验的诊断效率:直观法 曲线下面积(Area under curve,AUC)AUC与诊断准确度高低 高:0.90-1.00=excellent(A)中:0.80-0.89=good(B);0.70-0.79=fair(C)低:0.60-0.69=poor(D);0.50-0.59=fail(E)临床科研设计诊断20ROC曲线评价诊断试验曲线评价诊断试验A Ar re ea a U Un nd de er r t th he e C Cu ur rv ve e.801.039.000.724.877.594.050.072.496.691Test Re
11、sult Variable(s)DBILTBILAreaStd.ErroraAsymptoticSig.bLower BoundUpper BoundAsymptotic 95%ConfidenceIntervalThe test result variable(s):DBIL,TBIL has at least one tie between the positive actual state groupand the negative actual state group.Statistics may be biased.Under the nonparametric assumption
12、a.Null hypothesis:true area=0.5b.AUCDBIL:0.801TBIL:0.594DBILTBIL临床科研设计诊断21ROC曲线评价诊断试验曲线评价诊断试验CUT OFF POINTS9.65(0.787,0.769)临床科研设计诊断22评价指标的意义:预测值评价指标的意义:预测值 阳性预测值(Positive predictive value):阳性结果时患病的概率 阴性预测值(Negative predictive value):阴性结果时无病的概率 灵敏度越高,阴性预测值越高 特异度越高,阳性预测值越高 患病率对预测值的影响比灵敏度和特异度更明显临床科研设计
13、诊断23患病率对预测值的影响患病率对预测值的影响 酸性磷酸酶诊断前列腺癌的灵敏度70%,特异度90%,在不同人群的阳性预测值差别很大一般人群(发病率1/10万):0.4%75岁以上男性(发病率500/10万):5.6%有前列腺结节者(发病率50 000/10万):93.0%一项诊断试验临床应用满意,用于普查就不满意高特异度试验(高阳性预测值)用于低发病人群,将有大量假阳性高灵敏度试验(高阴性预测值)用于高发病人群,将有大量假阴性临床科研设计诊断24评价指标的意义:似然比评价指标的意义:似然比 阳性似然比:病例组阳性率(真阳性率)与对照组阳性率(假阳性率)之比 公式:a/(a+c)/b/(b+d
14、)含义:阳性结果时判对是判错的多少倍 阴性似然比:病例组阴性率(假阴性率)与对照组阴性率(真阴性率)之比 公式:c/(a+c)/d/(b+d)含义:阴性结果时判错是判对的多少倍临床科研设计诊断25似然比的价值与特点似然比的价值与特点 同时反映灵敏度和特异度的复合指标 非常稳定,不受患病率的影响 连续数据可分段计算似然比,避免简单的定为阳性或阴性 应用时需将似然比转换成率 可用于计算某一个体患者患病的可能性 工作中要选择阳性似然比高的诊断试验临床科研设计诊断26似然比的应用举例似然比的应用举例 某女性患者,45岁,因典型的心绞痛样胸痛就诊,问患冠心病的可能性有多大?查文献得知,45岁女性的冠心患
15、病率为1%;典型心绞痛来自冠心病的似然比为100 验前比=验前概率/(1-验前概率)=0.01/(1-0.01)=0.01 验后比=验前比似然比=0.01 100=1 验后概率=验后比/(1+验后比)=1/(1+1)=50%患者因提供了典型心绞痛病史后,患冠心的概率从1%上升到50%临床科研设计诊断27似然比的应用举例似然比的应用举例 该患者接着做心电图运动试验,ST段压低2.2 mm,问患冠心病的可能性又有多大?查文献得知,ST段压低2.2 mm 的似然比为 11 验前比=验前概率/(1-验前概率)=0.5/(1-0.5)=1 验后比=验前比似然比=1 11=11 验后概率=验后比/(1+验
16、后比)=11/(1+11)=91%患者做心电图运动试验后,患冠心的概率从50%升到91%临床科研设计诊断28似然比的应用步骤似然比的应用步骤 从文献中找出某一症状、体征、诊断试验或联合检测的似然比,并确定其可行性 从文献查阅或估计病人的验前概率(患病的可能性,即患病率)依次按公式计算验前比验后比验后概率 前一个诊断试验的验后概率是后一个诊断试验的验前概率 重复上述过程,直到最后一个诊断试验的验后概率,即为病人患该病的最后概率临床科研设计诊断29似然比的应用举例似然比的应用举例18岁女性,病史及血常规示缺铁性贫血的可能性为20%,测血清铁蛋白为40g/L。患缺铁性贫血的可能性多少?以12g/L临
17、界点,诊断缺铁性贫血为灵敏度为65%,特异度为99%阴性似然比=(1-灵敏度)/特异度)=0.35/0.99=0.35验前概率=20%,验前比=20/80=0.25验后比=验前比似然比=0.25 0.35=0.0875验后概率=验后比/(1+验后比)=0.875/1.875=8%按血清铁蛋白分段计算似然比,3544g/L段似然比为 2,最后计算验后概率为 33%临床科研设计诊断30精确性评价指标:精确性评价指标:Kappa值值 观察一致率(po):如甲乙两个医生阅读100张胸片,诊断结果有多少是一致的。机遇一致率(pc):其中甲医生不读片,采用掷钱币的方法确定胸片的诊断,也有部分诊断与乙医生相
18、符。非机遇一致率:100%机遇一致率(%)实际一致率:观察一致率机遇一致率 Kappa值:实际一致率/非机遇一致率临床科研设计诊断31Kappa值计算举例值计算举例甲医生肺门淋巴结核正常乙医生肺门淋巴结核46(a)10(b)56 (r1)正常12 (c)32 (d)44(r2)58 (c1)42(c2)100(N)观察一致率(po)(a+d)/N=(46+32)/100=78%机遇一致率(pc)(r1c1/N)+(c2r2/N)/N=51%非机遇一致率100%机遇一致率=100%-51%=49%实际一致率观察一致率机遇一致率=78%-51%=27%Kappa值实际一致率/非机遇一致率=27%/
19、49%=0.55甲乙两医生阅读同样100张胸片的诊断结果及其一致性分析临床科研设计诊断32Kappa值与一致性强度值与一致性强度Kappa值一致性强度1完全一致-1完全不一致0等于机遇一致率0好于机遇一致率,越大越好0.75一致性相当满意临床科研设计诊断33如何提高诊断试验的效率如何提高诊断试验的效率 选择高危人群应用诊断试验 患病率越高,阳性预测值越高 采用联合检测试验 平行试验(Parallel tests):同时做几项诊断试验,只要一项阳性即判为阳性,均为阴性才判为阴性 系列试验(Serial tests):同时做几项诊断试验,均为阳性判为阳性,否则为阴性临床科研设计诊断34平行联合检测
20、试验平行联合检测试验 可提高诊断的灵敏度 适用于下列情况:急需作出诊断:如急诊、外地门诊病人现有单项检测灵敏度都不高需要降低漏诊率需要排除某项诊断(无一阳性)会降低特异度,可能增加假阳性率临床科研设计诊断35系列联合检测试验系列联合检测试验 可提高诊断的特异度 适用于下列情况:需要增加诊断的正确性现有的单项检测特异度都不高需要降低误诊率需要肯定某项诊断(都是阳性)会降低灵敏度,可能增加假阴性率临床科研设计诊断36诊断试验中常见的偏倚诊断试验中常见的偏倚 工作偏倚(work-up bias):对试验呈阳性结果的病人才进一步用金标准加以确诊,而阴性结果的病人不再作进一步检查。例如:评价心导管检查诊
21、断心脏病的价值:偏倚:门诊病人1030例有阳性症状体征168例心导管检查:灵敏度74%,特异度84%合理:门诊病人1030例心导管检查:灵敏度53%,特异度93%19901993年世界主要期刊有关诊断试验的论文有38%的研究有这种偏倚临床科研设计诊断37诊断试验中常见的偏倚诊断试验中常见的偏倚 无对照偏倚:只以病人为研究对象,没有非病人群的信息。例如:偏倚:腰背痛患者MRI 多有腰椎间盘突出腰背痛主要由腰椎间盘突出引起 无偏倚:再做98例无腰背痛者MRI 腰椎间盘突出略少于腰背痛者,无统计学差异否认腰背痛主要由腰椎间盘突出引起临床科研设计诊断38诊断试验中常见的偏倚诊断试验中常见的偏倚 不明结
22、果引起的偏倚:结果不明确或呈中间状态者,资料分析时将它们剔除 19901993年世界主要期刊中约62%的诊断性研究有此偏倚 审阅测量偏倚:评判试验结果者事先已知道金标准的诊断结果,非盲法 19901993年世界主要期刊中约53%的诊断性研究有此偏倚临床科研设计诊断39诊断试验中常见的偏倚诊断试验中常见的偏倚 实验室测量偏倚:实验室检测缺乏质控、没有重复测定、没有仪器校正信息 19901993年世界主要期刊中约53%的诊断性研究有此偏倚 参考试验偏倚:选择金标准不妥造成的偏倚 例如:B超诊断胆石症试验的参考试验 口服胆囊造影()胆囊手术诊断()临床科研设计诊断40临床上诊断试验的选用原则临床上诊断试验的选用原则 综合考虑试验的各个方面进行选择 诊断效力、安全性、费用、可行性、结果重复性、简便易行性、是否兼有多方面功能 高似然比的试验诊断效力高 验前概率(患病率)十分低时,选择价廉、简便、无创、危险性小的诊断试验 验前概率高的疾病,有创、费高、复杂试验也可选用 试验结果不影响对病人的处理时,不做该试验临床科研设计诊断41临床科研设计诊断42临床科研设计诊断43临床科研设计诊断44临床科研设计诊断45临床科研设计诊断46确保数据准确无误确保数据准确无误18/42=42.9%10/36=27.8%5/40=12.5%18/42=42.9%临床科研设计诊断47