1、循证医学中常用的统计学方法循证医学中常用的统计学方法 主讲老师主讲老师:陈青山:陈青山 医学院医学院 流行病学教研室流行病学教研室临床研究的数据资料,主要集中于临床研究的数据资料,主要集中于PICO类类指标的测量,如指标的测量,如研究对象特征指标(研究对象特征指标(population/patients,P)干预测量指标干预测量指标(intervention,简写,简写I)对照(对照(companson,C)结果(局)指标结果(局)指标(outcome,O)等等构成统计学分析与效果评价的物质基础构成统计学分析与效果评价的物质基础临床研究的临床研究的“创证创证”到循证医学的临床到循证医学的临床“
2、用证用证”涉及统计方法的正确应用、以及对涉及统计方法的正确应用、以及对研究结果真实可靠的评价。研究结果真实可靠的评价。实践循证医学实践循证医学除了应具有除了应具有临床专业知识临床专业知识、经验经验和和技能技能之外,之外,还应具备还应具备分析和评价临床研究证据分析和评价临床研究证据所需的所需的医学医学统计学知识和技能统计学知识和技能。1 临床证据的数据资料类型临床证据的数据资料类型 一、分类变量资料一、分类变量资料(categorical variable)先将观察单位按某种属性或类别分成相互独立的若干组,再清点先将观察单位按某种属性或类别分成相互独立的若干组,再清点各组观察单位个数所得到的资料
3、。各组观察单位个数所得到的资料。二、数值变量资料二、数值变量资料 用测量或其它定量方法对每个观察单位的某项指标进行测定所得用测量或其它定量方法对每个观察单位的某项指标进行测定所得到的一组数值,一般带有度量衡单位。到的一组数值,一般带有度量衡单位。三、等级资料(三、等级资料(ranked data)又称半定量资料)又称半定量资料将观察单位按某种属性或某个特征的等级顺序分组,将观察单位按某种属性或某个特征的等级顺序分组,然后清点各组观察单位的个数得来的资料。然后清点各组观察单位的个数得来的资料。统计资料的几种类型1证据资料的方法学质量评价证据资料的方法学质量评价 一、单个研究证据的质量评价一、单个
4、研究证据的质量评价(一)判断资料的完整性(一)判断资料的完整性资料的完整性是指纳入分析的研究对象资料的完整性是指纳入分析的研究对象数量以及重要指标数应前后保持一致,数量以及重要指标数应前后保持一致,不能遗漏或选择。不能遗漏或选择。丢失率丢失率=(入组例数(入组例数终末例数)入组例数终末例数)入组例数100%F丢失率20%时,表明资料质量较差设计阶段设置的重要结局指标与最终纳入分析设计阶段设置的重要结局指标与最终纳入分析的指标,两者是否一致,不能任意删减的指标,两者是否一致,不能任意删减(二)组间的基线资料是否可比(二)组间的基线资料是否可比除研究因素外,组间基线资料应尽量做到组间除研究因素外,
5、组间基线资料应尽量做到组间均衡。均衡。试验和对照两组的重要临床基线资料应该相对试验和对照两组的重要临床基线资料应该相对一致。一致。F如例数、性别和年龄构成、病情严重程度、病程的组间差异无统计学意义。(三)重复性检验(三)重复性检验医生的诊断水平医生的诊断水平FKappa值值0.7及以上,质佳及以上,质佳。实验室的操作条件、试剂是否标准?应用试剂实验室的操作条件、试剂是否标准?应用试剂的批内及批间差异度?在容许范围内吗?的批内及批间差异度?在容许范围内吗?F批内差异度=1一第二次测量值第一次测量值F批间差异度=1一第二批测量值第一批测量值这两类差异度均应控制在这两类差异度均应控制在5%以内。以内
6、。(四)缺失值分析及其处理(四)缺失值分析及其处理缺失值是指因种种原因不能得到观测指标缺失值是指因种种原因不能得到观测指标的具体测量值。的具体测量值。随机性缺失,即缺失值的出现与组别、干预措随机性缺失,即缺失值的出现与组别、干预措施等无关,随机产生、无固定规律。施等无关,随机产生、无固定规律。F缺失比例不要超过缺失比例不要超过l0%。非随机性缺失,有规律可循,集中出现或非随机性缺失,有规律可循,集中出现或个体出现。个体出现。假如,药物的毒副反应过大,造成病人的大量失访,直接表现在试验组与对照组的缺失比例不同,影响结果。与组别、干预措施等有关,与组别、干预措施等有关,在设计阶段应考虑好相应处置措
7、施。在设计阶段应考虑好相应处置措施。对于小样本影响尤为明显。对于小样本影响尤为明显。1分类变量资料的数据缺失及处理分类变量资料的数据缺失及处理一般通过一般通过敏感性分析敏感性分析,观察结果的稳健性,观察结果的稳健性,继以考察缺失值对结果的影响程度。,继以考察缺失值对结果的影响程度。例如,试验组和对照组各丢失了例如,试验组和对照组各丢失了10例,把试验例,把试验组丢失的组丢失的10例当作例当作“无效病例无效病例”,对照组丢失,对照组丢失的的10例当作例当作“有效病例有效病例”,再作差别比较,再作差别比较,F两组率差有临床及统计学意义,则结果可靠;F若结论相反,结果对缺失值敏感,应审慎解释。还可作
8、还可作意向性分析意向性分析。2数值变量资料的数据缺失及处理数值变量资料的数据缺失及处理数值变量资料表达以均数数值变量资料表达以均数标准差表示。标准差表示。95%可信区间的间隔小、精度高,则意味着数可信区间的间隔小、精度高,则意味着数值资料可靠性高,结果较为可信;值资料可靠性高,结果较为可信;反之则精度差,考虑原始数据反之则精度差,考虑原始数据“丢失丢失”过多或过多或样本数量较少所致。样本数量较少所致。随机性缺失值小于随机性缺失值小于10%,缺失值可用平均,缺失值可用平均值替代。值替代。(五)样本量的分析(五)样本量的分析应进行样本量估算,不是越大越好。重点应进行样本量估算,不是越大越好。重点考
9、察最小效应量以及考察最小效应量以及、型错误的水平型错误的水平如在一个临床治疗性试验中如在一个临床治疗性试验中新药组假设有效率为新药组假设有效率为80%,而对照组的疗效为,而对照组的疗效为60%,则试验组比对照组临床效果好,则试验组比对照组临床效果好20%,型错误率(型错误率()0.05,型错误率(型错误率()0.2,表明样本量不足,表明样本量不足,扩大样本再试,扩大样本再试是必要的。是必要的。相反,若样本量很大时,即使是组间差相反,若样本量很大时,即使是组间差异很小,有可能出现异很小,有可能出现P0.05或更大时,或更大时,需借助需借助95%CI进行综合判断进行综合判断。(三)有关统计学假设检
10、验方法的正确抉择(三)有关统计学假设检验方法的正确抉择表 数值变量资料比较的常用假设检验方法表 分类变量资料比较的常见假设检验方法 (四)多因素分析及相关要求(四)多因素分析及相关要求多因素分析方法中,需要事先定义应变量多因素分析方法中,需要事先定义应变量和自变量,构建一般表达方式为:和自变量,构建一般表达方式为:其中其中y为应变量,常为结局指标为应变量,常为结局指标 PXXXXY321多因素分析应注意样本量是否足够,通常多因素分析应注意样本量是否足够,通常要求要求样本量应为纳入分析的自变量个数的样本量应为纳入分析的自变量个数的510倍倍;注意相关自变量的赋值与注意相关自变量的赋值与标准化问题
11、标准化问题。分类变量及数值变量都可作为自变量纳入分类变量及数值变量都可作为自变量纳入,分析前按要求转换为标准数据,分析前按要求转换为标准数据,建立相应的数据库。建立相应的数据库。1.多元线性回归分析多元线性回归分析多元线性回归分析用回归方程定量地刻画一多元线性回归分析用回归方程定量地刻画一个数值变量的应变量个数值变量的应变量(Y)与多个自变量间线与多个自变量间线性依存关系的大小与方向。性依存关系的大小与方向。用 表示。为方程的常数项,也称截距,Y的基线水平量。为偏回归系数。eXXXXYPP33221100p,321多元线性回归的条件:多元线性回归的条件:应变量(结果变量)要求是数值变量应变量(
12、结果变量)要求是数值变量资料,且满足随机性与独立性,自变量资料,且满足随机性与独立性,自变量可以是数值变量资料、分类变量资料、可以是数值变量资料、分类变量资料、等级资料;等级资料;应变量与自变量间具有线性关系;应变量与自变量间具有线性关系;残差残差e e服从正态分布等。服从正态分布等。2.logistic回归模型回归模型logistic回归模型是研究分类变量结果与一回归模型是研究分类变量结果与一些影响因素之间的一种多元(变量)统计些影响因素之间的一种多元(变量)统计方法。方法。logistic回归模型特点:回归模型特点:为结果变量为分类变量资料,自变量可为结果变量为分类变量资料,自变量可log
13、istic回归模型为分类变量,也可以是连续回归模型为分类变量,也可以是连续性变量。性变量。logistic回归模型常用于:回归模型常用于:控制一个或多个混杂因素时,探讨某控制一个或多个混杂因素时,探讨某个事件的发生与研究因素的关系;个事件的发生与研究因素的关系;探讨各种影响因素间的交互作用;探讨各种影响因素间的交互作用;筛选危险因素;筛选危险因素;预测事件发生。预测事件发生。3COX风险比例回归模型风险比例回归模型生存分析是将结果事件发生及发生时间进生存分析是将结果事件发生及发生时间进行综合分析的一种统计分析方法。行综合分析的一种统计分析方法。多因素生存分析方法首推多因素生存分析方法首推COX
14、风险比例回风险比例回归模型。归模型。应变量(结果变量)为生存时间,自变量应变量(结果变量)为生存时间,自变量为分类变量资料或者数值变量资料。为分类变量资料或者数值变量资料。模型一般表达为:模型一般表达为:为风险函数(风险率或瞬间死亡率)为基准风险函数,是与时间有关的任意分布函数,分布与形状无明确的假定。表示与生存可能有关的影响因素,为回归系数,由实际数据估计得到,要求在观察时间内是恒定的、不随时间变化。)(tH)exp(332211)(0)(mmttXXXXHH)(0 tHiXi0i,表示iX值越大,病人死亡的风险越大;0i,说明iX值越大,病人死亡的风险越小;0i,则iX值与病人死亡的风险无
15、关。(五)分层分析与亚组分析(五)分层分析与亚组分析为观察某个新治疗措施的效果,直接将试为观察某个新治疗措施的效果,直接将试验组与对照组进行整体分析,也许不具备验组与对照组进行整体分析,也许不具备统计学意义,读者有可能否定其价值。统计学意义,读者有可能否定其价值。若按病情程度等重新进行分层分析或亚组若按病情程度等重新进行分层分析或亚组分析,可能发现有重要临床与统计学意义分析,可能发现有重要临床与统计学意义的结果。的结果。例如颅脑血肿患者施以例如颅脑血肿患者施以A、B两种两种不同手术方式,并比较临床疗效。不同手术方式,并比较临床疗效。A组与B组各有490例,尽管A术式从临床意义上要优于B术式,然
16、而假设检验发现P=0.08,按照a=0.05水准,整体比较并无统计学意义。按颅内按颅内CT片所定量的出血灶大小(小量、片所定量的出血灶大小(小量、中量和大量出血)分层,以死残率为终点中量和大量出血)分层,以死残率为终点指标,进行分层分析后,会发现指标,进行分层分析后,会发现小量与中量出血灶组小量与中量出血灶组A式与式与B式手术的死式手术的死残率差异无统计学意义,残率差异无统计学意义,大量出血组大量出血组A术式则显著优于术式则显著优于B术式术式进一步依据出血量分层的进一步依据出血量分层的Logistic分析结分析结果发现果发现A组死残率仅为组死残率仅为B组的组的0.7倍;倍;出血量每增一个等级,
17、则死残危险度平均为原出血量每增一个等级,则死残危险度平均为原等级的等级的1.9倍,且具有临床与统计学双重意义倍,且具有临床与统计学双重意义(P95%若试验设计时限定若试验设计时限定型错误(即假阴性错型错误(即假阴性错误)误)90%在临床实践中,往往可以遇到有些证据既在临床实践中,往往可以遇到有些证据既有临床价值,又具统计学意义,结果自然有临床价值,又具统计学意义,结果自然可信;反之,无价值。可信;反之,无价值。有时尽管临床证据有重要意义,然而无统有时尽管临床证据有重要意义,然而无统计学意义,这时要慎下结论;反之,如无计学意义,这时要慎下结论;反之,如无临床价值,却有显著统计学意义,其证据临床价值,却有显著统计学意义,其证据的临床价值却不大。的临床价值却不大。表 证据的统计学意义与临床意义临床意义和统计学意义进行综合分析,才临床意义和统计学意义进行综合分析,才能得出合理的结论。能得出合理的结论。假设检验有统计学意义,并不能说明其有临床价值。不能仅仅依据p值的大小就武断说某种证据的有用或者无用,否则就可能出现误判。The end