1、临床科研临床科研中中常用统计方法及选择常用统计方法及选择2014.6 CQMU.PBu统计学方法有什么用?u合理选择统计方法的四个因素u数据资料的描述u数据资料的组间比较u变量间关系研究主要内容一张关于统计学的图片一、统计学方法有什么用?例子例子1:一研究者宣布找到一种治疗一研究者宣布找到一种治疗某病某病的新药,的新药,试验的结果如下:试验的结果如下:药物例数有效有效率新药604270%安慰剂502550%该新药是否值得推广?该新药是否值得推广?几个例子几个例子假设检验及临床优效性检验假设检验及临床优效性检验例子例子2 2:英国某年全人口统计资料:英国某年全人口统计资料矛盾:移民组的发病率在各
2、个年龄组均高于英格兰和威尔矛盾:移民组的发病率在各个年龄组均高于英格兰和威尔士组,为什么它的合计发病率反而低?士组,为什么它的合计发病率反而低?分析中混杂因素的控制分析中混杂因素的控制 胃癌胃癌 228 235 143 187 250 胃炎胃炎 100 153 178 143 200 非胃病非胃病 98 123 170 100 120 例子例子3 3:为鉴别胃癌、胃炎、非胃病患者,各测定了为鉴别胃癌、胃炎、非胃病患者,各测定了5050名名对象的铜兰蛋白等指标,其中铜兰蛋白的观察结果如下对象的铜兰蛋白等指标,其中铜兰蛋白的观察结果如下:问:三种人的铜兰蛋白有无不同?问:三种人的铜兰蛋白有无不同?
3、能否根据测定的铜兰蛋白数据对患者进行初步诊断?能否根据测定的铜兰蛋白数据对患者进行初步诊断?假设检验及判别诊断假设检验及判别诊断 结局指标:心性死亡结局指标:心性死亡 预后因素:年龄、预后因素:年龄、性别、性别、高血压病、心梗位置、心梗分级、高血压病、心梗位置、心梗分级、传导阻滞、溶栓治疗传导阻滞、溶栓治疗,.,等,等例子例子4 4:研究心肌梗死患者预后的影响因素研究心肌梗死患者预后的影响因素,以以是否发生是否发生心性死亡心性死亡作为观察结果作为观察结果指标指标,对对116116名心梗患者的名心梗患者的2222个可个可能影响预后的因素进行观察和能影响预后的因素进行观察和记录记录哪些预后因素与发
4、生心性死亡有关系?哪些预后因素与发生心性死亡有关系?关系的强度如何?关系的强度如何?影响因素筛选影响因素筛选回归分析回归分析统计学在医学科研中作用n 统计学是进行医学科研的重要工具重要工具n 满足统计学原则要求是保障医学科研科学性的前提n 采用恰当的统计学方法是研究结论可靠、可信的前提n 课题申报、论文撰写均有明确的统计学要求u研究设计u分析目的u资料类型u数据特征二、合理选择统计方法的四个因素n完全随机设计(成组设计)完全随机设计(成组设计)-最常见,最易实施的实验设计方案-将研究对象随机分配随机分配到几个组,然后做实验n配对设计配对设计(区组设计区组设计)-将具有相似特征的研究对象配成对子
5、,然后再将每个对子的对象随机分配随机分配到两个组进行实验-常见形式:同源配对(如样品一分为二)异源配对(按性别、体重、年龄配对)自身前后配对(试验前后的对比)(一)研究设计(一)研究设计n析因设计析因设计-同时研究多个实验因素多个实验因素对结果的影响-例如,研究药物剂量药物剂量(3mg、6mg)及给药方式给药方式(口服、肌注口服、肌注)对结果的影响,每种组合均需要做试验(3mg+口服,3mg+肌注,6mg+口服,6mg+肌注),为22析因设计析因设计n重复测量设计重复测量设计-同一对象在不同时间点不同时间点上进行某个指标的观测,以分析该指标在时间上的变化。-临床上很常见的一类资料(一)研究设计
6、(一)研究设计n对临床资料进行统计描述 描述性统计分析方法 如,均数,中位数,标准差,百分比,频数分布等n估计总体参数 95%可信区间n对几组资料进行差异性检验 假设检验方法 如,t检验,卡方检验,方差分析,秩和检验等n探讨变量之间的关系,或者自变量(影响因素)自变量(影响因素)对应变量(结果变量)应变量(结果变量)的影响大小 多变量分析方法 如,线性相关,线性回归,Logistic回归,Cox回归、生存分析等(二)分析(二)分析目的目的数值变量数值变量资料资料 计量计量资料资料无序分类变量无序分类变量资料资料 计数计数资料资料 有序分类变量有序分类变量资料资料 等级资料等级资料(三三)资料类
7、型资料类型无序分类无序分类:指类别或属性间无顺序、程度之分例如,性别(男、女)为二分类 血型(A、B、AB、O)为多分类 有序有序分类分类:指类别间存在着次序,或程度上的差异。例如,治疗效果:无效、好转、显效、治愈 实验室检验:、+、+、+数值变量数值变量:每一个观察对象都有一个数值,且大小差异有意义例如,血红蛋白(g/L),住院天数,产前检查次数,住院费用n任何统计方法都有自己的适用条件,只有当某个或某些条件满足时,统计计算公式才成立n适用条件可根据数据特征来判断数据的分布特征(正态、偏态)方差齐性理论数大小样本量大小(四(四)数据特征)数据特征编号 年龄 性别 治疗组 舒张压 心电图 疗效
8、 NO X1 X2 X3 X4 X5 X6 1 37 男 A 11.27 正常 显效 2 45 女 B 12.53 正常 有效 3 43 男 A 10.93 异常 有效 4 59 女 B 14.67 异常 无效 108 54 男 B 16.80 正常 无效108例高血压患者治疗后临床记录三、数据资料的描述三、数据资料的描述n通过绘制直方图直方图可以直观了解数据的分布(一)数值变量资料的描述(一)数值变量资料的描述偏态分布偏态分布近似正态分布近似正态分布变异水平变异水平 平均水平平均水平 平均水平平均水平偏态分布形状研究中,右偏态分布更常见,如研究中,右偏态分布更常见,如住院时间,住院费用,病程
9、住院时间,住院费用,病程等等左偏态分布较少见,如左偏态分布较少见,如考生成绩考生成绩有时呈左偏态分布有时呈左偏态分布n方差齐性 方差是否齐同(相等)粗略判断 两组标准差之比在2.5倍以上,就得警惕方差不齐指标名称指标名称适用的资料适用的资料均数(X)正态分布或近似正态分布中位数(M)偏态分布、分布未知、两端无界几何均数(G)对数正态分布、等比资料标准差(s)正态分布或近似正态分布四分位数间距偏态分布、分布未知、两端无界极差(R)观察例数相近的数值变量变异系数(CV)比较几组资料间的变异大小描述数值变量资料的常用指标描述数值变量资料的常用指标变异水平变异水平 平均水平平均水平 平均水平平均水平偏
10、态分布偏态分布近似正态分布近似正态分布中位数中位数均数均数标准差标准差P25,P75四分位数间距四分位数间距n正态分布或近似正态分布:均数 与 标准差n偏态分布或未知分布 中位数 与 P25、P75(四分位数间距)论文中最常用组合 通常需要描述各个类别的频数及频率频数及频率(百分比)(二)分类变量资料的描述二维频数表A A、B B 两组两组高血压患者高血压患者疗效比较疗效比较组别组别 治愈治愈 显效显效 有效有效 无效无效 合计合计 A 29 17 6 4 56 B 17 12 12 11 52 研究中通常需要列出二维频数表研究中通常需要列出二维频数表四、四、数据资料数据资料的组间比较的组间比
11、较n假设检验出发点是:判断样本之间差异由什么原因造成的判断样本之间差异由什么原因造成的n样本样本数据间数据间的的差异差异有有两种原因所两种原因所致致 样本来自同一总体,差异因抽样误差所引起 样本来自不同总体,差异因不同总体所引起n假设检验以P P值值大小作为推断依据 P值大,表示差异由抽样误差引起可能性大 P值小,表示差异由抽样误差引起可能性小,即由总体不同引起的可能性大 一般以0.05作为临界值来判断(一)组间比较采用技术(一)组间比较采用技术-假设检验假设检验n根据资料类型选择根据资料类型选择计量资料的计量资料的假设检验假设检验 t t检验、检验、F F检验(方差分析)、检验(方差分析)、
12、Z Z检验检验、秩和检验、秩和检验(WilcoxonWilcoxon秩和检验、秩和检验、H H检验、检验、FriedmanFriedman检验检验)等)等计数资料的计数资料的假设检验假设检验 卡方检验、卡方检验、Z Z检验检验等等等级资料的等级资料的假设检验假设检验 秩和检验(秩和检验(WilcoxonWilcoxon秩和检验秩和检验、H H检验检验、FriedmanFriedman检验)检验)(二)组间比较常用(二)组间比较常用的的假设检验假设检验方法方法比较目的比较目的应用条件应用条件统计方法统计方法样本与总体比较样本与总体比较n n较大较大Z Z检验检验n n大小均可大小均可t t检验检
13、验两组资料的比较两组资料的比较(完全随机设计)(完全随机设计)n n较大较大Z Z检验检验n n较小较小,正态分布正态分布,方差齐方差齐t t检验检验n n较小较小,非正态分布非正态分布,方差不齐方差不齐WilcoxonWilcoxon秩和检验秩和检验tt检验检验1 1、常用、常用计量资料计量资料的假设检验的假设检验比较目的比较目的应用条件应用条件统计方法统计方法配对资料的比较配对资料的比较n n较大(任意分布)较大(任意分布)配对设计配对设计Z Z检验检验(配对设计)(配对设计)n n较小,差值为正态较小,差值为正态配对设计的配对设计的t t检验检验n n较小,差值为非正态较小,差值为非正态
14、配对设计的秩和检验配对设计的秩和检验多组资料的比较多组资料的比较正态分布,方差齐正态分布,方差齐方差分析方差分析(完全随机设计)(完全随机设计)非正态分布,方差不齐非正态分布,方差不齐秩和检验(秩和检验(H H检验)检验)配伍资料的比较配伍资料的比较正态分布,方差齐正态分布,方差齐配伍设计的方差分析配伍设计的方差分析(配伍设计)(配伍设计)非正态分布,方差不齐非正态分布,方差不齐配伍设计的秩和检验配伍设计的秩和检验(FriedmanFriedman检验)检验)1 1、常用、常用计量资料计量资料的假设检验(续表)的假设检验(续表)比较目的比较目的应用条件应用条件统计方法统计方法样本率样本率与总体
15、率与总体率的比较的比较n n较小时较小时二项分布的直接法二项分布的直接法np5np5且且n(1-p)5n(1-p)5二项分布的二项分布的Z Z检验检验两个率两个率或构成比或构成比的比较(完全随的比较(完全随机设计)机设计)np5np5且且n(1-p)5n(1-p)5二项分布的二项分布的Z Z检验检验n40n40且且T5T5卡方检验卡方检验n40n40且且1T51T5校正校正卡方检验卡方检验n40n40或或T1T40b+c 40配对卡方检验配对卡方检验np5np5且且n(1-p)5n(1-p)5校正配对卡方检验校正配对卡方检验多个率多个率或构成比的比较或构成比的比较(完全随机设计)(完全随机设计
16、)全部格子全部格子T5T5或或1T51T5小于小于25%25%卡方检验卡方检验T1T1或或1T51T5超过超过25%25%FisherFisher精确检验精确检验2 2、常用、常用计数资料计数资料假设检验方法(续表)假设检验方法(续表)比较目的比较目的统计方法统计方法两组比较(完全随机设计)两组比较(完全随机设计)多组比较(完全随机设计)多组比较(完全随机设计)Wilcoxon秩和检验秩和检验秩和检验(秩和检验(H检验)检验)配伍设计配伍设计秩和检验(秩和检验(Friedman检验)检验)配对设计配对设计符号秩和检验符号秩和检验3 3、常用、常用等级资料等级资料假设检验方法假设检验方法 实例1
17、 30只大鼠随机分为A、B、C三组,每组10只,分别给予三种药物,5天后测定某指标值如下表。几个例子资料特点:完全随机设计,计量资料,三组资料特点:完全随机设计,计量资料,三组不妥的方法:t检验恰当的方法:方差分析 实例2 36只大鼠随机分为对照组、实验组1、实验组2三组,每组12只,分别给予三种饲料,分别于10天、15天、20天、25天测定大鼠体重,如下表。资料特点:完全随机设计,计量资料,三组,重复测量资料特点:完全随机设计,计量资料,三组,重复测量不妥的方法:每个时间点用t检验或方差分析恰当的方法:重复测量的方差分析 实例3 72只小鼠随机分为3组,每组24只,进行实验,分别于试验后1,
18、3,5,7天处死小鼠6只小鼠,测定大脑中酪氨酸激酶B的表达水平,如下表。资料特点:计量资料,三组,重复测量资料特点:计量资料,三组,重复测量?析因设计析因设计?不妥的方法:每个时间点用t检验,重复测量的方差分析恰当的方法:34析因设计方差分析 实例4 两组手术病人,采用两种不同的镇痛方式(试验组、对照组),于手术后24小时测定血清中的IL-6,结果如下表。资料特点:计量资料,两组,标准差相差比较大资料特点:计量资料,两组,标准差相差比较大(方差不齐方差不齐)不妥的方法:t检验恰当的方法:t检验 或者 Wilcoxon秩和检验 实例5 两组病人,采用两种药物治疗,治疗疗效如下表。经卡方检验,P=
19、0.0486,差异有统计学意义。因此可以认为试验组的疗效比对照组的疗效好。资料特点:计数资料,两组,例数比较少资料特点:计数资料,两组,例数比较少不妥的方法:卡方检验恰当的方法:Fisher精确检验 实例6 两组病人,采用两种药物治疗,治疗疗效如下表。经卡方检验,P=0.0570,差异无统计学意义。资料特点:等级资料,两组资料特点:等级资料,两组不妥的方法:卡方检验恰当的方法:Wilcoxon秩和检验 临床研究中,经常需要分析某些因素与疾病之间的关系,探讨疾病的危险因素。这些通常会涉及到多变量分析。五、变量间关系研究 实例7 欲研究治疗某病的改进法(传统药+辅药)与传统法(传统药)在不同剂量下的疗效。将150例研究对象随机分成10组,每组15例;每种剂量及每种疗法下观察15例。结果如下表:资料特点:结果变量:是否有效,二分类(有效、无效)资料特点:结果变量:是否有效,二分类(有效、无效)两个影响因素:治疗方法、药物剂量两个影响因素:治疗方法、药物剂量不妥的方法:卡方检验或Fisher精确检验恰当的方法:多因素分析中的Logistic回归分析谢谢!