1、杜世正杜世正 南京中医药大学护理学院南京中医药大学护理学院 Email:护理科研中常用的护理科研中常用的统计学方法统计学方法 医学论文中统计学问题医学论文中统计学问题n20世纪60年代到80年代,国外医学杂志调查结果:有统计错误的论文20%72%。n对2005年国内5种护理期刊2844篇论文调查显示,未进行统计处理的1703篇文章有29篇应该进行统计学分析,在有统计学处理的1141篇文章中,有统计学缺陷的占27.8%。-杨海清.5种护理杂志文献中统计方法 的应用现况分析J.中国医院统计,2005,12(2):124-127.精品资料“非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究
2、工作面临着被葬送的危险。”-F.Yates,M.J.R.Healy应用举例:应用举例:n欲比较中国和日本青少年身高,随机抽样1000名青少年,比较其平均身高 两独立样本两独立样本t t检验或单因素检验或单因素F F检验检验应用举例:应用举例:n一项研究探讨太极拳锻炼对于高血压患者干预效果,纳入研究对象200人,在干预3个月后,比较血压的变化情况 配对配对t t检验检验应用举例:应用举例:n一项研究太极拳锻炼对于高血压患者干预效果的预实预实验验,纳入研究对象20人,在干预3个月后,比较血压的变化情况 配对样本比较配对样本比较WilcoxonWilcoxon秩检验秩检验应用举例:应用举例:n一项研
3、究太极拳锻炼对于高血压患者干预效果的临床临床试验试验,纳入研究对象400人,完成随机化分组和基线值测量,试验组204人,对照组196人,在干预3个月后,比较干预后血压情况。两独立样本两独立样本t t检验或单因素检验或单因素F F检验检验应用举例:应用举例:n一项研究太极拳锻炼对于高血压患者干预效果的临床临床试验试验,纳入研究对象400人,完成基线信息测量和随机化分组,试验组204人,对照组196人,干预3个月,比较患者在基线值、3个月、6个月、9个月和12个月时血压的变化情况。重复测量方差分析重复测量方差分析应用举例:应用举例:n某医师欲比较物理疗法和药物疗法治疗周围性面神经麻痹的疗效,资料见
4、下表,问两种疗法的有效率有误差别?卡方检验卡方检验应用举例:应用举例:n某医师欲比较物理疗法和药物疗法治疗周围性面神经麻痹的疗效,资料见下表,问两种疗法的有效率有误差别?等级资料秩和检验等级资料秩和检验(1)计量资料计量资料(quantitative data)变量值有度量衡单位,表现为数值大小,如年龄,身 高,体重,疼痛强度(VAS)等。(2)计数资料计数资料(qualitative data)将观察单位按某种属性进行分组,分组汇总各组观察单 位数。如:性别,职业,血型等(3)等级资料等级资料(ranked data,ordinal data)将观察单位按某种属性的不同程度分成等级后分组计数
5、,变量值具有半定量性质,如疗效等级,癌症分期,Likert 式分级等n 统计描述n 统计推断n 统计描述统计描述n 统计推断 统计描述基本方法n 计量资料 集中趋势:算数均数、几何均数、中位数 离散趋势:极差、四分位距、方差和标准差、变异系数 百分位数:偏态资料n 计数资料 率 构成比 相对比:OR,RR 动态数列:增长量、发展速度n 统计描述统计描述n 统计推断 统计推断基本方法n 参数估计l计量资料:t检验,方差分析l计数资料:卡方检验n 非参数估计(秩和)检验l配对,两独立样本,多独立样本,随机区组n 相关和回归l相关:Pearson 相关:双变量均呈正态分布 Spearman 相关:双
6、变量不呈正态分布l回归:线性回归:因变量为计量资料 Logistic 回归:因变量为二分类变量(阳性、阴性)Ordinal 有序回归:因变量为等级资料 统计推断基本方法n 参数估计l计量资料:t检验,方差分析l计数资料:卡方检验n 非参数估计(秩和)检验l配对,两独立样本,多独立样本,随机区组n 相关和回归l相关:Pearson 相关:双变量均呈正态分布 Spearman 相关:双变量不呈正态分布l回归:线性回归:因变量为计量资料 Logistic 回归:因变量为二分类变量 Ordinal 有序回归:因变量为等级资料n t 检验参数检验:计量资料参数检验:计量资料l单样本t检验l配对样本t检验
7、:每对数值差总体为正态分布l两独立样本t检验:方差齐性(两正态总体,总体 方差相等)n t 检验l单样本t检验l配对样本t检验:每对数值差总体为正态分布l两独立样本t检验:方差齐性(两正态总体,总体 方差相等)参数检验:计量资料参数检验:计量资料n t 检验l单样本t检验 已知样本均数与已知总体均数的比较。例:某社区随机抽样老年居民100人,分别测量其血压值(收缩压和舒张压),请问该社区老年居民收缩压与140mmHg是否有差别?参数检验:计量资料参数检验:计量资料n t 检验l单样本t检验l配对样本t检验:每对数值差总体为正态分布每对数值差总体为正态分布l两独立样本t检验:方差齐性(两正态总体
8、,总体 方差相等)参数检验:计量资料参数检验:计量资料n t 检验l 配对样本t检验配对设计适用情形:自身比较,指同一受试对象处理前后的比较(处理前 后其他非处理因素保持齐同性),若重复测量(3次),则采用重复测量方差分析。同一样本(比如血样)分成两半,用两种不同方法测定将月龄、体重、性别相同的纯系实验动物组成配伍组,随机分成两组参数检验:计量资料参数检验:计量资料n t 检验l 配对样本t检验 数据要求:每对数据的差值差值符合正态分布符合正态分布参数检验:计量资料参数检验:计量资料配对t检验要求每对数据的差值符合正态分布差值符合正态分布配对配对t检验检验前提欠妥前提欠妥n t 检验l单样本t
9、检验l配对样本t检验:每对数值差总体为正态分布l两独立样本t检验:方差齐性(两正态总体,总体 方差相等)参数检验:计量资料参数检验:计量资料n t 检验l两独立样本t检验:方差齐性(两正态总体,总体 方差相等)适用情形:完全随机设计的两样本均数比较 数据要求:两组数据均呈正态分布参数检验:计量资料参数检验:计量资料n t 检验l两独立样本t检验:方差齐性(两正态总体,总体 方差相等)例:一项研究太极拳锻炼对于高血压患者干预效果的临床试临床试验验,纳入研究对象400人,完成随机化分组和基线值测量,试验组204人,对照组196人,在干预3个月后,比较干预后血压情况。参数检验:计量资料参数检验:计量
10、资料配对t检验?两独立样本t检验?两独立样本t检验配对t检验n t 检验l单样本t检验l配对样本t检验:每对数值差总体为正态分布l两独立样本t检验:方差齐性(两正态总体,总体 方差相等)参数检验:计量资料参数检验:计量资料n方差分析 (ANOVA)单因素F检验多因素F检验均要求方差齐性比较某处理因素不同水平的样本之间的差别是否比较某处理因素不同水平的样本之间的差别是否具有统计学意义。具有统计学意义。参数检验:计量资料参数检验:计量资料n单因素F检验单因素单因素F检验检验多个样本均数间多重比较多个样本均数间多重比较实验中的处理因素只有一个,这个处理因素包括g(g2)个水平,分析不同水平实验结果的
11、差别是否有统计学意义。当g=2时,单因素方差分析和两独立样本t检验效能是等价的。参数检验:计量资料参数检验:计量资料 三组战士行军后体温增加数三组战士行军后体温增加数()()不饮水不饮水 定量饮水定量饮水 不限量饮水不限量饮水 1.9 1.4 0.9 1.9 1.4 0.9 1.8 1.2 0.7 1.8 1.2 0.7 1.6 1.1 0.9 1.6 1.1 0.9 1.7 1.4 1.1 1.7 1.4 1.1 1.5 1.1 0.9 1.5 1.1 0.9 1.6 1.3 0.9 1.6 1.3 0.9 1.3 1.1 0.8 1.3 1.1 0.8 1.4 1.0 1.0 1.4 1.
12、0 1.0 1.6 1.2 0.9 1.6 1.2 0.9iX处理因素处理因素:饮水方式饮水方式 水平数水平数=3能用能用t检检验吗?验吗?n单因素F检验单因素单因素F检验检验多个样本均数间多重比较多个样本均数间多重比较实验中的处理因素只有一个,这个处理因素包括g(g2)个水平,分析不同水平实验结果的差别是否有统计学意义。当g3时,多重比较多采用LSD-t检验,Dunnett-t检验和SNK-q检验(两两之间的全面比较)。参数检验:计量资料参数检验:计量资料n单因素F检验单因素单因素F检验检验随机区组设计的方差分析随机区组设计的方差分析先按影响实验结果的非处理因素(如性别、体重、年龄、职业、病
13、情、病程等)将受试对象配成区组,再分别将区组内的受试对象随机分配到各处理组或对照组。参数检验:计量资料参数检验:计量资料A=术前晚清洁、剃毛B=术前2h清洁、剃毛C=术前晚清洁、不剃毛D=术前2h清洁、不剃毛应用举例:应用举例:n一项研究太极拳锻炼对于高血压患者干预效果的临床临床试验试验,纳入研究对象400人,完成基线信息测量和随机化分组,试验组204人,对照组196人,干预3个月,比较患者在基线值、3个月、6个月、9个月和12个月时血压的变化情况。重复测量方差分析重复测量方差分析各组数据间各组数据间独立吗?独立吗?相关系数相关系数n原文题目:牛黄千金散的抗炎解热作用原文题目:牛黄千金散的抗炎
14、解热作用n原文设计:将原文设计:将Wistar大鼠随机分为大鼠随机分为3组:生理盐水组,地塞米松组:生理盐水组,地塞米松组,牛黄千金散组。药前测定大鼠的足跖容积,然后分别灌胃给组,牛黄千金散组。药前测定大鼠的足跖容积,然后分别灌胃给药,药,30min后足皮下注射新鲜鸡蛋清。后足皮下注射新鲜鸡蛋清。用药后用药后15、30、45、60、75min以同样的方法测左侧足跖容积。数据采用以同样的方法测左侧足跖容积。数据采用t检验检验的统计学分的统计学分析方法处理,资料见下表析方法处理,资料见下表1。摘自徐庆荣等发表于中国临床药理学与治疗学杂志,1999,4(3):218-219。n行 列 表X2 检验(
15、四格表)n配对X2检验参数检验:计数资料参数检验:计数资料n行 列 表X2 检验(四格表)n配对X2检验参数检验:计数资料参数检验:计数资料 表 两组方式治疗压疮有效率的比较根据统计学理论研究发现,四格表资料在下面的根据统计学理论研究发现,四格表资料在下面的情况下,用前面公式计算得到的情况下,用前面公式计算得到的X2值比分布的值比分布的X2 值大,因而需对该值进行校正。值大,因而需对该值进行校正。1.T51.T5且且N40,N40,用四格表专用公式;用四格表专用公式;2.2.11T T55且且N N 4040时,需用校正公式计算时,需用校正公式计算X2值;值;3.3.T T1 1或或N N40
16、40时,需用精确概率法计算时,需用精确概率法计算P P值。值。校正问题2专用公式校正公式确切概率法多组间两两比较:分割比较多组间两两比较:分割比较=/NN=n(n-1)/2n=组数配对四格表资料的X X2 2检验 例 有26份咽喉涂抹标本,把每份标本分成两份,依同样的条件分别接种在A和B两种白喉杆菌培养基上,观察白喉的生长情况,其结果如下表所示。表 两组方法检测结果n行 列 表X2 检验(四格表)n配对X2检验l把一份标本分为两份,分别用两种方法化验,比较两种方法的结果(两类计数资料)是否相同?l分别采用甲、乙两种方法对同一批患者进行检查,比较此两种检查方法(两类计数资料)是否相同?参数检验:
17、计数资料参数检验:计数资料 统计推断基本方法n 参数估计l计量资料:t检验,方差分析l计数资料:卡方检验n 非参数估计(秩和)检验l配对,两独立样本,多独立样本,随机区组n 相关和回归l相关:Pearson 相关:双变量均呈正态分布 Spearman 相关:双变量不呈正态分布l回归:线性回归:因变量为计量资料 Logistic 回归:因变量为二分类变量(阳性、阴性)Ordinal 有序回归:因变量为等级资料n秩和检验:秩和检验:小样本资料(不满足正态分布和方 差齐性,如 Sd );等级资料等级资料 适用条件:适用条件:l 计量资料不满足正态分布和方差齐性l 小样本资料l 一端或两端是不确定数值
18、(0.5)l 等级资料X非参数检验非参数检验SdX不适合用参数检验n秩和检验:秩和检验:小样本资料(不满足正态分布和方 差齐性,如 Sd );等级资料等级资料 配对样本比较的Wilcoxon符号秩检验 两独立样本比较的Wilcoxon符号秩检验 多个独立样本比较的Kruskal-Wallis H检验X非参数检验非参数检验n秩和检验:秩和检验:配对样本比较的Wilcoxon符号秩检验自身比较,指同一受试对象处理前后的比较(处理前后其他非处理因素保持齐同性)同一样本(比如血样)分成两半,用两种不同方法测定将月龄、体重、性别相同的纯系实验动物组成配伍组,随机分成两组非参数检验非参数检验n 秩和检验:
19、秩和检验:两独立样本比较的Wilcoxon符号秩检验 适用情形:完全随机设计的两样本均数比较 数据要求:两组数据方差不齐非参数检验非参数检验n秩和检验:秩和检验:两独立样本比较的Wilcoxon符号秩检验 等级资料秩和检验:非参数检验非参数检验应用举例:应用举例:n某医师欲比较物理疗法和药物疗法治疗周围性面神经麻痹的疗效,资料见下表,问两种疗法的有效率有误差别?等级资料秩和检验等级资料秩和检验n等级资料秩和检验注:行列表资料:l指标变量无序:行列表X2 检验l指标变量有序:等级资料秩和检验非参数检验非参数检验指标变量有序:等级资料秩和检验指标变量无序:行列表X2 检验n秩和检验:秩和检验:小样
20、本资料(不满足正态分布和方 差齐性,如 Sd );等级资料等级资料 配对样本比较的Wilcoxon符号秩检验 两独立样本比较的Wilcoxon符号秩检验 多个独立样本比较的Kruskal-Wallis H检验X非参数检验非参数检验n秩和检验:秩和检验:多个独立样本比较的Kruskal-Wallis H检验计量资料计量资料相关统计学方法相关统计学方法多个独立样本两两比较的Nemenyi法 统计推断基本方法n 参数估计l计量资料:t检验,方差分析l计数资料:卡方检验n 非参数估计(秩和)检验l配对,两独立样本,多独立样本,随机区组n 相关和回归l相关:Pearson 相关:双变量均呈正态分布 Spearman 相关:双变量不呈正态分布l回归:线性回归:因变量为计量资料 Logistic 回归:因变量为二分类变量(阳性、阴性)Ordinal 有序回归:因变量为等级资料