1、临床流行病学应用研究室临床流行病学应用研究室 周罗晶周罗晶在医学资料中,特别是临床医学资料中,常在医学资料中,特别是临床医学资料中,常常遇到一些定性指标,如临床疗效的评价、疾病常遇到一些定性指标,如临床疗效的评价、疾病的临床分期、症状严重程度的临床分级、中医诊的临床分期、症状严重程度的临床分级、中医诊断的一些临床症状等,断的一些临床症状等,对这些指标常采用分成若对这些指标常采用分成若干等级然后分类计数的办法来解决它的量化问题干等级然后分类计数的办法来解决它的量化问题,这样的资料我们在统计学上称为有序变量这样的资料我们在统计学上称为有序变量(ordered variableordered var
2、iable)或半定量资料,也称为等)或半定量资料,也称为等级资料(级资料(ranked dataranked data)。)。 等级资料定义:等级资料定义: 等级资料划分的两种情况:等级资料划分的两种情况:特点:特点:观察结果具有等级差别。观察结果具有等级差别。v按性质划分:按性质划分:如药物疗效分为痊愈、显效、好转如药物疗效分为痊愈、显效、好转、无效;麻醉效果分为、无效;麻醉效果分为、级等。级等。v按数量分组:按数量分组:数据两端不能确切测定的计量资料数据两端不能确切测定的计量资料。如抗体滴度分为。如抗体滴度分为1:20,1:20,1:40,1:80,1:20,1:20,1:40,1:80,
3、1:80;年龄分为年龄分为10,100.050.05)等级资料正确的统计分析方法:等级资料正确的统计分析方法: 非参数统计的秩和检验非参数统计的秩和检验 Kendall Kendall 、spearmanspearman等级相关等级相关 CMHCMH卡方检验卡方检验 RiditRidit分析分析 线性趋势卡方检验线性趋势卡方检验 有序变量的有序变量的LogisticLogistic回归分析回归分析一、非参秩和检验一、非参秩和检验 由于非参数检验法不考虑数据的分由于非参数检验法不考虑数据的分布规律,检验不涉及总体参数,检验统布规律,检验不涉及总体参数,检验统计量多是人们在总结经验的基础上创造计量
4、多是人们在总结经验的基础上创造出来的,所以这类检验方法的特点是针出来的,所以这类检验方法的特点是针对性强。但是不同设计、不同目的所用对性强。但是不同设计、不同目的所用的非参数检验法是不同的。的非参数检验法是不同的。 v 单向有序行列表单向有序行列表 在表的两个方向上的分类中,一在表的两个方向上的分类中,一个方向(横向)无顺序和等级概念,个方向(横向)无顺序和等级概念,另一个方向(纵向)是有顺序的分类,另一个方向(纵向)是有顺序的分类,称为单向有序行列表。称为单向有序行列表。 a. a. 两组独立样本两组独立样本等级资料比较的等级资料比较的Mann- Mann- WhitneyWhitney秩和
5、检验秩和检验 以表以表1 1为例。将无效、有效、显效三个疗效等级数量化,为例。将无效、有效、显效三个疗效等级数量化,数值用平均秩号,然后比较各组平均秩号的大小。数值用平均秩号,然后比较各组平均秩号的大小。 治治 疗疗 组组 对对 照照 组组 合合 计计 秩秩 次次 范范 围围 平平 均均 秩秩 次次 无无 效效 6 14 20 1-20 10.5 有有 效效 19 20 39 21-59 40 显显 效效 35 24 59 60-118 89 合合 计计 60 58 118 两组的平均秩号分别为:两组的平均秩号分别为:治疗组:治疗组:R1= (6R1= (610.5+1910.5+1940+3
6、540+3589)/60 =65.689)/60 =65.6对照组:对照组:R2=R2=(141410.5+2010.5+2040+2440+248989)/58=53.1/58=53.1 经秩和检验,经秩和检验,u=2.169u=2.169,P P0.050.05,两组疗效差异有,两组疗效差异有统计学意义,因为治疗组平均秩号大于对照组,所以治统计学意义,因为治疗组平均秩号大于对照组,所以治疗组疗效好。疗组疗效好。 计算两组秩号并进行秩和检验计算两组秩号并进行秩和检验 Analyze Nonparametric Tests 2 independent Samples Test variable
7、 List :result Grouping variable :group Define groups:group1:1;group2:2 , Test Type :Mann-Whitney OKSPSSSPSS窗口操作过程:窗口操作过程:Ranks GROUP N Mean Rank Sum of Ranks RESULT 1 60 65.63 3938.00 2 58 53.16 3083.00 Total 118 分析结果:分析结果:Test Statistics RESULT Mann-Whitney U 1372.000 Wilcoxon W 3083.000 Z -2.169 A
8、symp. Sig. (2-tailed) .030 结论:两组疗效差异有统计学意义,且治疗结论:两组疗效差异有统计学意义,且治疗组效果好于对照组。组效果好于对照组。=-2.169=-2.169,P P0.050.05 结论:两组疗效差异没有统计学意义。结论:两组疗效差异没有统计学意义。 b. b. 两 组 配 对 样 本两 组 配 对 样 本 等 级 资 料 比 较 的等 级 资 料 比 较 的WilcoxonWilcoxon秩和检验秩和检验c. c. 多组多组等级资料比较的等级资料比较的KruskalKruskal-Wallis-Wallis秩秩和检验和检验 该方法对该方法对K (K2)K
9、 (K2)组独立样本进行组独立样本进行K K个个总体分布函数相同假设的检验,是在总体分布函数相同假设的检验,是在WilcoxonWilcoxon秩和检验基础上扩展的方法,称秩和检验基础上扩展的方法,称为为K-WK-W检验。检验。 例例2 2 对对5454例牙病患者的例牙病患者的6464颗患牙的根端形态不同分颗患牙的根端形态不同分为为3 3种,种,X X线片显示喇叭口状为线片显示喇叭口状为A A型,管壁平行状为型,管壁平行状为B B型,管壁由聚状为型,管壁由聚状为C C型型表表 3 3 不不同同根根端端形形态态分分型型的的疗疗效效比比较较 根根端端形形态态 牙牙数数 成成功功 进进步步 失失败败
10、 A A 型型 1 18 8 3 3 9 9 6 6 B B 型型 2 24 4 1 10 0 1 10 0 4 4 C C 型型 2 22 2 1 10 0 1 11 1 1 1 合合计计 6 64 4 2 23 3 3 30 0 1 11 1 比较不同根端形态患牙的疗效有否差别。比较不同根端形态患牙的疗效有否差别。1、建立数据库、建立数据库1.1定义变量定义变量 group: 1 A型型 2 B型型 3 C型型 result: 1成功成功 2进步进步 3失败失败 count: 例数例数1.2录入数据录入数据1.3权重频数权重频数SPSS软件操作步骤:软件操作步骤:Analyze Nonpa
11、rametric Tests K independent Samples Test variable List :result Grouping variable :group Define range:minimum:1;maximum:3 Continue Test Type :KruskalKruskal-Wallis-Wallis HOK2、分析、分析:3 3、结果、结果Ranks GROUP N Mean Rank RESULT 1 18 40.92 2 24 30.88 3 22 27.39 Total 64 Test Statistics RESULT Chi-Square 6.
12、528 df 2 Asymp. Sig. .038 结论:按结论:按=0.05=0.05的检验水平,三组间差异有统计学意义。的检验水平,三组间差异有统计学意义。 H =6.528,P =0.038 计算结果中显示的计算结果中显示的2值并不是值并不是2检检验,只是验,只是KruskalKruskal-Wallis Test-Wallis Test的检验统的检验统计量计量H H,此时近似,此时近似2分布,所以按分布,所以按2分分布的近似值来确定概率,它的自由度布的近似值来确定概率,它的自由度 = = 组数组数-1 -1。 v 双向有序资料行列表双向有序资料行列表KendallKendall等级相等
13、级相关法和关法和SpearmanSpearman等级相关分析法等级相关分析法 例例3 3 某病病情与疗效的关系某病病情与疗效的关系 表表4 4 某某病病病病情情与与疗疗效效的的关关系系(1 1) 病病 情情 疗疗效效 极极重重 重重 中中 轻轻 恶恶化化 3 30 0 2 20 0 2 20 0 1 10 0 无无效效 2 20 0 3 30 0 1 10 0 2 20 0 有有效效 1 10 0 1 10 0 3 30 0 3 30 0 表表 5 5 某某病病病病情情与与疗疗效效的的关关系系(2 2) 病病 情情 疗疗效效 极极重重 重重 中中 轻轻 恶恶化化 2 20 0 2 20 0 3
14、 30 0 1 10 0 无无效效 1 10 0 3 30 0 2 20 0 2 20 0 有有效效 3 30 0 1 10 0 1 10 0 3 30 0 两表的区别仅在于病情两表的区别仅在于病情“极重极重”组和组和“中中”组的数据进行了互换。组的数据进行了互换。 分别对上面两个表格数据进行分别对上面两个表格数据进行2检验和多检验和多组等级资料比较的组等级资料比较的KruskalKruskal-Wallis-Wallis秩和检验。秩和检验。对于表对于表4 4:2=40.000,P=0.000 H=24.896 ,P=0.000对于表对于表5 5:2=40.000,P=0.000 H=24.8
15、96 ,P=0.000两种检验都两种检验都无法表达表无法表达表4 4和表和表5 5的差别,的差别,直观地看,直观地看,表表4 4的资料显的资料显示病情越轻示病情越轻者疗效越好,者疗效越好,表表5 5却未显示却未显示这种趋势来。这种趋势来。此时我们选用此时我们选用KendallKendall和和SpearmanSpearman等级相等级相关分析法分别计算相关系数关分析法分别计算相关系数t t和和r rs s。计算公式:计算公式:mmnS122t = n n:总例数:总例数 m m:最长对角线上的格子数:最长对角线上的格子数 S S:专用统计量:专用统计量Kendall等级相关意义:等级相关意义:
16、当一个变量的等级为标准时,当一个变量的等级为标准时,另一个变量的等级与它不一致的情况(可分析两个以另一个变量的等级与它不一致的情况(可分析两个以及多个变量间的等级相关性)。及多个变量间的等级相关性)。 rs = 1- ) 1(62nndn n:总例数:总例数 d d:每一对值的等级差:每一对值的等级差Spearman等级相关意义:等级相关意义:两个变量之两个变量之间的等级相关性。间的等级相关性。(只适用于分析两个变量关系)(只适用于分析两个变量关系)Spearman等级相关公式:等级相关公式:1.1.建立数据库建立数据库2.2.录入数据录入数据3.3.权重频数权重频数4.4.界面操作(界面操作
17、(以表以表4 4为例为例):):Analyze Correlate Bivariate Row(s):疗效疗效 Column(s) :病病情情 Statistics Kendalls tau-b ,Spearman OK 病病情情 疗疗效效 Correlation Coefficient 1.000 .275 Sig. (2-tailed) . .000 病病情情 N 240 240 Correlation Coefficient .275 1.000 Sig. (2-tailed) .000 . Kendalls tau_b 疗疗效效 N 240 240 Correlation Coeffi
18、cient 1.000 .320 Sig. (2-tailed) . .000 病病情情 N 240 240 Correlation Coefficient .320 1.000 Sig. (2-tailed) .000 . Spearmans rho 疗疗效效 N 240 240 表表4检验结果:检验结果: 病病情情 疗疗效效 Correlation Coefficient 1.000 .039 Sig. (2-tailed) . .480 病病情情 N 240 240 Correlation Coefficient .039 1.000 Sig. (2-tailed) .480 . Ken
19、dalls tau_b 疗疗效效 N 240 240 Correlation Coefficient 1.000 .046 Sig. (2-tailed) . .482 病病情情 N 240 240 Correlation Coefficient .046 1.000 Sig. (2-tailed) .482 . Spearmans rho 疗疗效效 N 240 240 表表5检验结果:检验结果:v 重复测量等级资料时间趋势检验重复测量等级资料时间趋势检验 CMHCMH卡方检验卡方检验 实例实例4 4 在某药治疗闭塞性动脉炎的临床试验中在某药治疗闭塞性动脉炎的临床试验中, ,治疗治疗2626例
20、下肢溃疡例下肢溃疡的病人溃疡改善情况见表的病人溃疡改善情况见表6 6,评价该药有无促进溃疡愈合的作用。,评价该药有无促进溃疡愈合的作用。 表表 6 6 溃疡改善程度(例数)溃疡改善程度(例数) 溃疡改善程度溃疡改善程度 第第 1 1 周周 第第 2 2 周周 第第 3 3 周周 溃疡面积不变溃疡面积不变 1414 1212 7 7 溃疡面积缩小溃疡面积缩小20%20% 2 2 4 4 5 5 溃疡面积缩小溃疡面积缩小 20%20%50%50% 8 8 7 7 6 6 溃疡面积缩小溃疡面积缩小50%50% 2 2 3 3 6 6 完全治愈完全治愈 0 0 0 0 2 2 合计合计 2626 26
21、26 2626 本例特点:本例特点: 1. 1.个体的重复测量个体的重复测量 2. 2.溃疡随时间的变化趋势溃疡随时间的变化趋势 卡方检验卡方检验, , Cochran-Mantel-Cochran-Mantel-HanselHansel检验简称检验简称 ,包括非零相关、行平分差包括非零相关、行平分差和一般联系和一般联系3 3种检验方法。对于这种重复测量种检验方法。对于这种重复测量的等级变量的等级变量, ,行列变量均为等级变量行列变量均为等级变量, ,应该作非应该作非零相关检验。本方法仅限于检验线性趋势。零相关检验。本方法仅限于检验线性趋势。计算公式:计算公式: Q Qcscs = = cjj
22、airiicjricjijaicinuanucnuaucn1212211) 1(结果:结果:2 = 4.7424,P = 0.0294结论:溃疡改善程度随着治疗时间延长有变好的趋势。结论:溃疡改善程度随着治疗时间延长有变好的趋势。 v多组等级资料的两两比较多组等级资料的两两比较RiditRidit分析分析 RiditRidit是是“Relative to an identified Relative to an identified distribution integral transformation”distribution integral transformation”的首个字母的首
23、个字母缩写,意指对于一个确认的分布作积分变换。缩写,意指对于一个确认的分布作积分变换。 RiditRidit分析是一种关于等级资料进行对比组分析是一种关于等级资料进行对比组与标准组比较的假设检验方法,其基本思想是与标准组比较的假设检验方法,其基本思想是先先确定一个标准组确定一个标准组作为特定总体,求得各等级作为特定总体,求得各等级的的RiditRidit值,标准组平均值,标准组平均RiditRidit值理论上可以证明值理论上可以证明等于等于0.50.5,其他各组与标准组比较,看其可信区,其他各组与标准组比较,看其可信区间是否与间是否与0.50.5重叠,来判断组间的统计学显著性,重叠,来判断组间
24、的统计学显著性,最后得出专业解释。最后得出专业解释。RiditRidit分析适用范围:分析适用范围: 1. 1.两组或两组以上等级资料的比两组或两组以上等级资料的比较和分析较和分析 2. 2.两端数据不确切的计量资料分两端数据不确切的计量资料分组转换成计数资料的分析,如血清组转换成计数资料的分析,如血清滴度等。滴度等。特点:特点:简便、直观、适用性广。简便、直观、适用性广。一、确定标准组:一、确定标准组: 1. 1.利用已知的标准分布(传统方法)作为利用已知的标准分布(传统方法)作为标准组。如某药物大规模的观察研究结果,标准组。如某药物大规模的观察研究结果,计算不同疗效的计算不同疗效的R R值
25、。值。 2. 2.以例数最多的一组作为标准组。以例数最多的一组作为标准组。 3. 3.各组的例数都差不多时,可把各组观察各组的例数都差不多时,可把各组观察结果合并起来作为标准组。结果合并起来作为标准组。 二、计算标准组的二、计算标准组的RiditRidit值:值:三、利用对照组计算各组的平均三、利用对照组计算各组的平均R R值值四、置信区间判断四、置信区间判断五、统计检验五、统计检验: : u u检验、检验、t t检验、检验、2检验检验 糖糖衣衣 黄黄体体酮酮 复复方方 合合计计 无无效效 4 48 8 5 5 1 13 3 6 66 6 好好转转 1 18 84 4 1 16 6 3 36
26、6 1 12 26 6 显显效效 7 77 7 1 18 8 1 11 1 1 10 06 6 控控制制 5 52 2 1 19 9 1 17 7 8 88 8 合合计计 3 36 61 1 5 58 8 7 77 7 4 49 96 6 表表7 三种方剂对某妇科病患者治疗效果比较三种方剂对某妇科病患者治疗效果比较PEM3.1PEM3.1操作过程:操作过程: 1.1.建立数据库建立数据库 1.1 1.1 定义变量名定义变量名 1.2 1.2 录入数据录入数据2.2.界面操作:界面操作: 其他统计分析其他统计分析 RiditRidit分析分析 分析目的:分析目的:多个样本比较多个样本比较 分组变
27、分组变量:量:分组分组 类别变量类别变量 :类别类别 频频数变量:数变量:例数例数 确定确定 主要结果:主要结果:检验水准检验水准: : =0.05 =0.05 选用同一参照组选用同一参照组 ( (各样本合计为参照组各样本合计为参照组)样本数样本数 k=3 k=3 等等 级级 数数: 4 : 4 主要结果:主要结果:参照组各等级参照组各等级 R R 值的计算值的计算 等级等级 (1)(1) 频数频数 (2)(2) (2)/2(2)/2 (3)(3) (2) (2)累累计计 (4)(4) (3)+(4)(3)+(4) 移下一行移下一行(5)(5) R=(5)/NR=(5)/N (6)(6) 1
28、1 6666 3333 0 0 33 33 0.06650.0665 2 2 236236 118118 6666 184184 0.37100.3710 3 3 106106 5353 302 302 355355 0.71570.7157 4 4 8888 4444 408408 452452 0.91130.9113 各样本平均各样本平均R R 样本名样本名 频数合计频数合计 平均平均R R 第第1 1组组 361 0.4819361 0.4819 第第2 2组组 58 0.628758 0.6287 第第3 3组组 77 0.488177 0.4881主要结果:主要结果:卡方检验卡方检
29、验: : 卡方值卡方值 = 13.0887 = 13.0887 自由度自由度 v= 3 v= 3 概概 率率 P= 0.0044 P= 0.0044 结论:结论:三种药物对妇科病的疗效差异有统计三种药物对妇科病的疗效差异有统计 学意义。学意义。主要结果:主要结果:1.1.标准组平均标准组平均R R值值 : = 248.00/496 = 248.00/496 = =0.50.5 2.2.标准组方差、标准差的计算:标准组方差、标准差的计算: 1222nnfRfRSR2RRSS标标准准组组 f f R R f fR R f fR R2 2 无无效效 6 66 6 0 0. .0 06 66 65 5
30、 4 4. .3 39 9 0 0. .2 29 9 好好转转 2 23 36 6 0 0. .3 37 71 10 0 8 87 7. .5 56 6 3 32 2. .4 48 8 显显效效 1 10 06 6 0 0. .7 71 15 57 7 7 75 5. .8 86 6 5 54 4. .3 30 0 控控制制 8 88 8 0 0. .9 91 11 13 3 8 80 0. .1 19 9 7 73 3. .0 08 8 合合计计 4 49 96 6 2 24 48 8. .0 00 0 1 16 60 0. .1 15 5 方差方差 = 160.16 = 160.16 24
31、82/496/ 2482/496/(496-1496-1)= 0.0730= 0.0730标准差标准差 = 0.2702= 0.2702标准组方差、标准差的计算标准组方差、标准差的计算对比组平均对比组平均R值值 糖糖衣衣 黄黄体体酮酮 复复方方 合合计计 无无效效 4 48 8 5 5 1 13 3 6 66 6 好好转转 1 18 84 4 1 16 6 3 36 6 1 12 26 6 显显效效 7 77 7 1 18 8 1 11 1 1 10 06 6 控控制制 5 52 2 1 19 9 1 17 7 8 88 8 合合计计 3 36 61 1 5 58 8 7 77 7 4 49
32、96 6 nfRR糖衣组糖衣组= = = 0.4819 = 0.4819 黄体酮组黄体酮组 = 0.6287= 0.6287 复方组复方组 = 0.4881= 0.4881 5277184489113. 0527157. 0773710. 01840665. 048 如果等级是由劣到优的顺序排列,如果等级是由劣到优的顺序排列,则平均则平均 RiditRidit值越大越好,否则越小越好。值越大越好,否则越小越好。但我们不能单纯以各组平均但我们不能单纯以各组平均RiditRidit值的大值的大小来判断各组的差异,因为小来判断各组的差异,因为RiditRidit值是一值是一个点估计,没有考虑抽样误差
33、,而样本个点估计,没有考虑抽样误差,而样本正好等于总体指标的可能性很小,因此正好等于总体指标的可能性很小,因此应该结合可信区间或统计检验方法综合应该结合可信区间或统计检验方法综合判断。判断。注意:注意:计算对比组可信区间计算对比组可信区间nSSRRRSR2对比组标准误:对比组标准误:对比组对比组95%可信区间:可信区间:计算对比组计算对比组95%CI并进行判断并进行判断糖衣组糖衣组95%95%CICI:0.45340.45340.51030.5103黄体酮组黄体酮组95%95%CICI:0.55780.55780.69970.6997复方组复方组95%95%CICI:0.42650.42650
34、.54970.5497判断:通过可信区间比较对比组与标准组的差判断:通过可信区间比较对比组与标准组的差别。看对比组别。看对比组95%95%可信区间是否包括标准组可信区间是否包括标准组RiditRidit值(值(0.50.5),不包括,则),不包括,则P0.05P0.05,差别有,差别有统计学意义。否则反之。统计学意义。否则反之。 图1 不同方剂对妇科病疗效比较图1 不同方剂对妇科病疗效比较糖衣黄体酮复方0.00.00.50.51.01.0Ridit值Ridit值对比组对比组95%CI图图标准组标准组 多个对比组的两两比较多个对比组的两两比较 2121221222121nnnnSRRSSRRuRRR21212, 1121121NNRRU统计界限:统计界限:u0.05,u0.05,差异无统计意义差异无统计意义 u1.96,P0.05,u1.96,P0.05,差异有统计意义差异有统计意义 u2.58,P0.01,u2.58,P0.01,差异有统计意义差异有统计意义 u 1,2 =3.84, u 1,3=0.18, u 2,3 =2.99小小 结结