1、 医学统计学 (Medical Statistics)院医室楼院医室楼 4楼楼 Tel:0759-2388590 E-mail:gdmyfyx 医学统计学教研室医学统计学教研室 Department of Statistical Medicine秩和检验秩和检验2/45rank sum test第十一章第十一章 非参数检验非参数检验简单复习一下前面所学内容简单复习一下前面所学内容 统计描述统计描述统计推断统计推断适用条件适用条件 计量资料计量资料(定量资料定量资料)频数分布频数分布集中趋势集中趋势离散趋势离散趋势统计图表统计图表抽样误差、抽样误差、标准误标准误 t u F检验检验秩和检验秩和检
2、验 正态分布正态分布 方差齐性方差齐性 计数资料计数资料(定性资料定性资料)(分类资料分类资料)(无序分类无序分类)频数分布频数分布相对数及相对数及其标准化其标准化统计图表统计图表u 2检验检验分布类型分布类型 样本例数样本例数理论频数理论频数 等级资料等级资料(有序分类有序分类)秩和检验秩和检验 3/45 复习一下正态分布的判断方法复习一下正态分布的判断方法 4/45利用频数表或频数图进行判断利用频数表或频数图进行判断根据专业知识判断:疾病的潜伏期、住院天数和根据专业知识判断:疾病的潜伏期、住院天数和 临床生化指标大多为偏态临床生化指标大多为偏态正态性检验正态性检验 正态分布的经验判断正态分
3、布的经验判断 若若 ,则有理由怀疑资料呈偏态分布,则有理由怀疑资料呈偏态分布 若若 ,可认为资料呈偏态分布,可认为资料呈偏态分布XS3XS 参数统计(参数统计(parametric statistics)参数统计要求样本来自某种特定分布的参数统计要求样本来自某种特定分布的总体,而该分布中的某些参数未知,统总体,而该分布中的某些参数未知,统计分析的目的就是对这些未知参数进行计分析的目的就是对这些未知参数进行估计或推断,如估计或推断,如t检验、方差分析都要求检验、方差分析都要求原始数据来自于正态分布的总体,且方原始数据来自于正态分布的总体,且方差齐性。差齐性。非参数统计非参数统计(non-para
4、metric statistics)有许多资料不符合参数统计的要求,不有许多资料不符合参数统计的要求,不能用参数统计的方法进行检验,而需要能用参数统计的方法进行检验,而需要一种不依赖于总体分布类型,也不对总一种不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验,称为体参数进行统计推断的假设检验,称为非参数检验。非参数检验。非参数分析方法的优缺点非参数分析方法的优缺点优点:优点:不受总体分布条件的限制,适用范围广;某不受总体分布条件的限制,适用范围广;某些不便准确测定,只能以严重程度,好坏优劣,些不便准确测定,只能以严重程度,好坏优劣,次第先后等作记录的资料也可应用。次第先后等作记录的资
5、料也可应用。对资料没有特殊要求,例如对资料没有特殊要求,例如 不受分布的影响(偏态、分布不明的资料)不受分布的影响(偏态、分布不明的资料)不受方差齐性的限制不受方差齐性的限制 不受变量类型的影响不受变量类型的影响 不受样本量的影响不受样本量的影响非参数分析方法的优缺点非参数分析方法的优缺点缺点:缺点:适用于参数检验的资料若用非参数检验会造适用于参数检验的资料若用非参数检验会造成信息损失,导致检验效率较低。即当成信息损失,导致检验效率较低。即当H0H0不真,不真,非参数检验可能不如参数检验能较灵敏地拒绝非参数检验可能不如参数检验能较灵敏地拒绝H0 H0,犯第二类错误的概率比参数检验大犯第二类错误
6、的概率比参数检验大。若资料适用于参数方法(如正态分布,方若资料适用于参数方法(如正态分布,方差差齐性等,级就尽可能不用非参数方法)齐性等,级就尽可能不用非参数方法)第一类错误与第二类错误第一类错误与第二类错误 客观实际客观实际 拒绝拒绝H0 不拒绝不拒绝H0H0成立成立 第一类错误第一类错误,(误诊率,假阳误诊率,假阳性率性率)推断正确推断正确H0不成立推断正确推断正确第二类错误第二类错误(漏诊率,假(漏诊率,假阴性率)阴性率)优点优点:对资料的信息利用充分对资料的信息利用充分 统计分析的效率高统计分析的效率高 缺点:缺点:对资料的要求高对资料的要求高 适用范围有限适用范围有限7/45参数分析
7、方法的优缺点参数分析方法的优缺点 常用的非参数检验方法常用的非参数检验方法 秩和检验秩和检验 Ridit 分析分析 卡方检验卡方检验 K-S 法法 秩相关分析(等级相关分析)秩相关分析(等级相关分析)cpd 法法(积差交叉法)积差交叉法)游程检验游程检验 9/45秩秩 和和 检检 验验 秩和检验(秩和检验(rank sum test)是最常用的的非)是最常用的的非参数检验方法,也称参数检验方法,也称秩转换秩转换(rank transform-ation),该方法在非参数检验中占有重要地位。),该方法在非参数检验中占有重要地位。原理:原理:是首先将原始数据从小到大,或是首先将原始数据从小到大,或
8、 等级从弱到等级从弱到强转换成秩后,再对基于强转换成秩后,再对基于秩次秩次的统计量(如秩的统计量(如秩和),进行检验,做出统计推断。故又称基于秩和),进行检验,做出统计推断。故又称基于秩次的非参数检验。次的非参数检验。秩号:秩号:将各原始数据从小到大排列,分别给每个将各原始数据从小到大排列,分别给每个 数据一个顺序号,也就是秩号数据一个顺序号,也就是秩号(rank)。如:9 6 7.5 13 秩号:3 1 2 4 秩和:秩和:用秩次代替原始数据,在计算各组秩次之用秩次代替原始数据,在计算各组秩次之 和;和;秩和检验:秩和检验:基于秩和提供的信息,对不同总基于秩和提供的信息,对不同总 体的平均水
9、平进行假设检验。体的平均水平进行假设检验。秩和检验常用方法秩和检验常用方法 l 配对设计资料的符号秩和检验配对设计资料的符号秩和检验l 两独立样本差别的秩和检验两独立样本差别的秩和检验l 完全随机设计多组差别的秩和检验完全随机设计多组差别的秩和检验l 多个样本间两两比较的秩和检验多个样本间两两比较的秩和检验第一节第一节 WilcoxonWilcoxon 符号秩和检验符号秩和检验一、配对设计的两样本比较一、配对设计的两样本比较 10/45 什么叫配对设计?什么叫配对设计?是将实验对象按一定条件配成对子,如将年龄、是将实验对象按一定条件配成对子,如将年龄、体重一致的动物配成对子,再随机分配每对中的
10、两体重一致的动物配成对子,再随机分配每对中的两个对象接受不同的处理方式;或同一样品用两种方个对象接受不同的处理方式;或同一样品用两种方法(或仪器等)检验的结果;或同一受试对象两个法(或仪器等)检验的结果;或同一受试对象两个部位的数据。配对设计可增强组间的均衡性,提高部位的数据。配对设计可增强组间的均衡性,提高实验效率。实验效率。WilcoxonWilcoxon符号秩和检验符号秩和检验(WilcoxonWilcoxon 配对法,或配对法,或WilcoxonWilcoxon signed rank signed rank testtest)是推断其差值是否来自中位数为零的总体是推断其差值是否来自中
11、位数为零的总体的方法,可用于计量配对设计资料差值的比的方法,可用于计量配对设计资料差值的比较和单一样本与总体中位数的比较较和单一样本与总体中位数的比较 11/45请看课本请看课本P152P152例题例题11-111-1 为观察血浆置换法治疗出凝血功能异常为观察血浆置换法治疗出凝血功能异常的临床疗效的临床疗效,某医师治疗了某医师治疗了11例出凝血功例出凝血功能异常患者,置换前后各患者的凝血酶原能异常患者,置换前后各患者的凝血酶原时间见表时间见表11-1。该医师采用两样本均数比。该医师采用两样本均数比较的检验,结果,差异有统计学意义,由较的检验,结果,差异有统计学意义,由此认为血浆置换治疗前后凝血
12、酶原时间有此认为血浆置换治疗前后凝血酶原时间有差别。差别。11/45问题问题l (1)该资料为何种类型资料?)该资料为何种类型资料?l (2)该研究属于何种设计方案?)该研究属于何种设计方案?l (3)该医师所选用的统计分析方法是否正)该医师所选用的统计分析方法是否正 确?为什么?确?为什么?l (4)该资料应采用何种统计方法进行分)该资料应采用何种统计方法进行分 析?析?其步骤如何?其步骤如何?11/4511/45(1)该资料为计量资料。)该资料为计量资料。(2)该研究属自身配对设计方案。)该研究属自身配对设计方案。(3)该医师所选用的统计分析方法不正确。)该医师所选用的统计分析方法不正确。
13、原因在于:原因在于:自身配对设计资料一般自身配对设计资料一般 选用配对选用配对检验,而该医师采用完全随检验,而该医师采用完全随 机设计两样本均数比较的机设计两样本均数比较的t检验,统计检验,统计 方法与设计类型不符;方法与设计类型不符;该医师未考该医师未考 虑资料是否满足虑资料是否满足t检验的应用条件。检验的应用条件。t 建立检验假设,确定检验水准建立检验假设,确定检验水准 H H0 0:差值的总体中位数为零,即:差值的总体中位数为零,即M Md d=0=0 H H1 1:M Md d0 0 =0.05=0.05 计算检验统计量计算检验统计量v 求各对测量值的差值求各对测量值的差值v 编秩:编
14、秩原则编秩:编秩原则 12/45 按照差值的绝对值从小到大编秩按照差值的绝对值从小到大编秩v差值为差值为 0 0 者不参加编秩者不参加编秩v绝对值相等,符号相同时顺次编绝对值相等,符号相同时顺次编秩秩v绝对值相等,符号相反时取平均秩次绝对值相等,符号相反时取平均秩次 v 求秩和、确定检验统计量求秩和、确定检验统计量 T 值值 分别求出正、负秩和,正秩和以分别求出正、负秩和,正秩和以T+T+表示,负表示,负 秩和以秩和以T-T-表示。任取正秩和或负秩和为统计表示。任取正秩和或负秩和为统计 量量T值。其中值。其中 T+T-=n(n+1)/2T+T-=n(n+1)/2,n n 为有效对子数为有效对子
15、数 确定确定P P 值、作出统计推断结论值、作出统计推断结论v 查表法:查表法:用于有效对子数用于有效对子数 n50 (P345)n50 (P345)若若T 值在上、下界值范围内,则值在上、下界值范围内,则 P0.05 若若T 值在上、下界值上或范围外值在上、下界值上或范围外,则,则 P0.05 14/4515/45v 正态近似法:正态近似法:用于有效对子数用于有效对子数 n n5050 1)1)当差值绝对值相同的个数当差值绝对值相同的个数nn25%25%时时 差值绝对值相同差值绝对值相同即指相同秩。指差值的绝对即指相同秩。指差值的绝对值值相等者取平均秩。也就是秩次相等的个数,可用相等者取平均
16、秩。也就是秩次相等的个数,可用tjtj表示。如表示。如t1t1指第一个出现相同秩次的个数。本例指第一个出现相同秩次的个数。本例中中有两个秩次为有两个秩次为2.5(2.5(指绝对值指绝对值),则,则t1=2;t1=2;有两个秩有两个秩次为次为6.5,6.5,则则t2=2t2=2。当。当tjntjn25%25%时,公式如下时,公式如下 24/)12)(1(5.04/)1(nnnnnTu 2)2)当差值绝对值相同的个数当差值绝对值相同的个数n n25%25%时时 上式中,上式中,tjtj 为第为第 j j 个差值绝对值相同的个数个差值绝对值相同的个数16/4548)(24)12)(1(5.04/)1
17、(3jjttnnnnnTujjtt3jjtt3=(2=(23 3-2)+(2-2)+(23 3-2)=12-2)=12 如果还有相同的,再相应加上,依此类推如果还有相同的,再相应加上,依此类推(2 2)单一样本与总体中位数比较)单一样本与总体中位数比较 (见课本(见课本P154P154例题例题11-211-2)已知某地正常人尿汞含量的中位数为已知某地正常人尿汞含量的中位数为2.50g/L,某,某医师从该地某厂从事土法炼金(汞齐法)的汞医师从该地某厂从事土法炼金(汞齐法)的汞作业工人中随机抽取作业工人中随机抽取10名工人,测得尿汞含量名工人,测得尿汞含量(g/L)为为11.01,2.13,2.5
18、6,2.79,12.95,3.12,3.56,4.37,5.13,18.90。采用单样本检验对资。采用单样本检验对资料进行分析,得,按水准,拒绝料进行分析,得,按水准,拒绝H0,接受,接受H1,差异有统计学意义,可以认为该厂工人尿汞含差异有统计学意义,可以认为该厂工人尿汞含量与正常人尿汞含量不同。量与正常人尿汞含量不同。17/4517/45 建立检验假设建立检验假设H0:工人的尿汞含量总体中位数等于:工人的尿汞含量总体中位数等于2.15,M=2.50H1:M 2.50单侧单侧=0.05计算检验统计量计算检验统计量v 求差值:求差值:这里的差值是各观察值与已知这里的差值是各观察值与已知 总体中位
19、数(总体中位数(2.50)之差)之差 v 编秩:编秩原则同上编秩:编秩原则同上v 求秩和、确定检验统计量求秩和、确定检验统计量 T 值:值:取取T+和和 T-的任意一个作为检验统计量的任意一个作为检验统计量v 确定确定P值、作推断结论值、作推断结论 本例本例n=10,T=4.5,查,查T界值表(配对比较的符号界值表(配对比较的符号秩和检验用,附表秩和检验用,附表10),得),得P 20.05,3,故故P0.05,按水准,按水准拒绝拒绝H0,接受,接受H1,差异有统计学意义,可认为斯康,差异有统计学意义,可认为斯康杜尼和利多卡因麻醉效果不相同,斯康杜尼的麻醉效杜尼和利多卡因麻醉效果不相同,斯康杜
20、尼的麻醉效果好于利多卡因。果好于利多卡因。28/451建立检验假设,确定检验水准建立检验假设,确定检验水准H0:两种药物麻醉效果的总体分布相同:两种药物麻醉效果的总体分布相同H1:两种:两种药物麻醉效果的药物麻醉效果的总体分布不同总体分布不同 =0.052计算检验统计量:详见课本计算检验统计量:详见课本P158例题例题 (代入公式如下)(代入公式如下)79555.412/)1109(56535.02/)1109(535.3706u78874.0109109)77()1111()2828()6363(1)/()(13333333NNttcjj uc=4.79555/0.8881=5.4029/4
21、5最后与最后与1.96比较作出结论,比较作出结论,P0.05,按按 =0.05水准水准拒绝拒绝H0,接受,接受H1,差异有统计学意义,可以认为,差异有统计学意义,可以认为斯康杜尼和利多卡因应用于深牙周袋刮治术的局斯康杜尼和利多卡因应用于深牙周袋刮治术的局部麻醉效果的总体分布不同,斯康杜尼的效果好部麻醉效果的总体分布不同,斯康杜尼的效果好于利多卡因。于利多卡因。l 两样本比较的Wilcoxon秩和检验用于完全随机(成组)设计两样本资料的比较,是针对呈偏态分布或方差不齐不满足t检验条件的计量资料、等级资料和其它不能精确测量的资料的比较。31/45第三节第三节 成组设计多个样本比较的秩和检验成组设计
22、多个样本比较的秩和检验一、一、KruskalKruskal-Wallis-Wallis 法,又称法,又称H H 检验法检验法 该法是由该法是由KruskalKruskal和和WallisWallis在在WilcoxonWilcoxon秩和检秩和检验的基础上扩展的方法,又称为验的基础上扩展的方法,又称为K-WK-W检验或检验或H H检验。检验。本法利用多个样本的秩和来推断各样本分别代表本法利用多个样本的秩和来推断各样本分别代表的总体分布有无差别。的总体分布有无差别。(1)原始数据的多个样本比较)原始数据的多个样本比较见课本见课本P159P159例题例题11-511-5l例例11-511-5为探讨
23、血管紧张素转化酶抑制剂开博通抗动脉粥为探讨血管紧张素转化酶抑制剂开博通抗动脉粥样硬化的机制,某医师将样硬化的机制,某医师将15只兔随机分为三组,即正常饮只兔随机分为三组,即正常饮食组、高脂饮食组及高脂饮食加开博通组,喂养食组、高脂饮食组及高脂饮食加开博通组,喂养14周后测周后测量兔血清总胆固醇量兔血清总胆固醇(TC)水平,结果如下:水平,结果如下:l正常饮食组:正常饮食组:0.86 0.78 1.38 0.88 1.70l高脂饮食组:高脂饮食组:40.35 41.79 44.00 40.72 27.05l高脂饮食加开博通组:高脂饮食加开博通组:41.20 33.04 40.60 32.05 4
24、0.4932/45 该医师应用方差分析对资料进行分析,F=104.41,P0.05,差异有统计学意义,采用t检验进一步作两两比较,得高脂饮食组及高脂饮食加开博通组均与正常组差异有统计学意义;但高脂饮食组与高脂饮食加开博通组两组间差异无统计学意义,故认为高脂饮食组及高脂饮食加开博通组的兔血清总胆固醇显著高于正常组;开博通对血脂无影响。方法步骤:方法步骤:建立检验假设建立检验假设H0:三个总体的分布位置相同:三个总体的分布位置相同H1:三个总体的分布位置不全相同:三个总体的分布位置不全相同=0.05lKruskal-Wallis 法法计算检验统计量计算检验统计量v 编秩:将各组数据统一由小到大排序
25、并编秩,编秩:将各组数据统一由小到大排序并编秩,如遇有相等数值则取平均秩次。如遇有相等数值则取平均秩次。v 求秩和:分别将各组秩次相加,得各组秩和求秩和:分别将各组秩次相加,得各组秩和v 计算检验统计量计算检验统计量 H 值值 )1(3)()1(122NnTNNHii 当相同秩次的个数当相同秩次的个数 n25%时,用上式时,用上式Ti为各组的秩和,为各组的秩和,ni为各组对应的例数。为各组对应的例数。33/45 2 2)当)当相同秩次的个数相同秩次的个数 n25%时时 tj 为第为第 j 个相同秩次的个数个相同秩次的个数 CHHC)/()(133NNttCjj34/45确定确定P 值、作出统计
26、推断结论值、作出统计推断结论v 查表法:组数查表法:组数 k=3,每组例数,每组例数 ni 5时,时,可查可查H界值表界值表 P347近似法近似法 若组数若组数 k=3,每组例数,每组例数 ni 5;或者;或者k 3 或者或者ni 5时,则时,则H分布近似分布近似 服从自由度为服从自由度为 k-1 的的 分布分布,可查可查 界值表确定界值表确定P 值值(2)频数表资料(或等级资料)的多个样本比较)频数表资料(或等级资料)的多个样本比较 步骤同上步骤同上 (详见课本(详见课本P160例题例题11-6,此略),此略)2235/45 多个样本比较的秩和检验多个样本比较的秩和检验(Kruskal-Wa
27、llis法,即法,即H检验)检验)例例11-4 某医院外科用三种手术方法治疗肝癌某医院外科用三种手术方法治疗肝癌患者患者15例,每组例,每组5例,进入各组的患者系用随例,进入各组的患者系用随机方法分配,每例术后生存月数如表机方法分配,每例术后生存月数如表11-6的第的第、栏。试问三种不同手术方法治疗肝栏。试问三种不同手术方法治疗肝癌的效果有无差别。癌的效果有无差别。11-6 三种手术方法治疗肝癌患者的术后表生存月数三种手术方法治疗肝癌患者的术后表生存月数 1.建立假设:建立假设:H0:三个总体分布的中心位置相同。:三个总体分布的中心位置相同。H1:三个总体分布的中心位置不全相同。:三个总体分布
28、的中心位置不全相同。0.05 2.编秩:编秩:将各组数据将各组数据混合由小到大编秩次,混合由小到大编秩次,如遇相同数值时,若相同数值在不同组内,如遇相同数值时,若相同数值在不同组内,则取平均秩次。则取平均秩次。甲甲法法生生存存月月数数 秩秩次次 乙乙法法生生存存月月数数 秩秩次次 丙丙法法生生存存月月数数 秩秩次次 3 3 4 4 9 9 1 13 3 1 1 1 1 7 7 1 10 0 1 12 2 1 15 5 2 2 2 2.5 5 7 7 1 10 0 1 11 1 1 14 4 6 6 7 7.5 5 6 6 7 7.5 5 8 8 1 12 2 4 4 5 5 2 2 2 2.5
29、 5 5 5 6 6 7 7 1 10 0 R Ri i 3 34 4 6 60 0 2 26 6 N Ni i 5 5 5 5 5 5 表表11-6 三种手术方法治疗肝癌患者的术后生存月数三种手术方法治疗肝癌患者的术后生存月数 3.求各组秩和:求各组秩和:4.计算检验统计量计算检验统计量H值:值:)1(3)1(122 NnRNNHii32.6)115(3526560534)115(1512222 H分子为分子为H值,分母值,分母C为校正数为校正数,CHHc NNttCjj 331NN)tt(HHjjC 331 校正后,校正后,HcH,P值减小。值减小。4.确定确定P值,判断结果:值,判断结果
30、:查附表查附表12,H界值表,界值表,H0.05 5.78,按,按=0.05水水准,得准,得P0.05,拒绝,拒绝H0,故三种手术方法术后生,故三种手术方法术后生存月数不全相等。存月数不全相等。36)33()22()22()(3333 jjtt39615153613263.HC (二)频数表法(二)频数表法:秩秩 和和 乳乳量量 早早产产 足足月月产产 过过期期产产 合合计计 秩秩次次范范围围 平平均均秩秩次次 早早产产 足足月月产产 过过期期产产 (1 1)(2 2)(3 3)(4 4)(5 5)(6 6)(7 7)(8 8)(9 9)(1 10 0)无无 3 30 0 1 13 32 2
31、1 10 0 1 17 72 2 1 1-1 17 72 2 8 86 6.5 5 2 25 59 95 5 1 11 14 41 18 8 8 86 65 5 少少 3 36 6 2 29 92 2 1 14 4 3 34 42 2 1 17 73 3-5 51 14 4 3 34 43 3.5 5 1 12 23 36 66 6 1 10 00 03 30 02 2 4 48 80 09 9 多多 3 31 1 4 41 14 4 3 34 4 4 47 79 9 5 51 15 5-9 99 93 3 7 75 54 4 2 23 33 37 74 4 3 31 12 21 15 56
32、6 2 25 56 63 36 6 合合计计 9 97 7 8 83 38 8 5 58 8 9 99 93 3 3 38 83 33 35 5 4 42 23 38 87 76 6 3 31 13 31 10 0 例例 比较不同孕周产妇的乳量。比较不同孕周产妇的乳量。表表11-8 分娩时孕周与乳量的关系分娩时孕周与乳量的关系1建立假设:建立假设:H0:三个总体分布的中心位置相同。:三个总体分布的中心位置相同。H1:三个总体分布中心位置不全相同。:三个总体分布中心位置不全相同。0.052编秩(第编秩(第5、6、7列)列)3求秩和(第求秩和(第8、9、10列)列)4计算检验统计量:计算检验统计量
33、:3.14)1993(358313108384238769738335)1993(99312222 H154992182)479479()342342()172172()(3333 jjjtt0.1799399315499138213.14)(1333 NNttHHjjjC 5.确定确定P值,判断结果:值,判断结果:当样本组数或样本例数超过当样本组数或样本例数超过H界值界值表的范围,则认为表的范围,则认为H值近似服从值近似服从 2分布,分布,查查 2界值表。界值表。本例:本例:查查 2界值表,界值表,=k 1=3 1=2,2 0.005,2=10.60,得,得P0.005,可认为分,可认为分娩
34、时的孕周对乳量有影响。娩时的孕周对乳量有影响。第四节第四节 随机区组设计的秩和检验随机区组设计的秩和检验36/45一、随机区组设计的秩和检验一、随机区组设计的秩和检验 什么叫随机区组设计?什么叫随机区组设计?也叫配伍组设计,是配对设计的扩大,是将条件也叫配伍组设计,是配对设计的扩大,是将条件相近的实验对象(三个及以上)配成一组,每组中相近的实验对象(三个及以上)配成一组,每组中的不同对象分别给以不同的处理措施。此种设计增的不同对象分别给以不同的处理措施。此种设计增强了各组间的均衡性,可进一步控制混杂性偏倚。强了各组间的均衡性,可进一步控制混杂性偏倚。本法是由本法是由M-FriedmanM-Fr
35、iedman在符号检验的基础上提出在符号检验的基础上提出来的,常称为来的,常称为FriedmanFriedman检验,又称检验,又称 M M 检验。检验。36/45 【例【例11-711-7】某医师为探讨多发伤后血清内皮某医师为探讨多发伤后血清内皮细胞特异性分子细胞特异性分子-1(ESM-1)-1(ESM-1)的变化,将的变化,将1212窝小白窝小白鼠(每窝鼠(每窝3 3只)制作成多发伤动物模型,再把每只)制作成多发伤动物模型,再把每窝窝3 3只多发伤小白鼠随机分配到只多发伤小白鼠随机分配到3 3个实验组,采静个实验组,采静脉血脉血4ml4ml,分离血清,成批检测,分离血清,成批检测ESM-1
36、(ng/ml)ESM-1(ng/ml),结果见表结果见表11-1011-10。该医师采用两样本均数比较的。该医师采用两样本均数比较的t t检验,结果三次两两比较的结果均为,差异均无检验,结果三次两两比较的结果均为,差异均无统计学意义,故认为多发伤后三组的血清内皮细统计学意义,故认为多发伤后三组的血清内皮细胞特异性分子胞特异性分子-1(ESM-1)-1(ESM-1)无差别。无差别。(1)M 检验(检验(Friedman法)查表法法)查表法 (用于区组数(用于区组数b15,处理组数,处理组数k15)方法步骤:方法步骤:建立检验假设建立检验假设计算检验统计量计算检验统计量v 编秩、求各处理组的秩和编
37、秩、求各处理组的秩和 Ri:每个区组的数每个区组的数 据由小到大分别编秩,相同数据取平均秩次据由小到大分别编秩,相同数据取平均秩次v 求平均秩和求平均秩和 b区组数区组数 k处理组数处理组数v 求检验统计量求检验统计量M 值值 确定确定P 值、作出统计推断结论值、作出统计推断结论(P162例题例题11-7))1(21kbR2)(RRMi37/45(2)F 检验检验(用于区组数(用于区组数b15 或处理组数或处理组数k15)方法步骤:方法步骤:建立检验假设建立检验假设计算检验统计量计算检验统计量v 编秩:编秩原则编秩:编秩原则 v 求各处理组的秩和求各处理组的秩和 Riv 计算所有数据秩次的平方
38、和计算所有数据秩次的平方和A 值值:若各区组内无相同秩次,可用若各区组内无相同秩次,可用:2ijRA6)12)(1(kkbkA38/4539/45v计算计算B 值值:v计算检验统计量计算检验统计量F 值:值:BAkbkBbF4)1()1(2 确定确定P 值、作出统计推断结论值、作出统计推断结论 查查F 界值表:界值表:1=k-1 2=(b-1)(k-1)21iRbB第五节第五节 多个样本两两比较的秩和检验多个样本两两比较的秩和检验成组设计多个样本两两比较的秩和检验成组设计多个样本两两比较的秩和检验 Nemenyi 法法 例题例题11-8(以例题(以例题11-5为例)为例)41/45l例例11-
39、511-5为探讨血管紧张素转化酶抑制剂开博通抗动脉粥为探讨血管紧张素转化酶抑制剂开博通抗动脉粥样硬化的机制,某医师将样硬化的机制,某医师将15只兔随机分为三组,即正常饮只兔随机分为三组,即正常饮食组、高脂饮食组及高脂饮食加开博通组,喂养食组、高脂饮食组及高脂饮食加开博通组,喂养14周后测周后测量兔血清总胆固醇量兔血清总胆固醇(TC)水平,结果如下:水平,结果如下:l正常饮食组:正常饮食组:0.86 0.78 1.38 0.88 1.70l高脂饮食组:高脂饮食组:40.35 41.79 44.00 40.72 27.05l高脂饮食加开博通组:高脂饮食加开博通组:41.20 33.04 40.60
40、 32.05 40.49该资料不服从正态分布,在进行多组间比该资料不服从正态分布,在进行多组间比较时采用较时采用KruskalKruskal-Wallis-Wallis 检验,推断结检验,推断结论为拒绝,接受,这与前面所介绍的多组论为拒绝,接受,这与前面所介绍的多组比较方差分析类似,只能得出三组资料总比较方差分析类似,只能得出三组资料总体分布不同或不全相同的结论,不能判断体分布不同或不全相同的结论,不能判断三组资料中哪些组间差异具有统计学意义。三组资料中哪些组间差异具有统计学意义。若要对每两个总体分布做出有无不同的推若要对每两个总体分布做出有无不同的推断,需要做组间的两两比较。断,需要做组间的
41、两两比较。41/45l多组秩和检验中做进一步的两两比较,需调整检验多组秩和检验中做进一步的两两比较,需调整检验水准水准。l检验水准的调整:对检验水准的调整:对k个样本组进行多次两两比较,个样本组进行多次两两比较,会增加第会增加第I类错误的概率。为保证第类错误的概率。为保证第I类错误的概率类错误的概率总共不超过,每次比较的第总共不超过,每次比较的第I类错误概率应采用式类错误概率应采用式(11-12)进行调整。进行调整。l=/总的比较次数总的比较次数l(1)=2/k(k-1)(多组两两比较)多组两两比较)(2)=/k-1(实验组与同一对照组比)实验组与同一对照组比)41/45方法步骤:(方法步骤:
42、(P165)建立检验假设建立检验假设确定检验水准确定检验水准计算检验统计量计算检验统计量 两两比较两两比较:设为设为k k个样本组,和分别为比较的第个样本组,和分别为比较的第i i组和组和 第第j j组样本的秩和,其平均秩和分别为和。组样本的秩和,其平均秩和分别为和。(1)精确法:精确法:样 本 含 量 较 小 时,应 采 用 两 样 本 秩 和 检 验 的样 本 含 量 较 小 时,应 采 用 两 样 本 秩 和 检 验 的 方法,求得统计量的数值后,借助方法,求得统计量的数值后,借助SAS和和SPSS软件的软件的“exact”功能得到相应的功能得到相应的P值(包括该数值对应的概率值(包括该
43、数值对应的概率和更极端情形的概率)和更极端情形的概率)。41/45(1)精确法:精确法:样 本 含 量 较 小 时,应 采 用 两 样 本 秩 和 检 验 的样 本 含 量 较 小 时,应 采 用 两 样 本 秩 和 检 验 的 方法,求得统计量的数值后,借助方法,求得统计量的数值后,借助SAS和和SPSS软件的软件的“exact”功能得到相应的功能得到相应的P值(包括该数值对应的概率值(包括该数值对应的概率和更极端情形的概率)和更极端情形的概率)。(2)正态近似法:正态近似法:当各样本组例数较大时,按下式当各样本组例数较大时,按下式(11-15)求得第求得第i组和第组和第j组组样本比较的值。
44、样本比较的值。41/45jijiijnnNNRRu1112)1(平均秩次平均秩次 ,公式的分母为公式的分母为 的标准误。的标准误。iiinRR jjjnRR jiRR 经多个样本比较的秩和检验,各组间有经多个样本比较的秩和检验,各组间有差别,试再进一步作两两比较。差别,试再进一步作两两比较。l 表表11-12 三组兔血清总胆固醇水平三组兔血清总胆固醇水平(mmol/L)的两两比的两两比较较l 利用标准正态分布或利用标准正态分布或SAS和和SPSS统计软件求得统计量统计软件求得统计量数值所对应的数值所对应的P值。将值。将P值与调整以后的检验水准值与调整以后的检验水准比比较,若较,若P 0.058
45、38.1515112)115(15128.6 u 1组和组和3组比较:组比较:P0.05566.0515112)115(152.58.6 t2组和组和3组比较:组比较:P0.05404.2515112)115(152.512 t4.确定确定P值,判断结果:值,判断结果:按按0.05水准,除了水准,除了2组与组与3组比较,组比较,拒绝拒绝H0,其余每二组间均无差别,可认,其余每二组间均无差别,可认为乙法优于丙法。为乙法优于丙法。二、随机区组设计多个样本间的多重比较二、随机区组设计多个样本间的多重比较 与完全随机设计多个样本组间的多重比较与完全随机设计多个样本组间的多重比较类似,对于随机区组设计资
46、料,当用类似,对于随机区组设计资料,当用Friedman Friedman M M检验拒绝后,同样需要对各处检验拒绝后,同样需要对各处理组间进行多重比较。采用调整检验水准,理组间进行多重比较。采用调整检验水准,两两做相关样本的秩和检验,即配对两两做相关样本的秩和检验,即配对wilcoxonwilcoxon符号秩和检验。符号秩和检验。42/45 以例以例11-7说明随机区组设计资料多重比说明随机区组设计资料多重比 较的基本步骤。(较的基本步骤。(P162)某医师为探讨多发伤后血清内皮细胞特异某医师为探讨多发伤后血清内皮细胞特异性分子性分子-1(ESM-1)-1(ESM-1)的变化,将的变化,将1
47、212窝小白鼠窝小白鼠(每窝(每窝3 3只)制作成多发伤动物模型,再把只)制作成多发伤动物模型,再把每窝每窝3 3只多发伤小白鼠随机分配到只多发伤小白鼠随机分配到3 3个实验个实验组,采静脉血组,采静脉血4ml4ml,分离血清,成批检测,分离血清,成批检测ESM-1(ng/ml)ESM-1(ng/ml),结果见表,结果见表11-1011-10。42/45小小 结结1.掌握非参数检验的概念及秩和检验的优掌握非参数检验的概念及秩和检验的优缺点。缺点。2.掌握配对设计资料、两组和多组完全随机掌握配对设计资料、两组和多组完全随机设计资料秩和检验的编次方法。设计资料秩和检验的编次方法。3.掌握如何确定配对设计资料、两组和多组掌握如何确定配对设计资料、两组和多组完全随机设计资料秩和检验的检验统计量。完全随机设计资料秩和检验的检验统计量。Thanks for listening!44/45 45/45