1、对于符合参数统计分析条件者,采用对于符合参数统计分析条件者,采用非参数统计分析,其非参数统计分析,其检验效能较低检验效能较低 秩和检验秩和检验两独立样本差别的秩和检验两独立样本差别的秩和检验配对设计资料的秩检验配对设计资料的秩检验完全随机设计多组差别的秩和检验完全随机设计多组差别的秩和检验 秩和检验(秩和检验(rank sum testrank sum test):一类常用):一类常用的非参数统计分析方法;基于数据的秩次与的非参数统计分析方法;基于数据的秩次与秩次之和秩次之和 两独立样本比较的秩和检验两独立样本比较的秩和检验Wilcoxon rank sum test 对于计量数据,如果资料对
2、于计量数据,如果资料方差相等方差相等,且服从,且服从正态正态分布,就可以用分布,就可以用 t 检验比较两样本均数。检验比较两样本均数。 如果此假定不成立或不能确定是否成立,就如果此假定不成立或不能确定是否成立,就应采用秩和检验来分析两样本是否来自同一总应采用秩和检验来分析两样本是否来自同一总体。体。 表表 两组患者生存时间(月)两组患者生存时间(月)无淋巴细胞转移无淋巴细胞转移有淋巴细胞转移有淋巴细胞转移时间时间秩次秩次时间时间秩次秩次124.5512510822711124.52912.5124.53817124.542191774620218462124956232912.56024301
3、43415361640184822 n1=10秩和秩和 T1=162n2=14秩和秩和 T2=138如果两总体如果两总体分布相同分布相同 基本思想基本思想两样本来自同一总体两样本来自同一总体 任一组秩和不应太大或太小任一组秩和不应太大或太小 T T 与与平均平均秩和秩和 应相差不大应相差不大 212121),min( ,nnTTnnT较小例数组的秩和),min(21021nnnnnN2/ )1 (0Nn假定:两组样本的总体分布形状相同假定:两组样本的总体分布形状相同 H0:两样本来两样本来自相自相同总体;同总体; H1:两样本来自不同总体(双侧):两样本来自不同总体(双侧) =0.05 编秩编
4、秩:两样本混合编秩次,求得:两样本混合编秩次,求得T1、T2、T。 相同观察值(即相同秩,相同观察值(即相同秩,ties),不同组),不同组-平均秩次。平均秩次。 确定确定P值作结论:值作结论: 查表法查表法 (n010,n2 n110) 查附表查附表9 如果如果T T 位于检验界值区间内,位于检验界值区间内, ,不拒绝,不拒绝H H0 0;否;否则,则, ,拒绝,拒绝H H0 0 本例本例T T =162 =162,取,取 =0.05=0.05,查附表,查附表9 9得双侧检验界值区间得双侧检验界值区间(9191,159159),),T T位于区间外,位于区间外,P P0.05T0.05时,时
5、,P0.05, TT0.05时,时,P0.05 本例:例:T T=3 =3 T0.05(8)3 33333,P 10)时,可采用正态近似)时,可采用正态近似例例9.2 完全随机设计多个样本比较的秩和检验完全随机设计多个样本比较的秩和检验(Kruskal-Wallis法)法) 对于完全随机设计多组资料比较,如果不满足方差分析的条件,可采用Kruskal-Wallis秩和检验。 此法的基本思想与Wilcoxon-Mann-Whitney法相近:如果各组处理效应相同,混合编秩号后,各组的秩和应近似相等。1.建立假设,确定检验水准建立假设,确定检验水准 H H0 0:多个总体分布相同。多个总体分布相同
6、。 H H1 1:多个总体分布不全相同。多个总体分布不全相同。2.编秩:多组数据从小到大混合编秩。注意:遇不同组相同数据,编秩:多组数据从小到大混合编秩。注意:遇不同组相同数据,取平均秩次。取平均秩次。3.求各组秩和:将各组秩次相加,即求各组秩和:将各组秩次相加,即Ti,i表示组号。表示组号。4.计算检验统计量:计算检验统计量:相同秩次太多时,上式需校正。相同秩次太多时,上式需校正。5.确定确定p值,得出结论:值,得出结论:(1)当)当k=3,每组例数,每组例数5,查,查H界值表。界值表。(2)k k3 3,n ni i5 5,近似服从,近似服从 = k 1 的的 2 分布分布,查,查 2界界
7、值表值表。假设检验步骤假设检验步骤) 1( 3) 1(122NnTNNHiiH H 的校正与的校正与 2 2近似近似 当有相同秩次时,当有相同秩次时,H H 需校正:需校正: 当当 n n 较大时,较大时, H H 近似服从近似服从 = = k k 1 1 的的 2 2 分布。分布。 故可按故可按 2 2 分布获得概率分布获得概率 P P,作出统计推断。,作出统计推断。33/1()/()CjjHH CCttNN P85 例9.5正常患自发性白血病的脾患移植白血病的脾(甲)患移植白血病的脾(乙)脾含量秩次含量秩次含量秩次含量秩次12.31810.889.319.5213.22211.61310.
8、33.510.33.513.72612.31811.11110.5515.22812.72111.71410.5615.82913.52611.71510.5716.93013.52412.01610.5917.33114.82712.31610.91017.43212.42011.01213.62511.5n1=8T1=216n2=7T2=134n3=9T3=123.5n4=8T4=54.5表表9-6 9-6 各组鼠脾各组鼠脾DNADNA含量(含量(mgmg)的秩和计算)的秩和计算建立假设检验建立假设检验 H H0 0:四组鼠脾:四组鼠脾DNADNA含量的总体分布相同。含量的总体分布相同。
9、H H1 1:四组鼠脾:四组鼠脾DNADNA含量的总体分布位置不全相含量的总体分布位置不全相同。同。 0.050.05计算统计量计算统计量90.19132385.5495.123713482161323212)1N(3nT)1N(N12H2222i2i假设检验步骤假设检验步骤查表及结论查表及结论 现现k k=4=4,= =k k-1=4-1=3-1=4-1=3查界值表查界值表 2 20.050.05, ,(3)(3)=7.81=7.81, 2 2 2 20.05,(3)0.05,(3); 0.050.05按按0.050.05水准,拒绝水准,拒绝 H H0 0,接受,接受H H1 1,故可认为四
10、组故可认为四组DNADNA含量有差别。含量有差别。 4. 求求P值,下结论值,下结论 (1) 查表:查表:k3,各组例数,各组例数ni 5,根据,根据H值查附表值查附表10 (2)如超出附表范围,在)如超出附表范围,在ni不太小时,理论上不太小时,理论上H近似于近似于 自由度为(自由度为(k1)的分布,故可查卡方界值表)的分布,故可查卡方界值表(附表(附表7)。本例:)。本例:0.05,自由度为,自由度为3的卡方界值为的卡方界值为7.81 计算所得卡方值计算所得卡方值19.9 , 所以所以P0.05。 在在0.05检验水平拒绝检验水平拒绝H0,接受,接受H1,认为四组认为四组DNA含量有含量有
11、差别。差别。 频数表法:频数表法:属于同一组段的观察值,一律属于同一组段的观察值,一律取平均秩次(组中值),再以该组段频数加权,取平均秩次(组中值),再以该组段频数加权,计算计算Hc值。值。 (见见p85 例例9.6)抗体滴度气雾组皮下注射组累计秩次范围平均秩次秩和80亿100亿80亿100亿皮下1:1024281-84.591891:201571239-3120300140201:401012133532-66494905886371:805792167-87773855396931:160125888-9591.591.5183475.51:32011969696合计33323196127
12、5.514681912.5表表9 9 不同途径免疫不同途径免疫2121天后血清抗体滴度的分布与秩和计算天后血清抗体滴度的分布与秩和计算 1. H0:三个总体分布相同,:三个总体分布相同,H1:三个总:三个总体分布不全相同体分布不全相同 =0.05 2. 编秩:计算各等级合计,确定秩次范编秩:计算各等级合计,确定秩次范围围 3. 求秩和:求秩和:各组频数与该组平均秩次乘各组频数与该组平均秩次乘积求和积求和 4. 计算统计量计算统计量 5. 确定确定P值作结论值作结论:查:查 2界值表界值表 2 =5.99,得,得P0.05,可认为三组血清抗体滴度水平的差别有统计学意可认为三组血清抗体滴度水平的差
13、别有统计学意义。义。 36.11) 196(3311912321468335 .127) 196(9612222H27.1296968821213535232388136.11333333cH 小小 结结 1. 1. 非参数检验在假设检验中不对参数作非参数检验在假设检验中不对参数作明确的推断,也不涉及样本取自何种分布的总明确的推断,也不涉及样本取自何种分布的总体。它的适用范围较广。常用的非参方法较为体。它的适用范围较广。常用的非参方法较为简便。易于理解掌握。当资料适用参数检验方简便。易于理解掌握。当资料适用参数检验方法时,用非参常会损失部分信息,降低检验效法时,用非参常会损失部分信息,降低检验效能。能。