1、秩和检验医学知识秩和检验医学知识2内容回顾内容回顾第二节第二节 分类变量资料的统计推断分类变量资料的统计推断一一四格表资料的四格表资料的2 2检验检验二二配对资料的配对资料的2 2检验检验三三行行列表资料的列表资料的2 2检验检验秩和检验医学知识3教学内容教学内容第一节第一节 非参数统计的适应条件非参数统计的适应条件第二节第二节 秩和检验秩和检验一一配对资料的符号秩检验配对资料的符号秩检验二二完全随机设计两组定量资料的秩和检验完全随机设计两组定量资料的秩和检验三三完全随机设计多组定量资料的秩和检验完全随机设计多组定量资料的秩和检验四四等级资料的秩和检验等级资料的秩和检验秩和检验医学知识4教学要
2、求教学要求1.1.掌握非参数统计的适应条件和主要的优掌握非参数统计的适应条件和主要的优缺点缺点2.2.熟悉几种秩和检验的编秩方法熟悉几种秩和检验的编秩方法3.3.了解几种秩和检验方法和步骤了解几种秩和检验方法和步骤秩和检验医学知识参数统计与非参数统计参数统计与非参数统计5 5参数统计(参数统计(parametric testparametric test)在总体分布类型已知(如正态分布)的条件下,在总体分布类型已知(如正态分布)的条件下,对其未知对其未知总体参数总体参数做假设检验。如做假设检验。如t t检验,检验,Z Z检验检验以及以及2 2检验。检验。应用条件为:正态分布,方差齐性应用条件为
3、:正态分布,方差齐性非参数统计(非参数统计(nonparametric testnonparametric test)不依赖于总体分布的一种假设检验方法,它直接不依赖于总体分布的一种假设检验方法,它直接对对总体分布总体分布进行假设,不受总体分布的限制,适进行假设,不受总体分布的限制,适用范围广。用范围广。秩和检验医学知识第一节第一节 非参数统计的适用条件非参数统计的适用条件6 61.1.总体分布未知或分布类型不明的资料总体分布未知或分布类型不明的资料2.2.偏态分布的资料偏态分布的资料3.3.不满足参数统计条件(如不满足参数统计条件(如方差不齐方差不齐)的数值变)的数值变量资料量资料4.4.个
4、别数据偏大或数据一端或两端是不确定数值个别数据偏大或数据一端或两端是不确定数值5.5.等级资料等级资料单项有序单项有序R RC C资料资料秩和检验医学知识非参数统计的优缺点非参数统计的优缺点7 7优点优点适用范围广适用范围广对数据要求不严对数据要求不严方法简便,易于理解和掌握方法简便,易于理解和掌握缺点缺点符合参数检验的资料,如用非参数检验,会丢失符合参数检验的资料,如用非参数检验,会丢失信息,导致检验效率下降,检验效能低信息,导致检验效率下降,检验效能低符合条件符合条件 首选参数检验首选参数检验不符合条件不符合条件 非参数检验非参数检验秩和检验医学知识第二节第二节 秩和检验秩和检验8 基于秩
5、次的秩和检验(基于秩次的秩和检验(rank sum test)是是非参数统计方法中最常用的一种。非参数统计方法中最常用的一种。基本思想基本思想:将原始资料在不分组的情况下从小:将原始资料在不分组的情况下从小到大排顺序,即编到大排顺序,即编秩次秩次,然后分组将秩次相加,然后分组将秩次相加得到各组得到各组秩和秩和,若组间秩和相差不大,则认为,若组间秩和相差不大,则认为各组间无差异。各组间无差异。适用资料类型适用资料类型:数值变量资料,等级资料:数值变量资料,等级资料秩和检验医学知识9A组组B组组3.45.35.46.53.94.45.56.63.43.94.45.35.45.56.56.61 2
6、3 4 5 6 7 8 秩次秩次1+4+5+7=172+3+6+8=19秩和检验医学知识一、配对资料的符号秩和检验一、配对资料的符号秩和检验10对于配对设计的数值变量资料:对于配对设计的数值变量资料:差值符合正态分布差值符合正态分布 配对配对t检验检验差值非正态差值非正态 Wilcoxon符号秩检验符号秩检验Wilcoxon符号秩检验符号秩检验 用于推断配对资料的用于推断配对资料的差值差值是否来自是否来自中位数中位数为零的总体为零的总体。秩和检验医学知识一、配对资料的符号秩和检验一、配对资料的符号秩和检验1111秩和检验医学知识12121 1、建立检验假设,确定检验水准、建立检验假设,确定检验
7、水准H H0 0:差值的总体中位数等于:差值的总体中位数等于0 0,M Md d=0=0。H H1 1:差值的总体中位数不等于:差值的总体中位数不等于0 0,M Md d00。=0.05=0.052 2、求差、求差 各组数据的差值各组数据的差值d d3 3、编秩、编秩 按按差值差值的的绝对值由小到大绝对值由小到大编秩,并将秩次编秩,并将秩次按差值的正负加上正负号。按差值的正负加上正负号。当差值为当差值为0 0时,则省去不计秩次。时,则省去不计秩次。若差值的绝对值相等,各取平均秩次若差值的绝对值相等,各取平均秩次(相持)(相持)秩和检验医学知识13134 4、求秩和、求秩和 分别计算正负差值的秩
8、次之和,用分别计算正负差值的秩次之和,用T T+和和T T-表示。表示。本例:本例:T T+=1=1,T T-=170=170。5 5、确定统计量、确定统计量T T 任取任取T T+或或T T-为统计量为统计量T,T,但是做双侧检验时,但是做双侧检验时,通常以绝对值较小者为统计量通常以绝对值较小者为统计量T T。T=min T=min(T T+,T T-)n n是对子数是对子数 验证计算的正确与否验证计算的正确与否秩和检验医学知识14146 6、确定、确定P P值并作出推断结论值并作出推断结论1)查表法()查表法(5n505n50)配对设计用配对设计用T界值表(界值表(附表附表6,P1356,
9、P135)PTPT则在上下界值范围外时,若现有统计量则在上下界值范围内时,判断:若现有统计量本例:本例:n=18n=18,T=1T=1,查附表,查附表6 6,T T0.050.05=40-131=40-131P0.05P0.05,按,按=0.05=0.05检验水准,拒绝检验水准,拒绝H H0 0接受接受H H1 1,可认为治疗前后胆碱水平差异有统计学意义。可认为治疗前后胆碱水平差异有统计学意义。秩和检验医学知识1515秩和检验医学知识16秩和检验医学知识配对资料的编秩规则配对资料的编秩规则171.按照配对设计,先求出对子间的按照配对设计,先求出对子间的差值差值d;2.按其按其差值的绝对值差值的
10、绝对值,从小到大进行,从小到大进行排序排序,其序号即秩次,并在秩次之前保持原差值其序号即秩次,并在秩次之前保持原差值的正负号不变;的正负号不变;3.编编秩遇到差值为秩遇到差值为零零时则舍去不编秩;时则舍去不编秩;4.对对绝对值相等的差值取平均值绝对值相等的差值取平均值,并在秩次,并在秩次之前保持原差值的正负号。之前保持原差值的正负号。秩和检验医学知识二、完全随机设计两组定量资料的二、完全随机设计两组定量资料的秩和检验秩和检验18对于完全随机设计的两组数值变量资料:对于完全随机设计的两组数值变量资料:正态分布,方差齐正态分布,方差齐 t检验和检验和Z检验检验非正态,方差不齐非正态,方差不齐 Wi
11、lcoxon秩和检验秩和检验Wilcoxon符号秩检验符号秩检验 用于用于判断两总体分布是否有判断两总体分布是否有差异差异秩和检验医学知识19例例5.25.2(P69P69)某研究者欲考察单抗、利巴韦某研究者欲考察单抗、利巴韦林两种药物对乙型脑炎患者的治疗效果,将林两种药物对乙型脑炎患者的治疗效果,将2020名年龄、病情等方面相近的患者随机等分到两名年龄、病情等方面相近的患者随机等分到两个处理组中,测量退热时间(天),具体数据个处理组中,测量退热时间(天),具体数据见表见表5-2.5-2.请问两组治疗所得的平均效果之间的请问两组治疗所得的平均效果之间的差别是否具有统计学意义?差别是否具有统计学
12、意义?本例进行正态性检验后,认为不服从正态分布,本例进行正态性检验后,认为不服从正态分布,不满足两独立样本不满足两独立样本t t检验的条件,故用秩和检验。检验的条件,故用秩和检验。秩和检验医学知识2020秩和检验医学知识21211 1、建立检验假设,确定检验水准、建立检验假设,确定检验水准H H0 0:两个总体分布相同。:两个总体分布相同。H H1 1:两个总体分布不相同。:两个总体分布不相同。=0.05=0.052 2、编秩、编秩 将两组数据由小到大混合编秩。将两组数据由小到大混合编秩。若有相同数值,则取平均秩次。若有相同数值,则取平均秩次。秩和检验医学知识表表5-2 5-2 两组患者的退热
13、时间两组患者的退热时间(天天)单抗组单抗组利巴韦林组利巴韦林组退热时间退热时间秩次秩次退热时间退热时间秩次秩次1 11.51.5323220202 23.53.5131318.518.51 11.51.56 610.510.52 23.53.57 712125 58 8101015159 914148 813136 610.510.55 58 84 45.55.54 45.55.5131318.518.512121717111116165 58 8n n1 1=10=10n n2 2=10=102222秩和检验医学知识23234 4、确定统计量、确定统计量T T若若n n1 1=n=n2 2,
14、任取,任取T T1 1或或T T2 2为统计量为统计量T T若若n n1 1nn2 2,样本例数较小者对应的秩和为统计量,样本例数较小者对应的秩和为统计量本例:本例:n n1 1=n=n2 2=10=10,任取,任取T T1 1=82.5=82.53 3、求秩和、求秩和 将两组秩次分别求和,用将两组秩次分别求和,用T T1 1和和T T2 2表示。表示。本例:本例:T T1 1=82.5=82.5,T T2 2=127.5=127.5。秩和检验医学知识24245 5、确定、确定P P值并作出推断结论值并作出推断结论1)查表法()查表法(n n1 11010且且n n2 2-n-n1 11010
15、)两样本比较用两样本比较用T界值表(界值表(附表附表7,P1367,P136)PTPT则在上下界值范围外时,若现有统计量则在上下界值范围内时,判断:若现有统计量本例:本例:n n1 1=10=10,n n2 2-n-n1 1=0=0,查附表,查附表7 7,T T0.050.05=78-132=78-132 P P0.050.05,按,按=0.05=0.05检验水准,不拒绝检验水准,不拒绝H H0 0,尚,尚不能认为两种药物总体退热疗效差别有统计学意义。不能认为两种药物总体退热疗效差别有统计学意义。秩和检验医学知识25秩和检验医学知识三、完全随机设计多组计量资料的三、完全随机设计多组计量资料的秩
16、和检验秩和检验 26 完全随机设计多个样本比较的秩和检验完全随机设计多个样本比较的秩和检验(Kruskal-Wallis(Kruskal-Wallis法法)又称又称 K-WK-W检验或检验或H H 检验。检验。适用适用于完全随机设计分组的多个样本比较于完全随机设计分组的多个样本比较(即不满足参数统计条件的),目的在于判断(即不满足参数统计条件的),目的在于判断多个总体分布是否相同。多个总体分布是否相同。例例5.3(P71)5.3(P71)表表5-35-3为某县为某县1990-19911990-1991年自来年自来水厂出厂水铝含量检测结果,问不同季节水水厂出厂水铝含量检测结果,问不同季节水铝含量
17、是否不同?铝含量是否不同?秩和检验医学知识2727秩和检验医学知识28281 1、建立检验假设,确定检验水准、建立检验假设,确定检验水准H H0 0:四个季节铝含量总体分布相同。:四个季节铝含量总体分布相同。H H1 1:四个季节铝含量总体分布不相同。:四个季节铝含量总体分布不相同。=0.05=0.052 2、编秩、编秩 将四组数据由小到大混合编秩将四组数据由小到大混合编秩 若有相同数值,则取平均秩次。若有相同数值,则取平均秩次。秩和检验医学知识30304 4、确定统计量、确定统计量H H3 3、求秩和、求秩和 将四组秩次分别求和,用将四组秩次分别求和,用R R1 1、R R2 2、R R3
18、3、R R4 4表示。表示。5.26045.12435.17425.2601本例RRRR)1(3)2()1(12NiniRNNHinNiniR为各组例数为各组秩和93.9)140(3)1025.2601021241025.1741025.260()140(4012H秩和检验医学知识31315 5、确定、确定P P值并作出推断结论值并作出推断结论05.02)(05.005.02)(05.01353522PHPHPkHknHknii则若则若值。的界值表得到相应分布,通过查的组数自由度渐进地服从时,统计量,或若任一组的表(本书没有此表)。界值时,可查,且组数若每组的样本例数秩和检验医学知识3232量
19、不全相同。节自来水厂出厂水铝含,可认为不同季,接受水准,拒绝按的可省略校正计算)已经本例1005.0205.0(05.02)2(05.093.981.72)3(05.0314HHHPH 若还希望分析具体哪些季节之间有差别,需进若还希望分析具体哪些季节之间有差别,需进一步两两组间比较。一步两两组间比较。秩和检验医学知识四、等级资料的秩和检验四、等级资料的秩和检验33适用范围适用范围:完全随机设计分组的两个、以及两:完全随机设计分组的两个、以及两个以上样本等级程度比较,目的在于判断两个个以上样本等级程度比较,目的在于判断两个以及多个总体分布是否相同。以及多个总体分布是否相同。检验。程度的比较不应选
20、注意:有序分类资料对2秩和检验医学知识34 例例5.45.4(P72P72)某研究者欲比较局部注射亚甲某研究者欲比较局部注射亚甲蓝方法与局部封闭方法治疗跟痛症的治疗效果。亚蓝方法与局部封闭方法治疗跟痛症的治疗效果。亚甲蓝局部注射为治疗组甲蓝局部注射为治疗组8282例,局部封闭为对照组例,局部封闭为对照组4242例,随访例,随访8 8个月进行疗效观察,治疗后疗效分为优、个月进行疗效观察,治疗后疗效分为优、良、可、差良、可、差4 4个等级,数据见表个等级,数据见表5-45-4,试问两种治疗,试问两种治疗方法对跟痛症的治疗效果有无不同?方法对跟痛症的治疗效果有无不同?秩和检验医学知识35说明:说明:
21、本例是本例是单向有序单向有序4 42 2表资料,疗效为有序分类表资料,疗效为有序分类变量,而分组变量为无序分类变量。变量,而分组变量为无序分类变量。卡方检验:损失疗效等级信息,反映两组构成差别;卡方检验:损失疗效等级信息,反映两组构成差别;秩和检验:考虑了疗效等级信息。秩和检验:考虑了疗效等级信息。秩和检验医学知识36361 1、建立检验假设,确定检验水准、建立检验假设,确定检验水准H H0 0:两组治疗方法疗效的总体分布相同。:两组治疗方法疗效的总体分布相同。H H1 1:两组治疗方法疗效的总体分布不相同。:两组治疗方法疗效的总体分布不相同。=0.05=0.052 2、编秩、编秩 等级资料:
22、相同等级的个体属于相持等级资料:相同等级的个体属于相持 合计人数合计人数-各等级秩次范围各等级秩次范围-各等级平均秩次各等级平均秩次秩和检验医学知识3737表表5-4 5-4 两种方法跟痛症的疗效比较两种方法跟痛症的疗效比较疗效疗效例数例数合计合计秩次秩次范围范围平均平均秩次秩次治疗组治疗组对照组对照组优优4848131361611-611-613131良良21211414353562-9662-967979可可11111010212197-11797-117107107差差2 25 57 7118-124118-124121121合计合计828242422424秩和检验医学知识38383 3
23、、求秩和、求秩和 将各等级的平均秩次分别于各等级例数相乘,将各等级的平均秩次分别于各等级例数相乘,再求和可得到再求和可得到T T1 1和和T T2 2。秩和检验医学知识39394 4、确定检验统计量、确定检验统计量本例本例n n1 1=42=42超过了成组超过了成组T T界值表(附表界值表(附表7 7)的范)的范围,且围,且相同秩次过多,进行如下校正。相同秩次过多,进行如下校正。9487.212/)1124(82425.02/)1124(42318412/)1(5.02/)1(2121211nnnnnnnTu8535.0124124)77()2121()3535()6161(1)3/()3(1
24、33333NNjtjtc1917.38535.09487.2/cucu秩和检验医学知识40405 5、确定、确定P P值并作出推断结论值并作出推断结论8.754231842227.558245661111005.005.005.096.105.0)(nTTnTTHHPuuuut。的疗效优于局部封闭法亚甲蓝方法治疗跟痛症注射治疗效果有不同,局部种治疗方法对跟痛症的,可以认为两,接受水准,拒绝按故今得界值表或查界值表中查秩和检验医学知识41秩和检验医学知识小结小结1 142421.1.总体分布未知或分布类型不明总体分布未知或分布类型不明2.2.偏态分布的资料偏态分布的资料3.3.不满足参数统计条件
25、(不满足参数统计条件(组间方差不齐组间方差不齐)的数值)的数值变量资料变量资料4.4.个别数据偏大或数据一端或两端是不确定数值个别数据偏大或数据一端或两端是不确定数值5.5.等级资料等级资料单项有序单项有序R RC C资料资料非参数统计的适用条件非参数统计的适用条件秩和检验医学知识小结小结2 24343非参数统计的优缺点非参数统计的优缺点优点优点适用范围广适用范围广对数据要求不严对数据要求不严方法简便,易于理解和掌握方法简便,易于理解和掌握缺点缺点符合参数检验的资料,如用非参数检验,会丢符合参数检验的资料,如用非参数检验,会丢失信息,导致检验效率下降失信息,导致检验效率下降秩和检验医学知识4444小结小结3 3几种秩和检验的编秩方法几种秩和检验的编秩方法l 配对设计配对设计-按按差值的绝对值由小到大编秩,并将秩次差值的绝对值由小到大编秩,并将秩次按差值的正负加上正负号按差值的正负加上正负号。l 完全随机设计完全随机设计-将两组或两组以上的数据将两组或两组以上的数据由小到大混由小到大混合编合编秩。秩。l 等级等级资料资料-相同相同等级的个体属于相持等级的个体属于相持 注意:注意:当当差值为差值为0 0时,则省去不计秩次。时,则省去不计秩次。若有相同数值,若有相同数值,各取平均秩各取平均秩次次秩和检验医学知识