1、2022-10-281基础所流行病基础所流行病 王艳红王艳红2一、相关理论知识的回顾一、相关理论知识的回顾非参数检验特点非参数检验特点(定期复习十分重要定期复习十分重要)总体分布不作严格规定;总体分布不作严格规定;不依赖于总体分布类型(如正态分布)不依赖于总体分布类型(如正态分布)任意分布检验任意分布检验非参数检验的适用条件非参数检验的适用条件总体的分布不易确定总体的分布不易确定偏态分布偏态分布方差不齐方差不齐等级资料(等级资料(统计资料一般分为统计资料一般分为计量资料计量资料与与计数资料计数资料两大类,介于其间两大类,介于其间的一类资料称为等级资料的一类资料称为等级资料.不同类型的资料应采用
2、不同的分析方法。例不同类型的资料应采用不同的分析方法。例如用某药治如用某药治1.51.5指标的指标的特异性特异性指测量特定项目而不疗若干痢疾患者指测量特定项目而不疗若干痢疾患者,其其中治愈、好转、无效人受其它项目干扰的能力中治愈、好转、无效人受其它项目干扰的能力文献来源文献来源;化验结果分化验结果分为为:-:-、+、+、+、+5+5个有序等级个有序等级)3一、相关理论知识的回顾一、相关理论知识的回顾4一、相关理论知识的回顾一、相关理论知识的回顾(1)、)、Wilcoxon秩和检验秩和检验应用应用 两组连续变量资料的秩和检验两组连续变量资料的秩和检验 两组有序变量资料的秩和检验两组有序变量资料的
3、秩和检验基本思想:基本思想:假设两总体的分布相同(假设两总体的分布相同(H0),两样本),两样本可认为是从同一总体中抽取的随机样本可认为是从同一总体中抽取的随机样本;将;将二者混合后由小到大编秩,二者混合后由小到大编秩,然后分然后分别计算两组的平均秩和别计算两组的平均秩和R1与与R2,R1和和R2如果近似相等,其差别可能是由随机抽如果近似相等,其差别可能是由随机抽样引起的。样引起的。5一、相关理论知识的回顾一、相关理论知识的回顾6一、相关理论知识的回顾一、相关理论知识的回顾(1)、)、Wilcoxon秩和检秩和检验验公式公式1 1没有节点(没有节点(即没有相同的观察值即没有相同的观察值)公式公
4、式2 2有节点有节点112112121122112nnnRTnnnn112121121212121122(1)112()(1)giiinnnRTttnnnnnnnn7一、相关理论知识的回顾一、相关理论知识的回顾(2)、)、Kruskal-Wallis秩和检验秩和检验应用应用 多组多组连续变量资料的秩和检验连续变量资料的秩和检验 多组有序变量资料的秩和检验多组有序变量资料的秩和检验基本思想基本思想 同同Wilcoxon秩和检验秩和检验8一、相关理论知识的回顾一、相关理论知识的回顾(2)、)、Kruskal-Wallis秩和检秩和检验验 ,当,当K=3且至少有一组例且至少有一组例数大于数大于5时,
5、或者时,或者k3时服从卡时服从卡方分布;若方分布;若K=3且没有一组例且没有一组例数大于数大于5时,服从时,服从H分布。分布。公式公式1 1没有结没有结公式公式2 2有结有结21123(1)1kiiiRHNNNn 21313123(1)11kiiigjjiRNNNnHttNN9一、相关理论知识的回顾一、相关理论知识的回顾(3)、)、Friedman秩和检验秩和检验应用应用 随机区组设计资料随机区组设计资料基本思想基本思想 各区组的观察值按由小到大的各区组的观察值按由小到大的顺序进行编秩顺序进行编秩;如果各处理的;如果各处理的效应相同,各区组内秩效应相同,各区组内秩1,2,k应以相同的概率出现应
6、以相同的概率出现在各处理组(列)中,各处理在各处理组(列)中,各处理组的秩和应该大致相等,不可组的秩和应该大致相等,不可能出现较大的差别。能出现较大的差别。10(3)、)、Friedman秩和检验秩和检验公式公式11二、相关二、相关SASSAS过程步过程步(1)、)、NPAR1WAY过程过程两组连续变量资料的秩和检验两组连续变量资料的秩和检验多组连续变量资料的秩和检验多组连续变量资料的秩和检验(2)、)、RANK过程过程+ANOVA(或或GLM)过程过程完全随机设计连续变量资料的秩和检验完全随机设计连续变量资料的秩和检验随机区组设计资料的秩和检验随机区组设计资料的秩和检验多重比较多重比较(3)
7、、)、Freq过程过程等级资料等级资料两组连续变量资料的秩和检验两组连续变量资料的秩和检验完全随机设计连续变量资料的秩和检验完全随机设计连续变量资料的秩和检验随机区组设计资料的秩和检验随机区组设计资料的秩和检验单因素单因素单因素、双因素、两两比较单因素、双因素、两两比较单因素、双因素、等级资料单因素、双因素、等级资料12二、相关二、相关SASSAS过程步过程步(1)、)、NPAR1WAY过程的基本结构过程的基本结构proc npar1way wilcoxon;class group(分组变量分组变量);var x(连续变量连续变量);run;Wilcoxon 是指资料的分析基于是指资料的分析基
8、于Wilcoxon得分得分两样本资料两样本资料:Wilcoxon Wilcoxon 秩和检验秩和检验多样本作多样本作Kruskal-WallisKruskal-Wallis秩和检验秩和检验13二、相关二、相关SASSAS过程步过程步(2)、)、RANK过程过程+ANOVA(或或GLM)过程基本结构过程基本结构完全随机设计完全随机设计(Kruskal-Kruskal-WallisWallis秩和检验秩和检验)proc rank data=sample out=a;var x;ranks r;/*产生秩次产生秩次*/run;proc glm data=a;class group;model r=g
9、roup;means group/snk;run;proc sort data=a;by block;run;proc rank data=a out=b;var x;by block;ranks r;run;proc glm data=b;class treat block;model r=treat block;means treat/snk;run;随机区组设计随机区组设计(FriedmanFriedman秩和检验)秩和检验)14二、相关二、相关SASSAS过程步过程步(3)、)、Freq过程的基本结构(过程的基本结构(CMH解法)解法)proc freq data=aa;tables
10、group*x/scores=rank cmh;run;15三、常见的非参数检验实例三、常见的非参数检验实例(一)、配对设计和单样本资料的非参数检验(一)、配对设计和单样本资料的非参数检验(二)、完全随机设计两组独立样本的秩和检验(二)、完全随机设计两组独立样本的秩和检验(三)、完全随机设计多组独立样本的秩和检验(三)、完全随机设计多组独立样本的秩和检验(四)、随机区组设计资料的秩和检验(四)、随机区组设计资料的秩和检验16(一)、配对资料的非参数检验(一)、配对资料的非参数检验 拟对某种药物的降压效果进行评价,治疗前后病人的舒张压水平如下:拟对某种药物的降压效果进行评价,治疗前后病人的舒张压
11、水平如下:试用非参数检验的方法比较治疗前后舒张压有无差异?试用非参数检验的方法比较治疗前后舒张压有无差异?data dbp;input before after;d=before-after;cards;117 123 127 108 141 120 107 107 110 100 114 98 115 102 138 152 127 104 122 107;run;proc univariate data=dbp normal;var d;run;17(二)、完全随机设计两组独立样本的秩和检验(二)、完全随机设计两组独立样本的秩和检验实例实例 某缺碘地区测定某缺碘地区测定9名名12岁男孩和岁
12、男孩和8名女孩的尿碘含量(名女孩的尿碘含量(g/l),结果),结果如下:如下:男孩(男孩(9名):名):102.00、45.70、103.00、105.00、98.30、113.00、64.00、113.00、54.00 女孩(女孩(8名):名):61.00、49.70、45.80、33.90、116.00、118.00、120.00、72.00 试用非参数检验的方法比较试用非参数检验的方法比较不同性别的儿童尿不同性别的儿童尿碘碘含量是否不同含量是否不同?18SASSAS数据集的建立数据集的建立data aa;if _n_=10 then sex=2;input x;cards;102.00
13、45.70 103.00 105.00 98.30 113.00 64.00 113.00 54.0061.00 49.70 45.80 33.90 116.00 118.00 120.00 72.00;run;SASSAS过程步过程步proc npar1way wilcoxon data=aa;var x;class sex;run;proc freq data=aa;tables sex*x/scores=rank cmh;run;行均值得分的差值行均值得分的差值Row mean scores differ19练习练习1 1 应用免疫酶法对鼻咽癌患者和非鼻咽癌者分别测定应用免疫酶法对鼻咽癌
14、患者和非鼻咽癌者分别测定13人的血清病毒人的血清病毒VCA-LOGA抗体滴度(倍),结果如下抗体滴度(倍),结果如下 鼻咽癌患者:鼻咽癌患者:5 20 40 80 80 80 160 160 320 320 640 1280 1280 非鼻咽癌患者:非鼻咽癌患者:5 10 10 20 20 20 40 40 80 80 80 160 640 试用非参数检验法比较两组患者的血清病毒的试用非参数检验法比较两组患者的血清病毒的VCA-LOGA抗体滴度抗体滴度是否有差异?是否有差异?20(三)、完全随机设计多组独立样本的秩和检验(三)、完全随机设计多组独立样本的秩和检验实例实例 某研究者欲研究某研究者
15、欲研究A、B两个菌种对小鼠巨噬细胞吞噬功能的激活作两个菌种对小鼠巨噬细胞吞噬功能的激活作用,将用,将60只小鼠随机分为三组,其中生理盐水为对照组,用常规巨只小鼠随机分为三组,其中生理盐水为对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组吞噬指数如下:噬细胞吞噬功能的监测方法,获得三组吞噬指数如下:对照组:对照组:1.30 1.40 1.50 1.50 1.60 1.60 1.70 1.70 1.70 1.70 1.70 2.10 2.30 2.30 2.30 2.40 2.40 A菌组:菌组:1.80 1.80 2.20 2.20 2.20 2.20 2.30 2.30 2.30 2.66
16、2.66 2.68 2.68 2.70 2.80 2.80 3.00 3.10 3.10 3.10 3.10 3.20 4.30 4.30 B菌组:菌组:1.50 1.80 1.80 2.00 2.30 2.30 2.40 2.40 2.40 2.40 2.50 2.50 2.60 2.60 2.60 2.70 2.70 3.10 3.10 试用非参数检验的方法比较三组吞噬指数有无差别?试用非参数检验的方法比较三组吞噬指数有无差别?21SASSAS数据集的建立数据集的建立data aa;if _n_=18 and _n_=42 then group=3;input x;cards;1.30 1
17、.40 1.50 1.50 1.60 1.60 1.70 1.70 1.70 1.70 1.70 2.10 2.30 2.30 2.30 2.40 2.40 1.80 1.80 2.20 2.20 2.20 2.20 2.30 2.30 2.30 2.66 2.66 2.68 2.68 2.70 2.80 2.80 3.00 3.10 3.10 3.10 3.10 3.20 4.30 4.301.50 1.80 1.80 2.00 2.30 2.30 2.40 2.40 2.40 2.40 2.50 2.50 2.60 2.60 2.60 2.70 2.70 3.10 3.10;run;SAS
18、SAS过程步过程步proc npar1way wilcoxon data=aa;var x;class group;run;proc rank data=aa out=bb;var x;ranks r;run;proc glm data=bb;class group;model r=group;means group/dunnett(1);run;proc freq data=aa;tables group*x/scores=rank cmh;run;Kruskal-Wallis检验结果:检验结果:R-SquareDf总总行均值得分的差值行均值得分的差值Row mean scores diff
19、er22练习练习2 2 正常人、单纯型肥胖和皮质醇增多症病人的血浆总皮质醇测定值如正常人、单纯型肥胖和皮质醇增多症病人的血浆总皮质醇测定值如下(下(g/Lg/L):):正常人:正常人:1.4 1.9 2.2 2.5 2.8 3.1 3.7 3.9 4.6 7.0 单纯型肥胖:单纯型肥胖:1.6 1.2 2.0 2.4 3.1 4.1 5.0 7.4 10.8 13.6 皮质醇增多症:皮质醇增多症:9.8 10.2 10.6 13.0 14.0 14.8 15.6 15.6 21.6 24.0 试用非参数的方法比较三组人群的血浆总皮质醇含量有无差别?试用非参数的方法比较三组人群的血浆总皮质醇含量
20、有无差别?23(四)、随机区组设计资料的秩和检验(四)、随机区组设计资料的秩和检验实例实例 用某新药治疗血吸虫病患者,采用用某新药治疗血吸虫病患者,采用三天疗法,在治疗前及治疗后测定三天疗法,在治疗前及治疗后测定7名患者的血清谷丙转氨酶(名患者的血清谷丙转氨酶(SGPT)的变化,以观察该药对肝功能的影的变化,以观察该药对肝功能的影响,测定结果如下。响,测定结果如下。试用非参数检验的方法比较四个阶试用非参数检验的方法比较四个阶段段SGPT有无差别?有无差别?24SASSAS数据集的建立数据集的建立data aa;do block=1 to 7;do treat=1 to 4;input x;ou
21、tput;end;end;cards;63 188 138 54 90 238 220 144 54300 83 92 45 140 213 100 54 175150 36 72 300 163 90 64 207 185 87;run;SASSAS过程步过程步proc sort data=aa;by block;run;proc rank data=aa out=b;var x;by block;ranks r;run;proc glm data=b;class treat block;model r=treat block;run;proc freq data=aa;tables blo
22、ck*treat*x/scores=rank cmh;run;行均值得分的差值行均值得分的差值Row mean scores differFriedman检验结果:检验结果:R-Square(Df总总Df区组区组)25小结(小结(1 1)配对设计和单样本资料的非参数检验配对设计和单样本资料的非参数检验WilcoxonWilcoxon符号检验和符号检验和WilcoxonWilcoxon符号秩和检验符号秩和检验SASSAS中中UnivariateUnivariate过程:过程:“位置检验位置检验:Mu0=0:Mu0=0”中的中的 符号符号 M 符号秩符号秩 S完全随机设计两组独立样本的秩和检验完全
23、随机设计两组独立样本的秩和检验WilcoxonWilcoxon秩和检验秩和检验SASSAS中中 NPAR1WAY过程(过程(wilcoxon)FREQ过程(过程(tables./scoresrank cmh)“行均值得分的差值行均值得分的差值”26小结(小结(1 1)完全随机设计多组独立样本的秩和检验完全随机设计多组独立样本的秩和检验Kruskal-WallisKruskal-Wallis秩和检验秩和检验SASSAS中中 NPAR1WAY过程过程 Rank过程过程+Glm过程(或过程(或ANOVA过程)过程)“R-Square(R2)Df总总”结果结果 Freq过程(过程(tables gro
24、up*x/scoresrank cmh)“行均值得分的差值行均值得分的差值”随机区组设计资料的秩和检验随机区组设计资料的秩和检验FriedmanFriedman秩和检验秩和检验SASSAS中中 Freq过程过程(tables block*group*x/scoresrank cmh)“行均值得分差值行均值得分差值”Sort过程(过程(block)+Rank过程过程+Glm过程过程 “R-Square(Df总总Df区组区组)”结果结果27小结(小结(2 2)符合正态分布、方差齐性条件符合正态分布、方差齐性条件参数检验参数检验 t检验检验 方差分析(单向、双向等)方差分析(单向、双向等)不符合正态分布、方差齐性条件不符合正态分布、方差齐性条件数据变换使其满足条件,方差分析数据变换使其满足条件,方差分析数据变换仍不满足条件,非参数检验数据变换仍不满足条件,非参数检验 wilcoxon秩和检验秩和检验 Kruskal-Wallis秩和检验秩和检验 Friedman秩和检验秩和检验28