ImageVerifierCode 换一换
格式:PPT , 页数:93 ,大小:676.51KB ,
文档编号:5207420      下载积分:28 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-5207420.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(晟晟文业)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(秩转换非参数检验-课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

秩转换非参数检验-课件.ppt

1、秩转换的非参数检验秩转换的非参数检验 参数检验:参数检验:总体分布为已知的数学形式,对总体分布为已知的数学形式,对其总体参数做假设检验。其总体参数做假设检验。非参数检验:非参数检验:是针对参数检验而言的,不是针对参数检验而言的,不依赖于总体分布的一种假设检验方法,它直接依赖于总体分布的一种假设检验方法,它直接对总体分布进行假设,不受总体分布的限制,对总体分布进行假设,不受总体分布的限制,适用范围广,而且简便易学。适用范围广,而且简便易学。参数统计方法的局限性参数统计方法的局限性v必须要先对总体分布进行确定,当总体分布未知,或分必须要先对总体分布进行确定,当总体分布未知,或分布不符合要求时无法使

2、用。布不符合要求时无法使用。例:住院时间例:住院时间v结果为有序分类变量时无法使用。结果为有序分类变量时无法使用。例:尿糖检测结果例:尿糖检测结果v样本数据两端有不确定值时无法使用。样本数据两端有不确定值时无法使用。例:仪器性能限制,超出可测量范围例:仪器性能限制,超出可测量范围以上情况下强行使用参数统计方法可能会得到错误结论以上情况下强行使用参数统计方法可能会得到错误结论 非参数检验一般不直接用样本观察值作分析,统非参数检验一般不直接用样本观察值作分析,统计量的计算基于原数据在整个样本中按大小所占位计量的计算基于原数据在整个样本中按大小所占位次。由于丢弃了观察值的具体数值,而只保留其大次。由

3、于丢弃了观察值的具体数值,而只保留其大小次序的信息,凡适合参数检验的资料,应首选参小次序的信息,凡适合参数检验的资料,应首选参数检验。但不清楚是否适合参数检验的资料,则应数检验。但不清楚是否适合参数检验的资料,则应采用非参数检验;尤其对于难以确定分布又出现少采用非参数检验;尤其对于难以确定分布又出现少量异常值的小样本数据,非参数检验在剔除这些数量异常值的小样本数据,非参数检验在剔除这些数据前后所得结论显示出其较好的稳健性。据前后所得结论显示出其较好的稳健性。非参数检验的适用范围:非参数检验的适用范围:计量资料不满足正态或方差齐性条件计量资料不满足正态或方差齐性条件 对于分布不知是否正态的小样本

4、资料对于分布不知是否正态的小样本资料 对于一端或两端无确定数值的资料对于一端或两端无确定数值的资料 等级资料进行等级强度差别的比较等级资料进行等级强度差别的比较非参数方法的特点:非参数方法的特点:v适用范围广,几乎可用于任何情况。适用范围广,几乎可用于任何情况。v当资料符合参数检验方法的适用条件时,当资料符合参数检验方法的适用条件时,使用非参数方法的检验效能较低。使用非参数方法的检验效能较低。v原因:无法借助总体分布得到许多推论,原因:无法借助总体分布得到许多推论,本身在利用信息上就有丢失本身在利用信息上就有丢失型错误和型错误和型错误型错误 由样本推断的结果由样本推断的结果 真实结果真实结果

5、拒绝拒绝H H0 0 不拒绝不拒绝H H0 0 H H0 0成立成立 型错误型错误 推断正确推断正确(1(1)H H0 0不成立不成立 推断正确(推断正确(1 1)型错误型错误(1 1)即)即把握度把握度(检验效能检验效能)(power of a power of a test):test):两总体确有差别,在两总体确有差别,在检验水准下检验水准下,被检被检出有差别的能力出有差别的能力(1 1)即)即可信度可信度(confidence level):confidence level):重复重复抽样时,样本区间包含总体参数(抽样时,样本区间包含总体参数(m m)的百分数的百分数已知已知总体分布类

6、型总体分布类型,对,对未知参数(未知参数(、)进进行统计推断行统计推断依赖于特定分布类依赖于特定分布类型,型,比较的是参数比较的是参数 参数统计参数统计(parametric statisticsparametric statistics)非参数统计非参数统计(nonparametric statisticsnonparametric statistics)对总体的分布类对总体的分布类型型不作任何要求不作任何要求 不受总体参数的影响,不受总体参数的影响,比较分布或分布位置比较分布或分布位置 优点:优点:1.1.适用范围广适用范围广2.2.简便,易于掌握简便,易于掌握缺点:对于符合参数统计分析缺

7、点:对于符合参数统计分析条件者,采用非参数统计分析,条件者,采用非参数统计分析,其其检验效能较低检验效能较低 预备知识预备知识 v分析方法心中有数:分析方法心中有数:当手中有了数据,首先要对它进行充分、直观的了解,当手中有了数据,首先要对它进行充分、直观的了解,直方图,茎叶图,箱图等可以帮助我们对数据的分布形状进直方图,茎叶图,箱图等可以帮助我们对数据的分布形状进行探索,避免因对数据的特性缺乏了解而盲目使用一些方法行探索,避免因对数据的特性缺乏了解而盲目使用一些方法作出错误的或不合理的结论。作出错误的或不合理的结论。如果能使用参数方法,当然还是参数方法更好一些,参如果能使用参数方法,当然还是参

8、数方法更好一些,参数法效能高,方法多。数法效能高,方法多。预备知识预备知识v秩秩(Rank)(Rank):对于样本,按由小到大排成一列,若数据对于样本,按由小到大排成一列,若数据X X在这在这一列中占据第一列中占据第i i位,称位,称X X的秩为的秩为R Ri i 实际上就像是考试成绩的排名,只不过倒了过来实际上就像是考试成绩的排名,只不过倒了过来v相同秩(相同秩(TiesTies,得分相同,不分胜负,平手,得分相同,不分胜负,平手):在许多情况在许多情况下,数据中会有相同的值出现,此时如果排秩的话就会出现下,数据中会有相同的值出现,此时如果排秩的话就会出现同秩的现象,这种情况被称为数据中的相

9、同秩。同秩的现象,这种情况被称为数据中的相同秩。如:考试成绩的并列第三名如:考试成绩的并列第三名 在默认情况下,秩和检验中的相同秩为它们按大小顺序在默认情况下,秩和检验中的相同秩为它们按大小顺序排列后所处位置的平均值。排列后所处位置的平均值。秩转换的非参数检验(秩和检验),首先秩转换的非参数检验(秩和检验),首先将观察值从小到大,或者等级从弱到强转换为将观察值从小到大,或者等级从弱到强转换为秩次后,再计算统计量,这种秩次后,再计算统计量,这种用数据的秩代替用数据的秩代替原始数据进行假设检验的方法称为秩和检验原始数据进行假设检验的方法称为秩和检验。秩和检验对总体分布的形状差别不敏感,只对秩和检验

10、对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。总体分布的位置差别敏感。非参数检验的方法很多,有符号检验、游程非参数检验的方法很多,有符号检验、游程检验、等级相关分析、秩和检验等。秩转换的检验、等级相关分析、秩和检验等。秩转换的非参数检验(秩和检验)是在非参数检验中占非参数检验(秩和检验)是在非参数检验中占有重要地位且检验功效高的一种方法。有重要地位且检验功效高的一种方法。第一节配对样本比较的第一节配对样本比较的WilcoxonWilcoxon符号秩检验符号秩检验第二节两个独立样本比较的第二节两个独立样本比较的WilcoxonWilcoxon秩和检验秩和检验第三节第三节 完全随机设计多

11、个样本比较完全随机设计多个样本比较KruskalKruskalWallis Wallis H H检验检验第四节第四节 随机区组设计多个样本比较的随机区组设计多个样本比较的Friedman Friedman M M 检验检验第一节第一节 配对样本比较的配对样本比较的WilcoxonWilcoxon符号秩检验符号秩检验 WilcoxonWilcoxon符号秩检验可用于符号秩检验可用于1.1.配对样本差值的中位数与配对样本差值的中位数与0 0的比较的比较2.2.单个样本中位数和已知的一个总体中位数比较。单个样本中位数和已知的一个总体中位数比较。一、配对样本差值的中位数与一、配对样本差值的中位数与0

12、0的比较的比较 比较目的是推断配对样本差值得总体中位数是比较目的是推断配对样本差值得总体中位数是否为否为0 0,也可以说是推断配对的两个相关样本所来,也可以说是推断配对的两个相关样本所来自的两个总体中位数是否相等。自的两个总体中位数是否相等。例例8-18-1 对对1212份血清分别用原方法(检测时间份血清分别用原方法(检测时间2020分分钟)和新方法(检测时间钟)和新方法(检测时间1010分钟)测谷分钟)测谷-丙转氨酶,丙转氨酶,结果见表结果见表8-18-1的的(2)(2)、(3)(3)栏。问两法所得结果有无栏。问两法所得结果有无差别?差别?表表8-1 128-1 12份血清用原法和新法测血清

13、谷份血清用原法和新法测血清谷-丙转氨酶的比较丙转氨酶的比较编号编号 原法原法新法新法差值差值正秩正秩负秩负秩 1 1 6060 7676 16 16 8 8 2 2142142152152 10 10 5 5 3 3195195243243 48 481111 4 4 8080 8282 2 2 1.5 1.5 5 5242242240240-2-2 1.5 1.5 6 6220220220220 0 0 7 7190190205205 15 15 7 7 8 8 2525 3838 13 13 6 6 9 9198198243243 45 45 9 91010 3838 4444 6 6 4

14、 41111236236190190-46-46101012129595100100 5 5 3 3合计合计-54.554.5 11.5 11.5 本例为配对实验设计,对其差值进行正态性检本例为配对实验设计,对其差值进行正态性检验:验:W W=0.875=0.875,P P=0.076=0.076,不满足正态性的条件,使,不满足正态性的条件,使用符号秩检验。用符号秩检验。1 1。建立假设并确定检验水准建立假设并确定检验水准 H H0 0:差值的总体中位数为:差值的总体中位数为0 0,M Md d=0=0 H H1 1:差值的总体中位数不为:差值的总体中位数不为0 0,M Md d00 =0.0

15、5=0.052 2。计算统计量。计算统计量T T 省略所有差值为省略所有差值为0 0的对子,令余下的有效对子的对子,令余下的有效对子数为数为n n本例本例n n=11=11 对剩余的差值的绝对值从小到大编秩,并根对剩余的差值的绝对值从小到大编秩,并根据差值的正负号标上符号。编秩时遇到绝对值相据差值的正负号标上符号。编秩时遇到绝对值相同时取平均秩次。同时取平均秩次。分别求正负秩次之和,用分别求正负秩次之和,用T T+和和T T-表示,并任选表示,并任选正秩和或负秩和作为统计量值。正秩和或负秩和作为统计量值。本例本例T T=T T-=11.5=11.53.3.确定确定P P值,作出统计推断值,作出

16、统计推断 查表法:查表法:n5050查界值表,若查界值表,若T T在上下界值范在上下界值范围内,围内,P P大于表中上方对应的概率水平;若大于表中上方对应的概率水平;若T T等于等于上侧界值或下侧界值,上侧界值或下侧界值,P P近似等于表中上方对应近似等于表中上方对应的概率水平;若的概率水平;若T T不在上下界值范围内,不在上下界值范围内,P P小于表小于表中上方对应的概率水平。中上方对应的概率水平。本例本例n n=11,=11,T T=T T-=11.5=11.5,查界值表:,查界值表:0.050.05P P0.105050超出界值表的范围时,超出界值表的范围时,可以使用正态近似法作可以使用

17、正态近似法作u u检验。检验。31 41212448jjTn nuttn nnt tj j为第为第j j个相同秩次的个数个相同秩次的个数 如:相同秩中有如:相同秩中有2 2个个1.51.5,5 5个个8 8,3 3个个1414,则,则t1 1=2,=2,t t3 3=5,=5,t t3 3=3=3例例 配对比较甲、乙两种方法治疗扁平足效果,记录配对比较甲、乙两种方法治疗扁平足效果,记录如下,问两种疗法是否有差别?如下,问两种疗法是否有差别?两种疗法的治疗结果两种疗法的治疗结果病例号病例号1 12 23 34 45 56 67 78 89 91010 111112121313甲甲好好好好好好 好

18、好 差差 中中 好好好好中中 差差 好好差差中中乙乙差差差差好好 中中 中中 差差 中中差差中中 差差 好好好好差差配对的等级资料配对的等级资料 符号秩和检验若用于配对等级资料,则应先将符号秩和检验若用于配对等级资料,则应先将等级从弱到强赋值,然后再进行符号秩检验。但等级从弱到强赋值,然后再进行符号秩检验。但对于等级资料,相同秩次多,小样本的检验结果对于等级资料,相同秩次多,小样本的检验结果会存在偏差,最好为大样本。会存在偏差,最好为大样本。两种疗法的治疗结果两种疗法的治疗结果病例号病例号1 12 23 34 45 56 67 78 89 91010 111112121313甲甲好好好好好好

19、好好 差差 中中 好好好好中中 差差 好好差差中中赋值赋值3 33 33 33 31 12 23 33 32 21 13 31 12 2乙乙差差差差好好 中中 中中 差差 中中差差中中 差差 好好好好差差赋值赋值1 11 13 32 22 21 12 21 12 21 13 33 31 1差值差值2 22 20 01 1-1-11 11 12 20 00 00 0-2-21 1秩次秩次7.57.5 7.57.53 3-3-33 33 37.57.5-7.5-7.53 31 1。建立假设并确定检验水准建立假设并确定检验水准 H H0 0:差值的总体中位数为:差值的总体中位数为0 0,M Md d

20、=0=0 H H1 1:差值的总体中位数不为:差值的总体中位数不为0 0,M Md d00 =0.05=0.052 2。计算统计量。计算统计量T TT T+=34.5 =34.5 T T-=10.5 =10.5 T T=10.5 =10.5 3.3.确定确定P P值,作出统计推断值,作出统计推断n n=9,=9,T T=T T-=10.5=10.5,查界值表:,查界值表:P P0.100.10 按按=0.05=0.05的水准,不拒绝的水准,不拒绝H H0 0,还不能认为两,还不能认为两法治疗扁平足效果不同。法治疗扁平足效果不同。二、单样本中位数与总体中位数的比较二、单样本中位数与总体中位数的比

21、较 比较目的是推断样本来自的总体中位数比较目的是推断样本来自的总体中位数M M和某个和某个已知的总体中位数已知的总体中位数M M0 0是否相等。即推断样本各变量是否相等。即推断样本各变量值和值和M M0 0差值的总体中位数是否为差值的总体中位数是否为0 0。例例8-28-2 已知某地正常人尿氟含量的中位数为已知某地正常人尿氟含量的中位数为45.30mol/L45.30mol/L 。今在该地某厂随机抽取。今在该地某厂随机抽取1212名工人,名工人,测得尿氟含量见表测得尿氟含量见表8-28-2第(第(1 1)栏。问该厂工人的尿)栏。问该厂工人的尿氟含量是否高于当地正常人的尿氟含量?氟含量是否高于当

22、地正常人的尿氟含量?对工人尿氟含量进行正态性检验得对工人尿氟含量进行正态性检验得W W=0.845=0.845,P P=0.032=0.032,不满足正态性的条件,使用符号秩检验。,不满足正态性的条件,使用符号秩检验。表表8-2 128-2 12名工人的尿氟含量(名工人的尿氟含量(molmol/L/L)与)与45.3045.30比较比较尿尿 氟氟 含含 量量(1 1)45.3045.30正正 秩秩负负 秩秩44.2144.21-1.091.091.51.545.3045.30 0 046.3946.39 1.09 1.09 1.51.549.4749.47 4.17 4.17 3 351.05

23、51.05 5.75 5.75 4 453.1653.16 7.86 7.86 5 553.2653.26 7.96 7.96 6 654.3754.37 9.07 9.07 7 757.1657.1611.8511.85 8 867.3767.3722.0722.07 9 971.0571.0525.7525.75101087.3787.3742.0742.071111合合 计计64.564.51.51.51 1。建立假设并确定检验水准建立假设并确定检验水准 H H0 0:该厂工人尿氟含量的总体中位数为:该厂工人尿氟含量的总体中位数为45.3045.30 H H1 1:该厂工人尿氟含量的总体

24、中位数大于:该厂工人尿氟含量的总体中位数大于45.3045.30 =0.05=0.052 2。计算统计量。计算统计量T TT T+=64.5 =64.5 T T-=1.5 =1.5 T T=1.5 =1.5 3 3。确定确定P P值,作出统计推断值,作出统计推断n n=11,=11,T T=T T-=1.5=1.5,查界值表:,查界值表:P P0.0050.005 按按=0.05=0.05的水准,拒绝的水准,拒绝H H0 0,接受,接受H H1 1,可以认,可以认为该厂工人尿氟含量高于当地正常人。为该厂工人尿氟含量高于当地正常人。第二节第二节 两个独立样本比较的两个独立样本比较的Wilcoxo

25、nWilcoxon秩和检验秩和检验 两组独立样本比较的秩和检验两组独立样本比较的秩和检验(WilcoxonWilcoxon秩和检验秩和检验),目的是推断计量资料或等级资料的两个独立样本代表目的是推断计量资料或等级资料的两个独立样本代表的两个总体分布是否有差别。的两个总体分布是否有差别。理论上理论上H H0 0为两总体分布相同,即两样本来自同一总为两总体分布相同,即两样本来自同一总体;体;H H1 1为两总体分布不同。由于秩和检验对两总体分为两总体分布不同。由于秩和检验对两总体分布形状的差别不敏感,对位置相同、形状不同但类似布形状的差别不敏感,对位置相同、形状不同但类似的两总体分布,推断不出两总

26、体分布的两总体分布,推断不出两总体分布(形状形状)有差别,有差别,故在实际应用中,故在实际应用中,H H0 0可写作两总体分布位置相同,也可写作两总体分布位置相同,也可简化为两总体中位数相等。可简化为两总体中位数相等。例例8-38-3 对对1010例肺癌病人和例肺癌病人和1212例矽肺例矽肺0 0期工人用期工人用X X光片光片测量肺门横径右侧距测量肺门横径右侧距RDRD值(值(cmcm),结果见表),结果见表8-58-5。问。问肺癌病人的肺癌病人的RDRD值是否高于矽肺值是否高于矽肺0 0期工人的期工人的RDRD值?值?肺癌病人肺癌病人矽肺矽肺0 0期工人期工人RDRD值值秩秩RDRD值值秩秩

27、2.78 2.78 1 13.23 3.23 2.52.53.23 3.23 2.52.53.50 3.50 4 44.20 4.20 7 74.04 4.04 5 54.87 4.87 14144.15 4.15 6 65.12 5.12 17174.28 4.28 8 86.21 6.21 18184.34 4.34 9 97.18 7.18 19194.47 4.47 10108.05 8.05 20204.64 4.64 11118.56 8.56 21214.75 4.75 12129.60 9.60 22224.82 4.82 13134.95 4.95 15155.10 5.10

28、 1616n n1 1=10=10T T1 1=141.5=141.5n n2 2=12=12T T1 1=111.5=111.5表表8-5 8-5 肺癌病人和矽肺肺癌病人和矽肺0 0期工人的期工人的RDRD值(值(cmcm)比较)比较 1 1。建立假设并确定检验水准建立假设并确定检验水准 H H0 0:肺癌病人和矽肺:肺癌病人和矽肺0 0期工人期工人RDRD值的总体分布位值的总体分布位置相同置相同 H H1 1:肺癌病人的:肺癌病人的RDRD值高于矽肺值高于矽肺0 0期工人的期工人的RDRD值值(总体分布位置靠右)(总体分布位置靠右)=0.05=0.05分析:分析:本例两样本资料经正态性检验

29、,本例两样本资料经正态性检验,W W1 1=0.959=0.959,P P1 1=0.775=0.775,W W2 2=0.943=0.943,P P2 2=0.533=0.533;经方差齐性检验,;经方差齐性检验,F F=20.455=20.455,P P=0.000=0.000,推断的两总体方差不等,使用,推断的两总体方差不等,使用WilcoxonWilcoxon检验检验 2 2。计算统计量。计算统计量T T 把两样本数据混合小到大编秩,遇到数据相把两样本数据混合小到大编秩,遇到数据相同的取平均秩次同的取平均秩次 分别求两样本秩次之和,用分别求两样本秩次之和,用T T1 1和和T T2 2

30、表示(样本表示(样本含量小的为含量小的为T T1 1),选择),选择T T1 1作为统计量值作为统计量值T T。若样本。若样本含量相等,任取一个秩和作为含量相等,任取一个秩和作为T T(T T1 1或或T T2 2)。)。本例:本例:n n1 1=10=10,T T1 1=141.5=141.5,n n2 2=12=12,T T2 2=111.5 =111.5 所以:所以:T T=T T1 1=141.5 =141.5 3.3.确定确定P P值,作出统计推断值,作出统计推断 查表法:当查表法:当n n1 11010以及以及n n2 2-n n1 11010时,可以查时,可以查界值表确定概率值。

31、查界值表,若界值表确定概率值。查界值表,若T T在上下界值在上下界值范围内,范围内,P P大于表中上方对应的概率水平;若大于表中上方对应的概率水平;若T T等等于上侧界值或下侧界值,于上侧界值或下侧界值,P P近似等于表中上方对近似等于表中上方对应的概率水平;若应的概率水平;若T T不在上下界值范围内,不在上下界值范围内,P P小于小于表中上方对应的概率水平。表中上方对应的概率水平。按按=0.05=0.05的水准,拒绝的水准,拒绝H H0 0,接受,接受H H1 1,可以认,可以认为肺癌病人的为肺癌病人的RDRD值高于矽肺工人的值高于矽肺工人的RDRD值。值。本例本例n n1 1=10=10,

32、n n2 2-n n1 1=2=2,T T=141.5=141.5,查界值表:,查界值表:0.025 0.025P P0.051010或者或者n n2 2-n n1 11010时,可使用正态近似法时,可使用正态近似法作作u u检验。检验。131231 21112jjTnNuttn nNNNt tj j为第为第j j个相同秩次的个数个相同秩次的个数表表8-6 8-6 吸烟工人和不吸烟工人的吸烟工人和不吸烟工人的HbCOHbCO(%)(%)含量比较含量比较含含 量量吸烟吸烟工人工人不吸烟不吸烟工人工人合计合计秩范围秩范围平均平均秩秩秩秩 和和吸烟工人吸烟工人不吸烟工人不吸烟工人很低很低 1 1 2

33、 2 3 31 13 3 2 2 2 2 4 4低低 8 82323 31 314 434341919 152 152 437 437中中16161111 27 27353561614848 768 768 528 528偏高偏高1010 4 4 14 146262757568.568.5 685 685 274 274高高合合 计计 4 4 0 0 4 47676797977.577.5 310 310 0 039394040 79 791917191712431243二、频数表资料和等级资料的两样本比较二、频数表资料和等级资料的两样本比较例例8-48-4 39 39名吸烟工人和名吸烟工人和

34、4040名不吸烟工人的碳氧血名不吸烟工人的碳氧血红蛋白红蛋白HbCOHbCO(%)(%)含量见表含量见表8-68-6。问吸烟工人的。问吸烟工人的HbCOHbCO(%)(%)含量是否高于不吸烟工人的含量是否高于不吸烟工人的HbCOHbCO(%)(%)含量?含量?1 1。建立假设并确定检验水准建立假设并确定检验水准 H H0 0:吸烟工人和不吸烟工人的:吸烟工人和不吸烟工人的HbCOHbCO含量总体分布含量总体分布位置相同位置相同 H H1 1:吸烟工人的:吸烟工人的HbCOHbCO含量高于不吸烟工人的含量高于不吸烟工人的HbCOHbCO含量(总体分布位置靠右)含量(总体分布位置靠右)=0.05=

35、0.052 2。计算统计量。计算统计量T T 先确定各等级的合计人数、秩次范围和平均先确定各等级的合计人数、秩次范围和平均秩次。秩次。分别求两样本秩次之和,分别求两样本秩次之和,本例:本例:n n1 1=39=39,T T1 1=1917=1917,n n2 2=40=40,T T2 2=1243 =1243 所以:所以:T T=1917 =1917 3.3.确定确定P P值,作出统计推断值,作出统计推断超出界值表的范围,使用正态近似法作超出界值表的范围,使用正态近似法作u u检验。检验。本例:本例:n n1 1=39=39,n n2 2=40=40,N N=79=79,T T=1917 =1

36、917 t t1 1=3=3,t t2 2=31=31,t t3 3=27=27,t t4 4=14=14,t t5 5=4=4 1333312331 219173979 1 23.702333313144139 4079 11112127979jjTnNuttn nNNN查查u u界值表界值表u u0.00050.0005=3.2905=3.2905,P P0.00050.0005 按按=0.05=0.05的水准,拒绝的水准,拒绝H H0 0,接受,接受H H1 1,可以认,可以认为吸烟工人的的为吸烟工人的的HbCOHbCO含量高于不吸烟工人。含量高于不吸烟工人。三、三、Mann-Whitn

37、ey Mann-Whitney U U 检验检验 两独立样本比较还常用两独立样本比较还常用Mann-Whitney Mann-Whitney U U 检验检验(Mann-Whitney Mann-Whitney U U test test)。检验统计量。检验统计量U U值为:把值为:把第一个样本的第一个样本的n n1 1(n n1 1n n2 2)个变量值的每个变量值,个变量值的每个变量值,与第二个样本的与第二个样本的n n2 2个个变量值逐个比较(小于记变量值逐个比较(小于记1 1,相等记相等记0.50.5,大于记,大于记0)0),求其和。,求其和。肺癌病人肺癌病人矽肺矽肺0 0期工人期工人

38、RDRD值值计分计分RDRD值值2.78 2.78 12123.23 3.23 3.23 3.23 11.511.53.50 3.50 4.20 4.20 8 84.04 4.04 4.87 4.87 2 24.15 4.15 5.12 5.12 0 04.28 4.28 6.21 6.21 0 04.34 4.34 7.18 7.18 0 04.47 4.47 8.05 8.05 0 04.64 4.64 8.56 8.56 0 04.75 4.75 9.60 9.60 0 04.82 4.82 4.95 4.95 5.10 5.10 合计合计33.533.5表表8-5 8-5 肺癌病人和矽

39、肺肺癌病人和矽肺0 0期工人的期工人的RDRD值(值(cmcm)比较)比较 当当n n1 1和和n n2 2小时,如小时,如n n1 1+n n2 23030,有专门的有专门的U U界界值表;当值表;当n n1 1和和n n2 2大时,用正态近似法作大时,用正态近似法作u u检验检验确定概率确定概率P P值。值。对同一资料对同一资料WilcoxonWilcoxon秩和检验的结果与秩和检验的结果与Mann-Whitney Mann-Whitney U U 检验结果等价,且检验结果等价,且u uU U=u uT T。131231 21112TjjTnNuttn nNNN12312321112Ujj

40、Un nuttn nNNN第三节第三节 完全随机设计多个样本比较的完全随机设计多个样本比较的KruskalKruskal-Wallis-Wallis H H检验检验一、多个独立样本比较的一、多个独立样本比较的KruskalKruskal-WallisWallis H H检验检验 KruskalKruskal-Wallis-Wallis H H检验用于推断计量资料或等检验用于推断计量资料或等级资料的多个独立的样本所来自的多个总体分布是级资料的多个独立的样本所来自的多个总体分布是否有差别。否有差别。在理论上讲,检验假设在理论上讲,检验假设H H0 0应为多个总体分布相应为多个总体分布相同,即多个样

41、本来自同一总体。但由于同,即多个样本来自同一总体。但由于H H检验对总检验对总体分布的形状差别不敏感,而对总体分布的位置敏体分布的形状差别不敏感,而对总体分布的位置敏感,所以实际应用中感,所以实际应用中H H0 0可以写作多个总体分布的位可以写作多个总体分布的位置相同置相同例例8-58-5 用三种药物杀灭钉螺,每批用用三种药物杀灭钉螺,每批用200200只活钉螺,只活钉螺,用药后清点每批钉螺的死亡数、再计算死亡率用药后清点每批钉螺的死亡数、再计算死亡率(%),结果见表),结果见表8-98-9。问三种药物杀灭钉螺的效果。问三种药物杀灭钉螺的效果有无差别?有无差别?(一)原始数据的多个样本比较(一

42、)原始数据的多个样本比较甲药甲药乙药乙药丙药丙药死亡率死亡率秩秩死亡率死亡率秩秩死亡率死亡率秩秩32.5 32.5 101016.0 16.0 4 46.5 6.5 1 135.5 35.5 111120.5 20.5 6 69.0 9.0 2 240.5 40.5 131322.5 22.5 7 712.5 12.5 3 346.0 46.0 141429.0 29.0 9 918.0 18.0 5 549.0 49.0 151536.0 36.0 121224.0 24.0 8 8R Ri i636338381919n ni i 5 5 5 5 5 5表表8-9 8-9 三种药物杀灭钉螺的

43、死亡率(三种药物杀灭钉螺的死亡率(%)比较)比较分析:分析:本例资料为百分率资料,不知道是否符合正态本例资料为百分率资料,不知道是否符合正态分布,而且样本含量很小,保守起见选择分布,而且样本含量很小,保守起见选择KruskalKruskal-Wallis Wallis H H检验检验 1 1。建立假设并确定检验水准建立假设并确定检验水准 H H0 0:三种药物杀灭钉螺的死亡率的总体分布位置:三种药物杀灭钉螺的死亡率的总体分布位置相同相同 H H1 1:三种药物杀灭钉螺的死亡率的总体分布位置:三种药物杀灭钉螺的死亡率的总体分布位置不全相同不全相同 =0.05=0.052 2。计算统计量。计算统计

44、量H H 把各个样本数据混合小到大编秩,遇到数据把各个样本数据混合小到大编秩,遇到数据相同的取平均秩次相同的取平均秩次 分别求各样本秩次之和,用分别求各样本秩次之和,用R Ri i表示。表示。计算统计量计算统计量H H212()3(1)(1)iiRHNN Nnn ni i为第为第i i个样本的样本容量;个样本的样本容量;为第为第i i个样本的秩和个样本的秩和N N=n ni i2iR 当出现相同秩次时,算得当出现相同秩次时,算得H H值偏小,应进行校正,值偏小,应进行校正,求校正求校正H HC C值。值。331CjjHH CCttNN,本例:本例:n n1 1=n n2 2=n n3 3=5=

45、5,N N=15=15,R R1 1=63=63,R R2 2=38=38,R R3 3=19=1922221212633819()3(1)()3(15 1)9.74(1)15(15 1)555iiRHNN Nn t tj j为第为第j j个相同秩次的个数个相同秩次的个数3.3.确定确定P P值,作出统计推断值,作出统计推断 查表法:当样本个数查表法:当样本个数g g=3=3以及每个样本例数以及每个样本例数n ni i55时,可以查界值表确定概率值。时,可以查界值表确定概率值。本例:本例:g g=3=3,n n1 1=n n2 2=n n3 3=5=5查界值表:查界值表:H H0.010.01

46、=7.98=7.98,P P0.0133或或g=3g=3但最小样本容量但最小样本容量n ni i55,则,则H H或或H HC C近似服近似服从从=g g-1-1的的2 2分布,可以查分布,可以查2 2界值表确定概率值。界值表确定概率值。例例8-68-6 比较小白鼠接种三种不同菌型伤寒杆菌比较小白鼠接种三种不同菌型伤寒杆菌9D9D、11C11C和和DSC1DSC1后存活日数,结果见表后存活日数,结果见表8-108-10。问小白鼠接。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?种三种不同菌型伤寒杆菌的存活日数有无差别?9D9D11C11CDSCDSC1 1存活日数存活日数秩秩存活日数存活

47、日数秩秩存活日数存活日数秩秩2 22 2 5 5 10.510.5 3 3 4.54.52 22 2 5 5 10.510.5 5 5 10.510.52 22 2 6 6 15.515.5 6 6 15.515.53 3 4.54.5 6 6 15.515.5 6 6 15.515.54 47 7 6 6 15.515.5 6 6 15.515.54 47 7 7 72121 7 721214 47 7 8 82424 7 721215 5 10.510.51010 26.526.5 9 925257 72121121230301010 26.526.57 721211111 28.528.

48、51111 28.528.5R Ri i8484169169 212 212n ni i10109 91111 8.40 8.40 18.78 18.78 19.27 19.27iR表表8-10 8-10 小白鼠接种三种不同菌型伤寒杆菌的存活日数比较小白鼠接种三种不同菌型伤寒杆菌的存活日数比较分析:分析:本例资料为时间资料,一般生存日数资料为非本例资料为时间资料,一般生存日数资料为非正态分布,正态分布,W W1 1=0.871,=0.871,P P1 1=0.103=0.103,W W2 2=0.853,=0.853,P P2 2=0.080=0.080,W W3 3=0.931=0.931,

49、P P3 3=0.425=0.425,选择,选择KruskalKruskal-Wallis-Wallis H H检验检验 1 1。建立假设并确定检验水准建立假设并确定检验水准 H H0 0:接种三种不同菌型伤寒杆菌的存活日数总体:接种三种不同菌型伤寒杆菌的存活日数总体分布位置相同分布位置相同 H H1 1:接种三种不同菌型伤寒杆菌的存活日数总体:接种三种不同菌型伤寒杆菌的存活日数总体分布位置分布位置不全相同不全相同 =0.05=0.052 2。计算统计量。计算统计量H H 把各个样本数据混合小到大编秩,遇到数据把各个样本数据混合小到大编秩,遇到数据相同的取平均秩次相同的取平均秩次 分别求各样本

50、秩次之和,用分别求各样本秩次之和,用R Ri i表示。表示。计算统计量计算统计量H H222212()3(1)(1)1284169212()3(30 1)30(30 1)109119.77iiRHNN Nn 333333332222110.9830309.77 0.989.97jjCCttNNHH C 所以:所以:0.0050.005P P0.010.01220.005,20.01,210.60,9.21 按按=0.05=0.05的水准,拒绝的水准,拒绝H H0 0,接受,接受H H1 1,可以认,可以认为小白鼠接种三种不同菌型的伤寒杆菌的存活日为小白鼠接种三种不同菌型的伤寒杆菌的存活日数不全

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|