第二章非参数统计分析(0303)课件.ppt

上传人(卖家):三亚风情 文档编号:3041314 上传时间:2022-06-25 格式:PPT 页数:88 大小:926KB
下载 相关 举报
第二章非参数统计分析(0303)课件.ppt_第1页
第1页 / 共88页
第二章非参数统计分析(0303)课件.ppt_第2页
第2页 / 共88页
第二章非参数统计分析(0303)课件.ppt_第3页
第3页 / 共88页
第二章非参数统计分析(0303)课件.ppt_第4页
第4页 / 共88页
第二章非参数统计分析(0303)课件.ppt_第5页
第5页 / 共88页
点击查看更多>>
资源描述

1、10:551第二章单样本非参数检验10:552思考的要点 各种检验方法的思路 各种检验方法统计量的构造 各种检验方法的应用场合 在SAS与R中如何完成 10:553第一节第一节 符号检验符号检验第二节第二节 Cox-StuartCox-Stuart趋势检验趋势检验 第三节第三节 游程检验游程检验第四节第四节 WilcoxonWilcoxon符号秩检验符号秩检验第五节第五节 正态记分检验正态记分检验第六节第六节 与参数检验相对效率比较与参数检验相对效率比较10:554符号检验的统计量为B=得正号的个数。 符号检验符号检验。设随机变量X1,Xn是从某个总体X中抽出的简单随机样本。且分布函数F(X)

2、在X=0是连续的。假设检验问题00:(HF1)210:(HF1)2检验的统计量可以取B。 第一节第一节 符号检验符号检验 在原假设为真的条件下,B服从参数为n和0.5的二项分布b(n,0.5)。由于原假设为真时,B应该不太大,也不太小,如果B太大或太小,应该拒绝原假设。10:555 精确的符号检验是指检验的p值是由精确的概率给出的。 我们我们利用正号和负号的数目,来检验某假设,这是一种最简单的非参数方法。 【例4】联合国人员在世界上71个大城市的生活花费指数(上海是44位,数据为63.5)按自小至大的次序排列如下。一、精确中位数的符号检验一、精确中位数的符号检验10:556 有人说64应该是这

3、种大城市花费指数的中位数,有人说64顶多是低位数(下四分位数),进行检验。数据如下: 122.4,109.4,105,104.6,104.1,100.6,100,99.3,99.1,98.2,97.5,95.2,92.8,91.8,90.8,90.3,89.5, 89.4,86.4,86.2,85.7,82.6,81,80.9,79.1,77.9, 77.7,76.8,76.6,76.2,74.5,74.3,73.9,71.7,71.2, 67.7,66.7,66.2,65.4,65.3,65.3,65.3,64.6,63.5, 62.7,60.8,58.2,55.5,55.3,55,54.9

4、,52.7,51.8, 49.9,48.2,47.6,46,45.8,45.2,41.9,38.8,37.7,37.5,36.5, 36.4,32.7,32.7,32.2,29.1,27.8,27.810:557Histogram of xxFrequency20406080100120024681010:558 通常在正态总体分布的假设下,关于总体均值的假设检验和区间估计是用与t检验有关的方法进行的。然而,在本例中,总体分布是未知的。为此,首先看该数据的直方图从图中很难说这是什么分布。假定用总体中位数来表示中间位置,这意味着样本点,取大于me的概率应该与取小于me的概率相等。所研究的问题,可

5、以看作是只有两种可能“成功”或“失败”。 10:559符号检验的思路,记成功:X-0大于零,即大于中位数M,记为“+”;失败:X-0小于零,即小于中位数M,记为“-”。令 S+=得正符号的数目 S=得负符号得数目可以知道S+或S 均服从二项分布B(65,0.5)。则可以用来作检验的统计量。其假设为:0010:HH0010:HH0010:HH10:5510关于非参数检验统计量需要说明的问题关于非参数检验统计量需要说明的问题 在非参数检验中,可以得到两个相互等价的统计量,比如在符号检验中,得负号与得正好的个数,就是一对等价的统计量,因为S+S-=N。那么我们在检验时应该用那个呢?约定选择统计量mi

6、n(,),ks s10:551101:64:64HH2871710(28)(0.5) (1 0.5)0.04796iiiip SC(28)0.04796p S假设检验统计量S-=28是得负号的个数得正号的个数43。P-值检验的结果拒绝零假设结论中位数大于6410:5512该检验R的代码 x-c(122.4,109.4,105,104.6,104.1,100.6,100,99.3,99.1,98.2,97.5,95.2,92.8,91.8,90.8,90.3,89.5, 89.4,86.4,86.2,85.7,82.6,81,80.9,79.1,77.9, 77.7,76.8,76.6,76.2

7、,74.5,74.3,73.9,71.7,71.2, 67.7,66.7,66.2,65.4,65.3,65.3,65.3,64.6,63.5, 62.7,60.8,58.2,55.5,55.3,55,54.9,52.7,51.8, 49.9,48.2,47.6,46,45.8,45.2,41.9,38.8,37.7,37.5,36.5, 36.4,32.7,32.7,32.2,29.1,27.8,27.8)y=sum(sign(x-64)=1)pbinom(71-y,71,0.50)10:5513二、大样本的情形 当样本容量足够大,我们可以利用二项分布的正态近似来对该问题进行检验。因为计数统

8、计量在原假设为真时,服从b(n,0.5)。且其均值为0.5n,方差为0.25n。则检验的统计量为 足够大)nnnBz(25. 05 . 010:5514第二节第二节 Cox-StuartCox-Stuart趋势检验趋势检验 人们经常要看某项发展的趋势但是从图表上很难看出是递增,递减,还是大致持平 【例5】我国自1985年到1996年出口和进口的差额(balance)为(以亿美元为单位) 149.0 119.7 37.7 77.5 66.0 87.4 80.5 43.5 122.2 54.0 167.0 122.2 从这个数字,我们能否说这个差额总的趋势是增长,还是减,还是都不明显呢?下图为该数

9、据的点图从图可以看出,总趋势似乎是增长,但1993年有个低谷;这个低谷能否说明总趋势并不是增长的呢?我们希望能进行检验10:5515Case Number10987654321Value VAR0012001000-100-20010:5516三种假设: 有增长趋势无增长趋势;:10HH有减少趋势无减少趋势;:10HH有趋势无趋势;:10HH 怎么进行这些检验呢?可以把每一个观察值和相隔大约n2的另一个观察值配对比较;因此大约有n2个对子然后看增长的对子和减少的对子各有多少来判断总的趋势具体做法为取 和 。这里ixcix10:5517 在这个例子中n=12,因而c6。这6个对子为(x1,x7)

10、,(x2,x8),(x3,x9),(x4,x10),(x5,xl1),(x6,x12)。/2(1)/2nncnn如果 是偶数如果 是奇数10:5518 用每一对的两元素差Di=xi-xi+c的符号来衡量增减。令S+为正Di=xi-xi+c的数目,而令S-为负的Di=xi-xi+c的数。显然当正号太多时,即S+很大时(或S-很小时),有下降趋势,反之,则有增长趋势在没有趋势的零假设下它们应服从二项分布b(6,0.5),这里n为对子的数目(不包含差为0的对子)。该检验在某种意义上是符号检验的一个特例。10:5519 类似于符号检验,对于上面1,2,3三种检验,分别取检验统计量K=S+,K=S-和K

11、=min(S+,S-)。在本例中,这6个数据对的符号为 5负1正, 所以我们不能拒绝原假设。 1094. 0) 1(SP假设统计量 P值K=min(S+,S-) P(Kk)K=min(S+,S-) P(Kk)K=min(S+,S-) 2P(Kk)有增长趋势无增长趋势;:10HH有减少趋势无减少趋势;:10HH有趋势无趋势;:10HH10:5520 【 例6 】天津机场从1995年1月到2003年12月的108个月旅客旅客吞吐量数据如下: 54379 45461 55408 59712 60776 57635 63335 71296 70250 76866 75561 66427 61330 5

12、8186 67799 76360 86207 75509 83020 89614 75791 80835 72179 61520 66726 60629 68549 73310 80719 67759 70352 82825 70541 74631 68938 53318 62653 58578 63292 69535 73379 62859 72873 87260 67559 76647 70590 58935 58161 64057 63051 58807 63663 57367 70854 79949 66992 80140 62260 55942 58367 56673 61039 7

13、4958 85859 67263 87183 97575 79988 88501 68600 58442 68955 56835 67021 81547 85118 70145 95080 106186 86103 88548 70090 65550 69223 85138 89799 99513 98114 68172 97366 116820 95665 109881 87068 75362 88268 85183 87909 79976 27687 50178 100878 131788 116293 120770 104958 109603讨论是否存在显著的增长趋势。 10:55210

14、20406080100400006000080000100000120000Indexx10:5522SPSS无此检验,我们用R完成该检验,代码如下。x-c(54379,45461,55408,59712,60776,57635,63335,71296,70250,76866,75561,66427,61330,58186,67799,76360,86207,75509,83020,89614,75791,80835,72179,61520,66726,60629,68549,73310,80719,67759,70352,82825,70541,74631,68938,53318,62653

15、,58578,63292,69535,73379,62859,72873,87260,67559,76647,70590,58935,58161,64057,63051,58807,63663,57367,70854,79949,66992,80140,62260,55942,58367,56673,61039,74958,85859,67263,87183,97575,79988,88501,68600,58442,68955,56835,67021,81547,85118,70145,95080,106186,86103,88548,70090,65550,69223,85138,8979

16、9,99513,98114,68172,97366,116820,95665,109881,87068,75362,88268,85183,87909,79976,27687,50178,100878,131788,116293,120770,104958,109603) d=x1:54-x55:108 y=sum(sign(d)=1) pbinom(y,54,0.5) 直接得到p值=0.0019190.05,拒绝无趋势的原假设原假设。10:5523补充:检验的p值 在假设检验中,常常通过检验的p值来决策。 p值为拒绝原假设的最小概率。对于t检验,如果计算出的统计量的值为t0,则左尾检验的p值

17、为概率p(t t0)右尾检验的p值为概率p(t t0)双尾检验的p值为概率p(|t| t0|)。 但是对于非参数检验来说由于有两个等价的统计量,如得正号的个数与得负号的个数之和等于样本容量n;两个总体的秩和等于N(N+1)/2。10:5524 比如是左侧检验,如果总体真实的中位数比假设的小,则检验的统计量w+表现出过小, w-表现出大,检验的p值为p( w+w小),此时用的最小的统计量。对于右侧检验,如果总体真实的中位数比假设的大,则检验的统计量w+表现出过大, w-表现出小。检验的p值为p( w+w大)。实际上 p( w+w大) = p( -w+-w大) = pN(N+1)/2-w+ N(N

18、+1)/2 -w大 = pw-w小 可见检验的统计量用k=min(w+,w-)是合理的。另外双侧检验的p值是单侧的两倍。10:5525 游程检验是样本的随机性检验,其用途很广。例如当我们要考察生产中次品出现是随机的,还是成群的,一个时间序列是平稳的还是非平稳的。第三节 游程检验10:5526 从生产线上抽取产品检验,是否应采用频繁抽取小样本的方法。在一个刚刚建成的制造厂内,质检员需要设计一种抽样方法,以保证质量检验的可靠性。生产线上抽取的产品可以分成两类,有瑕疵,无瑕疵。检验费用与受检产品数量有关。一般情况下,有毛病的产品如果是成群出现的,则要频繁抽取小样本,进行检验。如果有毛病的产品是随机产

19、生的,则每天以间隔较长地抽取一个大样本。现随机抽了28件产品,按生产线抽取的顺序排列:0000111111111111110001111111检验瑕疵的产品是随机出现的吗?有瑕疵的产品是随机出现 有瑕疵的产品是成群出现:0H:1H10:5527 随机抽取的一个样本,其观察值按某种顺序排列,如果研究所关心的问题是:被有序排列的两种类型符号是否随机排列,则可以建立双侧备择假设组为 H0 H0: 序列是随机的序列是随机的 H1H1: 序列不是随机的(双侧检验)序列不是随机的(双侧检验)如果关心的是序列是否具有某种倾向,则应建立单侧备择,假设组为 H0 H0: 序列是随机的序列是随机的 H1: H1:

20、 序列具有混合的倾向(右侧检验,游程过多)序列具有混合的倾向(右侧检验,游程过多) H0H0: 序列是随机的序列是随机的 H1: H1: 序列具有成群的倾向(左侧检验,游程过小)序列具有成群的倾向(左侧检验,游程过小)游程:连续出现的具有相同特征的样本点为一个游程。游程:连续出现的具有相同特征的样本点为一个游程。10:5528 检验统计量。在H0为真的情况下,两种类型符号出现的可能性相等,其在序列中是交互的。相对于一定的m和n,序列游程的总数应在一个范围内。 若游程的总数过少,表明某一游程的长度过长,意味着有较多的同一符号相连,序列存在成群的倾向; 若游程总数过多,表明游程长度很短,意味着两个

21、符号频繁交替,序列具有混合的倾向。选择的检验统计量为R游程的总数目。 10:552922(2)( )(1)mnmnnmVar Rmnnm( )21nmE Rmn可以证明)1 , 0()()(NRVarRERZ则10:5530游程R的分布为,奇数时mnmknkmknkmCCCCCkRp111111) 12(mnmknkmCCCkRp11112)2(关于此可以做如下的考虑游程R的分布为,偶数时10:5531 先在m+n个抽屉里随机选择m个,抽出的抽屉里放入“1”,没有的放入“0”,所有可能基本的基本事件数为:mnmC有种。 或先在m+n个抽屉里随机选择n个,抽出的抽屉里放入“0”,没有的放入“1”

22、,所有可能基本的基本事件数为:nm nC有种。mnm nm nCC10:5532 1、必定有k+1个由“1”构成的游程和k个由 “0”构成的游程; 2、或必定有k+1个由“0”构成的游程和k个由 “1”构成的游程。如果游程数为奇数R=2K1,这意味着:10:5533 这就必须在m1个位置中插入K个“隔离元”,使有 “1”有k+1个游程,可以有 种,同样可以在n-1个“0”的n-1个空位上插入K-1个“隔离元”,有 种。共有有利基本事件数 。kmC111knC111knkmCC10:5534在第二种情形下,有 故:111kmknCCmnmknkmknkmCCCCCkRp111111) 12(mn

23、mknkmCCCkRp11112)2(22(2)( )(1)mnmnnmVar Rmnnm( )21nmE Rmn得同理10:5535备择假设P值序列具有混合的倾向右尾概率序列具有聚类的倾向左尾概率序列是非随机的较小的左尾概率的两倍1) 1()2(2)(2mnnmmnmnmnRVar) 1 , 0()()(NRVarRERZ10:5536 【例7】,在我国的工业和商业企业随机抽出22家进行资产负债率行业间的差异比较。有如下资料:这两个行业的负债水平是否相等。 首先,设 “1”为工业,“2”为商业,将两个行业的数据排序,得行业编号得游程: 1 1 1 1 1 2 1 1 1 1 2 2 2 1

24、1 1 2 2 2 2 2 2工业64 76 55 82 59 82 70 75 61 64 73 83商业77 80 80 65 93 91 84 91 84 86 8610:5537游程检验的菜单选择。10:553810:5539Runs Test1.4286129216-2.190.029Test ValueaCases = Test ValueTotal CasesNumber of RunsZAsymp. Sig. (2-tailed)资产负债Meana. 游程检验的结果:共有21个个案,12个小于1.4286,9个大于等于1.4286。游程6个。检验的统计量的值为-2.19,相应的

25、渐近p值=0.029,则拒绝原假设。10:5540 【例8】公司委托市场调查公司进行随机抽样调查。为了对调查表的真伪进行判断,市场调查公司按顺序抽取了20份问卷。其中消费者每年消费该公司的产品的花费数据如下表,分析问卷数据是否真实。用游程检验。样本编号12345678910消费额405205245465257234445375291291样本编号11121314151617181920消费额26121030529512525726019716015010:5541Runs TestRuns Test258.5010102010-.230.818Test ValueaCases = Test V

26、alueTotal CasesNumber of RunsZAsymp. Sig. (2-tailed)消费支出Mediana. 检验结果说明p值=0.808,不能拒绝随机数据的原假设。10:5542第四节第四节 单样本的单样本的Wilcoxon符号秩检验符号秩检验 一、 Wilcoxon符号秩检验0100:MMHMMH0100:MMHMMH0100:MMHMMH 前面几种推断的方法都只依赖于数据的符号,即方向。没有考虑数据的大小,Wilcoxon符号秩检验是检验关于中位数对称的总体的中位数是否等于某个特定值,检验的假设: 10:5543 检验的步骤检验的步骤: 1. 计算 ,它们代表这些样本

27、点到 的距离; |0MXi0M 2. 把上面的n个绝对值排序,并找出它们的n个秩;如果有相同的样本点,每个点取平均秩(如1,4,4,5的秩为1,2.5,2.5,4),然后分别将得正号的秩和得负号的秩相加。另1(0)niiiWRXM1(0)niiiWRMX(0)iMX指满足括号里的条件等于1,不满足等于零。10:55440010:HMMHMM右 0010:HMMHMM左 3. 双双 在零假设下, 和 应差不多因而,当其中之一非常小时,应怀疑零假设;取检验统计量T=min( , ); 0100:MMHMMHWWWW10:55451()(0)(0)11(1)224niiiiiE WE RXMnE R

28、 EXMnn nn121()(0)1(1)(21)424niiiniVar WVar RXMn nni统计量的均值和方差如下:10:5546 5. 根据得到的T值,查Wilcoxon符号秩检验的分布表以得到在零假设下p值如果n很大要用正态近似:得到一个与T有关的正态随机变量Z的值,再查表得P值或直接用计算机得到P值。(1)/ 4(0,1)(1)(21)/ 24Tn nZNn nn10:5547Wilcoxon符号秩检验表符号秩检验表)(2tTp)(tTpmin(,)TW W)(tTp假设检验的统计量P值 0100:MMHMMH0100:MMHMMHmin(,)TW Wmin(,)TW W010

29、0:MMHMMH10:5548 【例9】 欧洲10个城镇每人每年平均消费酒类相当于纯酒精数(单位:升)。 4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45。人们普遍认为其中位数为8。检验该假设。 x-c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45) wilcox.test(x-8)10:5549 Wilcoxon signed rank testdata: x - 8 V = 46, p-value = 0.06445alternative hypothesis:

30、true location is not equal to 0 10:5550 【例10】为了了解垃圾邮件对大型公司决策层工作的影响程度,某个网站收集了19家大型公司的CEO每天收到的垃圾邮件件数,得到如下数据: 310,350,370,375,385,400,415,425,440,195, 325,295,250,340,295,365,375,360,385 检验收到的垃圾邮件的数量的中间位置是否超过了320封。10:5551x-c(310,350,370,375,385,400,415,425,440,195, 325,295,250,340,295,365,375,360,385)

31、wilcox.test(x-320)data: x - 320 V = 146, p-value = 0.04207alternative hypothesis: true location is not equal to 0 10:5552注 Holdges-Lemmann 估计量 定义2.1 假设X1, X2, Xn为简单随机样本,计算任意两个样本点的平均数,从而得到一个样本长度为n(n+1)/2的新的数据,这组数据称为Walsh平均值,即:,2ijuXXWAXXij10:5553 定理 由定义2.1,Wilcoxon符号秩统计量W+可以表示为 #0,2ijXXWij 即W+是Walsh平

32、均值中符号为正的个数。如果中心是,则定义 #,2ijXXWij 即W+()是检验0010:HH的统计量。10:5554 定义2.2 假定假设X1, X2, Xn为F(X)的简单随机样本,如果F(X)为对称,则定义Walsh中位数如下: ,1,2,2ijXXmedianijn 作为的Holdges-Lemmann 估计量。 10:5555 从应用的角度看,这种中位数的计算对于样本容量非常小时,更为合理。比如X11季节调整中,季节变动和不规则变动相对数的平均值,就是计算的Holdges-Lemmann 中位数估计量。 补充: X11季节调整。10:5556 定理 假定假设X1, X2, Xn为F(

33、X)的简单随机样本,如果F(X)为对称,则定义Walsh平均,记为 WA(1),WA(),WA(),则 其中/2(1)(1)(21)224n nn nnkz(1)2n nN(1)(),kN kWAWA10:5557x-c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)walsh=NULLi例如正态记分检验统计量为正态记分检验统计量为10:5565正态积分检验的统计量为:11(0)1niiiRTI XMn10:5566 (二) 检验 检验的假设为:0100:;:MMHMMH0010:;:HMMHMM0010:;:HMMHMM10:

34、5567则检验的统计量为 11() (0)1niiiTI XMn11() (0)1niiiTI XMn或111()()021niiE Tnacnn2111()()141niniD Tnn()(0,1)var()TE TTNT当样本足够大时,10:556834:;34:10MHMH 例、下面的数据是亚洲10个国家的新生儿死亡率() 33 36 31 15 9 6 4 65 77 88 10:5569 秩 符号秩 平方3311 0.090909-1.33518-1.335181.7827013622 0.181818-0.90846-0.908460.8252953133 0.272727-0.6

35、0459-0.604590.36552315194 0.363636-0.34876-0.348760.1216319255 0.454545-0.11419-0.114190.0130386286 0.5454550.1141850.1141850.0130384307 0.6363640.3487560.3487560.12163165318 0.7272730.6045850.6045850.36552377439 0.8181820.9084580.9084580.825295885410 0.9090911.3351781.3351781.782701合计6.216376iX|34|

36、iX1in1()1in10:557011() (0)1niiiTXn()0E T2111()()141niniD Tnn21110 1()1.7279 41niin0.908460.6045850.908458 1.335178 1.9410:5571()TE TzVar T1.941.94=1.471.314()zVar T2 (1.47)2 0.070.140.05pp z接受原假设。接受原假设。10:5572 假定表示犯第一类错误的概率,而表示犯第二类错误的概率(检验的势为1- )。对于任意的检验T,理论上总可以找到样本容量n,使该检验满足固定的和。显然为了达到这个要求,需要样本容量大的

37、检验就不如需要样本容量小的检验效率高。为了达到同样的和,检验T1需要n1个样本点,检验T2需要n2个样本点.我们用n1/n2来定义T2相对于T1的效率。当然这个比值越大,T2需要的样本容量越小, T2的效率越高。定义渐近相对效率ARE为12limnn10:5573第六节 单个总体渐近相对效率的比较 假定假设X1, X2, Xn为F(X)的简单随机样本,我们来讨论符号检验,Wilcoxon符号秩检验和t检验三者的渐近相对效率。我们需要检验 01:0,:0HH 前面我们已经学习了关于线性符号秩统计量,在一些条件成立下,线性符号秩统计量有计算功效的公式。10:55741 线性符号秩统计量一类线性符号

38、秩统计量为1()niiiSaR(0)iiI X 假定( )()1iniaibn 这里 是非降非负平方可积函数。()1in10:5575 Wilcoxon线性符号秩统计量1niiiWR( )aii( )( )()()111nuuiiainbnn10:5576 符号检验的统计量1niiB( )1ai( )1( )()1111nuiainb10:5577可以证明效力因子10120( )( ,)()( )nuu f dueff Sudu其中1111()22( ,)11()22f Fuu ff Fu F(x)是总体的分布函数,f是总体的密度函数。10:5578 利用这个结论我们可以计算W+检验的功效10

39、120( )( ,)()( )nuu f dueff Sudu 110112011()2211()22 ()f Fuuduf Fueff Wudu10:5579110111()2211()22()13f Fuuduf Fueff W111()22tFu令2 ( ) 1uF t那么2 ( )duf t0.51,;0,utut 10:558010 2( )12( ) ()13f tF tf t dtf teff W1/22 32 ( ) 1 F tf t dt 1/2122 ( ) 1 F tf t dt 1/21/2122 ( ) 1 2 ( ) ( )F tf tf t f t dt 1/21

40、22 ( ) ( )f t f t dt212( )ft dt10:5581类似还可以计算其他检验的效力因子。2()12( )eff Wft dt( )neff T( )2 (0)eff Bf10:55822 各种统计量渐近相对效率的比较2222( , )4(0)BftCARE B tfC22222(, )12( )WftCARE Wtft dtC22222(0)( ,)3( )BWCfARE B WCft dt10:5583渐近相对效率的比较nt/nw(或B)分布U(-1.1)N(0,1)Logisti重指数密度函数ARE(W,T) 1(一样)3/(T)3/2(W+)ARE(B,T)1/3(

41、T)2/(T)2(B)1( 1,1)2I 21exp()22x(1)xxee2xe2/9()W2/12( )T10:5584 例 假定假设X1, X2, Xn来自一个污染的正态分布,该污染的正态分布的分布函数为( )(1)( )( )3xFxx ( )( )fxF x1( )(1) ( )( )33xfxx 10:5585221133xxxdx() ( )( ) 198() 2( )ft dt21(1) ( )( )33xxdx 22221(1)( )( )(1)( ) ( )933xxxxdx 22(1)(1)265 10:558622222(1)(1)(,)12(18 )265WTCARE

42、 WTC 2223(1 8 )2(1)(1)35 10:5587 从上面的计算可知,在正态分布的假定下,t检验与Wilcoxon的符号秩检验的效率差别不大。但是如果总体是一个污染的正态分布,从0.01开始,Wilcoxon的符号秩检验的效率就比t检验好。00.010.030.050.080.100.15ARE(W+,t)0.955(T)1.009(W+)1.108W/+1.196W+1.301W+1.373W+1.497W+10:5588 最后一节告诉我们非参数统计分析的重最后一节告诉我们非参数统计分析的重要性,当分布非正态时,大多数情况下,非要性,当分布非正态时,大多数情况下,非参数估计更有效率。参数估计更有效率。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第二章非参数统计分析(0303)课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|