概率论与数理统计第7章-假设检验课件.ppt_163文库

资源描述

1、7.1 假设检验的基本思想与概念7.2 正态总体参数假设检验7.3 其它分布参数的假设检验7.4 似然比检验与分布拟合检验7.1 假设检验的基本思想与概念 7.1.1 假设检验问题例7.1.1 某厂生产的合金强度服从，其中的设计值为不低于110(Pa)。为保证质量，该厂每天都要对生产情况做例行检查，以判断生产是否正常进行,即该合金的平均强度不低于 110(Pa)。某天从生产中随机抽取25块合金，测得强度值为x1,x2,x25，其均值为 (Pa)，问当日生产是否正常？(,16)N108x(1)是参数估计问题吗？(2)回答“是”还是“否”，假设检验问题。(3)命题“合金平均强度不低于1

2、10Pa”正确与否仅涉及如下两个参数集合：0:110 1:110 这两个非空参数集合都称作统计假设，简称假设。(4)我们的任务是利用样本去判断假设（命题）“”是否成立。这里的“判断”在统计学中称为检验或检验法则。07.1.2 假设检验的基本步骤一、一、建立假设在假设检验中，常把一个被检验的假设称为原假设，用表示，通常将不应轻易加以否定的假设作为原假设。当被拒绝时而接收的假设称为备择假设，用表示，它们常常成对出现。0H0H1H在例7.1.1中，我们可建立如下两个假设：0:110Hvs1:110H二、选择检验统计量，给出拒绝域形式假设检验的任务是确认H0是否为真，具体做法就是先假定H0成

3、立，然后用样本去判断其真伪，由样本对原假设进行判断总是通过一个统计量完成的，该统计量称为检验统计量。使原假设被拒绝的样本观测值所在区域称为拒绝域，一般用W 表示，在例7.1.1中，样本均值愈大，意味着总体均值也大，因此，合理的拒绝域形如x1(,):nWxxxcxc正如在数学上我们不能用一个例子去证明一个结论一样，用一个样本（例子）不能证明一个命题（假设）是成立的，但可以用一个例子（样本）推翻一个命题。因此，从逻辑上看，注重拒绝域是适当的。事实上，在“拒绝原假设”和“拒绝备择假设（从而接收原假设）”之间还有一个模糊域，如今我们把它并入接收域，所以接收域是复杂的，将之称为保留域也许更恰当，但习

4、惯上已把它称为接收域，没有必要再进行改变，只是应注意它的含义。观测数据情况总体情况犯第一类错误正确正确犯第二类错误为真0H 为真1H1(,)nxxW1(,)cnxxW三、选择显著性水平检验可能犯以下两类错误：其一是为真但样本观测值落在拒绝域中，从而拒绝原假设，这种错误称为第一类错误，其发生的概率称为犯第一类错误的概率，或称拒真概率，通常记为其二是不真（即为真）但样本观测值落在接受域中，从而接受原假设，这种错误称为第二类错误，其发生的概率称为犯第二类错误的概率,或称取伪概率，通常记为。0H0H.0H1H0H犯第一类错误的概率和犯第二类错误的概率可以用同一个函数表示，即所

5、谓的势函数。势函数是假设检验中最重要的概念之一，定义如下：定义7.1.1 设检验问题0011:HvsH的拒绝域为W，则样本观测值落在拒绝域内的概率称为该检验的势函数，记为 01()(),gPWx (7.1.3)这个势函数是的减函数势函数是定义在参数空间上的一个函数。犯两类错误的概率都是参数的函数，并可由势函数算得，即：()g01(),()1(),g 对例7.1.1，其拒绝域为，由(7.1.3)可以算出该检验的势函数()()4/54/54/5xccgP xcP Wx c由此可得如下结论：利用这个势函数容易写出犯两类错误的概率分别为()4/5,c 0和()1,4/5c 1,当减小时，

6、c 也随之减小，必导致的增大；当减小时，c 会增大，必导致的增大；说明：在样本量一定的条件下不可能找到一个使和都小的检验。英国统计学家 Neyman 和 Pearson 提出水平为的显著性检验的概念。(),g则称该检验是显著性水平为的显著性检验，简称水平为的检验。定义7.1.2 对检验问题00:H对11:H如果一个检验满足对任意的，0都有四、给出拒绝域确定显著性水平后，可以定出检验的拒绝域W。在例7.1.1中，若取=0.05,由于g()关于单调减，只需要5(110)(110)0.054cg 成立即可。这给出c 的值为0.051100.81100.8 1.645cu=108.

7、684检验的拒绝域为108.684Wx若令1104/5xu则拒绝域有另一种表示:0.051.645Wuuu 以后主要用检验统计量U表示拒绝域五、作出判断在有了明确的拒绝域后，根据样本观测值我们可以做出判断：当或时，则拒绝即接收；当或时，则接收 108.684x 1.645u 0H1H108.684x 1.645u 在例7.1.1中，由于108108.684x 因此拒绝原假设，即认为该日生产不正常。0H7.1.3 检验的 p 值假设检验的结论通常是简单的:在给定的显著水平下，不是拒绝原假设就是保留原假设。然而有时也会出现这样的情况：在一个较大的显著水平（下得到拒绝原假设的结论，而在

8、一个较小的显著水平（）下却会得到相反的结论。这种情况在理论上很容易解释：因为显著水平变小后会导致检验的拒绝域变小，于是原来落在拒绝域中的观测值就可能落入接受域。但这种情况在应用中会带来一些麻烦：假如这时一个人主张选择显著水平，而另一个人主张选，则第一个人的结论是拒绝H0，而后一个人的结论是接受H0，我们该如何处理这一问题呢？例7.1.5 一支香烟中的尼古丁含量X 服从正态分布N(,1)，质量标准规定不能超过1.5毫克。现从某厂生产的香烟中随机抽取20支测得其中平均每支香烟的尼古丁含量为毫克，试问该厂生产的香烟尼古丁含量是否符合质量标准的规定。1.97x 这是一个假设检验问题：H0:

9、1.5,H1:1.5,采用u检验，计算得:01.97 1.52.10/1/20 xun对一些的显著性水平，表7.3.1列出了相应的拒绝域和检验结论。表7.1.1 例7.1.5中的拒绝域显著性水平拒绝域u=2.10对应的结论=0.05u1.645拒绝H0=0.025u1.96拒绝H0=0.01u2.33接受H0=0.005u2.58接受H0我们看到，不同的有不同的结论。现在换一个角度来看，在=1.5时，u的分布是N(0,1)。此时可算得，P(u2.10)=0.0179，若以0.0179为基准来看上述检验问题，可得当2.10。于是2.10就不在中，此时应接受原假设H0;当0.0179时，2.1

10、0。于是2.10就落在中，此时应拒绝H0。1u1uu1uu由此可以看出，0.0179是能用观测值2.10做出“拒绝H0”的最小的显著性水平，这就是p值。1u定义7.1.3 在一个假设检验问题中，利用观测值能够做出拒绝原假设的最小显著性水平称为检验的p 值。引进检验的p 值的概念有明显的好处:第一，它比较客观，避免了事先确定显著水平；其次，由检验的p 值与人们心目中的显著性水平进行比较可以很容易作出检验的结论：如果 p，则在显著性水平下拒绝 H0；如果 p，则在显著性水平下保留 H0.p 值在应用中很方便，如今的统计软件中对检验问题一般都会给出检验的p 值。例7.1.6 设是来自b

11、(1,)的样本，要检验如下假设：0010:HvsH1,nxx若取显著性水平为，则在得到观测值后，我们只需要计算概率:0ixt00ipPxt这就是检验的p 值。譬如 0040,0.1,8nt4039733404010.90.10.90.10.90.0419.17p 若取=0.05，由于p 2.776，故拒绝原假设，认为该厂生产的铝材的长度不满足设定要求。若取=0.05，则 t0.975(4)=2.776.239.5,0.4,xs故0/xun11/2|uuuuuu检验法条件检验统计量拒绝域u 检验已知t 检验未知原假设0H备择假设1H00000011/2|uuuuuu0/xun0/xtsn11/2

12、(1)(1)|(1)t tnt t nt tn000000表7.2.1 单个正态总体的均值的检验问题三、假设检验与置信区间的关系这里用的检验统计量与6.5.5节中置信区间所用的枢轴量是相似的。这不是偶然的，两者之间存在非常密切的关系。设是来自正态总体的样本，现在未知场合讨论关于均值的检验问题。考虑双侧检验问题:1,nxx2(,)N 0010:HvsH它可以改写为1/201/2(1)(1)ssWxtnxtnnn并且有0()1,PW若让0 在(-)内取值，就可得到的1-信区间：这里0并无限制.1/2(1)sxtnn01/2|(1)sWxtnn则水平为的检验接收域为 00:H关于的水平

13、为的显著性检验。00:H是一一对应的。类似地，“参数的1-置信上限”与“关于00:H 的单侧检验问题的水平的检验”反之若有一个如上的1-置信区间，也可获得所以:“正态均值的1-置信区间”与“关于的双侧检验问题的水平的检验”参数的1-置信下限与另一个单侧检验也是一一对应的。是一一对应的。7.2.2 两个正态总体均值差的检验检验法条件原假设备择假设检验统计量拒绝域u检验已知t 检验未知0H1H12,12,1212121212122212xyumn11/2|uuuuuu11wxytsmn11/2(2)(2)|(2)t tm nt t m nt tm n 12121212121212大样本检u

14、验未知m,n充分大近似t 检验未知m,n不很大12,12,22yxxyussmn11/2|uuuuuu22yxxytssmn11/2(1)(1)|(1)ttlttlttl121212121212121212121212444022/,11yxsslsmmnn2220/xyssmsn例7.2.3 某厂铸造车间为提高铸件的耐磨性而试制了一种镍合金铸件以取代铜合金铸件，为此，从两种铸件中各抽取一个容量分别为 8和9的样本，测得其硬度为镍合金：76.43 76.21 73.58 69.69 65.29 70.83 82.75 72.34铜合金：73.66 64.27 69.34 71.37 6

15、9.77 68.12 67.27 68.07 62.61 根据经验，硬度服从正态分布，且方差保持不变。试在显著性水平下判断镍合金的硬度是否有明显提高。解：用X 表示镍合金的硬度，Y 表示铜合金的硬度，则由假定，21(,),XN 22(,).YN 要检验的假设是：012112:HvsH经计算，89221173.39,68.2756,()205.7958,()91.1552iiiixyxxyy从而1(205.795891.1552)4.4494892ws 73.3968.27562.2210114.449478t查表知0.95(15)1.7531,t由于0.95(15)tt故拒绝原假设，可判断镍

16、合金硬度有显著提高。7.2.3 正态总体方差的检验一、单个正态总体方差的检验设是来自的样本，对方差亦可考虑如下三个检验问题：1,nxx2(,)N 22220010:HvsH22220010:HvsH22220010:HvsH通常假定未知，它们采用的检验统计量是相同的，均为若取显著性水平为，则对应三个检验问题的拒绝域依次分别为22201,ns2211;Wn221;Wn222221211Wnn或例7.2.4 某类钢板每块的重量X 服从正态分布，其一项质量指标是钢板重量的方差不得超过 0.016(kg2)。现从某天生产的钢板中随机抽取 25块，得其样本方差S2=0.025(kg2)，问该天

17、生产的钢板重量的方差是否满足要求。解：原假设为20:0.016,H备择假设为21:0.016,H此处n=25，若取=0.05，则查表知20.952436.4152220124 0.02537.536.4150.016ns由此，在显著性水平0.05下，我们拒绝原假设，认为该天生产的钢板重量不符合要求。现计算可得二、两个正态总体方差比的F 检验设是来自的样本，是来自的样本。考虑如下三个假设检验问题 1,mxx211(,)N 1,nyy222(,)N 2222012112:HvsH2222012112:HvsH2222012112:HvsH通常 ,均未知，记 ,分别是由算得的的无偏估计和

18、由算得的的无偏估计.122xs2ys1,nyy1,mxx2122可建立检验统计量:22xysFs三种检验问题对应的拒绝域依次为11,1 WFFmn1,1WFFmn21,1WFFmn121,1FFmn。或例7.2.5 甲、乙两台机床加工某种零件，零件的直径服从正态分布，总体方差反映了加工精度，为比较两台机床的加工精度有无差别，现从各自加工的零件中分别抽取7件产品和8 件产品，测得其直径为 X (机床甲)16.2 16.4 15.8 15.5 16.7 15.6 15.8Y (机床乙)15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0这就形成了一个双侧假设检验问

19、题，原假设是备择假设为此处 m=7，n=8，经计算22012:,H22112:H20.2729,xs 0.27291.2610.2164F 查表知0.9756,75.12F于是，若取 =0.05，20.2164,ys 0.0250.975110.1757,65.70FF其拒绝域为0.175 5.12WFF或由此可见，样本未落入拒绝域，即在0.05水平下可以认为两台机床的加工精度一致。7.3 其他分布参数的假设检验7.3.1 指数分布参数的假设检验设 x1,x2,xn 是来自指数分布的样本，关于的如下检验问题：0010:HvsH(7.3.1)拒绝域的形式是，由于在=0时，Wxc22

20、02(2)nxn所以拒绝域为 2212Wn0010:HvsH0010:HvsH222Wn拒绝域为:拒绝域为:222221-222Wnn或例7.3.1 设我们要检验某种元件的平均寿命不小于6000小时，假定元件寿命为指数分布，现取 5个元件投入试验，观测到如下5个失效时间:395,4094,119,11572,6133。解：由于待检验的假设为 01:6000:6000HvsH若取=0.05，则检验拒绝域为:220.05103.94,W201010 4462.67.43776000 x故接受原假设,可以认为在0.05的显著性水平下平均寿命不低于6000小时.经计算得7.3.2 比例的检验比例 p

21、可看作某事件发生的概率。作 n 次独立试验，以 x 记该事件发生的次数，则。我们可以根据 x 检验关于 p 的一些假设:,xb n p(1)直观上看拒绝域为:，由于x 只取整数值，故c 可限制在非负整数中。0010:,HppvsHppWxc00;1,nn iioi cnP xc pppi 这是在对离散总体作假设检验中普遍会遇到的问题.一般情况下，对给定的，不一定能正好取到一个正整数c 使下式成立:一般较常见的是找一个c0，使得则取 c=c0+10000111nnn in iiiooi ci cnnppppii (2)0010:HppvsHpp检验的拒绝域为:,Wxcc 为满足001cn

22、 iioinppi 的最大正整数。(3)0010:HppvsHpp检验的拒绝域为:1Wxc2xc或其中c1为满足下式的最大正整数:10012cn iioinppi c2为满足下式的最小正整数:12012nn iioi cnppi例7.3.2 某厂生产的产品优质品率一直保持在 40%，近期对该厂生产的该类产品抽检 20 件，其中优质品7件，在下能否认为优质品率仍保持在40%？0.05解：以p 表示优质品率，x 表示20件产品中的优质品件数，则，待检验的假设为20,xbp01:0.4:0.4HpvsHp拒绝域为1Wxc或2xc由于下求c1与c2:30.01600.02540.0510,P

23、xP x故取 c1=3，又因为110.05650.025120.0210,P xP x从而c2=12，拒绝域为附带指出，该拒绝域的显著性水平实际上不是0.05，而是0.0160+0.021=0.0370。由于观测值没有落入拒绝域，故接受原假设。3Wx或12x 7.3.3 大样本检验在二点分布参数 p 的检验问题中，临界值的确定比较繁琐，使用不太方便。如果样本量较大，我们可用近似的检验方法大样本检验。大样本检验一般思路如下：设1,nxx是来自某总体的样本，又设该总体均值为，方差为的函数，记为，譬如，对二点分布b(1,)，其方差(1-)是均值的函数，则在样本容量n 充分大时，2()2(,(

24、)/)xNn 故可采用如下检验:020()(0,1)()n xuN由此近似地确定拒绝域。统计量例7.3.3 某厂产品的不合格品率为 10%，在一次例行检查中，随机抽取80件，发现有 11件不合格品，在下能否认为不合格品率仍为10%？解：这是关于不合格品率的检验，假设为:01:0.1:0.1HvsH若取，则u0.975=1.96,故拒绝域为故不能拒绝原假设。|1.96,Wu因为n=80 比较大，可采用大样本检验方法。检验统计量为1180(0.1)801.1180.1 0.9u例 7.3.4 某建筑公司宣称其麾下建筑工地平均每天发生事故数不超过 0.6 起，现记录了该公司麾下建筑工地

25、200天的安全生产情况，事故数记录如下：天数102 59 30 8 010 200一天发生的事故数01 2 3 45合计6试检验该建筑公司的宣称是否成立(取)。解：以X 记建筑工地一天发生的事故数，可认为，要检验的假设是：()XP01:0.6:0.6HvsH由于n=200很大，可以采用大样本检验，泊松分布的均值和方差都是，这里，检验统计量为0.74x()200(0.740.6)2.5560.6n xu若取，则 u0.95=1.645，拒绝域为1.645Wu如今 u=2.556 已落入拒绝域，故拒绝原假设，认为该建筑公司的宣称明显不成立。大样本检验是近似的:近似的含义是指检验的实际显著性

26、水平与原先设定的显著性水平有差距，这是由于诸如(7.3.12)中 u 的分布与N(0,1)有距离。如果n 很大，则这种差异就很小。实用中我们一般并不清楚对一定的n,u 的分布与N(0,1)的差异有多大，因而也就不能确定检验的实际水平与设定水平究竟差多少。在区间估计中也有类似问题。因此，大样本方法是一个“不得已而为之”的方法。只要有基于精确分布的方法一般总是首先要加以考虑的。7.4 分布拟合检验7.4.1 总体分布只取有限个值的情况设总体X 可以分成k 类，记为，现对该总体作了n 次观测，k 个类出现的频数分别为:1,kAA1.kiinn检验如下假设:n1,nk,且0:(),1,

27、2,.iiHP Apik其中诸0ip 且11.kiip一、诸 pi 均已知如果H0 成立，则对每一类Ai，其频率ni/n与概率pi 应较接近。即观测频数ni 与理论频数npi 应相差不大。据此，英国统计学家K.Pearson提出如下检验统计量:221kiiiinnpnp(7.4.2)并证明在H0 成立时对充分大的n,(7.4.2)给出的检验统计量近似服从自由度为k-1的分布。2拒绝域为:2211Wk例7.4.1 为募集社会福利基金，某地方政府发行福利彩票，中彩者用摇大转盘的方法确定最后中奖金额。大转盘均分为20份，其中金额为5万、10万、20万、30万、50万、100万的分别占2份、

28、4份、6份、4份、2份、2份。假定大转盘是均匀的，则每一点朝下是等可能的，于是摇出各个奖项的概率如下：概率0.10.20.30.20.10.1额度5万10万20万 30万 50万 100万现20人参加摇奖，摇得5万、10万、20万、30万、50万和100万的人数分别为2、6、6、3、3、0，由于没有一个人摇到100万，于是有人怀疑大转盘是不均匀的，那么该怀疑是否成立呢？这就需要对转盘的均匀性作检验。解：这是一个典型的分布拟合优度检验，总体共有6类，其发生概率分别为0.1、0.2、0.3、0.2、0.1和0.1，这里k=6，检验拒绝域为:2215,由本例数据可以算出若取=0.05，则查附表3

29、知22222222264663432023.75246422=20.95511.07.由于未落入拒绝域，故接受原假设，23.75没有理由认为转盘不均匀。在分布拟合检验中使用p 值也是方便的。本例中，以T 记服从 (5)的随机变量，则使用统计软件可以算出 23.750.5859.pP T这个p 值就反映了数据与假设的分布拟合程度的高低，p 值越大，拟合越好。二、诸 pi 不完全已知若诸由r(rk)个未知参数确定，即,1,ip ik1,.,r1(,),1,iirppik.首先给出的极大似然估计然后给出诸的极大似然估计 Fisher证明了 1,r1,r,1,ip ik1(,).iirpp

30、221kiiiinnpnp在H0成立时近似服从自由度为k-r-1的分布，于是检验拒绝域为22211kr 例7.4.2 卢瑟福在2608个等时间间隔内观测一枚放射性物质放射的粒子数X，表7.4.1是观测结果的汇总，其中ni表示2608次观测中放射粒子数为i的次数。ni 57 203 383 525 532 408 273 139 45 27 10 6i 0 1 2 3 4 5 6 7 8 9 10 11试利用该组数据检验该放射物质在单位时间内放射出的粒子数是否服从泊松分布。解：本例中，要检验总体是否服从泊松分布。观测到 0,1,11 共 12 个不同取值，这相当于把总体分成12类。这里有

31、一个未知参数，采用极大似然估计，11 2032 383.11 63.8702608=将代入可以估计出诸。于是可计算出ip2列表如下。012345678910115720338352553240827313945271060.02090.08070.15620.20150.19500.15090.09730.05380.02600.01120.00430.002254.5210.5407.4525.5508.6393.5253.8140.367.829.211.25.70.11470.26721.46140.00051.07660.53431.45250.01207.66730.16580.

32、12580.0158合计26081.00002068 =12.89672iniipinp2/iiinnpnp本例中 =12.896718.307，故接受原假设。使用统计软件可以计算出此处检验的p 值是0.2295。若取=0.05，则211kr 20.951018.307.2列联表是将观测数据按两个或更多属性(定性变量)分类时所列出的频数表。例如，对随机抽取的1000人按性别（男或女）及色觉(正常或色盲)两个属性分类,得到如下二维列联表，又称22表或四格表。7.4.2 列联表的独立性检验男53565女38218性别视觉正常色盲一般,若总体中的个体可按两个属性A与B分类，A 有r 个类，B 有c

33、个类从总体中抽取大小为n的样本，设其中有个个体既属于类又属于类，称为频数，将rc个排列为一个r行c列的二维列联表，简称rc表(表7.4.3)。1,rAA1,cBBijniAjBijnijn表7.4.3 rc列联表1111111111jciijicirrjrcrjcA Bjcnnnninnnnrnnnnnnnn和和列联表分析的基本问题是:考察各属性之间有无关联，即判别两属性是否独立。如在前例中，问题是：一个人是否色盲与其性别是否有关？在rc表中，若以和分别表示总体中的个体仅属于，仅属于和同时属于与的概率,可得一个二维离散分布表（表7.4.4），则“A、B两属性独立”的假设可以

34、表述为,ijppijpiAjBiAjB0:,1,1,ijijHpp pirjc表7.4.4 二维离散分布表11111111111jciijicirrjrcrjcA Bjcppppipppprppppppp行和列和这就变为上一小节中诸不完全已知时的分布拟合检验。这里诸共有rc个参数，在原假设H0成立时，这rc个参数由r+c个参数和决定。在这r+c后个参数中存在两个约束条件：ijpijpijp1,rpp1,cppijp所以，此时实际上由r+c-2个独立参数所确定。据此，检验统计量为 111,1rcijijpp2211()rcijijijijnnpnp在H0成立时，上式服从自由度为rc-

35、(r+c-2)-1的分布。其中诸是在H0成立下得到的的极大似然估计，其表达式为 2ijpijpjiijijnnpp pnn 对给定的显著性水平，检验的拒绝域为:221(1)(1).Wrc例7.4.3 为研究儿童智力发展与营养的关系，某研究机构调查了1436名儿童，得到如表7.4.5的数据，试在显著性水平0.05下判断智力发展与营养有无关系。表7.4.5 儿童智力与营养的调查数据营养良好营养不良合计智商合计342367266329130456402013216423382286345143680 8090 9099 100解：用A表示营养状况，它有两个水平：表示营养良好，表示营

36、养不良；B表示儿童智商,它有四个水平，分别表示表中四种情况。沿用前面的记号，首先建立假设 H0：营养状况与智商无关联，即A与B独立的。统计表示如下：1A2A1234,B B B B0.:,1,2,1,2,3,4.ijijHpp pij在原假设H0成立下，我们可以计算诸参数的极大似然估计值:121304/14360.9081,132/14360.0919,pp1234423/14360.2946,382/14360.2660,286/14360.1992,345/14360.2403,pppp 进而可给出诸，如 ijijnpnp p111436 0.9081 0.2496384.1677np

37、其它结果见表7.4.6 表7.4.6 诸的计算结果 ijnp.ip营养良好 384.1677 346.8724 259.7631 313.3588 0.90810.29460.26600.19920.2403营养不良 38.877935.103626.288131.71200.0919.jp7.815，故拒绝原假设，认为营养状况对智商有影响。本例中检验的p 值为0.0002。20.95(3)7.8157.4.3 正态性检验正态分布是最常用的分布，用来判断总体分布是否为正态分布的检验方法称为正态性检验，它在实际问题中大量使用。一、正态概率纸正态概率纸可用来作正态性检验，方法如下：利用样本数据在

38、概率纸上描点，用目测方法看这些点是否在一条直线附近，若是的话，可以认为该数据来自正态总体，若明显不在一条直线附近，则认为该数据来自非正态总体。例7.4.4 随机选取10个零件，测得其直径与标准尺寸的偏差如下：（单位：丝）9.4 8.8 9.6 10.2 10.1 7.2 11.1 8.2 8.6 9.6 在正态概率纸上作图步骤如下：(1)首先将数据排序：7.2 8.2 8.6 8.8 9.4 9.6 9.8 10.1 10.2 11.1;(2)对每一个i，计算修正频率 (i-0.375)/(n+0.25),i=1,2,n,(3)将点逐一点在正态概率纸上,(4)观察上述n个点的分布:()(,

39、(0.375)/(0.25),1,2,ixinin 若诸点在一条直线附近,则认为该批数据来自正态总体；若诸点明显不在一条直线附近，则认为该批数据的总体不是正态分布。从图7.4.2可以看到，10个点基本在一条直线附近，故可认为直径与标准尺寸的偏差服从正态分布。如果从正态概率纸上确认总体是非正态分布时，可对原始数据进行变换后再在正态概率纸上描点，若变换后的点在正态概率纸上近似在一条直线附近，则可以认为变换后的数据来自正态分布，这样的变换称为正态性变换。常用的正态性变换有如下三个：对数变换、倒数变换和根号变换。lnyx1/yxyx图7.4.3 给出这10个点在正态概率纸上的图形，这10个点

40、明显不在一条直线附近，所以可以认为该电子元件的寿命的分布不是正态分布。例7.4.5 随机抽取某种电子元件10个,测得其寿命数据如下:110.47,99.16,97.04,77.60,4269.82,539.35,179.49,782.93,561.10,286.80.图7.4.3 例7.4.5 的正态概率纸对该10个寿命数据作对数变换,结果见表7.4.8 表7.4.8 对数变换后的数据 1 32.623.4849 0.061 6286.80 5.6588 0.5492 97.04 4.5752 0.159 7539.35 6.2904 0.6463 99.16 4.5967 0.256 85

41、61.10 6.3299 0.7434 110.47 4.7048 0.354 9 782.936.6630 0.8415 179.49 5.1901 0.451 10 2269.82 7.7275 0.939ii()ix()ix()lnix()lnix0.3750.25in0.3750.25in利用表7.4.8 中最后两列上的数据在正态概率纸上描点，结果见图7.4.4，从图上可以看到10个点近似在一条直线附近，说明对数变换后的数据可以看成来自正态分布。这也意味着，原始数据服从对数正态分布图7.4.4 变换后数据的正态概率纸二、夏皮洛威尔克(Shapiro-Wilk)检验夏皮洛威尔克检验也简

42、称W 检验。这个检验当8n50时可以利用。过小样本(n8)对偏离正态分布的检验不太有效。W 检验是建立在次序统计量的基础上。检验统计量为:2()122()11()()()()niiinniiiiaaxxWaaxx(7.4.5)其中系数ai 可查附表6。拒绝域为:WW。其中分位数可查附表7.W系数还具有如下几条性质：1121(1),1,2,/2.(2)0.(3)1.ininiiniiaainaa 1,naa2/2(1)()12()1()()niniiiniia xxWxx 据此可将(7.4.5)简化为例7.4.6 某气象站收集了44个独立的年降雨量数据，资料如下（已排序）：520 556

43、561 616 635 669 686 692 704 707 711713 714 719 727 735 740 744 745 750 776 777786 786 791 794 821 822 826 834 837 851 862873 879 889 900 904 922 926 952 963 10561074我们要根据这批数据作正态性检验。首先由这批数据可算得:442()1785.114,()630872.43.iixxx我们将计算W 的过程列于表7.4.9中。为便于计算，值，和安排在同一行。()kx(1)nkx(1)()knkkdxx 表7.4.9 某一气象站收集的年

44、降雨量 152010745540.3872255610565000.266735619634020.232346169523360.207256359262910.186866699222530.169576869042180.1542k()kx(1)nkx kdkak()kx(1)nkx kdka86929002080.140597048891850.1278107078791720.1160117118731620.1049127138621490.0943137148511370.0842147198371180.0745157278341070.0651k()kx(1)nkx kdka16735826910.056017740822820.047118744821770.038319745794490.029620750791410.021121776786100.01262277778690.0042从表7.4.9可以计算出W 的值：2(0.38725540.26675000.00429)0.982630872.43W由于计算得到的W 值大于该值，所以在显著性水平=0.05上不拒绝零假设，即可以认为该批数据服从正态分布。0.050.944W若取 =0.05，查附表7，在n=44时给出:

展开阅读全文