1、7.1 假设检验的基本思想与概念7.2 正态总体参数假设检验7.3 其它分布参数的假设检验7.4 似然比检验与分布拟合检验7.1 假设检验的基本思想与概念 7.1.1 假设检验问题 例7.1.1 某厂生产的合金强度服从 ,其中 的设计值 为不低于110(Pa)。为保证质量,该 厂每天都要对生产情况做例行检查,以判断生 产是否正常进行,即该合金的平均强度不低于 110(Pa)。某天从生产中随机抽取25块合金,测得强度值为x1,x2,x25,其均值为 (Pa),问当日生产是否正常?(,16)N108x(1)是参数估计问题吗?(2)回答“是”还是“否”,假设检验问题。(3)命题“合金平均强度不低于1
2、10Pa”正确与否仅涉及如下两个参数集合:0:110 1:110 这两个非空参数集合都称作统计假设,简称假设。(4)我们的任务是利用样本去判断假设(命题)“”是否成立。这里的“判断”在统计学中称为检验或检验法则。07.1.2 假设检验的基本步骤 一、一、建立假设 在假设检验中,常把一个被检验的假设称为原假设,用 表示,通常将不应轻易加以否定的假设作为原假设。当 被拒绝时而接收的假设称为备择假设,用 表示,它们常常成对出现。0H0H1H在例7.1.1中,我们可建立如下两个假设:0:110Hvs1:110H二、选择检验统计量,给出拒绝域形式假设检验的任务是确认H0是否为真,具体做法就是先假定H0成
3、立,然后用样本去判断其真伪,由样本对原假设进行判断总是通过一个统计量完成的,该统计量称为检验统计量。使原假设被拒绝的样本观测值所在区域称为拒绝域,一般用W 表示,在例7.1.1中,样本均值 愈大,意味着总体均值 也大,因此,合理的拒绝域形如x1(,):nWxxxcxc正如在数学上我们不能用一个例子去证明一个结论一样,用一个样本(例子)不能证明一个命题(假设)是成立的,但可以用一个例子(样本)推翻一个命题。因此,从逻辑上看,注重拒绝域是适当的。事实上,在“拒绝原假设”和“拒绝备择假设(从而接收原假设)”之间还有一个模糊域,如今我们把它并入接收域,所以接收域是复杂的,将之称为保留域也许更恰当,但习
4、惯上已把它称为接收域,没有必要再进行改变,只是应注意它的含义。观测数据情况总体情况犯第一类错误正确正确犯第二类错误为真0H 为真1H1(,)nxxW1(,)cnxxW三、选择显著性水平检验可能犯以下两类错误:其一是 为真但样本观测值落在拒绝域中,从而拒绝原假设 ,这种错误称为第一类错 误,其发生的概率称为犯第一类错误的概率,或称拒真概率,通常记为 其二是 不真(即 为真)但样本观测值落 在接受域中,从而接受原假设 ,这种错误称 为第二类错误,其发生的概率称为犯第二类错 误的概率,或称取伪概率,通常记为 。0H0H.0H1H0H犯第一类错误的概率 和犯第二类错误的概率 可以用同一个函数表示,即所
5、谓的势函数。势函数是假设检验中最重要的概念之一,定义如下:定义7.1.1 设检验问题0011:HvsH的拒绝域为W,则样本观测值落在拒绝域内的概率称为该检验的势函数,记为 01()(),gPWx (7.1.3)这个势函数是 的减函数 势函数 是定义在参数空间 上的一个函数。犯两类错误的概率都是参数 的函数,并可由势函数算得,即:()g01(),()1(),g 对例7.1.1,其拒绝域为 ,由(7.1.3)可以算出该检验的势函数()()4/54/54/5xccgP xcP Wx c由此可得如下结论:利用这个势函数容易写出犯两类错误的概率分别为()4/5,c 0和()1,4/5c 1,当 减小时,
6、c 也随之减小,必导致的增大;当 减小时,c 会增大,必导致 的增大;说明:在样本量一定的条件下不可能找到一个使 和 都小的检验。英国统计学家 Neyman 和 Pearson 提出水平为 的显著性检验的概念。(),g则称该检验是显著性水平为 的显著性检验,简称水平为 的检验。定义7.1.2 对检验问题00:H对11:H如果一个检验满足对任意的 ,0都有 四、给出拒绝域确定显著性水平后,可以定出检验的拒绝域W。在例7.1.1中,若取=0.05,由于g()关于 单调减,只需要5(110)(110)0.054cg 成立即可。这给出c 的值为0.051100.81100.8 1.645cu=108.
7、684检验的拒绝域为108.684Wx若令1104/5xu则拒绝域有另一种表示:0.051.645Wuuu 以后主要用检验统计量U表示拒绝域五、作出判断 在有了明确的拒绝域后,根据样本观测值我们可以做出判断:当 或 时,则拒绝 即接收 ;当 或 时,则接收 108.684x 1.645u 0H1H108.684x 1.645u 在例7.1.1中,由于108108.684x 因此拒绝原假设,即认为该日生产不正常。0H7.1.3 检验的 p 值假设检验的结论通常是简单的:在给定的显著水平下,不是拒绝原假设就是保留原假设。然而有时也会出现这样的情况:在一个较大的显著水平(下得到拒绝原假设的结论,而在
8、一个较小的显著水平()下却会得到相反的结论。这种情况在理论上很容易解释:因为显著水平变小后会导致检验的拒绝域变小,于是原来落在拒绝域中的观测值就可能落入接受域。但这种情况在应用中会带来一些麻烦:假如这时一个人主张选择显著水平,而另一个人主张选,则第一个人的结论是拒绝H0,而后一个人的结论是接受H0,我们该如何处理这一问题呢?例7.1.5 一支香烟中的尼古丁含量X 服从正态 分布N(,1),质量标准 规定不能超过1.5毫 克。现从某厂生产的香烟中随机抽取20支测 得其中平均每支香烟的尼古丁含量为 毫克,试问该厂生产的香烟尼古丁含量是否 符合质量标准的规定。1.97x 这是一个假设检验问题:H0:
9、1.5,H1:1.5,采用u检验,计算得:01.97 1.52.10/1/20 xun对一些的显著性水平,表7.3.1列出了相应的拒绝域和检验结论。表7.1.1 例7.1.5中的拒绝域显著性水平拒绝域u=2.10对应的结论=0.05u1.645拒绝H0=0.025u1.96拒绝H0=0.01u2.33接受H0=0.005u2.58接受H0我们看到,不同的有不同的结论。现在换一个角度来看,在=1.5时,u的分布是N(0,1)。此时可算得,P(u2.10)=0.0179,若以0.0179为基准来看上述检验问题,可得 当2.10。于是2.10就不在 中,此时应接受原假设H0;当0.0179时,2.1
10、0。于是2.10就落在 中,此时应拒绝H0。1u1uu1uu由此可以看出,0.0179是能用观测值2.10做出“拒绝H0”的最小的显著性水平,这就是p值。1u定义7.1.3 在一个假设检验问题中,利用观测 值能够做出拒绝原假设的最小显著性水平称 为检验的p 值。引进检验的p 值的概念有明显的好处:第一,它比较客观,避免了事先确定 显著水平;其次,由检验的p 值与人们心目中的显 著性水平进行比较可以很容易 作出检验的结论:如果 p,则在显著性水平下拒绝 H0;如果 p,则在显著性水平下保留 H0.p 值在应用中很方便,如今的统计软件中对检验问题一般都会给出检验的p 值。例7.1.6 设 是来自b
11、(1,)的样本,要检验如下假设:0010:HvsH1,nxx若取显著性水平为,则在得到观测值后,我们只需要计算概率:0ixt00ipPxt这就是检验的p 值。譬如 0040,0.1,8nt4039733404010.90.10.90.10.90.0419.17p 若取=0.05,由于p 2.776,故拒绝原假设,认为该厂生产的铝材的长度不满足设定要求。若取=0.05,则 t0.975(4)=2.776.239.5,0.4,xs故0/xun11/2|uuuuuu检验法条件检验统计量拒绝域u 检验已知t 检验未知原假设0H备择假设1H00000011/2|uuuuuu0/xun0/xtsn11/2
12、(1)(1)|(1)t tnt t nt tn000000表7.2.1 单个正态总体的均值的检验问题三、假设检验与置信区间的关系 这里用的检验统计量与6.5.5节中置信区间所用的枢轴量是相似的。这不是偶然的,两者之间存在非常密切的关系。设 是来自正态总体 的样本,现在 未知场合讨论关于均值 的检验问题。考虑双侧检验问题:1,nxx2(,)N 0010:HvsH它可以改写为1/201/2(1)(1)ssWxtnxtnnn并且有0()1,PW若让0 在(-)内取值,就可得到 的1-信区间:这里0并无限制.1/2(1)sxtnn01/2|(1)sWxtnn则水平为的检验接收域为 00:H关于 的水平
13、为的显著性检验。00:H是一一对应的。类似地,“参数 的1-置信上限”与“关于00:H 的单侧检验问题的水平的检验”反之若有一个如上的1-置信区间,也可获得所以:“正态均值 的1-置信区间”与“关于 的双侧检验问题的水平的检验”参数 的1-置信下限与另一个单侧检验也是一一对应的。是一一对应的。7.2.2 两个正态总体均值差的检验检验法条件原假设备择假设检验统计量拒绝域u检验已知t 检验未知0H1H12,12,1212121212122212xyumn11/2|uuuuuu11wxytsmn11/2(2)(2)|(2)t tm nt t m nt tm n 12121212121212大样本检u
14、 验 未知m,n充分大近似t 检验未知m,n不很大12,12,22yxxyussmn11/2|uuuuuu22yxxytssmn11/2(1)(1)|(1)ttlttlttl121212121212121212121212444022/,11yxsslsmmnn2220/xyssmsn例7.2.3 某厂铸造车间为提高铸件的耐磨性而 试制了一种镍合金铸件以取代铜合金铸件,为此,从两种铸件中各抽取一个容量分别为 8和9的样本,测得其硬度为 镍合金:76.43 76.21 73.58 69.69 65.29 70.83 82.75 72.34铜合金:73.66 64.27 69.34 71.37 6
15、9.77 68.12 67.27 68.07 62.61 根据经验,硬度服从正态分布,且方差保持不变。试在显著性水平下判断镍合金的硬度是否有明显提高。解:用X 表示镍合金的硬度,Y 表示铜合金的硬 度,则由假定,21(,),XN 22(,).YN 要检验的假设是:012112:HvsH经计算,89221173.39,68.2756,()205.7958,()91.1552iiiixyxxyy从而1(205.795891.1552)4.4494892ws 73.3968.27562.2210114.449478t查表知0.95(15)1.7531,t由于0.95(15)tt故拒绝原假设,可判断镍
16、合金硬度有显著提高。7.2.3 正态总体方差的检验一、单个正态总体方差的检验 设 是来自 的样本,对方差亦可考虑如下三个检验问题:1,nxx2(,)N 22220010:HvsH22220010:HvsH22220010:HvsH通常假定 未知,它们采用的检验统计量是相同的,均为 若取显著性水平为,则对应三个检验问题的拒绝域依次分别为22201,ns2211;Wn221;Wn222221211Wnn或例7.2.4 某类钢板每块的重量X 服从正态分布,其一项质量指标是钢板重量的方差不得超过 0.016(kg2)。现从某天生产的钢板中随机抽取 25块,得其样本方差S2=0.025(kg2),问该天
17、生 产的钢板重量的方差是否满足要求。解:原假设为20:0.016,H备择假设为21:0.016,H此处n=25,若取=0.05,则查表知20.952436.4152220124 0.02537.536.4150.016ns由此,在显著性水平0.05下,我们拒绝原假设,认为该天生产的钢板重量不符合要求。现计算可得二、两个正态总体方差比的F 检验 设 是来自 的样本,是来自 的样本。考虑如下三个假设检验问题 1,mxx211(,)N 1,nyy222(,)N 2222012112:HvsH2222012112:HvsH2222012112:HvsH通常 ,均未知,记 ,分别是由算得的 的无偏估计和
18、由 算得的 的无偏估计.122xs2ys1,nyy1,mxx2122可建立检验统计量:22xysFs三种检验问题对应的拒绝域依次为11,1 WFFmn1,1WFFmn21,1WFFmn121,1FFmn。或例7.2.5 甲、乙两台机床加工某种零件,零件 的直径服从正态分布,总体方差反映了加工 精度,为比较两台机床的加工精度有无差别,现从各自加工的零件中分别抽取7件产品和8 件产品,测得其直径为 X (机床甲)16.2 16.4 15.8 15.5 16.7 15.6 15.8Y (机床乙)15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0这就形成了一个双侧假设检验问
19、题,原假设是 备择假设为 此处 m=7,n=8,经计算22012:,H22112:H20.2729,xs 0.27291.2610.2164F 查表知0.9756,75.12F于是 ,若取 =0.05,20.2164,ys 0.0250.975110.1757,65.70FF其拒绝域为0.175 5.12WFF或 由此可见,样本未落入拒绝域,即在0.05水平下可以认为两台机床的加工精度一致。7.3 其他分布参数的假设检验7.3.1 指数分布参数的假设检验 设 x1,x2,xn 是来自指数分布的样本,关于 的如下检验问题:0010:HvsH(7.3.1)拒绝域的形式是 ,由于在=0时,Wxc22
20、02(2)nxn所以拒绝域为 2212Wn0010:HvsH0010:HvsH222Wn拒绝域为:拒绝域为:222221-222Wnn或例7.3.1 设我们要检验某种元件的平均寿命不小 于6000小时,假定元件寿命为指数分布,现取 5个元件投入试验,观测到如下5个失效时间:395,4094,119,11572,6133。解:由于待检验的假设为 01:6000:6000HvsH若取=0.05,则检验拒绝域为:220.05103.94,W201010 4462.67.43776000 x故接受原假设,可以认为在0.05的显著性水平下平均寿命不低于6000小时.经计算得7.3.2 比例的检验比例 p
21、 可看作某事件发生的概率。作 n 次独立试验,以 x 记该事件发生的次数,则 。我们可以根据 x 检验关于 p 的一些假设:,xb n p(1)直观上看拒绝域为:,由于x 只 取整数值,故c 可限制在非负整数中。0010:,HppvsHppWxc00;1,nn iioi cnP xc pppi 这是在对离散总体作假设检验中普遍会遇到的问题.一般情况下,对给定的,不一定能正好取到一个正整数c 使下式成立:一般较常见的是找一个c0,使得 则取 c=c0+10000111nnn in iiiooi ci cnnppppii (2)0010:HppvsHpp检验的拒绝域为:,Wxcc 为满足001cn
22、 iioinppi 的最大正整数。(3)0010:HppvsHpp检验的拒绝域为:1Wxc2xc或其中c1为满足下式的最大正整数:10012cn iioinppi c2为满足下式的最小正整数:12012nn iioi cnppi例7.3.2 某厂生产的产品优质品率一直保持在 40%,近期对该厂生产的该类产品抽检 20 件,其中优质品7件,在 下能否认为 优质品率仍保持在40%?0.05解:以p 表示优质品率,x 表示20件产品中的优质 品件数,则 ,待检验的假设为20,xbp01:0.4:0.4HpvsHp拒绝域为1Wxc或2xc由于下求c1与c2:30.01600.02540.0510,P
23、xP x故取 c1=3,又因为110.05650.025120.0210,P xP x从而c2=12,拒绝域为附带指出,该拒绝域的显著性水平实际上不是0.05,而是0.0160+0.021=0.0370。由于观测值没有落入拒绝域,故接受原假设。3Wx或12x 7.3.3 大样本检验 在二点分布参数 p 的检验问题中,临界值的确定比较繁琐,使用不太方便。如果样本量较大,我们可用近似的检验方法大样本检验。大样本检验一般思路如下:设1,nxx是来自某总体的样本,又设该总体均值为,方差为 的函数,记为 ,譬如,对二点分布b(1,),其方差(1-)是均值 的函数,则在样本容量n 充分大时,2()2(,(
24、)/)xNn 故可采用如下检验:020()(0,1)()n xuN由此近似地确定拒绝域。统计量 例7.3.3 某厂产品的不合格品率为 10%,在 一次例行检查中,随机抽取80件,发现有 11件不合格品,在下能否认为不合 格品率仍为10%?解:这是关于不合格品率的检验,假设为:01:0.1:0.1HvsH若取,则u0.975=1.96,故拒绝域为 故不能拒绝原假设。|1.96,Wu因为n=80 比较大,可采用大样本检验方法。检验统计量为1180(0.1)801.1180.1 0.9u例 7.3.4 某建筑公司宣称其麾下建筑工地平均每 天发生事故数不超过 0.6 起,现记录了该公司 麾下建筑工地
25、200天的安全生产情况,事故数 记录如下:天数102 59 30 8 010 200一天发生的事故数01 2 3 45合计6试检验该建筑公司的宣称是否成立(取)。解:以X 记建筑工地一天发生的事故数,可认 为 ,要检验的假设是:()XP01:0.6:0.6HvsH由于n=200很大,可以采用大样本检验,泊松分布的均值和方差都是,这里 ,检验统计量为0.74x()200(0.740.6)2.5560.6n xu若取,则 u0.95=1.645,拒绝域为1.645Wu如今 u=2.556 已落入拒绝域,故拒绝原假设,认为该建筑公司的宣称明显不成立。大样本检验是近似的:近似的含义是指检验的实际显著性
26、水平与原先设 定的显著性水平有差距,这是由于诸如(7.3.12)中 u 的分布与N(0,1)有距离。如果n 很大,则这种差 异就很小。实用中我们一般并不清楚对一定的n,u 的分布与N(0,1)的差异有多大,因而也就不能 确定检验的实际水平与设定水平究竟差多少。在 区间估计中也有类似问题。因此,大样本方法是 一个“不得已而为之”的方法。只要有基于精确 分布的方法一般总是首先要加以考虑的。7.4 分布拟合检验7.4.1 总体分布只取有限个值的情况 设总体X 可以分成k 类,记为 ,现对该总体作了n 次观测,k 个类出现的频数分别为:1,kAA1.kiinn检验如下假设:n1,nk,且0:(),1,
27、2,.iiHP Apik其中诸0ip 且11.kiip一、诸 pi 均已知如果H0 成立,则对每一类Ai,其频率ni/n与概率pi 应较接近。即观测频数ni 与理论频数npi 应相差不大。据此,英国统计学家K.Pearson提出如下检验统计量:221kiiiinnpnp(7.4.2)并证明在H0 成立时对充分大的n,(7.4.2)给出的检验统计量近似服从自由度为k-1的 分布。2拒绝域为:2211Wk例7.4.1 为募集社会福利基金,某地方政府发 行福利彩票,中彩者用摇大转盘的方法确定 最后中奖金额。大转盘均分为20份,其中金 额为5万、10万、20万、30万、50万、100万 的分别占2份、
28、4份、6份、4份、2份、2份。假定大转盘是均匀的,则每一点朝下是等可 能的,于是摇出各个奖项的概率如下:概率0.10.20.30.20.10.1额度5万10万20万 30万 50万 100万现20人参加摇奖,摇得5万、10万、20万、30万、50万和100万的人数分别为2、6、6、3、3、0,由于没有一个人摇到100万,于是有人怀疑大转盘是不均匀的,那么该怀疑是否成立呢?这就需要对转盘的均匀性作检验。解:这是一个典型的分布拟合优度检验,总体 共有6类,其发生概率分别为0.1、0.2、0.3、0.2、0.1和0.1,这里k=6,检验拒绝域为:2215,由本例数据可以算出若取=0.05,则查附表3
29、知22222222264663432023.75246422=20.95511.07.由于 未落入拒绝域,故接受原假设,23.75没有理由认为转盘不均匀。在分布拟合检验中使用p 值也是方便的。本例中,以T 记服从 (5)的随机变量,则使用统计软件可以算出 23.750.5859.pP T这个p 值就反映了数据与假设的分布拟合程度的高低,p 值越大,拟合越好。二、诸 pi 不完全已知 若诸 由r(rk)个未知参数 确定,即,1,ip ik1,.,r1(,),1,iirppik.首先给出 的极大似然估计然后给出诸 的极大似然估计 Fisher证明了 1,r1,r,1,ip ik1(,).iirpp
30、221kiiiinnpnp在H0成立时近似服从自由度为k-r-1的 分布,于是检验拒绝域为22211kr 例7.4.2 卢瑟福在2608个等时间间隔内观测一 枚放射性物质放射的粒子数X,表7.4.1是观测 结果的汇总,其中ni表示2608次观测中放射粒 子数为i的次数。ni 57 203 383 525 532 408 273 139 45 27 10 6i 0 1 2 3 4 5 6 7 8 9 10 11试利用该组数据检验该放射物质在单位时间内放射出的粒子数是否服从泊松分布。解:本例中,要检验总体是否服从泊松分布。观测到 0,1,11 共 12 个不同取值,这相当于把总体分成12类。这里有
31、一个未知参数,采用极大似然估计,11 2032 383.11 63.8702608=将 代入可以估计出诸 。于是可计算出ip2列表如下。012345678910115720338352553240827313945271060.02090.08070.15620.20150.19500.15090.09730.05380.02600.01120.00430.002254.5210.5407.4525.5508.6393.5253.8140.367.829.211.25.70.11470.26721.46140.00051.07660.53431.45250.01207.66730.16580.
32、12580.0158合计26081.00002068 =12.89672iniipinp2/iiinnpnp本例中 =12.896718.307,故接受原假设。使用统计软件可以计算出此处检验的p 值是0.2295。若取=0.05,则211kr 20.951018.307.2列联表是将观测数据按两个或更多属性(定性变量)分类时所列出的频数表。例如,对随机抽取的1000人按性别(男或女)及色觉(正常或色盲)两个属性分类,得到如下二维列联表,又称22表或四格表。7.4.2 列联表的独立性检验男53565女38218性别视觉正常色盲一般,若总体中的个体可按两个属性A与B分类,A 有r 个类 ,B 有c
33、个类从总体中抽取大小为n的样本,设其中有 个个体既属于 类又属于 类,称为频数,将rc个 排列为一个r行c列的二维列联表,简称rc表(表7.4.3)。1,rAA1,cBBijniAjBijnijn表7.4.3 rc列联表1111111111jciijicirrjrcrjcA Bjcnnnninnnnrnnnnnnnn和和列联表分析的基本问题是:考察各属性之间有无关联,即判别两属性是否独立。如在前例中,问题是:一个人是否色盲与其性别是否有关?在rc表中,若以 和 分别表示总体中的个体仅属于 ,仅属于 和同时属于 与 的概率,可得一个二维离散分布表(表7.4.4),则“A、B两属性独立”的假设可以
34、表述为,ijppijpiAjBiAjB0:,1,1,ijijHpp pirjc表7.4.4 二维离散分布表11111111111jciijicirrjrcrjcA Bjcppppipppprppppppp行和列和这就变为上一小节中诸 不完全已知时的分布拟合检验。这里诸 共有rc个参数,在原假设H0成立时,这rc个参数 由r+c个参数 和 决定。在这r+c后个参数中存在两个约束条件:ijpijpijp1,rpp1,cppijp所以,此时 实际上由r+c-2个独立参数所确定。据此,检验统计量为 111,1rcijijpp2211()rcijijijijnnpnp在H0成立时,上式服从自由度为rc-
35、(r+c-2)-1的 分布。其中诸 是在H0成立下得到的 的极大似然估计,其表达式为 2ijpijpjiijijnnpp pnn 对给定的显著性水平,检验的拒绝域为:221(1)(1).Wrc例7.4.3 为研究儿童智力发展与营养的关系,某 研究机构调查了1436名儿童,得到如表7.4.5的 数据,试在显著性水平0.05下判断智力发展与 营养有无关系。表7.4.5 儿童智力与营养的调查数据营养良好营养不良合计 智 商合计342367266329130456402013216423382286345143680 8090 9099 100解:用A表示营养状况,它有两个水平:表示 营养良好,表示营
36、养不良;B表示儿童智商,它有四个水平,分别表示表中四种 情况。沿用前面的记号,首先建立假设 H0:营养状况与智商无关联,即A与B独立的。统计表示如下:1A2A1234,B B B B0.:,1,2,1,2,3,4.ijijHpp pij在原假设H0成立下,我们可以计算诸参数的极大似然估计值:121304/14360.9081,132/14360.0919,pp1234423/14360.2946,382/14360.2660,286/14360.1992,345/14360.2403,pppp 进而可给出诸 ,如 ijijnpnp p111436 0.9081 0.2496384.1677np
37、其它结果见表7.4.6 表7.4.6 诸 的计算结果 ijnp.ip营养良好 384.1677 346.8724 259.7631 313.3588 0.90810.29460.26600.19920.2403营养不良 38.877935.103626.288131.71200.0919.jp7.815,故拒绝原假设,认为营养状况对智商有影响。本例中检验的p 值为0.0002。20.95(3)7.8157.4.3 正态性检验正态分布是最常用的分布,用来判断总体分布是否为正态分布的检验方法称为正态性检验,它在实际问题中大量使用。一、正态概率纸正态概率纸可用来作正态性检验,方法如下:利用样本数据在
38、概率纸上描点,用目测方法看这些点是否在一条直线附近,若是的话,可以认为该数据来自正态总体,若明显不在一条直线附近,则认为该数据来自非正态总体。例7.4.4 随机选取10个零件,测得其直径与标 准尺寸的偏差如下:(单位:丝)9.4 8.8 9.6 10.2 10.1 7.2 11.1 8.2 8.6 9.6 在正态概率纸上作图步骤如下:(1)首先将数据排序:7.2 8.2 8.6 8.8 9.4 9.6 9.8 10.1 10.2 11.1;(2)对每一个i,计算修正频率 (i-0.375)/(n+0.25),i=1,2,n,(3)将点 逐一点在正态概率纸上,(4)观察上述n个点的分布:()(,
39、(0.375)/(0.25),1,2,ixinin 若诸点在一条直线附近,则认为该批数 据来自正态总体;若诸点明显不在一条直线附近,则认为 该批数据的总体不是正态分布。从图7.4.2可以看到,10个点基本在一条直线附近,故可认为直径与标准尺寸的偏差服从正态分布。如果从正态概率纸上确认总体是非正态分布时,可对原始数据进行变换后再在正态概率纸上描点,若变换后的点在正态概率纸上近似在一条直线附近,则可以认为变换后的数据来自正态分布,这样的变换称为正态性变换。常用的正态性变换有如下三个:对数变换 、倒数变换 和根号变换 。lnyx1/yxyx图7.4.3 给出这10个点在正态概率纸上的图形,这10个点
40、明显不在一条直线附近,所以可以认为该电子元件的寿命的分布不是正态分布。例7.4.5 随机抽取某种电子元件10个,测得其寿 命数据如下:110.47,99.16,97.04,77.60,4269.82,539.35,179.49,782.93,561.10,286.80.图7.4.3 例7.4.5 的正态概率纸对该10个寿命数据作对数变换,结果见表7.4.8 表7.4.8 对数变换后的数据 1 32.623.4849 0.061 6286.80 5.6588 0.5492 97.04 4.5752 0.159 7539.35 6.2904 0.6463 99.16 4.5967 0.256 85
41、61.10 6.3299 0.7434 110.47 4.7048 0.354 9 782.936.6630 0.8415 179.49 5.1901 0.451 10 2269.82 7.7275 0.939ii()ix()ix()lnix()lnix0.3750.25in0.3750.25in利用表7.4.8 中最后两列上的数据在正态概率纸上描点,结果见图7.4.4,从图上可以看到10个点近似在一条直线附近,说明对数变换后的数据可以看成来自正态分布。这也意味着,原始数据服从对数正态分布图7.4.4 变换后数据的正态概率纸二、夏皮洛威尔克(Shapiro-Wilk)检验 夏皮洛威尔克检验也简
42、称W 检验。这个检验当8n50时可以利用。过小样本(n8)对偏离正态分布的检验不太有效。W 检验是建立在次序统计量的基础上。检验统计量为:2()122()11()()()()niiinniiiiaaxxWaaxx(7.4.5)其中系数ai 可查附表6。拒绝域为:WW。其中分位数 可查附表7.W系数 还具有如下几条性质:1121(1),1,2,/2.(2)0.(3)1.ininiiniiaainaa 1,naa2/2(1)()12()1()()niniiiniia xxWxx 据此可将(7.4.5)简化为例7.4.6 某气象站收集了44个独立的年降雨量数 据,资料如下(已排序):520 556
43、561 616 635 669 686 692 704 707 711713 714 719 727 735 740 744 745 750 776 777786 786 791 794 821 822 826 834 837 851 862873 879 889 900 904 922 926 952 963 10561074我们要根据这批数据作正态性检验。首先由这批数据可算得:442()1785.114,()630872.43.iixxx我们将计算W 的过程列于表7.4.9中。为便于计算,值 ,和 安排在同一行。()kx(1)nkx(1)()knkkdxx 表7.4.9 某一气象站收集的年
44、降雨量 152010745540.3872255610565000.266735619634020.232346169523360.207256359262910.186866699222530.169576869042180.1542k()kx(1)nkx kdkak()kx(1)nkx kdka86929002080.140597048891850.1278107078791720.1160117118731620.1049127138621490.0943137148511370.0842147198371180.0745157278341070.0651k()kx(1)nkx kdka16735826910.056017740822820.047118744821770.038319745794490.029620750791410.021121776786100.01262277778690.0042从表7.4.9可以计算出W 的值:2(0.38725540.26675000.00429)0.982630872.43W由于计算得到的W 值大于该值,所以在显著性水平=0.05上不拒绝零假设,即可以认为该批数据服从正态分布。0.050.944W若取 =0.05,查附表7,在n=44时给出: