1、7 43.14159268000习题与解答 。 1. 有人对的小数点后位数字中数字,1,2, ,9出现的次数进行了统计,结果如下数字 0 1 2 3 4 5 6 7 8 9次数 74 92 83 79 80 73 77 75 76 91试在显著性水平为0.05下检验每个数字出现概率相同的假设。 解 这是一个分布拟合优度检验,总体共有1019:0.1.100.05pppki0221-20.950类。若记出现数字i的概率为p ,则要检验的假设为 H这里,检验拒绝域为(9)。若取,则查表可知(9)=16.9190.检验的统计量为222222(7480)(9280)(91 80)50125.80808
2、05.12550125由于未落入拒绝域,故不拒绝原假设。在显著性水平为0.05下可以认为每个数字出现概率相同的结论成立。此处检验的p值为p=P(9),可以用统计软件算出,譬如,可在Matlab中使用如下命令1-chi2cdf(50125,9),给出p=0.8233.2. 掷一颗筛子60次,结果如下: 点数 1 2 3 4 5 6 次数 7 8 12 11 9 13 试在显著性水平为0.05下检验这个筛子是否均匀。126222221:.660.052.81010102.8pppki01-0.95222 解 这是一个分布拟合优度检验,总体总共分6类。若即出现点数i的概率为p ,则要检验的假设为 H
3、这里的,检验拒绝域为(5),若取,则查表知,(5)=11.0705,检验的统计量为(7-10) (8-10)(13-10) 由于未落入拒绝域,故不拒绝原假20.052.8p设。在显著性水平为下可以认为这可筛子是均匀的。此处检验的值为p=P(5)=0.7308.3.6(0.05?!iii检查了一本书的100页,记录各业中的印刷错误的个数,其结果如下:错误个数 0 1 2 3 4 5 问 页数 35 40 19 3 2 1 0 能否认为一夜的印刷错误个数服从泊松分布 取) 解 这是一个要检验总体是否服从泊松分布的假设检验问题。本题中把总体分成7类,在原假设下,每类出现的概率为p66,0,1,5,.
4、!14021951100iieipei未知参数可采用最大似然方法进行估计,为(1)=1.22.) /00.871012iiiiippnpnpnpii将代入可以估计出诸于是可计算出检验统计量,如下表:i n (n 35 0.3679 36.79 40 0.3679 36.79 0.2801 19 0.1839 345618.39 0.0202 3 0.0613 6.13 1.5982 2 0.0153 1.53 0.1444 1 0.0031 0.31 1.5358 0 0.0006 0.06 2 0.06 合计 100 1.0000 100 =3.7258 0.0511.07053.72581
5、1.07053.7258221-0.95222 若取,查表知,(k-r-1)=(5)=11.0705,故拒绝域为W=. 由于,故不拒绝原假设,在显著性水平为0.05下可以认为一页的印刷错误个数服从泊松分布的。此处检验的p值为p=P(5)=0.5895. 4. 某建筑工地每天发生事故数现场记录如下:一天发生的事60.05故数0 1 2 3 4 5 合计 天数 102 59 30 8 0 1 0 200 试在显著性水平下检验这批数据是否服从泊松分布。 662,0,1,5,.!1592 303 85 1200iiiieipeiip i 解 本题仍为检验总体是否服从泊松分布的分布拟合检验问题。此处总体
6、取值杯分成7类,在原假设下,每类出现的概率为 p 未知参数 采用最大似然估计得 =(1)=0.74,将 代入可以估计出诸 。于是可计算出检验核计量,如下表: 2) /iiiipnpnpnpii i n (n 0 102 0.4771 95.42 0.4537 1 59 0.3531 70.61 1.9090 2 30 0.1306 26.13 0.5732 3 8 0.0322 6.44 0.3779 4 0 0.0060 1.20 1.2000 5 1 0.0009 0.18 3.7356 6 0 0.0001 0.02 0.0200 合计 200 1.0000 200 0.052221-0
7、.95 =8.2694 若取,则 (k-r-1)=(5)=11.0705。 8.269411.07058.269430022由于,故不拒绝原假设,在显著性水平为0.05下可以认为一页的印刷错误个数服从泊松分布的。此处检验的p值为p=P(5)=0.142. 5. 在一批灯泡中抽取300只作寿命试验,其结果如下:寿命(h) 3.8415,.P12.6482rcrc此处若取查表有由于故拒绝原假设不能认为色盲与性别无关此处验的 值为p=P(1)=0.0003759.7.,() : 为研究慢性气管炎与吸烟量的关系 调查了813人 各人健康情况 吸烟量 支合计 0 15 5 数统计如下 患病 126 24
8、5 49 420 健康 152 209 32 393合计 278 454 81 813 是否可以认为吸烟量对慢性22(0.05)?,:(),A;,;:,.:,1,2,1,2,3.ijijBABpp pij11300气管炎没有影响 取 解 用A表示健康情况 它有两个水平 A 表示患病 慢性气管炎表示健康 用B表示吸烟量情况 它有三个水平 分别以BB 表示 检验的假设问题为 H吸烟量与气管炎无关联 即 与 是独立的用统计语言表示如下 H12123,420/8130.5166,393/8130.4834,278/8130.3419,454/8130.5584,81/8130.0997.,:() ij
9、ijippppppnp pp0在原假设H 成立下 我们可以计算诸参数的最大似然估计为进而可给出诸n结果如下表健康情况 吸烟量 支 jp 0 15 5 患病 143.597 234.526 41.874 0.5166 健康 134.368 219.454 39.183 0.4834 0.3419 0.5584 0.0997 2222220.95,245234.5263239.183(126-143.597)143.597234.52639.1832,3,(1)(1)2,0.05,(2)=5.9915,7.96535.9915,.Prcrc因而检验的统计量为 =7.9653.此处若取查表有由于故在
10、显著性水平0.05下拒绝原假设 可以判断吸烟量对慢性气管炎有影响此处检验的 值为p2:=P(2) 7.9653)=0.0186. 8. 下表是1976年至1977年间在美国佛罗里达州29个地区发生的凶杀案中被告人被判死刑的情况2?,:,A;11 被害人肤色 判死刑 不判死刑 白人 30 184 黑人 6 106 是否可以被认为被害人肤色不同不会影响对被告的死刑判决 解 设A表示被害人的肤色情况 B表示判刑情况 它们各有两个水平 用 A 表示白人表示黑人 用B 表21212,;:,.:,1,2,1,2.,214/3260.6564, 112/3260.3436,36/3260.1104, iji
11、jBABpp pijpppp000示判死刑表示不判死刑 检验的假设为 H被害人肤色不同不会影响对被告的死刑判决 即 与是独立的 也计算相当于检验 H在原假设H 成立下 我们可以计算诸参数的最大似然估计为 290/3260.8896,进而有11122122223260.65640.110423.6241,3260.65640.8896190.3623, 3260.34360.110412.3663, 3260.34360.889699.6473.(30-23.6241),23.npnpnpnp 由以上结果 计算检验统计量为222220.956241(184-190.3623)(6-12.3663
12、)(106-99.6473)5.6159.190.362312.366399.64732,2,(1)(1)1,0.05,(1)=3.8415,5.61593.8415,.Prcrc此处若取查表有由于故在显著性水平0.05下拒绝原假设 认为被害人的肤色不会影响对被告的死刑判决 此处验的 值为p=P(25.6159(1)=0.0178.9.:( ),(2),(3),(4),.: 某调查机构连续三年对某城市的居民进行热点调查 对下列四个问题 1 收入物价住房交通 要求被调查者选择其中之一作为最关键的问题 调查结果如下问题收入物价住房交通和 1997年 155 232 87 50 5241998年 1
13、34 223(0.05). ,:,A;A;101 100 75 510 1999年 176 114 165 61 516合计 465 547 352 186 1550 是否可以认为各年该城市居民对热点问题的看法保持不变 取解 用A表示不同的年份 A 表示1997年表示1998年表示1999年 用B表示2,B134居民关心的问题 分别以BB ,B123;:.,.:,1,2,3,1,2,3.4.,524/15500.3381, 510/15503529, 516/15500.3329,ijijABpp pijppp000依次表示四个问题 检验的假设为 H各年该城市居民对热点问题的看法保持不变 即与
14、 是独立的用统计语言表示如下 H在原假设H 成立下我们可以计算诸参数的最大似然估计为 1234465/15500.3, 547/15500.3529, =352/1550=0.2271,/1,:ijijpppppnp p =186 550=0.12进而可给出诸n结果如下表 ip问题收入物价住房交通 1997年157.2165 184.9390 119.0129 62.8866 0.3381 1998年152.9850 179.9614 115.8096 61.1940 0.3290 1999年154.7985 182.0946 117.18222220,232184.939061(155-15
15、7.2165)157.2165184.93903,4,(1)(1)6,0.05,jprcrc25 61.9194 0.3329 0.3 0.3529 0.2271 0.12 1.0000 由此 检验的统计量为61.919461.9194 =81.2410.此处若取查表有.952(6)=12.5916,12.5916,由于81.2410故拒绝原假设 认为各年215.P1010.,:该城市居民对热点问题的看法并不是保持不变的此处检验的 值为p=P(6) 81.2410)=1.9984.某砖厂为考察其生产的砖的抗断强度是否服从正态分布现从一批砖中抽取30件测得其抗压强度如下77 70 80 81 7
16、3 87 87 79 81 81 78 84 76 93 7980 86 80 79 75 81 71 84 89 75 85 87 302( )1,.()995.8667,iix70 71 83.试对这批数据正态概率值做正态性检验然后进行W检验 解 我们这里先给出W检验由数据可算得x=80.0667,x为计算方便建立如下表格(k)(k)k xxxxkkkk(n-k+1)(n-k+1) d a k d a 1 70 93 23 0.4254 9 77 84 7 0.13062 70 89 19 0.2944 10 78 83 5 0.08623 71 87 16 0.2487 11 79 81
17、 2 0.06684 71 87 16 0.2148 12 79 81 2 0.05375 73 87 14 0.1870 13 79 81 2 0.03816 75 86 11 0.1630 14 80 81 1 0.02277 75 85 10 0.1415 15 80 80 0 0.00768 76 84 8 022:(0.4254230.2944 190.00760)31.2801995.8667995.8667WW.1219 从上表中可以计算出的值= =0.9825.3,0.927,0.927,0.05,.,.,nW0.95当时查表知W拒绝域为由于样本观测值没有落入拒绝域内故在显著性
18、水平上不拒绝原假设 即可以认为这批数据服从正态分布 本题也可以利用统计软件来解在各种统计软件中均有几种方法用于检验数据的正态性 这里我们仅介绍一种在MINITAB中的stat菜单中选择Basic Statistic的下拉菜单Normality Test 对话框中.(),p0.683,0.05,.p有三种检验数据正态性的方法可供选择这里我们选择Anderson - Darling方法 当然也可以选择其他方法 检验的 值为若取择 值大于因此我们接受原假设 这与我们前面的检验结果一致,Pr,MINITABMINITABGraphobability正态概率纸也可以用作出在中的菜单中选择 Plot 即可
19、 如图7.2. -6,30,.(10 ),0.9920 1.0138 1.0163 1.0142 1.0258 1.0134 1.0238 0.9760 0.9996 0.9969 0.9679 1.0051 0.9789 从图上可见个点基本上位于一条直线附近可认为该批数据来自正态总体图上由两条曲线所夹的区域为该正态分布的95%置信带11 下列数据是某工厂的冷却水中的含氯量 1.0283 0.9839 1.01061.0044 0.9816 0.9566 0.9988 0.9798 1.0123 1.0102 1.03381.0118 0.9871 1.0076 0.9798 0.9996 0
20、.9990 1.0000 0.99361.0219 0.9625 1.0086 1.0179 1.0146 1.0116 1.0008 1.01351.0114 0.9949 0.9925 0.9941 0.9705 0.9953 1.0024 1.00630.01. ,.,0.01.,. 试在显著性水平下对这批数据作正态性检验 解 由于本题的数据较多 我们仅用统计软件来验证数据的正态性 方法同上 这里就不再重复了对于本题的数据 检验的p值为0.163 大于给定的于是在显著性水平下我们可以认为这组数据是正态的 正态概率纸如图7.3.由图形可见 所有的点基本上位于一条直线附近 可认为该批数据来自
21、正态总体 图上由两条曲线所夹的区域为该正态分布的95%.置信带0,.,:()3,X,112,:0.05,:( ,),8,3,5,HXh n N MNnM 12. 袋中装有红球与白球共8个 其中红球数M未知为了考察红球数M是多少 特设计如下试验 每次从袋中任取 不返回 球 记录其中红球数如此试验独立进行次 获得X 0 1 2 3如下数据次数 1 31 55 25对显著性水平检验如下假设服从超几何分布其中即 00533:P(X=k)=,0,1,2,3.85,kkHkH 简单的说是袋中有5个红球 即M=5.22,. (M=5) X=kk2kkkkkk 解 对这个问题可用拟合优度检验 先按下表计算拟合
22、优度检验计算表 n p =P() np (n -np )/(np ) 0 1 1/56 2 0.51 31 15/56 30 0.950.05,(3)=7.8147,7.8147,220 24/56 48 6.021 2 55 24/56 48 1.0213 25 4/56 8 36.125和 112 1.00 112 =49.292 由于故应拒绝原假设H 即袋中红.,. 球个数为4是与试验数据不符合的因为有此结果 使人们对M=5增加了信念213.,:0.05(10,).inXbp 某射手打靶 一次打10发子弹 共打了100次 每次10发的命中数X统计如下命中数i 0 1 2 3 4 5 6
23、7 8 9 10 频率 0 2 4 10 22 26 18 12 4 2 0在显著性水平下用拟合优度试验法检验命中数服从二项分布 解 先给出命中率p的最大似然估计 100.5500/10000.5.100010(X=i)=0.5 ,0,1,2,10.:Pii10ii=1i p=x=in又记p具体计算见下表2 iX = i2ii0 . 5iiii拟 合 优 度 检 验 计 算 表 n p = P() n p ( n- n p ) / ( n p )0 0 0 . 0 0 0 9 7 7 0 . 0 9 8 0 . 0 9 81 2 0 . 0 0 9 7 6 5 0 . 9 7 6 1 . 0
24、7 4 2 4 0 . 0 4 3 9 4 5 4 . 3 9 5 0 . 0 3 63 1 0 0 . 1 1 7 1 8 8 1 1 . 7 1 9 0 . 2 5 24 2 2 0 . 2 0 5 2 1 2 2 0 . 5 2 1 0 . 1 0 75 2 6 0 . 2 4 6 0 9 4 2 4 . 6 0 9 0 . 0 7 96 1 8 0 . 2 0 5 2 1 2 2 0 . 5 2 1 0 . 3 1 07 1 2 0 . 1 1 7 1 8 8 1 1 . 7 1 9 0 . 0 0 78 4 0 . 0 4 3 9.4 5 4 . 3 9 5 0 . 0 3 69 2
25、 0 . 0 0 9 7 6 5 0 . 9 7 6 1 . 0 7 41 0 0 0 . 0 0 0 9 7 7 0 . 0 9 8 0 . 0 9 8 和 1 0 0 1 . 0 0 0 0 0 0 1 0 0 . 0 0 3 . 1 7 1 0.05,(11-1-1)=(9)=16.9190,16.9190,3.17116.9190,10,(:kV),:/kV 3.8 3.9 4.0 4.1 4.2 4.3 220.950.95220对给定的查表知拒绝域为由于所以不能拒绝H 即可认为该射手一次发的命中数X服从二项分布 14. 对某种电缆进行耐高压试验记录43根电缆的最低击穿电压 单位具体
26、数据如下测试电压i 4.4 4.5 4.6 4.7 4.8n0.05. X击穿频数 1 1 1 2 7 8 8 4 6 4 1 试在显著性水平下对 击穿电压 服从正态分布 的假设作出检验 ,.,(,.,.解这是一个分组样本 因为一根电缆被击穿的最低电压是一个连续随机变量 它的可能取值是充满整个空间它可以取4.13kV 也可以取4.17kV 由于试验只能在若干个点上观察 譬如在4.2kV电压下有7根电缆被击穿 实际这7根电缆被击穿的电压可能在4.14.2 kV内某7个点 由于不能观察到具体电压故用分组样本表示 由于不知43根电缆的确切最低击穿电压 故不能用w检验进行正态性检验 但可以,:使用拟合
27、优度检验 具体操作如下 1111121(1),1431()0.04957,0.2226.43(2)(- ,+ ),5,.(3)N(4.3244,0.22iiiiffx 22i2i设最低击穿电压XN()其中 和的最大似然估计可用分组样本得到 =x=x =4.3244, x 把分成若干个区间使每个小区间里击穿频率不低于 这可对分组样本作适当合并得到具体见下表第二列 利用正态分布226 ),4.1 4.3244(4.1)()0.1562,0.2226Px1计算正态变量落入每个区间的概率譬如p24.24.32444.1 4.3244(4.14.2)()0.1315,0.22260.2226,: iX=
28、i(- ,4.1Px2362ii0.5iiiip其他pp 类似计算结果见下表 拟合优度检验计算表 区间 频数n p =P () np (n -np )/(np )1 5 0.1562 6.7166 0.4387 2 (4.1,4.2 7 0.1315 5.6545 0.32023 (4.2,4.3 8 0.1685 7.2455 0.0786 4 (4.3,4.5 12 0.3290 14.1470 0.32585 (4.5,4.6 6 0.1073 4.6139 0.41646 (4.6,+2) 5 0.1075 4.6225 0.0308和 43 1.0000 =1.6105 0.95(4)1.6105 (5).0.05,(3)=7.814W=7.8147.(6):,.22iii222n -np ) 计算检验统计量的值np给出拒绝域对给定的显著性水平查表值拒绝域为 判断由于7.8147没落入拒绝域故应不拒绝正态分布的假设即可认为此种电缆的最低击穿电压服从正态分布