参数估计-白城师范学院课件.ppt_163文库

资源描述

1、第六章参数估计6.1 点估计的几种方法6.2 点估计的评价标准6.3 最小方差无偏估计6.4 贝叶斯估计6.5 区间估计一般常用表示参数，参数所有可能取值组成的集合称为参数空间，常用表示。参数估计问题就是根据样本对上述各种未知参数作出估计。参数估计的形式有两种：点估计与区间估计。设 x1, x2, xn 是来自总体 X 的一个样本，我们用一个统计量的取值作为的估计值，称为的点估计（量），简称估计。在这里如何构造统计量并没有明确的规定，只要它满足一定的合理性即可。这就涉及到两个问题：1(,)nxx 其一是如何给出估计，即估计的方法问题；其二是如何对不同的估计进行评价，即估

2、计的好坏判断标准。6.1.1 替换原理和矩法估计一、矩法估计替换原理是指用样本矩及其函数去替换相应的总体矩及其函数，譬如：用样本均值估计总体均值E(X)，即；用样本方差估计总体方差Var(X)，即用样本的 p 分位数估计总体的 p 分位数，用样本中位数估计总体中位数。 ()E Xx2Var()nXs例6.1.1 对某型号的20辆汽车记录其每加仑汽油的行驶里程(km)，观测数据如下： 29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7 28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9

3、经计算有由此给出总体均值、方差和中位数的估计分别为: 28.695, 0.9185 和 28.6。矩法估计的实质是用经验分布函数去替换总体分布，其理论基础是格里纹科定理。20.528.695,0.9185,28.6nxsm 设总体具有已知的概率函数 P(x, 1, , k)， x1, x2 , , xn 是样本，假定总体的k阶原点矩k存在，若1, , k 能够表示成 1, , k 的函数j = j(1, ,k)，则可给出诸j 的矩法估计为其中1( ,),1, ,jjkaajk11njjiiaxn例6.1.2 设总体服从指数分布，由于EX=1/，即 =1/ EX，故的矩法估计为另外

4、，由于Var(X)=1/2，其反函数为因此，从替换原理来看，的矩法估计也可取为 s 为样本标准差。这说明矩估计可能是不唯一的，这是矩法估计的一个缺点，此时通常应该尽量采用低阶矩给出未知参数的估计。1/ x1/ Var( )X11/s例6.1.3 x1, x2, , xn是来自(a,b)上的均匀分布U(a,b)的样本，a与b均是未知参数，这里k=2，由于不难推出由此即可得到a, b的矩估计：2(),Var(),212abbaEXX3Var(),3Var(),aEXXbEXX3 ,3axsbxs定义6.1.1 设总体的概率函数为P(x; )，是参数可能取值的参数空间，x1, x2 , , x

5、n 是样本，将样本的联合概率函数看成的函数，用L( ; x1, x2, , xn) 表示，简记为L( )，称为样本的似然函数。112( )( ;,)(; )(; )(; )nnLLxxp xp xp x 如果某统计量满足则称是的极(最)大似然估计，简记为MLE（Maximum Likelihood Estimate）。 1( ,)nxx ( )max( )LL人们通常更习惯于由对数似然函数lnL( )出发寻找的极大似然估计。当L( )是可微函数时，求导是求极大似然估计最常用的方法，对lnL( )求导更加简单些。例6.1.6 设一个试验有三种可能结果，其发生概率分别为现做了n次试

6、验，观测到三种结果发生的次数分别为 n1 , n2 , n3 (n1+ n2+ n3 = n)，则似然函数为其对数似然函数为22123,2 (1),(1)ppp123212322222( )() 2 (1) (1) 2(1)nnnnnnnnL12322ln ( )(2)ln(2)ln(1)ln2Lnnnnn将之关于求导，并令其为0得到似然方程解之，得由于所以是极大值点。12322201nnnn1212123222()2nnnnnnnn21232222ln ( )220(1)Lnnnn 例6.1.7 对正态总体N(, 2)，=(, 2)是二维参数，设有样本 x1, x2 , , xn，则似

7、然函数及其对数分别为 22212/222122221()1( ,)exp221(2)exp()21ln ( ,)()lnln(2 )222niinniiniixLxnnLx 将 lnL(, 2) 分别关于两个分量求偏导并令其为0, 即得到似然方程组 (6.1.9) (6.1.10)221ln ( ,)1()0niiLx 222421ln ( ,)1()022niiLnx 解此方程组，由(6.1.9)可得的极大似然估计为将之代入(6.1.10)，得出 2的极大似然估计利用二阶导函数矩阵的非正定性可以说明上述估计使得似然函数取极大值。 11niixxn2221*1()niixxsn 虽然求导

8、函数是求极大似然估计最常用的方法，但并不是在所有场合求导都是有效的。例6.1.8 设 x1, x2 , , xn 是来自均匀总体 U(0, )的样本，试求的极大似然估计。解似然函数要使L( )达到最大，首先一点是示性函数取值应该为1，其次是1/n尽可能大。由于1/n是的单调减函数，所以的取值应尽可能小，但示性函数为1决定了不能小于x( (n) )，由此给出的极大似然估计：。 ( )0111( )innxxnniLII ( )nx 极大似然估计有一个简单而有用的性质：如果是的极大似然估计，则对任一函数 g( )，其极大似然估计为。该性质称为极大似然估计的不变性，从而使一些复

9、杂结构的参数的极大似然估计的获得变得容易了。 ( )g 例6.1.9 设 x1 , x2 , , xn是来自正态总体N( , 2) 的样本，则和 2的极大似然估计为，于是由不变性可得如下参数的极大似然估计，它们是: 22*, xs*s 标准差的MLE是；概率的MLE是；0.90*xs u3(3)P X*3xs总体0.90分位数 x0.90= + u0.90 的MLE是，其中u0.90为标准正态分布的0.90分位数。6.2.1 相合性我们知道，点估计是一个统计量，因此它是一个随机变量，在样本量一定的条件下，我们不可能要求它完全等同于参数的真实取值。但如果我们有足够的观测值，根据格里

10、纹科定理，随着样本量的不断增大，经验分布函数逼近真实分布函数，因此完全可以要求估计量随着样本量的不断增大而逼近参数真值，这就是相合性，严格定义如下。定义6.2.1 设为未知参数，是的一个估计量，n 是样本容量，若对任何一个0，有 (6.2.1) 则称为参数的相合估计。 1( ,)nnnxxlim(|)0nnPn 相合性被认为是对估计的一个最基本要求, 如果一个估计量, 在样本量不断增大时，它都不能把被估参数估计到任意指定的精度, 那么这个估计是很值得怀疑的。通常, 不满足相合性要求的估计一般不予考虑。证明估计的相合性一般可应用大数定律或直接由定义来证. 若把依赖于样本量n的估计量

11、看作一个随机变量序列,相合性就是依概率收敛于 ,所以证明估计的相合性可应用依概率收敛的性质及各种大数定律。nn在判断估计的相合性时下述两个定理是很有用的。定理6.2.1 设是的一个估计量，若则是的相合估计，1(,)nnnxxlim(),lim()0nnnnEVarn1,nnk1(,)nnnkg定理6.2.2 若分别是1, , k 的相合估计， =g(1 , , k) 是1, , k 的连续函数，则是的相合估计。例6.2.2 设 x1, x2 , , xn 是来自均匀总体U(0, )的样本，证明的极大似然估计是相合估计。证明：在例6.1.7中我们已经给出的极大似然估计是

12、 x(n)。由次序统计量的分布，我们知道 x(n) 的分布密度函数为 p(y)=nyn-1/ n, y 1，比有效。这表明用全部数据的平均估计总体均值要比只使用部分数据更有效。 11x2x2212Var(),Var()/n21例6.2.7 均匀总体U(0, )中的极大似然估计是x(n)，由于，所以x(n)不是的无偏估计，而是的渐近无偏估计。经过修偏后可以得到的一个无偏估计：。且另一方面，由矩法我们可以得到的另一个无偏估计，且由此，当n1时，比有效。( )1nnExn1( )1nnxn22221( )211Var( )Var()(1) (2)(2)nnnnxnnnnn

13、n22x22244Var()4Var( )Var()123xXnnn12 无偏估计不一定比有偏估计更优。评价一个点估计的好坏一般可以用：点估计值与参数真值的距离平方的期望，这就是下式给出的均方误差均方误差是评价点估计的最一般的标准。我们希望估计的均方误差越小越好。 2()()MSEE 注意到，因此 (1) 若是的无偏估计，则，这说明用方差考察无偏估计有效性是合理的。 (2) 当不是的无偏估计时，就要看其均方误差。下面的例子说明：在均方误差的含义下有些有偏估计优于无偏估计。 2( )Var( )()MSEE( )MSE( )Var( )MSE例6.2.8 对均匀总体

14、U(0, )，由的极大似然估计得到的无偏估计是，它的均方误差现我们考虑的形如的估计，其均方差为用求导的方法不难求出当时上述均方误差达到最小，且其均方误差所以在均方误差的标准下，有偏估计优于无偏估计。 ( )(1)/nnxn2( )Var( )(2)MSEn n( )nx22222()1(1) (2)1nnMSEnnn0(2)/(1)nn2202()( )(1)(2)MSEMSEnn n06.3 最小方差无偏估计6.3.1 Rao-Blackwell定理以下定理说明：好的无偏估计都是充分统计量的函数。定理6.3.2 设总体概率函数是 p(x, )， x1, x2 , , x

15、n 是其样本，T=T(x1, x2 , , xn )是的充分统计量，则对的任一无偏估计，令，则也是的无偏估计，且 1( ,)nxx( | )ETVar( )Var( ) 定理6.3.2说明：如果无偏估计不是充分统计量的函数，则将之对充分统计量求条件期望可以得到一个新的无偏估计，该估计的方差比原来的估计的方差要小，从而降低了无偏估计的方差。换言之，考虑的估计问题只需要在基于充分统计量的函数中进行即可，该说法对所有的统计推断问题都是正确的，这便是所谓的充分性原则。例6.3.1 设 x1, x2 , , xn 是来自b(1, p)的样本，则是p 的充分统计量。为估

16、计 =p2，可令由于，所以是的无偏估计。这个只使用了两个观测值的估计并不好.下面我们用Rao-Blackwell定理对之加以改进：求关于充分统计量的条件期望，得Tnx12111,10 xx，其它112( )(1,1)EP xxp p 111niiTx12(1)(|)/2(1)nnt tETtttn n 定义6.3.1 对参数估计问题，设是的一个无偏估计，如果对另外任意一个的无偏估计，在参数空间上都有则称是的一致最小方差无偏估计，简记为 UMVUE。如果UMVUE存在，则它一定是充分统计量的函数。Var ( )Var ( ) 定理6.3.3 设 x=(x1, x

17、2 , , xn) 是来自某总体的一个样本，是的一个无偏估计，如果对任意一个满足E(x)=0的(x)，都有则是的UMVUE。()xVar( ). Cov ( , )0, 关于UMVUE，有如下一个判断准则。例6.3.2 设 x1,x2 ,xn 是来自指数分布Exp(1/ )的样本，则T = x1+xn 是的充分统计量，而是的无偏估计。设 =(x1 , x2 , , xn)是0的任一无偏估计，则两端对求导得这说明，从而，由定理6.3.3，它是的UMVUE。 /xT n()/1100( ,)dd0inxxnnxxexx ()/11200( ,)dd0inxxnnnx

18、xxexx ()0E xCov( , )()( )( )0 xE xE xE定义6.3.2 设总体的概率函数 P(x, ), 满足下列条件： (1) 参数空间是直线上的一个开区间； (2) 支撑 S=x: P(x, )0与无关； (3) 导数对一切都存在； (4) 对P(x, )，积分与微分运算可交换次序； (5) 期望存在；则称为总体分布的费希尔(Fisher) 信息量。 ( ; )p x2ln( ; )Ep x2( )ln ( ; )IEp x 费希尔信息量是数理统计学中一个基本概念，很多的统计结果都与费希尔信息量有关。如极大似然估计的渐近方差，无偏估计的方差的下界等都与费希尔信

19、息量I( )有关。I( )的种种性质显示，“I( )越大”可被解释为总体分布中包含未知参数的信息越多。例6.3.3 设总体为泊松分布P()分布，则于是ln( ; )lnln( !)p xxxln( ; )1xp x21( )XIE例6.3.4 设总体为指数分布，其密度函数为可以验证定义6.3.2的条件满足，且于是1( ; )exp,0, 0 xp xx221ln( ; )xxp x 2242Var( )1( )xxIE定理6.3.4（Cramer-Rao不等式）设定义6.3.2的条件满足，x1, x2 , , xn 是来自该总体的样本，T=T(x1, x2 , , xn )是g( )

20、的任一个无偏估计，存在，且对中一切，微分可在积分号下进行，则有 ()()gg2Var( ) ( )( )TgnI 上式称为克拉美-罗（C-R）不等式; g()2/(nI( )称为g( )的无偏估计的方差的C-R下界，简称g( )的C-R下界。特别，对的无偏估计 ,有 ;1Var( )( ( )nI 如果等号成立，则称 T=T(x1, , xn) 是 g( )的有效估计，有效估计一定是UMVUE。例6.3.5 设总体分布列为p(x, )= x(1- )1-x, x=0,1，它满足定义6.3.2的所有条件，可以算得该分布的费希尔信息量为，若 x1, x2, , xn 是该总体的样本

21、，则的C-R下界为(nI( )-1= (1- )/n。因为是的无偏估计，且其方差等于 (1- )/n，达到C-R 下界，所以是的有效估计，它也是的UMVUE。 1()(1)Ixx例6.3.6 设总体为指数分布Exp(1/ )，它满足定义6.3.2的所有条件，例6.3.4中已经算出该分布的费希尔信息量为I( ) = -2，若x1, x2, , xn 是样本，则的C-R下界为(nI( )-1=2/n。而是的无偏估计，且其方差等于2/n，达到了C-R下界，所以，是的有效估计，它也是的UMVUE。xx能达到C-R下界的无偏估计不多:例6.3.7 设总体为N(0, 2 )，满足定义

22、6.3.2的条件，且费希尔信息量为，令 , 则的C-R下界为 , 而的UMVUE为其方差大于C-R下界。这表明所有的无偏估计的方差都大于其C-R下界。 241()2I22()g2222()()2gnIn21( /2)12(1)/2)niinnxnn定理6.3.5 设总体X有密度函数 p(x; )，，为非退化区间，假定 (1) 对任意的x，偏导数，和对所有都存在； (2) , 有，其中函数F1(x) , F2(x), F3(x)可积.ln p22ln p33ln p2312323ln( ),( ),( )pppF xF xF x (3) , 若 x1, x2 , , x

23、n 是来自该总体的样本，则存在未知参数的极大似然估计，且具有相合性和渐近正态性: 1,( )nNnI2ln0( )( ; )dpIp xx1(,)nnnxxn6.4.1 统计推断的基础经典学派的观点：统计推断是根据样本信息对总体分布或总体的特征数进行推断，这里用到两种信息：总体信息和样本信息；贝叶斯学派的观点：除了上述两种信息以外，统计推断还应该使用第三种信息：先验信息。（1）总体信息:总体分布提供的信息。（2）样本信息:抽取样本所得观测值提供的信息。（3）先验信息:人们在试验之前对要做的问题在经验上和资料上总是有所了解的，这些信息对统计推断是有益的。先验信息即是抽样（试验）之

24、前有关统计问题的一些信息。一般说来，先验信息来源于经验和历史资料。先验信息在日常生活和工作中是很重要的。基于上述三种信息进行统计推断的统计学称为贝叶斯统计学。它与经典统计学的差别就在于是否利用先验信息。贝叶斯统计在重视使用总体信息和样本信息的同时，还注意先验信息的收集、挖掘和加工，使它数量化，形成先验分布，参加到统计推断中来，以提高统计推断的质量。忽视先验信息的利用，有时是一种浪费，有时还会导出不合理的结论。贝叶斯学派的基本观点：任一未知量都可看作随机变量，可用一个概率分布去描述，这个分布称为先验分布；在获得样本之后，总体分布、样本与先验分布通过贝叶斯公式结合起来得到一个关于未知量

25、新的分布后验分布；任何关于的统计推断都应该基于的后验分布进行。总体依赖于参数的概率函数在贝叶斯统计中记为P (x | )，它表示在随机变量取某个给定值时总体的条件概率函数；根据参数的先验信息可确定先验分布( )；从贝叶斯观点看，样本 x1, x2 , , xn 的产生分两步进行:首先从先验分布( )产生一个样本0，然后从P (x |0)中产生一组样本。这时样本的联合条件概率函数为，这个分布综合了总体信息和样本信息； 1001(,|)(|)nniip xxp x0 是未知的，它是按先验分布()产生的。为把先验信息综合进去，不能只考虑0，对的其它值发生的可能性也要加以考虑，故要用(

26、 )进行综合。这样一来，样本x1 , , xn和参数的联合分布为: h(x1, x2 , , xn, ) = p(x1, x2 , , xn )( )，这个联合分布把总体信息、样本信息和先验信息三种可用信息都综合进去了；在没有样本信息时，人们只能依据先验分布对作出推断。在有了样本观察值 x1, x2 , , xn 之后，则应依据 h(x1, x2 , , xn , )对作出推断。由于 h(x1,x2 ,xn , ) =( x1,x2 ,xn )m(x1,x2 ,xn)，其中是x1, x2 , , xn 的边际概率函数，它与无关，不含的任何信息。因此能用来对作出推断的仅是条件分

27、布( x1, x2 , , xn)，它的计算公式是 111(,)(, )(,| ) ( )nnnm xxh xxdp xxd 11111( , )( ,| ) ( )( |,)( ,)( ,| ) ( )nnnnnh xxp xxxxm xxp xxd 这个条件分布称为的后验分布后验分布，它集中了总体、样本和先验中有关的一切信息。后验分布( x1, x2 , , xn )的计算公式就是用密度函数表示的贝叶斯公式。它是用总体和样本对先验分布()作调整的结果，贝叶斯统计的一切推断都基于后验分布进行。 6.4.3 贝叶斯估计基于后验分布( x1, x2 , , xn )对所作的贝叶斯估计有

28、多种，常用有如下三种：使用后验分布的密度函数最大值作为的点估计，称为最大后验估计；使用后验分布的中位数作为的点估计，称为后验中位数估计；使用后验分布的均值作为的点估计，称为后验期望估计。用得最多的是后验期望估计，它一般也简称为贝叶斯估计，记为。 B例6.4.2 设某事件A在一次试验中发生的概率为，为估计，对试验进行了n次独立观测，其中事件A发生了X次，显然 X b(n, )，即假若我们在试验前对事件A没有什么了解，从而对其发生的概率也没有任何信息。在这种场合，贝叶斯本人建议采用“同等无知”的原则使用区间（0,1）上的均匀分布U(0,1)作为的先验分布，因为它取（0,1）上的每一

29、点的机会均等。贝叶斯的这个建议被后人称为贝叶斯假设。 (| )(1),0,1,xn xnP Xxxnx 由此即可利用贝叶斯公式求出的后验分布。具体如下：先写出X和的联合分布然后求X的边际分布最后求出的后验分布最后的结果说明X Be(x+1,n-x+1)，其后验期望估计为 (6.4.4)( , )(1),0,1, ,01xn xnh xxnx(1) (1)(1)(2)xnxnxnxdxn (1) 1(1) 1( , )(2)( | )(1),01( )(1) (1)xn xh xnxm xxn x 1( | )2BxExn某些场合，贝叶斯估计要比极大似然估计更合理一点。比如: “抽检

30、3个全是合格品”与“抽检10个全是合格品”，后者的质量比前者更信得过。这种差别在不合格品率的极大似然估计中反映不出来（两者都为0），而用贝叶斯估计两者分别是 0.2 和 0.83。由此可以看到，在这些极端情况下，贝叶斯估计比极大似然估计更符合人们的理念。例6.4.3 设x1, x2 , , xn是来自正态分布N(,02)的一个样本，其中02已知，未知，假设的先验分布亦为正态分布N(, 2)，其中先验均值和先验方差 2均已知，试求的贝叶斯估计。解：样本x的分布和的先验分布分别为2/22021021/2221( | )(2)exp()21( )(2)exp()2nniip xx 由此可以写

31、出x与的联合分布其中，。若记则有222211220212( , )exp2niinn xxhkx 11niixxn(1)/2110(2 )nnk 2212222220001,niixnnxABC212211( ,)exp22(/)1exp(/)2/2hkABCB AkCBAAx 注意到A,B,C均与无关，由此容易算得样本的边际密度函数应用贝叶斯公式即可得到后验分布这说明在样本给定后，的后验分布为 N(B/A,1/A)，即 21/211( )( , )exp(/ ) (2 / )2m xh xdkCBAA1/22( , )1( | )(2 / )exp(/ )( )2/h xxAB

32、 Am xA 2202222001|,nxxNnn 后验均值即为其贝叶斯估计：它是样本均值与先验均值的加权平均。220222200/1/1/1/nxnnx 若后验分布(x)与()属于同一个分布族，则称该分布族是的共轭先验分布(族)。二项分布b(n, )中的成功概率的共轭先验分布是贝塔分布Be(a,b)；泊松分布P()中的均值的共轭先验分布是伽玛分布Ga(,)；在方差已知时，正态均值的共轭先验分布是正态分布N(, 2);在均值已知时，正态方差 2的共轭先验分布是倒伽玛分布IGa(,)。 6.5.1 区间估计的概念定义6.5.1 设是总体的一个参数，其参数空间为，x1, x2 ,

33、 , xn是来自该总体的样本，对给定的一个 (0 1)，若有两个统计量和，若对任意的，有（6.5.1）1( ,)LLnxx1( ,)UUnxx()1,LUP 则称随机区间为的置信水平为1- 的置信区间，或简称是的1-置信区间. 和分别称为的（双侧）置信下限和置信上限. ,LU 这里置信水平1- - 的含义是指在大量使用该置信区间时，至少有100(1-)%的区间含有。 ,LULU例6.5.1 设x1, x2 , , x10是来自N(, 2)的样本，则的置信水平为1- 的置信区间为其中， ,s 分别为样本均值和样本标准差。这个置信区间的由来将在6.5.3节中说明，这里用它来

34、说明置信区间的含义。若取 =0.10，则t0.95(9)=1.8331，上式化为1212(9)10,(9)10 xtsxts0.5797 ,0.5797xsxsx 现假定 =15, 2 =4，则我们可以用随机模拟方法由N(15,4)产生一个容量为10的样本，如下即是这样一个样本：14.85 13.01 13.50 14.93 16.97 13.80 17.9533 13.37 16.29 12.38 由该样本可以算得从而得到的一个区间估计为该区间包含的真值-15。现重复这样的方法 100次，可以得到100个样本，也就得到100个区间，我们将这100个区间画在图6.5.1上。 14.

35、7053,1.8438xs14.7053 0.5797 1.8438, 14.7053 0.5797 1.8438 13.6427, 15.7679 由图6.5.1可以看出，这100个区间中有91个包含参数真值15，另外9个不包含参数真值。图6.5.1 的置信水平为0.90的置信区间取=0.50，我们也可以给出100个这样的区间，见图6.5.2。可以看出，这100个区间中有50个包含参数真值15，另外50个不包含参数真值。图6.5.2 的置信水平为0.50的置信区间定义6.5.2 沿用定义6.5.1的记号，如对给定的 (0 1)，对任意的，有（6.5.2）称为的1- 同等置信区

36、间。同等置信区间是把给定的置信水平1- 用足了。常在总体为连续分布场合下可以实现。 ()1LUP ,LU定义若对给定的 (0 1)和任意的，有，则称为的置信水平为1- 的（单侧）置信下限。假如等号对一切成立，则称为的1- 同等置信下限。若对给定的 (0 1)和任意的，有 ,则称为的置信水平为1- 的（单侧）置信上限。若等号对一切成立，则称为1- 同等置信上限。单侧置信限是置信区间的特殊情形。因此，寻求置信区间的方法可以用来寻找单侧置信限。 LLUU()1LP ()1UP 构造未知参数的置信区间的最常用的方法是枢轴量法，其步骤可以概括为如下三步：1. 设法构造一个样本和

37、的函数 G=G(x1, x2 , , xn, ) 使得G的分布不依赖于未知参数。一般称具有这种性质的G为枢轴量。 2. 适当地选择两个常数c,d，使对给定的 (0 1) 有P(cGd)=1- 3. 假如能将cG d 进行不等式等价变形化为则，是的1- 同等置信区间。 LULU关于置信区间的构造有两点说明：满足置信度要求的c与d通常不唯一。若有可能，应选平均长度达到最短的c与d，这在G的分布为对称分布场合通常容易实现。实际中，选平均长度尽可能短的c与d，这往往很难实现，因此，常这样选择 c与d，使得两个尾部概率各为 /2，即P(Gd)= /2，这样的置信区间称为等尾置信区间。这是

38、在G的分布为偏态分布场合常采用的方法。 ULEULE例6.5.2 设x1, x2 , , xn是来自均匀总体U(0, )的一个样本，试对给定的 (0 1)给出的1- 同等置信区间。解:（1）取x(n)作为枢轴量，其密度函数为p(y; )= nyn ， 0y 1；（2）x(n) / 的分布函数为F(y)=yn, 0y 1，故P(cx(n)/ d)= d n-cn，因此我们可以适当地选择c和d满足d n-cn=1-（3）利用不等式变形可容易地给出的1-同等置信区间为x(n) /d，x(n) /c，该区间的平均长度为。不难看出，在0cd1及dn-cn=1- 的条件下，当d=1, c= 时

39、，取得最小值，这说明是的置信水平1- 为最短置信区间。 ( )11nExcdn11cd( )( ),nnnxx一、一、已知时已知时的置信区间的置信区间在这种情况下，枢轴量可选为，c和d应满足P(cGd)=(d)-(c)= 1-，经过不等式变形可得该区间长度为。当d=-c=u1-/2时，d-c达到最小，由此给出了的同等置信区间为，。（6.5.8）这是一个以为中心，半径为的对称区间，常将之表示为。(0,1)xGNn1Pxdnxcn ()/dcn12xun12xunx12un12xun例6.5.3 用天平秤某物体的重量9次，得平均值为（克），已知天平秤量结果为正态分

40、布，其标准差为0.1克。试求该物体重量的0.95置信区间。解：此处1- =0.95， =0.05，查表知u0.975=1.96，于是该物体重量的0.95置信区间为，从而该物体重量的0.95置信区间为 15.3347，15.4653。 15.4x 1215.4 1.96 0.1 9 15.4 0.0653x un例6.5.4 设总体为正态分布N(,1)，为得到的置信水平为0.95的置信区间长度不超过1.2，样本容量应为多大？解：由题设条件知的0.95置信区间为其区间长度为，它仅依赖于样本容量n而与样本具体取值无关。现要求，立即有n(2/1.2)2u21-/2.现1- = 0.95

41、，故u1-/2=1.96，从而n(5/3)2 1.962 = 10.6711。即样本容量至少为11时才能使得的置信水平为0.95的置信区间长度不超过1.2。 122 un1221.2un1212/,/xunxun二、 2未知时的置信区间这时可用t 统计量，因为，因此 t 可以用来作为枢轴量。完全类似于上一小节，可得到的1-置信区间为此处是 2的无偏估计。 () (1)n xtt ns1212(1),(1)x tnsnx tnsn221()1isxxn例6.5.5 假设轮胎的寿命服从正态分布。为估计某种轮胎的平均寿命，现随机地抽12只轮胎试用，测得它们的寿命（单位：万公里）如下：4

42、.68 4.85 4.32 4.85 4.61 5.025.20 4.60 4.58 4.72 4.38 4.70 此处正态总体标准差未知，可使用t分布求均值的置信区间。经计算有 =4.7092，s2=0.0615。取 =0.05，查表知t0.975(11)=2.2010，于是平均寿命的0.95置信区间为（单位：万公里）x4.70922.20100.0615/ 124.5516, 4.8668 在实际问题中，由于轮胎的寿命越长越好，因此可以只求平均寿命的置信下限，也即构造单边的置信下限。由于由不等式变形可知的1-置信下限为将t0.95(11)=1.7959代入计算可得平均寿命的0.95

43、置信下限为4.5806（万公里）。 ()( (1)1n xP tns 1(1)xtnsn 取枢轴量，由于 2分布是偏态分布，寻找平均长度最短区间很难实现，一般都用等尾置信区间：采用 2的两个分位数 2 /2(n-1) 和21- /2(n-1)，在 2分布两侧各截面积为/2的部分，使得由此给出 2的1-置信区间为 222(1)1nsGn222/ 21/ 2211nsP2222121211 ,11nsnnsn例6.5.6 某厂生产的零件重量服从正态分布N(, 2)，现从该厂生产的零件中抽取9个，测得其重量为（单位：克）45.3 45.4 45.1 45.3 45.5 45.7 45.4 45

44、.3 45.6 试求总体标准差的0.95置信区间。解：由数据可算得 s2 =0.0325，(n-1)s2=80325=0.26. 查表知 2 0.025(8) =2.1797，20.975(8)=17.5345，代入可得 2的0.95置信区间为从而的0.95置信区间为: 0.1218，0.3454。 0.260.26,0.0148,0.119317.53452.1797 在样本容量充分大时，可以用渐近分布来构造近似的置信区间。一个典型的例子是关于比例p 的置信区间。设x1, xn是来自b(1, p)的样本,有对给定，，通过变形，可得到置信区间为其中记= u21-/2，实用中通

45、常略去/n项，于是可将置信区间近似为(0,1)(1)/xpuNppn121(1)xpPuppn 22221(1)1(1),242411xxxxxxnnnnnnnn22(1)(1),xxxxxuxunn例6.5.7 对某事件A作120次观察，A发生36次。试给出事件A发生概率p 的0.95置信区间。解：此处n=120， =36/120=0.3 而u0.975=1.96，于是p的0.95（双侧）置信下限和上限分别为故所求的置信区间为 0.218，0.382x0.3 0.70.3 1.960.218120Lp0.3 0.70.31.960.382120Up例6.5.8 某传媒公司欲调查电视台某综艺

46、节目收视率p，为使得 p 的1-置信区间长度不超过d0，问应调查多少用户？解：这是关于二点分布比例p的置信区间问题，由（6.5.11）知，1-的置信区间长度为这是一个随机变量，但由于，所以对任意的观测值有。这也就是说p的1-的置信区间长度不会超过。现要求p的的置信区间长度不超过d0，只需要即可，从而（6.5.12）1221uxxn0,1x 2(1) 0.50.25xx12un120und2120und 这是一类常见的寻求样本量的问题。比如，若取d0=0.04， =0.05，则。这表明，要使综艺节目收视率p的0.95置信区间的长度不超过0.04，则需要对2401个用户作调查。

47、220.9751.9624010.040.04un 设x1 , , xm是来自N(1, 12)的样本，y1 , , yn是来自N(2, 22)的样本，且两个样本相互独立。与分别是它们的样本均值，和分别是它们的样本方差。下面讨论两个均值差和两个方差比的置信区间。 xy22111mxiisxxm22111nyiisyyn一、1 -2的置信区间1、 12和 22已知时的两样本u区间 2、 12 = 22 = 2未知时的两样本t区间 222212121212,xyuxyumnmn12122 ,2wwmnmnxys tmnxys tmnmnmn3、 22 / 12=已知时的两样本t区间 1212

48、2 ,2ttmnmnxystmnxystmnmnmn4、当m和n都很大时的近似置信区间 5、一般情况下的近似置信区间其中 22221212,yyxxssssxyuxyumnmn 0 120 12,xys tlxys tl2220/ ,xyssmsn40442211yxslssmmnn例6.5.9 为比较两个小麦品种的产量，选择18块条件相似的试验田，采用相同的耕作方法作试验，结果播种甲品种的8块试验田的亩产量和播种乙品种的10块试验田的亩产量（单位：千克/亩）分别为：甲品种 628 583 510 554 612 523 530 615 乙品种 535 433 398 470 567 48

49、0 498 560 503 426 假定亩产量均服从正态分布，试求这两个品种平均亩产量差的置信区间.( =0.05）。解：以x1 , , x8记甲品种的亩产量，y1 , , y10记乙品种的亩产量，由样本数据可计算得到 =569.3750，sx2 =2140.5536，m=8 =487.0000，sy2=3256.2222， n=10 下面分两种情况讨论。 xy(1) 若已知两个品种亩产量的标准差相同，则可采用两样本t区间。此处故1 -2的0.95置信区间为22117 2110.55369 3256.222252.4880216xywmsnssmn 120.9752162.1199tmnt

50、12111122.1199 52.488052.7797810wtmnsmn569.3750 487 52.7797, 9569.3750 487 52.7797 29.5953, 135.1547(2) 若两个品种亩产量的方差不等，则可采用近似 t 区间。此处 s02 =2110.5536/8+3256.2222/10=589.4414， s0 =24.2784 于是1-2的0.95近似置信区间为 31.3685，133.38152.2222589.441417.7429 182110.55363256.2222871011l 0 0.97524.2784 2.100951.0065s t

展开阅读全文