1、 第五章 抽样估计 引言引言 上一讲,我们介绍了总体、样本、上一讲,我们介绍了总体、样本、简单随机样本、统计量和抽样分布的概简单随机样本、统计量和抽样分布的概念,介绍了统计中常用的三大分布,给念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理出了几个重要的抽样分布定理.它们是它们是进一步学习统计推断的基础进一步学习统计推断的基础.总体总体样样本本统计量统计量描述描述作出推断作出推断研究统计量的性质和评价一个统计推断的研究统计量的性质和评价一个统计推断的优良性,完全取决于其优良性,完全取决于其抽样分布抽样分布的性质的性质.随机抽样随机抽样统计推断既是利用样本来推断总 体,是数理统计的核
2、心n统计推断的基本问题可以分两大类:n1、参数估计n2、假设检验第5.1节 参数的点估计一、点估计问题的提法一、点估计问题的提法二、估计量的求法二、估计量的求法三、小结三、小结 现在我们来介绍一类重要的统计推断问题现在我们来介绍一类重要的统计推断问题 参数估计问题是利用从总体抽样得到的信息参数估计问题是利用从总体抽样得到的信息来估计总体的某些参数或者参数的某些函数来估计总体的某些参数或者参数的某些函数.参数估计参数估计估计废品率估计废品率估计新生儿的平均体重估计新生儿的平均体重估计湖中鱼数估计湖中鱼数 估计平均降雨量估计平均降雨量 在参数估计问题中,假定总体分布在参数估计问题中,假定总体分布形
3、式已知,未知的仅仅是一个或几个形式已知,未知的仅仅是一个或几个参数参数.这类问题称为参数估计这类问题称为参数估计.参数估计问题的一般提法参数估计问题的一般提法X1,X2,Xn要依据该样本对参数要依据该样本对参数 作出估计,或估计作出估计,或估计 的某个已知函数的某个已知函数 .)(g现从该总体中抽取样本现从该总体中抽取样本设有一个统计总体,总体的分布函数设有一个统计总体,总体的分布函数向量向量).为为 F(x,),其中其中 为未知参数为未知参数(可以是可以是 参数估计参数估计点估计点估计区间估计区间估计一、点估计问题的提法 设总体设总体X的分布函数形式已知的分布函数形式已知,但它的一但它的一个
4、或多个参数为未知个或多个参数为未知,借助于总体借助于总体X的一个样的一个样本来估计总体未知参数的问题称为本来估计总体未知参数的问题称为点估计问点估计问题题.),(),(2121 来估计未知参数来估计未知参数用它的观察值用它的观察值一个适当的统计量一个适当的统计量点估计问题就是要构造点估计问题就是要构造nnxxxXXX.),(21的估计量的估计量称为称为 nXXX.),(21的估计值的估计值称为称为 nxxx.,简记为简记为通称估计通称估计 .,150,0,试估计参数试估计参数数据如下数据如下内断头的次数内断头的次数只纱锭在某一时间段只纱锭在某一时间段现检查了现检查了为未知为未知参数参数为参数的
5、泊松分布为参数的泊松分布假设它服从以假设它服从以随机变量随机变量是一个是一个断头次数断头次数在某纺织厂细纱机上的在某纺织厂细纱机上的 X15011293260456543210knkk次的纱锭数次的纱锭数断头断头断头次数断头次数.,的估计值的估计值作为参数作为参数把把的观察值的观察值再计算出再计算出先确定一个统计量先确定一个统计量 xxXX解解.133.1 x.133.1的的估估计计值值为为 例例1二、估计量的求法 由于估计量是样本的函数由于估计量是样本的函数,是随机变量是随机变量,故故对不同的样本值对不同的样本值,得到的参数值往往不同得到的参数值往往不同,求估求估计量的问题是关键问题计量的问
6、题是关键问题.估计量的求法估计量的求法:(四种四种)常用常用矩估计法和最大似然估计法矩估计法和最大似然估计法.一、一、矩估计法矩估计法 其基本思想是用样本矩估计总体矩其基本思想是用样本矩估计总体矩.理论依据理论依据:它是基于一种简单的它是基于一种简单的“替换替换”思想建立起来的一种估计方法思想建立起来的一种估计方法.是英国统计学家是英国统计学家K.皮尔逊最早提出的皮尔逊最早提出的.大数定律大数定律设设 X1,X2,Xn 来自总体来自总体X的样本的样本记总体记总体k阶矩为阶矩为)(kkXE样本样本k阶矩为阶矩为nikikXnA11 用样本矩来估计总体矩用样本矩来估计总体矩,用样本矩的连续函数用样
7、本矩的连续函数来估计总体矩的连续函数来估计总体矩的连续函数,从而得出参数估计,从而得出参数估计,这种估计法称为矩估计法这种估计法称为矩估计法.记总体记总体k阶中心矩为阶中心矩为kkXEXE)(样本样本k阶中心矩为阶中心矩为nikikXXnB1)(1那么用诸那么用诸 的估计量的估计量 Ai分别代替上式分别代替上式中的诸中的诸 ,即可得诸即可得诸 的矩估计量的矩估计量:i i j 设总体的分布函数中含有设总体的分布函数中含有k个未知参数个未知参数 k ,1都是这都是这k个参数的函数个参数的函数,记为:记为:k ,1,那么它的前那么它的前k阶矩阶矩一般一般),(kiig 1i=1,2,k从这从这k个
8、方程中解出个方程中解出j=1,2,k),(kjjh 1),(1kjjAAh j=1,2,k矩估计法的具体步骤矩估计法的具体步骤:klXnAAnililll,2,1;1,).2(1 令令.,21的的方方程程组组个个未未知知参参数数这这是是一一个个包包含含kk ,).3(21k 解出其中解出其中klXEkll,2,1),()().1(21 求出求出.,表示表示用用k21.,量量这个估计量称为矩估计这个估计量称为矩估计估计量估计量的的分别作为分别作为用方程组的解用方程组的解kk ,).4(2121矩估计量的观察值称为矩估计值矩估计量的观察值称为矩估计值.例例 2 设总体设总体 服从泊松分布服从泊松分
9、布 ,求参数求参数 的估计量的估计量.解:解:设设 是总体是总体 的一个的一个样本样本,由于由于 ,可得可得 nXXX,21)(XEXXniin 11 XX)(P.,),(,21的矩估计量的矩估计量求求的样本的样本是来自总体是来自总体未知未知其中其中上服从均匀分布上服从均匀分布在在设总体设总体baXXXXbabaXn解解)(XE1,2ba )(22XE ,41222baba 2)()(XEXD ,1211 niiXnAba令令2224)(12)(Ababa ,112 niiXn例例3 )(1222121AAabAba即即解方程组得到解方程组得到a,b的矩估计量分别为的矩估计量分别为)(3212
10、1AAAa ,)(312 niiXXnX)(32121AAAb ,)(312 niiXXnX.,),(,)10(),2,1()1(,211的矩估计量的矩估计量求求的样本的样本体体是来自总是来自总未知未知其中其中即有分布律即有分布律服从几何分布服从几何分布设总体设总体pXXXXppkppkXPXnk 解解)(XE 11)1(kkppk,1p,11XAp 令令.1的矩估计量的矩估计量为所求为所求pXp 例例4.,0,221222的矩估计量的矩估计量和和求求一个样本一个样本是是又设又设均为未知均为未知和和但但且有且有都存在都存在和方差和方差的均值的均值设总体设总体 nXXXX 解解)(XE1,22
11、222)()()(XEXDXE 2221AA 令令解方程组得到矩估计量分别为解方程组得到矩估计量分别为,1XA 2122AA niiXXn1221.)(112 niiXXn例例5上例表明上例表明:总体均值与方差的矩估计量的表达式,不因总体均值与方差的矩估计量的表达式,不因不同的总体分布而异不同的总体分布而异.的矩估计量的矩估计量即得即得未知未知例例222,),(NX,X 2.)(112 niiXXn一般地一般地:,的均值的矩估计的均值的矩估计作为总体作为总体用样本均值用样本均值XXnXnii 11.)(1212的方差的矩估计的方差的矩估计作为总体作为总体用样本二阶中心矩用样本二阶中心矩XXXn
12、Bnii 矩法的优点是简单易行矩法的优点是简单易行,缺点是,当总体类型已知时,没有缺点是,当总体类型已知时,没有 充分利用分布提供的信息充分利用分布提供的信息.一般场合下一般场合下,矩估计量不具有唯一性矩估计量不具有唯一性.X 例例6 设总体设总体 的分布密度为的分布密度为xexp 21);()0,(x 为总体为总体 的样本的样本,求参数求参数 的矩估的矩估 计量计量.),(21nXXXX 解解:由于:由于 只含有一个未知参数只含有一个未知参数 ,一般,一般只需求出只需求出 便能得到便能得到 的矩估计量,但是的矩估计量,但是);(xp)(XE021);()(dxexdxxxpXEx 即即 不含
13、有不含有 ,故不能由此得到故不能由此得到 的矩估的矩估计量计量.为此为此,求求)(XEdxexdxxpxXEx|21222);()(20212dxexx 故令故令 21221niiXnniinX1221于是解得于是解得 的矩估计量为的矩估计量为 本例本例 的矩估计量也可以这样求得的矩估计量也可以这样求得 dxexdxxpXXEx|21|);(|01dxxex故令故令|11 niinX 即即 的矩估计量为的矩估计量为|11 niinX 该例表明参数的矩估计量不唯一该例表明参数的矩估计量不唯一 二、二、最大(极大)似然估计法最大(极大)似然估计法最大似然法最大似然法是在总体类型已知条件下使用是在总
14、体类型已知条件下使用的一种参数估计方法的一种参数估计方法.它首先是由德国数学家它首先是由德国数学家高斯在高斯在1821年提出的年提出的,然而,然而,GaussFisher这个方法常归功于英国统这个方法常归功于英国统计学家费歇计学家费歇.费歇在费歇在1922年重新发现了年重新发现了 这一方法,并首先研究了这这一方法,并首先研究了这 种方法的一些性质种方法的一些性质.(或分(或分1.似然函数似然函数设总体设总体X的分布律为的分布律为;xpxXP,其中,其中 m ,.,21 是未知参数,是未知参数,nXXX,.,21是总体是总体X的一个样的一个样nXXX.,21 或或分分布布密密度度为为 布密度为布
15、密度为 ));(xp本,则样本本,则样本 niixp1;,当给定样本值,当给定样本值 nxxx,.,21后,它只是参数后,它只是参数的函数,记为的函数,记为 L即即 niixpL1;的分布律的分布律则称则称 L为似然函数。似然函数实质上为似然函数。似然函数实质上是样本的分布律或分布密度。是样本的分布律或分布密度。2.最大似然估计法最大似然估计法最大似然估计法,是建立在最大似然最大似然估计法,是建立在最大似然原理的基础上的求点估计量的方法。最原理的基础上的求点估计量的方法。最大似然原理的直观想法是:在试验中概大似然原理的直观想法是:在试验中概率最大的事件最有可能出现。因此,一率最大的事件最有可能
16、出现。因此,一个试验如有若干个可能的结果个试验如有若干个可能的结果,.,CBA 若在一次试验中若在一次试验中,结果结果 出现,则一般出现,则一般A出现的概率最大。出现的概率最大。A认为认为X定义定义6.1设总体设总体 的分布密度(或分布律)为的分布密度(或分布律)为 ,其中,其中 为未知参为未知参数。又设数。又设 是总体是总体 的一个样的一个样本值,如果似然函数本值,如果似然函数)(nxxx,.,21).,21m ,();(xpX niixpL1;(6.1)替换成样本替换成样本处处达达到到最最大大值值,则则称称分别为分别为m,.,21似然估计值。似然估计值。m ,.,21 在在m .,21,需
17、要注意的是,最大似然估计值需要注意的是,最大似然估计值i 依赖于样本值,即依赖于样本值,即 niixxx,.,21mi.,2,1若将上式中样本值若将上式中样本值nxxx,.,21nXXX,.,2,1则则所得的所得的 niiXXX.,21 的最大的最大 称为参数称为参数i 的最大似然估计量。的最大似然估计量。由于由于 niixpL1,lnln而而 Lln与与 L在同一在同一 处达到处达到最大值,最大值,为最大似然估计的必要条件为为最大似然估计的必要条件为 0ln iiiL mi,.,2,1称它为似然方程,其中称它为似然方程,其中 m ,.,21(6.2)因此,因此,求最大似然估计量的一般步骤为求
18、最大似然估计量的一般步骤为:(1)求似然函数求似然函数 L(2)一般地,求出一般地,求出 Lln及似然方程及似然方程 0ln iL mi,.,2,1(3)解似然方程得到最大似然估计值解似然方程得到最大似然估计值 niixxx,.,21 mi,.,2,1(4)最后得到最大似然估计量最后得到最大似然估计量 niiXXX,.,21 mi,.,2,1.,),1(21的最大似然估计量的最大似然估计量求求个样本个样本的一的一是来自是来自设设pXXXXpBXn,2121一个样本值一个样本值的的为相应于样本为相应于样本设设nnXXXxxx解解1,0,)1(1 xppxXPXxx的分布律为的分布律为似然函数似然
19、函数iixnixpppL 11)1()(,)1(11 niiniixnxpp例例1 1),1ln(ln)(ln11pxnpxpLniinii ,01)(lndd11 pxnpxpLpniinii令令的最大似然估计值的最大似然估计值解得解得 p.11xxnpnii 的最大似然估计量为的最大似然估计量为p.11XXnpnii 这一估计量与矩估计量是相同的这一估计量与矩估计量是相同的.,),(22122的最大似然估计量的最大似然估计量和和求求的一个样本值的一个样本值是来自是来自为未知参数为未知参数设总体设总体 XxxxNXn解解的概率密度为的概率密度为X,),;()(222221 xexpX 的的似
20、然函数为似然函数为,21),(222)(12 ixnieL例例2,)(21ln2)2ln(2),(ln12222 niixnnL 0),(ln0),(ln222 LL令令,0112 niinx ,0)()(21212222 niixn 解得解得由由0112 niinx ,11xxnnii 解得解得由由0)()(21212222 niixn ,)(1212xxnnii 为为的最大似然估计量分别的最大似然估计量分别和和故故2 ,X .)(1212XXnnii 它们与相应的矩它们与相应的矩估计量相同估计量相同.用上述求导方法求参数的最大似然估计用上述求导方法求参数的最大似然估计有时行不通,这时要用极
21、大似然原则来有时行不通,这时要用极大似然原则来求求.说明:说明:三、小结两种求点估计的方法两种求点估计的方法:矩估计法矩估计法最大似然估计法最大似然估计法 在统计问题中往往先使用最大似然估计法在统计问题中往往先使用最大似然估计法,在最大似然估计法使用不方便时在最大似然估计法使用不方便时,再用矩估计法再用矩估计法.);();,()(niinxpxxxLL121似然函数似然函数第5.2节 估计量的评价标准一、问题的提出一、问题的提出二、无偏估计二、无偏估计三、最小方差无偏估计三、最小方差无偏估计四、相合估计四、相合估计五、小结五、小结一、问题的提出 从前一节可以看到从前一节可以看到,对于同一个参数
22、对于同一个参数,用不用不同的估计方法求出的估计量可能不相同同的估计方法求出的估计量可能不相同,那么那那么那一个估计量好?好坏的标准是什么一个估计量好?好坏的标准是什么?下面介绍几个常用标准下面介绍几个常用标准.二、无偏估计的一个样本,的一个样本,为总体为总体若若XXXXn,21 ,的的分分布布中中的的待待估估参参数数是是包包含含在在总总体体 X )(的的取取值值范范围围是是 .,)(的无偏估计量是则称有且对于任意存在的数学期望若估计量定义,)()(,.EEXXXn2126无偏估计的实际意义无偏估计的实际意义:无系统误差无系统误差.无偏性是对估计量的一个常见而重要的要求无偏性是对估计量的一个常见
23、而重要的要求.1,)1()(121的的无无偏偏估估计计阶阶总总体体矩矩是是阶阶样样本本矩矩总总体体服服从从什什么么分分布布论论的的一一个个样样本本,试试证证明明不不是是又又设设存存在在阶阶矩矩的的设设总总体体knikiknkkkXnAkXXXXkXEkX 证证同分布,同分布,与与因为因为XXXXn,21)()(kkiXEXE 故有故有.,2,1,nik nikikXEnAE1)(1)(即即.k 例例1.的无偏估计的无偏估计阶总体矩阶总体矩是是阶样本矩阶样本矩故故kkkAk 特别地特别地:.)(1估估计计量量的的无无偏偏的的数数学学期期望望总总是是总总体体 XEXX 不论总体不论总体 X 服从什
24、么分布服从什么分布,只要它的数学期望存在只要它的数学期望存在,).()(1 ,0 ,122222即不是无偏估计即不是无偏估计有偏的有偏的是是的估计量的估计量则则均为未知均为未知若若都存在的总体都存在的总体方差方差对于均值对于均值 niiXXn 证证 niiXXn12221,22XA 22)(AE因为因为,22 22)()()(XEXDXE 又因为又因为,22 n)()(222XAEE 所以所以)()(22XEAE 例例2,122 nn.2是有偏的是有偏的所以所以.,1 2偏的偏的所得到的估计量就是无所得到的估计量就是无乘乘若以若以 nn(这种方法称为这种方法称为无偏化无偏化).)(11222
25、EnnnnE221*nSnn 因为,)(1112 niiXXn,2的无偏估计是即2*nS.2的估计量作故通常取2*nS.0,1/的的无无偏偏估估计计都都是是和和的的样样本本,试试证证是是来来自自总总体体又又设设其其中中参参数数其其它它度度概概率率密密的的指指数数分分布布服服从从参参数数为为设设总总体体 ),min(,00,1);(21)1(21nnxXXXnnXXXXXXxexpX证证)(XE因为因为,)(XE.的无偏估计量的无偏估计量是是所以所以 X例例4,的指数分布的指数分布服从参数为服从参数为而而 nXXXXn),min(21)1(其它概率密度,);(min00 xenxpnx,)()(
26、nXE 1 故知,)()(1nXE.的无偏估计量也是所以)(1nX 由以上两例可知,同一个参数可以有不同的无偏估计量.无偏性虽然是评价估计量的一个重无偏性虽然是评价估计量的一个重要标准要标准,而且在许多场合是合理的而且在许多场合是合理的,必要必要的。然而,有时一个参数的无偏估计可的。然而,有时一个参数的无偏估计可能不存在。能不存在。三、最小方差无偏估计 由于方差是随机变量取值与其数学期望的偏离由于方差是随机变量取值与其数学期望的偏离程度程度,所以无偏估计以方差小者为好所以无偏估计以方差小者为好.(,)()(21212211有效有效较较则称则称若有若有的无偏估计量的无偏估计量都是都是与与设设定义
27、定义 ),(),3.62121DDXXXXXXnn说明说明.),()()(,MVUEDD缩写为量的最小方差无偏估计是则称都有的任意无偏估计量使得对于的一个无偏估计量如果存在000 最小方差无偏估计是一种最优估计.定义定义四、相合估计四、相合估计有时候我们不仅要求估计量有较小的方差,还有时候我们不仅要求估计量有较小的方差,还希望当样本容量希望当样本容量n充分大时,估计量能在某种充分大时,估计量能在某种意义下收敛于被估计参数,这就是所谓相合性意义下收敛于被估计参数,这就是所谓相合性(或一致性)概念。(或一致性)概念。定义定义 设设 是未知参数是未知参数 估计序列,如果估计序列,如果 依概率收敛于依
28、概率收敛于 ,即对任,即对任 ,有,有 nnnXXX,.,21 n01|lim nnP0|lim nnP或或则则 称是称是 的相合估计(量)(或一致估量)。的相合估计(量)(或一致估量)。n例例 若总体若总体 的的 和和 存在存在,则样则样本均值本均值 是总体均值的相合估计是总体均值的相合估计.X)(XE)(XDX解解:)()(XEXE 0)(lim)(lim nXDXDnn一般地一般地,样本的样本的 阶原点矩阶原点矩 是总体是总体 的的 阶原点矩阶原点矩 的相合估计的相合估计.由此可见由此可见,矩矩估计往往是相合估计估计往往是相合估计.k nikikXnA11Xk)(kXE .1112122
29、122*估估计计量量的的相相合合都都是是总总体体方方差差方方差差及及样样本本修修正正样样本本方方差差试试证证 niinniinXXnSXXnS证明证明例 niinXXnS122)(1 niiiXXXXn122)2(1 niiXXn1221,22XA )(2是是样样本本二二阶阶原原点点矩矩A由大数定律知由大数定律知,)(12122XEXnAnii依概率收敛于依概率收敛于 ,)(11XEXnXnii依概率收敛于依概率收敛于 222XASn 故 )()(22XEXE 依概率收敛于依概率收敛于,2 .2的相合估计量是所以2nS ,11lim nnn又又 .22的相合估计量也是所以21nnSnnS *六
30、、小结估计量的评选的三个标准估计量的评选的三个标准 无偏估计无偏估计最小方差无偏估计最小方差无偏估计相合估计相合估计 相合性是对估计量的一个基本要求相合性是对估计量的一个基本要求,不具备不具备相合性的估计量是不予以考虑的相合性的估计量是不予以考虑的.由最大似然估计法得到的估计量由最大似然估计法得到的估计量,在一定条在一定条件下也具有相合性件下也具有相合性.估计量的相合性只有当样本估计量的相合性只有当样本容量相当大时容量相当大时,才能显示出优越性才能显示出优越性,这在实际中这在实际中往往难以做到往往难以做到,因此因此,在工程中往往使用无偏性和在工程中往往使用无偏性和有效性这两个标准有效性这两个标
31、准.第5.3节 参数的区间估计一、区间估计基本概念一、区间估计基本概念二、正态总体均值与方差的区间估计二、正态总体均值与方差的区间估计三、小结三、小结 引言引言 前面,我们讨论了参数点估计前面,我们讨论了参数点估计.它它是用样本算得的一个值去估计未知参数是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误近似值,它没有反映出这个近似值的误差范围,使用起来把握不大差范围,使用起来把握不大.区间估计区间估计正好弥补了点估计的这个缺陷正好弥补了点估计的这个缺陷.一、区间估计基本概念1.置信区间的定义置信区间的定义(
32、6.7)(6.7),11),(),(,)10(,);(212122211121 PXXXXXXXXXxFXnnn满足满足和和确定的两个统计量确定的两个统计量若由样本若由样本对于给定值对于给定值数数含有一个未知参含有一个未知参的分布函数的分布函数设总体设总体.1 ,1 ,1,2121为置信度为置信度的置信下限和置信上限的置信下限和置信上限的双侧置信区间的双侧置信区间分别称为置信度为分别称为置信度为和和间间的置信区的置信区的置信度为的置信度为是是则称随机区间则称随机区间 关于定义的说明关于定义的说明.,21是是随随机机的的而而区区间间没没有有随随机机性性但但它它是是一一个个常常数数虽虽然然未未知知
33、被被估估计计的的参参数数 :1的本质是的本质是因此定义中以下表达式因此定义中以下表达式 21P.,2121 11的的概概率率落落入入随随机机区区间间以以而而不不能能说说参参数数的的真真值值的的概概率率包包含含着着参参数数以以随随机机区区间间例如例如 ,1000 0.01,次次反复抽样反复抽样若若 .10 1000 个个真真值值的的约约为为个个区区间间中中不不包包含含则则得得到到的的 一旦有了样本,就把一旦有了样本,就把 估计在区间估计在区间,21 内内.这里有两个要求这里有两个要求:由定义可见,由定义可见,11 对参数对参数 作区间估计,就是要设法找出作区间估计,就是要设法找出两个只依赖于样本
34、的界限两个只依赖于样本的界限(构造统计量构造统计量)22 )(21 (X1,Xn)(X1,Xn)2.估计的精度要尽可能的高估计的精度要尽可能的高.如要求区间如要求区间12 长度长度 尽可能短,或能体现该要求的其尽可能短,或能体现该要求的其它准则它准则.,21 1.要求要求 以很大的可能被包含在区间以很大的可能被包含在区间 21 P内,就是说,概率内,就是说,概率 要尽可能大要尽可能大.即要求估计尽量可靠即要求估计尽量可靠.可靠度与精度是一对矛盾,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下一般是在保证可靠度的条件下尽可能提高精度尽可能提高精度.2.求置信区间的一般步骤求置信区间的一般步骤
35、(共共3步步).)(,);,(:,)1(2121 包包括括数数且且不不依依赖赖于于任任何何未未知知参参的的分分布布已已知知并并且且其其中中仅仅包包含含待待估估参参数数的的函函数数寻寻求求一一个个样样本本ZXXXZZXXXnn.1);,(,)2(21 bXXXZaPban使使决决定定出出两两个个常常数数对对于于给给定定的的置置信信度度,1 .,),(,),(,);,()(11的置信区间的置信区间的一个置信度为的一个置信度为就是就是那么那么都是统计量都是统计量其中其中不等式不等式得到等价的得到等价的若能从若能从 13212122211221nnnXXXXXXbXXXZa.,1,区间估计精度降低区间
36、估计精度降低可信程度增大可信程度增大长度增大长度增大置信区间置信区间增大增大置信度置信度固定固定样本容量样本容量 n.,1区区间间估估计计精精度度提提高高可可信信程程度度不不变变长长度度减减小小置置信信区区间间增增大大样样本本容容量量固固定定置置信信度度n 单击图形播放单击图形播放/暂停暂停ESCESC键退出键退出单击图形播放单击图形播放/暂停暂停ESCESC键退出键退出.,12221修正样本方差分别是样本均值和的样本总体为并设设给定置信度为*,),(,nnSXNXXX 二、正态总体均值与方差的区间估计),(2 N ,)1(2为为已已知知 1 的置信区间的置信区间的一个置信度为的一个置信度为
37、.unX 2/的置信区间的置信区间均值均值 1.I 单个总体单个总体的情况的情况 ,的无偏估计的无偏估计是是因为因为 X),1,0(/NnXU 且且 ,)1,0(/数的数的是不依赖于任何未知参是不依赖于任何未知参NnX 推导过程如下推导过程如下:,/12unXP,/122unXunXP即即 分位点的定义知分位点的定义知由标准正态分布的上由标准正态分布的上.,/221unXunX的置信区间的置信区间的一个置信度为的一个置信度为于是得于是得这样的置信区间常写成这样的置信区间常写成.2 /unX其置信区间的长度为其置信区间的长度为.22/un 包糖机某日开工包了包糖机某日开工包了1212包糖包糖,称
38、得重量称得重量(单单位位:克克)分别为分别为506,500,495,488,504,486,505,506,500,495,488,504,486,505,513,521,520,512,485.513,521,520,512,485.假设重量服从正态分布假设重量服从正态分布,解解,12,10 n,92.502 x计算得计算得,10.0)1(时时当当 0502./uu查表得0.05).0.10(1 10,和和分别取分别取置信区间置信区间的的试求糖包的平均重量试求糖包的平均重量且标准差为且标准差为附表附表2-12-1,95.021 ,645.1例例1 2/unx645.1121092.502 ,
39、67.507 2/unx645.1121092.502 ,17.498 90%的置信区间为的置信区间为的置信度为的置信度为即即.,.6750717498,05.0)2(时时当当 ,975.021 02502./uu 95%的置信区间为的置信区间为的置信度为的置信度为同理可得同理可得.,.5850826497.,1 ;,1 ,置置信信区区间间也也较较小小较较小小时时当当置置信信度度置置信信区区间间也也较较大大较较大大时时当当置置信信度度从从此此例例可可以以看看出出 附表附表2-22-2,96.1查表得查表得 ,)2(2为未知为未知 ,2直接使用此区间不能中含有未知参数由于区间 /unX ,222
40、,*替换可用的无偏估计是但因为nnnSSS 1 的置信区间的置信区间的置信度为的置信度为 .)(/*12ntnSXn推导过程如下推导过程如下:,1)1()1(2/*2/*ntnSXntnSXPnn即即 1 的置信区间的置信区间的置信度为的置信度为于是得于是得 .)(/*12ntnSXn 1 185),(/.*ntnSXn知的推论又根据第五章定理,1)1(/)1(2/*2/ntnSXntPn故故解解 有一大批糖果有一大批糖果,现从中随机地取现从中随机地取16袋袋,称得重称得重量量(克克)如下如下:496509502506496493505514512497510504503499508506设袋
41、装糖果的重量服从正态分布设袋装糖果的重量服从正态分布,试求总体均值试求总体均值,151 0.05,n :)1(分布表可知分布表可知查查 nt)15(025.0t,.,.*2022675503 nsx计算得 .0.95 的置信区间的置信区间的置信度为的置信度为 附表附表3-13-1,1315.2例例2 5%9 的置信区间的置信区间的置信度为的置信度为得得 1315.2162022.675.503.,.15074500即即就是说估计袋装糖果重量的均值在就是说估计袋装糖果重量的均值在500.4克与克与507.1克之间克之间,这个估计的可信程度为这个估计的可信程度为95%.).(61.621315.2
42、162022.6 克克其误差不大于其误差不大于 ,的近似值的近似值为为若依此区间内任一值作若依此区间内任一值作 这个误差的可信度为这个误差的可信度为95%.95%,),(2的置信区间的置信区间的的试求糖包重量试求糖包重量 N解解,12,n未知未知此时此时,92.502 0.05,x,.*3512 ns :)1(分布表可知分布表可知查查 nt)11(025.0t,.)(/*85720121235121 2 ntnsn于是 5%9 的置信区间的置信区间的置信度为的置信度为得得.,.7751007495,201.2附表附表3-23-2例例3(续例续例1)1)如果只假设糖包的重量服从正态分布如果只假设
43、糖包的重量服从正态分布解解).(,1 ,),(,22221LELNXXXn求求的置信区间的长度的置信区间的长度的置信度为的置信度为关于关于是是设随机变量设随机变量为未知参数为未知参数和和其中其中的样本的样本是来自正态总体是来自正态总体设设 ,2未知时未知时当当 ,11 2 )(/*ntnSXn的置信区间为的置信度为 ,12 2)(/*ntnSLn置信区间长度例例4 ,14 2222)(/*ntnSLn nii2*nXXnE(SE 1211)()又 21211XnXnEnii )()(11212XnEXEnnii )()()()(XEXDnXEXDnniii21211 2212211 nnnni
44、,2 ntnSELE 2n )()(/*14222于是)()(*/2214n2SEntn .)1(4222/ntn推导过程如下推导过程如下:,S 22n的无偏估计是因为*),()(*11222 nSnn根据第五章第三节定理根据第五章第三节定理5.8知知 1 2的置信区间的置信区间的置信度为的置信度为方差方差 nSnnSnnn.)()(,)()(/*/*11112212222 .,未知的情况未知的情况只介绍只介绍根据实际需要根据实际需要 2的置信区间的置信区间方差方差 II.1 2的置信区间的置信区间的置信度为的置信度为于是得方差于是得方差 ,1)1()1()1(22/22*22/1 nSnnP
45、n故故 nSnnSnP nn,)()()()(/*/*1111122122222即 nSnnSnnn.)()(,)()(/*/*11112212222 1 的置信区间的置信区间的一个置信度为的一个置信度为标准差标准差 .)(,)(/*/*111122122nSnnSnnn进一步可得进一步可得:注意注意:在密度函数不对称时在密度函数不对称时,2分布分布分布和分布和如如F 习惯上仍取对称的分位点来习惯上仍取对称的分位点来确定置信区间确定置信区间(如图如图).(续例续例2)求例求例2 2中总体标准差中总体标准差 的置信度为的置信度为0.950.95的置信区间的置信区间.解解,151 0.975,21
46、 0.025,2 n :)1(2分布表可知分布表可知查查 n )15(2025.0,.*20226 ns 计算得)15(2975.0 代入公式得标准差的置信区间代入公式得标准差的置信区间.,.609584附表附表4-14-1,488.27,262.6附表附表4-24-2例例52、两个总体 的情况),(),(222211 NN两两总总体体相相互互独独立立的的修修正正样样本本方方差差分分别别是是第第一一、二二个个总总体体总总体体的的样样本本均均值值分分别别是是第第一一、二二个个的的样样本本个个总总体体为为第第二二的的样样本本第第一一个个总总体体为为并并设设给给定定置置信信度度为为.,),(,),(
47、,12*22*1222212112121SSYXNYYYNXXXnn 讨论两个总体讨论两个总体均值差均值差和和方差比方差比的估计问题的估计问题.,)1(2221均为已知均为已知和和 1 21的置信区间的置信区间的一个置信度为的一个置信度为 .nnuYX 2221212/,21的无偏估计的无偏估计分别是分别是因为因为 YX推导过程如下推导过程如下:,21的无偏估计的无偏估计是是所以所以 YX 21的置信区间的置信区间两个总体均值差两个总体均值差 I.,的独立性及的独立性及由由YX,1211 nNX ,2222 nNY ,22212121 nnNYX 可知可知 ,1,0 22212121NnnYX
48、 或或 1 21的置信区间的置信区间的一个置信度为的一个置信度为于是得于是得 .nnuYX 2221212/,)2(2221均为未知均为未知和和 ),50(21则有则有即可即可实用上实用上都很大都很大和和只要只要 nn 1 21的的近近似似置置信信区区间间的的一一个个置置信信度度为为 .nSnSuYX 2221212*/,)3(222221为未知为未知但但 1 21的的置置信信区区间间的的一一个个置置信信度度为为 .11)2(21212/nnSnntYXw.,)()(*2212222112211wwwSSnnSnSnS 其中例例6机床厂某日从两台机床加工的零件中机床厂某日从两台机床加工的零件中
49、,分别抽取分别抽取若干个样品若干个样品,测得零件尺寸分别如下测得零件尺寸分别如下(单位单位:cm):第一台机器第一台机器 6.2,5.7,6.5,6.0,6.3,5.8 5.7,6.0,6.0,5.8,6.0 第二台机器第二台机器 5.6,5.9,5.6,5.7,5.8 6.0,5.5,5.7,5.5 假设两台机器加工的零件尺寸均服从正态分布假设两台机器加工的零件尺寸均服从正态分布,且且方差相等方差相等,试求两机床加工的零件平均尺寸之差的试求两机床加工的零件平均尺寸之差的区间估计区间估计)05.0(解解 用用 X 表示第一台机床加工的零件尺寸表示第一台机床加工的零件尺寸,用用 Y表示第二台机床
50、加工的零件尺寸表示第二台机床加工的零件尺寸,由题设由题设,111n,92n,05.01009.2)18(025.0t64.0)1(2112*111xnxSnnii24.0)1(2212*221ynySnnii2)1()1(212*222*11nnSnSnS经计算,得经计算,得2211.0291124.064.00.6x7.5y0912.011)18(21025.0nnStyx5088.011)18(21025.0nnStyx置信下限置信下限置信上限置信上限故所求故所求 的置信度为的置信度为95%的置信区间为的置信区间为 0.0912,0.5088.21 .,21为未知的情况为未知的情况仅讨论总
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。