1、 引引 言言 上一章,我们介绍了总体、样本、简单随机样本、上一章,我们介绍了总体、样本、简单随机样本、统计量和抽样分布的概念,介绍了统计中常用的三大统计量和抽样分布的概念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理分布,给出了几个重要的抽样分布定理. 它们是进一步它们是进一步学习统计推断的基础学习统计推断的基础.参数估参数估计问题计问题假设检假设检验问题验问题点估计点估计区间估计区间估计统计统计推断推断 的的基本基本问题问题第七章第七章 参数估计参数估计 参数的点估计参数的点估计 点估计的优良性准则点估计的优良性准则 区间估计区间估计 在实际问题中在实际问题中, ,我们根据问题本
2、身的专业知识或以往的经验我们根据问题本身的专业知识或以往的经验或适当的统计方法或适当的统计方法, ,有时可以有时可以判断总体分布的类型判断总体分布的类型. . 总体分布的总体分布的参数往往是未知的参数往往是未知的, ,需要通过样本来估计需要通过样本来估计. .例如例如 (1) (1) 为了研究人们的市场消费行为为了研究人们的市场消费行为, ,我们要先搞清楚人们我们要先搞清楚人们的收入状况的收入状况. . 假设某城市人均年收入假设某城市人均年收入X X N(N( , , 2 2). ). 但参数但参数 和和 2 2 的具的具体值并不知道体值并不知道, ,需要通过样本来估计需要通过样本来估计. .
3、 (2) (2) 假定某城市在单位时间假定某城市在单位时间( (譬如一个月譬如一个月) )内交通事故发生内交通事故发生次数次数 X X P( P( ). ). 参数参数 未知未知, ,需要从样本来估计需要从样本来估计. . 通过样本来估计总体的参数通过样本来估计总体的参数,称为参数估计称为参数估计,它是统计推断它是统计推断的一种重要形式的一种重要形式.参数估计参数估计点估计点估计区间估计区间估计)1 . 0,(2 N(假定身高服从正态分布(假定身高服从正态分布N(,0.12) 设这设这5个数是个数是:1.65 1.67 1.68 1.78 1.69 估计估计 为为1.68,这是这是点估计点估计
4、.这是这是区间估计区间估计.估计估计 在区间在区间 1.57, 1.84 内,内,例如我们要估计某队男生的平均身高例如我们要估计某队男生的平均身高. 现从该总体选取容量为现从该总体选取容量为5的样本,我们的任务的样本,我们的任务是要根据选出的样本(是要根据选出的样本(5个数)求出总体均值个数)求出总体均值 的的估计估计. 而全部信息就由这而全部信息就由这5个数组成个数组成 . 从总体从总体 X 中抽取样本中抽取样本( (X1, X2, , X n ) ) 构造构造合适的合适的统计量统计量 =T( (X1, X2, , X n ) ) 将样本观察值将样本观察值( (x1, x2, , x n )
5、 )代入估计量代入估计量 计算出估计量的观察值计算出估计量的观察值 =T( (x1, x2, , x n ) ) 或构造或构造 1 = T1( (X1, X2, , X n ) ) 和和 2 =T2( (X1, X2, , X n ) ) ( 10, 其中其中 与与 2未知未知, 样本样本(X1, X2, , X n )来自总体来自总体 X,求求 与与 2的的矩估计量。矩估计量。 2 22A X 解解:2222222BXXXXXA )(1111niiniinn XX niin11 2222 )EX(DXEXEX 2 A X2EXEX 无论总体的分布形式如何,总体均值无论总体的分布形式如何,总体
6、均值 和方差和方差2 2的的矩估计量矩估计量分别分别为样本均值和样本二阶中心矩。为样本均值和样本二阶中心矩。 矩法的矩法的优点优点是简单易行是简单易行,并不需要事先知道总并不需要事先知道总体是什么分布体是什么分布 . 缺点缺点是,当总体类型已知时,没有充分利用分是,当总体类型已知时,没有充分利用分布提供的信息布提供的信息 . 一般场合下一般场合下, 矩估计量矩估计量不具有唯一性不具有唯一性 . 其主要原因在于建立矩法方程时,选取哪些总其主要原因在于建立矩法方程时,选取哪些总体矩用相应样本矩代替带有一定的体矩用相应样本矩代替带有一定的随意性随意性 . 1.2 极大似然估计法极大似然估计法极大似然
7、估计极大似然估计作为一种点估计方法最初是由作为一种点估计方法最初是由 德国数学家高斯德国数学家高斯(Gauss)于于1821年提出,英国统计年提出,英国统计 学家费歇尔学家费歇尔(R.A.Fisher)在在1922年作了进一步发展年作了进一步发展 使之成为数理统计中最重要应用最广泛的方法之一使之成为数理统计中最重要应用最广泛的方法之一. GaussFisher 极大似然估计法极大似然估计法是建立在是建立在极大似然极大似然原理原理的的基础上的一个统计方法。基础上的一个统计方法。 极大似然原理的直观想法是:极大似然原理的直观想法是:一次试验就出现一次试验就出现的事件有较大的概率的事件有较大的概率.
8、 即:一个试验如有若干个即:一个试验如有若干个 可能结果可能结果 ,若在一次试验中,结果若在一次试验中,结果 出现出现, AB, , A则认为则认为 出现的概率最大出现的概率最大. A例如例如: 有两外形相同的箱子有两外形相同的箱子,各装各装100个球个球 一箱一箱 99个白球个白球 1 个黑球个黑球 一箱一箱 1 个白球个白球 99个黑球个黑球现从两箱中任取一箱现从两箱中任取一箱, 并从箱中任取一球并从箱中任取一球,结果所取得的球是白球结果所取得的球是白球.问问: 所取的球来自哪一箱?所取的球来自哪一箱?答答: 第一箱第一箱. 假定一个盒中黑球和白球两种球的数目之比假定一个盒中黑球和白球两种
9、球的数目之比 为为 3:1,但不知哪种球多,但不知哪种球多 , 表示从盒中任取一球表示从盒中任取一球 p是黑球的概率,那么是黑球的概率,那么 或或 , 现在有放回地现在有放回地 1/4p 3/4从盒中抽从盒中抽3个球,试根据样本中的黑球数个球,试根据样本中的黑球数 来估计来估计 X参数参数 .p解解随机变量随机变量 ,即,即 3XBp,331xxxP XxC pp 0 1 2 3X, , ,例例1/40 13/42 3xpx, 估计估计 只需在只需在 和和 之间作出选择之间作出选择. p1/4p 3/4p 计算这两种情况下计算这两种情况下 的分布律:的分布律: X的估计的估计 p27/6427
10、/649/641/641/649/6427/6427/643210X3/4p P Xx1/4p P Xx, 根据极大似然原理,根据极大似然原理,应该寻找使事件发生的概率最大的参数值作应该寻找使事件发生的概率最大的参数值作为未知参数的估计值。为未知参数的估计值。1. 1. 似然函数似然函数进行一次具体的抽样之后,进行一次具体的抽样之后, (X1, X2, , X n ) 得到一组观察值得到一组观察值 (x1, x2, , x n )。是一组确定的数,把它们代入上式,则。是一组确定的数,把它们代入上式,则 设总体分布设总体分布(以离散型为例以离散型为例)为为P(X=x)=P(x, 1, 2 , k
11、), ( 1, 2 , k )未知,未知,样本样本(X1, X2, , X n )来自总体来自总体 X,则则样本样本(X1, X2, , X n )的的概率分布函数概率分布函数为:为: 112212121(,)( ,)nnnkikiP Xx XxXxp x 121( ,)nikip x 仅为仅为( 1, 2 , k )的函数。把它记作的函数。把它记作 并称并称12( ,)kL 为参数(为参数( 1, 2 , k )的的似然函数似然函数。12121( ,)( ,)nkikiLp x 进行一次具体的抽样之后,进行一次具体的抽样之后, (X1, X2, , X n ) 得到一组观察值得到一组观察值
12、(x1, x2, , x n )。是一组确定的数,把它们代入上式,则。是一组确定的数,把它们代入上式,则若总体若总体X为为连续性随机变量连续性随机变量,其密度函数为分布为,其密度函数为分布为f(x, 1, 2 , k), ( 1, 2 , k )未知,未知,样本样本(X1, X2, , X n )来自总体来自总体 X,则则样本样本(X1, X2, , X n )的的密度函数密度函数为:为: 121( ,)nikif x 121( ,)nikif x 仅为仅为( 1, 2 , k )的函数。把它记作的函数。把它记作 并称并称12( ,)kL 为参数(为参数( 1, 2 , k )的的似然函数似然
13、函数。12121( ,)( ,)nkikiLf x 可见,可见,似然函数实质上是样本的概率分布或密度函数。似然函数实质上是样本的概率分布或密度函数。2.2.极大似然法极大似然法当给定一组样本值时,当给定一组样本值时,似然函数似然函数L ( 1, 2 , k )为参数为参数( 1, 2 , k )的函数,极大似然估计法的思想就是:的函数,极大似然估计法的思想就是:选择使选择使似然函数似然函数L ( 1, 2 , k )达到最大值的点达到最大值的点12 ( ,)k 作为作为为参数为参数( 1, 2 , k )的估计。的估计。定义定义1.1 若存在样本值若存在样本值 (x1, x2, , x n )
14、的函数的函数1( ,)(1,2, )iinxxik使使似然函数似然函数L ( 1, 2 , k )达到最大值,即达到最大值,即121212(,) ( ,)max( ,)kkkLL 则称则称1( ,)(1,2, )iinxxik为参数为参数 i的的极大似然估计值极大似然估计值;称相应的统计量称相应的统计量1(,)(1,2, )iinXXik为为 i的的极大似然估计量极大似然估计量;极大似然估计值和极大似然估计值和极大似然估计量统称为极大似然估计量统称为极大似然估计。极大似然估计。极极大大似似然然法法的的方方法法称称为为这这种种求求未未知知参参数数 3、极大似然估计(离散型总体)的步骤 属属离离散
15、散型型,其其分分布布列列为为若若总总体体 X ),),;x( pxkk2121( XP。空空间间为为待待估估参参数数,属属于于参参数数的的形形式式为为已已知知, 211的极大似然估计量。的极大似然估计量。求求来自总体来自总体),(,kn , , 的样本 )是( 设XXX ),(k 21L建建立立似似然然函函数数)(1 niki),;x(p121 ; ),x(Plnln)(niki 1212 L取对数:取对数:;ln)(031 L令令;ln02 L;lnk0 L的的极极大大似似然然估估计计值值。解解方方程程组组求求得得k,)( 14为为待待估估参参数数。的的形形式式已已知知,属属连连续续型型,其
16、其概概率率密密度度若若总总体体),(),(),;x(fkkk 212121 X极大似然估计(连续型总体)的步骤 211的极大似然估计量。的极大似然估计量。求求来自总体来自总体),(,kn , , 的样本 )是( 设XXX建建立立似似然然函函数数)(1 ),(k 21L niki),;x(f121 ; ),x(flnln)(niki 1212 L取对数:取对数:;ln)(031 L令令;ln02 L;lnk0 L的的极极大大似似然然估估计计值值。解解方方程程组组求求得得k,)( 14下面举例说明如何求参数的极大似然估计。下面举例说明如何求参数的极大似然估计。未未知知参参数数的的样样本本,是是来来
17、自自设设)p(p),();p,n(m101 XXXBX试求试求参数参数p的极大似然估计量的极大似然估计量 :解解xnxxn)p(pCx 1XP故似然函数为故似然函数为 mixnxxniii)p(pC)p(11L)(lnpL而而例例1:,)p(p)C(miimiiixnmxmixn 1111).pln()xnm(pln)x()Cln(miimiimixni 1111的的分分布布律律为为:X, 0)(ln pdpdL令令.pxnmpxmiimii01 11 即即的的极极大大似似然然估估计计值值解解得得pnxxnmp mii 11 的的极极大大似似然然估估计计量量为为pnXXnmp mii 11 未
18、未知知参参数数的的样样本本,是是来来自自设设)p(p),();p,n(m101 XXXBX试求试求参数参数p的极大似然估计量的极大似然估计量 :解解xnxxn)p(pCx 1XP故似然函数为故似然函数为 mixnxxniii)p(pC)p(11L)(lnpL而而例例1:,)p(p)C(miimiiixnmxmixn 1111).pln()xnm(pln)x()Cln(miimiimixni 1111的的分分布布律律为为:X, 0)(ln pdpdL令令.pxnmpxmiimii01 11 即即的的极极大大似似然然估估计计值值解解得得pnxxnmp mii 11 的的极极大大似似然然估估计计量量
19、为为pnXXnmp mii 11 的的极极大大似似然然估估计计。求求参参数数的的样样本本,是是来来自自设设 XXXPX),();(n1:解解 e!xxxXP故似然函数为故似然函数为 e!x)(niixi1L)(ln L而而例例2: niixnniie )!x(111 ln)x(n)!xln(niinii 111的的分分布布律律为为:X,)(lndd0 L令令.nxnii0 1 即即的的极极大大似似然然估估计计值值解解得得 xxnnii 11 的的极极大大似似然然估估计计量量为为 XXnp nii 11 的的样样本本,是是来来自自为为未未知知参参数数,;设设XNX)X,X,X(,),(n2122
20、 :解解222 221 )x(e),;x(f 似然函数为:似然函数为: ni)x(ie),(12 22221 L例例3:Lln)ln(22 n niix122)(21 )2ln(2 n 2122)(2 2)2( niixne的的概概率率密密度度为为:X的的极极大大似似然然估估计计量量。求求2, 0ln0ln2 LL令令 即即: 0)(1 12 niix0)(212-2142 niixn, 11xxnnii 解得:解得: niixxn122)(1 的极大似然估计量:的极大似然估计量:2 ,212211 1B)(nnniinii XXXX :似似然然函函数数为为 niixne12221 2 22
21、的的一一个个样样本本值值,是是来来自自为为未未知知参参数数,已已知知,;设设XNXnxx,),(122 的的极极大大似似然然估估计计量量。求求2 :解解 nixie12)( 22221),( LLln)ln(22 n niix122)(21 )2ln(2 n 222 221);( )( xexf的的概概率率密密度度为为:X例例4: niixndd12422212ln L,令:令:0ln2 ddL 02121242 niixn 得得似似然然方方程程 niixn1221 解此方程,得解此方程,得 niiXn12221 的的极极大大似似然然估估计计量量为为因因此此似似然然函函数数为为的的密密度度函函
22、数数为为设设总总体体 X解:解: ,11 niinxL niixnL1ln1lnln 其它。其它。, 0, 10,1xxxf 例例5: 021的的极极大大似似然然估估计计。抽抽取取的的一一个个样样本本。试试求求是是从从该该总总体体,未未知知,其其中中 ).,(nXXX ,令:令:0ln dLd得得似似然然方方程程为为, 0ln1 niixn 解得解得,ln1 niixn 的的极极大大似似然然估估计计量量为为因因此此 .ln1 niiXn 似似然然函函数数为为的的密密度度函函数数为为设设总总体体 X解:解: niixneL1 niixlnnLln1 其它。其它。,x,exfx00 例例6: 02
23、1的的极极大大似似然然估估计计。抽抽取取的的一一个个样样本本。试试求求是是从从该该总总体体,未未知知,其其中中 ).,(nXXX ,令:令:0 dLlnd得得似似然然方方程程为为01 niixn 解得解得xxnnii11 的的极极大大似似然然估估计计量量为为因因此此 XXnnii11 极大似然法求估计量的步骤:极大似然法求估计量的步骤:( (一般情况下一般情况下) ):)()1 L构造似然函数构造似然函数,(),x()(nii 1离散型)离散型) PL nii;(),x(f)(1连连续续型型) L);(ln)2 L取对数:取对数:; 0ln)3 ddL令令。的的极极大大似似然然估估计计量量解解
24、似似然然方方程程得得 )4说明:说明:若似然方程(组)无解,或似然函数不可导,若似然方程(组)无解,或似然函数不可导, 此法失效,改用其它方法。此法失效,改用其它方法。能地使用极大似然估计能地使用极大似然估计应用中,我们应当尽可应用中,我们应当尽可计优于矩估计,因而在计优于矩估计,因而在一般来讲,极大似然估一般来讲,极大似然估似似然然函函数数为为上上的的均均匀匀分分布布,服服从从设设总总体体21 X解:解: n)(,L12211 例例7: , 212121的的极极大大似似然然估估计计。抽抽取取的的一一个个样样本本。试试求求是是从从该该总总体体未未知知,其其中中 ).,(,nXXX因因此此极极大
25、大似似然然估估计计量量为为 12 lnnLln01 dLlnd令:令:02 dLlnd012 )(n 012 )(n 方程组无解方程组无解 1x2xixnx1 2 211 x221 x21 nx)x,x,xmin(n211 )x,x,xmax(n212 )X,X,Xmin(n211 )X,X,Xmax(n212 点估计点估计矩估计法矩估计法基本步骤基本步骤极大似然估计法极大似然估计法基本步骤基本步骤 第二节第二节 点估计的优良性准则点估计的优良性准则 我们知道,一个未知参数的估计量可能不止我们知道,一个未知参数的估计量可能不止一个。究竟采用哪个为好呢?这就涉及到用什么一个。究竟采用哪个为好呢?
26、这就涉及到用什么标准来评价估计量的问题。我们介绍三个常用的标准来评价估计量的问题。我们介绍三个常用的标准:标准: 1)无偏性;)无偏性; 2)有效性;)有效性; 3)一致性。)一致性。2.1 无偏性无偏性 根据样本推得的估计值与真值可能不同,根据样本推得的估计值与真值可能不同, 然而,如果有一系列然而,如果有一系列抽样构成各个估计,很合理地会要求这些估计的期望值与未知参数抽样构成各个估计,很合理地会要求这些估计的期望值与未知参数的真值相等,它的直观意义是样本估计量的数值在参数的真值周围的真值相等,它的直观意义是样本估计量的数值在参数的真值周围摆动,而无误差,这就是估计量的无偏性。摆动,而无误差
27、,这就是估计量的无偏性。 定义定义2.1:设总体:设总体X的分布中含有未知参数的分布中含有未知参数 , 为参数为参数空间,样本空间,样本(X1, X2, , X n)来自来自 X, ,若,若的估计量 为参数 ,E无偏估计量成立,则称 为参数 的,简称无偏估计。或称估计量 具有无偏性。否则,有偏称 为参数 的估计量。lim,nE若则渐近无称 是 的偏估计。 例例1:设总体:设总体X 有期望有期望 EX= 与方差与方差 DX= 2, 与与 2 都未知。都未知。 样本样本(X1, X2, , X n)来自来自 X,试证:,试证: (1) 样本均值样本均值 是总体均值是总体均值 的无偏估计的无偏估计;
28、 (2) 样本方差样本方差S2是是 2的无偏估计;的无偏估计; (3) 样本标准差样本标准差S不是标准差不是标准差 的无偏估计;的无偏估计; (4) B2不是不是 2的无偏估计。的无偏估计。XE X 证证: 由定理知:由定理知: (1) (2) ES2= 2 这个结论与总体的分布类型没有关系。只要总体期望和方差存在这个结论与总体的分布类型没有关系。只要总体期望和方差存在, 样本均值样本均值总总是总体期望的无偏估计,是总体期望的无偏估计,样本方差总是总体方差的无偏估计样本方差总是总体方差的无偏估计 (3) 由由DS=ES2 - (ES)2= 2 - (ES)2,得,得 2ES=s -DS所以,样
29、本标准差所以,样本标准差S不是标准差不是标准差 的无偏估计。的无偏估计。2222SXXXXBnnnnnnniinii1)(111)(111 (4) 因因 222 nnnn11 ESEB 所所以以所以,二阶样本中心矩所以,二阶样本中心矩B2不是不是总体总体方差方差 2的无偏估计。因此,通常把的无偏估计。因此,通常把B2的分母修正为的分母修正为n-1获得样本方差获得样本方差S2作为总体作为总体方差方差 2的估计。的估计。 例例2:设总体:设总体X 的期望值的期望值 EX= 未知,方差未知,方差 DX有限有限, 样本样本(X1, X2, , X n)来自来自 X,试证:,试证:1122nn= a X
30、 +a X + L+a X121,1.nniiaaaa是 的无偏估计,其中为常数,且满足111 ()nnniiiiiiiiaaa证明:EEXEX1=1.niiaE 因为,所以=即是 的无偏估计.11=1nniiiiiaa X时,=称为 的线性无注意:偏估计. 所以,未知参数所以,未知参数 的无偏估计量往往有许多个,的无偏估计量往往有许多个, 在这些估计量中,当然是取值对于在这些估计量中,当然是取值对于 的离散程度越小的的离散程度越小的 越好,即方差越小的越好。越好,即方差越小的越好。2.2 无偏估计的有效性无偏估计的有效性 定义定义2.2:设总体:设总体X的分布中含有未知参数的分布中含有未知参
31、数 , 为参数为参数空间,样本空间,样本(X1, X2, , X n)来自来自 X,如如果果的的无无偏偏估估计计都都是是参参数数和和设设, 2112 DD且它们的方差都存在.若对一切有的的最最小小方方差差无无偏偏估估计计。为为则则称称方方差差达达到到最最小小的的的的一一切切无无偏偏估估计计中中如如果果在在有有效效比比则则称称 21,。有或称为 的效估计. 解解:DX1=DX= 2 n2 XDnnaaaXXX1122 例例:设总体:设总体X 有期望有期望 EX= 与方差与方差 DX= 2, 与与 2 都未知。都未知。 样本样本(X1, X2, , X n)来自来自 X,比较,比较 的两个的两个无
32、偏估计无偏估计X1 和和 X 的有的有 效性。效性。有有效效。比比所所以以 1XX 例例:条件同上,试证:条件同上,试证X在在 的所有线性的所有线性无偏估计中方差最小。无偏估计中方差最小。 解解:所谓线性估计是指:所谓线性估计是指 为样本的线性函数,为样本的线性函数,121 ,1nniiaaaa其中为常数,且满足222111()nnniiiiiiiiaaaDDXDX21 n XD niiniininiianaa1212121)(1()(1211niianDDX1i =1,2, ).iann特别地,当= (时,X,nPnn : 若为 参 数的 估 计 量 如 果对 于 一 切, 当时,定定 义义
33、 2 2 . .3 3n一则 称是的致 估 计 。2.3 一致性(相合性)一致性(相合性),1 EXXXX的的样样本本,是是总总体体若若n,有,有对于任意给定的对于任意给定的0 01lim1 niinnXP的的一一致致估估计计量量。是是总总体体期期望望因因此此,样样本本均均值值 X由由辛辛钦钦大大数数定定律律,知知例:例:样本均值样本均值 是总体均值是总体均值的一致估计值的一致估计值. x 结论结论1 1: 2s2样本方差样本方差 是总体方差是总体方差 的一致估计值的一致估计值. 结论结论2 2:要求:要求:当样本容量当样本容量 n 无限增大时,估计量能在某种意义下充分接无限增大时,估计量能在
34、某种意义下充分接近被估计的参数。近被估计的参数。 引言引言 前面,我们讨论了参数点估计前面,我们讨论了参数点估计. 它是用样本算它是用样本算得的一个值去估计未知参数得的一个值去估计未知参数. 但是,点估计值仅仅但是,点估计值仅仅是未知参数的一个是未知参数的一个近似值近似值,它没有反映出这个近似,它没有反映出这个近似值的值的误差范围误差范围,使用起来把握不大,使用起来把握不大. 区间估计区间估计正好正好弥补了点估计的这个缺陷弥补了点估计的这个缺陷 . 6.3 6.3 区间估计区间估计 譬如,在估计湖中鱼数的问题中,若我们譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数根据一个实际样
35、本,得到鱼数 N 的极大似然估的极大似然估计为计为1000条条. 若我们能给出一个区间,在此区间内我们若我们能给出一个区间,在此区间内我们合理地相信合理地相信 N 的真值位于其中的真值位于其中. 这样对鱼数的这样对鱼数的估计就有把握多了估计就有把握多了. 实际上,实际上,N的真值可能大于的真值可能大于1000条,也可条,也可能小于能小于1000条条.也就是说,我们希望确定一个区间,使我们能也就是说,我们希望确定一个区间,使我们能以比较高的以比较高的可靠程度可靠程度相信它包含真参数值相信它包含真参数值.湖中鱼数的真值湖中鱼数的真值 这里所说的这里所说的“可靠程度可靠程度”是用概率来度量的是用概率
36、来度量的 ,称为置信度或置信水平称为置信度或置信水平. 习惯上把置信水平记作习惯上把置信水平记作 1 ,这里这里 是一个是一个 很小的正数很小的正数.,即即的的概概率率为为给给定定值值包包含含,使使得得区区间间,与与构构造造两两个个统统计计量量的的样样本本,用用来来自自总总体体的的未未知知参参数数对对于于总总体体)10(1),(),(),(),( 21212211 nnnXXXXXXXXXXX212121121 ,1 则称为 置信系数 或置信度 ,随机区间称为 的置信系数为的 置信区间 。 121)(P 1)0 6.5,如如果果对对于于给给定定的的定定义义 一、区间估计的基本概念一、区间估计的
37、基本概念 21 和分别称为置信下限和置信上限分别称为置信下限和置信上限. 的可靠性。的可靠性。置信区间表示估计结果的精确性,置信区间表示估计结果的精确性,而置信概率则表示这一结果而置信概率则表示这一结果通常,置信系数(可靠性)采用通常,置信系数(可靠性)采用 0.95, 0.99, 0.90 等值。等值。义义。意意区区分分不不同同场场合合下下的的含含也也称称为为置置信信区区间间,应应注注习习惯惯上上,常常将将 ),(2),(1(nxxxnxxx2121 12121212 ,),nx xx 因为和是统计量,所以区间是一个随机区间,一旦有了样本值(区间的端点也随之确定,它是一个普通的区间,称为置信
38、区间的观测值,也称为置信区间,因此未知参数未知参数的置信区间,称为参数的置信区间,称为参数的的区间估计区间估计。对于已给的置信概率对于已给的置信概率1-1-,根据样本观测值来确定根据样本观测值来确定 一旦有了样本,就把一旦有了样本,就把 估计在区间估计在区间 ,21 内内.这里有两个要求这里有两个要求:11 对参数对参数 作区间估计,就是要设法找出作区间估计,就是要设法找出两个只依赖于样本的界限两个只依赖于样本的界限(构造统计量构造统计量) 22 )(21 (X1,Xn)(X1,Xn)可见,可见,区间估计区间估计: : 估计 为端点的区间计 估 个,212121)(,量量找找两两 1.1.可靠
39、度:可靠度:要求区间以很大的可能性包含要求区间以很大的可能性包含 即:即:要要尽尽可可能能大大概概率率)(21 P2.2.精度:精度:估计的精度要尽可能高估计的精度要尽可能高, , 即即 区间的长度要尽可能小区间的长度要尽可能小, , 或或 能体现此要求的其它准则。能体现此要求的其它准则。在保证可靠度的条件下,尽量提高精度在保证可靠度的条件下,尽量提高精度 可靠度和精度要统筹兼顾可靠度和精度要统筹兼顾 在求置信区间时,要查表求分位点在求置信区间时,要查表求分位点.二、置信区间的求法二、置信区间的求法教材已经给出了概率分布的上侧分位数(分位点)教材已经给出了概率分布的上侧分位数(分位点)的定义,
40、为便于应用,这里我们再简要介绍一下的定义,为便于应用,这里我们再简要介绍一下. 设设0 1, 对随机变量对随机变量X,称满足,称满足 )(xXP的点的点 为为X的概率分布的上的概率分布的上 分位数分位数. x 标准正态分布标准正态分布的临界值(的临界值( 分位点)分位点) ,称称满满足足条条件件:对对于于给给定定的的若若)(),(NX1010 为为标标准准正正态态分分布布的的的的点点 u uP X。分分位位点点上上 O u y y = = (x)u1- 02509619610250.).X(P.u. 例:例: 10)u( 2分布的临界值(分布的临界值( 分位点)分位点) ,称称满满足足条条件件
41、:对对于于给给定定的的)10( 分分布布的的为为的的点点)()(nn22 2 )(22nP,可可查查表表获获得得。自自由由度度和和的的值值依依赖赖于于nn 2 )(。分分位位点点上上 例:例: 950943102.)(P )(.102950 943.,称称满满足足条条件件:对对于于给给定定的的)10( 分分位位点点。上上 :由由概概率率密密度度的的对对称称性性知知 )(nt )(1nt )(nttP)()(1ntnt t 分布的临界值(分布的临界值( 分位点)分位点) 分分布布的的为为的的点点 tnt)( 例:例: )(t.8101. 3971039718.)( tP ),()(2110nnF
42、FP,称称满满足足条条件件:对对于于给给定定的的分分布布的的为为的的点点FF),(21nn ),(21nnF 分分位位点点。上上 例:例: 642158050.),(. F050642. F(8,15)P枢轴变量法求置信区间枢轴变量法求置信区间(1) 找与找与 有关的统计量有关的统计量 T (T (一般一般T T是是 的点估计的点估计) ) (2)找一个函数找一个函数 I=I(T, I=I(T, ), I 的分布的分布F与与 无关无关( ( I I( (T,T, )为枢轴变量为枢轴变量) )(3)对给定的对给定的 1- ,找到,找到F 的上的上分位点分位点 和和2 21 1),( 221TIP
43、即估计估计置信系数置信系数解出解出的区间为的即为这时,由 1 , ),( (4)2121221TI三、正态总体未知参数的区间估计(枢轴变量法)三、正态总体未知参数的区间估计(枢轴变量法) 1、均值、均值 的的区间估计区间估计 , 2/2/ unun XX(1) 2已知已知 设总体设总体X N( , 2),样本,样本 (X1, X2, , Xn) 来自总体来自总体X 。所以所以 的置信系数为的置信系数为1- 的置信区间:的置信区间: 2120 )u(/枢轴变量为枢轴变量为) 1 , 0(NnU X -1) ( 2/2/ uuPX而而O /2U /2 /2-U /2(2) 2未知未知所以所以 的置
44、信系数为的置信系数为1- 的置信区间:的置信区间: 1)-(n , 1)-(n22 tntnSXSX 枢轴变量为枢轴变量为) 1( ntnSt X2)1() 1(2 ntntP -1) ) 1() 1( 2/2/ ntSntPX而而2/2(1)tn/2(1)tn例例1:从从大批灯泡中随机地抽取大批灯泡中随机地抽取5个个,测得寿命为测得寿命为(单位单位: 小时小时):1650, 1700, 1680, 1820, 1800,假定灯泡寿命,假定灯泡寿命XN( , 9),求这批灯泡平均寿命的区间估计求这批灯泡平均寿命的区间估计 ( = 0.05)。 解:解:方差方差 2=9已知,利用公式:已知,利用
45、公式: , 2/2/ unun XX由由 = 0.05,查标准正态分布表得,查标准正态分布表得 u0.025=1.96。 因因 n=5, =3,x = 1730,所以,得所以,得 的区间估计为的区间估计为 1727.37 , 1732.63。P(1727.37 1732.63)=0.95注注97500250102500.)u(. u,u.0250025053 53 XX例例2 :从从大批灯泡中随机地抽取大批灯泡中随机地抽取5个个,测得寿命为测得寿命为(单位单位: 小时小时):1650, 1700, 1680, 1820, 1800,假定灯泡寿命,假定灯泡寿命XN( , 2),求这批灯泡平均寿命
46、的区间估计求这批灯泡平均寿命的区间估计 ( = 0.05)。 1)-(n , 1)-(n22 tntnSXSX 由由n = 5,查,查 t 分布表得分布表得 t0.025(4)=2.776。 x = 1730,S = 75.50。所以,得所以,得 的区间估计为的区间估计为 1636.27 , 1823.73。解:解:方差方差 2未知,利用公式:未知,利用公式: nii)X(nS12211Xt,t.(4)5 (4)502500250SXSX 2、方差的、方差的区间估计区间估计 (1) 已知已知)()-(12122nInii X 2 的置信系数为的置信系数为1- 的区间估计的区间估计为:为:枢轴变
47、量为枢轴变量为 )()-( ,)()-(221122212nnniinii XX 1)()-(1)( 22122221nnPniiX而而 /22/221/2(2) 未知未知 2 的置信系数为的置信系数为1- 的区间估计的区间估计为:为: ) 1() 1( ,) 1() 1(2212222nnnn SS nii)X(Sn1221X枢轴变量为枢轴变量为)1()-(1)1(212222 nXSnInii X 1)1() 1() 1( 2222221nSnnP而而/22/221/2查查 2 分布表得分布表得 20.025(5)=12.833, 20.975(5)=0.831。所以,得方差的区间估计为所
48、以,得方差的区间估计为 0.055 , 0.842。 例例3:对某塔的高度进行了对某塔的高度进行了 5 次测量,数据(单位:米)如下:次测量,数据(单位:米)如下:90.5, 90.4, 89.7, 89.6, 90.2,设测量数据服从正态分布,设测量数据服从正态分布,求方差的区间估计(求方差的区间估计( = 0.05)。 (1) 假设塔的真实高度为假设塔的真实高度为 90米。米。 (2) 假设塔的真实高度未知。假设塔的真实高度未知。解:解:(1) 利用公式:利用公式: 计算得:计算得: )()-( ,)()-(221122212nnniinii XX 5120.790ii)(X (2) 利用
49、公式:利用公式: ) 1() 1( ,) 1() 1(2212222nnnn SS计算得:计算得: nii.)X(Sn12266801X 查查 2分布表得分布表得 20.025(4)=11.143, 20.975(4)=0.484。 所以,得方差的区间估计为所以,得方差的区间估计为 0.060 , 1.380。1、均值、均值差差 1 - 2的的区间估计区间估计 (1) 12 , , 22都都已知已知 令枢轴变量为令枢轴变量为6.3.36.3.3、两个正态总体均值差和方差比的区间估计、两个正态总体均值差和方差比的区间估计2212,Y,S ,SX 设样本设样本(X1,X2, ,Xn1) 来自正态总
50、体来自正态总体XN( 1 , 12), (Y1, Y2, , Y n2) 来自正态总体来自正态总体YN( 2 , 22),并假定,并假定X 与与 Y 相互独立相互独立 分别是两样本的均值和方差分别是两样本的均值和方差,1- 是是给定的置信系数给定的置信系数X YX Y22221212/2/21212(),() nnnnuu 所以所以 1 - 2的置信系数为的置信系数为1- 的置信区间:的置信区间: 2120 )u(/X Y12/2/2221212() () ( ) 1-nnP uu 而而O /2U /2 /2-U /2XYUN12221212()() (0,1)nn 解:解:由由 = 0.1,