1、第第8章章 参数估计参数估计n 点估计点估计n 点估计的评选标准点估计的评选标准n 参数的区间估计参数的区间估计 在实际问题中,对于一个总体往往是仅知其分布的类型,而其中所含的一个或几个参数的值却是未知的,因此只有在确定这些参数后,才能通过其分布来计算概率,如何确定这些参数的数值呢?这就是统计推断中的“参数估计”问题。本章只研究总体分布是连续型或离散型两种情形。为简便起见,我们引入一个对这两种情形通用的概念:概率函数概率函数。我们称随机变量的概率函数为f(x)是指:在连续型情形,在连续型情形,f(x)是是的密度函数。的密度函数。在离散型情形,在离散型情形,f(x)是是=x的的概率。概率。定义定
2、义 构造一个统计量 作定值的估计称为参数的点估计。对参数8.1 点估计点估计),(),(2121nnxxx点估计值点估计量点估计)18(,21mkkkgEmk,2,1阶矩的前求总体mFm,21(1)列出估计式。)列出估计式。步骤为步骤为:mkmkk,2,1,21)得即解方程组(18(2)求解关于估计量的方程组。)求解关于估计量的方程组。mkMMMmkk,2,1,21的矩估计为:得阶原点矩,代替总体的阶原点矩用样本的knikikknMk11(3)求出矩估计。)求出矩估计。解解为:,按照上述矩估计步骤记21,DE例例1.的矩估计和方差的数学期望求总体DE21222211EDEE212211解上述方
3、程组得:(1)列出估计式。)列出估计式。(2)求解关于估计量的方程组。)求解关于估计量的方程组。,得、分别代替总体的矩、用样本矩2121MM11M的矩估计为:和21212122212211SnnMMniinii(3)求出矩估计。)求出矩估计。注意:只要总体的期望和方差存在,此结果对任何注意:只要总体的期望和方差存在,此结果对任何总体均适用。总体均适用。2SD E即解解例例2,2N服从量误差已知一批元件的长度测中抽取容为未知参数,现从总体其中2,的估计值。求出的样本值:量为2,12.0,82.0,45.0,30.0,85.0,20.16。和来估计和,分别用由例221S 16.096.06112.
4、082.045.030.085.020.16122222222222222498.099.26128.098.061.014.069.004.16116.012.016.082.016.045.016.030.016.085.016.020.161S为偶若居中的一个数们按大小次序排列,取n(定义定义 knknkkk2,2112,11若若即即的一个样本,将它为总体n,21为,称记为平均值数时,则取居中两数的)样本中位数。样本中位数。称为样本极差。最大值与最小值之差RnnR,min,max2121排列而都是由样本按大小次序与因为R即即为顺序统计量。确定的,所以它们都称例例3 有一个样本为 1 45
5、3,1 650,1 367,1 502。和样本极差求样本中位数R283136716505.14771502145321R故解解 将样本的观察值按大小顺序排列为 1 367,1 453,1 502,1 650RdRn1有下述关系:与由于。估计因此可通过R为样本大小。可查表,其中ndn定义定义的一个样本观察值,是取自总体nxxx,21。为未知参数的概率函数为总体,xf的为取到极大值。则称即使似然函数L被取到的概率最大,时,如nxxx,21就是最可能产生观察值极大似然估计注意:注意:的值。的参数,nxxx21极大似然估计。极大似然估计。.,121nxxxL、求似然函数具体步骤:具体步骤:令对给定的样
6、本观察值未知其分布律为,2,1,21niixxxnixpxPniinxpxxxL121,1)总体为离散型分布。总体为离散型分布。未知。,密度函数为,xf观察值被取到的概率。样本称为似然函数,反映了,函数nxxxL,21niinxfxxxL121,,2)总体为连续型分布。总体为连续型分布。,令对给定的样本观察值nxxx,210ddLL满足方程必然点的可微函数,则极大值是若似然函数。的最大值点,、求,221nxxxL似然方程。的极大值点,经过检验即得解出L的极大似然估计。就是比前式要方便得多。求解似然方程数的单调函数,所以由对是为乘积形式,因为0lnlndLdxxLmnmxxxLLm,212121
7、其似然函数为,个未知参数一般地,设总体含有方程组其极大值点由对数似然的极大似然估计。为未知参数m,21就分别,其惟一解解得。在通常的情况下m,210ln0ln1mLL例例4。其中01,1PpPp中抽得容分布,从服从离散型随机变量10,2121nnxxxn的一组观察值的样本量为的极大似然估计,求参数pnixi,2,1;1,0nixnxxxixxniiniiiipppppxLpxppxP1111111,1,0,1的似然函数为的分布律为解解 01ln1lnln,ln1pynpydpLdpynpypxLxyinii由对数似然方程,得:令niixxnnyp11解得的极大似然估计值为以因为这是惟一的解,所
8、pxp 从而得p的极大似然估计量为:p 函数为服从正态分布,其密度设总体例例522212221,xexf的极大似然估计。,求未知参数,记21221niiixnnnixnneexxxL12122122122212122121221,似然函数为解解niixnnL1212221ln22ln2ln上式两边取对数得的极大似然估计值。这就是由此求得惟一解对数似然方程组为2211221112122221121,110212ln01lnniiniiniiniixxnxxnxnLxLxniixxn1221即相应的极大似然估计量为:niin1221点估计的方法:点估计的方法:一、矩估计法(也称数字特征法)一、矩估
9、计法(也称数字特征法)直观意义比较明显,但要求总体k阶矩存在。二、顺序统计量法二、顺序统计量法 使用起来方便,无需多大计算,但准确度不高。三、极大似然估计法。三、极大似然估计法。具有一些理论上的优点,但要求似然函数可微。E的估计量,若是参数设定义定义8.2 点估计的评选标准点估计的评选标准具有无偏性的意义是:的真值,取值由于随机性而偏离虽然具有无偏性。的无偏估计或称是称的真值,却等于数学期望但取其平均数)(即没有系统偏差。的样本,是,存在,记为与方差nD212)(例例1)(记为学期望的分布是任意的,其数设总体E?的估计是否具有无偏性22与分别作为与样本二阶中心矩问用样本均值S 22221SEn
10、nSEE由前知解解区别了。不加以相差不大,这时二者就与很大时,但在的估计,作为般用的无偏估计。因此,一不是但的无偏估计。是的无偏估计是这说明22222222.SSnSSS例例2的无偏估计。为其中求证:的样本,是有设总体niiiniiinCnCCDE1122121,1,证明证明的无偏估计。是即得21112niiiniiniiiCECCEE 由于方差是度量随机变量落在它的均值E的邻域内的集中或分散程度的。所以一个好的估计量,不仅应该是待估参数的无偏估计,而且应该有尽可能小的方差。样本的无偏估计,若对任意都是与设21定义定义高,也就是说估附近取值的密集程度较在但21的真值,虽然还不是有效的意义是:较
11、121计的精确度高。21DDn有容量有效。较则称21证明证明 有效。较即故而21122211222122121211221DnnCCDCDCDCCDCDDnDDniiniiniiniiniiiniiiniii例例3有效。较证明niiiC121我们不仅希望一个估计是无偏的,且具有较小的方差,有时还希望当子样容量无限增大时,即观察次数无限增多时,估计能在某种意义下越来越接近被估计的参数的真实值,这就是所谓一致性的要求。定义定义依概率时,的估计量,当为参数设n1)(limPn0)(limPn注意:注意:计量。的一致估计量或相合估是称1)(limPn,有。即对收敛于02与方差的数学期望设总体DE的一致
12、估计量。是、样本均值)1的样本。是都存在,n,21的一致估计量。是、样本方差22)3S下面证明:阶原点矩是总体的阶原点矩、样本的kMkk)2的一致估计量。kE独立同分布n证明证明(1)0)(limPn即由辛钦大数定理,有0)(limEPn(2)0lim111221211kknkkkkknikikknikiknikikEMPnDDMEMMPnDDnDMEEnEMnM由契比雪夫不等式,有0)(lim12)(12)1(2)1()1()1(222422224222222nnnnnnnnESSPnDSESSPnDSnSnDnSnn即由契比雪夫不等式,有(3)0)(lim1)1(222222nnnSPES
13、nSnEn故定义定义所确)为由样本(与nn,212128.3 参数的区间估计参数的区间估计分别与的置信区间,为或置信概率211121P)(的未知参数,若是总体设n,211,给定的常数定的两个统计量,如对10有:的置信度)称为参数则随机区间(21,限。称为置信下限与置信上随机区间(1,2)包含的概率为1。表示121P注意:注意:1/1/1011,0/,2222uuunPnPNnnN即,有对于给定的置信概率则由定理1、2已知,求已知,求的置信区间的置信区间的置信区间。的置信概率为是故区间即1,12222nnnnPuuuua例例1.146.15,754.1496.1,6,06.0.96.105.0,
14、95.0195.141.152.158.149.141.156.1461025.02025.02的置信区间为求得代入公式,将,查正态分布表得已知uunuu解解的置信区间。的置信概率为求单位:个,测得直径为生产的滚球中随机抽取从某天径已知某厂生产的滚珠直95.01.15,2.15,8.14,9.14,1.15,6.146,06.0,mmN2、2未知,求未知,求的置信区间的置信区间的置信区间。的置信概率为是)()(可求得:)(,有对于给定的置信概率有,代替若用11,111/1011/22222nSntnSntntnSPntSnnStS在例1中若滚珠直径的方差2未知,用同样的数据求的置信概率为0.9
15、5的置信区间。.186.15,714.145706.25,6,226.0.5706.25105.0,95.01226.0051.05255.095.141.1595.141.1595.146.145195.14025.0025.02222的置信区间为求得代入公式,将分布表得,查已知tnStnttS解解例例2 分析例1和例2的结果会发现,由同一组样本观察值,按同样的置信概率,对对计算出的计算出的置信区间因为置信区间因为2 2的是否已知会不一样。的是否已知会不一样。这因为:当当2 2为已知时,为已知时,我们掌握的信息多一些,在其他条件相同的情况下,对的估计精度要高一些,即表现为的置信区间长度要小些
16、。反之,当反之,当2 2为未知时,为未知时,对的估计精度要低一些,即表现为的置信区间长度在大一些。3 3、已知,求已知,求2 2的置信区间的置信区间 11101221122221212222221nnPnnPniiniinii即,有对于给定的置信概率 niin12222构造变量 nnniinii22112221221,的置信区间为:的置信概率为例例3的置信区间。的置信概率为求个,得样本观察值零件中随机取从某天生产的已知某厂生产的零件95.02.13,8.12,4.13,6.124,5.1222N解解4.15.122.135.128.125.124.135.126.122222412iinini
17、iiniinn11222122计算:亦可根据下面的等式去:注 .89.2,13.0.484.04,143.11405.0,95.0122975.02212025.0222间为的置信区求得将有关数据代入公式,分布得,查已知nn4、未知,求未知,求2的置信区间的置信区间1111011112222221222221222niiniinnPnSnSn,有对于给定的置信概率构造变量的置信区间。的置信概率为是可求得区间11,12221122212nnniinii11011,022221212122212121unnPNnnu使,对于给定的置信概率选取随机变量的置信区间已知,求、212221,1的置信区间。
18、的置信概率为是可求得区间1,2122212122221212nnunnu的置信区间。的置信概率为是可求得区间选用随机变量111,1121121212212212121nnStnnStnntnnSt的置信区间,求已知未知,、方差2122212221)(2两台机床生产同一个型号的滚珠,从甲机床、乙两台机床生产同一个型号的滚珠,从甲机床、乙机床生产的滚珠中分别抽取机床生产的滚珠中分别抽取8个、个、9个,测得这些滚珠的个,测得这些滚珠的直径(单位直径(单位:mm)如下)如下:甲机床甲机床 15.0,14.8,15.2,15.4,14.9,15.1,15.2,14.8乙机床乙机床 15.2,15.0,1
19、4.8,15.1,15.0,14.6,14.8,15.1,14.5 两台机床生产的滚珠直径服从正态分布,求这两两台机床生产的滚珠直径服从正态分布,求这两台机床生产的滚珠直径均值差台机床生产的滚珠直径均值差12 的置信区间,置信的置信区间,置信概率为概率为0.90,设,设(1)已知甲、乙机床生产的滚珠直径的标准差分别为)已知甲、乙机床生产的滚珠直径的标准差分别为1=0.18mm及及2=0.24mm;(2)未知)未知1,2,已知,已知1=2。例例4解解)318.0,018.0(168.0924.0818.0645.1645.11.09.0110575.00457.09.1405.159822222
20、121205.02222121故所求置信区间为查正态分布表得,则)给定置信概率nnuuuSSnn)344.0,044.0(194.09181228.0753.111228.02980575.080457.072)1()1(753.1)15()2(1.09.0122122122221105.0212故所求置信区间为分布表得查,则)给定置信概率nnStnnSnSnStnnttannFFnnFPnnFnnFniinii1,101,1121221212112222212121121,使对给定置信概率为选用随机变量的置信区间已知,求,、22212131,1,12121122112122121222112
21、211212212niiniiniiniinnnnFnnnnFP即的置信区间。的置信概率为是可求得区间1,1,12221122112122121122112122122121niiniiniiniinnnnFnnnnF1,111112122222121122221221121nnFSSnnFniinii选用随机变量的置信区间未知,求,、222121421211211222121121122212111,11,111,11niiniiniiniinnnnFnnnnF可求得区间的置信区间。的置信概率为是122212221212122212121,11,1,11SSnnFSSnnF上式亦可写成.)2
22、(9.140.15)1(90.042121 2221及未知;及珠直径的均值分别是已知两台机床生产的滚,如果:率为的置信区间,设置信概方差比滚珠直径中,求两台机床生产的在上面的例mmmm例例5解解 (1)计算得819.2,257.0846.0295.0934.0,846.023.3934.0295.039.318,919,8,23.39,8,10.0,90.0146.0,34.005.095.0212105.021291228121求得置信区间为:分布表得查则给定置信概率FFnnFFnnFFiiii 966.2,277.00575.0268.00457.0,0575.050.30457.0268.073.317,805.018,71,150.38,71,110.0,90.01,0575.0,0457.0295.0212105.02122221求得置信区间为得分布表,查则给定置信概率计算FFnnFFnnFFSS5,9,15,21