1、第7章 参数估计7.1、参数估计的基本原理7.2、总体均值、比例和方差的置信区间估计7.3、双总体均值之差、比例之差和方差之比 的置信区间估计7.1 参数估计的基本原理7.1.1 估计量与估计值样本统计量是样本观察值的函数,汇总了样本的观察信息。参数估计中,首要问题是找到恰当的统计量作为参数的估计量。估计值是根据特定样本计算的样本统计量值7.1.2 点估计与区间估计点估计(point estimate)就是找到合适的估计量,用样本数据计算的样本估计值直接作为总体参数的估计值依据点估计值 给出 的一个区间,总体参数落入这一区间的概率可以看做区间估计的可靠程度(置信度),区间的宽度可以看做估计误差
2、的一个参考。1)(p7.1.3 评价估计量的标准1、无偏性:无偏性是指估计量抽样分布的均值等于总体参数2、有效性:对于同样两个无偏估计量而言,方差较小的统计量更为有效。3、一致性:一致性是指随着样本容量的增大,估计值无限趋近于总体参数,也即就是估计量的方差趋近于零。)(E)(xE)var(1)()(22xnxxEsE7.2 总体均值、比例和方差的置信区间估计7.2.1、总体平均数的置信区间:总体正态分布且方差已知 根据样本均值的抽样分布根据标准正态分布,我们必然可以找到Z落入标准正态分布的一个对称区间的概率:)1,0(/NnxZ1)(2/2/ZZZP也就是:令:则一:则二:1)/(2/2/Zn
3、xZP1)(2/2/nZxnZPnZ2/1)(2/2/nZxnZP1)(2/2/nZxnZxP1)(2/2/nZxnZP1)(2/2/nZxnZxP 例7.1、某医院育婴房随机抽取9名新生儿,检查他(她)们的体重数据如下(单位KG):2.8,3.1,3.6,3.7,3.8,3.2,2.9,3.3,4.1。假设新生儿体重分布服从正态分布,且标准差为0.4。试估计新生儿体重置信度为95%的置信区间。解:样本均值:由于总体标准差:抽样标准差:边际误差:故新生儿体重95%的置信区间为:39.3nxx96.1,9,4.0025.0Zn34.0nx26.034.096.1025.0nZ26.039.3 即
4、x7.2.2、总体平均数的置信区间:总体正态分布且方差未知此时,例7.2、在例7.1中,如果总体标准差未知,试估计新生儿体重总体均值95%的置信区间。)1(/ntnsxtnsntxnsntx)1()1(2/2/解:样本平均值:样本标准差:0.437抽样标准差:根据自由度 查得边际误差:故新生儿体重95%的置信区间为:39.3nxx1)(2nxxsi146.03437.0nsx81 ndf05.0306.2)8(2/05.0t336.03437.03066.2)8(025.0nst336.039.3用EXCEL做区间估计的方法比较多,一种方法是可以充分利用EXCEL中的统计函数,比如样本计算平均
5、值的函数AVERAGE、计算样本方差的函数VAR、查t分布临界值的函数TINV等等。另一种方法则比较简单,就是利用EXCEL中的描述统计功能。在例7.2中,对9名新生儿体重的样本数据进行描述统计,过程和结果见图7-2、图7-2:7.2.3、总体比例的区间估计例7.3 根据一个由某品牌250个轮胎组成的随机样本,测试其轮胎防爆特性,发现有8%的轮胎防爆特性不合格,是以95%的置信度估计该品牌轮胎防爆特性不合格的比例。)1(,(nNp)1(,)1(2/2/nppZpnppZp%8p017.0250/92.008.0/)1(nppp017.0250/92.008.0/)1(nppp解:样本比例抽样标
6、准差:边际误差:95%的置信区间(6.3%,9.7%)7.2.4 单侧估计区间估计中,我们有时只仅仅关心区间的下限或者上限,这是通常称作单侧估计。总体均值置信度为1-a下限区间:总体均值置信度为1-a上限区间:1)(nZxP1)(nZxP在总体标准差未知情形下,通常用样本标准差s替代总体标准差,来计算抽样标准误,同时用t统计量临界值代替正态统计量临界值例7-4、为了解某品牌轮胎的使用寿命,随机抽取16个轮胎进行破坏性测试,模拟测试其在标准路面上的行驶里程数,结果数据如下(单位:km):16805,15550,15890,16870,16822,17875,15630,16324,15880,1
7、6931,17211,14550,15730,17820,14060,15995。假设轮胎使用寿命服从正态分布,试以95%的置信度估计该轮胎使用寿命不超过多少公里。解:样本均值:样本标准差:抽样标准误:t分布临界值:所以,置信度95%置信区间上限为即:即轮胎使用寿命均值在95%置信度下不超过16708.6公里。6.167086.2635531.14.16246nstx)15(05.07531.1)15(05.0t6.263/nsx5.10541)(2nxxs4.16246nxx 对于总体比例的单侧区间估计,类似于上式可以写出:总体比例置信度为 下限区间:总体比例置信度为 上限区间:1)1(np
8、pZpP1)1(nppZpP7.2.5 总体方差的区间估计对于样本方差统计量有而言:那么,一定有:总体方差置信度为1-a的置信区间为:22)(11xxns2222)1(/)1(nsn1)/)1(2/2222/12snP1)1()1(2/12222/22snsnP例7.5,根据例7-4的数据,试估计轮胎使用寿命标准差95%的置信区间解:根据7-4计算结果:样本方差:查表:所以总体方差95%的置信区间:即(606805.8,2663662.4)。因此标准差95%的置信区间:(779.0,1632.1)。11120081)(22nxxs4884.27)15(025.022621.6)15(975.0
9、22621.61112008154884.271112008152方差的单侧估计置信度为1-a的方差置信下限置信度为1-a的方差置信上限1)1(222snP1)1(1222snP7.3 双总体均值之差、比例之差和方差之比的置信区7.3.1总体均值之差的区间估计1、独立样本2、匹配样本1、独立样本两个总体方差已知时),(2221212121nnNxx1)()(2221212/21212221212/21nnZxxnnZxxP2)()(212222112nnxxxxsp如果总体方差位置,并相等置信度为1-a的区间111)2()(11)2()(21212/212121212/21nnsnntxxnn
10、snntxxPpp例7-6、在章节2.1的母婴关系的例子中,14名实验组和对照组母婴关系的评价数据如表7-1,试估计两种照顾方式母婴亲密度之间置信度95%的差异。控制组试验组人数1414样本平均值3.435.36样本离差平方33.311.2解:根据公式查表:95%的置信区间:即(0.91,2.95)。71.1262.113.332)()(212222112nnxxxxsp0555.2)26(025.0t1471.11471.10555.2)43.336.5(2、匹配样本考虑两种工艺哪种更有效率,先用A工艺加工一定数量的产品做记录,再用B工艺加工一定的产品做记录。为避免工人在加工过程中的学习对结
11、果的影响,某个工人在装配时先选择A工艺还是先选择B工艺也是随机的。序号123456789A工艺252931282628273030B工艺182227252725202525差值7743-13755设样本数据的差值来自实际上总体差值那么,类似单样本总体均值的区间估计,置信度1-a的置信区间:其中:BiAiixxdBiAiiXXDnsntdDnsntddd)1()1(2/2/1)(2nddsid对于上例,解:均值样本标准差抽样标准差两种工艺单位时间内生产产品的平均数置信度为0.95的置信区间为:44.4nddi60.21)(2nddsid87.0nssdd87.03.244.47.3.2 比例之差
12、的区间估计根据样本比例之差的的抽样分布置信度为1-a的置信区间为:)1,0()1()1()()(2221112112NnnppZ2221112/1)1()1()(2nppnppZpp 例7.7、1954年,美国国会曾针对新发明的小儿麻痹疫苗的效果进行大规模测试。在全国740000个儿童中,有400000人自愿接种此疫苗。其中只随机抽取一半的人注射疫苗,而另一半的人则注射生理盐水作为安慰剂,其结果如下(表7-3):全部观察儿童儿童人数患小儿麻痹病病例注射疫苗20000057注射安慰剂(控制组)200000142拒绝接受接种340000157试估计:1)针对三类儿童,分别计算患小儿麻痹的比例。2)
13、注射疫苗和安慰剂的两组患小儿麻痹的比例差异0.95的置信区间。3)注射疫苗和拒绝接种组患小儿麻痹的比例差异0.95的置信区间解:000285.0200000571p00071.02000001422p000461765.03400001573p可参照公式7.13给出三类儿童总体比例的置信区间。即(0.000424691,0.000425309)。即(0.000144854,0.000351617)。200000)00071.01(00071.0200000)000285.01(000285.096.1)000285.000071.0(340000)000461765.01(000461765.
14、0200000)000285.01(000285.096.1)000285.0000461765.0(7.3.3方差之比的区间估计由于因此置信区间)1,1(/2122212221nnFss1)/(2/222122212/1FssFP1)/(2/1222122212/2221FssFssP例7-8 在工程建筑中,用到两种不同结构的承载构件,为比较两种构件承载力得方差,分别选取两种构件各8个,实验测量得到它们破坏扭矩数值如表7-4,试估计两种构件方差之比95%的置信区间。A构件B构件66.87.29.210.28.813.213.211.411.213.614.99.210.211.211.8解:手工计算运用公式,我们用EXCEL简便运算。如图7-4,插入EXCEL中的函数VAR,得到查表得到:所以,根据:得到:即23.72As66.62Bs085.1/22BAss99.47,7025.0)(F20.07,7975.0)(F2/1222122212/2221/FssFss20.0085.199.4085.1222142.522.02221