1、统计学第6章 参数估计21 1 参数估计的基本原理参数估计的基本原理 2 2 一个总体参数的区间估计一个总体参数的区间估计3 3 两个总体参数的区间估计两个总体参数的区间估计4 4 样本量的确定样本量的确定 5-33l参数估计的基本原理参数估计的基本原理l点估计与区间估计点估计与区间估计l评价估计量优良性的标准评价估计量优良性的标准l一个总体参数的区间估计方法一个总体参数的区间估计方法l两个总体参数的区间估计方法两个总体参数的区间估计方法l样本量的确定方法样本量的确定方法5-44参数估计参数估计假设检验假设检验 统计方法统计方法描述统计描述统计推断统计推断统计5-55 为了解学生每周上网花费的
2、时间,中国人民大学公共管理学院的4名本科生对全校部分本科生做了问卷调查。调查的对象为中国人民大学在校本科生,调查内容包括上网时间、途径、支出、目的、关心的校园网内容,以及学生对收费的态度,包括收费方式、价格等。问卷调查由调查员直接到宿舍发放并当场回收。对四个年级中每年级各发60份问卷,其中男、女生各30份。共收回有效问卷共200份。其中有关上网时间方面的数据经整理如下表所示 5-66平均上网时间为平均上网时间为8.58小时,标准差为小时,标准差为0.69小时。全校学生每周小时。全校学生每周的平均上网时间是多少?每周上网时间在的平均上网时间是多少?每周上网时间在12小时以上的学生比小时以上的学生
3、比例是多少?你做出估计的理论依据是什么?例是多少?你做出估计的理论依据是什么?71 参数估计的基本原理参数估计的基本原理点估计与区间估计点估计与区间估计评价估计量的标准评价估计量的标准5-88参数估计(parameter estimation)就是用样本统计量去估计总体的参数估计量:用于估计总体参数的统计量的名称如样本均值,样本比例,样本方差等例如:样本均值就是总体均值 的一个估计量的一个估计量参数用参数用 表示,估计量表示,估计量用用 表示表示估计值:估计值:估估计参数时计算出来的统计量的具体值计参数时计算出来的统计量的具体值如果样本均值如果样本均值 x=80,则则80就是就是 的估计值的估
4、计值5-99参数估计的形式有两种参数估计的形式有两种:点估计与区间估计。设设 x1,x2,xn 是来自总体是来自总体 X 的一个样本,我们用一的一个样本,我们用一个统计量个统计量 的取值作为的取值作为的估计值,的估计值,称为称为的的点估计(量)点估计(量),简称简称估计估计。在这里如何构在这里如何构造统计量造统计量 并没有明确的规定,只要它满足一定的并没有明确的规定,只要它满足一定的合理性即可。这就涉及到两个问题:合理性即可。这就涉及到两个问题:1(,)nxx 其一其一 是如何给出估计,即估计的是如何给出估计,即估计的方法问题;方法问题;其二其二 是如何对不同的估计进行评价,即估是如何对不同的
5、估计进行评价,即估 计的计的好坏判断标准。好坏判断标准。5-1010 用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量5-1111点估计的常用方法 矩估计法矩估计法 顺序统计量法顺序统计量法 最大似然法最大似然法 最小二乘法等最小二乘法等5-1212参数区间估计的含义:估计总体参数的区间范围,并给出区间
6、估计成立的概率值。其中:1-(030时时2.使用使用 t 分布统计量分布统计量)1(ntnsxt12nsXtn5-3434 某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。假定XN(,2),但总体方差未知,已知样本方差为34分钟,试以95%的置信水平估计全校学生平均每天参加体育锻炼的时间。22120.0251122,34,100,260.05,1991.984,343426 1.984,26 1.98410010024.84,27.16nnnXNsnxtntssXtXtnn 解:已知当总体均值 的置信区间为352.2 总体比例的区间估计5-36361.假定条
7、件假定条件总体服从二项分布总体服从二项分布若若np(成功次数成功次数)和和n(1-p)(失败次数失败次数)均应该大于均应该大于10(有的(有的书上说是书上说是5)在大样本下,可以由正态分布来近似在大样本下,可以由正态分布来近似1,Nnp近似服从近似服从5-37372.使用正态分布统计量使用正态分布统计量 z)1,0()1(Nnpznppzp)-1(2样本比例样本比例分位数值分位数值样本比例的标准误差样本比例的标准误差5-3838%35.74%,65.55%35.9%65100%)651%(6596.1%65)1(2nppzp395-40401.估计一个总体的方差或标准差2.假设总体服从正态分布
8、3.总体方差 2的点估计量为s2,且11222nsn111122122222nsnnsn5-41415-42425-43434011.12)24()1(2975.0212n3641.39)24()1(2025.022n39.18083.564011.1221.931253641.3921.93125225-4444均值均值比例比例方差方差大样本大样本小样本小样本大样本大样本 2 2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2 2未知未知t t分布分布455-4646两个总体参数的区间估计两个总体参数的区间估计1212xx1
9、2221212pp2212ss473.1 两个总体均值之差的区间估计5-4848均值之差区间的一般表达式均值之差区间的一般表达式两个总体均值的置信区间是由两个样本均值之差加减估计误差得到的估计误差由两部分组成:一是点估计量的标准误差,它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为1-时,统计量分布两侧面积为的分位数值,它取决于事先所要求的可靠程度5-49491.假定条件两个总体都服从正态分布,1、2已知若不是正态分布,可以用正态分布来近似(n130和n230)两个样本是独立的随机样本使用正态分布统计量 z)1,0()()(2221212121Nnnxxz5-50501.1,2已知时
10、,两个总体均值之差1-2在1-置信水平下的置信区间为222121221)(nnzxx222121221)(nsnszxx5-5151861x782x5-5252)97.10,03.5(97.28332.7468.596.1)7886()(22222121221nsnszxx5-5353(独立小样本:1 12 2 2 22 2)1.假定条件两个总体都服从正态分布两个总体方差未知但相等:1=2两个独立的小样本(n130和n230)2.总体方差的合并估计量2)1()1(212222112nnsnsnsp21221211nnsnsnsppp5-54541.两个样本均值之差的标准化2.两个总体均值之差
11、1-2在1-置信水平下的置信区间为(独立小样本独立小样本:1 12 2 2 22 2)2(11)()(21212121nntnnsxxtp21221221112nnsnntxxp5-5555(独立小样本独立小样本:1 12 2 2 22 2)5-5656(独立小样本独立小样本:1 12 2 2 22 2)22112232.5,15.996,28.8,19.358xsxs677.1721212358.19)112(996.15)112(2ps56.37.3121121677.170739.2)8.285.32(5-5757(独立小样本独立小样本:1 12 2 2 22 2)1.假定条件两个总体都
12、服从正态分布两个总体方差未知且不相等:12两个独立的小样本(n130和n230)使用统计量)()()(2221212121vtnsnsxxt5-5858(独立小样本独立小样本:1 12 2 2 22 2)两个总体均值之差1-2在1-置信水平下的置信区间为2212122122221212222211221112()ssnnvsnsnnnssxxtvnn5-5959(独立小样本独立小样本:1 12 2 2 22 2)5-6060(独立小样本独立小样本:1 12 2 2 22 2)22112232.5,15.996,27.875,23.014xsxs13188.13188014.2311212996
13、.158014.2312996.15222v433.4625.48014.2312996.151604.2)875.275.32(5-6161(匹配大样本匹配大样本)假定条件两个匹配的大样本(n1 30和n2 30)两个总体各观察值的配对差服从正态分布两个总体均值之差d=1-2在1-置信水平下的置信区间为nzdd2 d 分位数值分位数值 d 的标准误差的标准误差5-6262(匹配小样本匹配小样本)假定条件两个匹配的小样本(n1 30和n2 30)两个总体各观察值的配对差服从正态分布 两个总体均值之差d=1-2在1-置信水平下的置信区间为2(1)dsdtnn5-6363(匹配小样本匹配小样本)5
14、-6464(匹配小样本匹配小样本)Normal Probability Plot分数之差Expected Normal Value-2.0-1.5-1.0-0.50.00.51.01.52.0-4048121620245-6565(匹配小样本匹配小样本)11101101dniindd53.61)(12dniidndds67.4111053.62622.211)1(2nsntdd663.2 两个总体比例之差的区间估计5-67671.假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的n1p1和n1(1-p1),n2p2和n2(1-p2),均应该大于52.两个总体比例之差 1-2在1-
15、置信水平下的置信区间为222111221)1()1(nppnppzpp(p1-p2)分位数值分位数值(p1-p2)的标准误差的标准误差5-68685-6969%32.19,%68.6%32.6%13400%)321(%32500%)451(%4596.1%32%45703.3 两个总体方差比的区间估计5-71711.比较两个正态总体的方差比用两个样本的方差比来判断如果S12/S22接近于1,说明两个总体方差很接近如果S12/S22远离1,说明两个总体方差之间存在差异2.总体方差比在1-置信水平下的置信区间为22222121122212212121,11,1ssssFnnFnn112211,Fn
16、 nFn n5-7272(图示)5-7373(例题分析)5201x26021s4802x28022s5-7474(例题分析)505.028026098.128026022215-7575(小结)均值差均值差比例差比例差方差比方差比独立大样本独立大样本独立小样本独立小样本匹配样本匹配样本独立大样本独立大样本 1 12 2、2 22 2已已 1 12 2、2 22 2未未Z Z分布分布Z Z分布分布 1 12 2、2 22 2已知已知 1 12 2、2 22 2未知未知Z Z分布分布 1 12 2=2 22 2 1 12 2 2 22 2正态总体正态总体F F分布分布Z Z分布分布t t分布分布t
17、 t分布分布t分布分布76775-7878估计总体均值时样本量n为样本量n与总体方差 2、边际误差E、可靠性系数Z或t之间的关系为与总体方差成正比与边际误差的平方成反比与可靠性系数成正比样本量的圆整法则:当计算出的样本量不是整数时,将小数点后面的数值一律进位成整数,如24.68取25,24.32也取25等等 2222)(EznnzE25-7979(例题分析)5-8080(例题分析)9704.964002000)96.1()(2222222Ezn5-8181 设n1和n2为来自两个总体的样本,并假定n1=n2根据均值之差的区间估计公式可得两个样本的容量n为222212221)()(Eznnnnz
18、E222125-8282(例题分析例题分析)5-8383(例题分析例题分析)33269.325)12090(96.1)()(22222212221Eznn844.2 估计总体比例时样本量的确定5-8585根据比例区间估计公式可得样本量n为 222)1()(EznnzE)1(25-8686(例题分析例题分析)1393.13805.0)9.01(9.0)96.1()1()(22222Ezn5-8787设n1和n2为来自两个总体的样本,并假定n1=n2根据比例之差的区间估计公式可得两个样本的容量n为 nzE)1()1(22112222112221)1()1()(Eznnn5-8888(例题分析例题分析)5-8989(例题分析例题分析)19308.1921.0)5.01(5.0()5.01(5.096.1)1()1()(22222112221Eznn5-9090本章小结本章小结l参数估计的基本原理参数估计的基本原理l一个总体参数的区间估计一个总体参数的区间估计l两个总体参数的区间估计两个总体参数的区间估计l样本量的确定样本量的确定结结 束束