1、参数估计参数估计假设检验假设检验统计方法统计方法描述统计描述统计推断统计推断统计总体均值、比例总体均值、比例、方差等、方差等简简单单随随机机抽抽样样分分层层抽抽样样整整群群抽抽样样系系统统抽抽样样多多阶阶段段抽抽样样概概率率抽抽样样方方便便抽抽样样判判断断抽抽样样自自愿愿样样本本滚滚雪雪球球抽抽样样配配额额抽抽样样非非概概率率抽抽样样抽抽样样方方式式一次失败的抽样调查一次失败的抽样调查方法方法1、重复抽样重复抽样:也叫:也叫放回抽样放回抽样,抽样过程中总体单位,抽样过程中总体单位的总数不变,每个抽中单位有再次被抽中的的总数不变,每个抽中单位有再次被抽中的可能可能2、不重复抽样不重复抽样:也叫:
2、也叫无放回抽样无放回抽样,每个单位只有一,每个单位只有一次被抽中的机会,总体单位数不断减少次被抽中的机会,总体单位数不断减少。层层1 1层层2 2层层N N总体总体群群1 1群群2 2群群N N总体总体1.先将总体单位划分成若干大群,大群内再分成若干小群。先将总体单位划分成若干大群,大群内再分成若干小群。先按某种方法抽取大群,然后在中选群中抽取小群,再进先按某种方法抽取大群,然后在中选群中抽取小群,再进一步抽样,从选中的群中抽取出若干个单位进行调查一步抽样,从选中的群中抽取出若干个单位进行调查2.具有具有整群抽样的优点,保证样本相对集中,节约调查费用整群抽样的优点,保证样本相对集中,节约调查费
3、用3.适用于大规模的抽样调查,如:我国的农作物产量调查、适用于大规模的抽样调查,如:我国的农作物产量调查、职工家计调查等职工家计调查等 作物作物1、 样本平均数分布样本平均数分布x xx x),(2Nnnnn1_x2_x3_xkx_总体_X),(2_xxN原总体变量的总体。 就构构成了一 ,这这许多个样本平均 ,即有 平均数都可以 计可以计算出该的样样本,从每一个样n样含量为。从这从这个总体中随,标标准差,其平均数 为变量的总体,即原总体X设有一个变量的总体。 就构构成了一 ,这这许多个样本平均 ,即有 平均数都可以 计可以计算出该的样样本,从每一个样n样含量为。从这从这个总体中随,标标准差,
4、其平均数 为变量的总体,即原总体X设有一个n设有一个设有一个X变量的总体,即原总体,其平均数为变量的总体,即原总体,其平均数为,标准差为,标准差为。从这个。从这个总体中随机取样含量为总体中随机取样含量为n的样本,从每一个样本都可以计算出该样本的的样本,从每一个样本都可以计算出该样本的平均数平均数 ,即,即 有有 ,这许多个样本平均数就构,这许多个样本平均数就构成了一个变量的总体。成了一个变量的总体。n样本平均数总体变量的平均数是样本平均数总体变量的平均数是 ,标准差是,标准差是 .xnxxxx,321x65 .17)(5 . 3665432122NXNXiixifipi110.167210.1
5、67310.167410.167510.167610.167Total61.000X 当抽样样本容量n=2时,即当掷骰子2次时,其相应的组合如下表: Roll 1Roll 21,1 (1.0) 1,2 (1.5)1,3 (2.0)1,4 (2.5) 1,5 (3.0) 1,6 (3.5)2,1 (1.5) 2,2 (2.0)2,3 (2.5)2,4 (3.0) 2,5 (3.5) 2,6 (4.0)3,1 (2.0) 3,2 (2.5)3,3 (3.0)3,4 (3.5) 3,5 (4.0) 3,6 (4.5)4,1 (2.5) 4,2 (3.0)4,3 (3.5)4,4 (4.0) 4,5
6、(4.5) 4,6 (5.0)5,1 (3.0) 5,2 (3.5)5,3 (4.0)5,4 (4.5) 5,5 (5.0) 5,6 (5.5)6,1 (3.5) 6,2 (4.0)6,3 (4.5)6,4 (5.0) 6,5 (5.5) 6,6 (6.0)nnNxfNxfxiixiix即2)2265.17125.17365.52(5.336126360.615.120.112fipi1.010.0281.520.0562.030.0832.540.1113.050.1393.560.1674.050.1394.540.1115.030.0835.520.0566.010.028Total36
7、1.000ix当n=2时平均数 的抽样分布iXXPifx3/841xxn例2:假定一个有限总体指3个一平方米抽样单位中的蛴螬数,观察值为2,4,和6头。倘若从这一总体内抽出所有可能的样本,而每个样本只有一个观察值,则可能出现的数目为2,4,6,样本平均数亦为2,4,6。头头所以,为因为3/83/ )46()44()42(43/ )642(:64 , 2 , ,:222321xxxxx例2:如果每个样本有2个观察值,即n=2,这时抽出的所有可能样本数目就有32 = 9个,这9个样本得到的平均数如下表:第一个观察值 第二个观察值样本观察值222 2242 4362 64424 2344 4464
8、65626 2446 4566 66总和36x头头3/49/ )46()42(49/ )6532(22xx0 01 12 23 34 423456fx3/442xxn例2:4种不同容量的样本平均数( )的抽样分布表xn=1n=2n=4n=8ffff21212.012.0012.2582.542.50362.75112323.0103.002663.255043.5163.507843.75101641434.0194.0011074.2510164.5164.507844.75504525.0105.002665.251125.545.50365.75861616.016.0013981656
9、144448/34/32/31/3xxxxx2不同容量时的 分布及参数fx3/442xxnfffxxx3/841xxn3/244xxn3/148xxn0 01 12 23 34 423456x1.从同一总体抽出的具有相同容量的所有可能平均数分布,其平均数等于该总体平均数 即2.样本平均数分布的方差等于总体方差除以样本容量n,即 因此样本平均数的标准差是原总体样本的标准误。_xnx22nx_3.从一个正态总体中抽样,无论样本容量大小,其样本平均数分布都遵循正态分布。4.从不是正态分布的同一总体抽出的、具有相同容量的所有可能样本,随样本容量n的增加,其平均数分布逐渐趋向于正态分布,当样本容量n30
10、时逼近正态分布。 由于平均数分布在样本容量n30时逼近正态分布,因此在计算样本平均数出现的概率时,样本平均数可按下式进行正态标准化:nxxuxx/ 正态分布再生定理正态分布再生定理: 当总体为正态概率分布时,对任何容当总体为正态概率分布时,对任何容量样本,样本均值量样本,样本均值x x的抽样分布服从均值的抽样分布服从均值x x = =, ,标准差标准差x x = =/n n 的正态分布的正态分布1. 从正态总体抽样从正态总体抽样Sampling from Normal Populations抽样分布定理抽样分布定理Sampling Distribution Theorem = 50 = 10
11、x从正态总体抽样从正态总体抽样Sampling from Normal Populations X = 50 x总体分布总体分布抽样分布抽样分布数据的特征和度量数据的特征和度量抽样方法简简单单随随机机抽抽样样分分层层抽抽样样整整群群抽抽样样系系统统抽抽样样多多阶阶段段抽抽样样概概率率抽抽样样方方便便抽抽样样判判断断抽抽样样自自愿愿样样本本滚滚雪雪球球抽抽样样配配额额抽抽样样非非概概率率抽抽样样抽抽样样方方式式 又称又称“大样本定理大样本定理”,当样本容量,当样本容量n足够大足够大(n30),无论总体是什么分布,样本均值无论总体是什么分布,样本均值x的抽样分布将的抽样分布将趋于均值为趋于均值为、
12、标准差为、标准差为/n的正态分布的正态分布中心极限定理中心极限定理Central Limit Theorem在实践中,总体的分布往往未知,因此在实践中,总体的分布往往未知,因此该定理的应用十分广泛该定理的应用十分广泛从非正态总体抽样从非正态总体抽样Sampling from Non-Normal Populationsx中心极限定理中心极限定理Central Limit Theorem中心极限定理对三个总体的图示中心极限定理对三个总体的图示x 的抽样分布的抽样分布 ()xP(x)总体总体I总体总体IIxP(x)xP(x)总体总体IIIxP(x)xP(x)xP(x)中心极限定理对三个总体的图示中
13、心极限定理对三个总体的图示x 的抽样分布的抽样分布()x 的抽样分布的抽样分布()xP(x)xP(x)xP(x)xP(x)xP(x)xP(x) 标准差(标准差(standard deviation):样本内变员数 偏离样本平均数 的程度的指标。 标准误(标准误(standard error)即样本平均数的标准差:)即样本平均数的标准差:样本平均数 偏离总体平均数 的程度的指标。),(2Nnnnn1_x2_x3_xkx_总体_X),(2_xxN原总体ix_x_x)/,(2nN而样本的标准误 SEn2()1ixxn例题9938. 0)5 . 2()5 . 2()20200250()250(FzPz
14、PxP1056. 08944. 01)25. 1 (1)25. 1()20200225()225(FzPzPxP9772. 0)0 . 2()0 . 2()0 . 2200204()204P(0 . 2200204X/0 . 210020,/200FuPuPxnXXuXdlmgndlmgxxxxxxxx因此则也为正态分布数为正态分布,因此平均因为原总体但0013. 0)0 . 3()0 . 3()2520200188()188(FuPuPXP2、样本比例的抽样分布、样本比例的抽样分布 引例引例:已知某高校女生(总数为8000)比例为40%,现对全体学生做两次随机抽样, n=10和n=1000
15、,求这两次抽样中女生的比例在50%以上的概率。 (二)样本比例的分布规律 例:已知某高校女生(女生总数为8000)比例为40%,现对全体学生做两次不放回抽样, n=10和n=1000 ,求这两次抽样中女生的比例在50%以上的概率。12nX) 1 , 0( NnXZnsXt)(12n相互独立,相互独立,则 :则 : 服 从服 从 标 准标 准服从自由度为服从自由度为n的的),(2NX) 1 , 0( NXZ2ZY ) 1 (2Y),(2NX) 1() 1()(2222122nsnXXnii),(mnFmYnXF 估估 计计 方方 法法点点 估估 计计区间估计区间估计3.2.1 点估计点估计1.用
16、样本估计量用样本估计量的的某个取值某个取值直接作为直接作为总体参数总体参数的的估计值估计值例如:用样本均值直接例如:用样本均值直接作为作为总体均值的估计总体均值的估计例如:用两个样本均值之差直接例如:用两个样本均值之差直接作为作为总体均值之差的总体均值之差的估计估计2.方法:矩估计方法:矩估计法、法、极大似然估计法等。极大似然估计法等。2,NXnXXX,21X2221111niniXXSn2)(1147101)(101hxxXEii889.7578)(2XD),;,(221nxxxL222)(121ixnieniixnne1222)(222)()2(1)ln(2)2ln(22)(ln2122n
17、nxLnii0)(2)()(21ln)(0)(1ln21222212nxLxLniiniiniimleniimlexxnxxn1221)(11XXnnii11212)(1nniiSXXn,S2的极大似然估计量分别为 ,22)(E211)21(PnZZxx222,NXnxxx,21xnNx2,1 , 0 NnxU22xxnn,nL2/222222,NXx2z1122,xzxznn101022z,zxxnn1ntnSxt122tnSxtPnStxnStx22,22s22z,zssxxnnx12待估计参数待估计参数已知条件已知条件置信区间置信区间正态总体,正态总体,2 2已知已知正态总体,正态总体,
18、n=30n=302 2未知未知非正态总体,非正态总体,n30n30未知时,用未知时,用s总体均值总体均值 ()(1)2/nXtsn总体均值的区间估计总体均值的区间估计汇总汇总2/XZsn2/XZnxnp s2(1-)sspppzn(0,1)(1)sssppZNPPn2(1)65%(165%)65%1.9610065%9.35%55.65%,74.35%ssspppznss(0,1)(1-)1sPpZNppNnnN2总体比例总体比例p在在1- 置信水平下置信水平下的置信区间为的置信区间为s2(1-)1ssppNnpznN%37.80%,63.69%37. 5%75110002001000200%)751%(7596. 1%751)1 (2NnNnppzp
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。