ImageVerifierCode 换一换
格式:PPT , 页数:53 ,大小:1.53MB ,
文档编号:3020196      下载积分:28 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-3020196.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(抽样平均误差课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

抽样平均误差课件.ppt

1、一、统计推断的一般问题一、统计推断的一般问题二、参数估计原理二、参数估计原理三、点估计三、点估计是是指利用概率论的理论指利用概率论的理论,在抽样调查或实验的基础上,利用样本的,在抽样调查或实验的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。计分析方法。实际工作中许多现象不可能对总体的所有单位进行调查只能组织抽实际工作中许多现象不可能对总体的所有单位进行调查只能组织抽样调查。样调查。建立在随机取样的基础上。建立在随机取样的基础上。运用运用概率估计的方法概率估计的方法。抽样误差抽样误差可以事先计算并加以

2、控制。可以事先计算并加以控制。4 4、统计推断的、统计推断的内容内容1 1)参数估计参数估计:从总体中抽取一部分单位进行调查,:从总体中抽取一部分单位进行调查,进而利用样本提供的信息来推断总体的未知参数进而利用样本提供的信息来推断总体的未知参数和数值特征的方法和过程。和数值特征的方法和过程。2)假设检验:假设检验:先对总体的状况作某种假设,然后先对总体的状况作某种假设,然后再根据抽样推断的原理,根据样本观察资料对所再根据抽样推断的原理,根据样本观察资料对所作假设进行检验,来判断这种假设的真伪,以决作假设进行检验,来判断这种假设的真伪,以决定我们行动的取舍。定我们行动的取舍。1 1)总体和样本)

3、总体和样本2 2)参数和统计量)参数和统计量3 3)样本容量和样本个数)样本容量和样本个数4 4)重复抽样和不重复抽样)重复抽样和不重复抽样5 5)抽样误差抽样误差登记性误 差系统偏差抽样误 差代表性误差统计(调查)误差 1、概念:概念:。 登记性误差登记性误差是所有统计调查都可能发生的,而是所有统计调查都可能发生的,而抽样误差抽样误差不是由于调查失误所引起的,它是随机抽不是由于调查失误所引起的,它是随机抽样所特有的误差。样所特有的误差。 系统偏误是由于违反抽样随机原则,系统偏误是由于违反抽样随机原则,有意地抽有意地抽选较好或较差的单位进行调查,这种系统性原选较好或较差的单位进行调查,这种系统

4、性原因造成的样本代表性不足所引起的误差。因造成的样本代表性不足所引起的误差。 系统偏误和登记误差系统偏误和登记误差都属于思想、作风、技术都属于思想、作风、技术问题,问题,可以防止和避免可以防止和避免,而,而抽样误差则是不可抽样误差则是不可避免,难于消灭,只能加以控制。避免,难于消灭,只能加以控制。 总体各单位标志值的差异程度总体各单位标志值的差异程度。(差异程度越。(差异程度越大,抽样误差越大)大,抽样误差越大) 样本的单位数样本的单位数(样本单位数越多,抽样误差越(样本单位数越多,抽样误差越小)小) 抽样方法抽样方法(重复抽样的误差比不重复抽样的误(重复抽样的误差比不重复抽样的误差要大些)差

5、要大些) 抽样调查的组织形式抽样调查的组织形式(简单随机抽样、类型抽(简单随机抽样、类型抽样、等距抽样、整群抽样)样、等距抽样、整群抽样)(1)抽样实际误差:)抽样实际误差:指某一次具体抽样中,样本指标值与总体参数真实值之间的偏差。(2)抽样平均误差:即通常所说的抽样误差,)抽样平均误差:即通常所说的抽样误差,也称抽样标准误。也称抽样标准误。(3)抽样极限)抽样极限/允许误差允许误差:样本平均数与总体平均数的差额样本平均数与总体平均数的差额X样本成数与总体成数的差额样本成数与总体成数的差额pP 抽样平均误差抽样平均误差是指所有可能的样本指标与总是指所有可能的样本指标与总体指标之间的平均差异程度

6、,是反映抽样误差体指标之间的平均差异程度,是反映抽样误差的一般水平的指标。的一般水平的指标。 用用样本平均数的标准差样本平均数的标准差或或样本成数的标准差样本成数的标准差来作为衡量其抽样误差一般水平的尺度。来作为衡量其抽样误差一般水平的尺度。是样本个数)()(22MMpPMXPX 重复抽样的条件下:重复抽样的条件下:样本容量总体标准差、nnX不重复抽样条件下:不重复抽样条件下:NnnNNNNNnNnXX11很大的时候,当为总体单位数、)1(22样本成数的抽样平均误差表明各样本成数和总体样本成数的抽样平均误差表明各样本成数和总体成数绝对离差的一般水平。成数绝对离差的一般水平。在重复抽样的条件下:

7、在重复抽样的条件下:样本单位数总体成数、)1(npnppP)1()1(很大时,当)1()1(NnnppNNnNnppPP某钢铁厂生产某种钢管,现从该厂某月生产的某钢铁厂生产某种钢管,现从该厂某月生产的500500根根产品中抽取一个容量为产品中抽取一个容量为100100根的样本。已知一级品根的样本。已知一级品率为率为60%60%,试求样本一级品率的抽样平均误差。,试求样本一级品率的抽样平均误差。解:已知解:已知p=60% p=60% 、n=100n=100、N=500N=500%9.4100%601%60)1(重复抽样下:nppP%4.4)5001001(100%)601(%6011不重复抽样下

8、:NnnppP抽样极限误差抽样极限误差是指一定概率下抽样误差的可能范围抽样误差的可能范围,说明样本估计量在总体参数周围变动的范围,记作。设待定的总体参数是,用以估计该参数的统计量是 ,抽样估计的极限误差是 ,即 这个极限误差是根据研究对象的变异程度和分析任务的性质来确定的允许误差范围。PPXXPXPpPXXpPX公式变形:样本成数极限误差:样本平均数极限误差:称为成数置信区间,区间称为平均数置信区间,区间PPXXPPXX1 1、参数估计的概念参数估计的概念:从总体中抽取一部分单位进行调:从总体中抽取一部分单位进行调查,进而利用样本提供的信息来推断总体的未知参查,进而利用样本提供的信息来推断总体

9、的未知参数和数值特征的方法和过程。数和数值特征的方法和过程。2 2、参数估计包括的内容:、参数估计包括的内容: 确定估计值 确定估计的优良标准并加以判别 求估计值和被估计参数之间的误差范围 计算在一定误差范围内所作推断的可靠程度等3 3、参数估计的两种形式、参数估计的两种形式:点估计点估计和和区间估计区间估计点估计以样本指标直接估计总体参数。评价准则的数学期望等于总体参数,即E该估计量称为无偏估计。无偏性有效性当 为 的无偏估计时, 方差 越小,无偏估计越有效。2)(E一致性对于无限总体,如果对任意01)|(|PLimn则称的一致估计。是估计量常用的点估计量PpSX 优点优点:简便、易行、原理

10、直观:简便、易行、原理直观 缺点缺点:这种估计没有表明抽样估计的误差,更:这种估计没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保证程度有没有指出误差在一定范围内的概率保证程度有多大。多大。 一、区间估计的含义 二、总体均值的区间估计 三、总体成数的区间估计 四、正态总体方差的区间估计1)(21P估计值、抽样误差范围、概率保证程度(置信度)估计值、抽样误差范围、概率保证程度(置信度) 抽样误差范围决定估计的抽样误差范围决定估计的,概率保证程,概率保证程度决定估计的度决定估计的可靠性可靠性。抽样误差范围越大,精确度越低,反之就越高;抽样误差范围越大,精确度越低,反之就越高;概率保证程度

11、越大,可靠性越高,反之就越低。概率保证程度越大,可靠性越高,反之就越低。 在抽样估计时,希望精度高些,可靠性大些,在抽样估计时,希望精度高些,可靠性大些,但两者同时实现是有矛盾的。但两者同时实现是有矛盾的。 区间估计估计未知参数所在的可能的区间。评价准则随机区间置信度精确度随机区间1)(ULP),(UL包含(即可靠程度)越大越好。的概率),(UL的平均长度(误差范围)越小越好),(LUE一般形式)()(或总体参数估计值误差范围 :一定倍数的抽样误差nZx2例如:抽样误差 n/一定时,2Z越大,x概率(可靠性)越大;随之增大,精确度就差。 根据已经给定的抽样误差范围,求概率保证程度。根据已经给定

12、的抽样误差范围,求概率保证程度。步骤:步骤:抽取样本,计算样本指标抽取样本,计算样本指标计算标准差、抽样计算标准差、抽样平均误差平均误差结合结合给定的抽样误差范围,求出给定的抽样误差范围,求出z z值值 根据根据z z值查表得值查表得F F(z z) 根据给定的置信度要求,来推算抽样极限误差的可能范围根据给定的置信度要求,来推算抽样极限误差的可能范围步骤:步骤:抽取样本,计算样本指标抽取样本,计算样本指标计算标准差,抽样平均计算标准差,抽样平均误差误差根据根据F F(z z)查出)查出z z值值计算极限误差计算极限误差求出求出估计总体指标的上下限,作区间估计估计总体指标的上下限,作区间估计1.

13、总体方差已知时总体方差已知时 当 , )时,来自该总体的简单随机样本 的样本均值 服从数学期望为 、方差 为 的正态分布,将样本均值统计量 标准化,得到 统计量: 根据区间估计的定义,在给定的显著性水平 下,总体均值在 1-的置信度下的置信区间为: ( , ),即 其中, 即抽样平均误差 , 即抽样允许误差。( NX2nxxx,21n/2X)1 ,0(/NnxZZnZX2/nZX2/XXXX)(xnnZ2/XX 例例 某厂生产的零件长度服从正态分布,从该厂生产的零件中随机抽取25件,测得它们的平均长度为30.2厘米。已知总体标准差 =0.45厘米。 要求:要求:(1)计算抽样平均误差和抽样允许

14、误差。 (2)估计零件平均长度的可能范围( =0.05)。 已知已知: , ), =30.2, =25, 1- =0.95,( NX245. 0Xn (1)抽样平均误差 查标准正态分布表可知在 =0.05时, =1.96,所以,抽样允许误差 (2)总体均值的置信区间为: ( , )= =( , )= (30.02,30.38) 即我们可以以95%的概率保证该厂零件平均长度在30.02厘米到30.38厘米之间。 09. 02545. 0)(nx2/Z1764. 009. 096. 12/nZxnZX2/nZX2/),(XXXX1764. 02 .301764. 02 .30*总体服从正态分布,但

15、总体服从正态分布,但总体方差 未知,可以以样本方差 代替,但新的统计量不服从标准正态分布,而是服从自由度为 n1的 t 分布。 *给定置信度1 ,可查 t 分布表确定临界值 从而总体均值的置信区间为: ( , ) 其中, 即为抽样平均误差; 即为抽样允许误差。上式也可表示为: 22S) 1(2/ntnSntX12/nSntX12/)(XnSnSnt12/XXXXX 例例 从某市高中生中按不重复抽样方法随机抽取25名调查每周收看电视的时间,分组资料见表7-2。 表7-2 每周看电视时间 要求:要求:(1)计算抽样平均误差和抽样允许误差; (2)估计该市全体高中生每周平均看电视时间的置信区间(给定

16、的显著性水平为0.05)。已知:已知: =25, =0.05, N远大于n,不重复抽样可按重复抽样处理样本均值 样本方差 =4.33 查 分布表知 =0.05时,临界值 = =2.0639,因此, 抽样平均误差 抽样允许误差n)小时( 5251987856321x2415)-(98)5-7(8)5-5(6)5-3(25)-(1222222s) 1(2/nt) 125(025. 0t416.02533.4)(nSX859.0416.00639.22/nStXt总体均值置信度为95%的置信区间为:( , ) = =(5-0.859,5+0.859)=(4.14,5.86) 即我们可以以95%的把握

17、保证该市高中生每周平均看电视时间在4.14到5.86小时之间。 nStX2/nStX2/),(XXXX *在大样本下,样本比例的分布趋近于均值为p 、方差为 的正态分布。因此,给定置信度1 ,查正态分布 表得 ,则样本比例的抽样极限误差为: 所以,总体比例的置信度为1 的置信区间为: npp)1(2/Z)(2/pZppppPp 例例 某厂对一批产成品按不重复抽样方法随机抽选200件进行质量检测,其中一等品160件,试以90%的概率估计一等品率的范围。 已知已知: ,1- =90%, =200 查表知: =1.645 计算得样本比例的抽样平均误差为: 抽样极限误差为: 所以,该批产品的一等品比例

18、的置信区间为: 即这批产品的一等品率在75.35% 到84.66% 之间。%80200160pn2/Z%83.2200%)801 (%80)1 ()(nppp%655. 4%83. 2645. 1)(2/pZp%655. 4%80%655. 4%80P 1.大样本情况下,样本标准差S的分布近似服从正态分布 ,所以,总体标准差的置信度为1- 的置信区间近似为: ( ) 2.小样本情况下,若总体呈正态分布且其均值和方差未知,则总体方差的置信区间可由如下统计量的分布来确定: 总体方差的置信度为1- 的置信区间为: ( , ) )2/,(2nNnSZSnSZS2,22/2/)1()1(2222nSn)

19、1()1(22/2nSn)1()1(22/12nSn 例例 从某班学生中随机抽取16人,计算得语文平均成绩为75分,方差为25分。假定学生成绩服从正态分布,试求总体方差及标准差的置信区间(给定的显著性水平为0.05)。 解解:已知n=25, =0.05,查 分布表确定两个临界值: = = 将临界值数字带入上述公式中,总体方差和标准差的置信度为1-的置信区间分别为:( , ),即为(13.64,59.89); ( , ),即为(3.69,7.74)。 2) 1(2/12n262. 6) 116(975. 02) 1(2/2n488.27) 116(025. 02488.2725)116(262.

20、625)116(64.1389.59一、抽样方案设计的基本原则二、简单随机抽样三、类型抽样四、整群抽样五、机械抽样六、多阶段抽样(一)保证实现抽样随机性的原则(二)保证实现最大的抽样效果的原则 抽样设计的原则应是在一定的误差和可靠性的要求下选择费用最少的样本设计。 在通常情况下,提高抽样精度的要求与节省费用的要求往往有矛盾,因为要求抽样误差愈小,就要增加抽样单位数目,相应地要增加调查费用。但实际工作中并非抽样误差最小的方案就是最好的方案,因为不同的调查项目对于精度的要求往往是不同的,而且调查费用和精度之间并不是线性关系,可以用图表示。98精度(精度(%)100905075100费用(费用(%)

21、 此图表示用此图表示用100%的费用可的费用可以达到以达到100%的精度。但如果用的精度。但如果用75%费用就可以达到费用就可以达到98%的精度,的精度,若若98%的精度可满足需要时,就的精度可满足需要时,就没有必要再花没有必要再花25%的费用来获取的费用来获取余下的余下的2%的精度。的精度。简单随机抽样,又称纯随机抽样。它是对总体不作任何处理,不进行分类也不搞排队,而是从总体的全部单位中随机抽选样本单位。具体做法:1.直接抽选法2.抽签法3.随机数码表法适用情况:1.对调查对象很少了解;2.总体单位的排列没有秩序;3.抽到的单位比较分散时也不影响调查工作。)1 ()1 ()1 ()1 (22

22、NnnppNnnnppnpxpx不重复抽样条件下:在重复抽样条件下:式为:简单随机抽样的误差公概念:类型抽样又称分类抽样,是先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,由各类(层)内的样本组成一个总的样本。优点:1.可以提高样本的代表性。由于分类使差别大的单位分开,使样本单位的分布更接近总体的分布;2.可以降低影响抽样误差的方差。由于进行了分类,所以影响抽样误差的只是各个组之内的方差,而各个组之间的方差已经不再影响抽样误差了,因为每个组都进行了抽样调查,因此对所有的组来讲,实际上是全面调查。而由于分类的结果,各个组内的方差是比较小的。作用:1.利用已知的信息

23、提高抽样效率;2.抽样的组织工作比较方便;3.掌握总体中各个子总体的情况。1、比例分配法:不考虑各组标志差异程度,而是根据统一的比例来确定各组要抽取的样本单位数,即通常以各类型组的单位数占全及总体单位数的比例,来确定各组抽取的单位数。个。个,平原抽陵各抽个乡调查,则山区、丘个,要从其中抽出个,平原个,丘陵个乡,其中山区例,某县有样本单位数的公式:计算各类型组应抽取的32712882844332211nNNnNnNnNnNnNnNniiii2480001201600368000120240060%5 . 1400080001204000,1600,2400,4000,120,8000232132

24、1nnnNNNnN本单位数为:计算各组需要抽取的样总体分成三个类型组:共要抽取样本单位数,全及总体单位数例nRNRNnRRnnnNNNnNnNNniiiiiiiiiiiiii用以下公式计算:,替代上式中的可以用,距但容易估计出各组的全,不知道各组的标准差实际工作中,事先往往465.46120301600152400104000301600358.34120301600152400104000152400397.38120301600152400104000104000方法为:计算各组抽取单位数的.30,15,10:假定各组标准差分别为.1600,2400,4000总体分成三个类型组:.120共

25、需抽取样本单位数,8000例如,总体单位数公式:计算各组抽样单位数的321321321概念:也称为集团抽样,它是将总体各单位划分成若干群,然后以群为抽样单位,从其中随机抽取部分群,对中选群的所有单位进行全面调查的抽样组织方式。特点: 整群抽样是对中选群进行全面调查,所以只存在群间抽样误差,不存在群内抽样误差。这一点和类型抽样只存在组内抽样误差恰好相反。因此,整群抽样和 类型抽样虽然都要对总体各单位进行分组,但对分组所起的作用则是完全不同的: 类型抽样分组的作用在于尽量缩小组内的差异程度,达到扩大组间方差提高效果的目的。 而整群抽样分组的作用则在于尽量扩大群内的差异程度,从而达到缩小群间方差提高

26、效果的目的。作用:I.当总体缺乏包括全部总体单位的抽样框,无法进行抽选时须采用整群抽样;II.比较方便和节约费用。局限性:样本单位比较集中,在总体中分布不均匀,抽样误差大。1.抽出群数多少。设所有的群数为R,抽出的群数为r。显然抽出的r的数目越多,抽样误差越小;2.群间方差,即群与群之间的差异程度。其计算方法如下:群间方差抽样各群的总平均数;抽样各群的平均数;全及平均数;全及各群的平均数;式中,或者:22222)()(xxXXrxxRXXiiixix(1)平均数的群间方差:(2)成数)成数的群间方差:的群间方差:抽样各群的总成数;抽样各群的成数;全及成数;全及各群的成数;式中:或者:ppPPr

27、ppRPPiiipip2222)()(3、抽样方法:整群抽样都采用不重复抽样方法,、抽样方法:整群抽样都采用不重复抽样方法,计算时要使用修正系数。计算时要使用修正系数。1RrR案例:某工厂生产某种灯泡,在连续生产720小时中每隔24小时抽取1小时的全部产品加以检查,根据抽样资料计算结果,灯泡平均使用寿命1200小时,群间方差为60小时,计算样本平均数的抽样误差,并以95%的可靠程度推断该批灯泡的平均使用寿命。)1()1(22RrRrRrRrppxx)来替代。可以用(式中的的数目较大时,两个公当式中RrRrRR11小时之间。小时寿命在即该批灯泡的平均使用平均使用寿命为:的概率估计该批灯泡的以(小

28、时)小时,小时,根据资料:72.120229.1197715. 21200385. 196. 11200%95385. 1)172030720(3060)1(3024720,72060120022RrRrrRxxx概念:又称等距抽样或系统抽样,是对研究的总体按一定的顺序排列,每隔一定的间隔抽取一个或若干个单位,并把这些抽取的单位组成样本进行观察的一种抽样方法。个单位为止。可用图示直到抽满即第个单位为一抽中单位,以后每隔个单位为抽中单位,则第,设为随机地抽取一个随机数中个单位,然后在段,每段中有把总体单位分成离,这样实际上称为抽样间隔或抽样距令排列,个总体单位按一定顺序其抽选方法是先将的样本,容

29、量为个单位,现须抽取一个设总体有nknikikiknikknknNkNnN,)1(,2,1,/kkkkiI+kI+2kI+(n+1)k作用:可以保证所取到的样本单位均匀地分布在总体的各个部分,作用:可以保证所取到的样本单位均匀地分布在总体的各个部分,有较高的代表性,可以减小抽样误差。有较高的代表性,可以减小抽样误差。机械抽样中作为总体各单位顺序排列的标志,可以是无关标志,也可以是有关标志。按照排队所依据的标志不同,可分为:(一)无关标志排队,是指排列的标志和单位标志值的大小无关或不起主要的影响作用。 例如,工业产品质量抽查按时间顺序取样,农产量抽样调查按田间的地理顺序取样,家计调查按街道的门牌

30、号码抽取调查户等。(二)有关标志排队:是指作为排列顺序的标志和单位标志值的大小有密切关系。 例如,农产量抽样调查,利用近几年平均亩产或当年估计亩产排队;职工家计调查按职工平均工资排队抽取调查单位或调查户等。v按有关标志顺序排队,并根据样本单位数加以n等分之后,对每一部分抽取一个单位有三种方法:I.随机起点等距抽样: a, k+a, 2k+a, ,( n-1)k+aII.半距中点取样:个单位构成样本。共有离都是个单位,每个单位的距nkknkkk,21) 1( ,212 ,211 ,2III.对称等距取样: i, 2k-i,2k+i,4k-i,(n-2)k+i,nk-i等等。机械抽样的平均误差和标

31、志的排列顺序有关,情况比较复杂。无关标志排队,近似于简单随机抽样的误差,可以采用简单随机抽样误差公式来近似反映。即:nppnpx)1 ( )1 ()1 ()1 (2NnnppNnnpx或:或:有关标志排队:可以看作一种特殊的分类抽样,可以用类型抽样的抽样误差有关标志排队:可以看作一种特殊的分类抽样,可以用类型抽样的抽样误差公式来计算抽样误差。即:公式来计算抽样误差。即:nppnpix)1 (2在等距抽样时,每个组内只抽取一个在等距抽样时,每个组内只抽取一个单位,因此,单位,因此,nNNNnNnixiiiiii21111, 1所以从而,概念:就是在抽样调查抽选样本时,分两个或两个以上的阶段来进行

32、。作用:1.当抽样调查的面很广,没有一个包括所有总体单位的抽样框,或者总体范围太大无法直接抽取样本时,须采用多阶段抽样。2.可以相对地节约人力物力。3.可以利用现成的行政区划、组织系统作为划分各阶段的依据,为组织抽样调查提供方便。步骤:省地块农户乡或村县注意:整群抽样中每一阶段抽样都会存在抽样误差。为提高抽样指标的代表注意:整群抽样中每一阶段抽样都会存在抽样误差。为提高抽样指标的代表性,各阶段抽取群数的安排和抽样方式,都应注意样本单位的均匀分布性,各阶段抽取群数的安排和抽样方式,都应注意样本单位的均匀分布1、适当多抽第一阶段的群数,使样本单位在总体中得到均匀分布。、适当多抽第一阶段的群数,使样

33、本单位在总体中得到均匀分布。2、根据方差的大小,来考虑各阶段抽取群数的多少。群间方差大、根据方差的大小,来考虑各阶段抽取群数的多少。群间方差大的阶段适当多抽一些,反之,则可少抽一些。的阶段适当多抽一些,反之,则可少抽一些。3.在各阶段灵活运用各种抽样组织方式,而且尽可能利用现成的资料。在各阶段灵活运用各种抽样组织方式,而且尽可能利用现成的资料。.21,21,21rmnmRMNMRmmmnmrMMMMNrRMRriiRi,则有相等,都为从各组抽取的单位数也,而且,则有,都为组中各组的单位数相等为简化起见,假定是不等的。可以是相等的,也可以各组抽取的样本单位数。样本单位数个单位,构成一个样本组中分

34、别随机抽取、从中选的是不等的。可以是相等的,也可以各组单位数总体单位数组;组中随机抽取个单位。第一步从组,每组包括、将总体划分为步骤:特点:特点:两阶段抽样和类型抽样的区别两阶段抽样和类型抽样的区别两阶段抽样在第一阶段只是随机地抽取两阶段抽样在第一阶段只是随机地抽取部分的组;而类型抽样在第一阶段取了全部的组。部分的组;而类型抽样在第一阶段取了全部的组。两阶段抽样和整群抽样的区别两阶段抽样和整群抽样的区别两阶段抽样在第二阶段只是在中选组中两阶段抽样在第二阶段只是在中选组中随机地抽取部分单位,而整群抽样在第二阶段抽取了中选组的全部单位。随机地抽取部分单位,而整群抽样在第二阶段抽取了中选组的全部单位

35、。所以,所以,两阶段抽样在组织技术上是类型抽样和整群抽样的综合。两阶段抽样在组织技术上是类型抽样和整群抽样的综合。rmrMmMrmRrRrrMmMrmRrRrxrxrmxxmxxijixmrrRxxriiriirimjijmjijiij222212222221111)1()1(,_),1(_,),1(:或者差为:以上两阶段抽样平均误平均数是各抽样群群内方差的式中,方差为第二阶段抽样平均数的方差。第一阶段抽样群的群间式中数的方差为,则第一阶段抽样平均数为如果估计量的样本平均计算则抽样平均数可由下式,样本群的抽样平均数为第个样本单位的标志值,样本群第表示第以个单位,组成样本。群中,每群随机抽取群,

36、并且从群中随机抽取现在从总体 某地区共有30000户居民分成100群,每群包括300户,现欲调查居民的收入水平。如果用两阶段抽样,先以群为第一阶段抽取单位,从100群中抽6群,然后以住户为第二阶段的抽取单位,从抽中的群体中每群抽3户,调查其平均收入。计算两阶段样本平均数的抽样误差,并以95%的可靠程度推断该地区居民每户平均收入。R=100,M=300,r=6,m=3(元)(元)(元)(元)(元)(元)各群内方差:(元)全体样本平均数:162233136361136989.384361.60877. 129.54467.1703256025622.422329.71109.1129.54467.

37、466390010040022.422329.54409.1129.71122.422654433.48543433.39335067.3262625242322211rxxrii元之间。即每户人均月收入应在民每户平均收入为:的把握程度推断该区居以元数的抽样误差:两阶段抽样的样本平均各群的群间方差:(元)各群群内方差平均数06.48238.36284.5922.42253.3096. 122.42296. 1%95)(53.3009.3223.900)13003300(3645.581)11006100(670.5688)1()1(70.56886)22.422544()22.42233.48

38、5()22.422434(6)22.42233.393()22.422350()22.42267.326()(45.5816162289.38467.17022.42267.46622.422222222221221122xixriiriixMmMrmRrRrrxxr确定抽样单位数的意义:1.认识允许有一定的误差。在一定的允许误差的条件下,只需要抽取一定的样本单位。抽取的样本单位数过多,会增加不必要的开支,造成人力物力浪费;但若抽取的样本单位数过少,又会使误差增大,达不到所要求的准确程度。2.抽样数目是影响抽样误差的重要因素,如果其他条件都相同,要改变对抽样误差的要求,就可以相应地改变抽样数目

39、,用增加或减少抽样数目的办法来控制抽样误差的大小。确定抽样单位数的原则: 在保证抽样推断达到预期的可靠程度和精确程度的要求下,确定一个恰当的抽取样本单位的数目。确定抽样单位数的依据:1.调查者对一项抽样推断的可靠程度和精确程度的要求;2.总体标志的变异程度;3.抽样组织方法;4.人力、物力和财力的许可情况。计算简单随机抽样平均指标的必要抽样单位数公式:2222222222xxxxxtntntntt移项:等式两端平方:由于:重复抽样重复抽样222222222222222222222222222)1 ()1 (tNNtnNtntNnntNtNnnNntNtnNntntNnntNnnttxxxxxx则:移项:等式两端平方:由于:不重复抽样不重复抽样简单随机抽样成数的必要抽样数目公式:22)1 (ppptn重复抽样重复抽样)1 ()1 (222pptNppNtnp不重复抽样不重复抽样计算类型抽样的必要抽样单位数的公式:22222)1 (pxpptntn)1 ()1 (22222222pptNNpptntNtnpx不重复抽样不重复抽样重复抽样重复抽样整群抽样计算必要抽样公式:2222222222tRRtrtRRtrpx机械抽样计算必要抽样单位数公式:)1 ()1 (22222222pptNNpptntNNtnpx

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|