1、4 抽样设计与组织实施 一、抽样设计的基本原则一、抽样设计的基本原则1遵循随机原则2控制误差范围3考虑投入产出关系4保证必要的样本容量5选择适宜的抽样组织方式(二)抽样框的编制 抽样框是实施抽样调查的基础条件之一,它是指由现象总体的所有单位组成的一个框架。在抽样调查实践中,抽样框一般有三种形式:在抽样调查实践中,抽样框一般有三种形式:一是名录抽样框,即将总体中所有单位排列而成的抽样框;二是区域抽样框,即按自然地理位置排列而成的抽样框;三是时间抽样框,即将一个较长时间过程划分为若干个较短的时间单位所形成的抽样框。如何编制抽样框?如何编制抽样框?这就要根据对总体单位了解的程度而定:1)如果对总体单
2、位不甚了解,就只能编制总体单位清单或是地段抽样框;2)如果是对总体单位的情况较了解,甚至还掌握了与调查内容有关的标志表现的资料,就可以按有关标志值的高低进行有序排队。例如,进行农产品产量抽样调查,如果掌握了各村甚至各田块、地块上期的平均亩产,就可以将这些村各田块、地块按上期的平均亩产由低到高排队。3)有时总体单位的形成时间知道比较清楚,就可以按时间编制抽样框,如流水线上的产品质量检验,可以把一天时间分为许多抽样时间单位而按顺序排列成抽样框。二、常用的抽样组织形式二、常用的抽样组织形式(一)简单随机抽样(二)类型抽样(三)等距抽样(四)整群抽样(五)阶段抽样(一)简单随机抽样(一)简单随机抽样1
3、 1简单随机抽样的含义和特点简单随机抽样的含义和特点 简单随机抽样又称纯随机抽样,是指不对总体作任何简单随机抽样又称纯随机抽样,是指不对总体作任何加工整理,直接从总体中抽取调查单位的抽样调查方式。加工整理,直接从总体中抽取调查单位的抽样调查方式。它是各种抽样组织方式中最基本的形式,其他各种抽样组它是各种抽样组织方式中最基本的形式,其他各种抽样组织方式都是以简单随机抽样的随机抽样原则为依据并采取织方式都是以简单随机抽样的随机抽样原则为依据并采取排队、分类、分群等形式而派生的抽样组织方式。排队、分类、分群等形式而派生的抽样组织方式。这种方法的优点是使用起来简便易行,而且用被抽中这种方法的优点是使用
4、起来简便易行,而且用被抽中的单位作样本推断总体最具有代表性,它适用于总体单位的单位作样本推断总体最具有代表性,它适用于总体单位数不太多的均匀总体。数不太多的均匀总体。2简单随机抽样的方法简单随机抽样的方法 (1)(1)抽签法。它适用于总体单位数较少的总体。首先将抽签法。它适用于总体单位数较少的总体。首先将总体单位编号,通常对总体中的每个单位按自然数的顺序总体单位编号,通常对总体中的每个单位按自然数的顺序编为编为1 1,2 2,3 3,N N,另外制定,另外制定N N个与总体各单位对应的号个与总体各单位对应的号签,然后将全部号签充分摇匀,采用重复抽样或不重复抽签,然后将全部号签充分摇匀,采用重复
5、抽样或不重复抽样方法,从中随机抽取样方法,从中随机抽取n n个号签与之对应的总体单位,即为个号签与之对应的总体单位,即为抽中的样本单位组成的样本。抽中的样本单位组成的样本。2简单随机抽样的方法简单随机抽样的方法 (2)(2)随机数表法。在大规模的社会经济调查中,由于总随机数表法。在大规模的社会经济调查中,由于总体单位数目特别大,使用抽签法的工作量相当大,所以通体单位数目特别大,使用抽签法的工作量相当大,所以通常利用随机数表来确定样本单位。随机数表是用计算机、常利用随机数表来确定样本单位。随机数表是用计算机、随机数字机等方法编制的(见附表)。根据不同的需要,随机数字机等方法编制的(见附表)。根据
6、不同的需要,可灵活确定随机数的起始位置,按行、列或划某一随机线可灵活确定随机数的起始位置,按行、列或划某一随机线取得随机数字,利用取得的随机数字对应编号的单位组成取得随机数字,利用取得的随机数字对应编号的单位组成样本。样本。3简单随机抽样的抽样平均误差的计算简单随机抽样的抽样平均误差的计算(二)类型抽样(二)类型抽样 1 1类型抽样的概念与特点类型抽样的概念与特点 类型抽样又称分层抽样或分类抽样,它是先将所要调查类型抽样又称分层抽样或分类抽样,它是先将所要调查的总体按照某一标志分成若干个类型的组,使各组内标志比的总体按照某一标志分成若干个类型的组,使各组内标志比较接近,不同组之间标志有明显的差
7、异,然后,再从各个组较接近,不同组之间标志有明显的差异,然后,再从各个组中采取简单随机抽样或机械随机抽样的方法抽取样本单位。中采取简单随机抽样或机械随机抽样的方法抽取样本单位。其主要应用于总体内其主要应用于总体内各单位在被研究标志上有明显差别的抽各单位在被研究标志上有明显差别的抽样,如研究农作物产量时,耕地有平原、丘陵和山地等区别;样,如研究农作物产量时,耕地有平原、丘陵和山地等区别;研究职工的工资水平时,各行业之间有明显的差别。研究职工的工资水平时,各行业之间有明显的差别。(二)类型抽样(二)类型抽样 类型抽样的特点是把统计分组和抽样原理有机地结合在类型抽样的特点是把统计分组和抽样原理有机地
8、结合在一起,通过分组,使组内具有同质性,组间具有差异性,然一起,通过分组,使组内具有同质性,组间具有差异性,然后从各组中采用简单随机抽样或机械抽样的方法,这样就可后从各组中采用简单随机抽样或机械抽样的方法,这样就可以保证样本对总体具有更高的代表性,因此,计算出的抽样以保证样本对总体具有更高的代表性,因此,计算出的抽样误差就比简单随机抽样误差和机械抽样误差要小一些。误差就比简单随机抽样误差和机械抽样误差要小一些。2 2类型抽样的方法类型抽样的方法 将全及总体进行分类以后,如何分配各组的抽样数目?将全及总体进行分类以后,如何分配各组的抽样数目?可采用两种方法:可采用两种方法:一种是按各组的标志变动
9、度来分配,标志变动度大的一种是按各组的标志变动度来分配,标志变动度大的组,可适当多抽一些样本单位,标志变动度小的组,抽样组,可适当多抽一些样本单位,标志变动度小的组,抽样数目可适当少一些;数目可适当少一些;另一种分配方法是等比例地分配各组的抽样单位数,另一种分配方法是等比例地分配各组的抽样单位数,即按各组单位数与总体单位数的比重来分配抽样数目,通即按各组单位数与总体单位数的比重来分配抽样数目,通常称为等比例类型抽样。常称为等比例类型抽样。3 3类型抽样的抽样平均误差的计算类型抽样的抽样平均误差的计算3 3类型抽样的抽样平均误差的计算类型抽样的抽样平均误差的计算22 (三)等距抽样(三)等距抽样
10、 等距抽样又称为机械抽样或系统抽样,它是先将总体按等距抽样又称为机械抽样或系统抽样,它是先将总体按某一标志值排序,然后按照固定的顺序和相同的间隔来抽选某一标志值排序,然后按照固定的顺序和相同的间隔来抽选样本单位的抽样组织方式。等距抽样可以分为按无关样本单位的抽样组织方式。等距抽样可以分为按无关 标志标志排序抽样和按有关标志排序抽样两类。排序抽样和按有关标志排序抽样两类。按无关标志排序的等距抽样是指排序的标志与被研究的按无关标志排序的等距抽样是指排序的标志与被研究的标志无关,如考查学生考试成绩用姓氏笔画排序,观察产品标志无关,如考查学生考试成绩用姓氏笔画排序,观察产品的质量按生产的先后顺序排序等
11、。按无关标志排序可以保证的质量按生产的先后顺序排序等。按无关标志排序可以保证抽样的随机性,它实质上相当于简单随机抽样,一般按不重抽样的随机性,它实质上相当于简单随机抽样,一般按不重复简单随机抽样的抽样误差公式来计算抽样误差。复简单随机抽样的抽样误差公式来计算抽样误差。(三)等距抽样(三)等距抽样 按有关标志排序的等距抽样,是指排序的标志与被研按有关标志排序的等距抽样,是指排序的标志与被研究的标志相关。如农产品产量调查时,将地块按过去连续究的标志相关。如农产品产量调查时,将地块按过去连续几年的亩产量排序;家庭生活消费水平调查中,按家庭收几年的亩产量排序;家庭生活消费水平调查中,按家庭收入额排序。
12、一般是从第一部分的中点抽取第入额排序。一般是从第一部分的中点抽取第 一个样本单一个样本单位,然后,按相等的距离依次逐个抽取位,然后,按相等的距离依次逐个抽取n-ln-l个单位组成被调个单位组成被调查的样本。查的样本。等距抽样均为不重复抽样。按无关标志排序的等距抽等距抽样均为不重复抽样。按无关标志排序的等距抽样,其抽样平均误差的计算公式与简单随机不重复抽样的样,其抽样平均误差的计算公式与简单随机不重复抽样的组织方式相组织方式相同;按有关标志排序的等距抽样,其抽样平均同;按有关标志排序的等距抽样,其抽样平均误差的计算公式与类型抽样的组织方式相同。误差的计算公式与类型抽样的组织方式相同。(四)整群抽
13、样(四)整群抽样 1 1整群抽样的含义整群抽样的含义 整群抽样也叫分群抽样或集团抽样,是将总体划分为整群抽样也叫分群抽样或集团抽样,是将总体划分为若干群,然后以群为单位若干群,然后以群为单位从中随机地抽取部分群,最后对从中随机地抽取部分群,最后对中选群中的所有单位进行全面调查的抽样组织方式。中选群中的所有单位进行全面调查的抽样组织方式。例如,要了解某市一年中自行车丢失情况,将该市按例如,要了解某市一年中自行车丢失情况,将该市按派出所行政区域划分为若干个群,然后随机地抽取一些派派出所行政区域划分为若干个群,然后随机地抽取一些派出所,随后对抽中派出所管辖的居民进行全面调查,了解出所,随后对抽中派出
14、所管辖的居民进行全面调查,了解这些派出所区域内丢失自行车的整体情况。这些派出所区域内丢失自行车的整体情况。(四)整群抽样(四)整群抽样 2 2整群抽样的特点整群抽样的特点 (1)(1)整群抽样不需要编制总体单位抽样框,只需编制总整群抽样不需要编制总体单位抽样框,只需编制总体群的抽样框,因而后者比前者工作量少,在大规模抽样体群的抽样框,因而后者比前者工作量少,在大规模抽样调查中,如果总体单位太多,分布区域太广,又缺乏抽样调查中,如果总体单位太多,分布区域太广,又缺乏抽样框或不宜编制抽样框,则宜采用这种方式。框或不宜编制抽样框,则宜采用这种方式。(2)(2)影响抽样平均误差的方差是群间方差,而不是
15、群内影响抽样平均误差的方差是群间方差,而不是群内方差。因为对被抽中的样本群来说,对群中所有的总体单方差。因为对被抽中的样本群来说,对群中所有的总体单位进行全面调查,因此,群内不产生抽样误差。位进行全面调查,因此,群内不产生抽样误差。(四)整群抽样(四)整群抽样(四)整群抽样(四)整群抽样 (五)阶段抽样(五)阶段抽样 在抽样调查中,由于被研究对象有时是一个相当复杂的现象总体,抽选调查单位时,很难一次就能够抽出被调查单位,在这样的情况下,需要将样本单位的抽选分阶段进行。假若抽出的样本单位直接就是总体单位,叫单阶段抽样。如简单随机抽样、类型抽样。如果先将总体进行分组,从中随机抽取一些组,然后再从中
16、选的组中随机抽取总体单位,叫两阶段抽样。如整群抽样就是第二阶段抽样比为100%的一种特殊的两阶段抽样。如果将总体进行多层次的分组,然后依次在各组中随机抽取,直到抽取总体单位,称为多阶段抽样。如我国农产量的调查就是采用多阶段抽样,即先从省中抽县,然后从中选的县抽乡,乡中抽村,再由中选的村中抽地块,最后从中选的地块中抽取小面积的样本单位。实际工作中,当总体单位很多、分布很广,又几乎不可能从总体中直接抽取单位时,常常采用多阶段抽样。其优点:首先,便于组织抽样。它可以按现有的行政区划或地理区域划分各阶段的抽样单元,从而简化抽样框的编制。其次,它可以获得各阶段单元的调查资料,根据最初资料进行逐级抽样推断
17、,得到各级的调查资料。如农产品产量调查,可根据样奉推断地块资料,根据地块资料可推断村的资料,然后依次推断乡、县等。第三,多阶段抽样的方式比较灵活,各阶段抽样的组织方式应以前述的几种抽样组织方式为依据进行选择。一般在初级阶段时多用分层抽样和等距抽样,在次级阶段时多用等距抽样和简单随机抽样。同时,还可以根据阶段的不同特点,采用不同的抽样调查比。如在方差大的阶段,抽样比大一些,方差小的阶段,抽样比小一些。而且,多阶段抽样在简化抽样工作的同时,又因抽样单位的分布较广,而具有较强的代表性。三、样本容量的确定三、样本容量的确定 在抽样调查中,样本容量越大,样本对总体的代表性越在抽样调查中,样本容量越大,样
18、本对总体的代表性越大,抽样误差越小;样本容量越小,抽样误差就要增大。但大,抽样误差越小;样本容量越小,抽样误差就要增大。但是,抽样数目越多,抽样调查的费用也越高,从而影响抽样是,抽样数目越多,抽样调查的费用也越高,从而影响抽样调查的优越性发挥。抽样数目过多,还会影响抽样调查的时调查的优越性发挥。抽样数目过多,还会影响抽样调查的时效性;抽样数目过少,抽选的样本很难对总体有代表性,由效性;抽样数目过少,抽选的样本很难对总体有代表性,由此会影响到推断的准确性。为了避免样本容量的过大或过小,此会影响到推断的准确性。为了避免样本容量的过大或过小,必须恰当地确定样本容量。必须恰当地确定样本容量。(一)影响
19、样本容量的因素(一)影响样本容量的因素 1总体各单位标志变异程度 如果被研究总体的标志变异程度大,则应抽取较多的样本单位;反之,则应抽取较少的样本单位。2允许误差的范围 允许误差的范围,即指估计的精度。如果允许的误差范围小,即要求的精度高,应抽取较多的样本单位;反之,则应抽取较少的样本单位。3抽样推断的可靠程度 抽样推断的可靠程度,即指估计的置信度。抽样推断的可靠程度越高,抽取的样本单位则越多;反之,抽取的样本单位则越少。4抽样的方法和抽样的组织方式 在其他条件不变的情况下,重复抽样比不重复抽样抽取的样本要多一些。不同的抽样组织方式也是影响样本容量的一个重要因素。(二)简单随机抽样的样本容量(二)简单随机抽样的样本容量(二)简单随机抽样的样本容量(二)简单随机抽样的样本容量(二)简单随机抽样的样本容量(二)简单随机抽样的样本容量