第4章抽样调查技术要点课件.ppt

上传人(卖家):晟晟文业 文档编号:4844450 上传时间:2023-01-17 格式:PPT 页数:56 大小:2.04MB
下载 相关 举报
第4章抽样调查技术要点课件.ppt_第1页
第1页 / 共56页
第4章抽样调查技术要点课件.ppt_第2页
第2页 / 共56页
第4章抽样调查技术要点课件.ppt_第3页
第3页 / 共56页
第4章抽样调查技术要点课件.ppt_第4页
第4页 / 共56页
第4章抽样调查技术要点课件.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

1、北京邮电大学世纪学院抽样调查技术抽样调查技术韩 璐重点章节重点章节 为了获取总体的信息及特征,可以选择普查和抽样调为了获取总体的信息及特征,可以选择普查和抽样调查两种方法。总的来说,与普查相比抽样调查具有经济、查两种方法。总的来说,与普查相比抽样调查具有经济、及时、准确和高效的特点。及时、准确和高效的特点。普遍调查普遍调查抽样调查抽样调查 需要投入大量的人、财、物和时间需要投入大量的人、财、物和时间 获取的信息全面,但准确性未必高获取的信息全面,但准确性未必高 在对精度要求小,但是对整体状况详在对精度要求小,但是对整体状况详细性要求高时可采用这种方法,比如细性要求高时可采用这种方法,比如人口普

2、查,农业普查、企业员工整体人口普查,农业普查、企业员工整体素质普查等。素质普查等。时间短、效率高,投入资源较少时间短、效率高,投入资源较少 调查结果的正确性较高,但是获取调查结果的正确性较高,但是获取的信息全面性不如普查的信息全面性不如普查 可以通过统计推断技术来估计调查可以通过统计推断技术来估计调查总体的各项指标,是企业经常使用总体的各项指标,是企业经常使用的调查研究方法。的调查研究方法。普查与抽样调查普查与抽样调查抽样调查的定义抽样调查的定义 抽样调查又称样本调查,是指按照随机原则,抽样调查又称样本调查,是指按照随机原则,从研究总体个单位中,抽取部分单位作为样本,从研究总体个单位中,抽取部

3、分单位作为样本,按照以样本的调查结果对总体的数量特征做出具按照以样本的调查结果对总体的数量特征做出具有一定可靠度和精确度的估计或推断的一种调查有一定可靠度和精确度的估计或推断的一种调查方法方法。抽样调查的理论基础是概率论。抽样调查的理论基础是概率论。抽样调查是什么?抽样调查是什么?抽样调查要遵循随机原则吗?抽样调查要遵循随机原则吗?需要从研究总体中抽取样本需要从研究总体中抽取样本 吗?吗?能够可靠或准确的估计总体样本吗?能够可靠或准确的估计总体样本吗?有理论基础吗?有理论基础吗?概率论概率论简单随机抽样简单随机抽样系统抽样系统抽样整群抽样整群抽样分层抽样分层抽样方便抽样方便抽样配额抽样配额抽样

4、滚雪球抽样滚雪球抽样判断抽样判断抽样抽样方法抽样方法概率抽样概率抽样非概率抽样非概率抽样抽样调查的分类抽样调查的分类概率抽样概率抽样非概率抽样非概率抽样两种抽样的区别两种抽样的区别概率抽样又称随机抽样,是指按照随机概率抽样又称随机抽样,是指按照随机原则抽取样本,在抽取样本时排除主观原则抽取样本,在抽取样本时排除主观因素影响,不进行有意识的挑选,使每因素影响,不进行有意识的挑选,使每个单位都有一定机会被抽中。个单位都有一定机会被抽中。非概率抽样,它不遵循随机原则,而非概率抽样,它不遵循随机原则,而是从方便、快捷出发抽取样本,或是是从方便、快捷出发抽取样本,或是根据主观有目的地挑选样本。根据主观有

5、目的地挑选样本。遵循随机原则遵循随机原则 客观抽样客观抽样 每个单位都有相同机会每个单位都有相同机会 不遵循随机原则不遵循随机原则 主观判断抽样主观判断抽样 方便、快捷的抽取样本方便、快捷的抽取样本优:从概率样本中获得的信息含量较高。优:从概率样本中获得的信息含量较高。缺:抽取样本技术复杂,必须有合适的缺:抽取样本技术复杂,必须有合适的样本框,成本较高,对抽样人员专业技样本框,成本较高,对抽样人员专业技术要求高。术要求高。优:操作简便、时效快、成本低,适合优:操作简便、时效快、成本低,适合做探索性研究和预调查。做探索性研究和预调查。缺:无法估计和控制误差,无法用统计缺:无法估计和控制误差,无法

6、用统计方法来推断总体。方法来推断总体。第一步:定义有关的总体第一步:定义有关的总体抽样方案的设计步骤抽样方案的设计步骤第二步:获得总体的名单第二步:获得总体的名单第三步:设计样本方案第三步:设计样本方案明确总体:明确总体:1 1)抽样的单位是什么?(家庭还)抽样的单位是什么?(家庭还是个人)是个人)2 2)时间限制,需要获取哪一时间)时间限制,需要获取哪一时间段的信息?段的信息?3 3)空间限制,局限于哪个区域的)空间限制,局限于哪个区域的信息?信息?建立抽样框建立抽样框1 1)所有的样本均从抽样框中得到)所有的样本均从抽样框中得到2 2)抽样框误差会影响分析结果的)抽样框误差会影响分析结果的

7、可靠性可靠性确定样本数量和抽样方法确定样本数量和抽样方法1 1)确定抽样数量)确定抽样数量2 2)根据样本特征选择抽样方法)根据样本特征选择抽样方法概率抽样概率抽样简单随机抽样简单随机抽样 简单随机抽样又称单纯随机抽样、纯简单随机抽样又称单纯随机抽样、纯随机抽样、无限制随机抽样,它对调查总随机抽样、无限制随机抽样,它对调查总体不经过任何分组、排队,完全凭着偶然体不经过任何分组、排队,完全凭着偶然的机会从中抽取个体加以调查。的机会从中抽取个体加以调查。(1)(1)抽签法抽签法该方法适用于调查总体中个体数目较少的情况。该方法适用于调查总体中个体数目较少的情况。例如:北京小轿车摇号例如:北京小轿车摇

8、号(2)(2)随机数字表法随机数字表法该方法需要使用摇码器生成乱数表,而后在从中该方法需要使用摇码器生成乱数表,而后在从中抽取,也是适用于数量不大的总体。抽取,也是适用于数量不大的总体。随机数字表随机数字表0947437386162294773997742467628482532731167662276663017863591256859926332134122955595635645760328644从第从第1 1行第行第4 4列开始抽取,小于列开始抽取,小于7070的数。如果样本不够那么再的数。如果样本不够那么再从其他列抽取,直至抽够为止。从其他列抽取,直至抽够为止。(3)(3)计算机抽取

9、计算机抽取使用统计软件中都有的抽取随机样本的功能,使用统计软件中都有的抽取随机样本的功能,从中抽取,该方法简便快捷,但是需要注意,从中抽取,该方法简便快捷,但是需要注意,软件生成的随机数是伪随机数,随机效果并软件生成的随机数是伪随机数,随机效果并不理想。不理想。例如:商场让个人用电脑抽奖的活动例如:商场让个人用电脑抽奖的活动简单随机抽样的优点及局限性简单随机抽样的优点及局限性优点:优点:方法简单,易操作,理论上是最符合随机原则的。方法简单,易操作,理论上是最符合随机原则的。简单随即抽样适用于总体的个数不太庞大,总体分布简单随即抽样适用于总体的个数不太庞大,总体分布较为均匀的情况。较为均匀的情况

10、。局限性:局限性:(1 1)采用简单抽样必须对个体进行编号,当总体样本巨大,)采用简单抽样必须对个体进行编号,当总体样本巨大,且不断产生时逐一编号比较困难。且不断产生时逐一编号比较困难。(2 2)当调查总体的标志变异程度较大时,简单抽样的代表性)当调查总体的标志变异程度较大时,简单抽样的代表性就会下降。就会下降。(3 3)简单抽样样本较为分散,需要的调查投入较大。)简单抽样样本较为分散,需要的调查投入较大。系统抽样系统抽样系统抽样是指将总体中的单位按某种系统抽样是指将总体中的单位按某种顺序排列顺序排列,在规定的范围,在规定的范围内随即抽取起始单位,然后按一定的规则确定其他样本单位的内随即抽取起

11、始单位,然后按一定的规则确定其他样本单位的抽样方法。抽样方法。抽选距离抽选距离=N Nn n=k=kNN调查总体数;调查总体数;nn样本数;样本数;kk最接近最接近N/nN/n的整数。的整数。排序的标志:排序的标志:按与调查项目无关的标志排序,如电话号码按与调查项目无关的标志排序,如电话号码排序;排序;按与调查项目有关的标志排序,如最近购买时间。按与调查项目有关的标志排序,如最近购买时间。例:从某小区例:从某小区600600户家庭中抽选户家庭中抽选5050户进行消费习惯调查,可以户进行消费习惯调查,可以利用小区物业管理的现有名册按顺序编号排序,从第利用小区物业管理的现有名册按顺序编号排序,从第

12、1 1号编至号编至600600号。号。抽选距离抽选距离=N Nn n=12=126006005050=抽取方式:从第一个抽取方式:从第一个1212户中用简单随即抽样的方式抽取第户中用简单随即抽样的方式抽取第1 1个样本个体,假如抽到的是个样本个体,假如抽到的是8 8号,则后续依次抽中号,则后续依次抽中2020号号3232号号4444号号,直至抽够,直至抽够5050户为止。户为止。系统抽样的优点及局限性系统抽样的优点及局限性局限性:局限性:(1 1)需要调查总体中每个个体的详细材料,尤其是按有关标)需要调查总体中每个个体的详细材料,尤其是按有关标志排序时,较为困难;志排序时,较为困难;(2 2)

13、当抽选间隔与被调查本身的节奏性相重合时会影响调查)当抽选间隔与被调查本身的节奏性相重合时会影响调查精度。精度。系统抽样适用于总体时间周期性不强的情况。系统抽样适用于总体时间周期性不强的情况。优点:优点:操作简便,只要随即确定一个起始单位整个样本就可以确定操作简便,只要随即确定一个起始单位整个样本就可以确定了。当研究对象的标志变异程度较大,又不可能抽取更多样了。当研究对象的标志变异程度较大,又不可能抽取更多样本个体时,这种方法能比较均匀的调查总体。本个体时,这种方法能比较均匀的调查总体。例:对军队中士兵对待战争的积极性进行调查,采用例:对军队中士兵对待战争的积极性进行调查,采用系统抽样的方法,将

14、士兵的编号按班排序(每班系统抽样的方法,将士兵的编号按班排序(每班1010人),进行抽样,从人),进行抽样,从1 1号开始抽取,接下来是号开始抽取,接下来是1111号、号、2121号号,调查发现士兵对待战争的积极性很高。但,调查发现士兵对待战争的积极性很高。但是经过对样本进行研究发现,被抽到的士兵都是每班是经过对样本进行研究发现,被抽到的士兵都是每班的班长,样本的代表性就有问题了!的班长,样本的代表性就有问题了!分层抽样分层抽样分层抽样,是指先将调查总体的所有个体分层抽样,是指先将调查总体的所有个体按某一重要标志按某一重要标志进行进行分类(分组),然后在各类(组)中采用简单随即抽样或系统分类(

15、分组),然后在各类(组)中采用简单随即抽样或系统抽样方式抽取样本个体的抽样方法。抽样方式抽取样本个体的抽样方法。分层抽样主要是希望增加样本的代表性,避免单纯随机抽样的分层抽样主要是希望增加样本的代表性,避免单纯随机抽样的样本过于集中于某种特性或完全无某种特性。样本过于集中于某种特性或完全无某种特性。N=NN=Ni i=N=N1 1+N+N2 2+N+N3 3+N Nk k进行分层抽样时,先将整个母体按照各种特性划分成进行分层抽样时,先将整个母体按照各种特性划分成i i个副次母(层):个副次母(层):n=n=n ni i=n=n1 1+n+n2 2+n+n3 3+n nk k再由各层中随机抽取样

16、本单位若干个,如再由各层中随机抽取样本单位若干个,如n n1 1,n n2 2,n nk k 根据样本在各层中分配方法不同,可以分为等比分层抽根据样本在各层中分配方法不同,可以分为等比分层抽样和非等比分层抽样两种方法。样和非等比分层抽样两种方法。1.1.等比分层抽样:按各层中个体数量占总体数量的比例分等比分层抽样:按各层中个体数量占总体数量的比例分配各层的样本数量。配各层的样本数量。例:某产品的用户共有例:某产品的用户共有50005000个,按用户的个,按用户的“年平均支出年平均支出”将其将其分为分为“大客户大客户”、“一般客户一般客户”和和“临时客户临时客户”。从中抽取。从中抽取800800

17、个用户进行消费者调查。个用户进行消费者调查。客户类型客户类型各层客户总数量各层客户总数量各层占比各层占比应抽取样本数应抽取样本数大客户大客户1250125025%25%800800*25%=20025%=200一般客户一般客户2500250050%50%800800*50%=40050%=400临时客户临时客户1250125025%25%800800*25%=20025%=200等比分层抽样简便易行,分配合理,计算方便,适用于类等比分层抽样简便易行,分配合理,计算方便,适用于类型之间差异不大的分层抽样调查。型之间差异不大的分层抽样调查。2.2.非等比分层抽样:按其他因素(如各层平均数或成数非等

18、比分层抽样:按其他因素(如各层平均数或成数标准差的大小,抽样工作量或费用的大小等)调整各层标准差的大小,抽样工作量或费用的大小等)调整各层的样本个体数。的样本个体数。非等比分层抽样主要在于减低各层之间的标准差,使母非等比分层抽样主要在于减低各层之间的标准差,使母体平均数的估计更加精确。体平均数的估计更加精确。n ni i=n nN Ni iS Si iN Ni iS Si in ni i各层应抽出的样本数;各层应抽出的样本数;nn总样本数;总样本数;N Ni i各层的调查单位总数;各层的调查单位总数;S Si i各层调查单位的标准差。各层调查单位的标准差。非等比分层抽样适用于各层之间相差悬殊或

19、标准差相差较非等比分层抽样适用于各层之间相差悬殊或标准差相差较大的情况。大的情况。例:某产品的用户共有例:某产品的用户共有50005000个,按用户的个,按用户的“年平均支出年平均支出”将其将其分为分为“大客户大客户”、“一般客户一般客户”和和“临时客户临时客户”。从中抽取。从中抽取800800个用户进行消费者调查。个用户进行消费者调查。客户类型客户类型各层客户总各层客户总数量数量N Ni i样本标准样本标准差差S Si iN Ni iS Si i乘积乘积抽取的样本抽取的样本大客户大客户12501250100100125000125000800800*0.17=1360.17=136一般客户一

20、般客户25002500150150375000375000800800*0.5=4000.5=400临时客户临时客户12501250200200250000250000800800*0.33=2640.33=264N=5000N=5000750000750000800800可以看出,标准差较大的抽取的样本个体也较多,这样可可以看出,标准差较大的抽取的样本个体也较多,这样可以平衡标准差的作用。但准确了解各组标志值变异程度的以平衡标准差的作用。但准确了解各组标志值变异程度的大小比较困难。大小比较困难。分层抽样的优点及局限性分层抽样的优点及局限性优点:优点:把科学分组方法和抽样原理结合,能划分出性质

21、比较接近的组,把科学分组方法和抽样原理结合,能划分出性质比较接近的组,以减少标志值之间变异程度,然后按随机原则,可以保证大数以减少标志值之间变异程度,然后按随机原则,可以保证大数法则的准确运用。比前两种抽样更准确,能得到比较准确的推法则的准确运用。比前两种抽样更准确,能得到比较准确的推断,尤其是总体数目较大,内容结构复杂时。断,尤其是总体数目较大,内容结构复杂时。分层抽样优点较多,局限性较小,是调查中常用的分层抽样优点较多,局限性较小,是调查中常用的抽样方法。抽样方法。局限性:局限性:(1 1)在调查前准确了解各组标志值变异程度大小比较困难。)在调查前准确了解各组标志值变异程度大小比较困难。(

22、2 2)划分层次时,应尽量使)划分层次时,应尽量使各层之间具有显著性差异各层之间具有显著性差异,不致混,不致混淆。分层数目也不宜过多,淆。分层数目也不宜过多,各层内各单位应尽量保持相似各层内各单位应尽量保持相似。整群抽样整群抽样整群抽样也叫分群抽样,是指将总体分解为群,抽样直接抽取整群抽样也叫分群抽样,是指将总体分解为群,抽样直接抽取群,对抽中群中的个体单位全部或随机抽取部分进行调查(一群,对抽中群中的个体单位全部或随机抽取部分进行调查(一级整群抽样、二级整群抽样、三级整群抽样),以此来推断总级整群抽样、二级整群抽样、三级整群抽样),以此来推断总体的一般特性。体的一般特性。整群抽样时,整群抽样

23、时,各群的特性应尽量保持相近各群的特性应尽量保持相近,如人口、经济等。,如人口、经济等。但但每一群内部则应具有差异性每一群内部则应具有差异性。如:初级调查单位(如地区):具有相同性如:初级调查单位(如地区):具有相同性 次级调查单位(如家庭):具有差异性次级调查单位(如家庭):具有差异性整群抽样与分层抽样刚好相反:整群抽样与分层抽样刚好相反:高收入层高收入层高收入高收入高收入高收入高收入高收入中等收入层中等收入层中等收入中等收入中等收入中等收入中等收入中等收入低收入层低收入层低收入低收入低收入低收入低收入低收入分层抽样分层抽样第一群第一群高收入高收入第二群第二群中等收入中等收入第三群第三群低收

24、入低收入整群抽样整群抽样高收入高收入中等收入中等收入低收入低收入高收入高收入中等收入中等收入低收入低收入思考:思考:1 1、调查某产品消费者可支配收入去向时,可采、调查某产品消费者可支配收入去向时,可采用哪种方法?用哪种方法?2 2、调查一线城市消费者耐用品消费状况时,可、调查一线城市消费者耐用品消费状况时,可采用哪种方法?采用哪种方法?3 3、调查北京地区高校大学生用于购买电脑消费、调查北京地区高校大学生用于购买电脑消费状况时,可采用哪种方法?状况时,可采用哪种方法?分层抽样分层抽样整群抽样整群抽样整群抽样整群抽样分层抽样分层抽样系统抽样系统抽样系统抽样系统抽样分层抽样分层抽样整群抽样的优点

25、及局限性整群抽样的优点及局限性优点:优点:组织抽样和实施调查比较方便,节省了费用和时间。组织抽样和实施调查比较方便,节省了费用和时间。局限性:局限性:(1 1)与其他抽样方式相比,在抽样个体数目相同的条件下,)与其他抽样方式相比,在抽样个体数目相同的条件下,抽样误差较大,代表性较差。抽样误差较大,代表性较差。(2 2)采用整群抽样时,一般都要比其他抽样方法抽选更多的)采用整群抽样时,一般都要比其他抽样方法抽选更多的个体,以降低抽样误差,提高结果的准确性。个体,以降低抽样误差,提高结果的准确性。(3 3)抽样结果的可靠性还取决于群与群之间的差异大小,差)抽样结果的可靠性还取决于群与群之间的差异大

26、小,差异越小,整群抽样结果就越准确。异越小,整群抽样结果就越准确。在大规模市场调查中,当群体内各个体间差异性较大,而在大规模市场调查中,当群体内各个体间差异性较大,而各群之间差异性较小时,适合采用整群抽样。各群之间差异性较小时,适合采用整群抽样。几种概率抽样方法的选择与比较几种概率抽样方法的选择与比较对抽样误差大小的要求:对抽样误差大小的要求:有关标志值排队的系统抽样方式误差最小;有关标志值排队的系统抽样方式误差最小;分层抽样、按无标志值排队的系统抽样方式其次;分层抽样、按无标志值排队的系统抽样方式其次;简单随即抽样和整群抽样方式误差较大。简单随即抽样和整群抽样方式误差较大。抽样误抽样误差大小

27、差大小调查对象本身特点的要求:调查对象本身特点的要求:有无总体的全面、详细的资料,如果没有就无法有无总体的全面、详细的资料,如果没有就无法按有关标志值排队进行系统抽样;按有关标志值排队进行系统抽样;与对调查对象了解的程度与对调查对象了解的程度 也有关系。也有关系。调查对调查对象特点象特点人、财、物和事件等各种调查条件的要求:人、财、物和事件等各种调查条件的要求:样本的分散程度大、调查往返的时间长和费用大的情况样本的分散程度大、调查往返的时间长和费用大的情况下可以考虑整群抽样。下可以考虑整群抽样。调查调查条件条件 应当注意,强调根据调查要求和调查对象应当注意,强调根据调查要求和调查对象特点选择合

28、适的抽样方式,并特点选择合适的抽样方式,并不否认不否认几种概率几种概率抽样方式的抽样方式的结合运用结合运用。在实际调查中,特别是。在实际调查中,特别是在复杂、大规模的市场调查中,抽取的调查个在复杂、大规模的市场调查中,抽取的调查个体一般不是一次性直接进行的,而是体一般不是一次性直接进行的,而是采用两阶采用两阶段或多阶段抽取的方法段或多阶段抽取的方法。非概率抽样非概率抽样在以下情形下可以考虑进行非概率抽样:在以下情形下可以考虑进行非概率抽样:(1 1)由于客观条件的限制,无法很好的进行概率抽样;)由于客观条件的限制,无法很好的进行概率抽样;(2 2)调查人员具有丰富的积累,凭经验可以抽选出很好)

29、调查人员具有丰富的积累,凭经验可以抽选出很好的样本;的样本;(3 3)调研委托方对抽样误差没有过多要求,不需要对总)调研委托方对抽样误差没有过多要求,不需要对总体参数进行区间估计。体参数进行区间估计。常用的非概率抽样方式有:方便抽样、判断抽样、配常用的非概率抽样方式有:方便抽样、判断抽样、配额抽样和滚雪球抽样四种。额抽样和滚雪球抽样四种。方便抽样方便抽样方便抽样又称便利抽样或任意抽样,样本的抽选完全从调方便抽样又称便利抽样或任意抽样,样本的抽选完全从调查者的方便或便利出发。查者的方便或便利出发。1.1.入户调查入户调查2.2.拦截式访问拦截式访问3.3.利用客户名单进行调查利用客户名单进行调查

30、4.4.将问卷通过传播媒体(如纸媒、网络)上,被调查者自填将问卷通过传播媒体(如纸媒、网络)上,被调查者自填后寄回。后寄回。节省费用和时间,但样本信息不适用于对总体参数的推节省费用和时间,但样本信息不适用于对总体参数的推断,预调查时可以采用,正式调查较少采用。断,预调查时可以采用,正式调查较少采用。判断抽样判断抽样判断抽样是指根据调查人员的主观意愿、经验和知判断抽样是指根据调查人员的主观意愿、经验和知识,从总体中选择具有典型代表性的样本作为调查识,从总体中选择具有典型代表性的样本作为调查对象的抽样方法。对象的抽样方法。1.1.专家判断后选择样本专家判断后选择样本:平均型与多数型平均型与多数型2

31、.2.利用统计资料判断、选择样本利用统计资料判断、选择样本简便易行,符合调查目的和特殊需要,被调查者配合较简便易行,符合调查目的和特殊需要,被调查者配合较好,资料回收率高。但是容易发生主观判断抽样误差。好,资料回收率高。但是容易发生主观判断抽样误差。配额抽样配额抽样配额抽样也叫定额抽样,是指将总体中的各单位按配额抽样也叫定额抽样,是指将总体中的各单位按一定的标准划分为若干个类别,将样本数额分配到一定的标准划分为若干个类别,将样本数额分配到个类别中,在规定的数额内由调查人员任意抽选样个类别中,在规定的数额内由调查人员任意抽选样本。本。配额抽样可分为独立控制配额抽样和相互控制配配额抽样可分为独立控

32、制配额抽样和相互控制配额抽样两类。额抽样两类。收入水平收入水平高高5050中中5050低低5050总计总计150150年龄年龄20-2920-29岁岁404030-4430-44岁岁404045-6445-64岁岁40406565岁以上岁以上3030总计总计150150收入水平收入水平男男7575女女7575总计总计150150独立控制配额抽样独立控制配额抽样调查人员可以将某个单一的特征的分类作为抽样配额的标准。调查人员可以将某个单一的特征的分类作为抽样配额的标准。如按收入分,高、中、低各抽如按收入分,高、中、低各抽5050个,而不用规定高收入中男个,而不用规定高收入中男女比例或年龄分布。样本

33、容易偏向某一组别,从而影响样本女比例或年龄分布。样本容易偏向某一组别,从而影响样本代表性。代表性。相互控制配额抽样相互控制配额抽样收入水平总计高中低性别男女男女男女年龄20-29岁446610104030-44岁668812125245-64岁335511113865岁以上22335520总计151522223838150调查人员对调查对象的各个特征的控制特性的样本数额交叉调查人员对调查对象的各个特征的控制特性的样本数额交叉分配。如要求调查中高收入,分配。如要求调查中高收入,20-2920-29岁的男性和女性各为岁的男性和女性各为4 4个。个。对样本进行了更多的要求,调查面明显扩大,弥补了独立

34、控对样本进行了更多的要求,调查面明显扩大,弥补了独立控制配额抽样的缺点。制配额抽样的缺点。练习:按照通信费月平均支出与用户的年龄,根据政府公布练习:按照通信费月平均支出与用户的年龄,根据政府公布的统计资料抽取样本的统计资料抽取样本600600人。统计资料显示:人。统计资料显示:2222岁以下,支岁以下,支出出200200元元/月以下的用户占月以下的用户占22%22%,200200元(含)元(含)-500-500元的占元的占15%,50015%,500(含)以上的占(含)以上的占1%1%;2222岁及以上,支出岁及以上,支出200200元元/月以月以下的用户占下的用户占35%35%,200200

35、元(含)元(含)-500-500元的占元的占19%,50019%,500(含)以(含)以上的占上的占8%8%。请编制配额表并计算各层抽样比例。请编制配额表并计算各层抽样比例。通信费月平均支出通信费月平均支出家庭主妇年龄家庭主妇年龄总计总计2222岁以下岁以下2222岁及以上岁及以上200200元以下元以下22%22%35%35%50%50%200200(含)(含)-500-500元元15%15%19%19%37%37%500500(含)元以上(含)元以上1%1%8%8%13%13%合计合计38%38%62%62%100%100%通信费月平均支出通信费月平均支出家庭主妇年龄家庭主妇年龄总计总计2

36、222岁以下岁以下2222岁及以上岁及以上200200元以下元以下132132210210342342200200(含)(含)-500-500元元9090114114204204500500(含)元以上(含)元以上6 648485454合计合计228228372372100%100%配额抽样与分层抽样有什么异同呢?配额抽样与分层抽样有什么异同呢?相同之处:相同之处:都是事先对总体中所有个体按照一定特征、属都是事先对总体中所有个体按照一定特征、属性分类,然后对每一类(组)按一定比例分配样本数额。性分类,然后对每一类(组)按一定比例分配样本数额。差别之处:层内抽样方法不同差别之处:层内抽样方法不同

37、(1 1)分层抽样各层内是按随机原则在层内抽取样本,保证)分层抽样各层内是按随机原则在层内抽取样本,保证大数法则的使用;大数法则的使用;(2 2)配额抽样则是由调查人员在配额内主观判断选定样本。)配额抽样则是由调查人员在配额内主观判断选定样本。配额抽样的优点及局限性配额抽样的优点及局限性优点:优点:调查费用低,执行容易,调查时间短,调查费用低,执行容易,调查时间短,适用于无母体适用于无母体名单的情况。名单的情况。局限性:局限性:(1 1)通常采用政府人口调查资料作为分组和样本分配表)通常采用政府人口调查资料作为分组和样本分配表形成的基础,但政府资料的时效性较差;形成的基础,但政府资料的时效性较

38、差;(2 2)随着控制特性增加,各组资料不一定能够齐备;)随着控制特性增加,各组资料不一定能够齐备;(3 3)循着符合条件的被调查者也是难以控制的事情;)循着符合条件的被调查者也是难以控制的事情;(4 4)主观选择抽样误差是无法控制和估计的。)主观选择抽样误差是无法控制和估计的。滚雪球抽样滚雪球抽样滚雪球抽样是指采用随机方式选择一组调查对象或个体,在滚雪球抽样是指采用随机方式选择一组调查对象或个体,在对他们进行调查后,根据他们提供的信息或由他们推荐选择对他们进行调查后,根据他们提供的信息或由他们推荐选择下一组调查对象或个体,像滚雪球一样继续下去,直至调查下一组调查对象或个体,像滚雪球一样继续下

39、去,直至调查结束。结束。初始随机样本初始随机样本推荐者名单推荐者名单更多调查对象更多调查对象通过对调查总体设计期望特征,增强了样本个体相似性,通过对调查总体设计期望特征,增强了样本个体相似性,而且通过推荐降低了调查成本,但仍然有较强的主观性。而且通过推荐降低了调查成本,但仍然有较强的主观性。非概率抽样具有较强的主观特征,并且无非概率抽样具有较强的主观特征,并且无法估计其误差。但是,在我们的很多调查(尤法估计其误差。但是,在我们的很多调查(尤其是探索性调查和预调查中)仍然会使用,大其是探索性调查和预调查中)仍然会使用,大家在使用非概率抽样时应当注意其满足条件,家在使用非概率抽样时应当注意其满足条

40、件,并且优先使用配额抽样方法。并且优先使用配额抽样方法。抽样误差及测定抽样误差及测定相关基本概念相关基本概念总体和样本总体和样本总体:被调查的所有对象总体:被调查的所有对象样本:每个被调查的对象样本:每个被调查的对象总体指标和抽总体指标和抽样指标样指标总体指标:总体平均数、总体成数、总体方差和标准差总体指标:总体平均数、总体成数、总体方差和标准差抽样指标:抽样平均数、抽样成数、抽样方差和标准差抽样指标:抽样平均数、抽样成数、抽样方差和标准差重复抽样和不重复抽样和不重复抽样重复抽样重复抽样:从总体中随机抽出一个样本后再将它放回去,还重复抽样:从总体中随机抽出一个样本后再将它放回去,还有再次被抽中

41、的可能性有再次被抽中的可能性不重复抽样:从总体中随机抽出后不再放回,没有第二次被不重复抽样:从总体中随机抽出后不再放回,没有第二次被抽中的可能抽中的可能总体分布和样总体分布和样本分布本分布总体分布:调查总体的各标志值经过分组所形成的变量数列总体分布:调查总体的各标志值经过分组所形成的变量数列样本分布:样本指标经过分组而形成的变量数列样本分布:样本指标经过分组而形成的变量数列大样本和小样大样本和小样本本当样本数目当样本数目3030时,称为大样本时,称为大样本当样本数目当样本数目3030时,称为小样本时,称为小样本调查误差与抽样误差调查误差与抽样误差调查误差调查误差登记性误差登记性误差代表性误差代

42、表性误差系统性误差系统性误差抽样误差抽样误差登记、计算等工作错误造成!登记、计算等工作错误造成!违背随机原则!违背随机原则!不违背随机原则,不违背随机原则,但样本有代表性但样本有代表性误差!误差!抽样误差的大小与样本的代表性成反比。抽样误差的大小与样本的代表性成反比。抽样误差的大小受到三个因素的影响:抽样误差的大小受到三个因素的影响:(2 2)抽取的调查个体的数目抽取的调查个体的数目:其他条件不变的情况下,抽:其他条件不变的情况下,抽样数目越多,抽样误差越小;样数目越多,抽样误差越小;(3 3)抽样调查技术抽样调查技术:在同等样本数量下,系统抽样和分层:在同等样本数量下,系统抽样和分层抽样的抽

43、样误差小于简单随机抽样。抽样的抽样误差小于简单随机抽样。(1 1)被研究总体各个体标志值的变异程度被研究总体各个体标志值的变异程度:总体方差与均:总体方差与均方差越大,抽样误差就越大。方差越大,抽样误差就越大。抽样平均数的平均误差抽样平均数的平均误差 1 1、重复抽样、重复抽样n样本单位数样本单位数2 2、不重复抽样、不重复抽样n样本单位数样本单位数N总体单位数总体单位数抽样成数的平均误差抽样成数的平均误差 1 1、重复抽样、重复抽样P成数成数n样本单位数样本单位数2 2、不重复抽样、不重复抽样n样本单位数样本单位数N总体单位数总体单位数P成数成数抽样误差应用时应注意的问题抽样误差应用时应注意

44、的问题1 1、当总体个数非常大时,修正系数接近于、当总体个数非常大时,修正系数接近于1 1,对抽样误,对抽样误差的影响不大,因此,在应用中按不重复抽样方法抽样差的影响不大,因此,在应用中按不重复抽样方法抽样时,也按照重复抽样公式计算平均误差。时,也按照重复抽样公式计算平均误差。2 2、当计算平均误差没有总体标准差资料时,可以采用以、当计算平均误差没有总体标准差资料时,可以采用以下办法:下办法:(1 1)用样本方差代替总体方差;)用样本方差代替总体方差;(2 2)用估计资料代替;)用估计资料代替;(3 3)用过去数的数字代替(选择最近的);)用过去数的数字代替(选择最近的);(4 4)进行一次小

45、规模调查获得。)进行一次小规模调查获得。3 3、该公式是在纯随机抽样条件下获得的,其他的抽样方、该公式是在纯随机抽样条件下获得的,其他的抽样方式的平均误差公式可在此公式基础上变化得到。式的平均误差公式可在此公式基础上变化得到。样本量的确定样本量的确定哪些因素影响了抽样的数目?哪些因素影响了抽样的数目?影响抽样数目的因素:影响抽样数目的因素:(1 1)被调查对象标志的差异程度:被调查对象标志的差异程度:差异程度越大,必要的差异程度越大,必要的抽样数目也越多;抽样数目也越多;(2 2)允许误差的大小允许误差的大小:允许误差与抽样数目成反比;:允许误差与抽样数目成反比;(3 3)对调查结果要求的把握

46、程度对调查结果要求的把握程度:要求把握程度与抽样数:要求把握程度与抽样数目成正比;目成正比;(4 4)抽样方法抽样方法:在同等条件下,不重复抽样比重复抽样需:在同等条件下,不重复抽样比重复抽样需要的样本数目少;要的样本数目少;(5 5)抽样技术抽样技术:分层抽样和系统抽样比简单随机抽样需要:分层抽样和系统抽样比简单随机抽样需要的样本数目少。的样本数目少。估计均值时样本量的确定估计均值时样本量的确定n 对于简单随机抽样对于简单随机抽样:1.确定确定允许抽样误差范围允许抽样误差范围d,d=5.002.确定确定置信水平置信水平,=95%3.3.确定置信水平相应的确定置信水平相应的t值值,t=1.96

47、4.确定确定总体总体的标准差的标准差,=555.计算所需的样本量计算所需的样本量n,n=2t2/d2=4656.当样本量超过总体的当样本量超过总体的5%时时,nc=nN/(N+n-1)估计成数(比例)时样本量的确定估计成数(比例)时样本量的确定n 对于简单随机抽样对于简单随机抽样:1.确定允许抽样误差范围确定允许抽样误差范围d,d=5%2.确定置信水平确定置信水平,=95%3.确定置信水平相应确定置信水平相应的的t值值,t=1.964.估计总体的估计总体的发生率发生率P(待估计待估计),P=64%5.计算所需的样本量计算所需的样本量n,n=P(1-P)t2/d2 =3556.当样本量超过总体的

48、当样本量超过总体的5%时时,nc=nN/(N+n-1)例题:某企业对某批产品的每包平均重量和合格率进行检验。例题:某企业对某批产品的每包平均重量和合格率进行检验。根据以往资料,每包平均重量的标准差为根据以往资料,每包平均重量的标准差为10g10g,产品合格率,产品合格率为为92%92%。现在用重复抽样的方式,在置信度为。现在用重复抽样的方式,在置信度为95%95%,每包产品,每包产品平均重量的抽样误差不超过平均重量的抽样误差不超过2g2g,合格率的抽样误差不超过,合格率的抽样误差不超过4%4%的条件下,应抽取多少包产品进行调查?的条件下,应抽取多少包产品进行调查?=10=10,P=92%P=9

49、2%,=95%=95%,t=1.96t=1.96,d d1 1=2=2,d d2 2=4%=4%重复抽样的条件下,按每包平均重量估计应当抽取的样本数量为:重复抽样的条件下,按每包平均重量估计应当抽取的样本数量为:n=n=2 2t t2 2/d/d2 2=10=102 2 1.961.962 2/2/22 2=96.04 97=96.04 97(包)(包)重复抽样的条件下,按合格率成数估计应当抽取的样本数量为:重复抽样的条件下,按合格率成数估计应当抽取的样本数量为:n=P(1-P)tn=P(1-P)t2 2/d/d2 2=0.92=0.92(1-0.921-0.92)1.961.962 2/0.04/0.042 2=176.71=176.71177177(包)(包)对于样本量的计算同学们应当初步掌握,对于样本量的计算同学们应当初步掌握,能够根据给出的条件计算样本量。能够根据给出的条件计算样本量。本章作业本章作业 本书第本书第116116页:页:第第1 1、2 2题(标明题号直接写答案)题(标明题号直接写答案)第第3 3题(题(5 5)、()、(6 6)第第4 4题(题(1 1)、()、(2 2)。)。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第4章抽样调查技术要点课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|