1、第五章第五章 抽样技术抽样技术第一节第一节 抽样在市场调查中的作用抽样在市场调查中的作用 一、市场普查(一)市场普查的意义 市场调查所研究对象的全体称为调查总体,它是市场调查所研究的各个体单位的总和。市场普查是以市场调查总体中的第一个个体单位作为研究对象的。第五章第五章 抽样技术抽样技术第一节第一节 抽样在市场调查中的作用抽样在市场调查中的作用 (二)市场普查的局限性 从理论上讲,市场普查取得的资料最为全面、最为准确、最有价值。因为,市场普查应该成为市场调查最常用的形式。但实际上只有在总体较小或有某些特殊要求的场合,市场调查才采用普查的形式。这是因为市场普查存在不少局限性。第五章第五章 抽样技
2、术抽样技术第一节第一节 抽样在市场调查中的作用抽样在市场调查中的作用 (1)市场普查要耗费大量的人力、物力、财力,绝大多数企业和研究机构要经常普遍地采用这种方法是难以承担的。(2)市场普查需要花费较长的时间,这和市场调查的时效性往往发生矛盾。(3)市场普查要受到地理、气候、政治、经济、心理等一系列自然的、社会的可变因素的影响。第五章第五章 抽样技术抽样技术第一节第一节 抽样在市场调查中的作用抽样在市场调查中的作用 (三)市场普查的困难 市场普查还往往在可操作性方面碰到困难。第五章第五章 抽样技术抽样技术第一节第一节 抽样在市场调查中的作用抽样在市场调查中的作用 二、抽样调查(一)抽样调查的意义
3、 抽样调查是指从总体中抽取能代表总体的一部分,即样本,进行调查,然后根据样本中所包含的信息对总体的状况进行估计和推算的一种市场调查方法。第五章第五章 抽样技术抽样技术第一节第一节 抽样在市场调查中的作用抽样在市场调查中的作用 (二)抽样调查的优越性 (1)抽样调查由于只对总体中的部分个体逐一进行调查,所需费用显然大大减少,为一般企业所能够承受。(2)抽样调查由于样本容量较小,调查所需的时间也较短,这就能够在不长的时间内完成资料收集及数据统计工作,保证调查的时效性。第五章第五章 抽样技术抽样技术第一节第一节 抽样在市场调查中的作用抽样在市场调查中的作用 (3)抽样调查由于样本容量较小,调查工作量
4、较少,在调查实施过程中只需较少的访问人员。这就便于精心组织,可对访问员进行更好的训练,更好地控制调查过程,以确保调查质量。(4)抽样调查也易于增加调查深度。在调查时可以对调查对象进行更全面更学入的了解和研究,可以获得更有价值的信息。第五章第五章 抽样技术抽样技术第一节第一节 抽样在市场调查中的作用抽样在市场调查中的作用 (三)抽样调查的基本概念 1、总体和样本 总体指的是市场调查所研究对象的全体。样本由从总体中抽取的部分个体所组成。第五章第五章 抽样技术抽样技术第一节第一节 抽样在市场调查中的作用抽样在市场调查中的作用 2、总体指标 总体指标就是调查的目标量,也就是总体的有关参数。这些总体参数
5、在抽样调查中是可以通过有关样本指标来估计的。3、抽样单元和抽样框 抽样单元是指对总体进行划分后得到的每一部分。在抽样时,必须掌握所有抽样单元的有关资料,如名单、地图等等,这称为抽样框。第五章第五章 抽样技术抽样技术第一节第一节 抽样在市场调查中的作用抽样在市场调查中的作用 4、抽样误差和非抽样误差 抽样误差是指用样本估计总体产生的误差。抽样误差一般用估计量的均方差或方差来表示。非抽样误差是指在抽样调查中由于人为差错所造成的误差。这类误差应采取一定的管理措施加以控制。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 一、简单随机抽样(一)简单随机抽样的方法 1、简单随机抽样的
6、方法 简单随机抽样是指从含有N个抽样单元的总体中,一次抽取n个单元,使全部可能的种不同的结果,每种被抽到的概率都等于1/的一种抽样方法。这时所得到的样本称为简单随机样本。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 从总体中逐个有放回地抽取单元,使在每次抽取一个单元之前,总体都恢复到原来的状态,使每一次抽取与上一次抽取都是相互独立的,那么这种抽样称为非常简单随机抽样,这是一种有重复的抽样。这时的样本称为非常简单随机样本。当总体的单元数N非常大,所抽取的样本单元数n相对又比较小,有放回和无放回的柚样几乎是一样的,否则两者还是存在差异。第五章第五章 抽样技术抽样技术第二节第
7、二节 随机抽样技术随机抽样技术 2、简单随机抽样的抽签法 抽签法可以如下操作:先把总体中的每个单元编上不同的号码,写在签上。将签充分搅拌均匀,从中任意抽取一个号码,将对应的单元选入样本,直到抽足预先规定的样本数目n为止。实际操作时也可以同时抽取几个签。如果抽取一个签后,记下号码后又放回总体,再随机抽取下一个,这样每次抽取都是相互独立的,这时得到的将是非常简单随机样本,其中可能出现同样的样本单元。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 3、简单随机抽样的乱数表法 乱数表又称随机数表,是指含有整齐排列的随机数字的表格。乱数表法可以如下操作:先将总体中的每个单元编上不同
8、的号码,根据最大编号的位数,确定使用若十位数字,然后查乱数表,先在乱数表中任意选定一个数字作为开始数字,随后向任何一个方向连续摘取数字,得到一系列规定位数的数,凡编号范围内的数对应的单元即被入样。如果不是重复抽样,碰上重复的数应舍去,直到抽足预定的样本数目n为止。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 例5-1 要从80户居民中抽取10户,先将80户居民由01到80(或从00至79)编号,然后把乱数表的任意一行一列的一个数字为起始数,假定本例以第3行第5列的数字4为起始数,再按任意方向起读,如本例由左向右起读。即得:47、33、84、51、67、47、97、19、
9、98、40、07、17、66、23,其中,47、33、51、67、19、40、07、17、66、23即为抽中的单元编号。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 4、简单随机抽样的计算机随机程序法 简单随机抽样还可以方便地应用计算机随机数程序。起动这一程序,在计算机屏幕上将连续出现随机数。由此可以确定入样单元的编号。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术(二)实例-地区居民数据库的建立 这里以上海地区为例,建立区、街道、居委会的三级地区居民数据库。上海市市区有:(1)黄浦 (2)卢湾 (3)静安 (4)杨浦 (5)虹口 (6)闸北 (9
10、)普陀 (8)长宁 (9)徐汇 (10)宝山 (11)浦东新区 (12)金山 (13)青浦 (14)南汇 (15)嘉定 (16)闵行 (17)奉贤 (18)松江等18个区。以普陀区为例有:(1)长寿 (2)曹杨 (3)长风 (4)长征镇 (5)甘泉 (6)石泉 (7)真如镇 (8)宜川 (9)桃浦镇等9个街道。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 以长风街道为例有:(1)长风一村 (2)长风二村一委 (3)长风二村二委 (4)长凤三村 (5)长风四村一委 (6)长风四村二委 (7)师大一村 (8)师大二村 (9)师大三村 (10)曹家巷 (11)中山桥 (12)
11、新渡口 (13)海鑫 (14)大渡河路95弄 (15)白玉新村一委 (16)白玉新村二委 (17)金沙新村 (18)光复西路1091弄 (19)曹家村 (20)普陀二村 (21)普陀四村一委 (22)普陀四村二委 (23)锦绿新城 (24)中江等24个居委会。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术(三)总体均值和比例的估计及抽样误差的估算 1、总体均值和比例的估计 采用简单随机抽样。可以用样本的特征值为估计总体的目标值,并且可以对抽样误差进行估算。(1)总体均值的估计。设总体X含 有N个单元,总体均值为。在简单随机抽样中,样本含量为n,则可用样本平均值 (5-1)
12、作为总体均值的估计量。niiXnX11第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 (2)总体比例的估计。设总体X含有N个单元,其中有个单元具有某种特性,那么总体中含有该种特征的单元的比例 (5-2)在简单随机抽样中,样本含量为n,其中具有该种特性的单元数为f,则可以用 (5-3)作为总体比例的估计量。NnfP 第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 例5-2 从某区50家超市中随机抽取10家超市,他们的日销售量分别为51、67、45、37、81、49、72、65、43、75万元。(1)试求该区超市平均日销售量的估计值;(2)试求该区销售量
13、低于60万元的超市比例的估计值。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 解:(1)样本的平均日销售量X的平均值 因此,可用X=58.5(万元)作为该区超市平均日销售量的估计值。(2)样本中日销售量低于60万元的超市有5家,因此,样本比例 因此,可用P=50%作为日销售量低于50万元的超市比例的估计值。1015.58)756751(101101iiXX%50105nfP第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 2、抽样误差的估算 (1)均值的抽样误差。在简单抽样情况下,均值的抽样误差有如下的计算公式:(5-4)其中:表示均值的抽样误差,S
14、表示样本标准差,N表示总体单元数,n表示样本单元数。nSNnNx1x第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 在非常简单随机抽样情况下,均值的抽样误差有如下的计算公式:(5-5)nSx 第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 例5-3 某饮料公司进行一次居民户平均饮料消费量的抽样调查。在总体10万户居民家庭中,抽选样本2000户。已知,样本标准差为2.5升,试求在简单随机抽样和非常简单随机抽样条件下的抽样误差。解:N=100000户)n=2000(户),S=2.5升设:为抽样误差 x第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技
15、术随机抽样技术 在简单随机抽样条件下 在非常简单随机抽样条件下0553.072.445.299.020005.2110000020001000001nSNnNx0559.020005.2nSx第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 (2)比例的抽样误差。比例的抽样误差和均值的抽样误差有类似的公式,不同之处是用 代替S,其中P是样本比例。在简单随机抽样情况下,比例的抽样误差有如下的计算公式:(5-6)其中:表示比例抽样抽差,P表示样本比例,N表示总体单元数,n表示样本单元数。)1(PPnPPNnNp)1(1p第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随
16、机抽样技术 在非常简单随机抽样情况下,比例的抽样误差有如下的计算公式:(5-7)例5-4 从总体10万户居民中抽取2000户调查,发现饮用果汁饮料的户数为450户,求其抽样误差。解:N=100 000(户)n=2 000(户)P=nPPp)1(225.02000450第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 设:为抽样误差,则:在简单随机抽样情况下:在非常简单随机抽样情况下:p0092.00093.099.02000775.0225.011000002000100000)1(1nPPNnNp0093.02000775.0225.0)1(nPPp第五章第五章 抽样技术
17、抽样技术第二节第二节 随机抽样技术随机抽样技术(3)抽样调查的容许误差。在数理统计中已经证明,在简单随机抽样情况下,总体均值 落在下列区间中的可能性为 。(5-8)其中:为总体均值,为样本均值,为 t 统计量值,为置信度,N为总体单元数,n为样本单元数。1nSNnNntXa1)1(2/X)1(2/nta第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 这一区间也称为总体均值的置信度为 的置信区间。从另一角度理解式(5-8),可以认为对于一次随机抽样所得的样本均值 ,总体均值 与 的实际差异的绝对值有的 可能性小于(5-9)为样本平均值 在置信度 下的最大容许绝对误差,常常简
18、称为最大容许误差。因此,为最大容许相对误差。(5-10)1XX1nSNnNnta1)1(2/X1Xxxr/第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 对于总体比例的估计,在简单随机抽样情况下也有类似的结果。总体比例 的置信度为 的置信区间为:(5-11)其中:为总体比例,P为样本比例,为t统计量值,a为置信水平,n为总体单元数,N为样本单元数。因此,(5-12)(5-12)1nPPNnNntPa)1(1)1(2/)1(2/ntanPPNnNntpa)1(1)1(2第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 为样本比例P在置信度 下的最大容许绝
19、对误差,简称为最大容许误差,因此,(5-13)为最大容许相对误差。对于非常简单随机抽样,有完全类似的公式,只是 取为1。在一般市场调查中,n均较大这时 可用 代替。1Pprp/1nnN)1(2/nta2/aZ第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 例5-5 在例5-2中计算 和 的95%的置信区间。解:查表得 样本方式 S=15.3(1)262.2)110(025.0tnSNnNntXa1)1(2/103.151501050262.25.5884.490.0262.25.5885.95.58第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术(2)
20、nPPNnNntPa)1(1)1(2/105.05.01501050262.25.016.090.0262.25.033.05.0第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术(四)样本含量的确定 如前所述,在置信度 下,样本均值 和样本比例P的最大容许绝对误差为 和 ,最大相对误差为 和 。现记 为按置信度和精度要求在非常简单随机抽样情况下所需的最小样本含量,n为按置信度和精度要求在简单随机抽样情况下所需的最小样本含量。1Xxpxrpr0n第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 1、在估计总体均值情况下 在非常简单随机抽样时,有:(5-14
21、5-14)则:由于一般n较大,其中 可用 代替,以下各式相同。02/)1(nSntxa22/0)1(xSntna)1(2/nta2/aZ第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 在简单随机抽样时,有:(5-15)可以解出:(5-16)nSNnNntxa1)1(2/NnnNxSntNxSntnaa/1/)1(11/)1(0022/22/第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 由式(5-16)容易看到,当N很大时,则 。也就是说,这时简单随机抽样和非常简单随机抽样在要求的置信度和精度下,所需的最小样本含量近似相等。在一般情况下 。为简便计,
22、一般都按非常简单随机抽样公式求出最小样本含量 ,简单随机抽样所需的最小含量n也近似取为 。当然这时样本含量是稍微扩大了,但在实际抽样时还是被经常采用。0nn 0nn 0n0n第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 在上述表示式中,稍作修改,则可用最大相对误差来表示最小样本含量。这时有:(5-17)和和 (5-18)22/0)1(xraXSntnNnnNnNnn/1/110000第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 2、在估计总体比例的情况下 对于非常简单随机抽样,有:(5-19)则:(5-20)对于简单随机抽样,根据:02/)1()
23、1(nPPntpa)1()1(22/0pPpntna第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术(5-21)可以解出:(5-22)nPpNnNntpa)1(1)1(2/NnnNPppntNPPpntnaa/1/)1()1(11)1()1(0022/22/第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 在以上计算式中,稍作修改,则可得出用最大相对误差来表示的计算公式。(5-23)在给出最大容许绝对误差 时,非常简单随机抽样所需最小样本含量 。见表5-1 PPrpntPPpntnaa1)1()1(Pr)1(22/22/0p0n表表5-1 非常简单随机抽
24、样的所需最小样本含量非常简单随机抽样的所需最小样本含量表表5-2 非常简单随机抽样所需最小样本含量非常简单随机抽样所需最小样本含量(95%置信度置信度)第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 例5-6 在例5-5中,如要求:(1)的最大容许绝对误差为5;(2)的最大容许相对误差为0.1。求:调查所需的最小样本含量。解:(1)应用公式(5-14),其中:得到:(人)96.1,53.152/2/aaZtx,S3653.1596.120n第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术(2)应用公式(5-23),得到:96.1,5.0,1.02/2/
25、aapZtPr3855.05.011.096.120n第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 二、以简单随机抽样为基础的抽样方法(一)分层随机抽样 分层随机抽样是把调查总体的个体单元按其属性的不同分为若干层次,然后在各层中随机抽取样本。在划分层次时应注意,各层次内部保持确定的同质性,而各层次之间又应有明显的异质性。1、分层比例抽样法 分层比例抽样法各层抽取的样本单元数,按各层单元数占总体单元数的比例加以确定。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 例5-7 某地共有居民4000户,按经济收入水平高低进行分层,其中高收入的居民占20%,
26、为800户;中收入的居民占总体的60%,为2400户;低收入居民占20%,为800户。某公司拟调查某种商品在该地区的销售前景。因该商品的消费与居民的收入水平有关,故以经济水平高中低会层并采用分层抽样法。抽取的样本单元数为200户,各层抽取的样本单元数如下:高收入层抽取的样本单元数为:20020%=40(户)中收入层抽取的样本单元数为:20060%=120(户)低收入层抽取的样本单元数为:20020%=40(户)在各层抽样时,只需采用简单随机抽样法即可。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 2、分层最佳抽样法 分层比例抽样,是按各层所含单元多少来分配样本单元数的。
27、实际上不同层次所含单元的差异程序是不一样的,有的层次差异较大,有的层次差异较小,如果都按同样的原则来分配样本单元数目就不尽合理。一般,差异小的层次应取较少的样本单元,差异大的层次应取较多的样本单元。因为层次中个体单元的差异程序是可以用该层的标准差予以反映的,于是提出了以各层次标准差与该层单元数之积为权重来对样本单元数进行分配的又一种分层抽样方法。其计算公式为:其中:各层应抽取样本单元数,n样本单元总数,各层的单元数,各层的样本标准差。iiiiiSNSNnniniNiS第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 例5-8 在例5-7中,改用分层最佳抽样法。设各层样本标准
28、差分别为150、100、50,可得表5-3所示的数据。表表5-3 各层单位数与各层样本标准差乘积计算表各层单位数与各层样本标准差乘积计算表 第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 高收入层抽取的样本单元数为:中收入层抽取的样本单元数为:低收入层抽取的样本单元数为:户)(60400000120000200)(120400000240000200户)(2040000040000200户第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术(二)分群随机抽样 分群随机抽样是先将总体划分成若干个群,然后用简单随机抽样法从中抽取部分群,并且对抽中的群内所有单元
29、都进行调查。(三)多级随机抽样 多级抽样是先把总体划分为若干一级单元,再把各个一级单元划分为若干个二级单元,直至不再划分的个体单元。在抽样时,先用简单随机抽样方法抽取部分一级单元,再在抽中的一级单元中抽取部分二级单元,依次操作,直到抽得个体单元为止。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 表5-4 三种抽样方法的比较 组织形式一级单元二级单元精度(样本含量相同时)提高精度的办法分层抽样抽取全部抽取部分高于简单随机抽样护大层间差异整群抽样抽取部分抽取全部低于简单随机抽样缩小群间差异,增加群数二级抽样抽取部分抽取部分介于整群抽样和简单随机抽样之间减少一级单元间的差异,
30、尽量多抽取一级单元第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术(四)等距随机抽样 等距随机抽样是先对总体中的各个单元按一定指标排列编号。并根据总体中单元数和样本单元数计算出抽样间隔,然后按相同的间隔抽取样本单元。例例5-9 某居委会拥有居民721户,在某次市场调查中需在这一居委会中抽取10户样本单元,采用等距随机抽样法。N=721,n=10,K=721/1072如用随机数表法,第一个确定数字为051,则第一个入样单元编号51,按着每隔72户抽取一个样本单元,各样本单元编号依次为:51,123,195,267,339,411,483,555,627,699如果第一个确定的
31、数字为102,则各样本单元编号依次为:102,174,246,318,390,462,534,606,678,29其中最后一个编号应为678+72=750。因大于N,故减去721,实际编号取为750-721=29。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 三、多级混合型抽样 在实际的市场调查中,一般采用多级抽样的方法,而各级抽样的形式又不尽相同,这就是多级混合型抽样。这种方法得到的样本不是简单随机样本。这就带来了一个统计问题。事实上,在市场调查的数据统计中如采用SPSS统计软件则要求总体中的各个个体单元被抽取的概率是相同的,不然就不宜直接应用SPSS进行各种统计分析
32、。为了在多级混合型抽样中最终能近似地得到简单随机样本,也就是说,最终使个体单元被抽中的概率基本相等,可以采用如下的抽样方法。第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术(一)多级混合型抽样的基本原理 如果一个总体个体单元数为N,现在抽取一个单元数为n的样本。显然,如果能实现每个单元被抽取的概率相等,那么这一概率应为:(5-24)设这是一个K级混合型抽样,为明确计,以K=4 为例进行说明,抽样过程如图5-1所示。NnP第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 图5-1表明,一
33、级单元以概率P1被抽中,二级单元以概率P2被抽中,最后的四级单元即个体单元以概率P4被抽中,根据概率论知识,有:P=P1 P2 P3 P4 多级混合型抽样的基本思路是,前n级单元被抽中的概率可以根据该级实际采用的抽样方法进行确定,而无需加以制约。在最后一级抽样时个体单元被抽中的概率即P4只需满足:(5-25)就能保证最终每个个体单元的抽中概率满足(5-24)式,即相等,都等于n/N。3213214/PPPNnPPPPP第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术(二)多级混合抽样实例 2000年,某市场研究公司在上海市中心城区进行一次居民生活状况调查,要在上海市中心城区
34、279.36万户居民中抽取1000户居民进行访问。现采用多级混合型抽样方法。每户被抽中概率应为:当时上海市市区有黄浦区、南市区、卢湾区、徐汇区、长宁区、静安区、普陀区、闸北区、虹口区、杨浦区、浦东新区等11个区分为4个片。其居民户数的分布如表5-5所示。41058.336.2791.0NnP第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 现把市区11个区,按地理位置分为东、南、西、北4片。抽样方案为第一级从各片中共抽取5个区,第二级在抽中区中抽取3个街道,第三级在抽中街道中抽取3个居委会,第四级在抽中居
35、委会抽取若干居民户,并要保证使每居民户抽中概率都相等。现假定某居委会有610户,该居委会所在街道有2500户,该街道所在区有29.17万户,该区所在片有83.1万户。为了保证每户抽概率为 ,必须先计算前面各级的概率,计算方法如下:41058.3第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 该片应抽区数所在片 总在片该区户数P1该片应抽街道数所在片 总在片该街道户数P2该街道应抽居委会数所在街道 户在该居委会户数P1第五章第五章 抽样技术抽样技术第二节第二节 随机抽样技术随机抽样技术 第四阶段的计算应先按求出的P4=0.0542,计算应抽取的户数。该居委会应抽户数=各户被抽中的概率 该居委会总户数=0.0542 610=33户 这时可以按抽签法或随机数表法确定样本,也可按等距随机抽样的方法确定样本。通过上述的抽样过程,最后可得出一个n=1000户的简单随机样本,数据即可采用SPSS软件统计。