1、 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法 Chapter 10其他抽样方法 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法第一节 估计总体单位个数N 符号 N:总体单位个数 t:做了标记的单位数 n:正式样本容量 r:样本中有标记的个数 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法nrPNtP,于 是 rtnPtN 32)()(rrnntNV 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原
2、理与方法原理与方法原理与方法原理与方法原理与方法原理与方法例1:某狩猎场在狩猎季节来临前想了解一下该地区猎物的数量,故采用抽样的方法,先扑捉到300只狍子,做上记号后放回,2星期后又扑捉到200只,发现其中有62只狍子带有记号。问该猎场地区大约有多少只狍子?()0.05 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法2233300(200)967.7462968()300(200)(20062)1.96()1.961.9620062968200tnNrNt n nrV Nr可以取置信区间 抽样调查抽样调查抽样调查抽样调查抽样调查抽
3、样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法第二节 逆抽样估计N可能产生的问题 r=0 处理方法:将 r 固定,n 可以增加 rtnN )1()()(22rrrnntNV 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法例2:有关部门欲了解自然保护区内一种鸟类的数量。先随机扑捉了150只,做了记号,然后放飞,一个星期后又进行抽选,目标是扑捉到有记号的鸟35只,结果扑捉了100只后才完成目标。以95%的把握程度估计自然保护区中该种鸟的数目。抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原
4、理与方法原理与方法原理与方法原理与方法2222150,100,35100(150)428.57(429)35()150(100)(65)()57.6(1)35(36)429 1.96(57.6)(316,542)tnrntNrt n nrV Nrr解:置信区间 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法 与直接估计N相比,逆抽样有较高的效率,但若对N没有一点了解,抽选的 t 很差,则将造成样本量n很大。例如,如果N=10000,第一个标识样本t=50,要抽到r=10,则n将非常大。如果事先对N有一个大致了解,则抽样设计可以更科
5、学。令 ,则 为12,tnppNN()v NN 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法()v NN 取值表1tpN2npN 0.001 0.01 0.1 0.25 0.5 1.0 0.001 999000 99000 9000 3000 1000 0 0.01 99000 9900 900 300 100 0 0.1 9990 990 90 30 10 0 0.25 3996 396 36 12 4 0 0.50 1998 198 18 6 2 0 1.0 999 99 9 3 1 0 抽样调查抽样调查抽样调查抽样调查抽样
6、调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法 如果事先对N有所预估,就可以方便地知道在t和n不同水平下,估计量方差的大致范围。例:在前面例子中,猎场管理机构认为今年狍子的数量与去年相仿,约在800-1000头(为把握取1000头),打算取 ,则估计量误差将会如何?10.25p 20.25p 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法 因为取较大的N,得到的方差估计也较大,是保守的估计。从前表中可以查到,()121000,()12(1000)()109.541v NNNv Nv N取 抽样调查抽样调
7、查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法 设计人员可以利用该信息进行抽样设计。如果估计量误差是可接受的,则120.25(1000)2500.25(1000)250tp Nnp N 然后依据设计抽取样本对N进行估计。如果估计量误差是不可接受的,可根据表中提供的信息进行调整。于是,抽样设计变得比较简单。抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法()v NN 对于逆抽样,同样可以设计 分布表1tpN2rpN 0.001 0.01 0.1 0.25 0.5 1.0 0.001 9
8、99 990 900 750 500 0 0.01 99 90 75 50 0 0.1 9 7.5 5 0 0.25 3 2 0 0.50 1 0 1.0 0 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法对估计量方差估计的处理方法同前。此时12tp Nrp N由此可以预知,抽取不同r时误差的分布情况。抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法第四节 随机化回答技术一、什 么 是 随 机 化 回 答 技 术 随 机 化 回 答 技 术 特 征 *随 机 回 答 方
9、 式 *对 回 答 起 保 护 作 用 *有 可 以 对 总 体 进 行 推 算 二、沃 那 随 机 化 回 答 模 型 卡 片 A:我 有 过 漏 税 行 为 卡 片 B:我 没 有 漏 税 行 为 最 终 答 案:“是”或“不 是”抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法 A 是 具有A特征 P 卡片A 被调查者 1-A 不是 具有B特征 1-P A 不是 具有A特征 卡片B 1-A 是 具有B特征 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法令n为样本容
10、量 n1为回答“是”的人数 则:)1()12()1)(1()(1ppppnnAAA 由于P已知,n1/n为调查结果,则)1(1211PnnPA 21P 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法2)12()1()1()(PnPPnVAAA 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法解:已 知P3/4,n=200,n1=120 7.0)431(2001201)43(21)1(1211PnnPA 漏 税 人 数 比 例 的 点 估 计 值 为70。2)12()1(
11、)1()(pnPPnVAAA 0048.0)1432(200)431(43200)7.01(7.02 135.07.0)(96.1AAV 故%5.835.56A 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法三、西蒙斯随机化回答模型 卡片 A:我在考试中作了弊 卡片 B:我上星期在图书馆借过书 设:A:具有卡片 A 特征人数比例 B:具有卡片 B 特征人数比例 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法
12、原理与方法原理与方法原理与方法原理与方法原理与方法 A 是 具 有A特 征 P 卡 片A 被 调 查 者 1-A 不 是 不 具 有A特 征 1-P B 是 具 有B特 征 卡 片B 1-B 不 是 不 具 有B特 征 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法BAppnn)1(1 PPnnBA)1(1 式中nnpB1,已知,故)1)()1(1)(112nnnnPnA 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法四、使用随机化模型应当注意的问题 1高素质的调查人
13、员;2有效的说明工作;3注意选择无关的非敏感性问题。抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法第五节 随机化回答技术 进一步发展一、改进模型 目的:避免涉及无关问题 1号卡片:问题是否具有A特征,卡片比例P1,具有,回答1;不具有,回答0;2号卡片:直接回答1,卡片比例P2;3号卡片:直接回答0,卡片比例P3;P1+P2+P3=1 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法设回答“1”的数量为1n,则有 121PPnn 为总体中具有 A 特征的比例,抽样调查抽
14、样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法122111211121)(1)(1)()(PPPPPPPnnEPPPnnEE2121222112)1()1()1()(nPPPPPPnPPnV 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法改进模型的特点 1.克服了沃纳模型 2 个卡片都是敏感性问题的缺点;2.敏感问题卡片 P1 可以等于 1/2;3.不必专门设计无关问题。抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方
15、法二、数量特征非相关模型 调查内容为数量指标。1 号卡片:敏感性数量问题,X 表示;2 号卡片:无关数量问题,Y表示;1、2 号卡片比例分别为 P、1-P,样本容量为 n,回答结果变量为 Z,则 f(Z)=Pg(Z)+(1-P)h(Z)抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法)()1()()()()1()()(222yEPxPEZEyEPxPEZE 则 Z 的总体均值和方差分别为 yxzPP)1((1)2222)(1()1(yxyxzPPPP 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原
16、理与方法原理与方法原理与方法令样本结果分别为,21,.,nzzz222)(111zznsznznini又因22)(,)(zZsEzE 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法故由(1)式得 PPzyx)1(如何得到y?改进方法:两套卡片中敏感性问题的比例分别为P1,P2 第一组容量1n,回答结果iZ1表示 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法第二组容量2n,回答结果iZ2表示 22211121,nZZnZZnini 则有 yxPPZE)1()(111
17、yxPPZE)1()(222 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法当21PP 时 212112)1()1(PPZPZPx 2221122221)1()1()(nPnPVzzx 选择变量 y,使其具备如下特征 y接近于x 2y尽量小,或尽量接近2x 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法三、转换模型 操作方法 组有M 个数据,MAA,.1 组有L个数据,LBB,.1 从组中抽一个数,记为aj 再从组中抽一个数,记为bk 敏感问题的数值是xi 抽样调查抽
18、样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法kijibxaRiR为报告结果BbEAaEkj)()(BxAREii)(ABRABRExiii)(抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法nixnx1 nABiAniAxnNxxnnfxV222221)()1(1)(当0,022BA时的情况 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法四随机变量和回答模型 操作过程 问卷如:(1)你考试作弊了么?(2)你是四月份
19、出生的么?按下列要求回答 a 如果两个问题均“No”,填“0”b 如果一个问题是“No”,填“1”抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法c 如果两个问题均“Yes”,填“2”解决方式:一种:改进 C,如果两个问题“Yes”,填 1(或 0)另一种,三种卡片 a 你考试作弊了么?1=Yes.0=No b 请直接回答 1,c 请直接回答 0 抽样调查抽样调查抽样调查抽样调查抽样调查抽样调查 原理与方法原理与方法原理与方法原理与方法原理与方法原理与方法数量特征的“随机变量和”模型 X:敏感问题 Y:非敏感问题 Z=X+Y 为解决 Y 的估计 一套问卷,包括 X 和 Y 一套问卷,仅包括非敏感问题 Y