1、?-非概率,等概率,不等概非概率,等概率,不等概每个单元入样的概率每个单元入样的概率第五章第五章 不等概抽样不等概抽样iP)在第一次抽取中被抽中单元i(iP被选入样本)单元i(一、不等概抽样的必要性*提高估计精度*放回的 PPS 抽样简化方差计算应用条件:通常需要知道一个辅助变量, 用以确定其入样的概率场合:总体单元差异比较大时;抽样审计;多阶段的PSU.入样概率不同是否导致估计偏差?例如“水野法”抽样使得比估计为无偏估计量二、放回的PPS抽样Ui Mi iM 区域1 8 8 182 20 28 9283 40 68 2968. . . . . . . . . .(Probability Pr
2、oportional to Size)01iiiNiiMMZMM也称PPZiMiMi100Mi100M0累计累计代码代码10.66616214.5145151715131.515166152166413.713730316730357.87838130438161515053138253171010063153263183.6366676326679660727668727101.111738728738738738一种多项抽样二、放回的PPS抽样 Ui Mi iM 区域 1 8 8 18 2 20 28 928 3 40 68 2968 . . . . . . . . . . . . KM0
3、/nMik可能重复2k肯定重复niiiniiiHHmynMzynY1011例如:估计超市销售额,m:员工人数解释公式意义221()()()1()(1)NiHHiiniHHiHHYV YZYnZyYZv Ynn()()()HHHHHHE YYE v YV YniHHiiniHHiiHHMYmynnMYzynnYv12020121111iimiyiimiyiimiy1*38.2310926106.501900191.5010213.7010241115.00864208.008030.7513127.00172128.421367242.85301316.00104522*9.01384552.0
4、011021412.30220230.7548065.00600153.864600246.00311710.802901615.8023702528.43928482.00430179.00940269.9784298.8199218*21.00640276.20510niiiHHmynMY102 . 651070.13102423.381092623.3810926303676niHHiiHHMYmynnMYv120201HHHHYvYs75708717411896. 1HHHHYYstr152302 . 045. 02n174118 相对误差相对误差达到20时所需样本量?二、不放回不等概
5、抽样 Horvitz_Thompson估计量 iji,的含义, 性质:iNijNinn) 1(, ininiiHTyWyY,iiW1 不放回的与单元大小成比例的概率抽样为PS抽样 n固定条件下的包含概率 第i单位入样概率第i,j单位都入样概率21kiN1iN1iNikkikiik2iii)/)(YYY1)(kkiNiNiKiikkiHTYYYVSkSkkkii2iS2iiYY)(/Y)1 ()(iiikikkiiHTYv2SkSk)/()()(kkiiiiikikkiHTYYYv2)()(jjiinijijjinHTyyYHTY是 Y 的无偏估计)(HTY是)(HTYV的无偏估计HHY PPSHTY PSi=1 ji其他公式在某种程度上可用这两个公式表现。其他公式在某种程度上可用这两个公式表现。如:在如:在srs中中iynNY(等概抽样)在在srs等概抽样条件下,每个单元包含概率是等概抽样条件下,每个单元包含概率是nNWNniii1,则iniiHTynNyWY又如,对于霍维茨又如,对于霍维茨汤普森估计量汤普森估计量iiHTyY在入选概率与规模成比例条件下,i的性质为iinZ则HHniiniiHTYZynnZyY1iiiZZZ21)1 (jiZZ1)211211(jijZZZ)1) 1(*nNnnNZNnZii) 1(1NnnZi)Pr()/Pr(SyiSYiM