1、3.3为调查某中学学生的每月购书支出水平,在全校名学生中,用不放回简单随机抽样的方法抽得一个的样本。对每个抽中的学生调查其上个月的购书支出金额 yi(如表1所示)。(1)在95%的置信度下估计该校学生该月平均购书支出额;(2)试估计该校学生该月购书支出超出70元的人数;(3)如果要求相对误差限不超过10%,以95%的置信度估计该校学生该月购书支出超出70元的人数比例,样本量至少应为多少。样本样本序号序号支出额支出额(元)(元)样本样本序号序号支出额支出额(元)(元)样本样本序号序号支出额支出额(元)(元)123456789108562421550398365324611121314151617
2、181920 20 75 34 41 58 63 95 120 19 5721222324252627282930494595362545128452984 表1 30名学生某月购书支出金额的样本数据3.3解:解:(1)依据题意和表依据题意和表1的数据,有:的数据,有:2216821682,56.07(),(1182661682/30)/30798.7330iyyys元211750300.032764301750fNnbacnnN()0.03276798.7326.168v y()()5.115se yv y 因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对应的
3、 t=1.96,所以,可以以95%的把握说该学生该月的人均购书支出额大约在56.071.965.115,即50.96-61.19元之间。,(2)易知,N=1750,n=30,18n t=1.96180.26730npn11750300.033891(1)29 1750fNnnnN(1)0.2670.7330.1957pqpp(1)0.033890.19570.081441f pqn10.01672nP的的95%95%的置信区间为的置信区间为:12(1)1()0.267(1.960.081440.0167)12=(0.0907,0.4433)f pqpunn的的95%95%的置信区间为的置信区间
4、为:1N(159(159,776)776)(3)N=1750(3)N=1750,n=30n=30,n n1 1=8,t=1.96,p=0.267,=8,t=1.96,p=0.267,q=1-0.267=0.733 q=1-0.267=0.733 由此可计算得:22021.960.7331054.640.01 0.267t qnr p 计算结果说明,至少应抽取一个样本量为659的简单随机样本,才能满足95%置信度条件下相对误差不超过10%的精度要求。n=n0/1+(n01)/N =1054.64/1+1053.64/1750=658.2942=6593.5要调查甲乙两种疾病的发病率,从历史资料得
5、知,甲种疾病的发病率为8,乙种疾病的发病率为5,求:(1)要得到相同的标准差0.05,采用简单随机抽样各需要多大的样本量?(2)要得到相同的变异系数0.05,又各需要多大的样本量?3.5解:已知 P1=0.08,Q1=1-P1=0.92;P2=0.05,Q2=1 P2=0.95;V(p)=0.05*0.05,(1)由0()PQnVp得:1020.080.92300.05n2020.050.95190.05n 由02()QnCvp P得:(2)1020.9246000.050.08n 2020.9576000.050.05n 第四章第四章 分层抽样分层抽样4.3解:解:(1),(2)按比例分配)
6、按比例分配 n=186n=186,n n1 1=57=57,n n2 2=92=92,n n3 3=37=37(3)Neyman分配分配 n=175,n1=33,n2=99,n3=434.5 ,置信区间(,置信区间(60.63,90.95)元。)元。20.07sty(元)()3.08sts y(元)75.79sty(元)4.6 解解 已知已知W1=0.2,W2=0.3,W3=0.5,P1=0.1,P2=0.2,P3=0.4 P=hWhPh=0.28,Q=1P=0.72 n=100的简单随机抽样估计方差:的简单随机抽样估计方差:V(Psrs)(1f)/100PQ 0.28*0.72/100 =0
7、.002016 按比例分配的分层抽样的估计方差:按比例分配的分层抽样的估计方差:V(Pprop)hWh2(1fh)/nh Ph Qh n-1hWh Ph Qh =n-10.2*0.1*0.9+0.3*0.2*0.8+0.5*0.4*0.6 =0.186 n-1 故故 n 92.26 934.8 解解 已知已知W1=0.7,W2=0.3,p1=1/43,p2=2/57 (1)简单随机抽样)简单随机抽样 Psrs=(1+2)/100=0.03 V(P)=PQ/(n-1)=0.03*0.97/99=0.0002937 (2)事后分层)事后分层 Ppst=hWhph=0.7*1/43+0.3*2/57
8、=0.0268 V(Ppst)=hWh2(1fh)/(nh1)phqh =0.72*1/42(1/43)(42/43)+0.32*1/56(2/57)(55/57)=0.00031942第五章 比率估计与回归估计5.2 N2000,n36,10.95,t1.96,f=n/N0.018,0.000015359,0.003920.00392 置信区间为置信区间为40.93%,42.47%。)(Rv)(Rse第五章 比率估计与回归估计5.3当 时用第一种方法,当 时用第二种方法,当 时两种方法都可使用。这是因为:,若 则 0YXCC2YXCC2YXCC222211)(YYCYnfSnfyV)2(1)
9、()(222XYXYCCCCRnfRVxyV)(XyV2222211YYCRnfCYXnf YXCC2)2(1)()(2XYXCCCRnfxyVXyVYXCC20)2(1)()(2XYXCCCRnfxyVXyVYXCC2)2(1)()(2XYXCCCRnfxyVXyV 05.45.4 解解:V(YR)(1f)/nY2CY2+CX22rCYCX V(Ysrs)=(1f)/nSY2 =(1f)/n CY2Y2 故故 V(YR)/V(Ysrs)=12rCX/CYCX2/CY2 =1-2*0.696*1.054/1.063-1.0542/1.0632 =1-0.397076 =0.6029245.5
10、证明:由(5.6)得:2121)(1)(dNiiiRSNnnNNRXYnfyV,2VSNnnNd令,则22)(ddNSSNVnNVSVSSNVNSndddd22221从而5.65.6 解解(1)简单估计简单估计:总产量总产量:Ysrs=(N/n)i=1n Yi=(140/10)1400+1120+480 =176400(斤斤)v(Ysrs)=N2(1f)/nSY2 =1402(110/140)/10*194911.1 =354738222 se(Ysrs)=18834.4965.65.6 解解(2)比率估计比率估计:R=i=1n Yi/i=1n Xi=12600/29.7 =424.2424
11、YR=XR=460*424.2424 =195151.5(斤斤)v(YR)=N2(1f)/n*i=1n(yiRXi)2/(n-1)=1402(110/140)/90*124363.5 =25149054 se(Ysrs)=5014.883面积面积/亩亩产量产量/斤斤3 3140014002.52.5112011204.24.2171017103.63.6150015001.81.87207205.25.2198019803.23.2131013102.42.4108010802.62.6130013001.21.248048029.729.712600126005.65.6 解解(3)回归估计
12、回归估计:回归系数回归系数 b=Sxy/Sxx2=370.5965 ylr=xb(xX)=1260370.5965*(2.97460/140)=1377.089 Ylr=Nylr=192792.47(斤斤)v(Ylr)=N2(1f)/n*i=1n yiyb(xix)2/(n-2)=1402(110/140)/80*89480.59 =20356834 se(Ylr)=4511.8555.7解:,)(YyElr)1(1)(22YlrSnfyVniiilrlrXxBynxXByxXByy1)(21)(2)(YxEXByEyElrlr)()()()(21)(1niiilrXxBynVyV21)(21
13、11YXXBYNnfNiii)(41)44(122222YXxYYXXYSBSBSnfBSSBSnf)()1(11222lrYYyVSnfSnf故估计量 虽然与 一样都是 的无偏估计,但方差不小于 的方差,当 时 ,故 不优于 。lrylryYlry0)()(lrlryVyVlrylry0.22390.25140.15480.05730.04870.10220.06760.0981 第六章 不等概率抽样6.1假设对某个总体,事先给定每个单位的与规模成比例的比值 Zi,如下表,试用代码法抽出一个n=3的 PPS 样本。iiziiz 表表1 总体单位规模比值总体单位规模比值6.1解:令 ,则可以得
14、到下表,从11000中产生n=3个随机数,设为108,597,754,则第二、第六和第七个单位入样。01000M iMi累计累计Mi 代码代码1234567898102572516748154223982002575085756237771000198992002012572585085095755766236277777781000M0=1000 2819541 0851 6292157989201 83456781 3536396506081 2387465125941234子公司序号子公司 序号6.3欲估计某大型企业年度总利润,已知该企业有8个子公司,下表是各子公司上年利润Xi 和当年利
15、润 Yi 的数据,以Mi作为单位Xi大小 的度量,对子公司进行PPS 抽样,设n=3,试与简单随机抽样作精度比较。iYiXiYiX表表2 某企业各子公司上年与当年利润(单位:万元)某企业各子公司上年与当年利润(单位:万元)对子公司进行抽样,根据教材(对子公司进行抽样,根据教材(6.7)式:)式:88116.3 8,3,6857,7199iiiiNnXXY212211()()1NiHHiiiNiiiYV YZYnZYXYnX2168577707.8271993342303.5 5 8 5.0 7H HVY显然对 抽样,估计量的精度有显著的提高。如果对子公司进行简单随机抽样,同样样本量时如果对子公
16、司进行简单随机抽样,同样样本量时 的的简单估计方差为:简单估计方差为:Y2SRSyN NnV YSn8 54580379.6936 1 0 7 1 7 2 9.27814.84SR SVYPPS 抽样的设计效应是:342303.50.00560561071729.2deff PPS6.4 解解 (1)PPS的样本抽样方法可采用代码法或拉希里法的样本抽样方法可采用代码法或拉希里法.(2)若在时间长度若在时间长度2、8、1、7h中打入电话数量分别为中打入电话数量分别为8、29、5、28,则客户打入电话的总数:,则客户打入电话的总数:YHH=(35/4)8/2+29/8+5/1+28/7=145.4
17、6875(3)估计量的方差估计估计量的方差估计 v(YHH)=n(n1)-1i=1n(yi/ziYHH)2 =352/(4*3)(8/24.15625)2+(29/84.15625)2 +(5/14.15625)2+(28/74.15625)2 =106.46976.5设总体设总体N=3,zi=1/2,1/3,1/6,Yi=10,8,5,采取的采取的n=2的的PS抽样,求抽样,求i,ij (i,j=1,2,3)。解:解:(1)(1)所有可能样本为:(所有可能样本为:(1010,8 8),(),(1010,5 5),(),(8 8,1010),(),(8 8,5 5),(),(5 5,1010)
18、,(),(5 5,8 8),其概率分别为:),其概率分别为:122236111236133341 21113412133653 0122653012133516612306022132446121230603113225612303060122335612601313166306023129123060所以:所以:6.6 解解 (1)简单随机抽样简单估计简单随机抽样简单估计 Y=2+3+6+8+11+14=44 S2=(N1)-1i=1N(YiY)2 =(2*322)2+(3*322)2+(6*322)2 +(8*322)2+(11*322)2+(14*322)2/(5*9)=322/15=2
19、1.4667 总值估计的方差估计总值估计的方差估计 V(Ysrs)=N2(1f)/nS2=36(12/6)/2322/15 =1288/5=257.66.6 解解 (2)简单随机抽样比率估计简单随机抽样比率估计 X=1+2+4+7+9+13=36,Y=2+3+6+8+11+14=44,R=44/36=11/9,f=2/6=1/3总值估计的方差估计总值估计的方差估计 V(YR)N2(1f)/n i=1N(YiRXi)2/(N1)=36(12/6)/10(21*11/9)2+(32*11/9)2 +(64*11/9)2+(87*11/9)2 +(119*11/9)2+(1413*11/9)2 =(
20、12/5)*(488/81)=14.466.6 解解 (3)PPS抽样汉森抽样汉森赫维茨估计赫维茨估计 X=1+2+4+7+9+13=36,Y=2+3+6+8+11+14=44,取取Zi=Xi/X,(i=1,2,6)总值估计的方差估计总值估计的方差估计 V(YHH)=(1/n)i=1N Zi(Yi/Zi Y)2 =(1/nX)i=1N Xi(XYi/Xi Y)2 =(1/72)1*(36*2/144)2+2*(36*3/244)2 +4*(36*6/444)2+7*(36*8/744)2 +9*(36*11/944)2+13*(36*14/1344)2 =24.96第七章 整群抽样 7.1(略
21、)7.3解:不是 的无偏估计,此因类似于 有 因为对群进行简单随机抽样,故 ,从而 ,若取 则2s2S1)1()1(222AMSASMASbw 1)1()1(222aMsasMasbw22bbSEs 22wwSEs 22221)1()1(SaMSaSMaEsbw1)1()1(222AMsAsMASbw22SSE7.2样本样本耐用时数耐用时数1 1 10361036 10751075 11251125995995 10881088 10651065 10231023988988 100210029949942 2 10471047 11261126 11831183 10581058 11421
22、142 10981098945945968968 103610369879873 3 10461046 11531153 10871087984984 12241224998998 10321032976976 110311039589584 4 11531153 10781078 10391039 10061006 12141214 10761076986986994994 10481048112611265 5 12161216 10941094 10961096 10351035 10041004 10531053 10041004 11221122 10801080115211526
23、6964964 11361136 11851185 10211021 10071007948948 10241024975975 108310839949947 7 11131113 10931093 10051005 10881088997997 10341034985985997997 10051005112011208 8 10471047 10971097 11361136989989 10731073 11021102976976984984 1004100410821082样样本本耐用时数耐用时数均值均值标准差标准差1 1103610361075107511251125995995
24、10881088 10651065 1023102398898810021002994994 1039.11039.1 47.0990747.099072 21047104711261126118311831058105811421142 109810989459459689681036103698798710591059 78.4644378.464433 310461046115311531087108798498412241224998998 1032103297697611031103958958 1056.11056.1 85.6549385.654934 4115311531078
25、1078103910391006100612141214 1076107698698699499410481048 112611261072107273.932473.93245 51216121610941094109610961035103510041004 10531053 10041004 1122112210801080 11521152 1085.61085.666.573666.57366 696496411361136118511851021102110071007948948 1024102497597510831083994994 1033.71033.7 77.44539
26、77.445397 711131113109310931005100510881088997997 1034103498598599799710051005 11201120 1043.71043.7 53.6595253.659528 810471047109710971136113698998910731073 1102110297697698498410041004 1082108210491049 57.2809857.28098y=(1/80)ij yij=1054.78,sb2=(10/7)i(yiy)2=3017.65V(y)=(1f)/(aM)sb2=(18/2000)/(8*
27、10)*3017.65 =37.5697 Se(y)=6.1294(1)以每盒灯泡为群实施整群抽样以每盒灯泡为群实施整群抽样y=(1/80)ij yij=1054.78,s2=(1/79)ij(yijy)2=4628.667V(y)=(1f)/(aM)s2=(180/20000)/(8*10)*4628.667 =57.6269 Se(y)=7.5912(2)以从以从20000个灯泡中按简单随机抽样个灯泡中按简单随机抽样y=(1/80)ij yij=1054.78,Sw2=(1/a)i si2=1/(a(M1)ij(yijyi)2=4721.0056r=(sb2sw2)/sb2+(M1)sw2
28、=-0.04723Deff=V(y)/V(y)=1+(M1)r =0.6694 7.4 对对7.2题群内相关系数进行估计题群内相关系数进行估计 7.5 解:由于农户是调查单位,故以村为抽样单位的抽样是整群抽样,村即是群。对于村既有生猪存栏数,也有户数,因此在村大小不等的整群抽样下,既可使用简单估计量估计生猪存栏数,也可以户数为辅助指标构造比率估计和回归估计来估计生猪存栏数。(1)简单估计量(2)以户数为辅助变量的比率估计量,1080063240200yAY,6394240001)()1()(122ayyafAYvaii25287)(Yse,11368428503240100000110aiia
29、iiRmyMY314.452,98880,365.718,133750ys2ysxs2xs13684.12850324011aiiaiimyR0.934 r13341)2()1()()(2222xyxyRRsrsRsRsafAYvYse(3)以户数为辅助变量的回归估计量 803.022xxyxyxssrsssb 1080000.803(100000200475)112015475m)()(0mNMbYmNMNbYyNYlrlr9034)1(21)1()()(222rsaaafAYvYseylrlr显然以户数为辅助变量构造回归估计量效果最好。此因各村显然以户数为辅助变量构造回归估计量效果最好。此
30、因各村生猪存栏数与村的规模(户数)有高度相关性,生猪存栏数与村的规模(户数)有高度相关性,r r0.9340.934,故采用回归估计量精度最高。故采用回归估计量精度最高。企业企业已婚女职工人数已婚女职工人数/人人 M Mi i平均理想婚龄平均理想婚龄/岁岁 y yi i1 149549524.124.12 21020102022.822.83 384484425.525.54 41518151824.624.65 563563525.825.86 639439423.723.77 72346234624.524.57.67.6 (1)按简单随机抽样抽取按简单随机抽样抽取,简单估计量估计简单估计
31、量估计y=(1/7)i Mi yi=25321.1571M=35680/35=1019.4286Y=y/M=24.8386v(y)=(1f)/(a(a1)M2)i(yiy)2 =(17/35)/(42*1019.42862)*1711911436 =31.3768Se(y)=5.60157.6 (2)按简单随机抽样抽取按简单随机抽样抽取,采用比率估计量估计采用比率估计量估计YR=i yi/i Mi=177248.1/7252=24.4413v(y)=(1f)/(a(a1)m2)i(yiYmi)2 =(17/35)/(42*1019.42862)*4536349.45 =0.0831445Se(
32、y)=0.28837.6 (3)按按PPS抽样抽取抽样抽取,抽样概率与企业女职工人数成比例抽样概率与企业女职工人数成比例YHH=i yi/a=24.4286v(Y)=1/(a(a1)i(yiy)2 =(1/42)*6.3542857 =0.15129se(Y)=0.38896 7.7证明分别以 记整群抽样、简单随机抽样的估计量:srsclupp,1)(1)(12APPafpVAiiclu11111)(2AMAPQafPQAMAMaMfSaMfpVsrsAPQPPMAPQPPAAMAPQPPAAMpVpVdeffAiiAiiAiisrsclu121212)()()(11)()(7.8市县编号市县
33、编号社会从业人员数社会从业人员数/万人万人 m mi i第三产业从业人员数第三产业从业人员数/万人万人 t ti i181837.60 37.60 7.00 7.00 323241.30 41.30 7.39 7.39 434334.40 34.40 6.30 6.30 656528.90 28.90 4.97 4.97 878757.60 57.60 11.23 11.23 pR=i ti/i mi=36.89/199.8=0.1846,7.8v(pR)=(1f)/(a(a1)m2)i(tipRmi)2 =(15/110)/(20*39.962)*0.549388 =0.00001642se(pR)=0.004052