第三章简单随机抽样讲义课件.ppt

上传人(卖家):晟晟文业 文档编号:4515501 上传时间:2022-12-16 格式:PPT 页数:53 大小:1.50MB
下载 相关 举报
第三章简单随机抽样讲义课件.ppt_第1页
第1页 / 共53页
第三章简单随机抽样讲义课件.ppt_第2页
第2页 / 共53页
第三章简单随机抽样讲义课件.ppt_第3页
第3页 / 共53页
第三章简单随机抽样讲义课件.ppt_第4页
第4页 / 共53页
第三章简单随机抽样讲义课件.ppt_第5页
第5页 / 共53页
点击查看更多>>
资源描述

1、第三章 简单随机抽样例:从某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476(1)计算样本均值与样本方差;(2)若用 估计总体均值,按数理统计结果,是否无偏,并写出它的方差表达式。(3)根据上述样本数

2、据,如何估计?(4)假定的分布是近似正态的,试分别给出总体均值的置信度为95%的近似置信区间。y(1)计算样本均值与样本方差;(2)若用 估计总体均值,按数理统计结果,是否无偏,并写出它的方差表达式。(3)根据上述样本数据,如何估计?y)(111)(,1221221niiniiniiynynnyysnyynyVyY2)(,nsyvsE222)(,)(性质:(4)假定的分布是近似正态的,试分别给出总体均值的置信度为95%的近似置信区间。)1(tys),1(t/,.,yy221nynnsyyyn)(即则是近似正态分布假定是独立同分布样本,设)(),(ystyysty21213.1 概述3.1.1

3、简单随机抽样(或单纯随机抽样):简单随机抽样(或单纯随机抽样):本书一般局限于不放回随机抽样3.1.2 实施方法实施方法:3.1.3 地位、作用地位、作用:是其他抽样方法基础3.2 总体均值与总量的简单估计一、总体均值的估计:总体均值的估计:1.简单估计及其无偏性简单估计及其无偏性:这种估计即是简单估计估计用条件下,在没有其他总体信息的NiiniiYNYyny1111YyE)(1:性质2.估计量的方差:估计量的方差:一般定义,有限总体的方差为:说明:总体方差但为了使大多数情形下公式表达更简练,定义总体方差为:21221)(11NNYYNSNii221.2SnfSnNnNyVsrs)(,:对性质

4、NiiiYYNYYE1222)(1)(3.估计量的方差估计:估计量的方差估计:niiniiynynyynsSsE122122221111)()(其中)(性质:)的无偏估计。(是)(:性质yVsnfyv2134.区间估计:区间估计:snfuysnfuyY1112121,的近似置信区间为:的置信度为)()(因此,)(则(),()(很大时,当10N)(,(n2/12/1uudVN 简单估计及其无偏性简单估计及其无偏性:证明:(定义法)yY YyE)(1:性质nNCyyE)(NiinNnYCnyyny11111)(1YYNCYCnCyyENiinNNiinNnN111111)(证明:(对称性论证法)Y

5、YNYNnnyEnyENiiNiinii11111)(1)(niiyny11证明:(对称论性论证法)由定义221.2SnfSnNnNyVsrs)(,:对性质)(1)(1)(1)1()()(2212212212YyYyEnYyEnYyEnYynEYyEyVjnjiiniiniinii)()(2121YYNnYyENiinii)()1()1()(YYYYNNnnYyYyEjjiijjii21212122122212)(11)(11)(11)(1)()1()1(1)(1)(1)(1)(YYNnYYNnYYYYNnYYnNYYYYNNnnnYYNnnYyYyEnYyEnyVNiiNiijjiiNiij

6、jiiNiijjiinii212121)(11)(11)(1111YYNnNnNYYNnYYNnnNNiiNiiNii22211)(111SnfSnNnNYYNNnNnNii3.估计量的方差估计:估计量的方差估计:证明:只需证由定义由对称论证法 的无偏估计。)(是)(:性质22113SnfyVsnfyv22)(SsE221212)()(11)(11YynYynyynsniinii22121)1()()(SNNnYYNnYyENiinii2221)(SnNnNSnfYyE22222)()1()1()1(11)(SnNNnnNSSnNnNnSNNnnsE例:为调查某城镇成年居民的服装消费水平,在全

7、体N=5443个成年人中,用简单随机抽样抽得一个n=36的样本。对每个抽中的成年人调查上一年中购买的件数与支出金额,数据见cha3.xls。试估计该城镇居民成衣平均消费水平。(忽略f)(置信度为95%)试估计该城镇居民成衣消费总额。(忽略f)解:(1)8.15)(11,5.5361981222niixnxnsx79.6,21.466.096.15.5,66.096.15.5,%952/05.012/05.01件件即即的近似置信区间为:的置信度nsuxnsuxX66.01)(5.52nssnfxsxX 304803)(11722.64936233901222niiynynsy47.829,97.

8、469,%952/05.012/05.01nsuynsuyY的近似置信区间为:的置信度71.911)(722.649nssnfysyY(2)例:在某地区10000户家庭中,按简单随机抽样抽取400户,调查一个月的伙食费(单位:元)。经计算:(1)试估计该地区平均每户每月的伙食费,并估计其标准差。(忽略f)(2)给出置信度为95%时该地区平均每户每月伙食费的近似置信区间。40012400139.119110251,165712iiiiyy解:(1)(2)62.355,58.126465)(1128.4144001657121222synynsynii13.449,43.379,%952/05.0

9、12/05.01nsuynsuyY的近似置信区间为:的置信度78.171)(28.414nssnfysyY例:某专业杂志目前拥有8000家订户,从中按简单随机抽样抽取了484户,这484户的年均收入为30500元,标准差为7040元。试求该杂志订户的年均收入 的置信度为95%的近似置信区间。解:3107040484800048411)()(30500snfyvysy31108,2989231096.13050031096.1305002121,即)(),(ysuyysuy二、总体总和的估计:二、总体总和的估计:YYEyNYYYYNii)(11:性质的简单估计为,则总体总和22221)(.2Sn

10、fNSnNnNNyNVYVsrs)(,:对性质)的无偏估计。()()是(且,)()(:性质yNVYVYvsnfNyNvYv1322)(),(的近似置信区间为:的置信度为snfuyNsnfuyNY11121213.3 总体比例(成数)的简单估计3.3.1总体:总体:PQNNYYNSYNYNAPAYYYYYYNiiNiiNiiiiN1)(11011221121总体方差:即总体比例:比例的单元在总体中所占的总体中具有所考虑特征征的单元数)(总体中具有所考虑特的总和)(,否则征时,总体单元具有某种特其中,总体 样本:样本:简单随机样本y1yn 样本比例 样本方差3.3.2 估计量及其性质:估计量及其性

11、质:性质性质1.p为P的简单估计,且为无偏估计,即E(p)=P。性质性质2.pqnnyynsynynapniinii1112121)(PQNNnfpV11)(性质性质3.P的区间估计:的区间估计:*推导总体总量A=NP的估计量及其性质。)的无偏估计(为pVpqnnnfsnfpv111)(2)2111(),211111,11121212121npqnfupnpqnfuppqnfuppqnfupP(修正为:的近似置信区间为:的置信度为 P的区间估计:的区间估计:修正。因此,考虑对其连续性又近似服从正态分布。大时,当近似服从二项分布;大时,当服从超几何分布;这是因为(:的近似置信区间修正为的置信度为

12、anaNnpa)2111(),211112121npqnfupnpqnfupP例3:从一份共有3042人的人名录中随机抽200人,发现38人的地址已经变动。(1)试以95%的置信度,估计这份人名录中需要修改的地址的人所占的比例及其标准差;(2)试以95%的置信度,估计这份人名录中需要修改的地址的人总数及其标准差。解(1)(2)027.0)()(102252.7)19.01(19.012003042200111)(19.0200384pvpspqnfpvnaP8213.82)()()()(57819.030422psNAspvNAvPNA复习:pqnnnfpvsnfyvPQNNnfpVSnfyV

13、pPyYPY11111122)()()()(估计估计例4:某超市开张一段时间后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度。该某超市与附近几个小区居委会联系,按简单随机抽样抽取了200人的样本。调查发现表示满意或基本满意的居民有130位。试估计对该超市购物环境持肯定态度居民的比例,并给出置信度95%的绝对误差和置信区间。(假定f可以忽略)。解:%63.71%37.580663.065.0%95%63.60663.00338.096.1%950338.0)()(001143.035.065.01200111)(%6520013021,即的置信区间为:置信度为)(的绝对误差限为

14、:置信度为psudpvpspqnfpvnap例5:从5620个中学中抽出一个含有300个学校的简单随机样本,其中有187个学校赞成一个提案,试估计赞成该提案的比例及总的学校数。解:3512,319464.3083503,64.3083503%9564.30847.15796.1%9547.157)()()(02802.03767.06233.01300111)()(35036233.05620,6233.030018721即的近似置信区间为:置信度为)(的绝对误差限为:置信度为AsudpNsNpsAspqnfpvpsNpAnap3.4 样本量的确定3.4.1 确定的原则与主要因素 简单随机抽样

15、的费用:若CT,C0定,则最大的n就确定了。精度费用费用是平均调查一个单元的是固定费用是总费用其中:CCCCnCCTT00精度常见的表示方法:)(,相对误差限21Surr)(,绝对误差限21Sudd)(21)(ESuE)()(21CvuV估计量方差的上限)(,估计量的变异系数上限SCC 3.4.2 估计总体均值或总量时样本量的确定方法:先对总体均值的情形讨论。1.精度要求:估计量方差的上限为V,即 VyV)(VSnf21即VSNVSn2211VSn20记Nnnn001则 2.精度要求:置信度1-的绝对误差限为d,即 1)(dYyP)(,(nVN很大时,当),()(10N)(则()()(因此,2

16、/12/1uud则估计总体均值时样本量这样确定:22122111)()(dSuNdSun22/12/1SnNnNuud)(22120)(记dSuVSn2210001)(,其中则dSunNnnn3.精度要求:置信度1-的相对误差限为r,即 则估计总体均值时样本量这样确定:11)(的定义:的绝对误差限)估计量而(dYyPdy221000,1:)(其中时,的绝对误差限为估计量若当精度要求为dSunNnnndy1)(rYYyP112)(即)(的定义:的相对误差限)估计量(YrYyPrYYyPryYrd)得:)、(由(21NnnnYrSudSun0022122101,)()(4.精度要求:估计量的变异系

17、数上限为C,即 CYyS)(2)(YCyV)(即2000,1)(其中则YCSnNnnn2)(YCV 量方差的上限为精度要求转化为:估计 精度要求 样本量的确定2210)(dSun)-1(.2下在时绝对误差限为d)-1(.3下在时相对误差限为rNnnn00122212210)()(CruYrSun时估计量方差的上限为V.1时估计量的变异系数为C.4VSn2020)(YCSn 例6:若要求估计职工的平均收入的绝对误差在20元之内,置信度为95%,N=4328,则样本量应该是多少?解:171432817811781178)2008.13696.1()(0022210NnnndSun例7:在某地区10

18、000户家庭中,按单纯随机抽样抽取400户,调查一个月的伙食费(单位:元)。经计算:利用这次抽样结果,现在若要再进行一次简单随机抽样,分别要求如下时,样本量各为多少?(1)要求d=50(置信度为0.95);(2)要求r=0.05(置信度为0.95)。62.355,28.414400165712sy解:194194)1(2210ndSun)(101611132)()2(00210NnnnYrSun2.4.3估计总体比例P时样本量的确定方法:1.精度要求:估计量p的绝对误差限为d则PQNNnfu1121)(21pVudPQNNnNnNu121PQnNundN)()(22121PQudNNPQun2

19、2122211)(整理得:)(22212221dPQuNdNPQu2222122221NddPQuNdNdNPQu)(NdPQudPQu)(1122212221NnnndPQun110022210,则令2.精度要求:估计量p的相对误差限为r分析:222100011dPQunNnnnd,其中时,则绝对误差限为,代入上式得:误差限把精度要求转化为绝对rPd PrQurPPQudPQunNnnn22212221222100011)(,其中 精度要求 样本量的确定2210)(dSun)-1(.2下在时绝对误差限为d)-1(.3下在时相对误差限为rNnnn00122212210)()(CruYrSun时

20、估计量方差的上限为V.1时估计量的变异系数为C.4VSn2020)(YCSn 精度要求 样本量的确定222/10dPQn时绝对误差限为d.2时相对误差限为r.3Nnnn1100222210rPPQun时估计量方差的上限为V.1时为估计量的变异系数上限C.4VPQn 0220PCPQn 例8:估计3200件产品中优等品的比例P的问题,若已知 ,以95%的置信度允许P估计量的绝对误差d=0.04,确定所需的样本量。解:45.00p59404.055.045.096.12222210dPQunNnnnNn11,19.0000需修正,不能忽略例9:为估计某一地区的流行病的发病率P,用简单随机抽样进行调

21、查,设允许P的估计量的相对误差限为10%,初步估计发病率为25%,问在置信水平为95%的条件下至少需采样多少才能满足需求?解:1152115225.01.075.096.1022222/10nnNPrQun取很大,例10:某销售公司希望了解全部3000家客户对该公司的综合满意度,决定用电话来进行一个简单随机调查。销售公司希望以95%的把握保证绝对误差为10%,但对总体比例P无法给出一个大致的范围。这时应该调查多少个客户?解:9311961.05.05.096.1002222/10NnnndPQun修正为:3.5 放回简单随机抽样定理:3234424444222222113322)(1)(2,1

22、unnsyCovnununusVsEnnsEnyVyEyynnnn),()()(,即:)()()()则(总体的四阶矩存在,是独立同分布样本,设,样本1.放回简单随机抽样的简单估计为:nyV2)(性质:;)YyEyY(,且的简单估计为性质:总体均值nsyvyV2)()的无偏估计为(性质:2.设计效应(design effect):3.放回简单随机抽样的样本量的确定:方法1:方法2:fnNNSNnnNSNNnSnfnVVdeffsrsworsrswr1111112222值越大,效率越低。抽样估计量的方差相同样本量下简单随机的方差所考虑抽样设计估计量deffdeff 3.6 逆抽样mmmpCvurmmmmQPpSpCvmQmPpVnmpPnmEPmnEmmnQPCnPmnmmn得到由)()(则,)(对于负二项分布1)(11)()()1()(11,11.12/12211

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第三章简单随机抽样讲义课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|