ImageVerifierCode 换一换
格式:PPT , 页数:52 ,大小:865.51KB ,
文档编号:7474647      下载积分:22 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-7474647.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(ziliao2023)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(抽样调查理论与方法-金勇进(第二版)-第2章-简单随机抽样课件.ppt)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

抽样调查理论与方法-金勇进(第二版)-第2章-简单随机抽样课件.ppt

1、第第2章章 简单随机抽样(简单随机抽样(SRS)2.1定义与符号定义与符号n简单随机抽样也称为纯随机抽样。n从含有 N 个单元的总体中抽取 n 个单元组成样本,如果抽样是不放回的,则所有可能的样本有 个,若每个样本被抽中的概率相同,都为 ,这种抽样方法就是简单随机抽样。n称 为抽样比,记为 f。CNnnNC1抽样总体样本容量Nn【例例2.1】n设总体有5个单元(1、2、3、4、5),按不放回简单随机抽样的方式抽取2个单元,则所有可能的样本为个:1,22,33,44,51,32,43,5 1,42,5 1,5 【例例2.2】n设总体有5个单元(1、2、3、4、5),按放回简单随机抽样的方式抽取2

2、个单元,则所有可能的样本为25个(考虑样本单元的顺序):1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5简单随机抽样的抽取规则n(1)按随机随机原则取样;n(2)每个抽样单元被抽中的概率都是已知已知的的或事先确定的;n(3)每个抽样单元被抽中的概率都是相等相等的的。(等概随机抽样)n定义定义2.1 从总体的N个单元中,一次整批抽取n个单元,使任何一个单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概率也都相等,这种抽样称为简单随机抽样。n定义定义2.2 从总体的N个单元中,逐个不放回

3、地抽取单元,每次抽取到尚未入样的任何一个单元的概率都相等,直到抽足n个单元为止,这样所得的n个单元组成一个简单随机样本。n定义定义2.3 按照从总体的N个单元中抽取n个单元的所有可能不同的组合构造所有可能的 个样本,从 个样本随机抽取1个样本,使每个样本被抽到的概率都等于 ,这种抽样称为简单随机抽样。nNC1nNCnNC符号 n大写符号表示总体的标志值,n用小写符号表示样本的标志值 NNiiYYYYY211nniiyyyy211NYYYYNYNNii2111nyyyynynnii2111NiiYNNAP1110或iYniiynnap1110或iyXYXYXYRNiiNii1122111NiiS

4、YYNniiyyns12211总 体样 本 11niiniiyyrxx1211nniiyyyYyynn1niiNYNyyn简单估计量11niiaPpyyYnnxyxyRniinii11总体指标值上面带符号“”的表示由样本得到的总体指标的估计。2.2 简单估计量及其性质简单估计量及其性质n引理引理 2.2.1 1:从大小为N的总体中抽取一个样本量为n的简单随机样本,则总体中每个特定单元入样的概率为n/N,两个特定单元都入样的概率为:n引理引理2.2 2.2 从总体规模为N的总体中抽取一个样本量为n的简单随机样本,若对总体中的每个单元 ,引进随机变量 (入样,;不入样,),则 iY11n nN N

5、ia0ia 1ia iYiY()(1,2,.,)()(1)(1,2,.,)(1)cov(,)(1)(,1,2,.,;)(1)1iiijnE afiNNn NnV affiNNNnnffa ai jN ijN NNN n定理定理 2.2.1 1:对于简单随机抽样,作为 的简单估计,是无偏的,即 始终成立。Y()E YE yYYyn推论推论 2.2.1 1:对于简单随机抽样,的期望为:n推论推论 2.22.2:对于简单随机抽样,的期望为:n推论推论 2.32.3:对于简单随机抽样,n较大时,的期望为:()E YE NyNYYYNyPp()E PE pPRr()E RE rRn对于有限总体的方差定义

6、:n定理定理2.2:对于简单随机抽样,的方差其中,称为有限总体校正系数。(未入样率)2211NYYiiNSNYYiiN22111y 21fV ySn1 f 评价调查成功评价调查成功与否的重要指标与否的重要指标n估计量的方差 是衡量估计量精度的度量。影响估计量方差的因素主要是样本量 。在简单随机抽样的条件下,只有通过加大 样本量来提高估计量的精度。V yS2n推论推论 2.42.4:对于简单随机抽样,的方差为:n推论推论 2.52.5:对于简单随机抽样,的方差为:n推论推论 2.62.6:对于简单随机抽样,当n较大时,的方差为:221()fV YNSnYNyPp11()(1)1fV PNPPnN

7、R2211 11()()1NiiifV RYRXXnNn定理定理 2.32.3:对于简单随机抽样,有 式中,为总体协方差。1cov(,)yxfy xSn111NyxiiiSYYXXNcov(,)()()y xE yE yxE x协方差定义:n定理定理 2.42.4:简单随机抽样的方差 是总体方差 的无偏估计。22111niisyyn2Sn推论推论 2.72.7:对于简单随机抽样,是 的无偏估计。n推论推论 2.82.8:是 的无偏估计。21()()fV Yv ysn22(1)()()fV Yv NyNsn()V y()V Yn推论推论 2.9:对于简单随机抽样,n推论推论 2.10:对于简单随

8、机抽样,当n较大时,有20 111()()()(1)1pffV Pv pv ysppnn 2211 11()()1niiifV Rv ryrxxnn n大样本下,抽样调查样本均值的估计量近似服从正态分布,(0,1)()YyNv y/2()1()YyPZv y/2/2(),()YyZv yyZv y【例例2.32.3】n我们从某个N=100的总体中抽出一个大小为n=10的简单随机样本,请估计总体平均水平,并给出置信度为95%的区间估计。iiy序号12345678910452046615085105011niiyny1111.199172)(11122niiyynsn由置信度95%对应的 ,因此,

9、可以以95%的把握说总体平均水平大约在 之间,即2.4295和7.5705之间。5 yY 2110.119.11111.7210fv ysn 1.3115v y/21.96z3115.196.15n定理定理 2.52.5:简单随机抽样的协方差 是总体协方差 的无偏估计。111nyxiiisyyxxnyxSn主要变量 Y n与Y有关的辅助变量 Xn辅助变量必须与主要变量高度相关n辅助变量与主要变量之间的相关关系整体上相当稳定n辅助变量的总体总值或总体均值必须是已知的,或是容易获得的n辅助变量的信息质量更好,或信息更容易取得即调查成本更低。2.3 比率估计量及其性质比率估计量及其性质比率估计量一般

10、用来估计主要变量的总体总值和总体均值n比率估计、回归估计需要有足够的样本量足够的样本量才能保证估计的有效性。n有偏估计:当样本量足够大时,估计的偏倚趋于0。符号定义 1RRyYyXXRxNRRRyYNYNyXXRxR属于简单估计量,不属于比率估计量。总体均值的比率估计量:总体总值的比率估计量:n引理引理 2.32.3:对于简单随机抽样,n较大时,的期望为:(1)不是无偏的;(2)但在某种条件下,是近似无偏的。Rr()E RE rRRRn定理定理 2.62.6:对于简单随机抽样,n较大时,的期望为:n推论推论 2.112.11:对于简单随机抽样,n较大时,的期望为:n引理引理2.4 2.4:对于

11、简单随机抽样,n较大时,的方差为:()RE yXRY2211 11()()()1NiiifV RV rYRXXnNRRYyRRYNy()RE YNXRNYYRrn定理定理 2.72.7:对于简单随机抽样,n较大时,的方差为:n推论推论 2.122.12:对于简单随机抽样,n较大时,的方差为:RRYNy22111()()1NRiiifV YNYRXnNRRYy2111()()1NRiiifV yYRXnN设:yxxSSS yxxyxSSSCYXYX 是Y和X的总体相关系数222SCYY的相对方差(变异系数)222xxSCXY与X的相对协方差X的相对方差(变异系数)22221 1()()(2)xx

12、fV RV rSR SSR SXn2221()()(2)RxxfV yV XRSR SSR Sn22221()(2)RxxfV YNSR SSR Sn比率估计量的方差估计22212222221()(2)1()(2)RxyxRxyxfv ysRsR snXfvysRsR sxn2222122222221()(2)1()(2)RxyxRxyxfv YNsRsR snXfv YNsRsR sxn【例例2.2.4 4】n在20世纪90年代初的一项工资研究中,人们发现IT行业中,从业者的现薪与起薪之间相关系数 高达0.88,已知某IT企业474名员工的平均起薪为17016.00/年,现根据对100个简单

13、随机抽样方式选出的员工现薪的调查结果,估计该企业员工的现薪平均水平。【例例2.2.5 5】n根据例【2.4】的数据和结果,比较两种思路下对应的方差估计结果。n间接估计n主要变量 Y n与Y有关的辅助变量 Xn辅助变量必须与主要变量高度相关n辅助变量与主要变量之间的相关关系整体上相当稳定n辅助变量的总体总值必须是已知的,或是容易获得的n辅助变量的信息质量更好,帮忙而不添乱。2.4 回归估计量及其性质回归估计量及其性质最早使用回归估计的人物之一是沃森(Watson),1937年他利用植物叶片的重量植物叶片的重量作为辅助变量,通过回归估计,得到了主要变量植物叶片面积植物叶片面积的总体均值估计。植物叶

14、片面积与植物叶片重量之间存在稳定的线性关系。植物叶片重量比植物叶片面积更容易测定。符号定义lrlrYyyXxlrlrYNY总体均值的回归估计量:总体总值的回归估计量:回归系数未知(用样本数据估计)已知(源于往期的调查结果)2()()()iiiyyxxxx n定理定理 2.82.8:对于简单随机抽样,如 为常数(记为 ),则有20112220011()11 2NNlriiiixyxfVyYYXXnNfSSSn 0()lrE yY02yxxxSSBSS n定理定理 2.92.9:使回归估计的精度最高,即 最小的 为:n此时,最小值 为:()lrV y0min()lrVy22min1()(1)Lrf

15、VySn()lrE yYn定理定理 2.102.10:对于简单随机抽样,n足够大时,的数学期望为(未知):lryn定理定理 2.112.11:对于简单随机抽样,n足够大时,的方差为(未知):lry221()()(1)lrlrfV yMSE ySn2.4.3 各种估计量的精度比较21()fV ySnn简单估计n比率估计n回归估计221()(1)lrfV ySn2221()(2)RxxfV ySR SSR SnN N足够大的情形足够大的情形N N不够大的情形不够大的情形l 比率估计和回归估计不一定比简单估计好;l 回归估计的抽样误差与比率估计的相差不大,但均方误差 明显比比率估计的大,且且n n越

16、小,回归估计的均方误差越大越小,回归估计的均方误差越大。n2.5.1 样本容量的确定n由n所以,2.5 简单随机抽样的实施简单随机抽样的实施22111()fV ySSnnN21()1V ynSNn定义 绝对误差限度:绝对误差限度:n由n所以,22111()fV ySSnnNyYd11()()yYdP yYdPV yV y 22/2()V ydZ222/211dnZSN 所以,有效回答率:有效回答人数占全部访问人数的比例0300=40075%n 初始n有效回答率222/211dnZSN 所以,有效回答率:有效回答人数占全部访问人数的比例0300=40075%n 初始n有效回答率样本量的确定步骤(

17、1)(1)根据委托机构要求确定估计精度水平n绝对误差限度n置信度(2)按照保守原则(即样本量宁大勿小),对总体方差 进行预估n利用先前的调查结果和经验n利用预调查或试调查的结果n利用同类或类似二手数据的结果n利用某些既有的结论。n由富有经验的专家指定。d12S样本量的确定步骤(2)(3)根据给定的估计精度水平和总体方差的预估结果,同时考虑总体规模N的大小,以简单随机抽样方式及回答率为100%为前提计算出初始样本量(4)确定抽样方式,并根据设计效应对样本量进行调整:0n10nndeff2022/211dnZSN设计效应设计效应deffdeff定义:复杂抽样的样本估计量的方差与简单随机抽样的样本估

18、计量的方差的比率。srsV ydeffVy简单随机抽样简单估计量的方差 某个抽样设计在同样样本量条件下估计量的方差。Deff的作用:(1)评价抽样设计的一个依据,如果deff1,则抽样设计比简单随机抽样的效率低。(2)计算样本量如多阶段抽样的 Deff大约在22.5之间。n=n(deff)n为简单随机抽样所需样本量。样本量的确定步骤(3)(5)判断有效回答率,并进行调整(6)存在分组数据时,分别估计各组所需样本量(7)仔细权衡费用、时间、调查机构拥有或可动用的各种资源的限制最终确定样本量。(7)21/nnr【例例2.52.5】n某超市新开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度,该超市与附近几个小区的居委会取得联系,在总体中按简单随机抽样抽取了一个n=200人的样本,调查发现对该超市购物环境表示满意或基本满意的居民有130位,要估计对该超市购物环境持肯定态度居民的比例,并在置信度95%下,给出估计的近似置信区间、绝对误差极限。(忽略抽样比的影响,f=0)n95%近似置信区间为 58.37%,71.63%65200130nap 11(1)0.65 0.350.0011431200 1fv pppn 1.96*1.96*0.03380.0662dv p0338.096.165.0end

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|