1、11/25/2022统计学专业必修课3学分1抽样理论与方法抽样理论与方法统计学本科统计学本科专业必修课专业必修课3学分学分主讲教师:刘爱芹主讲教师:刘爱芹11/25/2022统计学专业必修课3学分2目目 录录n第一、二章第一、二章 概述概述n第三章第三章 简单随机抽样简单随机抽样n第四章第四章 分层随机抽样分层随机抽样n第五章第五章 比率与回归估计比率与回归估计n第六章第六章 不等概抽样不等概抽样n第七章第七章 整群抽样整群抽样n第八章第八章 系统抽样系统抽样n第九章第九章 多阶段抽样多阶段抽样n第十章第十章 二重抽样二重抽样n第十一章第十一章 非抽样误差非抽样误差11/25/2022统计学专
2、业必修课3学分3CH3 简单随机抽样简单随机抽样(srs:simple random sampling)4课时课时11/25/2022统计学专业必修课3学分4Srs的地位的地位n掌握本章的内容对于学好其他各章、进而掌握整个抽样方掌握本章的内容对于学好其他各章、进而掌握整个抽样方法体系起到法体系起到基础性、关键性基础性、关键性的作用的作用n其他抽样方法都是在其他抽样方法都是在srs的基础上发展而来的的基础上发展而来的nSrs建立了建立了最完备最完备的理论,是抽样中的理论,是抽样中最容易掌握最容易掌握、也是发展、也是发展最最成熟成熟的技术的技术nSrs不需要其他辅助信息不需要其他辅助信息就能进行抽
3、样,唯一需要的只是一个就能进行抽样,唯一需要的只是一个关于研究总体所有单位的名单目录和联系方式关于研究总体所有单位的名单目录和联系方式最简单最简单nSrs关于关于n的确定、总体指标的估计与方差的估计都有的确定、总体指标的估计与方差的估计都有现成的现成的标准公式标准公式可用,且这些公式可用,且这些公式容易掌握容易掌握nSrs是是最基本最基本的抽样方法,其它概率抽样方式或多或少都包含的抽样方法,其它概率抽样方式或多或少都包含有有srs的成分,比如,的成分,比如,str、cl、ms等等nSrs一般来说一般来说效率也可以效率也可以,在相同的,在相同的n下,它的抽样精度往往下,它的抽样精度往往比其他很多
4、复杂抽样方式都高,经常作为方法比较的基础比其他很多复杂抽样方式都高,经常作为方法比较的基础11/25/2022统计学专业必修课3学分5CH3学习要求学习要求n大纲规定的内容:大纲规定的内容:n熟练掌握熟练掌握srs的样本抽选方法的样本抽选方法(上机上机)n熟知总体均值、总体总值和总体比例的简单估计熟知总体均值、总体总值和总体比例的简单估计n掌握掌握n确定的方法和步骤确定的方法和步骤n理解理解srs在抽样方法体系中的地位在抽样方法体系中的地位n了解:了解:n逆抽样法逆抽样法n子总体及其估计方法子总体及其估计方法11/25/2022统计学专业必修课3学分6CH3内容体系内容体系3.1 抽样方式抽样
5、方式/样本抽选方法样本抽选方法n对对srs的理解,的理解,srs的抽选方法,基本的符号说明的抽选方法,基本的符号说明n对对srs的地位、适用性和局限性的认识的地位、适用性和局限性的认识3.2 总体均值总体均值与总体总值的简单估计与总体总值的简单估计3.3 总体比例的简单估计总体比例的简单估计n估计量的定义估计量的定义n估计量的性质估计量的性质(无偏性、方差及方差的无偏估计无偏性、方差及方差的无偏估计)3.4 样本量的确定样本量的确定n样本量的确定原理、基本步骤样本量的确定原理、基本步骤n逆抽样法逆抽样法3.5 子总体的估计子总体的估计n结语:结语:srs之之“简单简单”的理解的理解11/25/
6、2022统计学专业必修课3学分73.1 抽样方式抽样方式一、对一、对srs的理解的理解二、二、srs的样本抽选方法的样本抽选方法三、三、srs的适用性和局限性的适用性和局限性四、基本符号说明四、基本符号说明11/25/2022统计学专业必修课3学分8Srs分类分类按是否放回、是否考虑顺序分按是否放回、是否考虑顺序分l放回有序放回有序理论探讨的基础理论探讨的基础l是全排列的形式,可能的样本数目是全排列的形式,可能的样本数目最多,但理论结果最简单,简称放最多,但理论结果最简单,简称放回简单随机抽样回简单随机抽样(srswr:srs with replacement)l放回无序放回无序l不放回有序不
7、放回有序l不放回无序不放回无序现实应用的核心现实应用的核心l典型的组合形式,其可能的样本数典型的组合形式,其可能的样本数目最少,同时实际操作也最简单,目最少,同时实际操作也最简单,简称为不放回简单随机抽样简称为不放回简单随机抽样(srswor:srs without replacement)基本没有基本没有实用价值实用价值nNm!)(!nNNPnN)!1(!)!1(1NnnNCnnN!)(!nNnNCnN可能的样可能的样本数目本数目11/25/2022统计学专业必修课3学分9Srswor和和Srswr的比较的比较l每次抽样面对的总体结构不同每次抽样面对的总体结构不同lSrswr总体结构不发生变
8、化,每次抽取都是相互独立地进行,总体结构不发生变化,每次抽取都是相互独立地进行,因此数学处理相对简单因此数学处理相对简单lSrswor各次抽取不是相互独立的各次抽取不是相互独立的l样本提供的信息量不同样本提供的信息量不同ln一定的条件下,一定的条件下,srswor能提供更多的信息量,抽样效率能提供更多的信息量,抽样效率更高更高l实践中,更多地是采用实践中,更多地是采用srsworl以下的讨论以下的讨论没有特殊说明,均指没有特殊说明,均指srswor11/25/2022统计学专业必修课3学分10一、对一、对srs的理解的理解nsrs又称又称“纯纯”随机抽样。对于大小为随机抽样。对于大小为N的总体
9、,的总体,随机抽取样本量为随机抽取样本量为n的样本,若的样本,若全部可能的样全部可能的样本被抽中的概率都相等本被抽中的概率都相等,则称这样的抽样为简,则称这样的抽样为简单随机抽样,所抽到的样本即单随机抽样,所抽到的样本即简单随机样本简单随机样本n所以,所以,srs是典型的是典型的等概率等概率抽样抽样11/25/2022统计学专业必修课3学分11比较流行的比较流行的srs的定义及理解的定义及理解l简单随机抽样简单随机抽样/纯随机抽样,是从含有纯随机抽样,是从含有N个单元的总体中,个单元的总体中,按照按照随机原则随机原则抽取容量为抽取容量为n的样本,的样本,每个单元都有同样每个单元都有同样的机会被
10、抽中的机会被抽中(以以srswor为例说明为例说明)等概率等概率抽样抽样l“等概率等概率”的含义的含义三个层次:三个层次:n每次抽样时,每个单元被抽中的概率相等每次抽样时,每个单元被抽中的概率相等 1/N,1/(N-1),n每个单元被抽中的概率每个单元被抽中的概率(进入样本的概率进入样本的概率)均为均为 n/Nn可能的样本数目为可能的样本数目为CNn,每个可能样本被抽中的概率,每个可能样本被抽中的概率均为均为 1/CNn11/25/2022统计学专业必修课3学分12srs举例举例n美国著名的美国著名的Gullop(盖洛普盖洛普)在总统大选期间进行的民在总统大选期间进行的民意测验的抽样方法是:意
11、测验的抽样方法是:n从美国从美国20万个选区中随机抽取万个选区中随机抽取300个选区个选区n再从每个中选选区中随机抽选住户进行民意调查再从每个中选选区中随机抽选住户进行民意调查n这虽然是个两阶段抽样,但在每个阶段中这虽然是个两阶段抽样,但在每个阶段中srs起主起主要作用要作用n大型企业,财务上核对帐面库存价值与实际库存价值大型企业,财务上核对帐面库存价值与实际库存价值是否相符是否相符n假设共有假设共有3000多种物资,不允许逐项核对多种物资,不允许逐项核对n采用抽样方法,随机抽取采用抽样方法,随机抽取100种物资核对帐面和库种物资核对帐面和库存,然后用两者的比率来推算总体存,然后用两者的比率来
12、推算总体n这种抽样的估计方法是比率估计,但抽样采用的是这种抽样的估计方法是比率估计,但抽样采用的是srs11/25/2022统计学专业必修课3学分13二、简单随机样本的抽选方法二、简单随机样本的抽选方法l首先,对总体单位编号,每个单位对应一个号首先,对总体单位编号,每个单位对应一个号(隐含:隐含:srs要求有所有总体单位的名单目录要求有所有总体单位的名单目录抽样框的编制抽样框的编制)l然后,从所编的号中然后,从所编的号中抽号抽号,如果抽到某个号,则对应,如果抽到某个号,则对应的那个单位入样,直到抽够的那个单位入样,直到抽够n个为止个为止l关键是:如何抽号?抽号的标准是什么?怎样才能保关键是:如
13、何抽号?抽号的标准是什么?怎样才能保证随机和等概率?证随机和等概率?l抽号的方法:抽号的方法:1.抽签法:抽签法:N不大不大2.随机数法:随机数法:N较大较大n随机数表随机数表、随机数骰子、摇奖机、随机数骰子、摇奖机、计算机产生随机计算机产生随机数数11/25/2022统计学专业必修课3学分141、抽签法、抽签法n适用性:适用性:N不大的情况下不大的情况下 n方法:方法:n制作同材质、结构均匀的制作同材质、结构均匀的N个签,编号个签,编号1N,分别代表总体分别代表总体N个单位个单位n将将N个签完全混合均匀,一次同时抽个签完全混合均匀,一次同时抽n个签个签(全全样本抽选法样本抽选法)或逐个抽取,
14、通常取中的不再放回或逐个抽取,通常取中的不再放回(srswor)n抽中的抽中的n个签上的号码对应的单位入样个签上的号码对应的单位入样l社会实践中应用较少,原因:社会实践中应用较少,原因:l实践中大总体、大样本居多,抽签法使用麻烦实践中大总体、大样本居多,抽签法使用麻烦11/25/2022统计学专业必修课3学分152、随机数法、随机数法(Random Number)l(1)随机数表随机数表l(2)随机数骰子随机数骰子l(3)摇奖机摇奖机l(4)计算机产生伪随机数计算机产生伪随机数11/25/2022统计学专业必修课3学分16随机数表的介绍随机数表的介绍n随机数表是用计算机采用随机方法模拟制成的随
15、机数表是用计算机采用随机方法模拟制成的n表中,表中,09这这10个数字出现的概率各为个数字出现的概率各为1/10,但排,但排列顺序是随机的;由相邻数字组成的各种多位数列顺序是随机的;由相邻数字组成的各种多位数(比如比如两位数、三位数等两位数、三位数等),也大致有相同的机会出现并随机,也大致有相同的机会出现并随机排列排列n目前,国际上常用的随机数表有四种:目前,国际上常用的随机数表有四种:n蒂配特,蒂配特,1927年编制的,年编制的,4位一组的随机数表位一组的随机数表n贾歇与耶茨,贾歇与耶茨,1938年,年,10位一组的位一组的n肯德尔与史密斯,肯德尔与史密斯,1939年,年,5位一组的位一组的
16、n兰德公司,兰德公司,1955年,年,5位一组的位一组的11/25/2022统计学专业必修课3学分17随机数表的使用方法随机数表的使用方法n方法方法1:常规方法:常规方法n方法方法2:差数法:差数法n方法方法3:余数法:余数法n使用时需注意:使用时需注意:n保证保证抽样随机性和等概率原则抽样随机性和等概率原则的实现的实现nP66 思考题思考题3.111/25/2022统计学专业必修课3学分18方法方法1:常规方法:常规方法n对总体的全部单元编号对总体的全部单元编号1-N1-Nn按编号的位数确定使用多少行按编号的位数确定使用多少行(或多少列或多少列)数字数字n随机确定起点随机确定起点(技巧技巧)
17、n从起点开始,横向从起点开始,横向(或纵向或纵向)逐个取数,属于总逐个取数,属于总体单元编号范围内的数码,其对应的总体单元即体单元编号范围内的数码,其对应的总体单元即被选中,直到取满所需样本单元数为止被选中,直到取满所需样本单元数为止nworwor抽取时,碰到重复的数字就舍弃,继续抽抽取时,碰到重复的数字就舍弃,继续抽选选11/25/2022统计学专业必修课3学分19方法方法2:差数法:差数法n常规方法存在的缺陷:效率低常规方法存在的缺陷:效率低n尤其是当尤其是当N的第一位数字小于的第一位数字小于5,而,而n不算小的时候不算小的时候n比如,比如,N=118,n=30n按常规方法,大于按常规方法
18、,大于118的号码要舍弃。的号码要舍弃。n所以,需要抽所以,需要抽200-300个数字才能有个数字才能有30个数字满足要求个数字满足要求n为了提高数字的使用效率,可选择差数法为了提高数字的使用效率,可选择差数法(或余数法或余数法)n比如,取到比如,取到768 则则768-2003=168,舍弃,舍弃 取到取到502 则则502-2002=102,取到,取到n这样数字的使用效率会提高为原来的这样数字的使用效率会提高为原来的 5倍倍11/25/2022统计学专业必修课3学分20方法方法3:余数法:余数法n差数法数字的使用效率会提高,而余数法能进一步提差数法数字的使用效率会提高,而余数法能进一步提高
19、数字的使用效率,比如,高数字的使用效率,比如,N=118,n=30n取到取到768,则,则768118=660,60号单位被选中号单位被选中n取到取到502,则,则502118=430,30号单位被选中号单位被选中n问题:问题:0999这这1000个数字都可以用吗?个数字都可以用吗?n注意:注意:n999以内以内118的最大倍数是的最大倍数是1188=944,则,则944999的数字全都抛弃,这样每个单元入样概率都的数字全都抛弃,这样每个单元入样概率都是是1/118;否则会造成各单位的入选概率不同,前;否则会造成各单位的入选概率不同,前56个个入样概率为入样概率为9/1000,后,后62个单元
20、入样概率为个单元入样概率为8/1000,569/1000+628/1000=1n所以,余数法数字的使用效率为所以,余数法数字的使用效率为 94.4%n虽然余数法抽选效率高,但需要一定的计算量,所以虽然余数法抽选效率高,但需要一定的计算量,所以差数法用的相对比较多差数法用的相对比较多11/25/2022统计学专业必修课3学分21(2)随机数骰子随机数骰子n国家技术监督局国家技术监督局1988年年12月月10日发布了:日发布了:GB/T 10111-1988号,规定了利用随机数骰子进行随机抽号,规定了利用随机数骰子进行随机抽样的方法,从样的方法,从1989年年8月月1日开始实施日开始实施n随机数骰
21、子有很多种随机数骰子有很多种n我国我国“运筹牌运筹牌”随机数骰子:随机数骰子:n一盒有一盒有6个颜色不同、材质均匀的正个颜色不同、材质均匀的正20面体,分别标有面体,分别标有09各各2个个n使用时,根据使用时,根据N的位数选择骰子的个数,规定好每种颜的位数选择骰子的个数,规定好每种颜色代表的位数,摇动盒子充分旋转,产生相应的数字。色代表的位数,摇动盒子充分旋转,产生相应的数字。重复重复n次次n一个一个m位的随机数也可以用一个骰子连续掷位的随机数也可以用一个骰子连续掷m次产生次产生11/25/2022统计学专业必修课3学分22(3)摇奖机摇奖机n现在社会上流行的各类彩票的抽奖过程都是借助摇奖现在
22、社会上流行的各类彩票的抽奖过程都是借助摇奖机来完成的机来完成的n摇奖机就是一个随机化装置摇奖机就是一个随机化装置n小球等物体要求材质相同且均匀、大小重量均相等小球等物体要求材质相同且均匀、大小重量均相等11/25/2022统计学专业必修课3学分23(4)计算机产生伪随机数计算机产生伪随机数 随机抽样的计算机实现随机抽样的计算机实现n比较适用于:拥有数据库或电子表格形式的抽样框时比较适用于:拥有数据库或电子表格形式的抽样框时n多数统计软件都有现成的产生随机数的程序多数统计软件都有现成的产生随机数的程序nExcel:随机数函数、数据分析过程中的随机数发:随机数函数、数据分析过程中的随机数发生器和抽
23、样过程生器和抽样过程nSpss:主菜单:主菜单dataselect cases过程过程n专用的电子随机数发生器专用的电子随机数发生器n优缺点:优缺点:n优点:方便、快捷优点:方便、快捷n缺点:计算机产生的随机数有循环周期,不能保证缺点:计算机产生的随机数有循环周期,不能保证随机性,因此被称为伪随机数随机性,因此被称为伪随机数n因此,在有条件的情况下,不建议使用计算机产生随因此,在有条件的情况下,不建议使用计算机产生随机数机数11/25/2022统计学专业必修课3学分24Excel中产生随机数中产生随机数(1)借助随机数函数借助随机数函数nRand(),返回大于或等于,返回大于或等于0且小于且小
24、于1的平均分布随的平均分布随机数机数nRandbetween(bottom,top),返回指定数值,返回指定数值(整数整数)之间的随机数之间的随机数(2)工具工具数据分析数据分析抽样过程抽样过程n可执行可执行srs和典型意义下的和典型意义下的sy(3)工具工具数据分析数据分析随机数发生器随机数发生器n定义变量个数、随机数个数、随机数服从的分布等定义变量个数、随机数个数、随机数服从的分布等即可产生相应的随机数即可产生相应的随机数11/25/2022统计学专业必修课3学分25Spss中中n主菜单主菜单dataselect cases过程过程nAll casesnSelect cases if sa
25、tisfied if(可用于分层可用于分层)nRandom sample of cases(可直接从总体中可直接从总体中srs)nSample size(approximately%of all cases/exactly cases from the first cases)nBased on time or case rangenUse filter variables11/25/2022统计学专业必修课3学分26电子随机数发生器电子随机数发生器n国家技术监督局国家技术监督局GB/T 15500-1995规定了,利用电规定了,利用电子随机数抽样器进行随机抽样的方法子随机数抽样器进行随机抽样
26、的方法n是专业抽样工具,是专业抽样工具,工业界广泛使用工业界广泛使用,而社会经济调查,而社会经济调查领域中和抽样文献中都很少提到领域中和抽样文献中都很少提到n但是这种方法简单易学,适用性广但是这种方法简单易学,适用性广n像个计算器,按照像个计算器,按照N的范围,预置各位次开关的位置,的范围,预置各位次开关的位置,读取随机数即可读取随机数即可n参考人大出版社参考人大出版社抽样技术抽样技术(2005第二版第二版)11/25/2022统计学专业必修课3学分27三、三、srs的适用性和局限性的适用性和局限性11/25/2022统计学专业必修课3学分28Srs的适用性的适用性n以下情形用以下情形用srs
27、最适宜最适宜l总体单元的标志变异程度很小,或总体单元的标志变异程度很小,或l具有某种特征的单元均匀分布于总体各个部分具有某种特征的单元均匀分布于总体各个部分11/25/2022统计学专业必修课3学分29Srs的局限性的局限性l在在N很大时,往往很大时,往往不具备完整的抽样框不具备完整的抽样框,或准备这样的抽样,或准备这样的抽样框很费劲框很费劲l如果抽样框中有很好的如果抽样框中有很好的辅助信息辅助信息而也不加以利用,势必会限而也不加以利用,势必会限制抽样估计效率的提高制抽样估计效率的提高l总体单元的总体单元的变异程度很大变异程度很大时,时,srs极可能得到一个极可能得到一个“差差”的的简单随机样
28、本,从而因样本代表性不足而影响抽样估计效果简单随机样本,从而因样本代表性不足而影响抽样估计效果lsrs的的样本单元散布很广样本单元散布很广,给现场调查工作带来困难,给现场调查工作带来困难l如果不用计算机,而借助随机数表或随机数骰子产生一个大如果不用计算机,而借助随机数表或随机数骰子产生一个大样本的随机数,则比较劳神单调样本的随机数,则比较劳神单调n其他抽样方法都是在其他抽样方法都是在srs的理论技术基础上,针对的理论技术基础上,针对srs的局限的局限发展起来的发展起来的11/25/2022统计学专业必修课3学分30四、四、srs的基本符号约定的基本符号约定11/25/2022统计学专业必修课3
29、学分31符号约定:符号约定:n总体目标量总体目标量NiiYY1n样本统计量样本统计量niiyy1ynNY n二者关系二者关系NYNYYNii1nynyynii1NYyY)或(YNYNAPiNii101)或(ynynapinii101pP yNYi(i=1,2,N)、yi(i=1,2,n)Xi(i=1,2,N)、xi(i=1,2,n)11/25/2022统计学专业必修课3学分32符号约定符号约定(续续)nii)y(yns122112122111N-N )Y(YNSNiin总体目标量总体目标量n样本统计量样本统计量n二者关系二者关系XYXYXYRNiiNii11xyxyxyrniinii11rR
30、2222S)wor E(s)wr E(sS2比比2使得使得估计量方差的估计量方差的形式更简洁形式更简洁11/25/2022统计学专业必修课3学分33均值估计的作用均值估计的作用n以上总体特征的估计中都用到了样本均值以上总体特征的估计中都用到了样本均值n总值估计是均值估计的总值估计是均值估计的N倍关系倍关系n比例是一种特殊的均值,是比例是一种特殊的均值,是(0-1)分布的均值,所以分布的均值,所以比例估计问题本质上就是均值估计问题比例估计问题本质上就是均值估计问题n比率估计是同一总体内两个总体特征变量的样本均值比率估计是同一总体内两个总体特征变量的样本均值之比之比n作为总体方差无偏估计的样本方差
31、的形式也是由样本作为总体方差无偏估计的样本方差的形式也是由样本均值构造的均值构造的n所以,在总体参数估计中,均值估计是最基本所以,在总体参数估计中,均值估计是最基本的,其方法是最重要的,需要特别关注的,其方法是最重要的,需要特别关注y11/25/2022统计学专业必修课3学分343.1小结小结n理解理解srs的地位、适用性和局限性的地位、适用性和局限性n重点理解重点理解srs的的“等概率等概率”的三个层次的三个层次n每次抽样时,每个单元被抽中的概率相等每次抽样时,每个单元被抽中的概率相等 1/N,1/(N-1),n每个单元被抽中的概率均为每个单元被抽中的概率均为n/Nn所有可能的样本数目为所有
32、可能的样本数目为CNn,每个可能样本被抽中,每个可能样本被抽中的概率均为的概率均为1/CNnn掌握样本抽取方法掌握样本抽取方法随机数表、计算机产生随机数随机数表、计算机产生随机数n熟悉熟悉srs的基本符号约定的基本符号约定3.1结束结束11/25/2022统计学专业必修课3学分353.2 总体均值与总体总值总体均值与总体总值 的简单估计的简单估计l估计量的形式估计量的形式l估计量的性质估计量的性质l无偏性无偏性l方差方差l方差的无偏估计方差的无偏估计11/25/2022统计学专业必修课3学分36一、总体均值的简单估计一、总体均值的简单估计11/25/2022统计学专业必修课3学分37(一一)总
33、体均值简单估计量的定义总体均值简单估计量的定义l在在没有其他总体信息没有其他总体信息的前提下,使用样本均值作的前提下,使用样本均值作为总体均值的估计为总体均值的估计l这是总体均值最简单的估计形式,即,样本均值这是总体均值最简单的估计形式,即,样本均值是总体均值的简单估计量是总体均值的简单估计量niiynyY11辅助辅助变量变量11/25/2022统计学专业必修课3学分38(二二)简单估计量的无偏性简单估计量的无偏性n样本均值是总体均值的无偏估计样本均值是总体均值的无偏估计YyE)(证明:对称性论证证明:对称性论证(argument of symmetry)法法NiiniiYNnyE11)(Ni
34、iniiYYNnYyE1212)()(NjijinjijiYYYYNNnnYyYyE)()1()1()()(1)(1niiyEnyEYYNYNnnNiiNii111)(111/25/2022统计学专业必修课3学分39(三三)简单估计量简单估计量 的方差的方差P48(3.7)221)(SnfSNnnNyVy说明说明:l 证明证明P49:方差的定义、完全平方式、对称性论证法:方差的定义、完全平方式、对称性论证法l V是抽样误差的测度指标,用于衡量估计精度是抽样误差的测度指标,用于衡量估计精度l 从上式可看出,影响抽样误差或精度的主要因素:从上式可看出,影响抽样误差或精度的主要因素:l n,二者呈反
35、向关系,二者呈反向关系l 1-f,二者,二者呈呈正向关系,正向关系,N一定,还是一定,还是n与与V的反向关系的反向关系l S2,二者,二者呈呈正向关系,正向关系,S2客观存在客观存在l 提高估计精度提高估计精度主要通过主要通过增大样本容量增大样本容量来实现来实现l 估计量方差的平方根即抽样标准误估计量方差的平方根即抽样标准误/抽样平均误差抽样平均误差l有限总体修正系数有限总体修正系数fpc:finite population correctionl总体未入样率总体未入样率Nnf 11/25/2022统计学专业必修课3学分40(四四)的方差的无偏估计的方差的无偏估计P49(3.12)221)(S
36、nfSNnnNyVnS2未知的处理思路未知的处理思路:1.经验数据,或者通过预调查或试调查获得经验数据经验数据,或者通过预调查或试调查获得经验数据2.根据标准差的数学性质粗略估计,全距根据标准差的数学性质粗略估计,全距R=46标准差,标准差,估计出估计出R,推出标准差的大概取值,推出标准差的大概取值3.用样本方差用样本方差s2估计总体方差估计总体方差S2,是无偏估计,是无偏估计n无偏性的证明在无偏性的证明在P49-50n Wor:E(s2)=S2方差:方差:y11/25/2022统计学专业必修课3学分41(五五)srswr的简单估计的简单估计n讨论讨论srswr的估计模式很有必要的估计模式很有
37、必要n现实中很多情况的抽样必须是放回的,比如现实中很多情况的抽样必须是放回的,比如n在城市中对行人、车辆的调查在城市中对行人、车辆的调查n对超市顾客、影剧院观众的调查对超市顾客、影剧院观众的调查n对一些特殊场所消费情况的调查等对一些特殊场所消费情况的调查等n对对srswr的理论探讨也是的理论探讨也是wor的基础的基础n由于每次抽样都是相互独立的,因此由于每次抽样都是相互独立的,因此srswr估计形式估计形式很简单,在此只给出基本结论很简单,在此只给出基本结论11/25/2022统计学专业必修课3学分42srswr的简单估计的简单估计P50(3.14-3.16)niiynyY11YyE)(21)
38、(snyv22111)(nSnNNyV21snf)y(V)y(VdeffsrsworsrswrnNNSNnNSNN1122121Snf21n=nwrsrs不如不如worsrs抽样效率高抽样效率高11/25/2022统计学专业必修课3学分43【例【例3.3】说明】说明P51n1、题目要求进行总体均值的区间估计、题目要求进行总体均值的区间估计n区间估计三要素区间估计三要素n中心点中心点n半径,即抽样极限误差半径,即抽样极限误差n置信度置信度/概率保证程度概率保证程度F(t),概率度,概率度tn2、总体分布未知,但、总体分布未知,但n=36是大样本,可做正态分布近似是大样本,可做正态分布近似n3、没
39、有其他辅助信息可以利用,所以采用总体均值的简单、没有其他辅助信息可以利用,所以采用总体均值的简单估计量形式估计量形式n这是区间的中心这是区间的中心niiynyY11t倍的抽样标倍的抽样标准差,也称准差,也称为绝对误差为绝对误差11/25/2022统计学专业必修课3学分44例例3.3说明说明(续续)n置信区间的半径由置信区间的半径由t倍的抽样标准误差倍的抽样标准误差/抽样平均抽样平均误差构成误差构成n开方以后就是抽样标准误差开方以后就是抽样标准误差n所以,关键是求样本方差所以,关键是求样本方差s2niiyyns122)(1121)(snyv21)(snfyv)(11212yynnii11/25/
40、2022统计学专业必修课3学分45二、总体总值二、总体总值Y的简单估计的简单估计n总体总值和总体比例的估计均可归结到总体均值的估总体总值和总体比例的估计均可归结到总体均值的估计上计上nY的定义式为的定义式为n所以,所以,Y的简单估计量为的简单估计量为NiiYYNY1niiynNyNYNY111/25/2022统计学专业必修课3学分46Y简单估计量的无偏性简单估计量的无偏性Y)YE(YyE)(证明:证明:)yNE()yE(N)YE(YYN11/25/2022统计学专业必修课3学分47Y估计量的方差及无偏估计估计量的方差及无偏估计(例例3.4)yV(N)YV(2221Snf)(NyNY 221)(SnfSNnnNyV)yv(N)Yv(2221snf)(N11/25/2022统计学专业必修课3学分48思考与练习思考与练习n思考:思考:n1、简单随机抽样的、简单随机抽样的“简单简单”如何理解?如何理解?n2、P66 3.1n作业:作业:nP66 3.2、3.3 注意:要习惯使用计算表注意:要习惯使用计算表n证明(看懂证明,证明(看懂证明,1/2的同学掌握):的同学掌握):nsrswor的简单估计量的无偏性的证明、方差形式的简单估计量的无偏性的证明、方差形式的证明和方差的无偏估计的证明的证明和方差的无偏估计的证明3.2结束结束
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。