统计学课件-第六章-抽样调查.ppt

上传人(卖家):晟晟文业 文档编号:4928527 上传时间:2023-01-26 格式:PPT 页数:58 大小:532KB
下载 相关 举报
统计学课件-第六章-抽样调查.ppt_第1页
第1页 / 共58页
统计学课件-第六章-抽样调查.ppt_第2页
第2页 / 共58页
统计学课件-第六章-抽样调查.ppt_第3页
第3页 / 共58页
统计学课件-第六章-抽样调查.ppt_第4页
第4页 / 共58页
统计学课件-第六章-抽样调查.ppt_第5页
第5页 / 共58页
点击查看更多>>
资源描述

1、一、抽样调查的概念、特点(一)、概念:抽样调查是按照随机原则随机原则从全部研究对象中抽取一部分单位进行观察,并依据所获得的数据对全部研究对象的数量特征数量特征做出具有一定可靠性可靠性的估计判断,从而达到对全部研究对象的认识的一种统计方法。根据部分实际资料对全部总体的数量特征做出估计。按随机的原则从全部总体中抽取样本单位。抽样推断的抽样误差可以事先计算并且加以控制。对某些不可能进行全面调查而又要了解其全面情况的社会经济现象,必须应用抽样调查。对某些社会经济现象虽然可以进行全面调查,但抽样调查可以节约时间、费用,提高调查的时效性。抽样调查和全面调查同时进行,可以发挥相互补充和检查质量的作用。抽样调

2、查可以用于工业生产过程的质量控制。利用抽样调查原理,还可以对某种总体的假设进行检验,来判断这种假设的真伪,以决定行动的取舍。一、总体与样本(一)、总体与总体指标总体:总体:是根据研究目的确定的所要研究的同类事物的全体。总体单位数称为总体容量,一般用N 表示。总体指标:总体指标:用来反映总体数量特征的指标。(二)、样本与样本指标样本:样本:从总体中抽取的部分总体单位所构成的整体。样本所包含的总体单位个数称为样本容量,一般用n表示。在实际工作中,人们通常把n30的样本称为大样本,而把 n30的样本称为小样本。样本指标:样本指标:是根据样本资料计算的、用于估计和推断相应总体指标的综合指标。211iP

3、PXFFXXFFXX FFNXPNPP 总体指标:或211ippxffxxffxxfsfnxpnspp 样本指标:或()概率抽样:也叫随机抽样,是指按照随机原则抽取样本。概率抽样最基本的组织方式有:简单随机抽样、分层抽样、等距抽样和整群抽样。非概率抽样:也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。重点调查、典型调查、配额调查等属于非随机抽样。(但由于非随机抽样的效果取决于调查者的经验、主观判断和专业知识,故难免掺杂调查者的主观偏见,出现因人而异的结果,且容易产生倾向性误差;此外,非随机抽样不能计算和控制其抽样误差,无法说明调查结果的可靠程度

4、。)随机原则:就是排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽选为样本单位,每个总体单位能否选随机原则:就是排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽选为样本单位,每个总体单位能否选入样本是随机的。入样本是随机的。抽样框的主要形式有三种:1、名单抽样框:即列出全部总体单位的名录一览表,如职工名单、企业名单等。2、区域抽样框:即按地理位置将总体范围划分为若干小区域,以小区域为抽样单位。3、时间表抽样框:即将总体全部单位按时间顺序排列,把总体的时间过程分为若干个小的时间单位,以此时间单位为抽样单位。误 差登记性误差代表性误差系统性误差随机性误差登记性误差是指在调查和汇总过程中

5、由于观察、测量、登记、计算等方法的差错或被调查者提供虚假资料而造成的误差。任何一种统计调查都可能产生登记性误差。代表性误差是指用样本指标推断总体指标时,由于样本结构与总体结构不一致、样本不能完全代表总体而产生的误差。系统性误差是指由于非随机因素引起的样本代表性不足而产生的误差,表现为样本估计量的值系统偏低或偏高。随机性误差又称偶然性误差,是指遵循随机原则抽样,由于随机因素(偶然性因素)引起的误差。抽样估计中的所谓抽样误差,就是指的这种随机误差。样本的可能数目既和样本的容量有关,也和抽样的方法有关。根据取样方式的不同,抽样方法有重复抽样和不重复抽样两种。1、重复抽样:是指从总体的N个单位中抽取一

6、个容量为n的样本,每次抽出一个单位后,再将其放回总体中参加下一次抽取,这样连续抽n次即得到一个样本。2、不重复抽样:是指抽中单位不再放回总体中,下一个样本单位只能从余下的总体单位中抽取。重复抽样:同一总体单位有可能被重复抽中;每个总体单位在每次抽样中被抽中的概率都是相同的。抽样误差较大。不重复抽样:同一总体单位不可能被重复抽中;由于每次抽取是在不同数目的总体单位中进行,每个总体单位在各次抽样中被抽中的概率不相等。抽样误差较小。1、考虑顺序的抽样:即从总体N 中抽取n个单位构成样本,不但要考虑样本各单位的不同性质,而且还考虑不同性质各单位的中选顺序。相同构成成分的单位,由于顺序不同,也作为不同样

7、本。2、不考虑顺序的抽样:即从总体N个单位抽取n个单位构成样本。只考虑样本各单位的组成成分如何,而不考虑单位的抽样顺序。如果样本的成分相同,不论顺序有多大不同,都作为一种样本。考虑顺序的不重复抽样数目考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目不考虑顺序的重复抽样数目!nNNANnnnNBN!nNNCnNn1nnNN nDC 考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目2416()nnNBN个!4!4 3 2 16()!2!42!2 2nNNCnNn 个考虑顺序的重复组合:AA BA CA DAAB BB CB DBAC BC CC DCAD BD CD DD不考虑顺序的不重复抽样数目

8、AB BC CDAC BDAD大数法则:大数法则:关于大量的随机现象具有稳定性质的法则。中心极限定理:中心极限定理:如果总体变量存在有限的平均数和方差,那么不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋近于正态分布。现象的某种总体规律只有当具有这些现象足够多数的单位汇总综合在一起的时候,才能显示出来。因此只有从大量现象的总体中,才能研究这些现象的规律性。现象的总体性规律,通常是以平均数的形式表现出来。所研究的现象总体包含的单位愈多,平均数也就越能够正确地反映出这些现象的规律性。各单位的共同倾向(这些表现为主要的、基本的因素)决定着平均数的水平;而单位对平均数的离差(这

9、些表现为次要的、偶然的因素)则由于足够多数单位的汇总综合的结果,而相互抵消,趋于消失。随着抽样单位数n的增加,抽样平均数x有接近总体平均数X的趋势。lim1inPxX 抽样平均数与总体平均数的离差究竟有多大?离差不超过一定范围的概率究竟有多少?这个离差的分布怎样?要解决这些问题,就要依靠中心极限定理。要解决这些问题,就要依靠中心极限定理。在现实生活中,一个随机变量服从于正态分布未必很多,但多个随机变量和的分布趋近于正态分布则普遍存在的。抽样平均数也是一种随机变量和的分布,因此在抽样单位数 n充分大的条件下,抽样平均数也趋近于正态分布,这为抽样误差的概率估计提供了一个极为有效而且方便的条件。一、

10、抽样实际误差:二、抽样平均误差:是抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。xX2ixxX样本可能数目(一)、抽样估计的特点:抽样估计是在逻辑上运用归纳推理而不是运用演绎推理。抽样估计是在方法上运用不确定的概率估计法而不是确定的数学分析法。抽样估计的估计结论存在着一定的抽样误差。无偏性:用抽样指标估计总体指标要求抽样指标的平均数等于被估计的总体指标。一致性:随着样本的单位数n的无限增大,抽样指标和未知的总体指标之间的绝对离差为任意小的可能性也趋于必然性。有效性:用抽样指标估计总体要求作为优良估计量的方差应该比其它估计量的方差小。E

11、 xX lim1lim1nnP xE xP xX序号样本变量(x)样本平均数平均数离差离差平方1(A、A)40、4040-204002(A、B)40、5045-152253(A、C)40、7055-5254(A、D)40、8060005(B、A)50、4045-152256(B、B)50、5050-101007(B、C)50、7060008(B、D)50、80655259(C、A)70、4055-52510(C、B)70、50600011(C、C)70、70701010012(C、D)70、80751522513(D、A)80、40600014(D、B)80、506552515(D、C)80、

12、70751522516(D、D)80、808020400合计9602000ix元)(604)80705040(X 22:9606016:20001611.18:240604:100015.81()4ixE xxXXXNXXN样本平均数的平均数样本可能数目(元)抽样平均误差样本可能数目(元)总体平均数(元)总体标准差元 举例说明抽样平均误差的意义:设有4个工人,各人的工资水平分别是40、50、70、80元,现采用不重复抽样方法随机从中抽取2人。序号样本变量(x)样本平均数平均数离差离差平方1(A、B)40、5045-152252(A、C)40、7055-5253(A、D)40、8060004(B

13、、A)50、4045-152255(B、C)50、7060006(B、D)50、80655257(C、A)70、4055-5258(C、B)70、5060009(C、D)70、80751522510(D、A)80、40600011(D、B)80、506552512(D、C)80、707515225合计7201000ix元)(604)80705040(X 22:7206012:1000129.13:240604:100015.81()4ixE xxXXXNXXN样本平均数的平均数样本可能数目(元)抽样平均误差样本可能数目(元)总体平均数(元)总体标准差元21xpnnppn重复抽样:()2111x

14、pnnNppnnN不重复抽样:()四、抽样平均误差的计算公式:变量总体属性总体当N 很大时,重复抽样与不重复抽样的差别不大!2215.8111.18()2115.81219.13()24nnnN重复抽样:元不重复抽样:元总体被研究标志的变异程度。在其他条件不变的情况下,总体标志的变异程度愈小,则抽样误差也愈小;总体标志的变异程度愈大,则抽样误差也愈大。抽样单位数的多少。在其他条件不变的情况下,抽样单位数愈多,抽样误差愈小;抽样单位数愈少,抽样误差愈大。抽样的方法。在其他条件不变的情况下,重复抽样的抽样误差大于不重复抽样。抽样的组织形式。抽样误差的大小与样本单位数的平方根成反比:如果抽样误差要减

15、少二分之一,则样本单位数必须增大到4倍。16060%10010.6(1 0.6)1004.90%(1)(1)0.6(1 0.6)100(1)100100004.87%ppnpnppnpPnnN根据已知条件:在重复抽样的情况下:()在不重复抽样的情况下:xpxxppxxppxXpPXxXPpPxXxpPp 将上式等价转换为下列不等式:因为,总体指标是未知,上述不等式应该转换为:例2、要估计某农作物幼苗的成活率,从播种这一品种的秧苗地中随机抽取秧苗1000株,其中死苗80株,则秧苗成活率p=1(801000)=92%。如果确定极限误差范围为5%,这就要求该农作物成活率p落在92%5%,即在87%至

16、97%之间。xxxxpppptttt 或或例2、已知幼苗成活率的抽样平均误差为3%,那么就以概率度t=5%3%=1.67来表示误差的可能范围,即以 来规定误差范围的大小,这时就要求该农作物的成活率p落在 之间。2x402x1.67p92%1.67p 所以在进行抽样估计时,不但要考虑抽样误差的可能范围有多大,而且还必须考虑落在这一范围的概率有多大。前者是估计的准确度问题,后者是估计的可靠性问题,两者密不可分。概率度(t)概率F(t)168.27%295.45%399.73%012312368.37%95.45%99.73%一、估计的方法有两种:点估计与区间估计点估计:也称定值估计,即以实际抽样资

17、料得到的抽样指标值作为总体指标的估计值。区间估计:根据估计可靠程度的要求,选定概率度,以及极限误差,再利用抽样调查取得的抽样平均数,定出估计的上、下限。区间称为置信区间,估计可靠程度称为置信度。(一)、总体平均数的估计 对一批电子元件进行耐用性能的检查,随机重置抽样方法选取100件作耐用测试,所得结果的分组资料如下:耐用时数(小时)组中值(x)件数(f)900以下 875 1900950 925 29501000 975 6100010501025 35105011001075 43110011501125 9115012001175 31200以上1225 1合计100概率保证程度为95%,

18、查概率表得t值为1.96。222875 1 925 21225 11055.5100(875 1055.5)1(1225 1055.5)110051.91()51.915.19()1001.96 5.1910.17xxfxfxxfsfsnt (小时)()小时小时(小时)2、区间估计:估计区间的下限:1055.510.17=1045.33小时估计区间的上限:1055.510.17=1065.67小时 所以,这批电子元件的平均耐用时数在1045.33小时至1065.67小时之间,可靠程度为95%。%995.105517.10119191%10010.91(1 0.91)2.86%10095.45%

19、22 2.86%5.72%pppnpnppntt 抽样合格品率:抽样平均误差:()概率保证程度为的概率度2、区间估计:估计的下限:91%5.72%=85.28%估计的上限:91%5.72%=96.72%所以,这批电子元件的合格品率在85.28%至96.72%之间,可靠程度为95.45%。%7.93%91%72.51一、抽样设计必须掌握两个基本原则:(一)、保证实现抽样的随机性原则(二)、保证实现最大的抽样效果原则,即在一定的调查费用条件下,选取抽样误差最小的方案;或在给定精确度的要求下,做到调查费用最少。简单随机抽样类型抽样等距抽样整群抽样多阶段抽样重置抽样不重置抽样2(1)xxnnnN)()

20、(:,抽样成数的单位数为在不重置抽样的条件下)(抽样成数的单位数为:在重置抽样的条件下,是:,抽样平均数的单位数在不重置抽样的条件下:抽样平均数的单位数是在重置抽样的条件下,pptNpNptnpptntNNtntnppxx1112222222222222(一)、抽样单位数受允许误差的制约,允许误差愈小,抽样单位数就愈多。所以在抽样方案设计中,对抽样误差的可能范围要十分慎重地进行思考。(二)、为了防止由于抽样单位数不足而扩大抽样误差,在实际工作中往往根据比单位数大的一个数目进行抽样,以满足共同的需要。(三)、在未知总体标准差或成数时,往往选择最大值或50%,只有这样才能抽取足够多的样本单位数,以

21、保证抽样后的极限误差在预先设定的允许误差范围之内。两个抽样指标所要求的单位数不同,应抽取其中比较多的单位数,即144个电池。在实际工作中,只要条件允许,一般应抽取150200个电池。以保证抽样调查后,计算的极限误差能够在预先设定的允许误差范围内,使抽样调查的任务顺利完成。14405.01.09.02110008.04.022222222222pxpptntn)(条件下,根据公式:在重置抽样 通过分类,可以把总体中比较接近的单位归为一组,使各组的分布比较均匀,而且保证各组都有中选的机会,这样计算的抽样平均指标变异程度也就比较小,所以在总体各单位标志值大小悬殊的情况下,运用类型抽样比简单随机抽样可

22、以得到更加准确的结果。在类型抽样中,组内:进行的是抽样调查,存在抽样误差。组间:进行的是全面调查,不存在抽样误差。由于在类型抽样中,组间是全面调查,总体标准差就只剩下平均组内方差。22i2nix2差:类型抽样的抽样平均误按地形分 组全部面积(亩)Ni抽样面积(亩)ni抽样平均亩产(斤)xi亩产标准差(斤)i平原4000504960200山区1000126750400合计5000630918253)斤之间。该地区粮食总产量在()斤之间。即:总平均亩产量在(斤。,其对应的值为)(斤)(斤)斤4688800449120076.93724.89876.1991876.19918)(76.1908.10

23、96.196.1%9508.106306400064000630126400504200)(91863012675050496022222XttFnnnfxfxxxiiiix 设全及总体有N个单位,现在需要抽取一个容量为n的样本,可以将总体单位N按一定标志(包括按有关标志或无关标志)排队,然后将N划分n个单位相等的部分,每个部分都包含k个单位,即Nn=k。并在第一部分顺序为1、2、3、ik个单位中随机抽取一个单位,而在第二部分中抽取第i+k单位,在第n个部分抽取第i+(n1)k单位,共n个单位组成一个样本,而且每个样本的间隔均为k,这种抽样方法称为等距抽样。等距抽样的随机性体现在抽取第一个样本

24、单位,当第一个单位确定后,其余的各个单位也就确定了。样本产量(斤)0.60.81.01.21.41.61单位数351042125斤之间。即()斤之间,整块地小麦总产量在()斤之间。斤,或在(即每亩平均产量为斤每亩地样本数亩产极限误差亩产极限误差每亩平均产量为斤)时:,即设概率保证程度为斤斤亩整块地小麦总产量(斤)平均垅宽样本长度每亩地样本数样本平均产量每亩平均产量斤)(斤)(斤))8.75522.6847247.314243.2857.3143.2857.143007.14049.0300300(049.0049.011%27.6872003002430021060006000(049.0)7200251(25061.01247.02552.1125252516.136.022 xxxttxNnnsffxxsfxfx在整群抽样中,群间群间:进行的是抽样调查,存在抽样误差;群内群内:进行的是全面调查,不存在抽样误差。R=720小时,r=7205%=36小时,为了保证所抽取的36小时能在720小时中均匀分配,故每隔20小时(72036=20)抽取1小时。则:)之间。一级品率的范围是的概率保证下在%96.92%04.77(%96.7%85%96.7%85:%96.70398.022,%45.95%98.37203613606.012ppppttRrr

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(统计学课件-第六章-抽样调查.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|