1、,算法初步、统计、统计案例,第 十 章,第54讲随机抽样,栏目导航,1简单随机抽样(1)定义:设一个总体含有N个个体,从中_抽取n个个体作为样本(nN),如果每次抽取时总体内的每个个体被抽到的机会都_,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法:_和_.,逐个不放回地,相等,抽签法,随机数法,2系统抽样(1)定义:在抽样时,将总体分成_的几个部分,然后按照_的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样)(2)适用范围:适用于_很多且_总体抽样3分层抽样(1)定义:在抽样时,将总体_的层,然后按照_,从各层独立地抽取一定数量的个
2、体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样(2)分层抽样的适用范围:当总体是由_几个部分组成时,往往选用分层抽样,均衡,事先确定,元素个数,均衡的,分成互不交叉,一定的比例,差异明显的,1思维辨析(在括号内打“”或“”)(1)从100件玩具中随机拿出一件,放回后再拿出一件,连续拿5次,是简单随机抽样()(2)系统抽样适用于元素个数很多且均衡的总体()(3)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平()(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关()(5)某校即将召开学生代表大会,现从高一、高二、高三共抽
3、取60名代表,则可用分层抽样方法抽取(),2在抽样过程中,每次抽取的个体不再放回总体的为不放回抽样,在分层抽样、系统抽样、简单随机抽样三种抽样中,不放回抽样的个数为()A0B1C2D3解析三种抽样都是不放回抽样,D,3假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是_ (下面摘取了随机数表第7行至第9行)87 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76
4、 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54解析由随机数表,可以看出前4个样本个体的编号是331,572,455,068,所以第4个样本个体的编号为068.,068,4某工厂平均每天生产某种机器零件大约10 000件,要求产品检验员每天抽取50件零件,检查其质量状况,采用系统抽样方法抽取,若抽取的第
5、一组中的号码为0010,则第三组抽取的号码为_.,0410,5某校高中生有900名,其中高一有400名,高二有300名,高三有200名,打算抽取容量为45的一个样本,则高三学生应抽取_名,10,简单随机抽样的注意点(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否容易搅匀一般地,当总体容量和样本容量都较小时可用抽签法(2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字要舍去,一简单随机抽样,【例1】 (1)以下抽样方法是简单随机抽样的是()A在某年明信片销售活
6、动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的为三等奖B某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D用抽签方法从10件产品中选取3件进行质量检验,D,(2)总体由编号为01,02,19,20的20个个体组成利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A08B07C02D01解析(1)A,B项不是简单随机抽样,因为抽取的个体间的间隔是固定的
7、;C项不是简单随机抽样,因为总体的个体有明显的层次;D项是简单随机抽样(2)由题意知前5个个体的编号为08,02,14,07,01.,D,二系统抽样,解决系统抽样问题的两个关键步骤(1)分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了,【例2】 (1)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A50B40C25D20(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间4
8、81,720的人数为()A11B12C13D14,C,B,三分层抽样,【例3】 (1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()A90B100C180D300,C,(2)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为357,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n()A54B90C45D126,B,1某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查已知高二被抽取的人数为13,则n()A6
9、60B720C780D800,B,2对于一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同的方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()Ap1p2p3Bp1p2p3Cp2p3p1Dp1p3p2解析无论是采用简单随机抽样、系统抽样,还是分层抽样,保持的原则是每个个体被抽到的可能性是均等的故选A,A,3做一次关于“手机垃圾短信”的调查,在A,B,C,D四个单位回收的问卷份数依次成等差数列,再从回收的问卷份数中按单位分层抽取容量为100的样本若在B单位抽取20份问卷,则在D单位抽取的问卷份数是()A30B35C40D65解析由条件可设从A
10、,B,C,D四个单位抽取的问卷份数依次为20d,20,20d,202d,则(20d)20(20d)(202d)100,d10.在D单位抽取的问卷份数为202d40.,C,4月底某商场想通过抽取发票的10%来估计该月的销售总额先将该月的全部销售发票存根进行编号:1,2,3,然后拟采用系统抽样的方法获取一个样本若从编号为1,2,10的前10张发票存根中随机抽取一张,然后再按系统抽样的方法依编号顺序逐次产生第二张、第三张、第四张、,则抽样中产生的第二张已编号的发票存根,其编号不可能是()A13B17C19D23解析根据系统抽样的特点可知,若第一组的编号为1,2,3,4,5,6,7,8,9,10,则第二组的编号为11,12,13,20,所以抽样中产生的第二张已编号的发票存根的编号不可能是23.,D,错因分析:当题目中出现需要被剔除的个体时,误认为被剔除的个体入选的概率与未被剔除的个体入选的概率不是相等的,易错点不清楚三种抽样方法对个体抽取的等可能性,答案 B,C,