1、=【 ;精品教育资源文库 】 = 第 54 讲 随机抽样 考纲要求 考情分析 命题趋势 1.理解随机抽样的必要性和重要性 2会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法 2017 江苏卷, 3 2016 江苏卷, 3 2015 湖北卷, 2 考查系统抽样、分层抽样的应用,利用随机抽样的方法解决抽取样本的相关问题,利用频率分布直方图计算 (频率、频数等 )样本数据的数字特征 (平均数、方差、标准差等 ) 分值: 5 分 1简单随机抽样 (1)定义:设一个总体含有 N 个个体,从中 _逐个不放回地 _抽取 n 个个体 作为样本(n N),如果每次抽取时总体内的每个个体被抽到的机
2、会都 _相等 _,就把这种抽样方法叫做简单随机抽样 (2)最常用的简单随机抽样的方法: _抽签法 _和 _随机数法 _. 2系统抽样 (1)定义:在抽样时,将总体分成 _均衡 _的几个部分,然后按照 _事先确定 _的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样 (也称为机械抽样 ) (2)适用范围:适用于 _元素个数 _很多且 _均衡的 _总体抽样 3分层抽样 (1)定义:在抽样时,将总体 _分成互不交叉 _的层, 然后按照 _一定的比例 _,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样 (2)分层抽样的适用范围:当总体
3、是由 _差异明显的 _几个部分组成时,往往选用分层抽样 1思维辨析 (在括号内打 “” 或 “ ”) (1)从 100 件玩具中随机拿出一件,放回后再拿出一件,连续拿 5 次,是简单随机抽样 ( ) (2)系统抽样适用于元素个数很多且均衡的总体 ( ) =【 ;精品教育资源文库 】 = (3)要从 1 002 个学生中用系统抽样的方法选取一个容量为 20 的样本,需要剔除 2 个学生,这样对被剔除 者不公平 ( ) (4)分层抽样中,每个个体被抽到的可能性与层数及分层有关 ( ) (5)某校即将召开学生代表大会,现从高一、高二、高三共抽取 60 名代表,则可用分层抽样方法抽取 ( ) 2在抽样
4、过程中,每次抽取的个体不再放回总体的为不放回抽样,在分层抽样、系统抽样、简单随机抽样三种抽样中,不放回抽样的个数为 ( D ) A 0 B 1 C 2 D 3 解析 三种抽样都是不放回抽样 3假设要考察某公司生产的 500 克袋装牛奶的三聚氰胺是否超标,现从 800 袋牛奶中抽取 60 袋进行检 验,利用随机数表抽取样本时,先将 800 袋牛奶按 000,001, ? , 799 进行编号,如果从随机数表第 7 行第 8 列的数开始向右读,则得到的第 4 个样本个体的编号是_068_(下面摘取了随机数表第 7 行至第 9 行 ) 87 42 17 53 31 57 24 55 06 88 77
5、 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 解析 由随机数表,可以看出前 4 个样本个体的编号是 331,572,455,068,所以第 4 个样本个体的编号为 068. 4某工厂平均每天生产某种机器零件大约 10 000 件,要求产品检验员每天抽取 50
6、件零件,检查其质量状况,采用系统抽样方法抽取,若抽取的第一组中的号码为 0010,则第三组抽取的号码为 _0410_. 解析 根据系统抽样方法的特点,从 10 000件零件 中抽取 50件零件,组距 10 00050 200,当第一组中抽到的号码是 0010 时,第三组中抽到的号码是 0010 (3 1)200 0410. 5某校高中生有 900 名,其中高一有 400 名,高二有 300 名,高三有 200 名,打算抽取容量为 45 的一个样本,则高三学生应抽取 _10_名 解析 抽取比例为 45900 120,所以 200 120 10(名 ),故高三学生应抽取 10 名 一 简单随机抽样
7、 简单随机抽样的注意点 =【 ;精品教育资源文库 】 = (1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否容易搅匀一般地,当总体容量和样本容量都较小时可用抽签法 (2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字要舍去 【例 1】 (1)以下抽样方法是简单随机抽样的是 ( D ) A在某年明信片销售活动中,规定每 100 万张为一个开奖组,通过随机抽取的方式确定号码的后四位为 2 709 的为三等奖 B某车间包装一种产品,在自 动包装的传送带上,每隔 30
8、 分钟抽一包产品,称其重量是否合格 C某学校分别从行政人员、教师、后勤人员中抽取 2 人、 14 人、 4 人了解对学校机构改革的意见 D用抽签方法从 10 件产品中选取 3 件进行质量检验 (2)总体由编号为 01,02, ? , 19,20 的 20 个个体组成利用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1行的第 5列和第 6列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为 ( D ) 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 A 08
9、B 07 C 02 D 01 解析 (1)A, B 项不是简单随机抽样,因为抽取的个体间的间隔是固定的; C 项不是简单随机抽样,因为总体的个体有明显的层次; D 项是简单随机抽样 (2)由题意知前 5 个个体的编号为 08,02,14,07,01. 二 系统抽样 解决系统抽样问题的两个关键步骤 (1)分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本 (2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其 他编号便随之确定了 【例 2】 (1)为了解 1 000 名学生的学习情况,采用系统抽样的方法,从中抽取容量为40 的样本,则分段的间隔为 ( C ) =【 ;精品教育资源
10、文库 】 = A 50 B 40 C 25 D 20 (2)某单位有 840 名职工,现采用系统抽样方法抽取 42 人做问卷调查,将 840 人按1,2, ? , 840 随机编号,则抽取的 42 人中,编号落入区间 481,720的人数为 ( B ) A 11 B 12 C 13 D 14 解析 (1)由 1 00040 25,可得分段间隔为 25. (2)由系统抽样定义可知,所分组距为 84042 20,每组抽取一个,因为包含整数个组,所以抽取个体在区间 481,720的数目为 (720 480)20 12. 三 分层抽样 进行分层抽样时应注意的几点 (1)分层抽样中分多少层,如何分层要视
11、具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠 (2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样 (4)抽样比 样本容量总体容量 各层样本数量各层个体数量 . 【例 3】 (1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有 320 人,则该样本中的老年教师人数为 ( C ) 类别 人数 老年教师 900 中年教师 1 800 青年教师 1 600 合计 4 300 A 90 B 100 C 180 D 300 =【 ;精
12、品教育资源文库 】 = (2)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为 357 ,现用分层抽样的方法抽出 容量为 n 的样本,其中甲种产品有 18 件,则样本容量 n ( B ) A 54 B 90 C 45 D 126 解析 (1)设该样本中的老年教师人数为 x,由题意及分层抽样的特点可得 x900 3201 600,故 x 180. (2)依题意得 33 5 7 n 18,解得 n 90,即样本容量为 90. 1某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一 600 人、高二 780 人、高三 n 人中,抽取 35 人进行问卷调查已知高二被 抽取的人数为 13,
13、则 n( B ) A 660 B 720 C 780 D 800 解析 由已知条件可知抽样比为 13780 160,从而 35600 780 n 160,解得 n 720.故选 B. 2对于一个容量为 N 的总体抽取容量为 n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同的方法抽取样本时,总体中每个个体被抽中的概率分别为 p1, p2, p3,则( A ) A p1 p2 p3 B p1 p2 p3 C p2 p3 p1 D p1 p3 p2 解析 无论是采用简单随机抽样、系统抽样,还是分层抽样,保持的原则是每个个体被抽到的可能性是均等的故选 A 3做一次关于 “ 手机垃圾短信 ”
14、的调查,在 A, B, C, D 四个单位回收的问卷份数依次成等差数列,再从回收的问卷份数中按单位分层抽取容量为 100 的样本若在 B 单位抽取20 份问卷,则在 D 单位抽取的问卷份数是 ( C ) A 30 B 35 C 40 D 65 解析 由条件可设从 A, B, C, D 四个单位抽取的问卷份数依次为 20 d,20,20 d,20 2d,则 (20 d) 20 (20 d) (20 2d) 100, d 10. 在 D 单位抽取的问卷份数为20 2d 40. 4月底某商场想通过抽取发票的 10%来估计该月的销售总额先将该月的全部销售发票存根进行编号: 1,2,3, ? ,然后拟采
15、用系统抽样的方法获取一个样本若从编号为 1,2, ? ,10 的前 10 张发票存根中随机抽取一张,然后再按系统抽样的方法依编号顺序逐次产生第二=【 ;精品教育资源文库 】 = 张、第三张、第四张、 ? ,则抽样中产生的第二张已编号的发票存根,其编号不可能是( D ) A 13 B 17 C 19 D 23 解析 根据系统抽样的特点可知,若第一组的编号为 1,2,3,4,5,6,7,8,9,10,则第二组的编号为 11,12,13, ? , 20,所以抽样中产生的第二张已编号的发票存根的编号不可能是 23. 易错点 不清楚三种抽样方法对个体抽取的等可能性 错因分析:当题目中出现需要被剔除的个体时,误认为被剔除的个体入选的概率与未被剔除的个体入选的概率不是相等的