1、第第 1 节节数据的收集数据的收集 知识梳理 1.总体、个体、样本与样本容量 考察问题涉及的对象全体是总体,总体中每个对象是个体,抽取的部分对象组成 总体的一个样本,一个样本中包含的个体数目是样本容量. 2.普查与抽样调查 (1)普查:一般地,对总体中每个个体都进行考察的方法称为普查(也称为全面调 查). (2)抽样调查:只抽取样本进行考察的方法称为抽样调查. 3.简单随机抽样 (1)定义: 一般地, 简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、 划类、排队等,完全随机地抽取个体. (2)两种常用方法:抽签法,随机数表法. (3)随机数表法 用随机数表进行简单随机抽样的一般步骤为
2、: 对总体进行编号. 在随机数表中任意指定一个开始选取的位置.位置的确定可以闭着眼用手指随 机确定,也可用其他方式随机确定. 按照一定规则选取编号.例如,若编号是两位,规则可以是每次从左往右选取 两个数字,也可以是每次只选取每一组的前两个数字,还可以是每次只选取下面 一行同一位置对应的两个数字,等等.规则一经确定,就不能更改.在选取过程中, 遇到超过编号范围或已经选取了的数字,应该舍弃. 按照得到的编号找出对应的个体. 4.分层抽样 一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠 的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样 的方法称为分层随机
3、抽样(简称为分层抽样). 1不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的 2分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比 诊断自测 1判断下列结论正误(在括号内打“”或“”) (1)简单随机抽样每个个体被抽到的机会不一样,与先后有关() (2)抽签法中,先抽的人抽中的可能性大() (3)简单随机抽样是一种不放回抽样() (4)分层抽样中,每个个体被抽到的可能性与层数及分层有关() 答案(1)(2)(3)(4) 2在“世界读书日”前夕,为了了解某地 5000 名居民某天的阅读时间,从中抽 取了 200 名居民的阅读时间进行统计分析在这个问题中,5000 名居民的阅读
4、 时间的全体是() A总体B个体 C样本的容量D从总体中抽取的一个样本 答案A 解析由题目条件知,5000 名居民的阅读时间的全体是总体;其中每 1 名居民 的阅读时间是个体;从 5000 名居民某天的阅读时间中抽取的 200 名居民的阅读 时间是从总体中抽取的一个样本,样本容量是 200. 3一个公司共有 N 名员工,下设一些部门,要采用等比例分层抽样的方法从全 体员工中抽取样本容量为 n 的样本,已知某部门有 m 名员工,那么从该部门抽 取的员工人数是_ 答案 nm N 解析每个个体被抽到的概率是n N,设这个部门抽取了 x 个员工,则 x m n N,x nm N . 4(2020上饶一
5、模)总体由编号为 00,01,02,48,49 的 50 个个体组成, 利用下面的随机数表选取 6 个个体, 选取方法是从随机数表第 6 行的第 9 列和第 10 列数字开始从左到右依次选取两个数字, 则选出的第 3 个个体的编号为() 附:第 6 行至第 9 行的随机数表如下: 26357900337091601620388277574950 32114919730649167677873399746732 27486198716441487086288885191620 74770111163024042979799196835125 A3B16C38D20 答案D 解析按随机数表法,从随
6、机数表第 6 行的第 9 列和第 10 列数字开始从左到右 依次选取两个数字,超出 0049 及重复的不选,则编号依次为 33,16,20,38, 49,32,则选出的第 3 个个体的编号为 20,故选 D. 5(2020百校大联考)在新冠肺炎疫情期间,大多数学生都进行网上上课我校 高一、高二、高三共有学生 1800 名,为了了解同学们对“钉钉”授课软件的意 见, 计划采用分层抽样的方法从这 1800 名学生中抽取一个容量为 72 的样本若 从高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,则我校高三年 级的人数为() A800B750C700D650 答案D 解析设从高三年级抽取的学
7、生人数为 2x 人,则从高二、高一年级抽取的人数 分别为 2x2,2x4. 由题意可得 2x(2x2)(2x4)72,x13. 设我校高三年级的学生人数为 N,且高三抽取 26 人, 由分层抽样,得 N 1800 26 72,N650(人) 6(2018全国卷改编)某公司有大量客户,且不同年龄段客户对其服务的评价 有较大差异为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方 法有简单随机抽样和分层抽样,则最合适的抽样方法是_ 答案分层抽样 解析因为不同年龄段的客户对公司的服务评价有较大差异, 所以需按年龄进行 分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价 考点一简单随机抽样
8、及其应用 1下面的抽样方法是简单随机抽样的是() A在某年明信片销售活动中,规定每 100 万张为一个开奖组,通过随机抽取的 方式确定号码的后四位为 2709 的为三等奖 B某车间包装一种产品,在自动包装的传送带上,每隔 30 分钟抽一包产品, 称其重量是否合格 C某学校分别从行政人员、教师、后勤人员中抽取 2 人、14 人、4 人了解对学 校机构改革的意见 D用抽签方法从 10 件产品中选取 3 件进行质量检验 答案D 解析A,B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;C 不是简 单随机抽样,因为总体中的个体有明显的层次;D 是简单随机抽样故选 D. 2 用简单随机抽样的方法从含
9、有 10 个个体的总体中, 抽取一个容量为 3 的样本, 其中某一个体 a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别 是() A. 1 10, 1 10 B. 3 10, 1 5 C.1 5, 3 10 D. 3 10, 3 10 答案A 解析在抽样过程中,个体 a 每一次被抽中的概率是相等的,因为总体容量为 10,故个体 a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为 1 10, 故选 A. 3(多选题)(2021聊城模拟)要考察某种品牌的 850 颗种子的发芽率,利用随机 数表法抽取 50 颗种子进行实验先将 850 颗种子按 001,002,850 进行编 号, 如
10、果从随机数表第 2 行第 2 列的数开始并向右读,下列选项中属于最先检验 的 4 颗种子中一个的是_(下面抽取了随机数表第 1 行至第 3 行)() 03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95 97 74 94 67 74 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73 16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
11、A774B946C428D572 答案ACD 解析依据题意可知:向右读数依次为:774,946,774,428,114,572,042, 533,所以最先检验的 4 颗种子符合条件的为:774,428,114,572,结合选 项知选 ACD. 感悟升华1.简单随机抽样需满足: (1)被抽取的样本总体的个体数有限; (2)逐个 抽取;(3)是不放回抽取;(4)是等可能抽取 2简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用 于个体数较多的情况) 考点二分层抽样及其应用 角度 1求某层入样的个体数 【例 1】某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的 一共
12、有 20000 人,其中各种态度对应的人数如下表所示: 最喜爱喜爱一般不喜欢 4800720064001600 电视台为了了解观众的具体想法和意见,打算从中抽取 100 人进行详细的调查, 为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为() A25,25,25,25B48,72,64,16 C20,40,30,10D24,36,32,8 答案D 解析法一因为抽样比为 100 20000 1 200,所以每类人中应抽取的人数分别为 4800 1 20024,7200 1 20036,6400 1 20032,1600 1 2008. 法二最喜爱、喜爱、一般、不喜欢的比例为 48
13、00720064001600 6982,所以每类人中应抽取的人数分别为 6 6982 10024, 9 698210036, 8 698210032, 2 69821008. 角度 2求总体或样本容量 【例 2】 (1)(2020东北三省四校联考)某中学有高中生 960 人,初中生 480 人, 为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为 n 的样本,其中高中生有 24 人,那么 n 等于() A12B18C24D36 (2)(2021重庆调研)甲、乙两套设备生产的同类型产品共 4800 件,采用分层抽样 的方法从中抽取一个容量为 80 的样本进行质量检测 若样本中有
14、50 件产品由甲 设备生产,则乙设备生产的产品总数为_件 答案(1)D(2)1800 解析(1)根据分层抽样方法知 n 960480 24 960,解得 n36. (2)由题设,抽样比为 80 4800 1 60. 设甲设备生产的产品为 x 件,则 x 6050,x3000. 故乙设备生产的产品总数为 480030001800. 感悟升华1.求某层应抽个体数量:按该层所占总体的比例计算 2已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样, 列比例式进行计算 3分层抽样的计算应根据抽样比构造方程求解,其中“抽样比样本容量 总体容量 各层样本数量 各层个体数量” 【训练】 (1)
15、(2020郴州二模)已知我市某居民小区户主人数和户主对户型结构的 满意率分别如图 1 和图 2 所示,为了解该小区户主对户型结构的满意程度,用分 层抽样的方法抽取 30%的户主进行调查, 则样本容量和抽取的户主对四居室满意 的人数分别为() A240,18B200,20 C240,20D200,18 (2)(2021合肥模拟)某商场有四类食品,其中粮食类、植物油类、动物性食品类 及果蔬类分别有 40 种,10 种,30 种,20 种,现从中抽取一个容量为 20 的样本 进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬 类食品种数之和是_ 答案(1)A(2)6 解析(1)样
16、本容量 n(250150400)30%240,抽取的户主对四居室满意 的人数为 15030%40%18. (2)抽样比为 20 40103020 1 5,则抽取的植物油类种数是 10 1 52,抽取的果 蔬类食品种数是 201 54,所以抽取的植物油类与果蔬类食品种数之和是 24 6. A 级基础巩固 一、选择题 1(多选题)(2021武汉调研)下列抽样方法不是简单随机抽样的是() A从平面直角坐标系中抽取 5 个点作为样本 B某可乐公司从仓库中的 1000 箱可乐中一次性抽取 20 箱进行质量检查 C某连队从 120 名战士中,挑选出 50 名最优秀的战士去参加抢险救灾活动 D 从 10 个
17、手机中逐个不放回地随机抽取 2 个进行质量检验(假设 10 个手机已编 号) 答案AC 解析对于 A,平面直角坐标系中有无数个点,这与要求总体中的个体数有限不 相符,故 A 中的抽样方法不是简单随机抽样;对于 B,一次性抽取与逐个不放 回地抽取是等价的,故 B 中的抽样方法是简单随机抽样;对于 C,挑选的 50 名 战士是最优秀的,不符合简单随机抽样的等可能性,故 C 中的抽样方法不是简 单随机抽样;对于 D,易知 D 中的抽样方法是简单随机抽样 2(多选题)(2020泰安质检)某公司生产三种型号的轿车,产量分别为 1500 辆, 6000 辆和 2000 辆为检验该公司的产品质量,公司质监部
18、门要抽取 57 辆进行 检验,则下列说法正确的是() A应采用分层随机抽样抽取 B应采用抽签法抽取 C三种型号的轿车依次应抽取 9 辆,36 辆,12 辆 D这三种型号的轿车,每一辆被抽到的概率都是相等的 答案ACD 解析因为是三种型号的轿车,个体差异明显,所以采用分层抽样,选项 A 正 确; 因为总体量较大,故不宜采用抽签法,选项 B 错误;抽样比为 57 150060002000 3 500,三种型号的轿车依次应抽取 9 辆,36 辆,12 辆,选项 C 正确分层抽样中,每一个个体被抽到的可能性相同故选项 D 正确故答 案为 ACD. 3 (2020首都师范大学附属中学月考)从某班50名同
19、学中选出5人参加户外活动, 利用随机数表法抽取样本时,先将 50 名同学按 01,02,50 进行编号,然后 从随机数表的第 1 行第 5 列和第 6 列数字开始从左往右依次选取两个数字, 则选 出的第 5 个个体的编号为() (注:表为随机数表的第 1 行与第 2 行) 03474373863696473661469863716297 74246792428114572042533237321676 A.24B36C46D47 答案A 解析由题知,从随机数表的第 1 行第 5 列和第 6 列数字开始,由表可知依次选 取 43,36,47,46,24. 4(多选题)(2021襄阳联考)某中学高
20、一年级有 20 个班,每班 50 人;高二年级 有 30 个班,每班 45 人甲就读于高一,乙就读于高二学校计划从这两个年级 中共抽取 235 人进行视力调查,下列说法中正确的有() A应该采用分层随机抽样法 B高一、高二年级应分别抽取 100 人和 135 人 C乙被抽到的可能性比甲大 D该问题中的总体是高一、高二年级的全体学生的视力 答案ABD 解析由于各年级的年龄段不一样,因此应采用分层抽样法由于比例为 235 20503045 1 10,因此高一年级 1000 人中应抽取 100 人,高二年级 1350 人中应抽取 135 人,甲、乙被抽到的可能性都是 1 10,因此只有 C 不正确,
21、故应 选 ABD. 5.如图是调查某学校高三年级男女学生是否喜欢数学的等高条形图,阴影部分的 高表示喜欢数学的频率 已知该年级男、 女生各 500 名(所有学生都参加了调查), 现从所有喜欢数学的学生中按分层抽样的方式抽取 32 人,则抽取的男生人数为 () A16B32C24D8 答案C 解析由题中等高条形图可知喜欢数学的女生和男生的人数比为 13, ,所以抽 取的男生人数为 24.故选 C. 6某中学 400 名教师的年龄分布情况如图,现要从中抽取 40 名教师作样本,若 用分层抽样方法,则 40 岁以下年龄段应抽取() A40 人B200 人C20 人 D10 人 答案C 解析由题图知,
22、40 岁以下年龄段的人数为 40050%200,若采用分层抽样 应抽取 200 40 40020(人) 7(多选题)(2021淄博模拟)港珠澳大桥是中国境内一座连接中国香港、广东珠 海和中国澳门的桥隧工程,因其超大的建筑规模、空前的施工难度以及顶尖的建 造技术闻名世界,为内地前往香港的游客提供了便捷的交通途径,某旅行社分年 龄统计了大桥落地以后, 由香港大桥实现内地前往香港的老中青旅客的比例分别 为 523,现使用分层抽样的方法从这些旅客中随机抽取 n 名,若青年旅客抽 到 60 人,则() A老年旅客抽到 100 人 B中年旅客抽到 20 人 Cn200 D被抽到的老年旅客以及中年旅客人数之
23、和超过 200 人 答案AC 解析由题意,香港大桥实现内地前往香港的老中青旅客的比例分别为 523, 若青年旅客抽到 60 人,现使用分层抽样的方法从这些旅客中随机抽取 n 名,所 以60 n 3 523,解得 n200 人,则老年旅客抽到 60 5 3100 人,中年旅客抽 到 602 340 人,则老年旅客和中年旅客人数之和为 160. 8(2020北京东城区模拟)某机构对青年观众是否喜欢跨年晚会进行了调查,人 数如表所示: 不喜欢喜欢 男性青年观众3010 女性青年观众3050 现要在所有参与调查的人中用分层抽样的方法抽取 n 人做进一步的调研,若在 “不喜欢”的男性青年观众中抽取了 6
24、 人,则 n() A12B16C24D32 答案C 解析由分层抽样的性质得: 6 30 n 30301050,解得 n24.故选 C. 二、填空题 9假设要考察某公司生产的 500 克袋装牛奶的三聚氰胺是否超标,现从 800 袋 牛奶中抽取 60 袋进行检验,利用随机数表抽取样本时,将 800 袋牛奶按 000, 001,799 进行编号,若从随机数表第 7 行第 8 列的数开始向右读,则得到 的第 4 个样本个体的编号是_(下面摘取了随机数表第 7 行至第 9 行) 87 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83
25、92 12 06 76 63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 答案068 解析由随机数表知,前 4 个样本的个体编号分别是 331,572,455,068. 10某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为 120 件,80 件, 60 件为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个 容量为 n 的样本进行调查
26、, 其中从丙车间的产品中抽取了 3 件, 则 n_ 答案13 解析依题意得 3 60 n 1208060,故 n13. 11(2020海南质检)九章算术第三章“衰分”中有如下问题:“今有甲持钱 五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以 钱数多少衰出之,问各几何?”其意为:“今有甲带了 560 钱,乙带了 350 钱, 丙带了180钱, 三人一起出关, 共需要交关税100钱, 依照钱的多少按比例出钱”, 则乙应出(所得结果四舍五入,保留整数)钱数为_ 答案32 解析因为甲持 560 钱,乙持 350 钱,丙持 180 钱,甲、乙、丙三人一起出关, 关税共 100 钱
27、要按照各人带钱多少的比例进行关税 则乙应付: 100 56035018035032 12 10932 钱 12某企业三月中旬生产 A,B,C 三种产品共 3000 件,根据分层抽样的结果, 企业统计员制作了如下的统计表格由于不小心,表格中 A,C 产品的有关数据 已被污染看不清楚, 统计员记得 A 产品的样本容量比 C 产品的样本容量多 10 件, 根据以上信息,可得 C 产品的数量是_ 产品类别ABC 产品数量(件)1300 样本容量(件)130 答案800 解析设 A,C 产品数量分别为 x 件、y 件, 则由题意可得 xy13003000, (xy) 130 130010, 解得 x90
28、0, y800. B 级能力提升 13我国古代数学算经十书之一的九章算术有一衰分问题:今有北乡八千一 百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人, 则北乡遣() A104 人 B108 人 C112 人 D120 人 答案B 解析由题意知,抽样比为 300 810074886912 1 75, 所以北乡遣 1 758100108(人) 14下列抽取样本的方式属于简单随机抽样的个数为() 从无限多个个体中抽取 100 个个体作为样本 盒子里共有 80 个零件,从中选出 5 个零件进行质量检验在抽样操作时,从 中任意拿出一个零件进行质量检验后再把它放回盒子里 从 20 件
29、玩具中一次性抽取 3 件进行质量检验 某班有 56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛 A0B1C2D3 答案A 解析不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有 限的;不是简单随机抽样因为它是有放回抽样;不是简单随机抽样因为 这是“一次性”抽取,而不是“逐个”抽取;不是简单随机抽样因为不是等 可能抽样故选 A. 15甲、乙两所学校高三年级分别有 1200 人,1000 人,为了了解两所学校全体 高三年级学生在该地区六校联考的数学成绩情况, 采用分层抽样方法从两所学校 一共抽取了 110 名学生的数学成绩,并作出了频数分布统计表如下: 甲校: 分组70,8
30、0)80,90)90,100)100,110) 频数34815 分组110,120)120,130)130,140)140,150 频数15x32 乙校: 分组70,80)80,90)90,100)100,110) 频数1289 分组110,120)120,130)130,140)140,150 频数1010y3 则 x,y 的值分别为() A12,7B10,7C10,8D11,9 答案B 解析从甲校抽取 110 1200 1200100060(人),从乙校抽取 110 1200 12001000 50(人),故 x10,y7. 16 某工厂的三个车间在 12 月份共生产了 3600 双皮靴,在出厂前要检查这批产 品的质量,决定采用分层抽样的方法进行抽取,若从第一、二、三车间抽取的产 品数分别为 a, b, c, 且 a, b, c 构成等差数列, 则第二车间生产的产品数为_ 答案1200 解析因为 a,b,c 成等差数列,所以 2bac. 所以abc 3 b.所以第二车间抽取的产品数占抽样产品总数的1 3.根据分层抽样 的性质,可知第二车间生产的产品数占总数的1 3,即为 1 336001200.