1、第十一章第十一章 算法初步与统计算法初步与统计 第第2课时课时 随随 机机 抽抽 样样 1理解随机抽样的必要性和重要性 2会用简单随机抽样方法从总体中抽取样 本 3了解分层抽样和系统抽样方法 请注意 1本节主要考查学生在应用问题中构造抽 样模型、识别模型、收集数据等能力方法, 是统计学中最基础的知识 2本部分在高考试题中主要以选择题或填 空题的形式出现,题目多为中低档题,重在 考查抽样方法的应用 课前自助餐课前自助餐 授授人以渔人以渔 自助餐自助餐 题组层级快练题组层级快练 课前自助餐课前自助餐 1简单随机抽样 (1)定义:设一个总体含有N个个体,从中 抽取n个个体作为样本(nN),如果每 次
2、抽取时总体内的各个个体被抽到的机会 ,就把这种抽样方法叫做简单随机抽 样 (2)最常用的简单随机抽样的方法: 和_. 逐个 相等 抽签法 随机数表法 1.图片对齐 在我们插入PPT图片或是输入文字的时候,为了整齐都需要将插入的文本框对齐 ,但是又不想一个一个的进行操作,这时按住Ctrl键将需要进行对齐的文本选中 ,点击开始排列对齐垂直居中即可; 2.巧用格式刷 在制作PPT的时候为了保证PPT风格的统一,很多任通常会使用复制粘贴来确保 每一页PPT格式相同,这样对于少页数来说可以进行操作,但是碎玉多页面的话 就有点麻烦了,其实我们可以巧用格式刷:首先,在开始菜单栏下方有一个格式 刷,点击格式刷
3、,很快就能看到效果; 3.去除所有动画效果 很多人在制作PPT的时候都是直接在模板库里下载模板进行使用的,但是下载的 模板大多数都是有幻灯片的,这样在演讲的时候很不方便,怎样将其进行去除呢 ?单击幻灯片放映选择设置幻灯片放映,放映类型选择演讲者放映;换片方式 选择手动即可; 4.PPT快键 PPT逼格提升技巧逼格提升技巧 2系统抽样的步骤 假设要从容量为N的总体中抽取容量为n的 样本 (1)先将总体的N个个体 (2)确定 ,对编号进行 ,当 是整数 时,取k . (3)在第1段中用 确定第一个个 体编号l(lk) (4)按照一定的规则抽取样本,通常是将l加 上间隔k得到第2个个体编号 ,再加k
4、得到 第3个个体编号 ,依次进行下去, 直到获取整个样本 编号 分段间隔k 分段 N n N n 简单随机抽样 lk l2k 3分层抽样 (1)定义:在抽样时,将总体 的层, 然后按照 ,从各层独立地抽取一 定数量的个体,将各层取出的个体合在一起 作为样本,这种抽样方法是一种分层抽样 (2)分层抽样的应用范围: 当总体是由 组成时,往往选用 分层抽样 4三种抽样方法的共同点 每个个体被抽到的概率相同 分成互不交叉 所占比例 差异明显的几部分 1判断下面结论是否正确(打“”或 “”) (1)简单随机抽样是从总体中逐个不放回的抽 取抽样 (2)简单随机抽样每个个体被抽到的机会不一 样,与先后有关
5、(3)系统抽样在起始部分抽样时采用简单随机 抽样 (4)分层抽样是将每层各抽取相同的个体数构 成样本,分层抽样为保证各个个体等可能入 样,必须进行每层等可能抽样 (5)要从1 002个学生中用系统抽样的方法选 取一个容量为20的样本,需要剔除2个学生, 这样对被剔除者不公平 答案 (1) (2) (3) (4) (5) 2(课本习题改编)2015年2月,为确保食品 安全,北京市质检部门检查一箱装有1 000 袋方便面的质量,抽查总量的2%.在这个问 题中下列说法正确的是( ) A总体是指这箱1 000袋方便面 B个体是一袋方便面 C样本是按2%抽取的20袋方便面 D样本容量为20 答案 D 3
6、(2013新课标全国理)为了解某地区的 中小学生的视力情况,拟从该地区的中小学 生中抽取部分学生进行调查,事先已了解到 该地区小学、初中、高中三个学段学生的视 力情况有较大差异,而男女生视力情况差异 不大在下面的抽样方法中,最合理的抽样 方法是( ) A简单随机抽样 B按性别分 层抽样 C按学段分层抽样 D系统抽样 答案 C 解析 因为学段层次差异较大,所以在不同 学段中抽取宜用分层抽样 4(2014广东文)为了解1 000名学生的学 习情况,采用系统抽样的方法,从中抽取容 量为40的样本,则分段的间隔为( ) A50 B40 C25 D20 答案 C 解析 根据系统抽样的特点求解 根据系统抽
7、样的特点可知分段间隔为 1 000 40 25,故选 C. 5(2014重庆文)某中学有高中生3 500人, 初中生1 500人,为了解学生的学习情况, 用分层抽样的方法从该校学生中抽取一个容 量为n的样本,已知从高中生中抽取70人, 则n为( ) A100 B150 C200 D250 答案 A 解析 思路一:根据分层抽样时样本中每一层的比与 总体中每一层的比相等求解;思路二:先计算抽样比和总 体容量,再求解 方法一:由题意可得 70 n70 3 500 1 500,解得n100,故选 A. 方法二:由题意,抽样比为 70 3 500 1 50 ,总体容量为3 5001 5005 000,故
8、n5 000 1 50100. 授授人人以以渔渔 例1 有一批机器,编号为1,2,3,112, 为调查机器的质量问题,打算抽取10台入样, 问此样本若采用简单随机抽样方法将如何获 得? 【思路】 简单随机抽样方法有抽签法和随 机数表法,因为样本的容量为10,因此,两 种方法均可以 题型一题型一 简单随机抽样简单随机抽样 【解析】 方法一:首先,把机器都编上号 码001,002,003,112,如用抽签法,则 把112个形状,大小相同的号签放在同一个 箱子里,进行均匀搅拌,抽签时,每次从中 抽出1个号签,连续抽取10次,就得到一个 容量为10的样本 方法二:第一步,将原来的编号调整为 001,0
9、02,003,112. 第二步,在随机数表中任选一数作为开始, 任选一方向作为读数方向比如:选第9行 第7个数“3”,向右读 第三步,从“3”开始,向右读,每次读取三 位,凡不在001112中的数跳过去不读, 前面已经读过的也跳过不读,依次可得到 074,100,094,052,080,003,105,107,083,092. 第四步,对应原来编号 74,100,94,52,80,3,105,107,83,92的机器便 是要抽取的对象 【答案】 略 探究1 (1)一个抽样试验能否用抽签法,关 键看两点:一是制签是否方便;二是号签是 否易搅匀,一般地,当总体容量和样本容量 都较小时可用抽签法 (
10、2)随机数表中共随机出现0,1,2,9十个 数字,也就是说,在表中的每个位置上出现 各个数字的机会都是相等的在使用随机数 表时,如遇到三位数或四位数时,可从选择 的随机数表中的某行某列的数字计起,每三 个或每四个作为一个单位,自左向右选取, 有超过总体号码或出现重复号码的数字舍 去 思考题思考题1 (1)利用简单随机抽样,从n个个体中 抽取一个容量为10的样本若第二次抽取时,余下的每个 个体被抽到的概率为 1 3 ,则在整个抽样过程中,每个个体被 抽到的概率为( ) A.1 4 B. 1 3 C. 5 14 D.10 27 【答案】 C 【解析】 根据题意, 9 n1 1 3 ,解得n28.故
11、每个个 体被抽到的概率为10 28 5 14. (2)(2013江西)总体由编号为01,02, 19,20的20个个体组成利用下面的随机数 表选取5个个体,选取方法是从随机数表第1 行的第5列和第6列数字开始由左到右依次选 取两个数字,则选出来的第5个个体的编号 为( ) 78 16 65 72 08 02 63 14 07 01 43 69 97 28 01 98 32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81 A.08 B07 C02 D01 【解析】 选出的5个个体的编号依次是 08,02,14,07,01,故选D. 【答案】 D 例2 采
12、用系统抽样方法从960人中抽取32 人做问卷调查,首先将他们随机编号为 1,2,960,分组后在第一组采用简单随 机抽样的方法抽到的号码为9,抽到的32人 中,编号落入区间1,450的人做问卷A,编 号落入区间451,750的人做问卷B,其余的 人做问卷C,则抽到的人中,做问卷B的人 数为( ) A7 B9 C10 D15 题型二题型二 系统抽样系统抽样 【答案】 C 【解析】 从960人中用系统抽样方法抽取32人,则每 30人抽取一人,因为第一组抽到的号码为9,则第二组抽到 的号码为39,第n组抽到的号码为an930(n1)30n 21,由45130n21750,得 236 15 n 257
13、 10 ,所以n 16,17,25,共有2516110人,选C. 探究2 (1)适用于元素个数很多且均衡的总 体,样本容量也较大 (2)各个个体被抽到的机会均等 (3)总体分组后,在起始部分抽样时采用的简 单随机抽样,一旦起始编号确定,其他编号 也就确定了 (4)若总体容量不能被样本容量整除可以先从 总体中随机地剔除几个个体 (5)样本容量是几就分几段,每段抽取一个个 体 (1)(2015唐山一模)某班级有 50名学生,现要采取系统抽样的方法在这50 名学生中抽出10名学生,将这50名学生随机 编号150号,并分组,第一组15号,第 二组610号,第十组4650号,若在 第三组中抽得号码为12
14、的学生,则在第八组 中抽得号码为_的学生 【解析】 组距为5,(83)51237. 【答案】 37 思考题思考题2 (2)一个总体中有100个个体,随机编号为 0,1,2,99,依编号顺序平均分成10个 小组,组号依次为1,2,10.现用系统抽 样方法抽取一个容量为10的样本,规定如果 在第1组随机抽取的号码为m,那么在第k组 中抽取的号码个位数字与mk的个位数字 相同若m6,则在第7组中抽的号码是 _ 【解析】 由题设知,若m6,则在第7组 中抽取的号码个位数字与13的个位数字相同, 而第7组中数字编号顺次为60,61,62,63, 69,故在第7组中抽取的号码是63. 【答案】 63 例3
15、 (1)一支田径运动队有男运动员56人, 女运动员42人现用分层抽样的方法抽取若 干人,若抽取的男运动员有8人,则抽取的 女运动员有_ 【答案】 6 题型三题型三 分层抽样分层抽样 【解析】 分层抽样的特点是按照各层占总体的比抽 取样本设抽取的女运动员有x人,则x 8 42 56,解得x6. (2)(2013湖南)某工厂甲、乙、丙三个车间 生产了同一种产品,数量分别为120件,80 件,60件为了解它们的产品质量是否存在 显著差异,用分层抽样方法抽取了一个容量 为n的样本进行调查,其中从丙车间的产品 中抽取了3件,则n( ) A9 B10 C12 D13 【答案】 D 【解析】 由分层抽样可得
16、, 3 60 n 260,解得n13. 探究3 (1)分层抽样的操作步骤: 将总体按一定标准进行分层; 计算各层的个体数与总体数的比,按各层个体数占 总体数的比确定各层应抽取的样本容量; 在每一层进行抽样(可用简单随机抽样或系统抽样) (2)分层抽样的特点: 适用于总体由差异明显的几部分组成的情况; 更充分地反映了总体的情况; 等可能抽样,每个个体被抽到的可能性都是 n N. (1)(2014天津理)某大学为了 解在校本科生对参加某项社会实践活动的意 向,拟采用分层抽样的方法,从该校四个年 级的本科生中抽取一个容量为300的样本进 行调查已知该校一年级、二年级、三年级、 四年级的本科生人数之比
17、为4556,则 应从一年级本科生中抽取_名学 生 【答案】 60 思考题思考题3 【解析】 设应从一年级本科生中抽取x名学生,则 x 300 4 4556,解得x60. (2)某工厂有甲、乙、丙、丁四类产品共3 000件,且它们的数量成等比数列,现用分 层抽样的方法从中抽取150件进行质量检测, 其中从乙、丁两类产品中抽取的总数为100 件,则甲类产品有( ) A100件 B200件 C300件 D400件 【解析】 设从甲、乙、丙、丁四类产品中分别抽取 a1、a2,a3,a4件进行检测,由于四类产品的数量成等比数 列且是分层抽样,所以a1,a2,a3,a4也成等比数列,设此 等比数列的公比为
18、q,由 a1a350, a2a4100, 即 a11q250, a1q1q2100, 解得 a110, q2. 即从甲类产品中抽取10 件,则甲类产品的数量为 10 150 3 000 200(件),故选B. 【答案】 B 例4 (2015河北冀州中学期末)某学校共有 教职工900人,分成三个批次进行继续教育 培训,在三个批次中男、女教职工人数如下 表所示已知在全体教职工中随机抽取1名, 抽到第二批次中女教职工的概率是0.16. 题型四题型四 抽样方法在概率解答题中的应用抽样方法在概率解答题中的应用 第一批次 第二批次 第三批次 女教职工 196 x y 男教职工 204 156 z (1)求
19、x的值; (2)现用分层抽样的方法在全体教职工中抽取 54名做培训效果的调查,问应在第三批次中 抽取教职工多少名? (3)已知y96,z96,求第三批次中女教职 工比男教职工多的概率 【解析】 (1)由 x 9000.16,解得x144. (2)第三批次的人数为yz900(196204144156) 200, 设应在第三批次中抽取m名,则 m 200 54 900,解得m12. 应在第三批次中抽取12名教职工 (3)设第三批次中女教职工比男教职工多为事件A,第三 批次女教职工和男教职工数记为数对(y,z),由(2)知yz 200(y,zN,y96,z96),则基本事件总数有: (96,104)
20、,(97,103),(98,102),(99,101),(100,100), (101,99),(102,98),(103,97),(104,96),共9个,而事件A包 含的基本事件有:(101,99),(102,98),(103,97),(104,96), 共4个,P(A)4 9. 【答案】 (1)144 (2)12名 (3)4 9 探究4 (1)在解答本题时有两点容易造成失分:一是通 过表格分析计算第三批次的人数时发生审题或运算失 误二是用列举法写出基本事件总数及事件A所含的事件 数,容易漏,使概率错误 (2)用分层抽样时,分成的各层标准要一致,互不重 叠,各层抽取的比例都等于样本容量在总
21、体中的比例,即 n N. 某中学为了更好地开展社团活动, 丰富同学们的课余生活,现用分层抽样的方 法从“模拟法庭”、“街舞”、“动漫”、 “话剧”四个社团中抽取若干人组成校社团 指导小组,有关数据见下表: 思考题思考题4 社团 相关人数 抽取人数 模拟法庭 24 a 街舞 30 5 动漫 b 4 话剧 12 c (1)求a,b,c的值; (2)若从“动漫”与“话剧”社团已抽取的人 中选2人担任指导小组组长,求这2人分别来 自这两个社团的概率 (2)设“动漫”社团的4人分别为:A1,A2, A3,A4;“话剧”社团的2人分别为:B1, B2.则从中任选2人的所有基本事件为:(A1, A2),(A
22、1,A3),(A1,A4),(A2,A3),(A2, A4),(A3,A4),(A1,B1),(A1,B2),(A2, B1),(A2,B2),(A3,B1),(A3,B2),(A4, B1),(A4,B2),(B1,B2),共15个 【解析】 (1)由表可知抽取比例为 5 30 1 6 ,故a4,b 24,c2. 第三步,找出满足题意的基本事件计算概率 其中2人分别来自这两个社团的基本事件为:(A1, B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2), (A4,B1),(A4,B2),共8个 所以这2人分别来自这两个社团的概率P 8 15. 【答案】 (
23、1)a4,b24,c2 (2) 8 15 1本节重点是理解简单随机抽样、系统抽 样、分层抽样的概念,并且是常用的从总体 中抽取样本的方法,难点是如何利用这些方 法从总体中抽取样本 2简单随机抽样是系统抽样和分层抽样的 基础,是一种等概率的抽样,由定义应抓住 以下特点:它要求总体个数较少;它是 从总体中逐个抽取的;它是一种不放回抽 样 3系统抽样又称等距抽样,号码序列一确 定,样本即确定了,但要求总体中不能含有 一定的周期性,否则其样本的代表性是不可 靠的,甚至会导致明显的偏向 4抽样方法经常交叉使用,比如系统抽样 中的第一均衡部分,可采用简单随机抽样, 分层抽样中,若每层中个体数量仍很大时,
24、则可辅之以系统抽样 自助餐自助餐 12015年1月6日8日衡水重点中学在毕 业班进行了一次模拟考试,为了了解全年级 1 000名学生的考试成绩,从中随机抽取了 100名学生的成绩单,下面说法正确的是 ( ) A1 000名学生是总体 B每个学生是个体 C1 000名学生的成绩是一个个体 D样本的容量是100 答案 D 解析 1 000名学生的成绩是统计中的总体, 每个学生的成绩是个体,被抽取的100名学 生的成绩是一个样本,其样本的容量是100. 2为了检查某超市货架上的奶粉是否含有 三聚氰胺,要从编号依次为1到50的袋装奶 粉中抽取5袋进行检验,用每部分选取的号 码间隔一样的系统抽样方法确定
25、所选取的5 袋奶粉的编号可能是( ) A5,10,15,20,25 B2,4,8,16,32 C1,2,3,4,5 D7,17,27,37,47 答案 D 解析 利用系统抽样,把编号分为5段,每 段10个,每段抽取一个,号码间隔为10,故 选D. 3课题组进行城市空气质量调查,按地域 把24个城市分成甲、乙、丙三组,对应城市 数分别为4,12,8.若用分层抽样抽取6个城市, 则丙组中应抽取的城市数为_ 答案 2 解析 由24个城市用分层抽样抽取6个城市,可知每一 个城市被抽入样的概率均为P 6 24 1 4 ,则丙组中应抽取的 城市数为81 42. 4在一次抽样活动中,采用了系统抽 样若第1组
26、中选中的为2号,第2组中选中 的为7号,则第5组中选中的应为_ 号 答案 22 解析 由题意知抽样间隔为725,所以 第5组中选中的号码为2(51)522. 5为了了解某市工人开展体育活动的情况, 拟采用分层抽样的方法从A,B,C三个区中 抽取7个工厂进行调查,已知A,B,C区中 分别有18,27,18个工厂 (1)求从A,B,C区中分别抽取的工厂个数; (2)若从抽取的7个工厂中随机抽取2个进行 调查结果的对比,计算这2个工厂中至少有1 个来自A区的概率 答案 (1)2,3,2 (2)11 21 解析 (1)工厂总数为18271863,样本容量与总 体中的个体数比为 7 63 1 9, 所以
27、从A,B,C三个区中应分别抽取的工厂个数为 181 92,27 1 93,18 1 92. (2)设A1,A2为在A区中抽得的2个工厂,B1,B2,B3为在 B区中抽得的3个工厂,C1,C2为在C区中抽得的2个工厂 从这7个工厂中随机的抽取2个,全部的可能结果有(A1, A2),(A1,B1),(A1,B2),(A1,B3),(A1,C1),(A1,C2),(A2, B1),(A2,B2),(A2,B3),(A2,C1),(A2,C2),(B1,B2),(B1, B3),(B1,C1),(B1,C2),(B2,B3),(B2,C1),(B2,C2),(B3, C1),(B3,C2),(C1,C2),共21种 随机抽取的2个工厂至少有一个来自A区的结果有(A1, A2),(A1,B1),(A1,B2),(A1,B3),(A1,C1),(A1,C2),(A2, B1),(A2,B2),(A2,B3),(A2,C1),(A2,C2),共11种 所以所求的概率为P11 21.