1、第十章第十章 统计与统计案例统计与统计案例 第一节第一节 随机抽样随机抽样 一、基础知识一、基础知识 1简单随机抽样 (1)定义:一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样 本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做 简单随机抽样这样抽取的样本,叫做简单随机样本 (2)常用方法:抽签法和随机数法 2分层抽样 (1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一 定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样 (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时
2、,往往选用分层抽样 3系统抽样 (1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制 定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样的方法叫做系统抽样 (2)系统抽样的步骤 假设要从容量为 N 的总体中抽取容量为 n 的样本 先将总体的 N 个个体编号; 确定分段间隔 k,对编号进行分段当N n(n 是样本容量)是整数时,取 k N n; 当总体中的个体数不能被样本容量整除时, 可先用简单随机抽样的方法从总体中剔除几个个 体,使剩下的个体数能被样本容量整除,然后再按系统抽样进行.这时在整个抽样过程中每 个个体被抽取的可能性仍然相等. 在第 1 段用简单随机
3、抽样确定第一个个体编号 l(lk); 按照一定的规则抽取样本通常是将 l 加上间隔 k 得到第 2 个个体编号 lk,再加 k 得到第 3 个个体编号 l2k,依次进行下去,直到获取整个样本 微信公众号学起而飞 类别共同点各自特点联系适用范围 简单随 机抽样 抽样过程中每 个个体被抽到的 可能性相等; 每次抽出个体 后不再将它放回, 即不放回抽样 从总体中逐个抽取 总体个数 较少 系统 抽样 将总体均分成几部分,按 预先定出的规则在各部 分中抽取 在起始部分取样 时,采用简单随 机抽样 总 体 个 数 较多 分层 抽样 将总体分成几层,分层进 行抽取 各层抽样时,采 用简单随机抽样 或系统抽样
4、 总 体 由 差 异 明 显 的 几 部 分 组 成 考点一考点一简单随机抽样简单随机抽样 典例下列抽取样本的方式属于简单随机抽样的个数有() 从无限多个个体中抽取 100 个个体作为样本; 盒子里共有 80 个零件,从中选出 5 个零件进行质量检验在抽样操作时,从中任意 拿出一个零件进行质量检验后再把它放回盒子里; 用抽签方法从 10 件产品中选取 3 件进行质量检验; 某班有 56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛 A0 个B1 个 C2 个D3 个 解析不是简单随机抽样, 因为被抽取样本的总体的个数是无限的, 而不是有限的; 不是简单随机抽样, 因为它是有放回抽样;
5、 明显为简单随机抽样; 不是简单随机抽样, 因为不是等可能抽样 答案B 解题技法应用简单随机抽样应注意的问题 (4)三种抽样方法的特点、联系及适用范围 (3)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比 (2)系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔 k 的整数倍 (1)不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的 二、常用结论二、常用结论 微信公众号学起而飞 78166572080263140702436997280198 32049234493582003623486969387481 A.08B07 C02D01 解析:选 D由随机数法的随机抽
6、样的过程可知选出的 5 个个体是 08,02,14,07,01,所 以第 5 个个体的编号是 01. 2利用简单随机抽样,从 n 个个体中抽取一个容量为 10 的样本若第二次抽取时,余 下的每个个体被抽到的概率为1 3,则在整个抽样过程中,每个个体被抽到的概率为( ) A.1 4 B.1 3 C. 5 14 D.10 27 解析:选 C根据题意, 9 n1 1 3, 解得 n28. 故在整个抽样过程中每个个体被抽到的概率为10 28 5 14. 考点二考点二系统抽样系统抽样 典例(1)某校为了解 1 000 名高一新生的身体生长状况,用系统抽样法(按等距的规 则)抽取 40 名同学进行检查,
7、将学生从 11 000 进行编号, 现已知第 18 组抽取的号码为 443, 则第一组用简单随机抽样抽取的号码为() A16B17 C18D19 (2)中央电视台为了解观众对某综艺节目的意见,准备从 502 名现场观众中抽取 10%进 行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除_个个体,抽 则选出来的第 5 个个体的编号为() 体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字, 1总体由编号为 01,02,19,20 的 20 个个体组成,利用下面的随机数表选取 5 个个 题组训练 数字舍去 数字计起,每三个或四个作为一个单位,自左
8、向右选取,有超过总体号码或出现重复号码的 (2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的 匀一般地,当总体容量和样本容量都较小时可用抽签法 (1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅 微信公众号学起而飞 为1 000 40 25, 设第一组随机抽取的号码为 x, 则抽取的第 18 组编号为 x1725443,所以 x18. (2)把 502 名观众平均分成 50 组,由于 502 除以 50 的商是 10,余数是 2,所以每组有 10 名观众,还剩 2 名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从 502 名观
9、众中抽取 2 名观众,这 2 名观众不参加座谈;再将剩下的 500 名观众编号为 1,2,3, 500,并均匀分成 50 段,每段含500 50 10 个个体所以需剔除 2 个个体,抽样间隔为 10. 答案(1)C(2)210 变透练清 1.变结论若本例(1)的条件不变,则编号落入区间501,750的人数为_ 解析:从 1 000 名学生中抽取一个容量为 40 的样本,系统抽样分 40 组,每组1 000 40 25 个号码,每组抽取一个,从 501 到 750 恰好是第 21 组到第 30 组,共抽取 10 人 答案:10 2(2018南昌摸底调研)某校高三(2)班现有 64 名学生,随机编
10、号为 0,1,2,63,依 编号顺序平均分成 8 组,组号依次为 1,2,3,8.现用系统抽样方法抽取一个容量为 8 的样 本,若在第 1 组中随机抽取的号码为 5,则在第 6 组中抽取的号码为_ 解析:由题知分组间隔为64 8 8,又第 1 组中抽取的号码为 5,所以第 6 组中抽取的号 码为 58545. 答案:45 解题技法系统抽样中所抽取编号的特点 系统抽样又称等距抽样, 所以依次抽取的样本对应的号码就是一个等差数列, 首项就是 第 1 组所抽取样本的号码, 公差为间隔数, 根据等差数列的通项公式就可以确定每一组内所 要抽取的样本号码 提醒系统抽样时,如果总体中的个数不能被样本容量整除
11、时,可以先用简单随机抽 样从总体中剔除几个个体,然后再按系统抽样进行 考点三考点三分层抽样分层抽样 解析(1)因为从 1 000 名学生中抽取一个容量为 40 的样本, 所以系统抽样的分段间隔 样间隔为_ 微信公众号学起而飞 最喜爱喜爱一般不喜欢 4 8007 2006 4001 600 电视台为了了解观众的具体想法和意见, 打算从中抽取 100 人进行详细的调查, 为此要 进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为() A25,25,25,25B48,72,64,16 C20,40,30,10D24,36,32,8 解析法一:因为抽样比为 100 20 000 1 200 ,
12、所以每类人中应抽取的人数分别为 4 800 1 20024,7 200 1 20036,6 400 1 20032,1 600 1 2008. 法二:最喜爱、喜爱、一般、不喜欢的比例为 4 8007 2006 4001 600698 2, 所以每类人中应抽取的人数分别为 6 698210024, 9 698210036, 8 698210032, 2 69821008. 答案D 解题技法分层抽样问题的类型及解题思路 (1)求某层应抽个体数量:按该层所占总体的比例计算 (2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比 例式进行计算 (3)分层抽样的计算应根据抽样比构
13、造方程求解,其中“抽样比 样本容量 总体容量 各层样本数量 各层个体数量” 题组训练 1 (2019山西五校联考)某校为了解学生的学习情况, 采用分层抽样的方法从高一 1 000 人、高二 1 200 人、高三 n 人中抽取 81 人进行问卷调查,若高二被抽取的人数为 30,则 n () A860B720 C1 020D1 040 解析:选 D由已知条件知抽样比为 30 1 200 1 40,从而 81 1 0001 200n 1 40,解得 n 有 20 000 人,其中各种态度对应的人数如下表所示: 典例某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共 微信公众号学起而飞
14、 2.(2018广州高中综合测试)已知某地区中小学学生人数如图所示为 了解该区学生参加某项社会实践活动的意向, 拟采用分层抽样的方法来进 行调查若高中需抽取 20 名学生,则小学与初中共需抽取的学生人数为 _ 解析: 设小学与初中共需抽取的学生人数为 x, 依题意可得 1 200 2 7002 4001 200 20 x20, 解得 x85. 答案:85 课时跟踪检测课时跟踪检测 1从 2 019 名学生中选取 50 名学生参加全国数学联赛,若采用以下方法选取:先用简 单随机抽样法从 2 019 名学生中剔除 19 名学生, 剩下的 2 000 名学生再按系统抽样的方法抽 取,则每名学生入选的
15、概率() A不全相等B均不相等 C都相等,且为 50 2 019 D都相等,且为 1 40 解析:选 C从 N 个个体中抽取 M 个个体,则每个个体被抽到的概率都等于M N,故每 名学生入选的概率都相等,且为 50 2 019. 2福利彩票“双色球”中红球的号码可以从 01,02,03,32,33 这 33 个两位号码中 选取, 小明利用如下所示的随机数表选取红色球的 6 个号码, 选取方法是从第 1 行第 9 列的 数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为() 81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 7
16、5 85 61 39 85 06 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 49 A.12B33 C06D16 解析:选 C被选中的红色球的号码依次为 17,12,33,06,32,22,所以第四个被选中的红 色球的号码为 06. 3某班共有学生 52 人,现根据座号,用系统抽样的方法,抽取一个容量为 4 的样本已 知 5 号、18 号、44 号同学在样本中,那么样本中还有一个同学的座号是() A23B27 1 040,故选 D. 微信公众号学起而飞 D33 解析:选 C分段间隔为52 4 13,故样本中还有一
17、个同学的座号为 181331. 4某工厂在 12 月份共生产了 3 600 双皮靴,在出厂前要检查这批产品的质量,决定采 用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为 a,b,c,且 a,b, c 构成等差数列,则第二车间生产的产品数为() A800 双B1 000 双 C1 200 双D1 500 双 解析:选 C因为 a,b,c 成等差数列,所以 2bac,即第二车间抽取的产品数占抽 样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占 12 月份生产 总数的三分之一,即为 1 200 双皮靴 5 (2018南宁摸底联考)已知某地区中小学生人数和近视情况分
18、别如图甲和图乙所示 为 了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样 本容量和抽取的高中生近视人数分别为() A100,20B200,20 C200,10D100,10 解析:选 B由题图甲可知学生总人数是 10 000,样本容量为 10 0002%200,抽取 的高中生人数是 2 0002%40,由题图乙可知高中生的近视率为 50%,所以抽取高中生的 近视人数为 4050%20,故选 B. 6一个总体中有 100 个个体,随机编号为 0,1,2,99.依编号顺序平均分成 10 个小 组,组号依次为 1,2,3,10.现用系统抽样方法抽取一个容量为 10
19、的样本,如果在第一组 随机抽取的号码为 m,那么在第 k 组中抽取的号码个位数字与 mk 的个位数字相同若 m 6,则在第 7 组中抽取的号码是() A63B64 C65D66 解析:选 A若 m6,则在第 7 组中抽取的号码个位数字与 13 的个位数字相同,而第 7 组中的编号依次为 60,61,62,63,69,故在第 7 组中抽取的号码是 63. 7 采用系统抽样方法从 960 人中抽取 32 人做问卷调查, 为此将他们随机编号为 1,2, , 960, 分组后在第一组采用简单随机抽样的方法抽到的号码为 9.抽到的 32 人中, 编号落入区 C31 微信公众号学起而飞 A7B9 C10D
20、15 解析:选 C9603230,故由题意可得抽到的号码构成以 9 为首项,以 30 为公差的 等差数列,其通项公式为 an930(n1)30n21.由 45030n21750,解得 15.7 n25.7.又 n 为正整数,所以 16n25,故做问卷 B 的人数为 2516110.故选 C. 8某企业三月中旬生产 A,B,C 三种产品共 3 000 件,根据分层抽样的结果,企业统 计员制作了如下的统计表格: 产品类别ABC 产品数量(件)1 300 样本容量(件)130 由于不小心,表格中 A,C 产品的有关数据已被污染看不清楚,统计员记得 A 产品的样 本容量比 C 产品的样本容量多 10,
21、根据以上信息,可得 C 的产品数量是_件 解析:设样本容量为 x,则 x 3 0001 300130,x300. A 产品和 C 产品在样本中共有 300130170(件) 设 C 产品的样本容量为 y,则 yy10170,y80. C 产品的数量为3 000 300 80800(件) 答案:800 9某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽 样方法从三个分厂生产的该产品中共抽取 100 件做使用寿命的测试, 则第一分厂应抽取的件 数为_;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值 分别为 1 020 小时、980 小时、1 030 小时
22、,估计这个企业所生产的该产品的平均使用寿命为 _小时 解析:第一分厂应抽取的件数为 10050%50;该产品的平均使用寿命为 1 0200.5 9800.21 0300.31 015. 答案:501 015 10将参加冬季越野跑的 600 名选手编号为:001,002,600,采用系统抽样方法抽 人中,做问卷 B 的人数为() 间1,450的人做问卷 A,编号落入区间(450,750的人做问卷 B,其余的人做问卷 C.则抽到的 微信公众号学起而飞 初一年级初二年级初三年级 女生373xy 男生377370z 已知在全校学生中随机抽取 1 名,抽到初二年级女生的概率是 0.19. (1)求 x
23、的值; (2)现用分层抽样的方法在全校抽取 48 名学生,问应在初三年级抽取多少名? 解:(1) x 2 0000.19,x380. (2)初三年级人数为 yz2 000(373377380370)500,现用分层抽样的方法在 全校抽取 48 名学生,应在初三年级抽取的人数为 48 2 00050012(名) 11某初级中学共有学生 2 000 名,各年级男、女生人数如下表: 答案:17 256 5k42,因此抽到穿白色衣服的选手人数为 422517(人) 各有 12 名学生,第 k(kN*)组抽中的号码是 412(k1)令 302412(k1)496,得 解析:由题意及系统抽样的定义可知,将
24、这 600 名学生按编号依次分成 50 组,每一组 到 496 穿白色衣服,从 497 到 600 穿黄色衣服,则抽到穿白色衣服的选手人数为_ 抽得的号码为 004,这 600 名选手穿着三种颜色的衣服,从 001 到 301 穿红色衣服,从 302 取一个容量为 50 的样本,把编号分为 50 组后,在第一组的 001 到 012 这 12 个编号中随机 微信公众号学起而飞 第二节第二节 用样本估计总体用样本估计总体 一、基础知识一、基础知识 1频率分布直方图 (1)纵轴表示频率 组距,即小长方形的高 频率 组距; (2)小长方形的面积组距频率 组距频率; (3)各个小方形的面积总和等于 1
25、 . 2频率分布表的画法 第一步:求极差,决定组数和组距,组距极差 组数; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表 3茎叶图 茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数 4中位数、众数、平均数的定义 (1)中位数 将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数) 叫做这组数据的中位数 (2)众数 一组数据中出现次数最多的数据叫做这组数据的众数 (3)平均数 一组数据的算术平均数即为这组数据的平均数,n 个数据 x1,x2,xn的平均数 x 1
26、n(x 1x2xn) 5样本的数字特征 如果有 n 个数据 x1,x2,xn,那么这 n 个数的 (1)平均数 x 1 n(x 1x2xn) (2)标准差 s 1 nx 1 x 2x2 x 2xn x 2. 微信公众号学起而飞 (3)方差 s21 n(x 1 x )2(x2 x )2(xn x )2 二、常用结论二、常用结论 1频率分布直方图中的常见结论 (1)众数的估计值为最高矩形的中点对应的横坐标 (2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横 坐标之和 (3)中位数的估计值的左边和右边的小矩形的面积和是相等的 2平均数、方差的公式推广 (1)若数据 x1,
27、x2,xn的平均数为 x ,则 mx1a,mx2a,mx3a,mxna 的 平均数是 m x a. (2)若数据 x1,x2,xn的方差为 s2,则数据 ax1b,ax2b,axnb 的方差为 a2s2. 考点一考点一茎叶图茎叶图 典例(2017山东高考)如图所示的茎叶图记录了甲、乙两组各 5 名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平 均值也相等,则 x 和 y 的值分别为() A3,5B5,5 C3,7D5,7 解析由两组数据的中位数相等可得 6560y,解得 y5,又它们的平均值相等, 所以1 556626574(70 x) 1 5(5961676578),解得 x3
28、. 答案A 解题技法茎叶图的应用 (1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组 数据 通过茎叶图可以确定数据的中位数, 数据大致集中在哪个茎, 数据是否关于该茎对称, 数据分布是否均匀等 (2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中 者方差较小 微信公众号学起而飞 但曾计算得该组数据的极差与中位数之和为 61,则被污染的数字为() A1B2 C3D4 解析:选 B由图可知该组数据的极差为 482028,则该组数据的中位数为 6128 33,易得被污染的数字为 2. 2.甲、乙两名篮球运动员 5 场比赛得分的原始记录如茎叶图所示
29、,若 甲、乙两人的平均得分分别为 x 甲, x 乙,则下列结论正确的是( ) A. x 甲 x 乙;乙比甲得分稳定 B. x 甲 x 乙;甲比乙得分稳定 C. x 甲 x 乙;乙比甲得分稳定 D. x 甲 x 乙;甲比乙得分稳定 解析:选 A因为 x 甲2781622 5 11, x 乙812182125 5 16.8,所 以 x 甲 x 乙且乙比甲成绩稳定 考点二考点二频率分布直方图频率分布直方图 典例某城市 100 户居民的月平均用电量(单位:千瓦时),以160,180),180,200), 200,220),220,240),240,260),260,280),280,300分组的频率分
30、布直方图如图 (1)求直方图中 x 的值; (2)求月平均用电量的众数和中位数 解(1)由(0.0020.009 50.0110.012 5x0.0050.002 5)201, 解得 x0.007 5. 即直方图中 x 的值为 0.007 5. 1.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清, 题组训练 微信公众号学起而飞 230. (0.0020.009 50.011)200.450.5, (0.0020.009 50.0110.012 5)200.70.5, 月平均用电量的中位数在220,240)内 设中位数为 a,则 0.450.012 5(a220)0.5,解得 a224
31、,即中位数为 224. 变透练清 1 某校随机抽取 20 个班, 调查各班有出国意向的人数, 所得数据的茎叶图如图所示 以 5 为组距将数据分组为0,5),5,10),30,35),35,40,所作的频率分布直方图是() 解析:选 A以 5 为组距将数据分组为0,5),5,10),30,35),35,40,各组的频数 依次为 1,1,4,2,4,3,3,2,可知画出的频率分布直方图为选项 A 中的图 2.变结论在本例条件下,在月平均电量为220,240),240,260),260,280),280,300 的四组用户中,用分层抽样的方法抽取 11 户居民,则月平均用电量在220,240)的用户
32、中应 抽取_户 解析:月平均用电量在220,240)的用户有 0.012 52010025(户)同理可得月平均 用电量在240,260)的用户有 15 户,月平均用电量在260,280的用户有 10 户,月平均用电 量在280,300的用户有 5 户,故抽取比例为 11 2515105 1 5. 所以月平均用电量在220,240)的用户中应抽取 251 55(户) 答案:5 3我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进 行了调查,通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨),将数据按照0, 2 (2)月平均用电量的众数是220240 微信公众号
33、学起而飞 (1)求直方图中 a 的值; (2)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数,说明理由 解:(1)由频率分布直方图可知,月均用水量在0,0.5)的频率为 0.080.50.04.同理, 在0.5,1), 1.5,2), 2,2.5), 3,3.5), 3.5,4), 4,4.56 组的频率分别为 0.08,0.21,0.25,0.06,0.04,0.02. 由 1(0.040.080.210.250.060.040.02)0.5a0.5a, 解得 a0.30. (2)估计全市居民中月均用水量不低于 3 吨的人数为 3.6 万理由如下: 由(1)知,100
34、位居民中月均用水量不低于 3 吨的频率为 0.060.040.020.12.由以上 样本的频率分布,可以估计 30 万居民中月均用水量不低于 3 吨的人数为 300 0000.12 36 0003.6(万) 考点三考点三样本的数字特征样本的数字特征 考法(一)样本的数字特征与频率分布直方图交汇 典例(2019辽宁师范大学附属中学模拟)某校初三年级有 400 名学生, 随机抽查了 40 名学生测试 1 分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直 方图用样本估计总体,下列结论正确的是() A该校初三学生 1 分钟仰卧起坐的次数的中位数为 25 B该校初三学生 1 分钟仰
35、卧起坐的次数的众数为 24 C该校初三学生 1 分钟仰卧起坐的次数超过 30 的人数约有 80 D该校初三学生 1 分钟仰卧起坐的次数少于 20 的人数约为 8 解析第一组数据的频率为 0.0250.1,第二组数据的频率为 0.0650.3,第三 0.5),0.5,1),4,4.5分成 9 组,制成了如图所示的频率分布直方图 微信公众号学起而飞 解析由茎叶图可知去掉的两个数是 87,99,所以 879029129490 x 917,解得 x4.故 s21 7(8791) 2(9091)22(9191)22(9491)2236 7 . 答案 36 7 解题技法 样本的数字特征与茎叶图综合问题的注
36、意点 (1)在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要 漏掉了数据,也不要混淆茎叶图中茎与叶的含义 (2)茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据, 因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个 数,或中间两个数的平均数)等 考法(三)样本的数字特征与优化决策问题交汇 7 个剩余分数的方差为_. 分为 91.现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中以 x 表示,则 典例将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低分,7 个剩余分数的平均 考法(二)样本的
37、数字特征与茎叶图交汇 乘以小长方形底边中点的横坐标之和 (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积 (2)中位数左边和右边的小长方形的面积和是相等的; (1)最高的小长方形底边中点的横坐标为众数; 频率分布直方图与众数、中位数、平均数的关系 解题技法 答案C 选 C. 20 的频率为 0.1,1 分钟仰卧起坐的次数少于 20 的人数为 4000.140,故 D 错误故 频率为 0.2,超过 30 次的人数为 4000.280,故 C 正确;1 分钟仰卧起坐的次数少于 第三组数据的中间值为 27.5,众数为 27.5,故 B 错误;1 分钟仰卧起坐的次数超过
38、30 的 0.10.30.1,x1.25,中位数为 26.25,故 A 错误;第三组数据所在的矩形最高, 组数据的频率为 0.0850.4,中位数在第三组内,设中位数为 25x,则 x0.080.5 微信公众号学起而飞 (1)请填写下表(写出计算过程): 平均数方差命中 9 环及 9 环以上的次数 甲 乙 (2)从下列三个不同的角度对这次测试结果进行分析: 从平均数和方差相结合看(分析谁的成绩更稳定); 从平均数和命中 9 环及 9 环以上的次数相结合看(分析谁的成绩好些); 从折线图上两人射击命中环数的走势看(分析谁更有潜力) 解由题图,知 甲射击 10 次中靶环数分别为 9,5,7,8,7
39、,6,8,6,7,7. 将它们由小到大排列为 5,6,6,7,7,7,7,8,8,9. 乙射击 10 次中靶环数分别为 2,4,6,8,7,7,8,9,9,10. 将它们由小到大排列为 2,4,6,7,7,8,8,9,9,10. (1) x 甲 1 10(56274829)7(环), x 乙 1 10(24672829210)7(环), s2 甲 1 10(57) 2(67)22(77)24(87)22(97)21 10(42024) 1.2, s2 乙 1 10(27) 2(47)2(67)2(77)22(87)22(97)22(107)2 1 10(25910289)5.4. 填表如下:
40、平均数方差命中 9 环及 9 环以上的次数 图所示 典例(2018周口调研)甲、乙两人在相同条件下各射击 10 次,每次中靶环数情况如 微信公众号学起而飞 甲71.21 乙75.43 (2)平均数相同,s2 甲s2乙, 甲成绩比乙稳定 平均数相同,命中 9 环及 9 环以上的次数甲比乙少, 乙成绩比甲好些 甲成绩在平均数上下波动, 而乙处于上升势头, 从第三次以后就没有比甲少的情况 发生,乙更有潜力 解题技法 利用样本的数字特征解决优化决策问题的依据 (1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动 的大小标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方
41、差越小,数据的 离散程度越小,越稳定 (2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征 题组训练 1对某商店一个月内每天的顾客人数进行统计,得到样本的茎叶图(如图所示),则该 样本中的中位数、众数、极差分别是() A46,45,56B46,45,53 C47,45,56D45,47,53 解析: 选 A样本共 30 个, 中位数为4547 2 46; 显然样本数据出现次数最多的为 45, 故众数为 45;极差为 681256,故选 A. 2甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表 所示: 甲乙丙丁 微信公众号学起而飞 平均环数 x8.38.88.8
42、8.7 方差 s23.53.62.25.4 从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是() A甲B乙 C丙D丁 解析:选 C由表格中数据可知,乙、丙平均环数最高,但丙方差最小,说明成绩好, 且技术稳定,选 C. 3 某仪器厂从新生产的一批零件中随机抽取 40 个进行检测, 如图是根据抽样检测得到 的零件的质量(单位:克)绘制的频率分布直方图,样本数据按照80,82),82,84),84,86), 86,88),88,90),90,92),92,94),94,96分成 8 组,将其按从左到右的顺序分别记为第一 组,第二组,第八组则样本数据的中位数在第_组 解析:由题图可得,前四组的
43、频率为(0.037 50.062 50.075 00.100 0)20.55,则 其频数为 400.5522,且第四组的频数为 400.100 028,故中位数在第四组 答案:四 课时跟踪检测课时跟踪检测 A 级 1 一个频数分布表(样本容量为 30)不小心被损坏了一部分, 只记得样本中数据在20,60) 上的频率为 0.8,则估计样本在40,60)内的数据个数为() A14B15 C16D17 解析:选 B由题意,样本中数据在20,60)上的频数为 300.824, 所以估计样本在40,60)内的数据个数为 244515. 2(2019长春质检)如图所示是某学校某年级的三个班在一学期内的六次
44、数学测试的平 微信公众号学起而飞 A0B1 C2D3 解析: 选 D由图可知一班每次考试的平均成绩都在年级平均成绩之上, 故正确 由图可知二班平均成绩的图象高低变化明显, 可知成绩不稳定, 波动程度较大, 故正确 由图可知三班平均成绩的图象呈上升趋势,并且图象的大部分都在年级平均成绩图象的下 方,故正确故选 D. 3(2018贵阳检测)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行 整理后分为 5 组, 绘制如图所示的频率分布直方图, 图中从左到右依次为第一、 第二、 第三、 第四、第五小组,已知第二小组的频数是 40,则成绩在 80100 分的学生人数是() A15B18 C20
45、D25 解析:选 A根据频率分布直方图,得第二小组的频率是 0.04100.4,频数是 40, 样本容量是40 0.4100,又成绩在 80100 分的频率是(0.010.005)100.15,成绩在 80100 分的学生人数是 1000.1515.故选 A. 4.2017 年 4 月,泉州有四处湿地被列入福建省首批重要湿地名录,某 同学决定从其中 A,B 两地选择一处进行实地考察因此,他通过网站了 其中正确结论的个数为() 三班成绩虽然多数时间低于年级平均水平,但在稳步提升 二班成绩不够稳定,波动程度较大; 一班成绩始终高于年级平均水平,整体成绩比较好; 线连接,根据图象,给出下列结论: 均
46、成绩 y 关于测试序号 x 的函数图象,为了容易看出一个班级的成绩变化,将离散的点用虚 微信公众号学起而飞 B 两地综合评分数据的均值分别为 x A, x B,方差分别为 s2A,s2B.若以备受好评为依据,则 下述判断较合理的是() A因为 x A x B,s2As2B,所以应该去 A 地 B因为 x A x B,s2As2B,所以应该去 A 地 C因为 x A x B,s2As2B,所以应该去 B 地 D因为 x A x B,s2As2B,所以应该去 B 地 解析:选 B因为 x A1 6(728687899294)86.67, x B1 6(747388 869594)85, s2A1
47、6(7286.67) 2(8686.67)2(8786.67)2(8986.67)2(9286.67)2(94 86.67)250.56, s2B1 6(7485) 2(7385)2(8885)2(8685)2(9585)2(9485)276, 所以 x A x B,s2As2B(A 数据集中,B 数据分散), 所以 A 地好评分高,且评价稳定故选 B. 5(2018青岛三中期中)已知数据 x1,x2,xn的平均数 x 5,方差 s24,则数据 3x17,3x27,3xn7 的平均数和标准差分别为() A15,36B22,6 C15,6D22,36 解析:选 Bx1,x2,x3,xn的平均数为
48、 5, x1x2xn n 5,3x13x23xn n 73x1x2xn n 735722. x1,x2,x3,xn的方差为 4,3x17,3x27,3x37,3xn7 的方差是 324 36,故数据 3x17,3x27,3xn7 的平均数和标准差分别为 22,6,故选 B. 6 (2018江苏高考)已知5位裁判给某运动员打出的分数的茎叶图如图所示, 那么这 5 位裁判打出的分数的平均数为_ 解析:这 5 位裁判打出的分数分别是 89,89,90,91,91,因此这 5 位裁判打出的分数的平 均数为8989909191 5 90. 答案:90 解上周去过这两个地方的人对它们的综合评分,并将评分数
49、据记录为右图的茎叶图,记 A, 微信公众号学起而飞 解析: 设被抽查的美术生的人数为n, 因为后2个小组的频率之和为(0.037 50.012 5)50.25,所以前 3 个小组的频率之和为 0.75.又前 3 个小组的频率之比为 135,第 2 个小组的频数为 15,所以前 3 个小组的频数分别为 5,15,25,所以 n51525 0.75 60. 答案:60 8某人 5 次上班途中所花的时间(单位:分钟)分别为 x,y,10,11,9.已知这组数据的平均 数为 10,方差为 2,则|xy|的值为_ 解析:由题意知这组数据的平均数为 10,方差为 2, 可得 xy20,(x10)2(y10
50、)28, 设 x10t,y10t,由(x10)2(y10)28 得 t24, 所以|xy|2|t|4. 答案:4 9某班 100 名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间 是50,60),60,70),70,80),80,90),90,100 (1)求图中 a 的值; (2)根据频率分布直方图,估计这 100 名学生语文成绩的平均分; (3)若这 100 名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比 如表所示,求数学成绩在50,90)之外的人数. 分数段50,60)60,70)70,80)80,90) xy11213445 解:(1)由频率分