1、=【 ;精品教育资源文库 】 = 第 2 讲 用样本估计总体 板块一 知识梳理 自主学习 必备知识 考点 1 用样本的频率分布估计总体分布 1作频率分布直方图的步骤 (1)求极差 (即一组数据中 最大值 与 最小值 的差 ) (2)决定 组距 与 组数 (3)将数据 分组 (4)列 频率分布表 (5)画 频率分布直方图 2频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的 中点 ,就得频率分布折线图 (2)总体密度曲线:随着 样本容量 的增加,作图时 所分的组数 增加, 组距 减小,相应的频率折线图会越来越接近于一条光滑曲 线,即总体密度曲线 3茎叶图 茎
2、是指 中间 的一列数,叶是从茎的 旁边 生长出来的数 考点 2 用样本的数字特征估计总体的数字特征 1众数:一组数据中出现次数最多的数 2中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数 3平均数: x x1 x2 ? xnn ,反映了一组数据的平均水平 4 标准差:是样本数据到平均数的一种平均距离, s 1n?x1 x ?2 ?x2 x ?2 ? ?xn x ?2. 5方差: s2 1n(x1 x )2 (x2 x )2 ? (xn x )2(xn是样本数据, n 是样本容量,x 是样本平均数 ) 必会结论 频率分布直方图与众数、中位数
3、与平均数的关系 (1)最高的小长方形底边中点的横坐标即 是众数 (2)中位数左边和右边的小长方形的面积和是相等的 =【 ;精品教育资源文库 】 = (3)平均数是频率分布直方图的 “ 重心 ” ,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和 考点自测 1判断下列结论的正误 (正确的打 “” ,错误的打 “”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势 ( ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论 ( ) (3)一组数据的方差越大,说明这组数据越集中 ( ) (4)从频率分布直方图得不出原始的数据内容,把数据表示成 直方
4、图后,原有的具体数据信息就被抹掉了 ( ) (5)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次 ( ) 答案 (1) (2) (3) (4) (5) 2 2017 芜湖模拟 某市中心购物商场在 “ 双 11” 开展的 “ 买三免一 ” 促销活动异常火爆,对当日 8 时至 22 时的销售额进行统计,以组距为 2 小时的频率分布直方图如图所示,已知 12 时至 16 时的销售额为 90 万元,则 10 时至 12 时销售额为 ( ) A.120 万元 B 100 万元 C 80 万元 D 60 万元 答案 D 解析 由图可知 12 时至 16 时频率为
5、0.45,销售额 90 万元, 10 时至 12 时频率为 0.3,销售额为 0.30.4590 60 万元故选 D. 3如图是 2017 年某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和众数依次为 ( ) A 85,84 B 84,85 C 86,84 D 84,86 答案 A =【 ;精品教育资源文库 】 = 解析 由图可知去掉一个最高分和一个最低分后,所剩数据为 84,84,86,84,87,则平均数为 85,众 数为 84. 4 课本改编 在样本频率分布直方图中,共有 9 个小长方形,若中间一个小长方形的面积等于其他 8
6、个长方形的面积和的 25,且样本容量为 140,则中间一组的频数为 ( ) A 28 B 40 C 56 D 60 答案 B 解析 设中间一个小长方形面积为 x,其他 8 个长方形面积为 52x,因此 x 52x 1, x 27. 所以中间一组的频数为 140 27 40.故选 B. 5 2015 湖北高考 某电子商 务公司对 10000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额 (单位:万元 )都在区间 0.3,0.9内,其频率分布直方图如图所示 (1)直方图中的 a _; (2)在这些购物者中,消费金额在区间 0.5,0.9内的购物者的人数为 _ 答案 (1)3 (2)
7、6000 解析 (1)由 0.11.5 0.12.5 0.1 a 0.12.0 0.10.8 0.10.2 1,解得 a 3. (2)区间 0.3,0.5)内的频率为 0.11.5 0.12.5 0.4,故 0.5,0.9内的频率为 1 0.4 0.6. 因此,消费金额在区间 0.5,0.9内的购物者的人数为 0.610000 6000. 板块二 典例探究 考向突破 考向 频率分布直方图的应用 例 1 2016 山东高考 某高校调查了 200 名学生每周的自习时间 (单位:小时 ),制成了如图所示的频率分布直方图,其中自习时间的范围是 17.5,30,样本数据分组为17.5,20), 20,2
8、2.5), 22.5,25), 25,27.5), 27.5,30根据直方图,这 200 名学生中每周的自习时 间不少于 22.5 小时的人数是 ( ) =【 ;精品教育资源文库 】 = A 56 B 60 C 120 D 140 答案 D 解析 由频率分布直方图知这 200 名学生每周的自习时间不少于 22.5 小时的频率为 1 (0.02 0.10)2.5 0.7,则这 200 名学生中每周的自习时间不少于 22.5 小时的人数为2000.7 140.故选 D. 触类旁通 应用频率分布直方图应注意的问题 (1)频率分布直方图是从各个小组数据在样本容量中所占比例大小的角度,表示数据分布的规律
9、 (2)图中各小长方形的面积等于相应各组的频率,它直观反映了数据在 各个小组的频率的大小 (3)要把握一个基本公式:频率 频数样本容量 . 【变式训练 1】 为了解某校高三学生联考的数学成绩情况,从该校参加联考学生的数学成绩中抽取一个样本,并分成五组,绘成如图所示的频率分布直方图,已知第一组至第五组的频率之比为 1 2 8 6 3,第五组的频数为 6,则样本容量为 _ 答案 40 解析 因为第一组至第五组的频率之比为 1 2 8 6 3,所以可设第一组至第五组的频率分别为 k,2k,8k,6k,3k,又频率之和为 1,所以 k 2k 8k 6k 3k 1,解得 k 120=【 ;精品教育资源文
10、库 】 = 0.05,所以第五组的频率为 30.05 0.15,又第五组的频数为 6,所以样本容量为 60.1540. 考向 茎叶图的应用 例 2 2017 山东高考 如图所示的茎叶图记录了甲、乙两组各 5 名工人某日的产量数据 (单位:件 )若这两组数据的中位数相等,且平均值也相等,则 x 和 y 的值分别为 ( ) A 3,5 B 5,5 C 3,7 D 5,7 答案 A 解析 甲组数据的中位数为 65,由甲、乙两组数据的中位数相等得 y 5.又甲、乙两组数据 的平均值相等, 15(56 65 62 74 70 x) 15(59 61 67 65 78), x 3.故选 A. 触类旁通 茎
11、叶图的绘制及应用 (1)一般制作茎叶图的方法是:将所有两位数的十位数字作为 “ 茎 ” ,个位数字作为“ 叶 ” ,茎相同者共用一个茎,茎按从小到大顺序由上到下列出 (2)估计数字特征,给定两组数据的茎叶图, “ 重心 ” 下移者平均数较大,数据集中者方差较小 【变式训练 2】 2018 长沙模拟 下面的茎叶图是某班学生在一次数学测试时的成绩: 根据 茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是 ( ) A 15 名女生成绩的平均分为 78 B 17 名男生成绩的平均分为 77 C女生成绩和男生成绩的中位数分别为 82,80 =【 ;精品教育资源文库 】 = D男生中的高分
12、段和低分段均比女生多,相比较男生两极分化比较严重 答案 C 解析 15 名女生成绩的平均分为 115(90 93 80 80 82 82 83 83 85 7071 73 75 66 57) 78, A 正确; 17 名男生成绩的平均分为 117(93 93 96 80 82 83 86 86 88 71 74 75 62 62 68 53 57) 77,故 B 正确;观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重, D 正确;根据女生和男生成绩数据分析可得,两组数据的中位数均为 80, C 错误 考向 数字特征的应用 命题角度 1 样本数字特征与直方图交汇 例 3 2018
13、益阳模拟 为了了解某校九年级 1600 名学生的体能情况,随机抽查了部分学生,测试 1 分钟仰卧起坐的成绩 (次数 ),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是 ( ) A该校九年级学生 1 分钟仰卧起坐的次数的中位数为 26.25 B该校九年级学生 1 分钟仰卧起坐的次数的众数为 27.5 C该校九年级学生 1 分钟仰卧起坐的次数超过 30 的人数约为 320 D该校九年级学生 1 分钟仰卧起坐的次数少于 20 的人数约为 32 答案 D 解析 由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值 27.
14、5; 1 分钟仰卧起坐的次数超过 30 的频率为 0.2,所以估计 1 分钟仰卧起坐的次数超过 30 的人数为 320; 1 分钟仰卧起坐的次数少于 20 的频率为0.1,所以估计 1 分钟仰卧起坐的次数少于 20 的人数为 160.故 D 错 命题角度 2 样本的数字特征与茎叶图 例 4 将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低分, 7 个剩余分数的平均分为 91.现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中以 x 表示: =【 ;精品教育资源文库 】 = 则 7 个剩余分数的方差为 _ 答案 367 解析 由图可知去掉的两个数是 87,99,所以 87 902 912 94 90 x 917 ,x 4.s2 17(87 91)2 (90 91)22 (91 91)22 (94 91)22 367. 命题角度 3 样本的数字特征与优化决策问题 例 5 某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔 30 min 抽取一包产品,称其重量,分别记