1、=【 ;精品教育资源文库 】 = 第 55 讲 用样本估计总体 考纲要求 考情分析 命题趋势 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点 2理解样本数据标准差的意义和作用,会计算数据标准差 3能从样本数据中提取基本的数字特征(如平均数、标准差 ),并做出合理的解释 4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想 2017 全国卷 ,12 2017 山东卷, 8 2017 北京卷, 17 2016 四川卷, 16 2015 江苏卷, 4 根据样本数据求基本的数字特征,利用随机抽样的
2、方法和样本估计总体的思想解决一些简单的实际问题 分值: 5 12 分 1频率分布直方图和茎叶图 (1)作频率分布直方图的步骤 求极差 (即一组数据中 _最大值 _与 _最小值 _的差 ); 决定 _组距 _与 _组数 _; 将数据 _分组 _; 列 _频率分布表 _; 画 _频率分布直方图 _. (2)频率分布折线图和总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的 _中点 _,就得到频率分布折线图 总体密度曲线:随着样本容量的增加,作图时 _所分的组数 _增加, _组距 _减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线 (3)茎叶图的优
3、点 茎叶图的优点是可以 _保留 _原始数据,而且可以 _随时 _记录,这对数据的记录和表示都能带来方便 2样本的数字特征 (1)众数、中位数、平均数 =【 ;精品教育资源文库 】 = 数字特征 定义与求法 优点与缺点 众数 一组数据中重复出现次数 _最多_的数 众数通常用于描述变量的值出现次数最多的数,但显然它对其他数据信息的忽视使得无法客观地反映总体 特征 中位数 把一组数据按 _从小到大的 _顺序排列,处在 _中间 _位置的一个数据(或两个数据的平均数 ) 中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点 平均数 如果有 n
4、 个数据 x1, x2, ? , xn,那么这 n 个数的平均数 x _ x1 x2 ? xnn _ 平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低 (2)标准差、方差 标 准差 : 样本 数 据到 平 均数 的 一种 平 均距 离 ,一 般用 s 表示, s _ 1n?x1 x ?2 ?x2 x ?2 ? ?xn x ?2 _. 方差:标准差的平方 s2 _ 1n(x1 x )2 (x2 x )2 ? (xn x )2 _, 其中 xi(i 1,2,3, ? , n)是 _样本数据 _, n 是 _样本容
5、量 _, x 是 _样本平均数 _. (3)平均数、方差公式的推广 若数据 x1, x2, ? , xn的平均数为 x ,方差为 s2,则数据 mx1 a, mx2 a, ? , mxn a的平均数为 m x a,方差为 m2s2. 1思维辨析 (在括号内打 “” 或 “ ”) (1)在频率分布直方图中,小矩形的高表示频率 ( ) (2)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相 同的数据可以只记一次 ( ) (3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数 ( ) =【 ;精品教育资源文库 】 = (4)在频率分布直方图中,众数左边和右边的小长方形的面
6、积和是相等的 ( ) (5)一组数据的方差越大,说明这组数据的波动越大 ( ) 解析 (1)错误在频率分布直方图中,小矩形的高为频率 /组距 (2)错误茎叶图中,相同的数据要重复记,故错误 (3)正确由众数概念知结论正确 (4)错误在频率分布直方图中,中位数左边和右边的小长方形面积和相等,故错误 (5)正确由方差定义知结论 正确 2若某校高一年级 8 个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是 ( A ) 8 9 7 9 3 1 6 4 0 2 A 91.5 和 91.5 B 91.5 和 92 C 91 和 91.5 D 92 和 92 解析 将这组数据从小到大排列
7、,得 87,89,90,91,92,93,94,96.故中位数为 91 922 91.5, 平均数为 x 87 89 90 91 92 93 94 968 91.5. 3如图是 100 位居民月均用水量的频率分布直方图,则月均用水量为 2,2.5)范围内的居民数有 _25_人 解析 由图可知,在 2,2.5)范围内的居民人数有 1000.5(2.5 2) 25. 4一个容量为 200 的样本的频率分布直方图如图所示,则样本数据落在 5,9)内的频率和频数分别为 _0.2,40_. =【 ;精品教育资源文库 】 = 解析 由图可知,落在 5,9)内的频率为 0.05(9 5) 0.2,频数为 2
8、000.2 40. 5某赛季甲、乙两名篮球运动员每场比赛得分记录用茎叶图表示 ,从茎叶图的分布情况看, _乙 _运动员的发挥更稳定 . 甲 乙 8 0 6 4 3 1 2 5 8 6 3 2 4 5 9 8 3 3 1 1 6 6 7 9 4 4 9 1 5 0 解析 由茎叶图可知,乙运动员的得分大部分集中在 30 40 之间,而甲运动员的得分相对比较分散且在低分区的较多,故乙比赛得分更稳定 一 频率分布直方图及其应用 (1)已知频率分布直方图中的部分数据,求其他数据可根据频率分布 直方图中的数据求出样本与整体的关系,利用频率和等于 1 就可求出其他数据 (2)已知频率分布直方图,求某种范围内
9、的数据,可利用图形及已知范围结合求解 【例 1】 (2018 河北衡水一中测试 )某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年 200 户居民每户的月均用电量 (单位:百千瓦 时 ),将数据按 0,1), 1,2), 2,3), 3,4), 4,5), 5,6), 6,7), 7,8), 8,9分成 9 组,制成了如图所示的频率分布直方图 (1)求直方图中 m 的值; (2)设该 市有 100 万户居民,估计全市每户居民中月均用电量不低于 6 百千瓦 时的户=【 ;精品教育资源文库 】 = 数及每户居民月均用电量的中位数; (3)政府计划对月均用电量在 4 百千瓦
10、 时以下的用户进行奖励,月均用电量在 0,1)内的用户奖励 20 元 /月,月均用电量在 1,2)内的用户奖励 10 元 /月,月均用电量在 2,4)内的用户奖励 2 元 /月若该市共有 400 万户居民,试估计政府执行此计划的年度预算 解析 (1)由题得 1 1(0.04 0.08 0.21 0.25 0.06 0.04 0.02) 2m,所以 m 0.15. (2)200 户居民中月均用 电量不低于 6 百千瓦 时的频率为 0.06 0.04 0.020.12,100 万户居民中月均用电量不低于 6 百千瓦 时的户数有 1 000 0000.12 120 000. 设中位数是 x 百千瓦
11、时, 因为前 5 组的频率之和 0.04 0.08 0.15 0.21 0.25 0.730.5,而前 4 组的频率之和 0.04 0.08 0.15 0.21 0.480.5,所以 4x5. 由 x 4 0.5 0.480.25 ,解得 x 4.08. (3)该市月均用电量在 0,1), 1,2), 2,4)内 的用户数分别为 20 0008,20 00016,20 00072 ,所以每月预算为 20 000(820 1610 722) 20 000464( 元 ),故估计政府执行此计划的年度预算为 20 00046412 11 136(万元 ) 二 茎叶图及其应用 由茎叶图可以清晰地看到数
12、据的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示;其缺点是当样本容量较大时,作图较繁琐 【例 2】 某市为了考核甲、乙 两部门的工作情况,随机访问了 50 位市民根据这 50位市民对这两部门的评分 (评分越高表明市民的评价越高 ),绘制茎叶图如下 . 甲部门 乙部门 3 59 4 4 0448 97 5 122456677789 97665332110 6 011234688 98877766555554443332100 7 00113449 6655200 8 123345 632220 9 01
13、1456 10 000 =【 ;精品教育资源文库 】 = (1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对 甲、乙两部门的评分高于 90 的概率; (3)根据茎叶图分析该市的市民对甲、乙两部门的评价 解析 (1)由所给茎叶图知, 50 位市民对甲部门的评分由小到大排序,排在第 25,26 位的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中位数的估计值是 75. 50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样本中位数为66 682 67,所以该市的市民对乙部门评分的中位数的估计值是 67. (2)由所给茎
14、叶图知, 50 位市民对甲、乙部门的评分高于 90 的频率分别为 550 0.1, 850 0.16,故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分别为 0.1,0.16. (3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大 三 样本的数字特征及其应用 平均数和方差都是重要的数字特征,是对总体的一种简明的阐述平均数、中位数、众数描述总体的集中趋 势,方差和标准差描述波动大小 【例 3】 甲、乙两名战士在相同条件下各射靶 10 次,每次命中的环数分别是 甲: 8,6,7,8,6,5,9,10,4,7; 乙: 6,7,7,8,6,7,8,7,9,5. (1)分别计算两组数据的平均数; (2)分别计算两组数据的方差; (3)根据计算结果,估计一下两名战士的射击水平谁更好一些 解析 (1)x 甲 110(8 6 7 8 6 5 9 10 4 7) 7, x 乙 110(6 7 7 8 6 7 8 7 9 5) 7. (2)由方差公