1、=【 ;精品教育资源文库 】 = 第 65 讲 用样本估计总体 考纲要求 考情分析 命题趋势 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点 2理解样本数据标准差的意义和作用并会计算 3能从样本数据中提取基本的数字特征(如平均数、标准差 ),并给出合理的解释 4会用样本的频率分布估计总体分布,会用样本数字特征估计总体的数字特征,理解用样本估计总体的思想 . 2016 山东卷, 3 2016 四川卷,16 2015 全国卷 , 18 2015 重庆卷, 3 2015 安徽卷, 6 根据 样本数据求基本的数字特征,利用随机抽样的方法和样本估计总
2、体的思想解决一些简单的实际问题 . 分值: 5 12 分 1频率分布直方图和茎叶图 (1)作频率分布直方图的步骤 求极差 (即一组数据中 _最大值 _与 _最小值 _的差 ); 决定 _组距 _与 _组数 _; 将数据 _分组 _; 列 _频率分布表 _; 画 _频率分布直方图 _ (2)频率分布折线图和总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的 _中点 _,就得到频率分布折线图 总体密度曲线:随着样本 容量的增加,作图时 _所分的组数 _增加, _组距 _减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线 (3)茎叶图的优点 茎叶图的
3、优点是可以 _保留 _原始数据,而且可以 _随时 _记录,这对数据的记录和表示都能带来方便 2样本的数字特征 (1)众数、中位数、平均数 数字特 定义与求法 优点与缺点 =【 ;精品教育资源文库 】 = 征 众数 一组数据中重复出现次数 _最多_的数 众数通常用于描述变量的值出现次数最多的数,但显然它对其他数据信息的忽视使得无法客观地反映总体特征 中位数 把一组数据 按 _从小到大的 _顺序排列,处在 _中间 _位置的一个数据 (或两个数据的平均数 ) 中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点 平均数 如果有 n 个数据
4、 x1, x2, ? , xn,那么这 n 个数的平均数 x _x1 x2 ? xnn _ 平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低 (2)标准差、方差 标准差 :样本数据到平均数的一种平均距离,一般用 s 表示, s _ 1n?x1 x ?2 ?x2 x ?2 ? ?xn x ?2_. 方差:标准差的平方 s2 _1n(x1 x )2 (x2 x )2 ? (xn x )2_, 其中 xi(i 1,2,3, ? , n)是 _样本数据 _, n 是 _样本容量 _, x 是 _样本平均数 _ (3)
5、平均数、方差公式的推广 若数据 x1, x2, ? , xn的平均数为 x ,方差为 s2,则数据 mx1 a, mx2 a, ? , mxn a的平均数为 m x a,方差为 m2s2. 1思维辨析 (在括号内打 “” 或打 “ ”) (1)在频率分布直方图中,小矩形的高表示频率 ( ) (2)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次 ( ) (3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数 ( ) (4)在频 率分布直方图中,众数左边和右边的小长方形的面积和是相等的 ( ) (5)一组数据的方差越大,说明这组数据的波动越大 (
6、) =【 ;精品教育资源文库 】 = 解析 (1)在频率分布直方图中,小矩形的高为频率 /组距 (2)茎叶图中,相同的数据要重复记,故错误 (3)由众数概念知结论正确 (4)在频率分布直方图中,中位数左边和右边的小长方形面积和相等,故错误 (5)由方差定义和结论知正确 2若某校高一年级 8 个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是 ( A ) A 91.5 和 91.5 B 91.5 和 92 C 91 和 91.5 D 92 和 92 解析 将这组数据从小到大排列,得 87,89,90,91,92,93,94,96.故中位数为 91 922 91.5, 平均数为
7、x 87 89 90 91 92 93 94 968 91.5. 3如图是 100 位居民月均用水量的频率分布直方图,则月均用水量为 2,2.5)范围内的居民数有 _25_人 解析 由图可知,在 2,2.5)范围内的居民人数有 1000.5(2.5 2) 25. 4一个容量为 200 的样本的频率分布直方图如图所示,则样本数据落在 5,9)内的频率和频数分别为 _0.2,40_. 解析 由图可知,落在 5,9)内的频率为 0.05(9 5) 0.2,频数为 2000.2 40. 5某赛季甲、乙两名篮球运动员每场比赛得分记录用茎叶图表示,从茎叶图的分布情况看, _乙 _运动员的发挥更稳定 . =
8、【 ;精品教育资源文库 】 = 解析 由茎叶图可知,乙运动员的得分大部分集中在 30 40 之间,而甲运动员的得分相对比较分散且在低分区的较多,故乙比赛得分更稳定 一 频率分布直方图及其应用 (1)已知频率分布直方图中的部分数据,求其他数据可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于 1 就可求出其他数据 (2)已知频率分布直方图,求某种范围内的数据,可利用图形及已知范围结合求解 【例 1】 (2016 四川卷 )我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查通过抽样,获得了某年 100 位居民每人的月均用水量 (单位:吨 ),将数据按照
9、0,0.5), 0.5,1), ? , 4,4.5分成 9 组,制成了如图所示的频率分布直方图 (1)求直方 图中 a 的值; (2)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数,说明理由; (3)估计居民月均用水量的中位数 解析 (1)由频率分布直方图,可知月均用水量在 0,0.5)的频率为 0.080.5 0.04.同理,在 0.5,1), 1.5,2), 2,2.5), 3,3.5), 3.5,4), 4,4.5)组的频率分别为0.08,0.21,0.25, 0.06, 0.04,0.02. 由 1 (0.04 0.08 0.21 0.25 0.06 0.04 0
10、.02) 0.5 a 0.5 a,解得 a0.30. (2)由 (1)知, 100 位居民月均用水量不低于 3 吨的频率为 0.06 0.04 0.02 0.12,由以上样本的频率分布,可以估计 30 万居民中月均用水量不低于 3 吨的人数为 300 0000.12=【 ;精品教育资源文库 】 = 36 000. (3)设中位数为 x 吨 因为前 5 组的频率之和为 0.04 0.08 0.15 0.21 0.25 0.73 0.5,而前 4 组的频率之和为 0.04 0.08 0.15 0.21 0.48 0.5,所以 2 x 2.5.由 0.50( x 2) 0.50.48,解得 x 2.
11、04.故可估计居民月 均用水量的中位数为 2.04 吨 二 茎叶图及其应用 由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示;其缺点是当样本容量较大时,作图较繁琐 【例 2】 在科普知识竞赛前的培训活动中,将甲、乙两名学生的 6 次培训成绩 (百分制 )制成如图所示的茎叶图 . (1)若从甲、乙两名学生中选择 1 人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由; (2)若从学生甲的 6 次培训成绩中随机选择 2 个 ,记选到的分数超过 87 分的个数为 ,求 的分布列
12、和数学期望 解析 (1)学生甲的平均成绩 x 甲 68 76 79 86 88 956 82,学生乙的平均成绩 x乙 71 75 82 84 86 946 82, 又 s2甲 16(68 82)2 (76 82)2 (79 82)2 (86 82)2 (88 82)2 (95 82)277, s2乙 16(71 82)2 (75 82)2 (82 82)2 (84 82)2 (86 82)2 (94 82)2 1673 . 则 x 甲 x 乙 , s2甲 s2乙 , 说明甲、乙的平均水平一样,但乙的方差小,则乙发挥更稳定,故应选择学生乙参加知识竞赛 (2) 的所有可能取值为 0,1,2,则 P
13、( 0) C24C2625, P( 1)C14C12C26 815, P( 2)C22C26115, =【 ;精品教育资源文库 】 = 则 的分布列为 0 1 2 P 错误 ! 错误 ! 错误 ! 所以数学期望 E( ) 0 25 1 815 2 115 23. 三 样本的数字特征及其应用 平均数和方差都是重要的数字特征,是对总体的一种简明的阐述平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小 【例 3】 甲、乙两名战士在相同条件下各射靶 10 次,每次命中的环数分别是 甲: 8,6,7,8,6,5,9,10,4,7; 乙: 6,7,7,8,6,7,8,7,9,5. (1)分别
14、计算两组数据的平均数; (2)分别计算两组数据的方差; (3)根据计算结果,估计一下两名战士的射击水平谁更好一些 解析 (1) x 甲 110(8 6 7 8 6 5 9 10 4 7) 7, x 乙 110(6 7 7 8 6 7 8 7 9 5) 7. (2)由方差公式 s2 1n(x1 x )2 (x2 x )2 ? (xn x )2可求得 s2甲 3.0, s2乙 1.2. (3)由 x 甲 x 乙 ,说明甲、乙两战士的平均水平相当; 又 s2甲 s2乙 ,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定 1下图是样本容量为 200 的频率分布直方图 根据样本的频率分布直方图估计,数据落在 2,10)内的概率约为 _0.4_. 解析 由题组可得 (0.02 0.08)4 0.4. 2某电子商务公司对 10 000 名网络购物者 2017 年度的消费情况进行统计,发现消费=【 ;精品教育资源文库 】 = 金额 (单位:万元 )都在区间 0.3, 0.9内,其频率分布直方图如图所 示 (1)直方图中的 a _3_; (2)在这些购物者中,消费金额在区间 0.5,0.9内的购物者的人数为