1、=【 ;精品教育资源文库 】 = 9 2 用样本估计总体 知识梳理 1用样本的频率分布估计总体分布 (1)频率分布:样本中所有数据 (或者数据组 )的频数和样本容量的比,就是该数据的 频率 ,所有数据 (或者数据组 )的频率的分布变化规律叫做 频率分布 (2)作频率分布直方图的步骤: 求极差,即一组数据中的 最大值 与 最小值 的差; 决定 组距与组数 ; 将 数据分组 ; 列 频率分布表 ; 画频率分布直方图 在频率分布直方图中,纵轴表示 频率 /组距 ,数据落在各小组内的频率用 各小长方形的面积 表示,各小长方形的面积总和等于 1. (3)频率分布折线图和总体 密度曲线 频率分布折线图:连
2、接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图 总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线 (4) 茎叶图:统计中还有一种被用来表示数据的图叫茎叶图,茎是指中间一列数,叶是从茎的旁边生长出来的数 当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便 茎叶图的画法步骤 第一步:将每个数据分为茎 (高位 )和叶 (低位 )两部分; 第二步:将最小茎与最大茎之间的数按大小次序排成一列,写在左 (右 )侧;有两组数据时,写在中
3、间; 第三步:将各个数据的叶依次写在其茎的右 (左 )侧 2样本的数字特征 (1)众数、中位数、平均数 =【 ;精品教育资源文库 】 = (2)方差和标准差 方差和标准差反映了数据波动程度的大小 方差: s2 1n(x1 x)2 (x2 x)2 ? (xn x)2, 标准差: s 1n?x1 x?2 ?x2 x?2 ? ?xn x?2. (3)关于平均数、方差的有关性质 若 x1, x2, ? , xn的平均数为 x,那么 mx1 a, mx2 a, ? , mxn a 的平均数为 mxa. 数据 x1, x2, ? , xn与数据 x1 x1 a, x2 x2 a, ? , xn xn a
4、的方差相等,=【 ;精品教育资源文库 】 = 即数据经过平 移后方差不变 若 x1, x2, ? , xn的方差为 s2,那么 ax1 b, ax2 b, ? , axn b 的方差为 a2s2. (4)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越波动;标准差,方差越小,数据的离散程度越小,越稳定 3各种统计表的优点与不足 诊断自测 1概念思辨 (1)一组数据的方差越大,说明这组数据的波动越大 ( ) (2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了 ( ) (3)在频率分布
5、直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越高 ( ) (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次 ( ) 答案 (1) (2) (3) (4) =【 ;精品教育资源文库 】 = 2教材衍化 (1)(必修 A3P70例题 )若某校高一年级 8 个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是 ( ) A 91.5 和 91.5 B 91.5 和 92 C 91 和 91.5 D 92 和 92 答案 A 解析 这组数据由小到 大排列为 87,89,90,91,92,93,94,96, 中位数是 91 92
6、2 91.5, 平均数 x 87 89 90 91 92 93 94 968 91.5.故选 A. (2)(必修 A3P82T7)甲、乙两人在一次射击比赛中各射靶 5 次,两人成绩的条形统计图如图所示,则 ( ) A甲的成绩的平均数小于乙的成绩的平均数 B甲的成绩的中位数等于乙的成绩的中位数 C甲的成绩的方差小于乙的成绩的方差 D甲的成绩的极差小于乙 的成绩的极差 答案 C 解析 由图可得, x甲 4 5 6 7 85 6, x乙 35 6 95 6,故 A 错误;甲的成绩的中位数为 6,乙的成绩的中位数为 5,故 B 错误; s2甲 2, s2乙 2.4,故 C 正确;甲的成绩的极差为 4,
7、乙的成绩的极差也为 4, D 错误故选 C. 3小题热身 =【 ;精品教育资源文库 】 = (1)右面茎叶图记录了甲、乙两组各五名学生在一次英语听力测试 中的成绩 (单位:分 ) 已知甲组数据的中位数为 15,乙组数据的平均数为 16.8,则 x, y 的值分别为 ( ) A 2,5 B 5,5 C 5,8 D 8,8 答案 C 解析 由茎叶图及已知得 x 5,又乙组数据的平均数为 16.8,即 9 15 10 y 18 245 16.8,解得 y 8,故选 C. (2)(2018 济南调研 )为了研究某药品的疗效,选取若干名志愿者进行临床试验所有志愿者的舒张压数据 (单位: kPa)的分组区
8、间为 12,13), 13,14), 14,15), 15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组, ? ,第五组,上图是根据试验数据制成的频率分布直方图已知第一组与第二组共有 20 人,第三组中没有疗效的有 6人,则第三组中有疗效的人数为 _ 答案 12 解析 全体志愿者共有: 20?0.24 0.16?1 50(人 ), 所以第三组有志愿者: 0.36150 18(人 ) 第三组中没有疗效的有 6 人, 有疗效的有 18 6 12(人 ) 题型 1 样本数字特征的计算及应用 =【 ;精品教育资源文库 】 = 典例 某企业有甲、乙两个研发小组,为了比较他们的研发水平
9、,现随机抽取这两个小组往年研发新产品的结果如下: (a, b), (a, b), (a, b), (a, b), (a, b), (a, b), (a, b), (a, b), (a, b),(a, b), (a, b), (a, b), (a, b), (a, b), (a, b), 其中 a, a分别表示甲组研发成功和失败; b, b分别表示乙组研发成功和失败 (1)若某组成功研发一种新产品,则给该组记 1 分,否则记 0 分试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙 两组的研发水平; (2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率 (1)直
10、接用公式求解; (2)按古典概型求解 解 (1)甲组研发新产品的成绩为 1,1,1,0,0,1,1,1,0,1,0,1,1,0,1. 其平均数为 x甲 101523; 方差为 s2甲 115? ? ?1 23 210 ? ?0 23 25 29. 乙组研发新产品的成绩为 1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数为 x乙 91535; 方差为 s2乙 115? ? ?1 35 29 ? ?0 35 26 625. 因为 x甲 x乙 , s2甲 y,因此可看出 A 药的疗效更好 (2)由 观测结果可绘制如下茎叶图: 从以上茎叶图可以看出, A 药疗效的试验结果有 710
11、的叶集中在茎 2,3 上,而 B 药疗效的=【 ;精品教育资源文库 】 = 试验结果有 710的叶集中在茎 0,1 上,由此可看出 A 药的疗效更好 . 题型 3 频率分布直方图 角度 1 求频率或频数 典例 (2016 山东高考 )某高校调查了 200 名学生每周的自习时间 (单位:小时 ),制成了如图所示的频率分布直方图,其中自习时间的范围是 17.5,30,样本数据分组为17.5,20), 20,22.5), 22.5,25), 25,27.5), 27.5,30根据直方图,这 200 名学生中每周的自习时间不少于 22.5 小时的人数是 ( ) A 56 B 60 C 120 D 14
12、0 首先求 22.5 30 范围上的频率,即求第三、四、五直方图的面积,再求人数 答案 D 解析 由频率分布直方图知这 200 名学生每周的自习时间不少于 22.5 小时的频率为 1 (0.02 0.10)2.5 0.7,则这 200 名学生中每周的自习时间不少于 22.5 小时的人数为2000.7 140,故选 D. 角度 2 利用频率分布直方图估计总体 典例 (2016 四川高考 )我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查通过抽样,获得了某年 100 位居民每人的月均用水量 (单位:吨 ),将数据按照 0,0.5), 0.5,1), ? , 4,4.5分成 9 组,制成了如图所示的频率分布直方图