1、u第二节 用样本估计总体u主干知识梳理u一、作频率分布直方图的步骤u1求极差(即一组数据中与的差)u2确定 与u3将数据u4列u5画最大值最小值组距组数分组频率分布表频率分布直方图u二、频率分布折线图和总体密度曲线u1频率分布折线图:连接频率分布直方图中各小长方形上端的,就得频率分布折线图u2总体密度曲线:随着的增加,作图时 u 增加,减小,相应的频率折线图会越来越接近于,即总体密度曲线中点样本容量所分的组数组距一条光滑曲线u三、样本的数字特征数字特征定义众数在一组数据中,出现次数 的数据叫做这组数据的众数.中位数将一组数据按大小依次排列,把处在 位置的一个数据(或最中间两个数据的 )叫做这组
2、数据的中位数.在频率分布直方图中,中位数 左 边 和 右 边 的 直 方 图 的 面积 .最多最中间平均数相等u四、茎叶图u茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示u 基础自测自评u1.(教材习题改编)在如图所示的茎叶图表示的数据中,众数和中位数分别是u()uA23与26uB31与26uC24与30uD26与30uB观察茎叶图可知,这组数据的众数是31,中位数是26.u3(2014长春模拟)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图由图中数据可知身高在120,130内的学生人数为u()uuA20 B25uC30 D35uC由题意知a
3、100.350.20.10.051,u则a0.03,故学生人数为0.310030.u5某校甲、乙两个班级各有5名编号为1、2、3、4、5的学生进行投篮练习,每人投10次,投中的次数如下表:学生编号12345甲班67787乙班67679则以上两组数据的方差中较小的值为_u 关键要点点拨u1在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值,而平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和,众数是最高的矩形的中点的横坐标u2注意区分直方图与条形图,条形图中的纵坐标刻度为频数或频率,直方图中的纵坐标刻度为频率/组距u3方差与原始数据的单位
4、不同,且平方后可能夸大了偏差的程度,虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差u典题导入u(2012广东高考)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:50,60),60,70),70,80),80,90),90,100用样本的频率分布估计总体分布 u(1)求图中a的值;u(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;u(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在50,90)之外的人数.u听课记录(1)由频率分布直方图知(2a0.
5、020.030.04)101,解得a0.005.u(2)由频率分布直方图知这100名学生语文成绩的平均分为550.00510650.0410750.0310850.0210950.0051073(分)分数段50,60)60,70)70,80)80,90)xy11213445u 互动探究u在本例条件下估计样本数据的众数u解析众数应为最高矩形的中点对应的横坐标,故约为65.u 跟踪训练u1(2013湖北高考)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示u(1)直方图中x的值为_;u(2)在这些用户中,用电量落在区间100,250)内的户数为_
6、u解析(1)根据频率和为1,得(0.002 40.003 60.006 0 x0.002 40.001 2)501,解得x0.004 4;u(2)(0.003 60.006 00.004 4)5010070.u答案(1)0.004 4(2)70u典题导入u (2012陕西高考)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示)设甲、乙两组数据的平均数分别为x甲、x乙,中位数分别为m甲、m乙,则 u ()茎叶图的应用 u规律方法u由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,
7、没有任何信息损失;第二点是茎叶图便于记录和表示其缺点是当样本容量较大时,作图较繁u 跟踪训练u2如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是_.uu众数是9;平均数是10;中位数是9或10;标准差是3.4.样本的数字特征 u(2)(2013江苏高考)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:u则成绩较为稳定(方差较小)的那位运动员成绩的方差为_运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892u 规律方法u(1)众数体现了样本数据的最大集中点,但无法客观地反映总体特征u(2)中位数是样本数据居中的数u(3)标准差、方差
8、描述了一组数据围绕平均数波动的大小标准差、方差越大,数据越分散,标准差、方差越小,数据越集中u 跟踪训练u3(2012山东高考)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是()uA众数 B平均数uC中位数 D标准差uD对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变u【创新探究】频率分布直方图中的易误点u(2012山东高考)如图是根据部分城市某年6月份的平均气温(单位:)数据得到的样本频率分布直方图,其中平均气温
9、的范围是20.5,26.5,样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5已知样本中平均气温低于22.5的城市个数为11,则 样 本 中 平 均 气 温 不 低 于 2 5.5 的 城 市 个 数 为_u【思路导析】结合频率分布直方图和样本数据的特点求解u【解析】最左边两个矩形面积之和为0.1010.1210.22,总城市数为110.2250,最右边矩形面积为0.1810.18,500.189.u【答案】9u 体验高考u1(2013重庆高考)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中
10、的成绩(单位:分)u已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为u()uA2,5B5,5uC5,8 D8,8uC由于甲组的中位数是15,可得x5,由于乙组数据的平均数为16.8,得y8.u2(2013全国高考)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h)试验的观测结果如下:u服用A药的20位患者日平均增加的睡眠时间:u061.22.71.52.81.82.22.33.2u352.52.61.22.71.52.93.03.1u232.4
11、u服用B药的20位患者日平均增加的睡眠时间:u321.71.90.80.92.41.22.61.3u141.60.51.80.62.11.12.51.2u270.5u(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?u(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?u(2)由观测结果可绘制茎叶图如图:u3(2013安徽高考)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图所示:u(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);u(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x1、x2,估计x1x2的值课时作业课时作业