1、,算法初步、统计、统计案例,第 十 章,第55讲用样本估计总体,栏目导航,1频率分布直方图和茎叶图(1)作频率分布直方图的步骤求极差(即一组数据中_与_的差);决定_与_;将数据_;列_;画_.,最大值,最小值,组距,组数,分组,频率分布表,频率分布直方图,(2)频率分布折线图和总体密度曲线频率分布折线图:连接频率分布直方图中各小长方形上端的_,就得到频率分布折线图总体密度曲线:随着样本容量的增加,作图时_增加,_减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线(3)茎叶图的优点茎叶图的优点是可以_原始数据,而且可以_记录,这对数据的记录和表示都能带来方便,
2、中点,所分的组数,组距,保留,随时,2样本的数字特征(1)众数、中位数、平均数,最多,从小到大的,中间,(2)标准差、方差标准差:样本数据到平均数的一种平均距离,一般用s表示,s_.方差:标准差的平方s2_,,样本数据,样本容量,样本平均数,1思维辨析(在括号内打“”或“”)(1)在频率分布直方图中,小矩形的高表示频率()(2)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次()(3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数()(4)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的()(5)一组数据的方差越大,说明这组数据的波
3、动越大(),解析(1)错误在频率分布直方图中,小矩形的高为频率/组距(2)错误茎叶图中,相同的数据要重复记,故错误(3)正确由众数概念知结论正确(4)错误在频率分布直方图中,中位数左边和右边的小长方形面积和相等,故错误(5)正确由方差定义知结论正确,2若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是 ()A91.5和91.5B91.5和92C91和91.5D92和92,A,3如图是100位居民月均用水量的频率分布直方图,则月均用水量为2,2.5)范围内的居民数有_人解析由图可知,在2,2.5)范围内的居民人数有1000.5(2.52)25.,25,4一个容量
4、为200的样本的频率分布直方图如图所示,则样本数据落在5,9)内的频率和频数分别为_.解析由图可知,落在5,9)内的频率为0.05(95)0.2,频数为2000.240.,0.2,40,5某赛季甲、乙两名篮球运动员每场比赛得分记录用茎叶图表示,从茎叶图的分布情况看,_运动员的发挥更稳定.解析由茎叶图可知,乙运动员的得分大部分集中在3040之间,而甲运动员的得分相对比较分散且在低分区的较多,故乙比赛得分更稳定,乙,(1)已知频率分布直方图中的部分数据,求其他数据可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据(2)已知频率分布直方图,求某种范围内的数据,可利用图
5、形及已知范围结合求解,一频率分布直方图及其应用,【例1】 (2018河北衡水一中测试)某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年200户居民每户的月均用电量(单位:百千瓦时),将数据按0,1),1,2),2,3),3,4),4,5),5,6),6,7),7,8),8,9分成9组,制成了如图所示的频率分布直方图,(1)求直方图中m的值;(2)设该市有100万户居民,估计全市每户居民中月均用电量不低于6百千瓦时的户数及每户居民月均用电量的中位数;(3)政府计划对月均用电量在4百千瓦时以下的用户进行奖励,月均用电量在0,1)内的用户奖励20元/月,月均用电量在1,2)
6、内的用户奖励10元/月,月均用电量在2,4)内的用户奖励2元/月若该市共有400万户居民,试估计政府执行此计划的年度预算,(3)该市月均用电量在0,1),1,2),2,4)内的用户数分别为20 0008,20 00016,20 00072,所以每月预算为20 000(8201610722)20 000464(元),故估计政府执行此计划的年度预算为20 0004641211 136(万元),二茎叶图及其应用,由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示;其缺点是当样本容量较大
7、时,作图较繁琐,【例2】 某市为了考核甲、乙两部门的工作情况,随机访问了50位市民根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下.,(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价,三样本的数字特征及其应用,平均数和方差都是重要的数字特征,是对总体的一种简明的阐述平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小,【例3】 甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是甲:8,6,7,8,6,5,9,10,4,7;乙:6,
8、7,7,8,6,7,8,7,9,5.(1)分别计算两组数据的平均数;(2)分别计算两组数据的方差;(3)根据计算结果,估计一下两名战士的射击水平谁更好一些,1以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A2,5B5,5C5,8D8,8,C,2某电子商务公司对10 000名网络购物者2017年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9,其频率分布直方图如图所示(1)直方图中的a_;(2)在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为_.,3,6
9、 000,解析由频率分布直方图及频率和等于1可得(0.20.81.522.5a)0.11,解得a3.于是消费金额在区间0.5,0.9内的频率为(320.80.2)0.10.6,所以消费金额在区间0.5,0.9内的购物者的人数为0.610 0006 000,故应填3,6 000.,B,(2)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为_ (从小到大排列),1,1,3,3,4(2017北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:20,30),
10、30,40),80,90,并整理得到如下频率分布直方图,(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等试估计总体中男生和女生人数的比例解析(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.020.04)100.6,所以样本中分数小于70的概率为10.60.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.,错因分析:不会计算中位数;对平均数、中位数、众数等数字特征的实际意义理解不透,易错点不清楚统计中数字特征的实际意义,【例1】 从高三年级中抽出50名学生参加竞赛,由成绩得到如下的频率分布直方图利用频率分布直方图估计:(1)这50名学生的众数P与中位数M;(2)这50名学生的平均成绩A;(3)这50名学生60分以上所占的百分比是多少?,B,D,B,