1、,算法初步、统计、统计案例,第 十 章,第65讲用样本估计总体,栏目导航,1频率分布直方图和茎叶图(1)作频率分布直方图的步骤求极差(即一组数据中_与_的差);决定_与_;将数据_;列_;画_,最大值,最小值,组距,组数,分组,频率分布表,频率分布直方图,(2)频率分布折线图和总体密度曲线频率分布折线图:连接频率分布直方图中各小长方形上端的_,就得到频率分布折线图总体密度曲线:随着样本容量的增加,作图时_增加,_减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线(3)茎叶图的优点茎叶图的优点是可以_原始数据,而且可以_记录,这对数据的记录和表示都能带来方便,中
2、点,所分的组数,组距,保留,随时,2样本的数字特征(1)众数、中位数、平均数,最多,从小到大的,中间,样本数据,样本容量,样本平均数,1思维辨析(在括号内打“”或打“”)(1)在频率分布直方图中,小矩形的高表示频率()(2)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次()(3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数()(4)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的()(5)一组数据的方差越大,说明这组数据的波动越大(),解析 (1)在频率分布直方图中,小矩形的高为频率/组距(2)茎叶图中,相同的数据要重复记,故错
3、误(3)由众数概念知结论正确(4)在频率分布直方图中,中位数左边和右边的小长方形面积和相等,故错误(5)由方差定义和结论知正确,2若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是 ()A91.5和91.5B91.5和92C91和91.5D92和92,A,3如图是100位居民月均用水量的频率分布直方图,则月均用水量为2,2.5)范围内的居民数有_人解析 由图可知,在2,2.5)范围内的居民人数有1000.5(2.52)25.,25,4一个容量为200的样本的频率分布直方图如图所示,则样本数据落在5,9)内的频率和频数分别为_.解析 由图可知,落在5,9)内的频
4、率为0.05(95)0.2,频数为2000.240.,0.2,40,5某赛季甲、乙两名篮球运动员每场比赛得分记录用茎叶图表示,从茎叶图的分布情况看,_运动员的发挥更稳定.解析 由茎叶图可知,乙运动员的得分大部分集中在3040之间,而甲运动员的得分相对比较分散且在低分区的较多,故乙比赛得分更稳定,乙,(1)已知频率分布直方图中的部分数据,求其他数据可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据(2)已知频率分布直方图,求某种范围内的数据,可利用图形及已知范围结合求解,一频率分布直方图及其应用,【例1】 (2016四川卷)我国是世界上严重缺水的国家,某市为了制定
5、合理的节水方案,对居民用水情况进行了调查通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图,(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数,解析 (1)由频率分布直方图,可知月均用水量在0,0.5)的频率为0.080.50.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5)组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1(0.040.
6、080.210.250.060.040.02)0.5a0.5a,解得a0.30.(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.060.040.020.12,由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 0000.1236 000.,(3)设中位数为x吨因为前5组的频率之和为0.040.080.150.210.250.730.5,而前4组的频率之和为0.040.080.150.210.480.5,所以2x2.5.由0.50(x2)0.50.48,解得x2.04.故可估计居民月均用水量的中位数为2.04吨,二茎叶图及其应用,由茎叶图可以清晰地看到数据
7、的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示;其缺点是当样本容量较大时,作图较繁琐,【例2】 在科普知识竞赛前的培训活动中,将甲、乙两名学生的6次培训成绩(百分制)制成如图所示的茎叶图.(1)若从甲、乙两名学生中选择1人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由;(2)若从学生甲的6次培训成绩中随机选择2个,记选到的分数超过87分的个数为,求的分布列和数学期望,三样本的数字特征及其应用,平均数和方差都是重要的数字特征,是对总体的一种简明的阐述平均数、中位数、众数描述总体的集中趋势,方差和
8、标准差描述波动大小,【例3】 甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算两组数据的平均数;(2)分别计算两组数据的方差;(3)根据计算结果,估计一下两名战士的射击水平谁更好一些,1下图是样本容量为200的频率分布直方图根据样本的频率分布直方图估计,数据落在2,10)内的概率约为_.解析 由题组可得(0.020.08)40.4.,0.4,2某电子商务公司对10 000名网络购物者2017年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直
9、方图如图所示,(1)直方图中的a_;(2)在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为_.解析 由频率分布直方图及频率和等于1可得(0.20.81.522.5a)0.11,解得a3.于是消费金额在区间0.5,0.9内的频率为(320.80.2)0.10.6,所以消费金额在区间0.5,0.9内的购物者的人数为0.610 0006 000.,3,6 000,3(1)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图考虑以下结论:,甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地
10、该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差其中根据茎叶图能得到的统计结论的编号为()ABCD,B,(2)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为_(从小到大排列),1,1,3,3,4某中学举行了一次“环保知识竞赛”活动,为了了解本次竞赛学生成绩情况,从中抽取了部分学生的分数(得分取正整数,满分为100分)作为样本(样本容量为n)进行统计按照50,60),60,70),70,80),80,90),90,100的分组作出频率分布直方图,并作
11、出样本分数的茎叶图(图中仅列出了得分在50,60),90,100的数据),(1)求样本容量n和频率分布直方图中x,y的值;(2)在选取的样本中,从竞赛成绩是80分以上(含80分)的同学中随机抽取3名同学到市政广场参加环保知识宣传的志愿者活动,设表示所抽取的3名同学中得分在80,90)的学生个数,求的分布列及其数学期望,错因分析:不会计算中位数;对平均数、中位数、众数等数字特征的实际意义理解不透,易错点不清楚统计中数字特征的实际意义,【例1】 从高三年级中抽出50名学生参加竞赛,由成绩得到如下的频率分布直方图利用频率分布直方图估计:(1)这50名学生的众数P与中位数M;(2)这50名学生的平均成
12、绩A;(3)这50名学生60分以上所占的百分比是多少?,(2)这50名学生的平均成绩是(450.004550.006650.02750.03850.024950.016)1076.2.(3)这50名学生中60分以上的百分比是1(0.0040.006)100.990%.,【跟踪训练1】 (2016北京卷)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图,(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替当w3时,估计该市居民该月的人均水费解析 (1)由用水量的频率分布直方图知,该市居民该月用水量在区间0.5,1,(1,1.5,(1.5,2,(2,2.5,(2.5,3内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.,