1、第二节用样本估计总体点 击 考 纲1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点2.理解样本数据标准差的意义和作用,会计算数据标准差3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.关 注 热 点 1.本节是用样本估计总体,是统计学的基础以考查频率分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估计总体的思想的理解2.本节在高考题中
2、主要是以选择题和填空题为主,属于中低档题目3.新课标地区(如广东、宁夏、海南等省份)也常以频率分布直方图为工具结合现实生活出一道应用大题,属于中档题目.1作频率分布直方图的步骤2频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的 ,就得频率分布折线图(2)总体密度曲线:随着的增加,作图时增加,减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线中点样本容量所分组数组距3样本的数字特征如何利用频率分布直方图估计样本的数字特征?提示:(1)在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值(2)平均数的估计值等于频率分布直
3、方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标110名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()Aabc BbcaCcab Dcba答案:D 2商场在国庆黄金周的促销活动中,对10月2日9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为()A6万元 B8万元C10万元 D12万元答案:C3一个容量为20的样本数据,分组后,组别与频数如下:则样本在(20,50上的
4、频率为()A12%B40%C60%D70%组别(10,20(20,30(30,40(40,50(50,60(60,70频数234542答案:C4某个容量为100的样本的频率分布直方图如下,则在区间4,5)上的数据的频数为_解析:对于在区间4,5)的频率的数值为1(0.40.150.10.05)0.3,而样本容量为100,因此频数为30.答案:305已知一组数据按从小到大的顺序排列,得到1,0,4,x,7,14,中位数为5,则这组数据的平均数和方差分别为_、_.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比
5、为2 4 17 15 9 3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由【解析】(1)由已知可设各组的频率依次为2x,4x,17x,15x,9x,3x.则2x4x17x15x9x3x1,解得x0.02.则第二小组的频率为0.0240.08,样本容量为120.08150.(2)次数在110次以上(含110次)的频率和为170.02150.0290.0230.020.340.30.180.060.88.则高一学生的达标率约为0
6、.88100%88%.(3)在这次测试中,学生跳绳次数的中位数落在第四小组因为中位数为平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标【方法探究】(1)频率分布直方图中纵轴表示频率与组距的比,各小长方形的面积表示相应的频率,其和为1.(2)众数是样本中出现次数最多的数(3)中位数是样本中各数据按大小排序,处在中间位置的一个数(或最中间两个数据的平均数)1在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如下表:分组频数1.30,1.34)41.34,1.38)251.38,1.42)301.42,1.46)291.46,1.50)101.50,1.
7、542合计100(1)列出频率分布表,并画出频率分布直方图(2)估计纤度落在1.38,1.50)中的概率及纤度小于1.40的概率是多少解析:(1)频率分布表见下表,频率分布直方图如图所示.分组频数频率1.30,1.34)40.041.34,1.38)250.251.38,1.42)300.301.42,1.46)290.291.46,1.50)100.101.50,1.5420.02合计1001.00美国NBA篮球赛中甲、乙两篮球运动员上赛季某些场次比赛的得分如下:甲:12,15,24,25,31,31,36,36,37,39,44,49,50.乙:8,13,14,16,21,23,24,26
8、,28,33,38,39,51.(1)画出两组数据的茎叶图;(2)试比较这两位运动员的得分水平【思路导引】(1)样本中有一位数,有两位数,把一位数的十位数字看为0;(2)将十位数字作为茎,个位数字作为叶,逐一统计;(3)根据茎叶图分析两组数据,得到结论【解析】(1)为便于对比分析,可将茎放在中间共用,叶分列左、右两则如图(2)从这个茎叶图可以看出,甲运动员的得分大致对称,平均得分及中位数都是30多分乙运动员的得分除一个51分外,也大致对称,平均得分及中位数都是20多分因此甲运动员发挥比较稳定,总体得分情况比乙好【方法探究】当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而
9、且可以随时记录,这对数据的记录和表示都非常方便,但当样本数据较多时,茎叶图就显得不太方便了因为数据较多时,枝叶就会很长,需要占据较多的空间提醒:当样本数据是两位有效数字,且样本容量又不很大时,用茎叶图显得更容易、方便、直观2在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子中所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据
10、用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?解析:(1)茎叶图如图所示:(2)电脑杂志上每个句子的字数集中在1030之间,中位数为22.5;而报纸上每个句子的字数集中在1040之间,中位数为27.5.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少说明电脑杂志作为读物通俗易懂、简明清晰.甲乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价(2)由s甲2s乙2可知乙的成绩较稳定从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成
11、绩则无明显提高3甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计一下两名战士的射击情况xi甲xi甲71101122330 xi甲2(xi甲7)21101144990 xi乙xi乙71001101022xi乙2(xi乙7)21001101044(3)甲、乙两名战士射靶10次的平均数相等,说明甲、乙两名战士平均水平相当由s甲2s乙2,说明乙战士比甲战士稳定,波动小(理)(2010辽宁高考,12分)为了比较注
12、射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.(1)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率(2)下表1和表2分别是注射药物A和B后的试验结果(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积60,65)65,70)70,75)75,80)频数30402010表2:注射药物B后皮肤疱疹面积的频数分布表疱疹面积60,65)65,70)70,75)75,80)80,85)频数1025203015()完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小
13、;图注射药物A后皮肤疱疹面积的频率分布直方图图注射药物B后皮肤疱疹面积的频率分布直方图()完成下面22列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”表3:疱疹面积小于70 mm2疱疹面积不小于70 mm2合计注射药物Aab注射药物Bcd合计n图注射药物A后皮肤疱疹面积的频率分布直方图图注射药物B后皮肤疱疹面积的频率分布直方图 可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数(8分)()表3:疱疹面积小于70 mm2疱疹面积不
14、小于70 mm2合计注射药物Aa70b30100注射药物Bc35d65100合计10595n200(文)(2010安徽高考,13分)某市2010年4月1日4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在050之间时,空气质量为优;在51100之间时,为良;在101150之间时,为轻微污染;在151200之间时,为轻度
15、污染请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价【解析】(1)频率分布表:(4分)(2)频率分布直方图:(8分)【考向分析】从近两年的高考试题来看,频率分布直方图、茎叶图、平均数、方差是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率、平均数等知识结合在一起,考查学生应用知识解决问题的能力预测2012年高考,频率分布直方图、茎叶图、平均数、方差仍然是考查的热点,同时应注意和概率、平均数等知识的结合1对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是()A频率分布折线图与总体密度曲线无关B频率分布折线图就是总体密
16、度曲线C样本容量很大的频率分布折线图就是总体密度曲线D如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线解析:由总体密度曲线的形成可知选D.答案:D2某人5次上班途中所花的时间(单位:分钟)分别为x、y、10、11、9.已知这组数据的平均数为10,方差为2,则|xy|的值为()A1B2C3 D4答案:D 3(2009山东高考)某工厂对一批产品进行了抽样检测下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是96,106,样本数据分组为96,98),98,100),100,102),102,104),104,106,已知样本
17、中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A90 B75C60 D45答案:A 4(2010安徽高考)某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是_答案:5.7%5已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是_答案:10.5,10.5