1、2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布【学习目标】1.了解频率分布的意义和作用.2.能正确列频率分布表,画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.1.频数与频率频率60将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数.每组频数除以全体数据的总数,得该组的_.练习 1:将容量为 n 的样本中的数据分成 6 组,绘制频率分布直方图.若第 1 组至第 6 组数据的频率之比为 2 3 4 64 1,且前 3 组数据的频数之和等于 27,则 n_.2.频率分布表当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布,反映总体频率分布的表格称
2、为频率分布表.3.频率分布直方图1在频率分布直方图中,纵轴表示_,数据落在各小组内的频率用小长方形的面积来表示,各小长方形的面积的总和等于_.4.绘制频率分布直方图的一般步骤(1)求极差(极差最大值最小值).(2)决定组距与组数.(3)决定分点,并将数据分组.(5)绘制频率分布直方图.5.频率分布折线图中点连接频率分布直方图中各小长方形上端的_,就得到频率分布折线图.6.总体密度曲线频率分布折线图的优点是它反映了数据的变化趋势,如果将样本容量取得足够大,分组的组距取得足够小,则相应的频率分布折线图将越来越接近于一条光滑曲线 yf(x),统计中称这条光滑曲线为总体密度曲线.7.茎叶图十位数个位数
3、茎叶统计中还常用茎叶图表示数据.茎是数据的高位,叶为数据低位.通常数据为两位整数时,茎为_,叶为_;当数据由整数部分和小数部分组成时,可以把整数部分作为_,小数部分作为_.练习 2:为了了解某校教师使用多媒体进行教学的情况,从该校 200 名授课教师中随机抽取 20 名教师,调查他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图 2-2-1:据此可估计该校上学期 200 名教师中使用多媒体进行教学次数在15,25)内的人数是_.图 2-2-160【问题探究】画频率分布直方图时,需对数据分组,组数、组距和极差有何关系?组数一般如何确定?组数为大于 k 的最小整数.取样容量越大,分的级数越多
4、.当样本容量不超过 100 时,常分为 512 组.题型 1 频率分布的概念【例 1】用样本频率分布估计总体频率分布的过程中,下列说法正确的是()A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确答案:C总体是不变的,样本是随机可变的,体会样本估计总体的思想.【变式与拓展】C1.图 2-2-2 为某试验的总体密度曲线,下列说法正确的是()图 2-2-2A.组距越大,频率分布折线图越接近于它B.样本容量越小,频率分布折线图越接近于它C.阴影部分的面积代表总体在(a,b)上取值的百分比D.阴影部分的高度代表总体在(a,b)上取值的百分比
5、题型 2 用频率分布表、频率分布直方图表示数据【例 2】抽查100 袋洗衣粉,测得它们的重量如下(单位:g):494 498 493 505 496 492 487 483 508 511495 494 483 485 511 493 505 485 501 503493 509 512 484 509 510 495 497 498 509504 498 483 510 503 497 502 511 497 500493 509 510 493 491 497 515 503 515 518510 514 509 499 493 499 509 492 505 489494 501 509
6、 498 502 500 508 491 509 509499 495 493 509 496 509 505 499 486 491492 496 499 508 485 498 496 496 495 505499 505 493 501 510 496 487 511 501 496(1)列出样本频率分布表;(2)画出频率分布直方图.解:(1)在样本数据中,最大值是 518,最小值是 483,极差为 35.组距为 4,分 9 组,分点比数据多一位小数,故把第一组起点稍微小一点,故分组如下:482.5,486.5,486.5,490.5,514.5,518.5.分组频数累计频数频率482.
7、5,486.5)正80.08486.5,490.5)30.03490.5,494.5)正正正170.17494.5,498.5)正正正正200.20498.5,502.5)正正140.14502.5,506.5)正正100.10506.5,510.5)正正正190.19510.5,514.5)正60.06514.5,518.530.03合计1001.00列表如下:(2)频率分布直方图,如图 D13.图 D13【变式与拓展】2.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有 900 名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数
8、,满分为 100 分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频率分布直方图(如图 2-2-3),解答下列问题:(1)填充频率分布表的空格(将答案直接填在表格内);(2)补全频率分布直方图.分组频数频率50.560.540.0860.570.50.1670.580.51080.590.5160.3290.5100.5合计50图 2-2-3解:(1)从左到右、从上到下依次填:8 0.20 12 0.24 1.00(2)图略.题型 3 频率分布直方图、折线图的应用【例 3】某加工厂在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量),共有 100 个数据,其频率分布直方图如图 2-
9、2-4.图 2-2-4(1)画出频率分布折线图;(2)估计纤维产品纤度的平均值;(3)估计数据落在1.38,1.50范围的概率.解:(1)将直方图中每个小矩形上底边中点用线段依次边起即可(图略).(2)平均值约为:1.320.04 1.360.25 1.400.3 1.440.291.480.101.520.021.408 8.(3)落在1.38,1.50)范围的概率约为:(7.57.252.50)0.040.69.用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:纵轴表示;频率分布直方图中各长方形高的比也就是其频率之
10、比;直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于 1,即频率之和为 1.【变式与拓展】3.(2013 年福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:40,50),50,60),60,70),70,80),80,90),90,100,加以统计,得到如图 2-2-5 所示的频率分布直方图,已知高一年级共有学生 600 名,据此估计,该模块测)试成绩不少于 60 分的学生人数为(图 2-2-5A.588 人B.480 人C.450 人D.120 人解析:成绩不少于 60 分的学生的频率为(0.0300.0250.0150.01)10
11、0.8,故不少于 60 分的学生人数为 6000.8480(人).答案:B题型 4 茎叶图【例 4】某良种培育基地正在培育一种小麦新品种 A,将其与原有的一个优良品种 B 进行对照试验,两种小麦各种植了25 亩,所得亩产数据(单位:千克)如下:品种 A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.品种 B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,
12、406,407,410,412,415,416,422,430.(1)用茎叶图表示数据;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种 A 与 B 的亩产量及其稳定性进行比较,写出统计结论.思维突破:由统计知识可求出 A,B 两个品种的小麦稳定性大小并画出茎叶图,用茎叶图处理数据,可直接从图中比较数据的差异.解:(1)茎叶图如图 D14.图 D14(2)用茎叶图处理现有的数据不仅可以看出数据的分布状况,且可以看出每组中的具体数据.(3)通过观察茎叶图,可以发现品种A 的平均亩产量为411.1千克,品种 B 的平均亩产量为397.8 千克.由此可知,品种A 的平均亩产量比
13、品种B 的平均亩产量高.但品种A 的亩产量不够稳定,而品种 B 的亩产量比较集中在平均产量附近.茎叶图能保留原始数据,所有的数据都可以很容易地从图中获得.【变式与拓展】4.(2013 年四川)某学校随机抽取 20 个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图 2-2-6.以组距为 5将数据分组成0,5),5,10),30,35),35,40时,所作的频率分布直方图是()图 2-2-6ACBD分组频数频率0,5)10.050.015,10)10.050.0110,15)40.200.0415,20)20.100.0220,25)40.200.0425,30)30.150.0330,
14、35)30.150.0335,40)20.100.02合计201.000.20解析:根据题意,频率分布表可得:答案为 A.答案:A【例 5】图 2-2-7 是一个容量为 200 的样本频率分布直方图,请根据图形中的数据填空:图 2-2-7(1)样本数据落在范围5,9)的频率为_;(2)样本数据落在范围9,13)的频数为_.答案:(1)0.32 (2)72方法规律小结1.画频率分布直方图的原则.(1)决定组距与组数,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:一般样本容量越大,所分组数越多;为方便起见,组距的选择应力求“取整”;当样本容量不超过 100 时,按
15、照数据的多少,通常分成512 组.(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积的总和等于 1.2.频率分布表和频率分布直方图.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律.我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.3.频率分布折线图与总体密度曲线.(1)频率分布折线图不但可以表示出数量的多少,而且能够以折线的起伏,表示出数量增减的情况.(2)总体密度曲线反映了总体在各个范围内取值的百分比.总体在区间(a,b)内取值的百分比,也就是曲线在区间(a,b)上方所围成的面积.4.茎叶图的特点.(1)在统计图上没有原始信息的损失,所有的信息都可以从这个茎叶图中得到.(2)茎叶图的数据可以随时记录,随时添加,方便记录与表示.