1、中职数学第十章概率统计第六节总体分布估计复习课件一、学习要求1.理解频数、频率、样本频率分布和总体分布等的概念.2.掌握频数、样本容量和频率之间的等量关系.3.掌握数据整理及相关图表的制作方法,会用样本频率分布估计总体分布.学法指导(1)自主或小组合作预习教材上频率分布表的内容.(2)本学时的重点是数据整理及相关图表的制作方法;难点是频率分布表及频率分布直方图的制作.(3)通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.第 一 学 时1.探究问题【探究1】通过抽样方法收集数据的目的是什么?【探究2】要了解某校学生每月零花钱的情况,我们可采用什么
2、样的方法?答案:从中寻找所包含的信息,进而用样本去估计总体。如利用样本的频率分布估计总体的分布.课堂探究答案略.2.知识链接:(1)频数、频率分布表、极差、组距的定义:频数:总体中个体在某区间或某组内的个数;频率:总体中各组个体数占总体个数的百分比;极差:样本中最大值与最小值之差;组距:组间数据跨度.(2)频数、频率分布表及频率分布直方图的制作步骤:第一步:将样本中的数据排序、确定极差;第二步:决定组距(即分成的区间的长度)、确定分组数和分组点,分组数=极差/组距;第三步:确定各组分点,确定各组分点的原则是:既要把全部数据包括在内,又要使每个数据在一个确定的组内,一般取比数据多一位小数,且把第
3、一组起点减小一点;第四步:统计各组中样本数据出现的频数并计算相应的频率,制作频数、频率分布表;第五步:绘制频率分布直方图(建立直角坐标系,以横轴表示数据,纵轴表示频率/组距).3.拓展提高:例 为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁18岁的男生的体重情况,结果如下(单位:kg):答案:第一步(计算极差).求最大值与最小值的差.在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是7655=21(所得的差告诉我们,这组数据的变动范围有多大).第二步(确定组距与组数).如果将组距定为2,那么由212=10.5,组数为11,这个组数适合的.于是组距为2
4、,组数为11.第三步(决定分点).根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是54.5,56.5),56.5,58.5),74.5,76.5).第四步(列频率分布表)第五步(绘制频率分布直方图)频率分布表 频率分布直方图 由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分布表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.4.当堂训练:某老师为了分析一次数学考
5、试情况,从全班抽了50人,将这50人的数学考试成绩分为5组(如下表),答案:(1)a的取值范围69.579.5,b=4,c=2,d=0.2,e=0.22,f=0.46,g=0.04;(2)略.(1)试求出表中a,b,c,d,e,f,g的值或取值范围;(2)画出该样本的频率分布直方图.学法指导(1)自主或小组合作预习教材上总体分布估计的内容.(2)本学时的重点是进一步理解、掌握频率分布表,频率分布直方图的制作方法;难点是能通过样本的频率分布估计总体的分布.(3)通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.第 二
6、学 时课堂探究1.探究问题【探究】确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?为了较为合理地确定出这个标准,需要做哪些工作?答案略.2.知识链接:用样本的频率分布估计总体分布,分两种情况:(1)当总体中的个数取不同数值且很少时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的直方图(建立直角坐标系,以横轴表示数据,纵轴表示频率/组距),例如射击的环数,掷单粒骰子时出现的点数等;(2)当总体中的个体取不同值且较多甚至无限时,此时需要对样本数据进行整理,其频率分布表
7、列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率.画第二种情况频率分布的步骤是:计算最大值与最小值的差;决定组距与组数;决定分点,通常使分点比数据多一位小数且把第一小组的起点稍微减小一点,如减少0.5;列出频率分布表;画出频率分布直方图.频率直方图的性质:各矩形面积的和为1;任取两个组分点ab构成区间a,b),则样本中落在这个区间内的数据个数所占比率正好等于该区间上各矩形面积之和.(3)频率分布将随着样本容量的增大而更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线反映总体分布的概率密度曲线(这里不作研
8、究).正因为频率分布与相应的总体分布的这个关系,通常是从总体中抽取一个样本,用样本的频率分布去估计相应的总体分布.3.拓展提高例1 对某电子元件进行寿命追踪调查,情况如下:(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100400以内的概率;(4)估计电子元件寿命在400以上的概率答案:(1)频率分布表 (2)频率分布直方图(3)频率分布图可以看出,寿命在100h400h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100h400h的概率为0.65.(4)由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.150.35,故我们估计电子元
9、件寿命在400h以上的概率为0.35.例2 下面是某班50名学生汉字输入速度(字/分钟)的记录:69 48 72 54 56 45 57 63 55 6765 44 59 57 76 60 50 65 60 6062 61 66 51 70 67 51 52 42 5857 70 63 61 53 60 46 58 54 5262 68 59 59 74 62 58 61 61 55(1)对以上数据进行整理,列出频率分布表;(2)画出频率分布直方图;(3)对50名学生的汉字输入水平作出估计,在这个班中任抽1人,则他的汉字输入速度最有可能在哪个区间?他的汉字输入速度在5070字每分钟之间的可能性
10、又有多大?答案:(1)第一步(计算极差):数据中最大值为76,最小值为42,极差为76-42=34;第二步(决定组距和组数):极差为34,取组距为5,共分组数为 组;第三步(确定分点):区间边界值确定到小数点后一位,即41.546.5,46.551.5,51.556.5,56.561.5,61.566.5,66.571.5,71.576.5;第四步(列频率分布表):71534(2)画出频率分布直方图(3)从总体上看:输入速度在51.566.5之间的约占66%,有33人,输入速度在56.561.5之间的约占34%,有17人,这部分人是优秀的。因此,在这个班任抽一人,则他的汉字输入速度最可能在56.561.5之间,汉字输入速度在5070之间的可能性约为78%4当堂训练(1)一个容量为100的样本分成若干组,已知某组的频率为0.4,则该组的频数是 .(2)样本数据6,9,15,9,6,13,12,8,7,13,18,20,7,9,13,11,14,11,12,17,落在7.59.5内的频率是 .(3)如图10-11所示是容量为100的样本的频率分布直方图,试根据图形完成以下填空:样本数据落在2,10)内的频率是 ;样本数据落在10,14内的频数是 .36400.2 0.32