1、2.2.1 用样本的频率分布估计总体分布用样本的频率分布估计总体分布(第二课时)第二课时)2.2用样本估计总体用样本估计总体(2)1.求极差求极差(即一组数据中最大值与最小值即一组数据中最大值与最小值的差的差)编制频率分步表的一般步骤编制频率分步表的一般步骤 复习回顾复习回顾决定组距与组数(组距决定组距与组数(组距=极差极差/组数);组数);2.分组。通常对组内数值所在区间左分组。通常对组内数值所在区间左闭右开区间,最后一组取闭区间;闭右开区间,最后一组取闭区间;3.统计频数,计算频率,列出频率分步表;统计频数,计算频率,列出频率分步表;频率分布表在数量表示上比较确频率分布表在数量表示上比较确
2、切,但不够直观,形象,分析数切,但不够直观,形象,分析数据分布的总体态势不太方便。据分布的总体态势不太方便。频率分步表的特点:频率分步表的特点:把横轴分出若干段,每一段对应一组组把横轴分出若干段,每一段对应一组组距,然后以此线段为底作一矩形,它的高距,然后以此线段为底作一矩形,它的高等于该组的频率等于该组的频率/组距,这样得到了一系列组距,这样得到了一系列的矩形,每个矩形的面积恰好是该组上的的矩形,每个矩形的面积恰好是该组上的频率。这些矩形就构成了频率分布直方图。频率。这些矩形就构成了频率分布直方图。作频率分布直方图的方法作频率分布直方图的方法频率分布直方图的优缺点频率分布直方图的优缺点优点:
3、优点:能够很容易地表示大量数据,能够很容易地表示大量数据,非常直观地表明分布的形状,使我们非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据能够看到在分布表中看不清楚的数据模式。模式。缺点:缺点:从直方图本身得不出原始数据从直方图本身得不出原始数据内容,也就是说,把数据表示成直方内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉图后,原有的具体数据信息就被抹掉了。了。为了直观地反映频数分布的情况,我们也常常采为了直观地反映频数分布的情况,我们也常常采用频数分布折线图。用频数分布折线图。如图,顺次连结图中每个长方形上面一条边的中如图,顺次连结图中每个长方形上面一条边的
4、中点,并且依次分别连结虚设的点,并且依次分别连结虚设的62.567.5和和92.597.5的组中值的组中值65和和95所在的点,就得到所求的频数分布折所在的点,就得到所求的频数分布折线图。线图。6570758085909520名学生每分脉搏跳动次数的频数分名学生每分脉搏跳动次数的频数分布折线图布折线图脉搏(次)脉搏(次)0246891012频数(人)在统计学中,画频在统计学中,画频数分布折线图时,分别取组中值所数分布折线图时,分别取组中值所在的点,并依次相应连在的点,并依次相应连结起来结起来.组频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.3
5、00.400.500.511.5 22.533.544.5连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图线图利用样本频率分布对总体分布进行相应估利用样本频率分布对总体分布进行相应估计计(3)当样本容量无限增大,组距无限缩小,)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑那么频率分布直方图就会无限接近于一条光滑曲线曲线总体密度曲线总体密度曲线。(2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1)上例的样本容量为)上例的样本容量为100,如果增至,如果增至1000,其频率分布直方
6、图的情况会有什么变化?假如增其频率分布直方图的情况会有什么变化?假如增至至10000呢?呢?总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间(a,b)内取值的百分比)。内取值的百分比)。用样本分布直方图去估计相应的总体分布时,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,一般样本容量越大,频率分布直方图频率分布直方图就会无限接就会无限接近近总体密度曲线总体密度曲线,就越精确地反映了总体的分布,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值规律,即越精确地反映了
7、总体在各个范围内取值百分比。百分比。总体密度曲线反映了总体在各个范围内取值的总体密度曲线反映了总体在各个范围内取值的百分比百分比,精确地反映了总体的分布规律。是研究总精确地反映了总体的分布规律。是研究总体分布的工具体分布的工具.总体密度曲线总体密度曲线茎叶图茎叶图某赛季甲、乙两名篮球运动员每场比赛得分某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:的原始记录如下:(1)甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(1)乙运动员得分乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图茎叶图甲甲乙乙01
8、23452 55 41 6 1 6 7 94 9 084 6 33 6 83 8 9 1 叶就是从茎的旁边生长出来的数,表示得分的个位数。茎是指中间的一列数,表示得分的十位数思考:你能通过该图说明哪个运动员的发挥更稳定吗?思考:你能通过该图说明哪个运动员的发挥更稳定吗?画茎叶图的步骤:画茎叶图的步骤:1.将每个数据分为茎(高位)和叶(低位)两部分,在此将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字。例中,茎为十位上的数字,叶为个位上的数字。2.将最小茎和最大茎之间的数按大小次序排成一列,写在将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧。左
9、(右)侧。3.将各个数据的叶按大小次序写在其茎的左(右)侧。将各个数据的叶按大小次序写在其茎的左(右)侧。注意:注意:在样本数据较少时,用茎叶图表示在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长数据很多,枝叶就会很长1、频率分布表:、
10、频率分布表:反映具体数据在各个不同区间的反映具体数据在各个不同区间的取值频率,但不够直观、形象,对分析数据分布的取值频率,但不够直观、形象,对分析数据分布的总体态势不太方便。总体态势不太方便。2、频率分布直方图:、频率分布直方图:能够非常直观的表明数据分布能够非常直观的表明数据分布的形状,一般是中间高、两端低、左右对称的峰状结的形状,一般是中间高、两端低、左右对称的峰状结构。但是从直观图把构。但是从直观图把原有的具体数据信息就被抹掉了原有的具体数据信息就被抹掉了3 3、频率分布折线图:、频率分布折线图:能反映数据的变化趋势。如果能反映数据的变化趋势。如果样本样本容量不断增加,分组组距不断缩小,
11、那么频率分布折线图容量不断增加,分组组距不断缩小,那么频率分布折线图就会无限接近于一条就会无限接近于一条 光滑曲线光滑曲线 总体密度曲线。总体密度曲线。几种表示频率分布的方法的优点及不足?几种表示频率分布的方法的优点及不足?4 4、茎叶图优点:、茎叶图优点:(1 1)保留了原始数据,没有损失样本信息;)保留了原始数据,没有损失样本信息;所有数所有数据信息都可以从茎叶图中得到据信息都可以从茎叶图中得到(2 2)数据可以随时记)数据可以随时记录、添加或修改,录、添加或修改,方便记录与表示方便记录与表示.不足:不足:茎叶图分析只是粗略的,对差异不大的两组数据不易分析。茎叶图分析只是粗略的,对差异不大
12、的两组数据不易分析。几种表示频率分布的方法的优点及不足?几种表示频率分布的方法的优点及不足?P71练习练习3、下面一组数据是某生产车间、下面一组数据是某生产车间30名工人名工人某日加工零件的个数,请设计适当的茎叶图表示某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由这图出发说明一下这个车间此日这组数据,并由这图出发说明一下这个车间此日的生产情况。的生产情况。134 112 117 126 128 124 122 116 113 107116 132 127 128 126 121 120 118 108 110133 130 124 116 117 123 122 120 112 11
13、2变题变题.已知某工厂工人某加已知某工厂工人某加工的零件个数的茎叶图如工的零件个数的茎叶图如右图所示(以零件个数的右图所示(以零件个数的前两位为茎,后一位为前两位为茎,后一位为叶),那么工人生产的零叶),那么工人生产的零件个数超过件个数超过130的比例分别的比例分别是是 ,101112137 80 2 2 2 3 6 6 6 7 7 80 0 1 2 2 3 4 4 6 6 7 8 80 2 3 4101 1、右面是甲、乙两名运动、右面是甲、乙两名运动员某赛季一些场次得分的茎员某赛季一些场次得分的茎叶图,据图可知叶图,据图可知 ()012345甲甲乙乙82 4 71 9 93 625 03 28 7 5 4 2 19 4 41AA A甲运动员的成绩好于甲运动员的成绩好于 乙运动员乙运动员B B乙运动员的成绩好于乙运动员的成绩好于 甲运动员甲运动员C C甲、乙两名运动员的甲、乙两名运动员的 成绩没有明显的差异成绩没有明显的差异D D甲运动员的最低得分甲运动员的最低得分 为为0 0分分