1、频数直方图 为了了解居民的消费水平为了了解居民的消费水平,调查组在某社区随机调查调查组在某社区随机调查 某宿舍某宿舍30户家庭户家庭6月份饮食消费的情况,数据如下表所示:月份饮食消费的情况,数据如下表所示:家庭编号家庭编号123456789101112131415消费金额消费金额804844956830780820900830820784820804824740824家庭编号家庭编号161718192021222324252627282930消费金额消费金额812788872758876776796828844766836764838730826如何更直观地了解这如何更直观地了解这30户家庭户
2、家庭6月份饮食消费的分布情况呢?月份饮食消费的分布情况呢?家庭编号家庭编号123456789101112131415消费金额消费金额804844956830780820900830820784820804824740824家庭编号家庭编号161718192021222324252627282930消费金额消费金额812788872758876776796828844766836764838730826动脑筋动脑筋 由于上述数据较多,且分布比较零散,我们需由于上述数据较多,且分布比较零散,我们需要把这些数据进行必要的归纳和整理,先进行适当要把这些数据进行必要的归纳和整理,先进行适当分组,并借助表
3、格将各组的频数进行统计整理,以分组,并借助表格将各组的频数进行统计整理,以便分析这组数据的分布规律便分析这组数据的分布规律.由表中可以看出,由表中可以看出,29号家庭月饮食消费最低,号家庭月饮食消费最低,3号家庭月饮食消费最高,号家庭月饮食消费最高,故故m=730,M=956.确定确定最小值最小值m和最大值和最大值M.(1)分组)分组.家庭编号家庭编号123456789101112131415消费金额消费金额804844956830780820900830820784820804824740824家庭编号家庭编号161718192021222324252627282930消费金额消费金额812
4、788872758876776796828844766836764838730826确定确定组距和组数组距和组数.把所有数据分成若干组,每个小组的两个端点数据把所有数据分成若干组,每个小组的两个端点数据之间的距离称为之间的距离称为组距组距.根据问题的需要,各组的组距可以相同也可以彼此根据问题的需要,各组的组距可以相同也可以彼此不同不同.本问题中,我们作等距分组本问题中,我们作等距分组.为了分组的方便,我们取略小于为了分组的方便,我们取略小于m 的数作为第一组的数作为第一组 的下限,例如取的下限,例如取720;而取略大于;而取略大于M的数作为最后一组的的数作为最后一组的 上限,例如取上限,例如取
5、960.然后将然后将720 到到960 分成若干组,假定每分成若干组,假定每 40元为一组(即取组距为元为一组(即取组距为40元),则可分为元),则可分为(960-720)40=6(组)(组).所分所分6组为组为720 x 760,760 x 800,800 x 840,840 x 880,880 x 920,920 x 960.组距和组数的确定没有组距和组数的确定没有固定的标准,可根据所研究固定的标准,可根据所研究的具体问题来确定的具体问题来确定.当数据当数据在在100 个以内时,可依数据个以内时,可依数据个数的多少,分成个数的多少,分成512 组组.(2)列频数分布表列频数分布表.统计属于
6、每组中的数据的个数(频数),为避免数据统计属于每组中的数据的个数(频数),为避免数据的重复和遗漏,的重复和遗漏,我们仍采用我们仍采用“画记画记”的方法,得到下面的的方法,得到下面的频数分布表频数分布表.调查对象调查对象6月份饮食消费支出频数分布表月份饮食消费支出频数分布表分分 组组画画 记记频频 数数720 x 7603760 x 800正正7800 x 84014840 x 8804880 x 9201920 x 9601正正正正分分 组组画画 记记频频 数数720 x 7603760 x 800正正7800 x 84014840 x 8804880 x 9201920 x 9601正正正正
7、(3)绘制频数直方图绘制频数直方图.为了更直观地反映一组数据的分布情况,可以为了更直观地反映一组数据的分布情况,可以以频数分布表为基础,绘制以频数分布表为基础,绘制频数直方图频数直方图(简称直方图)(简称直方图).在直角坐标系中,以组距为宽,频数为高作小矩形,在直角坐标系中,以组距为宽,频数为高作小矩形,就可以得到下面的直方图就可以得到下面的直方图(如图)(如图):在绘制频数直方图时,应注意:在绘制频数直方图时,应注意:1.横轴和纵轴加上适当的刻度,横轴和纵轴加上适当的刻度,标明各轴所代表的名称和单位标明各轴所代表的名称和单位.2.各个小矩形之间无空隙各个小矩形之间无空隙.3.小矩形的边界对应
8、于各组的组界小矩形的边界对应于各组的组界.根据根据图,图,你能从频数直方图中获得哪些信息?你能从频数直方图中获得哪些信息?(1)这)这30户家庭的饮食消费月支出集中在哪一组?户家庭的饮食消费月支出集中在哪一组?(2)是支出较高(超过)是支出较高(超过880 元)元)的家庭多,的家庭多,还是支出还是支出 较低(月支出不足较低(月支出不足800元)的家庭多?元)的家庭多?(3)请对这)请对这30户家庭的月饮食消费的整体水平作出评价户家庭的月饮食消费的整体水平作出评价.议一议议一议 我能看出在各个范围内分我能看出在各个范围内分布的数据的个数(频数)布的数据的个数(频数).我还能看出这我还能看出这30
9、 户家庭的月户家庭的月饮食消费水平集中在哪一组饮食消费水平集中在哪一组.把把图中图中的频数直方图的纵轴改成的频数直方图的纵轴改成“”,重新计算后得重新计算后得图,图,此时,小长方形的面积表示什么?此时,小长方形的面积表示什么?频频数数组组距距动脑筋动脑筋小长方形的面积小长方形的面积=组距组距=频数频数.频频数数组组距距 例例 为了为了了解某中学八年级两个班男生的身体发育情况,了解某中学八年级两个班男生的身体发育情况,对对40 名男生的身高(单位:名男生的身高(单位:cm)进行了测量,结果如下:)进行了测量,结果如下:(1)制作样本的频数分布表,绘制频数直方图)制作样本的频数分布表,绘制频数直方
10、图.(2)根据频数直方图分析,身高在哪个范围的人数最多?)根据频数直方图分析,身高在哪个范围的人数最多?有有多少人?多少人?40名男生的平均身高在这个范围内吗?名男生的平均身高在这个范围内吗?175 168 170 176 167 181 162 173 171 177179 172 165 167 172 173 166 177 169 181160 163 166 177 175 174 173 174 171 171180 170 165 175 165 174 169 163 166 166举例举例 列频数分布表如下:列频数分布表如下:(1)在样本数据中,最大值是)在样本数据中,最大值
11、是181,最小值是,最小值是160,它们它们的差是的差是21.取组距为取组距为5 cm,则,则 =4.2,可分为可分为5 组,即组,即160 x165,165 x170,170 x175,175x180,180 x185.215分分 组组画画 记记频频 数数160 x1654165 x17012170 x17513175x1808180 x1853正正正正正正正正正正根据上表绘制频数直方图,根据上表绘制频数直方图,如如图图.从频数直方图中可以看出,身高在从频数直方图中可以看出,身高在170 x175 范围内的人数最多,有范围内的人数最多,有13人人.通过计算可知这通过计算可知这40名名男生的平
12、均身高是男生的平均身高是171cm,在,在170 x175 的范围内的范围内.(2)在对数据的频数分布在对数据的频数分布进行分析时,要善于利用进行分析时,要善于利用频数直方图解释数据中蕴频数直方图解释数据中蕴含的信息含的信息.下列数据为美玲最近下列数据为美玲最近40次使用移动电话的通话时间次使用移动电话的通话时间(单位:(单位:min)记录:记录:(1)将上述数据分组,制作频数分布表,并绘制出频)将上述数据分组,制作频数分布表,并绘制出频 数直方图数直方图.(2)美玲的通话时间在哪个范围内最多?)美玲的通话时间在哪个范围内最多?她通话时间她通话时间 的平均值在这个范围内吗?的平均值在这个范围内
13、吗?下列数据为美玲最近下列数据为美玲最近40次使用移动电话的通话时间次使用移动电话的通话时间(单位:(单位:min)记录:记录:下列数据为美玲最近下列数据为美玲最近40次使用移动电话的通话时间次使用移动电话的通话时间(单位:(单位:min)记录:记录:6 11 30 8 28 16 21 8 17 1420 1 19 14 6 11 7 13 2 2312 19 9 2 12 16 3 17 15 910 25 12 14 6 7 20 5 13 15练习练习解:解:列频数分布表如下:列频数分布表如下:通话时间(单位:通话时间(单位:min)频数频数频率频率0 x 10150.37510 x2
14、0200.520 x 3050.125(1)将上述数据分组,制作频数分布表,并绘制出频)将上述数据分组,制作频数分布表,并绘制出频 数直方图数直方图.频数直方图如右图:频数直方图如右图:通话时间通话时间频数频数/次数次数 答:由频数直方图可知美玲的通话时间答:由频数直方图可知美玲的通话时间 在在10 x20 min范围内最多;范围内最多;她通话时间的平均值在这个范围内她通话时间的平均值在这个范围内.(2)美玲的通话时间在哪个范围内最多?)美玲的通话时间在哪个范围内最多?她通话她通话时间时间 的平均值在这个范围内吗?的平均值在这个范围内吗?1.下下图是初三图是初三(2)班同学的一次体检中每分钟心
15、跳次数的频班同学的一次体检中每分钟心跳次数的频率分布直方图率分布直方图(次数均为整数次数均为整数).已知该班只有已知该班只有5位同学的心跳每分位同学的心跳每分钟钟75次,请观察此图,指出下列说法中错误的是次,请观察此图,指出下列说法中错误的是().A.数据数据75落在第落在第2小组;小组;B.第第4小组的频率为小组的频率为0.1;C.心跳为每分钟心跳为每分钟75次的人数占该班体检人数的;次的人数占该班体检人数的;D.数据数据75一定是中位数一定是中位数.该班共有该班共有60人,观察人,观察统计图可知统计图可知A,B,C都是都是正确的正确的.解解D中考试题中考试题 2.某某校校320名学生在电脑
16、培训前后各参加了一次水平相同的考名学生在电脑培训前后各参加了一次水平相同的考试,考分都以同一标准划分成试,考分都以同一标准划分成“不合格不合格”、“合格合格”、“优秀优秀”三个三个等级等级,为了了解电脑培训的效果,随机抽取,为了了解电脑培训的效果,随机抽取32名学生两次考名学生两次考试考分试考分等级等级的统计图的统计图(如图如图),试回答下列问题:,试回答下列问题:中考试题中考试题(1)这)这32名学生经过培训,考分等级名学生经过培训,考分等级“不及格不及格”的百分比由的百分比由 下降到下降到 ;(2)估计该校)估计该校320名学生,培训后考分等级为名学生,培训后考分等级为“合格合格”和和“优
17、秀优秀”的学生共有的学生共有 名;名;(3)你认为上述估计合理吗?理由是什么?)你认为上述估计合理吗?理由是什么?答:答:.理由理由:(1)32名学生经过培训后不合格的频数为名学生经过培训后不合格的频数为8,频率为,频率为 .培训前不合格的频数为培训前不合格的频数为24,频率为,频率为 .(2)由于培训后合格和优秀的频率为)由于培训后合格和优秀的频率为 ,故,故320名学生名学生 培训后合格和优秀的频数为:培训后合格和优秀的频数为:32075%=240.(3)合理)合理.理由是该样本是随机抽取的,具有代表性理由是该样本是随机抽取的,具有代表性.8=25%3224=75%3224=75%32解解