1、第二十章第二十章 数据的初步分析数据的初步分析 20.1 数据的频数分布数据的频数分布 学习目学习目标标 1.理解掌握频数、频率的概念理解掌握频数、频率的概念. 2.会对数据进行分组,制作频数分布表和频数直方会对数据进行分组,制作频数分布表和频数直方 图图. 情境导入情境导入 下面我们一起来观看下面我们一起来观看一一组组图片图片,并思考这种现象带来的危害,并思考这种现象带来的危害. 情境导入情境导入 问题问题1 进行某市进行某市“空气质量情况调查空气质量情况调查”,从当地气象部门提供资料中,任意从当地气象部门提供资料中,任意 抽取抽取30天的空气综合污染指数,数据如下:天的空气综合污染指数,数
2、据如下: 提问:你能根据上面的数据谈谈某地空气质量情况吗?提问:你能根据上面的数据谈谈某地空气质量情况吗? 空气污 染指数 0-5051-100 101-150 151-200 201-250 251-300 空气质 量级别 I级 优 II级良 III级1 轻微污 染 III级2 轻度污 染 IV级1 中度污 染 IV级2中度 重污染 国家环保局公布国家环保局公布 30 77 127 53 98 130 57 153 83 32 40 85 167 64 184 201 66 38 87 42 45 90 45 77 235 45 113 48 92 243 情境导入情境导入 把数据按上述级别
3、分成把数据按上述级别分成0-50,51-100,101-150,151-200,201-250共共5 个组,进行整理,得下表:个组,进行整理,得下表: 提问:(提问:(1)你能说说这)你能说说这30天里的空气质量情况吗?天里的空气质量情况吗? (2)你能估计一下该地今年(按)你能估计一下该地今年(按365天计算)空气质量天计算)空气质量 达到优级别的天数吗?达到优级别的天数吗? 空气污染指数 0-5051-100 101-150151-200201-250 天数 9 12 3 3 3 探究新知探究新知 我校体育老师想对八年级全体学生一周内平均每天参加课外锻炼的时间我校体育老师想对八年级全体学生
4、一周内平均每天参加课外锻炼的时间 (单位(单位min)有所了解,从中随机抽查了)有所了解,从中随机抽查了40名学生,结果如下:名学生,结果如下: 提问:通过这组数据,你能了解到什么情况呢?一般情况下,如何对一组数提问:通过这组数据,你能了解到什么情况呢?一般情况下,如何对一组数 据进行分析呢?据进行分析呢? 40 21 35 24 40 38 23 52 35 62 36 15 51 45 42 40 32 43 36 34 53 38 40 39 32 45 40 50 45 40 50 26 45 40 45 35 40 42 45 40 探究新知探究新知 (1)计算这批数据中最大值与最小
5、值的差。)计算这批数据中最大值与最小值的差。 学生找出这批数据中最大数与最小数,作差:学生找出这批数据中最大数与最小数,作差:62-15=47, 由此可知这批数据的变动范围。由此可知这批数据的变动范围。 (2)决定组距和组数)决定组距和组数 组距和组数的概念:组距是指每个小组的两个端组距和组数的概念:组距是指每个小组的两个端 点间的距离。将这批数据分组,如果每组组距相点间的距离。将这批数据分组,如果每组组距相 同,并取组距为同,并取组距为8,那么组数,那么组数= 即把数据分成即把数据分成6组。组。 6 8 47- 组距 最小数最大数 探究新知探究新知 (3)决定)决定分点分点. 将数据按照将数
6、据按照8min的组距分组,从的组距分组,从15开始,分成开始,分成1523,2331,31 39,3947,4755,5563这这6组。这时,我们发现数据组。这时,我们发现数据23,39正好落在分正好落在分 点上,不好决定它们究竟属于哪一组,为了避免这种情况,一般的把表点上,不好决定它们究竟属于哪一组,为了避免这种情况,一般的把表 示分点的数比原数据多取一位小数,并把第一组的起点定为比最小的数示分点的数比原数据多取一位小数,并把第一组的起点定为比最小的数 据稍小一点的数,如把第一组的起点定为据稍小一点的数,如把第一组的起点定为14.5,这样所分的,这样所分的6个组是:个组是: 14.522.5
7、, 22.530.5, 30.538.5 38.546.5, 46.554.5,54.562.5 (4)列频数分布)列频数分布表表. 一般的数据越多,分的组数越多,当数据在一般的数据越多,分的组数越多,当数据在100以内时,可分成以内时,可分成512组,组, 并且要注意数据的并且要注意数据的“不重不漏不重不漏”,使每一个数据都能且只能落在一个组,使每一个数据都能且只能落在一个组 内。内。组组距距一般一般相同,也可以相同,也可以不同不同. 合作探究合作探究 探究点一:频数与频率探究点一:频数与频率 例例1 某校对初三年级某校对初三年级1600名男生的身高进行了测量,结果身高名男生的身高进行了测量
8、,结果身高(单位:单位: m)在在1.581.65这一小组的频率为这一小组的频率为0.4,则该组的人数为,则该组的人数为() 解析:根据解析:根据“频率频数数据总数频率频数数据总数”,得,得“频数数据总数频频数数据总数频 率率”,将数据代入即可求解根据题意,得该组的人数为,将数据代入即可求解根据题意,得该组的人数为16000.4 640(人人)故选故选A. A640人人 B480人人 C400人人 D40人人 合作探究合作探究 探究点二:频数直方图探究点二:频数直方图 例例3 统计武汉园博会前统计武汉园博会前20天日参观人数,得到如下频数分布表和天日参观人数,得到如下频数分布表和 频数直方图频
9、数直方图(部分未完成部分未完成): 武汉园博会前武汉园博会前2020天日参观人数的频数分布表天日参观人数的频数分布表 组别(万人)组中值(万人)频数频率 7.514.51150.25 14.521.5 60.3 21.528.525 0.3 28.535.532 3 (1)请补全频数分布表和频数直方图;请补全频数分布表和频数直方图; (2)求出日参观人数不低于求出日参观人数不低于21.5万的天数和所占的百分比;万的天数和所占的百分比; (3)利用以上信息,试估计武汉园博会利用以上信息,试估计武汉园博会(会期会期247天天)的参观总人数的参观总人数 合作探究合作探究 解析:解析:(1)根据表格的
10、数据求出根据表格的数据求出14.521.5小组的组中值,最后即可补小组的组中值,最后即可补 全频数分布表和频数直方图;全频数分布表和频数直方图;14.521.5小组的组中值是小组的组中值是(14.5 21.5)218,3200.15. 武汉园博会前武汉园博会前2020天日参观人数的频数分布表天日参观人数的频数分布表 组别(万人)组中值(万人)频数频率 7.514.51150.25 14.521.5 1860.3 21.528.525 60.3 28.535.532 3 0.15 合作探究合作探究 解析:解析:(1)根据表格的数据求出根据表格的数据求出14.521.5小组的组中值,最后即可补全频
11、数分布小组的组中值,最后即可补全频数分布 表和频数直方图;表和频数直方图;14.521.5小组的组中值是小组的组中值是(14.521.5)218,3200.15. 武汉园博会前武汉园博会前2020天日参观人数的频数分布表天日参观人数的频数分布表 组别(万人)组中值(万人)频数频率 7.514.51150.25 14.521.5 1860.3 21.528.525 60.3 28.535.532 3 0.15 (2)依题意得日参观人数不低于依题意得日参观人数不低于21.5万有万有639(天天),所占百分比为,所占百分比为92045%; (3)园博会前园博会前20天的平均每天参观人数约为天的平均每
12、天参观人数约为20.45(万人万人),武汉园博会武汉园博会(会期会期247天天) 的参观总人数约为的参观总人数约为20.452475051.15(万人万人) 随堂练习随堂练习 1.抽查抽查20名学生每分钟脉搏的跳动次数,获名学生每分钟脉搏的跳动次数,获 得如下数据(单位:次)得如下数据(单位:次)81737779 80788580689080898281 847283777975请制作表示上述数请制作表示上述数 据的频数分布表据的频数分布表. 随堂练习随堂练习 2.2008年奥运会在北京举行,上海市某学校学生会为了了解全校同学喜欢收年奥运会在北京举行,上海市某学校学生会为了了解全校同学喜欢收
13、看奥运会的比赛项目的情况,随机抽查了看奥运会的比赛项目的情况,随机抽查了200名同学,根据调查结果制作了名同学,根据调查结果制作了 频数分布表频数分布表 最喜欢收看的项目频数(人数)频率 足球 16% 篮球5628% 排球2010% 羽毛球3417% 乒乓球2010% 游泳 跳水189% 田径84% 合计200 (1)补全频数分布表补全频数分布表 (2)在这次抽样调查中,最喜欢收看哪个奥运会比赛项目的同学最多?最喜欢在这次抽样调查中,最喜欢收看哪个奥运会比赛项目的同学最多?最喜欢 收看哪个比赛项目的同学最少?收看哪个比赛项目的同学最少? (3)根据以上调查,试估计该校根据以上调查,试估计该校18001800名学生中,最喜欢收看羽毛球比赛的人数名学生中,最喜欢收看羽毛球比赛的人数. . 1.补全频数分布表补全频数分布表 课堂小结课堂小结 2.收获了哪些解决数学问题的方法?收获了哪些解决数学问题的方法? 再见再见