1、第20章 数据的初步分析数据的初步分析20.1 数据的频数分布1.明确频数直方图制作的步骤,会绘制频数直方图.(难点)2.能从频数分布表和频数直方图中获取有关信息,作出合理的判断和预测.(重点)学习目标学习目标 书籍是人类进步的阶梯,同学们在课外最爱读那一类书籍?文学类(A)漫画类(D)科普类(C)历史类(B)导入新课导入新课 根据上面结果,你能很快说出该班同学最喜欢读那一类书吗?他的数据表示方式是什么?下面是小亮调查的七(1)班50位同学喜欢的书籍,结果如下:A A B C D A B A A C B A A C B C A A B CA A B A C D A A C D B A C D
2、A A A C D AC B A A C C D A A C文学类(A)漫画类(D)科普类(C)历史类(B)问题:某校学生在假期进行“空气质量调查”的课题研究时,他们从当地的气象部门提供的今年上半年的资料中,随意抽取30天的空气综合污染指数,数据如下:国家环保总局公布的空气质量级别表国家环保总局公布的空气质量级别表30,77,127,53,98,130,57,153,83,32,40,85,167,64,184,201,66,38,87,42,45,90,45,77,235,45,113,48,92,243.空气污空气污染指数染指数0505110010115015120020125025130
3、0大于大于300空气质量级别级(优)级(良)级1(轻微污染)级2(轻度污染)级1(中度污染)级2中度重污染级重度污染频数与频率一讲授新课讲授新课(1)说说这30天的空气质量,根据国家公布的级别,各级别各占多大比率(即分布情况)(2)该校学生估计该地今年(按365天计算)空 气质量达到优级别的天数约是110天,你知道他们是怎样估计出这个结论的?空气污空气污染指数染指数050 51100101150151200 201250天天 数数 912333一共有30天呦 空气质量等级 空气污染指数频数频率A:空气质量优 050B:空气质量良 51100C:空气轻微污染 101150D:空气中度污染 151
4、200E:空气轻度污染 201250频数:每个小组内数据的个数频率频数该批所研究数据的总个数9120.30.40.13330.10.1频数分布表:如上表158158160168159159151158159168158154158154169158158158159167170153160160159159160149163163162172161153156162162163157162162161157157164155156165166156154166164165156157153165159157155164156问题:选择身高在哪个范围内的学生参加呢?为了参加全校各年级之间的广播操
5、比赛,七年级准备从63名同学中挑出身高相差不多的40名同学参加比赛.为此收集到这63名同学的身高(单位:cm)如下:交流与思考用频数直方图表示数据二 在上面的数据中,最小值是149,最大值是172,它们的差是23,说明身高的变化范围是23 cm一、计算最大值和最小值的差 为了使选取的参赛选手身高比较整齐,你知道怎样做才能知道数据(身高)的分布情况?(即在哪些身高范围的学生比较多?哪些身高范围内的学生比较少.)二、决定组距和组数所以要将数据分成8组:149x152,152x155,170 x173这里组数和组距分别是8和3 把所有数据分成若干组,每个小组的两个端点之间的距离称为组距 根据问题的需
6、要,各组的组距可以相同或不同.没有固定的标准,根据具体问题来决定.本问题中我们作等距分组,即令各组的组距相同.如果从最小值起每隔3 cm 作为一个组,那么由于327323-组距最小值最大值 对落在各个小组内的数据进行累计,得到各个小组内的数据的个数(叫做频数)整理可以得到频数分布表.三、列频数分布表从表中可以看出,身高在155x158,158x161,161x164三个组的人数最多,一共有41人,因此可以从身高在155164 cm(不含164 cm)的学生中选队员.身高身高分组分组149x152152x155155x158158x161161x164164x167167x170170 x173
7、频数26121910842议一议 上面我们选取的组距是3,从而把数据分成8组,若我们选取的组距是2或4呢,那么组距分成几个组?这样能否选出需要的40名同学呢?小长方形的高是频数与组距的比值小长方形的宽是组距频数组距0149152 15515816116416717017312567身高/cm34四、画频数分布直方图 为了更直观形象地看出频数分布的情况,可以根据频数分布表,画出频数分布直方图.横轴纵轴小长方形的面积组距(频数组距)频数 为画图与看图的方便,通常直接用小长方形的高作为频数.频数0149152 155158161 164167170173510身高/cm1520议一议 条形统计图与频
8、数直方图有什么区别和联系?(1)联系用途都是可以直观地表示出具体 数量.频数直方图是特殊的条形统计图.(3)绘制的形式不同条形统计图各条形分 开;频数直方图的条形连在一起(2)区别条形统计图是直观地显示出具体 数据;频数直方图是表现频数的分布情况.总结归纳 制作频数直方图大致步骤是什么?(1)找出所给数据中的最大值和最小值,求最大值与最小值的差确定统计量的范围.(4)根据分组和频数,绘制频数直方图.(3)统计每组中数据的频数.(2)确定组数和组距并进行分组(数据个数在100 以内,一般分5至12组)典例精析 例1 某校一学生社团参加数学实践活动,和交警一起在金山大道入口用移动测速仪监测一组汽车
9、通过的时速(千米/时),在数据整理统计绘制频数直方图的过程中,不小心墨汁将表中的部分数据污染(见下表),请根据下面不完整的频数分布表和频数直方图,解答问题:(注:5060指时速大于等于50千米/时而小于60千米/时,其他类同)(1)请用你所学的数学统计知识,补全频数直方图;39(2)如果此地汽车时速不低于80千米/时即为违章,求这组汽车的违章频数;(3)如果请你根据调查数据绘制扇形统计图,那么时速在7080范围内的车辆数所对应的扇形圆心角的度数是_.解:18+22=40144练一练 为了解某校九年级男生的身高情况,该校从九年级随机找来50名男生进行了身高测量,根据测量结果(均取整数,单位:cm
10、)列出了下表.根据表中提供的信息回答下列问题:(1)数据在161165范围内的频数是_;(2)频数最大的一组数据的范围是_;(3)估计该校九年级男生身高在176cm(包括176cm)以上的约占_%.1216617012 例2.为了了解某地区新生儿体重状况,某医院随机调取了该地区60名新生儿出生体重,结果(单位:克)如下:3850390033003500331538002550380041502500270028503800350029002850330036504000330028002150370034653680290030503850361038003280310030002800350
11、04050330034503100340041603300275032502350352038502850345038003500310019003200340034003400312036002900 将数据适当分组,并绘制相应的频数直方图,从图中反映出该地区新生儿体重状况怎样?解:(1)确定所给数据的最大值和最小值:上述数据中最小值是1900,最大值是4160;(2)将数据适当分组:最大值和最小值相差41601900=2260,考虑以250为组距,2260250=9.04,可以考虑分成10组;(3)统计每组中数据出现的次数分组人数分组人数17502000300032502000225032
12、503500225025003500375025002750375040002750300040004250111397151094111387141110402468101214161750200022502500275030003250350037504000体重(单位:克)人数 (4)绘制频数直方图 从图中可以看出出该地区新生儿体重状在32503500g 的人数最多.做一做为了解某中学九年级300名男学生的身体发育情况,从中对20名男学生的身高进行了测量,结果(单位:cm)如下:175 161 171 176 167 181 161 173 171 177179 172 165 157
13、173 173 166 177 169 181下表是根据上述数据填写的表格的一部分(1)请填写表中未完成的部分;(2)该校九年级男学生身高在171.5 cm176.5 cm范围内的人数为多少?62530030=90(人)1在频数分布表中,各小组的频数之和()A小于数据总数 B等于数据总数 C大于数据总数 D不能确定2如图是某班45名同学爱心捐款额的频数直方图(每组含前一个边界值,不含后一个边界值),则捐款人数最多的一组是()A510元 B1015元 C1520元 D2025元BC随堂练习随堂练习 3一个样本有100个数据,最大值为7.4,最小值为4.0,如果取组距为0.3,那么这组数据可分成(
14、)A.11组B12组 C.13组 D以上答案均不对4为了提高学生书写汉字的能力,增强保护汉字的意识,我市举办了首届“汉字听写大赛”,经选拔后有50名学生参加决赛,这50名学生同时听写50个汉字,若每正确听写出一个汉字得1分,根据测试成绩绘制出频数分布表和频数直方图(不完整)如下:B请结合图表完成下列各题:(1)求表中a的值;(2)请把频数直方图补充完整;(3)若测试成绩不低于40分为优秀,则本次测试的优秀率是多少?解:(1)a5048161012.(2)如图.频数直方图 用频数直方图表示数据制作频数直方图1.最大值与最小值的差2.确定组数和组距并进行分组3.统计每组中数据的频数4.绘制频数直方图从条形统计图获取信息从频数直方图获取信息课堂小结课堂小结