1、数据的收集、整理与描述单元复习(韩春艳)一、知识网络知识点一:总体、样本的概念1总体:要考察的全体对象称为总体.2个体:组成总体的每一个考察对象称为个体.3样本:被抽取的那些个体组成一个样本.4样本容量:样本中个体的数目叫样本容量(不带单位).注意:为了使样本能较好地反映总体的情况,除了要有合适的样本容量外,抽取时还要尽量使每一个个体都有同等的机会被抽到.知识点二:全面调查与抽样调查调查的方式有两种:全面调查和抽样调查: 1全面调查:考察全面对象的调查叫全面调查. 全面调查也称作普查,调查的方法有:问卷调查、访问调查、电话调查等.全面调查的步骤:(1)收集数据;(2)整理数据(划记法);(3)
2、描述数据(条形图或扇形图等).2抽样调查:若调查时因考察对象牵扯面较广,调查范围大,不宜采用全面调查,因此,采用抽样调查. 抽样调查只抽取一部分对象进行调查,然后根据调查数据推断全体对象的情况.抽样调查的意义:(1)减少统计的工作量;(2)抽样调查是实际工作中应用非常广泛的一种调查方式,它是总体中抽取样本进行调查,根据样本 来估计总体的一种调查.3判断全面调查和抽样调查的方法在于:全面调查是对考察对象的全面调查,它要求对考察范围内所有个体进行一个不漏的逐个准确统计;而抽样调查则是对总体中的部分个体进行调查,以样本来估计总体的情况. 注意区分“总体”和“部分”在表述上的差异. 在调查实际生活中的
3、相关问题时,要灵活处理,既要考虑问题本身的需要,又要考虑实现的可能性和所付出代价的大小.调查方法:问卷,观察,走访,试验,查阅资料。知识点三:扇形统计图和条形统计图及其特点1生活中,我们会遇到许多关于数据的统计的表示方法,它们多是利用圆和扇形来表示整体和部分的关系,即用圆代表总体,圆中的各个扇形分别代表总体中的不同部分,扇形的大小反映部分占总体的百分比的大小,这样的统计图叫做扇形统计图.(1)扇形统计图的特点: 用扇形面积表示部分占总体的百分比; 易于显示每组数据相对于总体的百分比; 扇形统计图的各部分占总体的百分比之和为100或1. 在检查一张扇形统计图是否合格时,只 要用各部分分量占总量的
4、百分比之和是否为100进行检查即可.(2)扇形统计图的画法: 把一个圆的面积看成是1,以圆心为顶点的周角是360,则圆心角是36的扇形占整个面积的 ,即10. 同理,圆心角是72的扇形占整个圆面积的,即20. 因此画扇形统计图的关键 是算出圆心角的大小. 扇形的面积与圆心角的关系:扇形的面积越大,圆心角的度数越大;扇形的面积越小,圆心角的 度数越小. 扇形所对圆心角的度数与百分比的关系是:圆心角的度数百分比360.(3)扇形统计图的优缺点: 扇形统计图的优点是易于显示每组数据相对于总数的大小,缺点是在不知道总体数量的条件下, 无法知道每组数据的具体数量.2用一个单位长度表示一定的数量关系,根据
5、数量的多少画成长短不同的条形,条形的宽度必须保持一致,然后把这些条形排列起来,这样的统计图叫做条形统计图. (1)条形统计图的特点: 能够显示每组中的具体数据; 易于比较数据之间的差别.(2)条形统计图的优缺点: 条形统计图的优点是能够显示每组中的具体数据,易于比较数据之间的差别,缺点是无法显示每 组数据占总体的百分比.注意:(1)条形统计图的纵轴一般从0开始,但为了突出数据之间的差别也可以不从0开始,这样既节省篇幅,又能形成鲜明对比;(2)条形图分纵置个横置两种.知识点四:频数、频率和频数分布表1一般我们称落在不同小组中的数据个数为该组的频数,频数与数据总数的比为频率. 频率反映了各组频数的
6、大小在总数中所占的分量.公式: .由以上公式还可得出两个变形公式:(1)频数频率数据总数.(2) .注意:(1)所有频数之和一定等于总数;(2)所有频率之和一定等于1.2数据的频数分布表反映了一组数据中的每个数据出现的频数,从而反映了在一组数据中各数据的分布情况.要全面地掌握一组数据,必须分析这组数据中各个数据的分布情况.知识点五:频数分布直方图与频数折线图1在描述和整理数据时,往往可以把数据按照数据的范围进行分组,整理数据后可以得到频数分布表,在平面直角坐标系中,用横轴表示数据范围,纵轴表示各小组的频数,以各组的频数为高画出与这一组对应的矩形,得到频数分布直方图.2条形图和直方图的异同:直方
7、图是特殊的条形图,条形图和直方图都易于比较各数据之间的差别,能够显示每组中的具体数据和频率分布情况.直方图与条形图不同,条形图是用长方形的高(纵置时)表示各类别(或组别)频数的多少,其宽度是固定的;直方图是用面积表示各组频数的多少(等距分组时可以用长方形的高表示频数),长方形的宽表示各组的组距,各长方形的高和宽都有意义. 此外由于分组数据都有连续性,直方图的各长方形通常是连续排列,中间没有空隙,而条形图是分开排列,长方形之间有空隙.3频数折线图的制作一般都是在频数分布直方图的基础上得到的,具体步骤是:首先取直方图中每一个长方形上边的中点;然后再在横轴上取两个频数为0的点(直方图最左及最右两边各
8、取一个,它们分别与直方图左右相距半个组距);最后再将这些点用线段依次连接起来,就得到了频数折线图.4频数分布直方图的画法:(1)找到这一组数据的最大值和最小值;(2)求出最大值与最小值的差;(3)确定组距,分组;(4)列出频数分布表;(5)由频数分布表画出频数分布直方图.5画频数分布直方图的注意事项:(1)分组时,不能出现数据中同一数据在两个组中的情况,为了避免,通常分组时,比题中要求数据 单位多一位. 例如:题中数据要求到整数位,分组时要求数据到0.5即可.(2)组距和组数的确定没有固定的标准,要凭借数据越多,分成的组数也就越多,当数据在100以内类型一:考查基本概念1:为了了解河南省中考数
9、学考试情况,从所有考生中抽取600名考生的成绩进行考查,指出该考查中的总体和样本分别是什么? 思路点拨:从概念上来看,总体即全部考查对象,样本是一部分考查对象,还要注意考查的对象是数量指标.解析:总体是河南省参加中考考试的所有考生的数学成绩;样本是抽取的600名考生的数学成绩.总结升华:统计中的研究对象是数据,而不是具体的人或物. 在叙述总体和样本时,要注意他们的范围和数量指标. 【变式】 某县共有4591人参加中考,为了考查这4591名学生的外语成绩,从中抽取了80名学生成绩进行调查,以下说法不正确的是( ).A.4591名学生的外语成绩是总体; B.此题是抽样调查;C.样本是80名学生的外
10、语成绩; D.样本是被调查的80名学生.【答案】D.类型二: 调查方法的考查2:下列调查中,适合用普查(全面调查)方法的是( ). A.电视机厂要了解一批显像管的使用寿命;B.要了解我市居民的环保意识;C.要了解我市“阳山水蜜桃”的甜度和含水量;D.要了解某校数学教师的年龄状况.思路点拨:A、B、C工作量太大,太复杂,只能作抽样调查,而D可以作普查,即全面调查.解析:D.总结升华:在调查实际生活中的相关问题时,要灵活处理,既要考虑问题本身的需要,又要考虑实现的可能性和所付出代价的大小. 举一反三:【变式】下列抽样调查中抽取的样本合适吗?为什么?(1)数学老师为了了解全班同学数学学习中存在的困难
11、和问题,请数学成绩优秀的10名同学开座谈会;(2)在上海市调查我国公民的受教育程度;(3)在中学生中调查青少年对网络的态度;(4)调查每班学号为5的倍数的学生,以了解学校全体学生的身高和体重;(5)调查七年级中的两位同学,以了解全校学生的课外辅导用书的拥有量.【答案】(1)中的抽样不太合适,抽样时,应该让成绩好、中、差的同学都有代表参加;(2)中上海市的经济发达,公民受教育的程度较高,不具有代表性;(3)中青少年不仅仅是中学生,还有为数众多的非中学生,中学生对网络的态度不代表青少年对网络 的态度;(4)中抽样是随机的,因此可以认为抽样合适;(5)中调查的人数太少,各年级的情况可能有所不同,因此
12、抽样不合适.类型三:考查整理数据的能力3:图中所示的是 南宁市年鉴记载的本市社会消费品零售总额(亿元)统计图. 请你仔细观察图中的数据,并回答下面问题. (1)图中所列的6年消费品零售总额的最大值和最小值的差是多少亿元?(2)求1990年、1995年和2000年这三年社会消费品零售总额的平均数(精确到0.01).(3)从图中你还能发现哪些信息,请说出其中两个.思路点拨:从图中可以看出最大值是163.44(亿元),最小值是0.33(亿元).第(3)题为开放性问题,答案不唯一解析:(1)163.440.33163.11(亿元).(2)(亿元).(3)2000年至 消费品零售总额的增长速度比1980
13、年至1990年10年间的消费品零售总额平均增 长速度快;可以看出2000年人民生活水平比10年前有大幅度提高.总结升华:仔细观察图表,获取准确有用的信息. 举一反三:【变式1】某中学在一次健康知识测试中,抽取部分学生成绩(分数为整数,满分为100分)为样本,绘制成绩统计图,请结合统计图回答下列问题.(1)本次测试中抽取的学生共多少人?(2)分数在90.5100.5分这一组的频率是多少?(3)从左到右各小组的频率比是多少?(4)若这次测试成绩80分以上(不含80分)为优秀,则优秀率不低于多少?【答案】(1)2341450(人).所以本次测试中抽取的学生共有50人.(2)4500.08. 所以分数
14、在90.5100.5分这一组的频率是0.08.(3)从左到右各小组的频率比是23414.(4)41445,所以优秀率不低于90.【变式2】(2010辽宁丹东)为了估计某市空气质量情况,某同学在30天里做了如下记录: 污染指数()406080100120140天数(天)3510651其中50时空气质量为优, 50100时空气质量为良,100150时空气质量为轻度污染,若1年按365天计算,请你估计该城市在一年中空气质量达到良以上(含良)的天数为_天【答案】292类型四:条形统计图和扇形统计图4:某厂生产一种产品,图一是该厂第一季度三个月产量的统计图,图二是这三个月的产量占第一季度总量的比例分布统
15、计图,统计员在制作图一、图二时漏填了部分数据. 根据上述信息,回答下列问题:(1)该厂第一季度哪一个月的产量最高?_月.(2)该厂一月份产量占第一季度总产量的_.(3)该厂质检科从第一季度的产品中随机抽样,抽检结果发现样品的合格率为98. 请你估计:该厂 第一季度大约生产了多少件合格的产品?(写出解答过程)思路点拨:由条形统计图可知,三月份的产量最高,由扇形统计图可知,一月份的产量占总量的百分比为:1383230.解析:(1)三;(2)30.(3)(190038)984900.答:该厂第一季度大约生产了4900件合格的产品.举一反三:【变式1】图中是甲、乙两户居民家庭全年各项支出的统计图.根据
16、统计图,下列对两户居民家庭教育支出占全年总支出的百分比做出的判断中正确的是( ).A.甲户比乙户大; B.乙户比甲户大; C.甲、乙两户一样大; D.无法确定哪一户大.分析:从图甲中可以直接读出甲户居民家庭全年的各项支出:衣着1200元,食品2000元,教育1200元,其他1600元,故全年总支出为:12002000120016006000(元),由此求出甲户教育支出占全年总支出的百分比为;由图乙得知乙户居民的教育支出占全年总支出的百分比为25,所以选B.【答案】B.【变式2】图中所示是北京奥运会、残奥会志愿者申请人来源的统计数据,请你计算:志愿者申请人的总数为_万;其中“京外省区市”志愿者申
17、请人数在总人数中所占的百分比约为_(精确到0.1%),它对应的扇形的圆心角约为_(精确到度).分析:由统计图可知,志愿者申请人的总数为:2.82.277.229.20.70.20.3112.6(万人).其中“京外省区市”志愿者申请人数在总人数中所占的百分比约为,它所对应的扇形圆心角约为:36025.993.【答案】112.6;25.9;93.类型五: 频数分布直方图5:一超市为了制定某个时间段收银台开放方案,统计了这个时间段本超市顾客在收银台排队付款的等待时间,并绘制成如图所示的频数分布直方图(图中等待时间6分钟到7分钟表示大于或等于6分钟而小于7分钟,其他类同). 这个时间段内顾客等待时间不
18、少于6分钟的人数为( ). A.5; B.7; C.16; D.33.思路点拨:本题主要考查频数分布直方图的意义,由图易得这个时间段内顾客等待时间不少于6分钟的人数为527人.解析:B.举一反三:【变式】 某市国际车展期间,某公司对参观本次车展盛会的消费者进行了随机问卷调查,共发放1000份调查问卷,全部回收.根据调查问卷的结果,将消费者年收入的情况整理后,制成表格如下:年收入/万元4.867.2910被调查的消费者人数/人2005002007030将消费者打算购买小车的情况整理后,作出了频数分布直方图的一部分如图(注:每组包含最小值不包含最大值,且车价取整数).请你根据以上信息,回答下列问题:(1)根据中信息可得,被调查消费者的年收入的众数是_万元;(2)请在图中补全这个频数分布直方图;(3)打算购买价格10万元以下小车的消费者的人数占被调查消费者总人数的百分比是_.分析:被调查的消费者人数中,年收入为6万元的人数最多,所以被调查的消费者的年收入的众数是6万元;因为共发放了1000份调查问卷,所以购买价格在10万到20万的人数为:1000(4012036020040)240(人);打算购买价格10万元以下小车的消费者人数为:40120360520(人),占被调查消费者人数的百分比是.【答案】(1)6;(2)频数分布直方图为:(3)52.