1、第三十讲第三十讲数据的收集与整理数据的收集与整理1(2013浙江嘉兴)在某次体育测试中,九(1)班 6 位同学的立定跳远成绩(单位:m)分别为:1.71,1.85,1.85,1.95,2.10,2.31,则这组数据的众数是()A1.71B1.85C1.90D2.31【解析】数据 1.85 出现 2 次,次数最多,所以众数是 1.85.故选 B.【答案】B2(2013浙江金华)王老师对本班 40 名学生的血型作了统计,列出如下的统计表,则本班 A 型血的人数是()组别 A 型 B 型 AB 型 O 型频率0.40.350.10.15A.16B14C6D4【解析】本班 A 型血的人数为:400.4
2、16.【答案】A3(2013浙江温州)小明对九(1)班全班同学“你最喜欢的球类项目是什么?(只选一项)”的问题进行了调查,把所得数据绘制成如图301 所示的扇形统计图由图可知,该班同学最喜欢的球类项目是()A羽毛球B乒乓球C排球D篮球图 301【解析】喜欢篮球比赛的人所占的百分比最大,故该班最喜欢的球类项目是篮球【答案】D4(2013四川遂宁)以下问题,不适合用全面调查的是()A了解全班同学每周体育锻炼的时间B旅客上飞机前的安检C学校招聘教师,对应聘人员面试D了解全市中小学生每天的零花钱【解析】A了解全班同学每周体育锻炼的时间,数量不大,宜用全面调查;B旅客上飞机前的安检,意义重大,宜用全面调
3、查;C学校招聘教师,对应聘人员面试必须全面调查;D了解全市中小学生每天的零花钱,工作量大,且普查的意义不大,不适合全面调查,故选 D.【答案】D5(2013浙江宁波)数据2,1,0,3,5 的方差是_【解析】这组数据2,1,0,3,5 的平均数是(21035)51,则这组数据的方差是15(21)2(11)2(01)2(31)2(51)2345.【答案】345考点一全面调查和抽样调查考点一全面调查和抽样调查1为一特定目的而对考查全体对象进行的调查叫做 全面调查(又叫做普查)2为一特定目的而对部分考查对象进行的调查叫做 抽样调查把所要考查对象的全体叫做总体,每一个考察对象叫做个体,从总体中所抽取的
4、部分考查对象叫做总体的一个样本,样本中数据的个数叫做样本容量考点点拨1如果每一个个体都需精确,需采用全面调查2考查对象会遭到破坏或范围太多、太广,需耗费大量财力物力,而对结果只要大致估计或了解时往往采用抽样调查3抽样调查时注意样本要具有广泛性、代表性,样本容量是不带单位的数目【精选考题 1】(2013广西贺州)调查市场上某种食品的色素含量是否符合国家标准,这种调查适用_(填全面调查或者抽样调查)点评:(1)本题考查抽样调查和全面调查的区别与选择,难度较小(2)选择全面调查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查,无法进行全面调查,全面调查的意义或价值不大时
5、,应选择抽样调查;对于精确度要求高的调查,事关重大的调查往往选用全面调查解析:由于食品数量庞大,且抽测具有破坏性,故适用抽样调查答案:抽样调查【预测演练1】下列调查中,适宜采用抽样调查方式的()A调查我市中学生每天体育锻炼的时间B调查某班学生对“中国梦”的知晓率C调查一架“歼 20”隐形战机各零部件的质量D调查伦敦奥运会100 m 决赛运动员兴奋剂的使用情况解析:B,C,D 调查对象范围小,实际情况中涉及每一个个体都需精确,因此需全面调查而全市中学生范围广,锻炼时间不需要准确知晓,估计值就可以,用抽样调查答案:A考点二统计表和统计图考点二统计表和统计图1在进行数据的收集时,我们常常要设计一个统
6、计表以便于简洁而清楚地记录数据,这样的统计表就称为数量统计表2条形统计图是用宽度相同的条形的高低或长短来表示数据特征的统计图,它可以直观地反映出数据的数量特征3折线统计图是在平面直角坐标系中用折线表示数量变化规律的统计图,它可以直观地反映出数据的数量变化规律4扇形统计图是用圆的面积表示一组数据的整体,用圆中扇形面积与圆面积的比来表示各组成部分在总体中所占百分比的统计图,它可以直观地反映出各部分数量在总体中所占的份额考点点拨在解决统计问题时,不同的统计图表之间的信息是互补的,要能正确地从图表中获取有用的信息来解决问题【精选考题 2】(2013浙江杭州)根据 20082012 年杭州市实现地区生产
7、总值(简称 GDP,单位:亿元)统计图302 所提供的信息,下列判断正确的是()图 302A20102012 年杭州市每年 GDP 增长率相同B2012 年杭州市的 GDP 比 2008 年翻一番C2010 年杭州市的 GDP 未达到 5500 亿元D20082012 年杭州市的 GDP 逐年增长点评:(1)本题考查条形统计图,难度较小(2)读懂统计图,从统计图中得到必要的信息是解决本题的关 键(3)条形统计图能清楚地表示出每个项目的数据解析:A2010 年2011 年 GDP 增长率约为70006000600016,2011年2012年 GDP 增长率约为790070007000970,增长
8、率不同,故此选项错误;B2012 年杭州市的GDP 约为 7900 亿元,2008 年 GDP 约为 4900 亿元,故此选项错误;C2010年杭州市的 GDP 超过到 5500亿元,故此选项错误;D20082012 年杭州市的GDP 逐年增长,故此选项正确故选 D.答案:D【预测演练 2】在结束了 380 课时初中阶段数学内容的教学后,唐老师计划安排 60 课时用于总复习,根据数学内容所占课时比例,绘制如下统计图表(图 303图 305),请根据图表提供的信息,回答下列问题:图 303图 304图 305(1)图 303 中“统计与概率”所在扇形的圆心角为_度;(2)图 304,305 中的
9、 a_,b_;(3)在 60 课时的总复习中,唐老师应安排多少课时复习“数与代数”内容?解析:(1)36扇形统计图中“统计与概率”所对应的圆心角360(145%40%5%)36.(2)60,14先求出数与代数占总数的 45%具体是多少课时,即 45%380171(课时),a171674460.同理:将“方程(组)与不等式(组)”课时总数减去 A,B,C,E 课时总和就是 b 的值,b60181312314.(3)根据课时比例,复习“数与代数”需 45%6027(课时)考点三平均数、众数和中位数考点三平均数、众数和中位数1有 n 个数据 x1,x2,xn,这些数据的平均数x1n(x1x2xn)2
10、有 n 个数据,x1,x2,xn,它们出现的次数分别为f1,f2,fn,这些数据的加权平均数xx1f1x2f2xnfnf1f2fn3一组数据从大到小(或从小到大)排列,如果数据的个数是奇数,则处于最中间的一个数据称为这组数据的中位数;如果数据的个数是偶数,则最中间的两个数据的平均数称为这组数据的中位数4在一组数据中,出现次数最多的数据叫做众数考点点拨1平均数反映一组数据的平均水平,计算平均数时要注意样本容量2加权平均数中的权可以是整数,也可以是小数或百分比3中位数反映数据的中等水平,但一定要按顺序排列后才能找4众数是一组数据中出现次数最多的数,它可能不唯一【精选考题 3】(2013浙江湖州)在
11、开展“爱心捐助雅安灾区”的活动中,某团支部 8 名团员捐款分别为(单位:元):6,5,3,5,6,10,5,5,这组数据的中位数是()A3 元B5 元C6 元D10 元点评:(1)本题考查中位数的定义,难度较小(2)解决本题的关键是把数据按要求重新排列解析:将数据从小到大排列为:3,5,5,5,5,6,6,10,故中位数为 5.故选 B.答案:B【预测演练 31】某课外小组的同学们在实践活动中调查了 20 户家庭某月用电量,结果如下表所示:用电量(kWh)120140160180220户数23672则这户家庭用电量的众数和中位数分别是()A180kWh,160kWhB160kWh,180kWh
12、C160kWh,160kWhD180kWh,180kWh解析:用电量出现最多的是180kWh,有 7 户家庭,所以众数是 180kWh.这组数据一共有20 个,按大小顺序排列之后的第10 个、第11 个数据都是160kWh,所以中位数是160kWh.答案:A【预测演练32】某文具商店共有单价分别为10 元,15 元和 20元的 3 种文具盒出售,该商店统计了2013 年 3 月份这 3 种文具盒的销售情况,并绘制统计图306 如下:图 306(1)请在图 306中把条形统计图补充完整;(2)小亮认为:该商店 3 月份这 3 种文具盒总的平均销售价格为13(101520)15(元),你认为小亮的
13、计算方法正确吗?如不正确,请计算出总的平均销售价格解析:(1)如解图 1 所示(解图 1)(2)不正确,平均销售价格为(10150153602090)(15036090)870060014.5(元)考点四极差、方差考点四极差、方差1极差是最大值减去最小值的差,是一组数据波动的最大范围,极差越大,说明波动越大2有 n 个数据 x1,x2,xn,它们的平均数为x,则这组数据的方差S21n(x1x)2(x2x)2(xnx)2S S2,把 S 叫做标准差方差越小,数据越稳定考点点拨1当方差为 0 时,说明各数据都相等2计算一组已知数据的方差,应先求出这组数据的平均数,再利用方差公式进行计算【精选考题
14、4】(2013浙江衢州)一次数学测试,某小组五名同学的成绩如下表所示(有两个数据被遮盖)组员日期甲乙丙丁戊方差平均成绩得分8179808280那么被遮盖的两个数据依次是()A80,2B80,2C78,2D78,2点评:(1)本题考查平均数与方差,难度较小(2)掌握平均数和方差的计算公式是解决本题的关键解析:根据题意,得:丙的得分805(81798082)78(分),方差15(8180)2(7980)2(7880)2(8080)2(8280)22.故选 C.答案:C【预测演练4】省射击队为从甲、乙两名运动员中选拔一人参加全国比赛,对他们进行了六次测试,测试成绩如下表(单位:环):第一次 第二次第
15、三次第四次第五次第六次甲10898109乙107101098(1)根据表格中的数据,计算出甲的平均成绩是_环,乙的平均成绩是_环;(2)分别计算甲、乙六次测试成绩的方差;(3)根据(1)(2)计算的结果,你认为推荐谁参加全国比赛更合适?请说明理由解析:(1)99 x甲16(10898109)9;x乙16(107101098)9.(2)S甲216(109)2(89)2(99)2(89)2(109)2(99)216(110110)23;S乙216(109)2(79)2(109)2(109)2(99)2(89)216(141101)43.(3)推荐甲参加全国比赛更合适,理由如下:两人的平均成绩相等,
16、说明实力相当;但甲的六次测试成绩的方差比乙小,说明甲发挥较为稳定,故推荐甲参加比赛更合适(不唯一,合理即可)考点五频数分布直方图与频数分布折线图考点五频数分布直方图与频数分布折线图1我们称数据分组后落在各小组内的数据个数为频数2一般地,每一组频数与数据总数(或实验总次数)的比叫做这一组数据(或事件)的频率3我们用小长方形的宽表示组距,小长方形的高表示频数,把频数分布表中的结果直观形象地表示出来,就得到了频数分布直方图在频数分布直方图中,顺次连结各组(含左、右虚设的频数为0 的组)的组中值对应的点,就得到了频数分布折线图考点点拨1画频数分布图的步骤:(1)计算极差;(2)选取组距确定组数;(3)
17、决定分点,进行分组;(4)列频数分布表;(5)画频数分布直方图或频数分布折线图2画频数分布折线图时,需在左、右各虚设一个频数为0的组3分组时,为避免数据落在边界上,边界值常多取一位小数,分组一般分 58 组为宜【精选考题 5】(2013福建三明)九年级(1)班全体学生参加了学校举办的安全知识竞赛,如图 307 是该班学生竞赛成绩的频数分布直方图(满分为 100 分,成绩均为整数),若将成绩不低于90 分的评为优秀,则该班这次成绩达到优秀的人数占全班人数的百分比是_图 307点评:(1)本题考查利用频数分布直方图获取信息的能力,难度较小(2)利用统计图获取信息时,必须认真观察、分析、研究统计图,
18、才能作出正确的判断和解决问题解析:总人数是 510201550(人),优秀的人数是 15 人,则该班这次成绩达到优秀的人数占全班人数的百分比是1550100%30%.答案:30%【预测演练 5】某农科所为了考察某种水稻穗长的分布情况,在一块试验田里随机抽取了50 个谷穗作为样本,量得它们的长度(单位:cm)对样本数据适当分组后,列出了如下频数分布表:穗长4.5x5 5x5.5 5.5x6 6x6.5 6.5x7 7x7.5频数481213103(1)在图 308,中分别画出频数分布直方图和频数分布折线图;(2)请你对这块试验田里的水稻穗长进行分析,并计算出这块试验田里穗长在5.5x7范围内的谷
19、穗所占的百分比图 308解 析:(1)频 数 分 布 直 方图 和 频 数 折 线 图 如 解 图 2 所 示(解图 2)(2)由解图 2可知谷穗长度大部分落在 5 cm 至 7 cm 之间,其他区域较少长度在 6x6.5 范围内的谷穗个数最多,有 13 个,而长度在 4.5x5,7x7.5 范围内的谷穗个数很少,总共只有 7 个这块试验田里穗长在5.5x7范围内的谷穗所占百分比为(121310)5070%.1.通过统计图表解决数学问题时,一定要仔细观察,发掘图表中所提供的信息,把图表中的信息与相应的数学知识、数学方法、数学模型联系起来,正确地解决提出的问题2平均数常用来反映数据的总体趋势,众
20、数常用来反映数据的集中趋势,中位数常用来反映数据的中间值,方差常用来反映数据的波动,方差大,波动大,方差小,波动小1(2013浙江嘉兴)下列说法:要了解一批灯泡的使用寿命,应采用普查的方式;若一个游戏的中奖率是1%,则做 100 次这样的游戏一定会中奖;甲、乙两组数据的样本容量与平均数分别相同,若方差 S甲20.1,S乙20.2,则甲组数据比乙组数据稳定;“掷一枚硬币,正面朝上”是必然事件正确说法的序号是()ABCD点评:(1)本题考查对全面调查、概率、方差、必然事件等基本概念的理解,难度中等(2)注意方差越小,数据越稳定解析:要了解一批灯泡的使用寿命,应采用抽样调查的方式,普查具有破坏性;若
21、一个游戏的中奖率是1%,则做 100次这样的游戏可能会中奖,也可能不中奖,说法错误;甲、乙两组数据的样本容量与平均数分别相同,若方差 S甲20.1,S乙20.2,则甲组数据比乙组数据稳定,说法正确;“掷一枚硬币,正面朝上”是随机事件,说法错误故选 C.答案:C2(2013江苏盐城)某公司10 名职工5 月份工资统计如下,该公司 10 名职工5 月份工资的众数和中位数分别是()工资(元)2000220024002600人数(人)1342A.2400元,2400元B2400元,2300元C2200元,2200元D2200元,2300元点评:(1)本题考查众数与中位数,难度中等(2)中位数是将一组数
22、据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数),众数是一组数据中出现次数最多的数解析:2400 出现了 4 次,出现的次数最多,众数是 2400 元共有 10 个数,中位数是第 5,6 个数的平均数,中位数是(24002400)22400(元)故选 A.答案:A3(2012湖北武汉)随机抽取某校九年级若干名学生进行体能测试,成绩记为 1 分,2 分,3 分,4 分共 4 个等级,将调查结果绘制成的统计图如图309 所示根据图中信息,这些学生的平均分数是()图 309A2.25 分B2.5 分C2.95 分D3 分点评:(1)本题考查从统计图中获取信息的能力和平均数
23、的概念,难度中等(2)求解本题的关键在于熟练地从统计图中获取信息,并综合处理解析:根据统计图可得总人数1230%40(人),1 分有3 人,3 分有 4042.5%17(人),4 分有 12 人,2 分有8 人,x1328317412402.95(分)答案:C4(2013浙江宁波)2013 年 5 月 7日浙江省 11 个城市的空气质量指数(AQI)如图 3010 所示(1)这 11个城市当天的空气质量指数的极差、众数和中位数分别是多少?图 3010(2)当 0AQI50 时,空气质量为优 求这 11个城市当天的空气质量为优的频率;(3)求宁波、嘉兴、舟山、绍兴、台州五个城市当天的空气质量指数
24、的平均数点评:(1)本题主要考查条形统计图以及极差、众数、中位数、平均数,难度中等(2)读懂统计图,从条形统计图中得到必要的信息是解决本题的关键解析:(1)极差是 803743;将统计图中的 11 个数据从小到大排列得:37,42,43,49,50,50,55,57,60,73,80,众数是 50,中位数是 50.(2)这 11 个城市中当天的空气质量为优的有6 个,这 11 个城市当天的空气质量为优的频率为611.(3)x15(5060573755)51.8.5(2013广东湛江)2013年 3 月 28日是全国中小学生安全教育日,某学校为加强学生的安全意识,组织了全校1500名学生参加安全
25、知识竞赛,从中抽取了部分学生的成绩(得分取正整数,满分为100分)进行统计成绩频率分布表图 3011请根据尚未完成的频率分布表和频数分布直方图(如图 3011),解答下列问题:(1)这次抽取了_名学生的竞赛成绩进行统计,其中 m_,n_;(2)补全频数分布直方图;(3)若成绩在 70分以下(含 70分)的学生为安全意识不强,有待进一步加强安全教育,则该校安全意识不强的学生约有多少人?分数段频数频率50.560.5160.0860.570.5400.270.580.5500.2580.590.5m0.3590.5100.524n点评:(1)本题主要考查频数分布直方图、频率分布表以及利用样本 估计
26、总体,难度中等(2)解决本题的关键是读懂频数分布直方图,能利用统计图获取信息;利用统计图获取信息时,必须认真观察、分析、研究统计图,才能作出正确的判断和解决问题解析:(1)200700.12(抽取的学生数为160.08200,m2000.3570,n242000.12.)(2)如解图 3 中阴影所示(频数为 70)(解图 3)(3)15001640200420(人)答:该校安全意识不强的学生约有420 人人有了知识,就会具备各种分析能力,明辨是非的能力。所以我们要勤恳读书,广泛阅读,古人说“书中自有黄金屋。”通过阅读科技书籍,我们能丰富知识,培养逻辑思维能力;通过阅读文学作品,我们能提高文学鉴赏水平,培养文学情趣;通过阅读报刊,我们能增长见识,扩大自己的知识面。有许多书籍还能培养我们的道德情操,给我们巨大的精神力量,鼓舞我们前进。