1、北师北师大新版数学必修第一册第大新版数学必修第一册第六章统计综合测试题六章统计综合测试题 一、单选题一、单选题 1某中学共有学生 2500 人,其中男生 1500 人,为了解该校学生参加体育锻炼的时间, 采用分层抽样的方法从该校全体学生中抽取一个容量为 50 的样本,则样本中女生的人 数为() A10B15C20D30 2一个单位有职工 160 人,其中业务人员 96 人,管理人员 40 人,后勤人员 24 人.为 了了解职工的某种情况,要从中抽取一个容量为 20 的样本,按下述三种方法抽取: 将 160 人按 1-160 编号, 按编号顺序分成 20 组, 每组 8 人, 号码分别为 1-8
2、, 9-16, , 153-160,先从第 1 组中用抽签法抽出(09)kk号,再抽取其余组的(8 )kn号, (1,2,19)n ,如此抽取 20 人; 将 160 人按 1-160 编号,用白纸做成有 1-160 号的签放入箱内搅匀,然后从中抽取 20 个签,与签号相同的 20 个人被选出; 按 20:160=1:8 的比例,从业务人员中抽取 12 人,从管理人员中抽取 5 人,从后勤人 员中抽取 3 人,都用随机数表法从各类人员中抽取所需的人数,他们合在一起恰好抽取 20 人. 上述三种抽样方法中,按照简单随机抽样、分层抽样、系统抽样的顺序是() ABCD 3如图是一次考试结果的频率分布
3、直方图,若规定 60 分以上(含 60 分)为考试合格,则 这次考试的合格率为() A0.02B0.035C0.4D0.7 4已知样本数据 1 x, 2 x, n x的均值 5x ,则样本数据 1 22x , 2 22x , 22 n x 的均值为() A5B10C7D12 5某工厂利用随机数表对生产的 600 个零件进行抽样测试,先将 600 个零件进行编号, 编号分别为 001,002,599,600,从中抽取 60 个样本,下面提供随机数表的第 4 行到第 6 行: 32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 3
4、5 78 90 56 42 84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04 32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45 若从表中第 6 行第 6 列开始向右依次读取 3 个数据, 则得到的第 5 个样本编号是 () A522B324C535D578 6下列说法正确的是() A为了解我国中学生课外阅读的情况,应采取全面调查的方式 B一组数据 1、2、5、5、5、3、3 的中位数和众数都是 5
5、 C投掷一枚硬币 100 次,一定有 50 次“正面朝上” D若甲组数据的方差是 0.03,乙组数据的方差是 0.1,则甲组数据比乙组数据稳定 7某组数据的茎叶图如图所示,其众数为a,中位数为b,平均数为c,则() AabcBacb Cbac Dcab 82020 年 10 月 1 日是中秋节和国庆节双节同庆,很多人外出旅行或回家探亲,因此 交通比较拥堵某交通部门为了解从 A 城到 B 城实际通行所需时间,随机抽取了 n 台 车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在30,55内,按通行 时间分为30,35),35,40),40,45),45,50),50,55五组,频率分布直
6、方图如 图所示,其中通行时间在30,35)内的车辆有 235 台,则通行时间在45,50)内的车辆 台数是() A450B325C470D500 9一个频率分布表(样本容量为30)不小心被损坏了一部分(如图),只记得样本中数据 在20 60,上的频率为0.8,则估计样本在40 60,内的数据个数为() A13个 B14个 C15个D18个 10某单位组织“不忘初心,牢记使命”主题教育知识比赛,满分 100 分,统计 20 人的 得分情况如图所示,若该 20 人成绩的中位数为 a,平均数为 b,众数为 c,则下列判断 错误的是() Aa=92Bb=92Cc=90Db+c2a 11一组数据的平均数
7、为m,方差为n,将这组数据的每个数都乘以0a a 得到一 组新数据,则下列说法正确的是() A这组新数据的平均数为mB这组新数据的平均数为am C这组新数据的方差为anD这组新数据的标准差为a n 122007年以前,北京市先后组织实施了多个阶段的大气污染防治行动,针对燃煤工 业扬尘排放和机动车排放等采取了数百项治理措施.2008 年北京市首次探索区域联防 联控,取得了良好效果.2013 年北京市制定实施以防治细颗粒物为重点的2013-2017 年清洁空气行动计划 ,治理成效显著. 上图是 2000 年至 2018 年可吸入颗粒物细颗粒物二氧化氮二氧化硫等主要污染物年 日均值的折线图.根据图中
8、信息,下列结论中正确的是() A2013 年到 2018 年,空气中可吸入颗粒物的年日均值逐年下降 B2013 年到 2018 年,空气中细颗粒物的年日均值逐年下降 C2000 年到 2018 年,空气中二氧化氮的年日均值都低于 40 微克/立方米 D2000 年到 2018 年,空气中二氧化硫的年日均值最低的年份是 2008 年 二、填空题二、填空题 13在 240 个零件中,一级品有 160 个,二级品有 80 个,用分层抽样法从中抽取容量 为 60 的样本,一级品被抽到_件. 14如图所示的茎叶图记录了甲、乙两组各 5 名工人某日的产量数据(单位:件)若这 两组数据的中位数相等,且平均值
9、也相等,则x y 的值为_ 15检测 600 个某产品的质量(单位:g) ,得到的频率分布直方图中,前三组的长方形 的高度成等差数列,后三组所对应的长方形的高度成公比为 0.5 的等比数列,已知检测 的质量在 100.5105.5 之间的产品数为 150,则质量在 115.5120.5 的长方形高度为 _. 162020 年年初,新冠肺炎疫情袭击全国.口罩成为重要的抗疫物资,为了确保口罩供 应,某工厂口罩生产线高速运转,工人加班加点生产.设该工厂连续 5 天生产的口罩数 依次为 1 x, 2 x, 3 x, 4 x, 5 x(单位:十万只) ,若这组数据 1 x, 2 x, 3 x, 4 x,
10、 5 x的 方差为 1.44,且 2 1 x, 2 2 x, 2 3 x, 2 4 x, 2 5 x的平均数为 4,则该工厂这 5 天平均每天生产 口罩_十万只. 三、解答题三、解答题 17目前,新冠病毒引发的肺炎疫情在全球肆虐,为了解新冠肺炎传播途径,采取有效 防控揩施,某医院组织专家统计了该地区 1000 名患者新冠病毒潜伏期的相关信息,数 据经过汇总整理得到如图所示的频率分布直方图(用频率作为概率).潜伏期低于平均 数的患者,称为“短潜伏者”,潜伏期不低于平均数的患者,称为“长潜伏者”. (1)求这 1000 名患者潜伏期的众数、平均数; (2)计算出这 1000 名患者中“短潜伏者”的
11、人数. 18某学校为培养学生的兴趣爱好,提高学生的综合素养,在高一年级开设各种形式的 校本课程供学生选择(如书法讲座、诗歌鉴赏、奥赛讲座等).现统计了某班 50 名学生 一周用在兴趣爱好方面的学习时间 (单位:h) 的数据, 按照0,2),2,4),4,6),6,8), 8,10分成五组,得到了如下的频率分布直方图. (1)求频率分布直方图中m的值; (2)求该班学生一周用在兴趣爱好方面的平均学习时间. 19 在一次高三年级统一考试中,数学试卷有一道满分 10 分的选做题,学生可以从A,B 两道题目中任选一题作答.某校有 900 名高三学生参加了本次考试,为了了解该校学生解 答该选做题的得分情
12、况,计划从900名考生的选做题成绩中随机抽取一个容量为10的样 本,为此将 900 名考生选做题的成绩按照随机顺序依次编号为 001900. (1) 若采用随机数表法抽样,并按照以下随机数表,以加粗的数字 5 为起点,从左向右依 次读取数据,每次读取三位随机数,一行读数用完之后接下一行左端.写出样本编号的中 位数; 05 26 93 70 6022 35 85 15 1392 03 51 59 7759 56 78 06 8352 91 05 70 74 07 97 10 88 2309 98 42 99 6461 71 62 99 1506 51 29 16 9358 05 77 09 51
13、 51 26 87 85 8554 87 66 47 5473 32 08 11 1244 95 92 63 1629 56 24 29 48 26 99 61 65 5358 37 78 80 7042 10 50 67 4232 17 55 85 7494 44 67 16 94 14 65 52 68 7587 59 36 22 4126 78 63 06 5513 08 27 01 5015 29 39 39 43 (2)若采用系统抽样法抽样,且样本中最小编号为 08,求样本中所有编号之和: (3)若采用分层轴样,按照学生选择A题目或B题目,将成绩分为两层,且样本中A题 目的成绩有 8
14、 个,平均数为 7,方差为 4:样本中B题目的成绩有 2 个,平均数为 8,方差 为 1.用样本估计 900 名考生选做题得分的平均数与方差. 20某高级中学共有学生 2000 名,各年级男、女生人数如下表: 高一年级高二年级高三年级 女生373x y 男生377370z 已知在全校学生中随机抽取 1 名,抽到高二年级女生的概率是 0.19 (1)求x的值; (2)现用分层抽样在全校抽取 48 名学生,则高三年级抽取多少名? 21某快递公司近 60 天每天揽件数量的频率分布直方图如下图所示(同一组数据用该 区间的中点值作代表). (1)求这 60 天每天包裹数量的平均值和中位数; (2)在这
15、60 天中包裹件数在100,200和200,300的两组中,用分层抽样的方法抽 取 30 件,求在这两组中应分别抽取多少件? 22仰巍巍铁山,临渊源两江,重庆市 18 中创建于 1949 年,至今已建校 71 周年。在 研究校史的过程中发现了一些有趣的自然数“新声数”.定义: 对于自然数n, 在通 过列竖式进行(1)(2)nnn的运算时各位都不产生进位现象,则称这个自然数n 为“新声数”.例如:10 是“新声数”,因为 10+11+12 在列竖式计算时各位都不产生进 位现象;34 不是“新声数”,因为 34+35+36 在列竖式计算时个位产生了进位. (1)请直接写出建校 71 周年中(194
16、9 年到 2020 年)所有的“新声数”; (2)18 中人秉承“树本砺新”的理念,十年树木,百年树人.请你求出“不大于 100” 的所有“新声数”的中位数. 参考答案参考答案 1C 【分析】 先求得中学中的女生人数,然后根据样本容量,按照比例求解. 【详解】 因为共有学生 2500 人,其中男生 1500 人, 所以女生有 1000 人, 所以样本中女生的人数为 1000 5020 2500 人 故选:C 【点睛】 本题主要考查分层抽样的应用,属于基础题. 2C 【分析】 根据简单随机抽样、分层抽样、系统抽样的特征即可得出选项. 【详解】 对于,先编号,再分组,然后再等间隔抽取,符合系统抽样
17、的特征,故是系统抽样; 对于,先编号,再搅拌均匀,符合简单抽样的特征,故是简单随机抽样; 对于,按比例从各层中抽取,符合分层抽样的特征,故是分层抽样. 故选:C 【点睛】 本题考查了随机抽样,掌握各抽样的特征是解题的关键,属于基础题. 3D 【分析】 观察频率分布直方图,60 分以上的小矩形面积的和即为所求. 【详解】 观察频率分布直方图可知这次考试的合格率为0.0150.02200.7. 故选:D 【点睛】 本题考查频率分布直方图,属于基础题. 4D 【分析】 根据数据关系确定均值关系,即可得结果. 【详解】 若样本数据 1 x, 2 x, n x的均值为x,则样本数据 1 22x , 2
18、22x ,22 n x 的 均值为2 +2 x , 所以样本数据 1 22x , 2 22x ,22 n x 的均值为2 +2 2 5212x 故选:D 【点睛】 本题考查均值,考查数据分析处理能力,属基础题. 5A 【分析】 按照随机数表取数,不大于 600 的留下,大于 600 的去掉即可得 【详解】 所得样本编号依次为 436,535,577,348,522, 第 5 个是 522 故选:A 【点睛】 本题考查随机数表抽样法,属于简单题 6D 【分析】 分别根据统计的性质判断即可. 【详解】 对于 A,为了解我国中学生课外阅读的情况,应采取抽样调查的方式,故 A 错误; 对于 B,数据
19、1、2、5、5、5、3、3 按从小到大排列后为 1、2、3、3、5、5、5,则其中位 数为 3,故 B 错误; 对于 C,因为每次抛掷硬币都是随机事件,所以不一定有 50 次“正面朝上”,故 C 错误; 对于 D,因为方差越小越稳定,故 D 正确. 故选:D. 【点睛】 本题考查抽样方式的选择,中位数的求法,随机事件的理解,以及方差的性质,属于基础题. 7A 【分析】 根据茎叶图中数据算出, ,a b c即可. 【详解】 由图中数据可得23a , 2021 20.5 2 b 89 13 15 1720212323263233 20 12 c 所以abc 故选:A 8C 【分析】 根据频率分布直
20、方图求出通行时间在45,50)内的频率,然后由通行时间在30,35)内的车 辆有 235 台与频率可得结论 【详解】 因为30,35),35,40),40,45),50,55四组通行时间的频率分别是 0.1,0.25,0.4, 0.05, 所以通行时间在45,50)内的频率是10.10.250.40.050.2, 通过的车辆台数是2352470 故选:C 9C 【分析】 首先根据公式样本容量乘以频率=频数,计算样本在40 60,内的数据个数. 【详解】 由条件可知样本中数据在20 60,上的频率为0.8,所以此区间的频数为30 0.824,那 么40,60的数据个数就是244515个. 故选:
21、C 10B 【分析】 由图知: 得分889092949698100 人数4534211 从而可判断出中位数,众数,平均数. 【详解】 由图知: 得分889092949698100 人数4534211 所以92,90ac, 88 490 592 394 496 298 100 92.2 20 b . 故选:B 【点睛】 本题考查中位数,众数,平均数的计算,考查学生数据分析和运算求解能力. 11D 【分析】 设原数据为 12 , p x xx ,分别列出原数据的平均数、方差和新数据的平均数、方差,逐一分 析选项,即可得答案. 【详解】 设原数据为 12 , p x xx ,共 p 个,则平均数 1
22、2p xxx m p ,方差 222 12 1 ()()() p nxmxmxm p 对于选项 A、 B: 新数据的平均数为 1212 () pp axaxaxa xxx am pp , 故 A、 B 错误; 对于选项 C:新数据的方差为 222 12 1 ()()() p axamaxamaxam p = 22222 12 1 ()()() p axmxmxma n p ,故 C 错误; 对于选项 D:新数据的标准差为 2 a na n ,故 D 正确. 故选:D 【点睛】 本题考查一组数据的平均数、 方差、 标准差的定义与性质, 考查分析理解, 推理计算的能力, 属基础题. 12B 【分析
23、】 观察折线图,确定数据的变化规律,判断各选项 【详解】 2014 年空气中可吸入颗粒物年日均值比 2013 年多,A 错; 2013 年到 2018 年,空气中细颗粒物的年日均值逐年下降,B 正确; 2007 年(含 2007 年)之前空气中二氧化氮的年日均值都高于 40 微克/立方米,C 错; 2000 年到 2018 年,空气中二氧化硫的年日均值最低的年份是 2018 年,D 错 故选:B 1340 【分析】 利用分层抽样公式进行计算. 【详解】 依题意一级品被抽到 1602 606040 2403 (件). 故答案为:40 【点睛】 本小题主要考查分层抽样,属于基础题. 148 【分析
24、】 已知两组数据的中位数相等,可以求出y;甲组数据的平均数等于乙组数据的平均数,根据 平均数的定义可列式求出x. 【详解】 由题意易知甲组数据的中位数为 65,由于两组数据的中位数相等得5y ;甲组数据的平均 数等于乙组数据的平均数,所以可得 56626570745961676578 = 55 x , 3x ,8xy . 所以本题答案为 8. 【点睛】 本题考查了根据茎叶图求平均数,根据平均数、中位数求原始数据,考查了计算能力,属基 础题. 15 1 60 【分析】 利用公式求得产品质量在 100.5105.5 之间的频率为 1501 6004 ,根据等差数列的性质,可 知前 3 个矩形的面积
25、和为 3 4 ,则后两个矩形面积和为 1 4 ,设中间矩形的面积为x,根据题 意,求得 1 3 x ,结合题意,进而求得结果. 【详解】 由题意知产品质量在 100.5105.5 之间的频率为 1501 6004 , 则前 3 个矩形的面积和为 3 4 ,后两个矩形面积和为 1 4 . 设中间矩形的面积为x,则后两个矩形的面积为 1 2 x, 1 4 x,则 111 244 xx, 所以 1 3 x ,最后一个矩形的面积为 1 12 ,所以长方形高度为 1 60 . 故答案为: 1 60 . 【点睛】 该题考查的是有关频率分布直方图的问题, 涉及到的知识点有频率分布直方图崔颖长方形的 面积和为
26、 1,结合数列的有关性质建立等量关系式,求得结果,属于简单题目. 161.6 【分析】 设 1 x, 2 x, 3 x, 4 x, 5 x的平均数为x,根据方差的计算公式有 222 125 1 1.44 5 xxxxxx .即 2 222 125125 257.2xxxx xxxx,再利用 2 1 x, 2 2 x, 2 3 x, 2 4 x, 2 5 x的 平均数为 4 求解. 【详解】 依题意,得 222 125 20 xxx. 设 1 x, 2 x, 3 x, 4 x, 5 x的平均数为x, 根据方差的计算公式有 222 125 1 1.44 5 xxxxxx . 2 222 12512
27、5 257.2xxxx xxxx, 即 22 20 1057.2xx , 1.6x . 故答案为:1.6 【点睛】 本题主要考查样本中的数字特征,还考查了数据处理和运算求解的能力,属于基础题. 17 (1)众数 7,平均数 6; (2)500 人. 【分析】 (1)由频率分布直方图取矩形面积最大的底边中点横坐标即可得出众数;利用平均数等于 小矩形的面积与矩形底边中点横坐标之积的和即可求出平均数. (2)根据平均数,结合频率分布直方图可得低于平均数的频率,由样本总数频率即可求 解. 【详解】 (1)由频率分布直方图可得众数为 7, 平均数0.02 2 1 0.08 2 30.15 2 5 0.1
28、8 2 70.03 2 90.03 2 11 0.01 2 136 . 所以这 1000 名患者潜伏期的众数 7,平均数 6. (2)由频率分布直方图可知,小于等于6的概率为0.020.080.1520.5, 所以这 1000 名患者中“短潜伏者”的人数为1000 0.5500. 【点睛】 本题考查了频率分布直方图求平均数、 众数以及求样本容量, 考查了基本运算, 属于基础题. 18 (1)0.1m ; (2)5.08. 【分析】 (1)根据频率分布直方图,使小矩形的面积之和等于1即可求解. (2)根据频率分布直方图中平均数小矩形的面积小矩形底边中点横坐标之和即可求解. 【详解】 (1)由频率
29、分布直方图得:0.06 20.08 20.2 220.06 21m ,解得0.1m . (2)学生的平均学习时间为:1 0.123 0.165 0.47 0.29 0.125.08 . 【点睛】 本题考查了补全频率分布直方图、根据频率分布直方图求平均数,属于基础题. 19 (1)667; (2)4130; (3)平均数为 7.2,方差为 3.56. 【分析】 (1)根据题意读出的编号,将有效编号从小到大排列,由此能求出中位数。 (2)按照系统抽样法,抽出的编号可组成以 8 为首项,以 90 为公差的等差数列,由上能求出样 本编号之和即。 (3)记样本中 8 个A题目成绩分别为 1 x, 2 x
30、, 8 x,2 个B题目成绩分别为 1 y, 2 y, 由题意可知 8 1 8 756 i i x , 8 2 1 78 432 i i x , 2 1 16 i i y , 2 2 1 82 12 i i y ,由此能 用样本估计 900 名考生选做题得分的平均数,方差。 【详解】 解:(1)根据题意,读出的编号依次是: 512,916(超界),935(超界),805,770,951(超界), 512(重复),687,858,554,876,647,547,332. 将有效的编号从小到大排列,得 332,512,547,554,647,687,770,805,858,876, 所以中位数为
31、1 (647687)667 2 ; (2)由题易知,按照系统抽样法,抽出的编号可组成以 8 为首项,以 90 为公差的等差数列, 所以样本编号之和即为该数列的前 10 项之和, 即 10 10 9 90 10 84130 2 S ; (3)记样本中 8 个A题目成绩分别为 1 x, 2 x, 8 x,2 个B题目成绩分别为 1 y, 2 y, 由题意可知 8 1 8 756 i i x , 8 2 1 78 432 i i x , 2 1 16 i i y , 2 2 1 82 12 i i y , 故样本平均数为 82 11 11 (56 16)7.2 8210 ii ii xxy ; 样本
32、方差为 82 22 2 11 1 7.27.2 82 ii ii sxy 28 22 11 1 70.280.8 10 ii ii xy 8822 22 22 1111 1 70.478 0.281.682 0.8 10 iiii iiii xxyy 1 (3200.3220 1.28) 10 3.56; 所以估计该校 900 名考生该选做题得分的平均数为 7.2,方差为 3.56. 【点睛】 本题考查随机数表法对抽取数的选择,考查系统抽样法的掌握以及平均数和方差的考查,属于 基础题. 20 (1)380; (2)12. 【分析】 (1)根据已知条件,根据分层抽样是等比抽样,即可求得x; (2
33、)根据(1)中所求,求得高三年级人数,再根据抽样比即可求得结果. 【详解】 (1)0.19 2000 x ,380 x (2)高三年级人数为:2000373 377380370500yz, 现用分层抽样的方法在全校抽取 48 名学生,应在高三年级抽取的人数为: 48 50012 2000 人 21 (1)平均数和中位数都为 260 件; (2)在100,200的件数为5,在200,300的件数 为25. 【分析】 (1)由每组频率乘以组中值相加即可得平均数,设中位数为x,由落在区间0,x内的频 率为 0.5 可得结果; (2)先得频率分别为 0.1,0.5,由分层抽样的概念即可得结果. 【详解
34、】 (1)每天包裹数量的平均数为 0.1 500.1 1500.5 2500.2 3500.1 450260; 设中位数为x,易知200,300 x,则0.001 100 20.0052000.5x , 解得260 x . 所以公司每天包裹的平均数和中位数都为 260 件. (2)件数在100,200,200,300的频率分别为 0.1,0.5 频率之比为 1:5,所抽取的 30 件中,在100,200的件数为 1 30=5 6 , 在200,300的件数为 5 30=25 6 . 22 (1)2000,2001,2002,2010,2011,2012,2020; (2)20. 【分析】 (1
35、)根据“新声数”的定义从 1949 到 2020 找出即可; (2)根据“新声数”的定义,不大于 100 的数个位不超过 2,十位不超过 3 时,才符合“新 声数”的定义求解. 【详解】 (1)显然 1949 至 1999 都不是“新声数”,因为在通过列竖式进行(1)(2)nnn的 运算时要产生进位. 在 2000 至 2019 之间的数,只有个位不超过 2 时,才符合“新声数”的定义. 所以所求“新声数”为 2000,2001,2002,2010,2011,2012,2020. (2)不大于 100 的“新声数”的个数有 13 个,理由如下: 因为个位不超过 2,十位不超过 3 时,才符合“新声数”的定义. 所以不大于 100 的“新声数”有:0,1,2,10,11,12,20,21,22,30,31,32,100 共 13 个., 所以中位数为 20. 【点睛】 本题主要考查数的新定义以及有理数的加法,还考查了理解辨析的能力,属于基础题.