1、2020-20212020-2021 学年新教材人教学年新教材人教 A A 版选择性必修第三册版选择性必修第三册第八章第八章成成 对数据的统计分析对数据的统计分析单元测试单元测试 1、已知两变量已知两变量 x x 与与 y y 的统计数据如下表:的统计数据如下表: x x4 42 23 35 5 y y4949262639395454 根据上表可得回归方程根据上表可得回归方程中中 9.49.4,则当,则当 x x6 6 时,时, 的值为的值为( () ) A A63.663.6 B B65.565.5 C C67.767.7 D D72.072.0 2、某公司生产三种型号的轿车,产量分别为 1
2、600 辆、6000 辆和 2000 辆,为检验 公司的产品质量,现从这三种型号的轿车中抽取 48 辆进行检验,这三种型号的轿 车依次应抽取 () A. 16,16,16B. 12,27,9C. 8,30,10D. 4,33,11 3、已知 x、y 的取值如下表所示: x0134 y 2.2 4.34.86.7 从散点图分析,y 与 x 线性相关,且,则 a 的值为() A2.8B2.6C3.6D3.2 4、某超市为了了解某超市为了了解“微信支付微信支付”与与“支付宝支付支付宝支付”的情况(的情况(“微信支付微信支付”与与“支支 付宝支付付宝支付”统称为统称为“移动支付移动支付”) ,对消费者
3、在该超市在对消费者在该超市在 20192019 年年 1-61-6 月的支付方式月的支付方式 进行统计,得到如图所示的折线图,则下列判断正确的是(进行统计,得到如图所示的折线图,则下列判断正确的是() 这这 6 6 个月中使用个月中使用“微信支付微信支付”的总次数比使用的总次数比使用“支付宝支付支付宝支付”的总次数多的总次数多 这这 6 6 个月中使用个月中使用“微信支付微信支付”的消费总额比使用的消费总额比使用“支付宝支付支付宝支付”的消费总额大的消费总额大 这这 6 6 个月中个月中 4 4 月份平均每天使用月份平均每天使用“移动支付移动支付”的次数最多的次数最多 2 2 月份平均每天使用
4、月份平均每天使用“移动支付移动支付”比比 5 5 月份平均每天使用月份平均每天使用“移动支付移动支付”的次数多的次数多 A A B BC CD D 5、甲、乙两名学生的六次数学测验成绩(百分制)的茎叶图如图所示 甲同学成绩的中位数大于乙同学成绩的中位数; 甲同学的平均分比乙同学的平均分高; 甲同学的平均分比乙同学的平均分低; 甲同学成绩的方差小于乙同学成绩的方差 上面说法正确的是() ABCD 6、某地物价部门对该地的 5 家商场的某商品一天的销售量及其价格进行调查,5 家 商场该商品的售价x元和销售量y件之间的一组数据如下表所示,由散点图知,销 售量y与价格x之间有较好的线性相关关系,其线性
5、回归直线方程是3.2yxa , 则 a 值为() 价格x(元) 99. 510 10. 5 11 销 售 量y (件) 1110865 A. 30B. 40C. 45D. 50 7、已知回归直线的斜率的估计值为 123,样本点的中心为(4,5) ,则回归直线 方程为() A1.234yxB1.235yx C1.230.08yxD0.081.23yx 8、某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性 回归方程 y =a+bx经计算,方程为 y 20-0.8x,则该方程参数的计算() Aa 值是明显不对的Bb 值是明显不对的 Ca 值和 b 值都是不对的Da 值和 b 值
6、都是正确的 9、某高校调查了 320 名学生每周的自习时间(单位:小时) ,制成了下图所示的频 率分布直方图,其中自习时间的范围是,样本数据分组为, ,.根据直方图,这 320 名学生中每周的 自习时间不足 22. 5 小时的人数是() A. 68B. 72C. 76D. 80 10、用系统抽样法从 160 名学生中抽取容量为 20 的样本,将 160 名学生从 1160 编号,按编号顺序平均分成 20 组(18 号,916 号,153160 号).若第 15 组应抽出的号码为 116,则第一组中用抽签方法确定的号码是() A.4B.5C.6D.7 11、已知变量之间的线性回归方程为,且变量之
7、间的一组关系数 据如下表所示,则下列说法错误的是() A. 变量之间呈现负相关关系B. 可以预测,当时, C.D. 由表格数据知,该回归直线必过点 12、某班 50 位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组 区间是:40,50) ,50,60) ,60,70) ,70,80) ,80,90) ,90,100已 知图中 x=0.018,则由直观图估算出中位数(精确到 0.1)的值为() A. 75.5B. 75.2C. 75.1D. 75.3 13、某中学进行了该学年度期末统一考试,该校为了了解高一年级 1 000 名学生的 考试成绩,从中随机抽取了 100 名学生的成绩单,
8、就这个问题来说,下面:1 000 名学生是总体;每个学生是个体;1 000 名学生的成绩是一个个体;样本的 容量是 100.说法正确的是_ 14、甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了 5 次,成 绩如下表(单位:环) 甲108999 乙1010799 如果甲、乙两人中只有 1 人入选,则入选的应是 15、我校高一、高二、高三共有学生我校高一、高二、高三共有学生 18001800 名,为了了解同学们对名,为了了解同学们对“智慧课堂智慧课堂”的的 意见,计划采用分层抽样的方法,从这意见,计划采用分层抽样的方法,从这 18001800 名学生中抽取一个容量为名学生中抽取一个容
9、量为 3636 的样本的样本. . 若从高一若从高一、高二高二、高三抽取的人数恰好是从小到大排列的连续偶数高三抽取的人数恰好是从小到大排列的连续偶数,则我校高三年则我校高三年 级的学生人数为级的学生人数为_._. 16、某次体检,6 名同学的身高(单位:米)分别为 1. 71,1. 78,1. 75,1. 80,1. 69,1.77,则这组数据的中位数是(米). 17、改革开放以来,我国农村改革开放以来,我国农村 7 7 亿多贫困人口摆脱贫困,贫困发生率由亿多贫困人口摆脱贫困,贫困发生率由 19781978 年的年的 97.5%下降到 下降到 20182018 年底的年底的1.4%,创造了人类
10、减贫史上的中国奇迹创造了人类减贫史上的中国奇迹,为全球减贫事为全球减贫事 业贡献了中国智慧和中国方案业贡献了中国智慧和中国方案“贫困发生率贫困发生率”是指低于贫困线的人口占全体人口是指低于贫困线的人口占全体人口 的比例的比例.2012.2012 年至年至 20182018 年我国贫困发生率的数据如表:年我国贫困发生率的数据如表: 年份(年份(t)20122012201320132014201420152015201620162017201720182018 贫 困 发 生 率贫 困 发 生 率 (%)y 10.210.28.58.57.27.25.75.74.54.53.13.11.41.4
11、(1 1)从表中所给的)从表中所给的 7 7 个贫困发生率数据中任选两个,求两个都低于个贫困发生率数据中任选两个,求两个都低于5%的概率;的概率; (2 2)设年份代码设年份代码 2015xt ,利用回归方程利用回归方程,分析分析 20122012 年至年至 20182018 年贫困发生率年贫困发生率 的变化情况,并预测的变化情况,并预测 20192019 年的贫困发生率年的贫困发生率 附:回归直线附:回归直线 ybxa 的斜率和截距的最小二乘估计公式为:的斜率和截距的最小二乘估计公式为: 1 2 2 1 n ii i n i i x ynxy b xnx , aybx . . 18、某高中社
12、团进行社会实践,对25,55岁的人群随机抽取 n 人进行了一次是否 开通“微博”的调查, 若开通“微博”的为“时尚族”, 否则称为“非时尚族” 通 过调查分别得到如图 1 所示统计表和如图 2 所示各年龄段人数频率分布直方图: 请完成以下问题: (1)补全频率直方图,并求 n,a,p 的值 (2)从40,45)岁和45,50)岁年龄段的“时尚族”中采用分层抽样法抽取 18 人参加网络时尚达人大赛, 其中选取 3 人作为领队, 记选取的 3 名领队中年龄在40, 45)岁得人数为 X,求 X 的分布列和数学期望 E(X) 19、某校某校 200200 名学生的数学期中考试成绩频率分布直方图如图所
13、示名学生的数学期中考试成绩频率分布直方图如图所示,其中成绩分组其中成绩分组 区间是区间是70,80),80,90),90,100),100,110),110,120) (1 1)求图中)求图中m的值;的值; (2 2)根据频率分布直方图,估计这)根据频率分布直方图,估计这 200200 名学生的平均分;名学生的平均分; (3 3)若这)若这 200200 名学生的数学成绩中,某些分数段的人数名学生的数学成绩中,某些分数段的人数x与英语成绩相应分数段与英语成绩相应分数段 的人数的人数 y 之比如下表所示,求英语成绩在之比如下表所示,求英语成绩在90,120)的人数的人数 分数段分数段70,80)
14、80,90) 90,100)100,110)110,120) :x y 1:22:16:51:21:1 参考答案参考答案 1、答案 B B 先根据题意求出,代入回归方程求出 ,再将 x6 代入,求出 y 的值即可. 详解 由表可知,回归方程经过样本中心,代入求出,从而当 x=6 时, =65.5.5 故选 B 名师点评 本题考查了线性回归方程,回归方程经过样本中心是解题的关键,属于基础题. 2、答案 C 这三种型号的轿车依次应抽取 选 C. 名师点评:在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要 求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,
15、 即 niNinN. 3、答案 B 由于回归直线经过样本中心点,因此首先应根据所给的的对应数值表计算出 样本中心点的坐标,再将其代入回归直线,即可求出的值根 据表格容易求得样本中心点的坐标是,代入即可得出,故选 B 考查目的:线性回归 4、答案 C 根据折线图,对逐项分析计算即可. 详解 由图像知,使用微信支付的总次数比使用支付宝支付的总次数多,故正确; 图像中纵坐标是消费次数,并不知道消费总额,故错误; 由图像知,四月份移动支付消费次数更多,所以平均值也最大,故正确; 二月 份平 均每 天消 费次 数 4.824.03 0.316 28 ,五 月份 平均 每天 消费 次数 4.994.17
16、0.295 31 ,0.316 0.295 ,故正确. 故选:C 名师点评 本题主要考查折线图的应用以及对数据分析处理的能力,属于基础题. 5、答案 A 中甲的中位数是 81,乙的中位数是 87.5,因此乙的中位数较大;甲的平均分为 727680828690 81 6 ,乙的平均分为 6978 87889296 85 6 ,所以 乙的平均分高;中甲的数据比较集中,乙的数据比较分散,因此甲的方差较小 考查目的:1.茎叶图;2.平均数中位数方差 6、答案 B 由题意, 99.5 10 10.5 1111 10865 10,8 55 xy ,因为线性回归直线 方程是3.2,83.2 10,40yxa
17、aa ,故选 B. 7、答案 C 8、答案 B 直接根据实际情况分析,可知时间的增加成绩应是增加的。 9、答案 B 由频率分布直方图可得,320 名学生中每周的自习时间不足 22.5 小时的人数是 人选 B 10、答案 A 由题意,可知系统抽样的组数为 20,间隔为 8,设第一组抽出的号码为 x,则由系统抽 样的法则,可知第 n 组抽出个数的号码应为 x+8(n-1) ,所以第 16 组应抽出的号码为 x+8(16-1)=123,解得 x=3,所以第 2 组中应抽出个体的号码是 3+(2-1)8=11.故 答案为:11. 考查目的:系统抽样方法 11、答案 C 由题意得,由,得变量 , 之间呈
18、负相关,故 A 正确;当时,则 , 故 B 正 确 ; 由 数 据 表 格 可 知, ,则,解得,故 C 错;由数据表易 知,数据中心为,故 D 正确.故选 C. 12、答案 B 根 据 频 率 分 布 直 方 图 , 得 :0.006 20.01100.220.5 (), 0.220.054 100.760.5, 所 以 中 位 数 应 在7080,)内 , 可 设 为x, 则 700.0540.220.5x,解得75.2x ,故选 B. 13、答案 1 000 名学生的成绩是总体,其容量是 1 000,100 名学生的成绩组成样本,其容量是 100. 14、答案甲 15、答案 700 设从
19、高三年级抽取的学生人数为 2x 人,由题意利用分层抽样的定义和方法,求出 x 的 值,可得高三年级的学生人数. 详解:设从高三年级抽取的学生人数为 2x 人,则从高二、高一年级抽取的人数分别为 2x2,2x4.4. 由题意可得 2222436xxx , 7x . 设我校高三年级的学生人数为 N,再根据 362 7 1800N ,求得 N700 故答案为:700. 名师点评 本题主要考查分层抽样,属于基础题. 16、答案1.76 把样本数据按照由小到大排列中间两数为1.75,1.77,所以中位数为它们的平均数 1.75 1.77 1.76 2 . 考查目的:样本中位数. 17、答案(1) 1 7
20、 (2)0.1%. 试题分析试题分析: (1)设 2012 年至 2015 年贫困发生率分别为 1 A, 2 A, 3 A, 4 A,均大于 5% 设 2016 年至 2018 年贫困发生率分别为 1 B, 2 B, 3 B, 均小于 5%, 列出从 2012 年至 2018 年贫困发生率的 7 个数据中任选两个, 可能的情况, 最后利用古典概型公式, 求出概率; (2)根据题意列出年份代码与贫困发生率之间的关系,分别计算求出 , ,x y 7 1 it i x y 7 2 1 i i xx 的值,代入公式,求出b, a 的值,求出回归直线方程,并通 过回归直线方程预测 2019 年底我国贫困
21、发生率. 详解 (1)设 2012 年至 2015 年贫困发生率分别为 1 A, 2 A, 3 A, 4 A,均大于 5% 设 2016 年至 2018 年贫困发生率分别为 1 B, 2 B, 3 B,均小于 5% 从 2012 年至 2018 年贫困发生率的 7 个数据中任选两个,可能的情况如下: 2 ,A A、,A A、,A A、,A B、 2 ,A B、 3 ,A B、 23 ,A A、 24 ,A A、 21 ,A B、 22 ,A B、 23 ,A B、 34 ,A A、 31 ,A B、 32 ,A B、 33 ,A B、 41 ,A B、 42 ,A B、 43 ,A B、 12
22、 ,B B、 13 ,B B、 23 ,B B共有 21 种情况, 两个都低于 5%的情况: 12 ,B B、 13 ,B B、 23 ,B B,共 3 种情况 所以,两个都低于 5%的概率为 31 217 . (2)由题意可得: 由上表可算得:0 x , 10.28.57.25.74.53.1 1.4 5.8 7 y , 7 1 310.2 1.428.5 3.17.24.539.9 it i x y , 7 2 222 1 2 32 22 128 i i xx , 所以, 7 1 7 39.9 7 0 5.8 1.425 2828 ii i x yxy b , 5.8 1.42505.8a
23、ybx , 所以,线性回归方程为1.4255.8yx , 由以上方程: 0b ,所以在 2012 年至 2018 年贫困发生率在逐年下降,平均每年下降 1.1.425%; 当4x 时,1.425 45.80.1y , 所以,可预测 2019 年底我国贫困发生率为 0.1%. 18、答案 n=1000a=60p=0.65 解:(1)第二组的频率为 1-(0.04+0.04+0.03+0.02+0.01)5=0.3, 所以高为=0.06频率直方图如下: (2 分) 第一组的人数为=200,频率为 0.045=0.2,所以 n=1000,(3 分) 所以第二组的人数为 10000.3=300,p=0
24、.65,(4 分) 第四组的频率为 0.035=0.15,第四组的人数为 10000.15=150, 所以 a=1500.4=60(5 分) (2)因为40,45)岁与45,50)岁年龄段的“时尚族”的比值为 60:30=2:1, 所以采用分层抽样法抽取 18 人,40,45)岁中有 12 人,45,50)岁中有 6 人(6 分) 随机变量 X 服从超几何分布 P(X=0)=,P(X=1)=, P(X=2)=,P(X=3)= 所以随机变量 X 的分布列为 X 01 2 3 P (10 分) 数学期望 E(X)=0+1+2+3=2(12 分) 19、答案(1)0.005(2)93(3)140 试
25、题分析试题分析: (1)由频率之和为 1 求解即可; (2)由平均数的计算方法求解即可; (3)求出数学成绩在90,100),100,110),110,120)的人数,再根据比例得出英语成绩 在90,100),100,110),110,120)的人数,即可得出答案. 详解: (1)10(20.020.030.04)1m,0.005m (2)这 200 名学生的平均分 750.05850.4950.31050.21150.0593x (3)数学成绩在90,100),100,110),110,120)的人数分别为 200 0.360,200 0.240,200 0.0510 设英语成绩在90,100),100,110),110,120)的人数分别为 123 ,y yy 123 606 401 101 , 521yyy 123 50,80,10yyy 则英语成绩在90,120)的人数为508010140 名师点评 本题主要考查了补全频率分布直方图,计算平均数等,属于中档题.