1、一、选择题12020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万)月份 2345口罩数 4.5432.5口罩数y与月份x之间有较好的线性相关关系,其线性回归直线方程是,则a的值为( )A6.1B5.8C5.95D6.752已知某样本的容量为50,平均数为70,方差为75现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90在对错误的数据进行更正后,重新求得样本的平均数为,方差为,则( )ABCD3一组数据的平均数为m,方差为n,将这组数据的每个数
2、都加上得到一组新数据,则下列说法正确的是( )A这组新数据的平均不变B这组新数据的平均数为amC这组新数据的方差为D这组新数据的方差不变4从两个班级各随机抽取5名学生测量身高(单位:cm),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165据此估计甲、乙两班学生的平均身高,及方差,的关系为( )A,B,C,D,5小明同学在做市场调查时得到如下样本数据13610842他由此得到回归直线的方程为,则下列说法正确的是( )变量与线性负相关 当时可以估计 变量与之间是函数关系ABCD6在一次公里的自行车个人赛中,25名参赛选手的成绩单位:分钟的茎叶图
3、如图所示,现将参赛选手按成绩由好到差编为号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为A95B96C97D987某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( )A70和50B70和67C75和50D75和678已知,取值如下表:0145681.31.85.66.17.49.3从所得的散点图分析可知:与线性相关,且,则( )ABCD9甲、乙两名同学在五次数学考试中的成绩统计
4、如下面的茎叶图所示,若甲、乙两人的平均成绩分别是,观察茎叶图,下列结论正确的是( )A,乙比甲成绩稳定B,乙比甲成绩稳定C,甲比乙成绩稳定D,甲比乙成绩稳定10已知x,y的取值如表:x2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是ABCD11已知某企业上半年前5个月产品广告投入与利润额统计如下:月份12345广告投入(万元)9.59.39.18.99.7利润(万元)9289898793由此所得回归方程为,若6月份广告投入10(万元)估计所获利润为( )A97万元B96.5万元C95.25万元D97.25万元12在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若
5、将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间上的学生人数是( )A4B5C6D7二、填空题13通过市场调查,得到某种产品的资金投入x(单位:万元)与获得的利润y(单位:万元)的数据,如表所示:资金投入x23456利润y0.40.611.21.8根据表格提供的数据,用最小二乘法求线性回归直线方程为,现投入资金15万元,求获得利润的估计值(单位:万元)为_.14如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _15已知一组数据6,7,8,的平均数是8,且,则该组数据的方差为_.16中医药
6、是反映中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份的含量(单位:)与药物功效(单位:药物单位)之间具有关系:.检测这种药品一个批次的5个样本,得到成份的平均值为,标准差为,估计这批中成药的药物功效的平均值为_药物单位17为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_.18为了解某地区某种农产品的年产量(单位:吨)对价格(单位:千元/吨)的影响,对近五年
7、该农产品的年产量和价格统计如下表:123457.06.53.82.2已知和具有线性相关关系,且回归方程为,那么表中的值为_19一个容量为40的样本,分成若干组,在它的频率分布直方图中,某一组相应的小长方形的面积为0.4,则该组的频数是_20如图是某工厂对一批新产品长度单位:检测结果的频率分布直方图估计这批产品的中位数为_三、解答题21我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额(单位:亿元)对年盈利额(单位:亿元)的影响,研究了“十二五”和“十三五”规划发展
8、期间近10年年研发资金投入额和年盈利额的数据.通过对比分析,建立了两个函数模型:,其中,均为常数,为自然对数的底数令,经计算得如下数据:262156526805.36112501302.612(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)()根据(1)的选择及表中数据,建立关于的回归方程;(系数精确到0.01)()若希望2021年盈利额为250亿元,请预测2021年的研发资金投入额为多少亿元?(结果精确到0.01)附:相关系数,回归直线中:,参考数据:,22我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加
9、重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年17月份煤改气、煤改电的用户数量. (1)在给定坐标系中作出煤改气、煤改电用户数量y随月份t变化的散点图,并用散点图和相关系数说明y与t之间具有线性相关性;(2)建立y关于t的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量.参考数据:.参考公式:相关系数.回归方程
10、中斜率和截距的最小二乘估计公式分别为:.23某食品厂为了检测某批袋装食品的质量,从该批食品中抽取了一个容量为100的样本,测量它们的质量(单位:克)根据数据分为,七组,其频率分布直方图如图所示(1)根据频率分布直方图,估计这批袋装食品质量的中位数(保留一位小数)(2)记产品质量在内为优等品,每袋可获利5元;产品质量在内为不合格品,每袋亏损2元;其余的为合格品,每袋可获利3元若该批食品共有10000袋,以样本的频率代替总体在各组的频率,求该批袋装食品的总利润24两台机床同时生产直径为10的零件,为了检验产品质量,质量质检员从两台机床的产品中各抽取4件进行测量,结果如下:机床甲109.81010.
11、2机床乙10.1109.910如果你是质量检测员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求.25全世界越来越关注环境保护问题,某监测站点于2016年8月某日起连续天监测空气质量指数(),数据统计如下:空气质量指数()0-5051-100101-150151-200201-250空气质量等级空气优空气良轻度污染中度污染重度污染天数2040105(1)根据所给统计表和频率分布直方图中的信息求出的值,并完成频率分布直方图;(2)在空气质量指数分别为51-100和151-200的监测数据中,用分层抽样的方法抽取5天,从中任意选取2天,求事件“两天空气都为良”发生的概
12、率.26随着各国经贸关系的进一步加深,许多国外的热带水果进入国内市场,牛油果作为一种热带水果,越来越多的中国消费者对这种水果有了一种全新的认识,它富含多种维生素、丰富的脂肪和蛋白质,钠、钾、镁、钙等含量也高,除作生果食用外也可作菜肴和罐头.牛油果原产于墨西哥和中美洲,后在加利福尼亚州被普遍种植.因此加利福尼亚州成为世界上最大的牛油果生产地,在全世界热带和亚热带地区均有种植,但以美国南部、危地马拉、墨西哥及古巴栽培最多,并形成了墨西哥系、危地马拉系、西印度系三大种群,我国的广东、海南、福建、广西、台湾、云南及四川等地都有少量栽培.市场上的牛油果大部分都是进口的.为了调查市场上牛油果的等级代码数值
13、与销售单价之间的关系,经统计得到如下数据:等级代码数值384858687888销售单价(元/)16.818.820.822.82425.8(1)已知销售单价与等级代码数值之间存在线性相关关系,利用前5组数据求出关于的线性回归方程;(2)若由(1)中线性回归方程得到的估计值与最后一组数据的实际值之间的误差不超过1,则认为所求回归方程是有效可靠的,请判断所求回归直线方程是否有效可靠?(3)若一果园估计可以收获等级代码数值为85的牛油果,求该果园估计收入为多少元.参考公式:对一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.参考数据:,.【参考答案】*试卷处理标记,请不要删除一、选择题1C解
14、析:C【分析】求得,得到样本中心点,再把样本中心点代入回归直线方程得解.【详解】由表可得,带入线性回归方程中有,故选:.【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.2A解析:A【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小.【详解】由题意,可得,设收集的48个准确数据分别记为,则,所以故选:A【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题3D解析:D【分析】考查平均数和方差的性质,基础题【详解】设这一组数据为,
15、由,故选:D【点睛】本题主要考查方差的性质,考查了运算能力,属于容易题.4C解析:C【解析】【分析】利用公式求得和,从而得到和的大小,观察两组数据的波动程度,可以得到与的大小,从而求得结果.【详解】甲班平均身高,乙班平均身高,所以,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以,故选C.【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.5C解析:C【解析】【分析】根据数据和回归方程对每一个选项逐一判断得到答案.【详解】变量与线性负相关
16、,正确将代入回归方程,得到,正确将代入回归方程,解得,正确变量与之间是相关关系,不是函数关系,错误答案为C【点睛】本题考查了回归方程的相关知识,其中中心点一定在回归方程上是同学容易遗忘的知识点.6C解析:C【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可.【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等.7B解析:B【解析】【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其
17、异同,然后整体代入即可求解【详解】设更正前甲,乙,的成绩依次为a1,a2,a50,则a1+a2+a505070,即60+90+a3+a505070,(a170)2+(a270)2+(a5070)25075,即102+202+(a370)2+(a5070)25075更正后平均分为(80+70+a3+a50)70;方差为s2(8070)2+(7070)2+(a370)2+(a5070)2100+(a370)2+(a5070)2100+507510220267故选B【点睛】本题考查平均数与方差的概念与应用问题,是基础题8D解析:D【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,
18、利用回归直线必过样本中心点,代入求得结果.详解:依题意得,因为回归直线必过样本中心点,即点,所以有,解得,故选D.点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.9A解析:A【解析】【分析】根据茎叶图中的数据,即可计算出两人平均分,再根据茎叶图的分布情况可知乙成绩稳定.【详解】由茎叶图知,甲的平均数是,乙的平均数是所以,从茎叶图上可以看出乙的数据比甲的数据集中,乙比甲成绩稳定故选:A【点睛】本题考查茎叶图中两组数据的平均数和稳定程度,平均数要进行计算,稳定程度可通过计算方差或通过数据排布形状作出比
19、较10B解析:B【解析】【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标【详解】根据题意可得,由线性回归方程一定过样本中心点,故选:B【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题11C解析:C【解析】【分析】首先求出的平均数,将样本中心点代入回归方程中求出的值,然后写出回归方程,然后将代入求解即可【详解】代入到回归方程为,解得将代入,解得故选【点睛】本题是一道关于线性回归方程的题目,解答本题的关键是求出线性回归
20、方程,属于基础题。12B解析:B【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果.详解:由题意可知,学生的成绩如下:; ; ; ; ;.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人,则所抽取的学生的成绩在区间上的学生人数为.本题选择B选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.二、填空题13【分析】根据线性回归方程过样本数据中心点可求出b代入即可求解【详解】由表中数据可得所以过点代入可得所以当时即获得利润大约为万元故答案为:【点睛】本题主要考查了线性回归方程样本数据中心
21、点线性回归方程的解析:【分析】根据线性回归方程过样本数据中心点,可求出b,代入即可求解.【详解】由表中数据可得,所以过点,代入可得,所以,当时,即获得利润大约为万元.故答案为:【点睛】本题主要考查了线性回归方程,样本数据中心点,线性回归方程的应用,属于中档题.14或【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为8284848689则平均数方差故答案为:或【点睛】本题考查茎叶图考查平均数与方差的计算是基础题解析:或【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为82,84,84,86,89,则平均数方差 故答案为:或【点睛】本
22、题考查茎叶图,考查平均数与方差的计算,是基础题152【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2【分析】根据题意,列出关于的等量关系式,结合,求得的值,利用方差公式求得结果.【详解】一组数据的平均数是8,且,所以,化简得,又,所以的值分别为或,所以该组数据的方差为:,故答案是:2.【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.1692【解析】【分析】由题可得进而可得再计算出从而得出答案【详解】5
23、个样本成份的平均值为标准差为所以即解得因为所以所以这批中成药的药物功效的平均值药物单位【点睛】本题考查求几个数的平均数解题的关键是求解析:92【解析】【分析】由题可得,进而可得,再计算出,从而得出答案【详解】5个样本成份的平均值为,标准差为,所以,即,解得因为,所以所以这批中成药的药物功效的平均值药物单位【点睛】本题考查求几个数的平均数,解题的关键是求出,属于一般题175000【分析】由题意其他年级抽取200人其他年级共有学生2000人根据题意列出等式即可求出该校学生总人数【详解】由题意其他年级抽取200人其他年级共有学生2000人则该校学生总人数为人故答案是:5解析:5000【分析】由题意,
24、其他年级抽取200人,其他年级共有学生2000人,根据题意列出等式,即可求出该校学生总人数.【详解】由题意,其他年级抽取200人,其他年级共有学生2000人,则该校学生总人数为人,故答案是:5000.【点睛】该题考查的是有关分层抽样的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,属于简单题目.185【解析】将样本中心代入回归方程得到m=55故答案为:55解析:5【解析】 将样本中心代入回归方程得到m=5.5.故答案为:5.5.1916【解析】根据频率直方图的含义每组小矩形的面积就是该组数据在总体中出现的频率所以该组频数为故填16解析:16【解析】根据频率直方图的含义,每组小矩
25、形的面积就是该组数据在总体中出现的频率,所以该组频数为,故填16.205【解析】根据频率分布直方图得;0025+0045=0305;中位数应在2025内设中位数为x则03+(x20)008=05解得x=225;这批产品的中解析:5【解析】根据频率分布直方图,得;0.025+0.045=0.30.5;中位数应在2025内,设中位数为x,则0.3+(x20)0.08=0.5,解得x=22.5;这批产品的中位数是22.5.故答案为22.5.点睛:用频率分布直方图估计总体特征数字的方法:众数:最高小长方形底边中点的横坐标;中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;平均数:频率
26、分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.三、解答题21(1)模型的拟合程度更好;(2)();()27.56.【分析】(1)通过换元,模型写成,模型两边取对数,写成,根据参考数列,求两个方程的相关系数,再比较大小;(2)()由(1)可知选择,化为,后根据公式求和,再换回求回归方程;()根据回归方程,令,求的值.【详解】(1)设和的相关系数为,和的相关系数为,由题意,则,因此从相关系数的角度,模型的拟合程度更好(2)()先建立关于的线性回归方程,由,得,即,所以关于的线性回归方程为,所以,则()2021年盈利额(亿元),所以,则,因为,所以所以2021年的研发资金投入量约为2
27、7.56亿元【点睛】思路点睛:本题考查非线性回归方程,一般可根据换元,两边取对数的方法,变形为线性回归直线方程,再根据参考公式求系数.22(1)散点图见解析,y与t的线性相关性相当高,理由见解析;(2),2.02万户.【分析】(1)根据表格中对应的与的关系,描绘散点图,并根据参考数据求,说明相关性;(2)根据参考数据求和,求回归直线方程,并令,求的预测值.【详解】(1)作出散点图如图所示:由条形图数据和参考数据得,.因为y与t的相关系数近似为0.99,说明y与t的线性相关性相当高,从而可以用线性回归模型拟合y与t的关系.(2)由及(1)得,所以,y关于t的回归方程为:.将代入回归方程得:,所以
28、预测11月份该省煤改气、煤改电的用户数量达到2.02万户.【点睛】关键点点睛:本题考查回归直线方程,此类问题的关键是根据参考数据和公式相结合,求和,一般计算量较大,需计算严谨,准确.23(1)99.6;(2)35600元.【分析】(1)根据频率分布直方图中的中位数在长方形面积为的地方取得得解 (2)求出批食品中优等品、不合格品、合格品的袋数得总利润.【详解】(1)因为,所以样本质量的中位数在内设样本质量的中位数为m,则,解得,故这批袋装食品质量的中位数为99.6(2)由题意可得,这批食品中优等品有袋, 这批食品中不合格品有袋, 这批食品中合格品有袋故该批袋装食品的总利润为元【点睛】频率分布直方
29、图中的中位数求法在长方形面积为的地方取得是解题关键,属于基础题.24机床乙的零件质量更符合要求,运算见解析.【详解】先考虑各自的平均数:设机床甲的平均数、方差分别为;机床乙的平均数、方差分别为,两者平均数相同,再考虑各自的方差:,机床乙的零件质量较稳定,乙更符合要求.25(1)答案见解析;(2).【解析】【试题分析】(1)借助题设中提供的频率分布直方图,算出0-50的频率为,进而求出样本容量,从而求出,最后完成频率分布直方图;(2)先运用分层抽样的方法求出空气质量指数为51-100和的监测天数中分别抽取4天和1天,即将空气质量指数为51-100的4天分别记为;将空气质量指数为151-200的1
30、天记为,算出从中任取2天的基本事件数为10种和其中事件“两天空气都为良”包含的基本事件数为6种,进而算得事件“两天都为良”发生的概率是:(1)由频率分布直方图可知0-50的频率为,所以,从而,频率分布直方图补充如下图所示.(2)在空气质量指数为51-100和的监测天数中分别抽取4天和1天,在所抽取的5天中,将空气质量指数为51-100的4天分别记为;将空气质量指数为151-200的1天记为,从中任取2天的基本事件分别为:,共10种.其中事件“两天空气都为良”包含的基本事件为:,共6种,所以事件“两天都为良”发生的概率是.26(1);(2)所求回归直线方程是有效可靠的;(3)该果园预计收入25095.84元.【分析】(1)求出的平均值,的平均值,再根据公式求出和,即可得出回归方程;(2)将代入(1)中的回归方程,求出,然后用和1比较即可判断;(3)将代入回归方程估计出单价,即可计算出收入.【详解】(1)由题意,得,则,故所求回归方程为;(2)当时,所以,所以所求回归直线方程是有效可靠的;(3)当,所以(元),所以该果园预计收入25095.84元.【点睛】本题考查回归方程的求法以及利用回归方程估计值,属于基础题.