1、一、选择题1某校举行演讲比赛,9位评委给选手打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的)无法看清,若统计员计算无误,则数字应该是( ) A5B4C3D22某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为,新平均分和新方差分别为,若此同学的得分恰好为,则( )A,B,C,D,3采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间内的
2、人员编号之和为( )A600B1225C1530D18554在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:价格99.510.511销售量11865由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的( )A10B11C12D10.55将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示,则5个剩余分数的方差为( )ABC36D6从两个班级各随机抽取5名学生测量身高(单位:c
3、m),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165据此估计甲、乙两班学生的平均身高,及方差,的关系为( )A,B,C,D,7已知一组数据的茎叶图如图所示,则该组数据的平均数为()A85B84C83D818已知变量之间的线性回归方程为,且变量之间的一组相关数据如表所示,则下列说法错误的是( )A变量之间呈现负相关关系B的值等于5C变量之间的相关系数D由表格数据知,该回归直线必过点9将1000名学生的编号如下:0001,0002,0003,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,0020中抽取的号码为0
4、015时,抽取的第40个号码为( )A0795B0780C0810D081510一组数据中的每一个数据都乘,再减去,得到一组新数据,若求得新数据的平均数是,方差是,则原来数据的平均数和方差分别是A,B,C,D,11某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为A60B50C40D3012甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s1,s2分别表示甲、乙选手分数的标准差,则s1与s2的关系是()As1s2Bs1s2
5、Cs1s2D不确定二、填空题13对两个变量和进行回归分析,得到一组样本数据,则下列说法中正确的序号是_.由样本数据得到的回归直线方程必过样本点的中心残差平方和越小的模型,拟合的效果越好用相关指数来刻画回归效果,越小说明拟合效果越好若变量和之间的相关系数为,则变量和之间线性相关性强14一组数据由小到大依次为,且平均数为9,则的最小值为_15下表是某厂14月份用水量(单位:百吨)的一组数据:月份1234用水量4.5432.5由散点图可知,用水量与月份之间有较好的线性相关关系,其线性回归直线方程是,则等于_16某校共有学生1600人,其中高一年级400人为了解各年级学生的兴趣爱好情况,用分层抽样的方
6、法从中抽取容量为80的样本,则应抽取高一学生_人17某校有高一学生名,其中男生数与女生数之比为,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为的样本,若样本中男生比女生多人,则_18某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_名学生19一组样本数据按从小到大的顺序排列为:,已知这组数据的平均数与中位数均为,则其方差为_20已知一组数据,8,7,9,7,若这组数据的平均数为8,则它们的方差为_三、
7、解答题21为了了解某工厂生产的产品情况,从该工厂生产的产品随机抽取了一个容量为200的样本,测量它们的尺寸(单位:),数据分为,七组,其频率分布直方图如图所示.(1)根据频率分布直方图,求200件样本中尺寸在内的样本数;(2)记产品尺寸在内为等品,每件可获利6元;产品尺寸在内为不合格品,每件亏损3元;其余的为合格品,每件可获利4元.若该机器一个月共生产2000件产品.以样本的频率代替总体在各组的频率,若单月利润未能达到9000元,则需要对该工厂设备实施升级改造.试判断是否需要对该工厂设备实施升级改造.22“水是生命之源”,但是据科学界统计可用淡水资源仅占地球储水总量的,全世界近人口受到水荒的威
8、胁某市为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨):一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照分成9组,制成了如图所示的频率分布直方图(1)求直方图中的值;(2)设该市有60万居民,估计全市居民中月均用水量不低于2.5吨的人数,并说明理由;(3)若该市政府希望使的居民每月的用水不按议价收费,估计的值,并说明理由23是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与的浓度是否相关,现采集到某城市周一至周五某时间段
9、车流量与浓度的数据如下表:时间周一周二周三周四周五车流量(万辆)5051545758的浓度(微克/立方米)3940424445(1)根据上表数据,求出这五组数据组成的散点图的样本中心坐标;(2)用最小二乘法求出关于的线性回归方程;(3)若周六同一时间段车流量是100万辆,试根据(2)求出的线性回归方程预测,此时的浓度是多少?(参考公式:,)24为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数:温度(单位:)21232
10、4272932死亡数(单位:株)61120275777经计算:,其中,分别为试验数据中的温度和死亡株数,.(1)若用线性回归模型,求关于的回归方程(结果精确到0.1);(2)若用非线性回归模型求得关于的回归方程,且相关指数为.(i)试与(1)中的回归模型相比,用说明哪种模型的拟合效果更好;(ii)用拟合效果好的模型预测温度为时该紫甘薯死亡株数(结果取整数).附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,;相关指数为:.25随着各国经贸关系的进一步加深,许多国外的热带水果进入国内市场,牛油果作为一种热带水果,越来越多的中国消费者对这种水果有了一种全新的认识,它富含多种维生素、丰
11、富的脂肪和蛋白质,钠、钾、镁、钙等含量也高,除作生果食用外也可作菜肴和罐头.牛油果原产于墨西哥和中美洲,后在加利福尼亚州被普遍种植.因此加利福尼亚州成为世界上最大的牛油果生产地,在全世界热带和亚热带地区均有种植,但以美国南部、危地马拉、墨西哥及古巴栽培最多,并形成了墨西哥系、危地马拉系、西印度系三大种群,我国的广东、海南、福建、广西、台湾、云南及四川等地都有少量栽培.市场上的牛油果大部分都是进口的.为了调查市场上牛油果的等级代码数值与销售单价之间的关系,经统计得到如下数据:等级代码数值384858687888销售单价(元/)16.818.820.822.82425.8(1)已知销售单价与等级代
12、码数值之间存在线性相关关系,利用前5组数据求出关于的线性回归方程;(2)若由(1)中线性回归方程得到的估计值与最后一组数据的实际值之间的误差不超过1,则认为所求回归方程是有效可靠的,请判断所求回归直线方程是否有效可靠?(3)若一果园估计可以收获等级代码数值为85的牛油果,求该果园估计收入为多少元.参考公式:对一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.参考数据:,.26某花圃为提高某品种花苗质量,开展技术创新活动,在A,B实验地分别用甲、乙方法培育该品种花苗为观测其生长情况,分别在A,B试验地随机抽选各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图记
13、综合评分为80及以上的花苗为优质花苗(1)求图中a的值,并求综合评分的平均数;(2)若优质花苗数中甲乙两种培育法的比列为1:3,填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关优质花苗非优质花苗合计甲培育法乙培育法合计附:下面的临界值表仅供参考015010005002500100005000120722706384150246635787910828(参考公式:,其中)【参考答案】*试卷处理标记,请不要删除一、选择题1D解析:D【解析】记分员在去掉一个最高分和一个最低分后,余下的个数字的平均数是,故选D.2C解析:C【分析】根据平均数和方差公式计算比较即可.【详解】设这个班
14、有个同学,分数分别是,假设第个同学的成绩没录入,这一次计算时,总分是,方差为;第二次计算时,方差为故有,.故选:C【点睛】本题主要考查样本的平均数和方差公式;属于中档题.3C解析:C【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可.【详解】由系统抽样的定义可知,在区间内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以.故选:C【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.4A解析:A【解析】【分析】由表求得,代入回归直线方程,联立方程组,即可求解,得到答案.【详解】由题意,5家商场的售价元和销售量件之间的一组数据,可得,又由回归直线
15、的方程,则,即,又因为,解得,故选A.【点睛】本题主要考查了回归直线方程的特征及其应用,其中解答中熟记回归直线方程的特征,准确计算是解答的关键,着重考查了推理与运算能力,属于基础题.5B解析:B【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x4,由此能求出5个剩余分数的方差【详解】将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21,由茎叶图得: 得x4,5个分数的方差为:S2 故选B【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题6C解析:C【解析】【分析】利用公式求得和,从而得到和的大小,观察两组数
16、据的波动程度,可以得到与的大小,从而求得结果.【详解】甲班平均身高,乙班平均身高,所以,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以,故选C.【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.7A解析:A【解析】【分析】利用茎叶图、平均数的性质直接求解【详解】由一组数据的茎叶图得:该组数据的平均数为:故选:A【点睛】本题考查平均数的求法,考查茎叶图、平均数的性质等基础知识,考查运算求解能力,是基础题8C解析:C【解析】分析:根据线性
17、回归方程的性质依次判断各选项即可详解:对于A:根据b的正负即可判断正负相关关系线性回归方程为,b=0.70,负相关对于B:根据表中数据:=9可得=4即,解得:m=5对于C:相关系数和斜率不是一回事,只有当样本点都落在直线上是才满足两者相等,这个题目显然不满足,故不正确.对于D:由线性回归方程一定过(,),即(9,4)故选:C点睛:本题考查了线性回归方程的求法及应用,属于基础题,对于回归方程,一定要注意隐含条件,样本中心满足回归方程,再者计算精准,正确理解题意,应用回归方程对总体进行估计.9A解析:A【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为
18、所以抽取的第40个数为选A.点睛:本题考查系统抽样概念,考查基本求解能力.10B解析:B【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可【详解】设原来的数据为,每一个数据都乘以2,再减去80,得到新数据为 已知,则 方差为:,故选B【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可11C解析:C【分析】设该样本中高三年级的学生人数为x,则,解之即可【详解】设该样本中高三年级的学生人数为x,则,解得,故选C【点睛】本题考查了分层抽样方法的应用问题,属基础题12C解析:C【分析】先求均值,再根据标准差公式求标准差,最后比较大小.【详解】乙选手分
19、数的平均数分别为所以标准差分别为因此s1s2,选C.【点睛】本题考查标准差,考查基本求解能力.二、填空题13【分析】根据两个变量线性相关的概念及性质逐项判定即可求解【详解】由题意根据回归直线方程的特征可得线性回归直线方程一定过样本中心所以正确;根据残差的概念可得残差平方和越小的模型拟合效果越好所以解析:【分析】根据两个变量线性相关的概念及性质,逐项判定,即可求解.【详解】由题意,根据回归直线方程的特征,可得线性回归直线方程一定过样本中心,所以正确;根据残差的概念,可得残差平方和越小的模型,拟合效果越好,所以正确;根据相关指数的概念,可得越大说明拟合效果越好,所以不正确;若变量和之间的相关系数为
20、,则变量和之间负相关,且线性相关性强,所以正确;故答案为:.【点睛】本题主要考查了两个变量的线性相关性的概念与判定,其中解答中熟记线性相关的基本概念和结论是解答的关键,属于基础题.14【分析】由已知可得利用基本不等式即可求出的最小值【详解】一组数据由小到大依次为且平均数为9故当且仅当时等号成立的最小值为故答案为:【点睛】本题考查基本不等式在最值中的应用关键要对1做代换属于中档题解析:【分析】由已知可得,利用基本不等式,即可求出的最小值.【详解】一组数据由小到大依次为,且平均数为9,故,当且仅当时,等号成立,的最小值为.故答案为:【点睛】本题考查基本不等式在最值中的应用,关键要对“1”做代换,属
21、于中档题.15【分析】首先求出xy的平均数根据样本中心点满足线性回归方程把样本中心点代入得到关于a的一元一次方程解方程即可【详解】:(1+2+3+4)25(45+4+3+25)35将(2535)代入线性回归直解析:【分析】首先求出x,y的平均数,根据样本中心点满足线性回归方程,把样本中心点代入,得到关于a的一元一次方程,解方程即可【详解】:(1+2+3+4)2.5,(4.5+4+3+2.5)3.5,将(2.5,3.5)代入线性回归直线方程是0.7x+a,可得3.51.75+a,故a故答案为【点睛】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是基础题1620【解析
22、】【分析】利用分层抽样方法直接求解【详解】由题意应抽取高一学生(人)故答案是20【点睛】该题考查的是有关分层抽样中某层所抽个体数的问题涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等解析:20【解析】【分析】利用分层抽样方法直接求解.【详解】由题意,应抽取高一学生(人),故答案是20.【点睛】该题考查的是有关分层抽样中某层所抽个体数的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,列式求得结果,属于简单题目.17【分析】依题意可得解之即得解【详解】依题意可得解得故答案为1320【点睛】本题主要考查分层抽样意在考查学生对这些知识的理解掌握水平和分析推理能力解析:【分析】依题
23、意可得,解之即得解.【详解】依题意可得,解得.故答案为1320【点睛】本题主要考查分层抽样,意在考查学生对这些知识的理解掌握水平和分析推理能力.1860【分析】采用分层抽样的方法从该校四个年级的本科生中抽取一个容量为300的样本进行调查的【详解】该校一年级二年级三年级四年级的本科生人数之比为4:5:5:6应从一年级本科生中抽取学生人数为:故解析:60【分析】采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查的.【详解】该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,应从一年级本科生中抽取学生人数为:.故答案为60.19【解析】分析:根据中位数为求
24、出是代入平均数公式可求出从而可得出平均数代入方差公式得到方差详解中位数为这组数据的平均数是可得这组数据的方差是故答案为点睛:本题主要考查平均数与方差属于中档题样本数据的算解析:【解析】分析:根据中位数为,求出是 ,代入平均数公式,可求出,从而可得出平均数,代入方差公式,得到方差.详解中位数为,这组数据的平均数是,可得这组数据的方差是,故答案为.点睛:本题主要考查平均数与方差,属于中档题.样本数据的算术平均数公式为样本方差,标准差. 20【解析】因为平均数为所以方差为解析:【解析】因为平均数为,所以 方差为 三、解答题21(1)件;(2)需要对该工厂设备实施升级改造.【分析】(1)根据评论分布直
25、方图面积之和为1列等式计算得,用200乘以内的频率即可得出答案;(2)根据题意计算等品件,不合格品有件,进而得合格品有件,根据题意计算其利润与9000比较判定需要对该工厂设备实施升级改造.【详解】解:(1)因为,解得,所以200件样本中尺寸在内的样本数为(件).(2)由题意可得,这批产品中优等品有件,这批产品中不合格品有件, 这批产品中合格品有件,元. 所以该工厂生产的产品一个月所获得的利润为8960元,因为,所以需要对该工厂设备实施升级改造.【点睛】频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标;(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边
26、中点的横坐标之和;(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.22(1);(2)万;(3)吨.【分析】(1)通过频率之和为,构造方程求得结果;(2)计算出样本中不低于吨人数占比,从而求得全市的人数;(3)由频率分布直方图频率分布可知,然后根据平均分布列方程求得相应结果.【详解】(1)由概率统计相关知识,可知各组频率之和的值为即频率分布直方图各小矩形面积之和为解得:(2)由图可知,不低于吨人数所占百分比为全市月均用水量不低于吨的人数为:(万)(3)由(2)可知,月均用水量小于吨的居民人数所占百分比为:即的居民月均用水量小于吨,同理,的居民月均用水量小于吨故假设月均用水量平均分布,则
27、(吨)注:本次估计默认组间是平均分布,与实际可能会产生一定误差【点睛】本题考查补全频率分布直方图、利用频率分布直方图估计总体数据特征的问题,属于基础题.23(1)(2)(3)75.12微克/立方米【分析】(1)求出从而得到样本点的中心;(2)利用参考公式求出,从而得到,再将样本中心坐标代入求得,从而得到回归方程;(3)将代入回方程,求出的值,即可得到答案.【详解】(1),所以样本中心坐标为.(2)因为,所以,线性回归方程为.(3)(微克/立方米)此时的浓度是75.12微克/立方米.【点睛】本题考查回归直线方程的最小二乘法求解及回归方程的应用,考查数据处理能力,求解时注意运算的准确性.24(1)
28、=6.6x139.4;(2)(i)回归方程比线性回归方程=6.6x138.6拟合效果更好;(ii)190.【分析】(1)根据公式,结合已知数据,分别求得,则问题得解;(2)根据相关指数的计算公式,结合已知数据,求得,再进行比较即可;(3)将代入回归方程,即可求得结果.【详解】()由题意得, 336.6326=139.4, 关于的线性回归方程为:=6.6x139.4 () (i)线性回归方程=6.6x138.6对应的相关指数为:,因为0.93980.9522,所以回归方程比线性回归方程=6.6x138.6拟合效果更好(ii)由(i)知,当温度时,即当温度为35C时该批紫甘薯死亡株数为190.【点
29、睛】本题考查线性回归直线方程的求解、相关指数的求解,以及用回归直线方程进行估算,属综合中档题.25(1);(2)所求回归直线方程是有效可靠的;(3)该果园预计收入25095.84元.【分析】(1)求出的平均值,的平均值,再根据公式求出和,即可得出回归方程;(2)将代入(1)中的回归方程,求出,然后用和1比较即可判断;(3)将代入回归方程估计出单价,即可计算出收入.【详解】(1)由题意,得,则,故所求回归方程为;(2)当时,所以,所以所求回归直线方程是有效可靠的;(3)当,所以(元),所以该果园预计收入25095.84元.【点睛】本题考查回归方程的求法以及利用回归方程估计值,属于基础题.26(1
30、)0.04,81;(2)列联表见解析,有的把握认为优质花苗与培育方法有关【分析】(1)利用频率和为1列方程求出的值,再利用直方图平均值公式计算平均值;(2)由(1)结合直方图求出有关数据,可填写列联表,计算观测值,对照临界值得出结论【详解】(1)因为,解得,综合评分的平均数为,(2)由(1)结合直方图可知,80分以上的频数为,甲乙两种培育法的比列为1:3,所以,甲乙两种培育法的优质苗数分别为15、45填写列联表如下,优质花苗非优质花苗合计甲培育法153550乙培育法45550合计6040100计算,所以有的把握认为优质花苗与培育方法有关【点睛】本题考查了频率分布直方图的性质与应用问题,也考查了列联表与独立性检验问题的实际应用,是中档题