1、单元卷九统计与成对数据的统计分析(基础巩固卷)题号123456789101112答案一、单项选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.2022山西大同一模某小区居民上网年龄分布图如图所示,现按照分层随机抽样的方法从该小区抽取一个容量为n的样本.若90后比00后多52人,则n()A.450 B.400 C.550 D.5002.2022湘中名校联考利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果23.841,那么有把握认为“X和Y有关系”的百分比为()0.500.400.250.150.
2、100.050.0250.0100.0050.001x0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828A.5% B.75% C.99.5% D.95%3.2022安徽合肥一模某商场2020年部分月份销售金额如下表:月份x246810销售金额y/万元64132a286368若用最小二乘法求得经验回归方程为38.1x17.6,则a()A.198.2 B.205 C.211 D.213.54.2022河南郑州一模下图是某统计部门网站发布的某市2020年212月国民经济和社会发展统计公报中居民消费价格指数(CPI)月度涨跌幅度折线图.(注:同比是今
3、年第n个月与去年第n个月相比,环比是现在的统计周期与上一个统计周期相比)下列说法错误的是()2020年9月CPI环比上升0.5%,同比上涨2.1%2020年9月CPI环比上升0.2%,同比无变化2020年3月CPI环比下降1.1%,同比上涨0.2%2020年3月CPI环比下降0.2%,同比上涨1.7%A. B. C. D.5.2022江苏南京一模某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查,统计得下方的22列联表.则根据列联表可知()年轻人非年轻人总计经常用流行用语12525150不常用流行用语351550总计16040200参考公式:独立性检验统计量2,其
4、中nabcd.下面的临界值表供参考:0.150.100.050.0250.100.0050.001x2.0722.7063.8415.0246.6357.87910.828A.有95%的把握认为“经常用流行用语”与“年轻人”有关系B.没有95%的把握认为“经常用流行用语”与“年轻人”有关系C.有97.5%的把握认为“经常用流行用词”与“年轻人”有关系D.有97.5%的把握认为“经常用流行用语”与“年轻人”没有关系6.2022山西太原一模设样本数据x1,x2,x3,x19,x20的均值和方差分别为2和8,若yi2xim(m为非零常数,i1,2,3,19,20),则y1,y2,y3,y19,y20
5、的均值和标准差分别为()A.2m,32 B.4m,4C.2m,4 D.4m,327.2022江西瑞金一模对四组数据进行统计,获得以下散点图,关于其线性相关系数的比较,正确的是()A.r2r40r3r1 B.r4r20r1r3C.r4r20r3r1 D.r2r40r1r38.2022兰州一模一组数据x1,x2,x3,xn的平均数为,现定义这组数据的平均差为D.下图是甲、乙两组数据的频率分布折线图.根据折线图,可判断甲、乙两组数据的平均差D1,D2的大小关系是()A.D1D2 B.D1D2C.D1D2 D.无法确定二、多项选择题:本题共4小题,每小题5分,共20分.在每小题给出的四个选项中,有多项
6、符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.9.2022湖南师大月考某公司引进先进管理经验,在保持原有员工人数的基础上,注重产品研发及员工待遇,提高产品质量和员工积极性,效益显著提高.同时该公司的各项成本也随着收入的变化发生了相应变化.下图给出了该公司2020年和2021年的运营成本及利润占当年总收入的比例,已知2020年和2021年的材料设备费用相同,则下列说法正确的是()A.该公司2021年利润是2020年的3倍B.该公司2021年的员工工资是2020年的2倍C.该公司2021年的总收入是2020年的2倍D.该公司2021年的研发费用等于2020年的研发和工资费用之和
7、10.2022河南新乡一模某高中为了解学生课外知识的积累情况,随机抽取200名同学参加课外知识测试,测试共5道题,每答对一题得20分,答错得0分.已知每名同学至少能答对2道题,得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则下列说法错误的是()A.该次课外知识测试及格率为90%B.该次课外知识测试得满分的同学有30名C.该次测试成绩的中位数大于测试成绩的平均数D.若该校共有3 000名学生,则课外知识测试成绩能得优秀的同学大约有1 440名11.2022陕西西安中学二模设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x
8、i,yi)(i1,2,n),用最小二乘法建立的经验回归方程为0.85x85.71.则下列选项正确的是()A.y与x具有正的线性相关关系B.经验回归直线过样本点的中心(,)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则其体重必为58.79 kg12.2021湖南永州二模下列说法正确的是()A.经验回归方程x对应的直线至少经过其样本数据点中的一个点B.10件产品中有7件正品,3件次品,从中任取2件,恰好取到1件次品的概率为C.已知30个数据的第60百分位数是8.2,这30个数据从小到大排列后,第18个数据是7.8,则第19个数据是8.6D.
9、从装有2个红球和2个黑球的口袋内任取2个球,“至少有一个黑球”与“至少有一个红球”是互斥而不对立的事件三、填空题:本题共4小题,每小题5分,共20分.13.2022江西九校联考新冠肺炎出现以来,医用口罩成为急需商品,为了提高医用口罩的质量,某口罩生产商决定加大检测力度.在一次对某生产线生产的口罩取样时,生产商将该生产线某一时段连续生产的60个口罩依次编号为00,01,02,59,准备利用随机数法从中选取10个进行检测,选取方法是从下方利用计算机产生的随机数中的第2行第6列的数字开始,从左向右依次选取2个数字,则选取的10个数据的中位数为_.第1行50 44 66 44 2166 06 58 0
10、5 6261 65 54 35 0242 35 48 96 3214 52 41 52 48第2行22 66 22 15 8626 63 75 41 9958 42 36 72 2458 37 52 15 5103 37 18 39 11第3行72 84 71 14 3519 11 58 49 2650 11 17 17 7686 31 57 20 1895 60 78 46 75第4行88 78 28 16 8413 52 53 94 5375 45 69 30 9673 89 65 70 3199 14 43 48 7614.2021广东广州一模某车间为了提高工作效率,需要测试加工零件所花
11、费的时间,为此进行了5次试验,这5次试验的数据如下表:零件数x(个)1020304050加工时间y(min)62a758189若用最小二乘法求得经验回归方程为0.67x54.9,则a的值为_.15.2022河北唐山一模为了解M离子在小鼠体内的残留程度,进行如下试验:给100只小鼠服M离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同,经过一段时间后检测出残留在小鼠体内M离子的百分比.根据试验数据得到如图所示的频率分布直方图,则图中a_;估计M离子残留百分比的平均数为_.(同组中的每个数据用该组区间的中点值代替)16.2022山东临沂一模蟋蟀鸣叫可以说是大自然优美、和谐的音乐,蟋蟀鸣叫的频率y(
12、每分钟鸣叫的次数)与气温x(单位:)存在着较强的线性相关关系.某地研究人员根据当地的气温和蟋蟀鸣叫的频率得到了如下数据:x()21222324252627y(次数/分钟)24283139434754利用上表中的数据求得经验回归直线方程为x,若利用该方程知,当该地的气温为30 时,蟋蟀每分钟鸣叫次数的预测值为68,则的值为_.四、解答题:本题共2小题,每题10分,共20分.17.(10分)2021湖北八市联考近年来,明代著名医药学家李时珍的故乡黄冈市蕲春县大力发展健康产业,蕲艾产业化种植已经成为该县脱贫攻坚的主要产业之一,已知蕲艾的株高y(单位:cm)与一定范围内的温度x(单位:)有关,现收集了
13、蕲艾的13组观测数据,得到如下的散点图:现根据散点图利用yab或yc建立y关于x的经验回归方程,令s,t得到如下数据:10.15109.943.040.16siyi13tiyi13s132t132y13213.942.111.670.2121.22且(si,yi)与(ti,yi)(i1,2,3,13)的相关系数分别为r1,r2,且r20.995 3.(1)用相关系数说明哪种模型建立y与x的经验回归方程更合适;(2)根据(1)的结果及表中数据,建立关于x的经验回归方程;(3)已知蕲艾的利润z与x,y的关系为z20yx,当x为何值时,z的预测值最大?附:参考数据和公式:0.2121.224.456
14、 2,11.6721.22247.637 4,15.736 5,对于一组数据(ui,vi)(i1,2,3,n),其经验回归直线方程vu的斜率和截距的最小二乘法估计分别为,相关系数r.18.(10分)2021福建福州模拟中国房地产产业协会主办的中国房价行情网调查的一份数据显示,2018年7月,大部分一线城市的房租租金同比涨幅都在10%以上.某部门研究成果认为,房租支出超过月收入的租户“幸福指数”低,房租支出不超过月收入的租户“幸福指数”高.为了了解甲、乙两小区租房的幸福指数高低,随机抽取甲、乙两小区的租户各100户进行调查.甲小区租户的月收入以0,3),3,6),6,9),9,12),12,15
15、(单位:千元)分组的频率分布直方图如下:乙小区租户的月收入(单位:千元)的频数分布表如下:月收入0,3)3,6)6,9)9,12)12,15户数38272492(1)设甲、乙两小区租户的月收入相互独立,记M表示事件“甲小区租户的月收入低于6千元,乙小区租户的月收入不低于6千元”,把频率视为概率,求M的概率;(2)利用频率分布直方图,求所抽取的甲小区100户租户的月收入的中位数;(3)若甲、乙两小区每户的月租费分别为2千元、1千元.请根据条件完成下面的22列联表,并说明能否在犯错误的概率不超过0.001的前提下认为“幸福指数高低与租住的小区有关”.幸福指数低幸福指数高合计甲小区租户乙小区租户合计
16、附:临界值表:0.1000.0100.001x2.7066.63510.828参考公式:2.单元卷九统计与成对数据的统计分析(基础巩固卷)1.B根据题意可知21%8%,解得n400.2.D由题图表中数据可得,当23.841时,有0.05的概率说明这两个变量之间的关系是不可信的,即有10.050.95的概率,也就是有95%的把握认为变量之间有关系,故选D.3.B由题意可知6,因为经验回归直线38.1x17.6一定经过样本点的中心(,),所以38.1617.6211,即211,解得a205.4.D由题意可知,题图中上面的折线为月度同比、下面的折线为月度环比,观察题图中数据可知,9月CPI环比上升0
17、.5%,同比上涨2.1%,3月CPI环比下降0.2%,同比上涨1.7%,所以正确的说法是,错误的说法是,故选D.5.A由列联表可得24.1673.841x0.05,根据临界值知有95%的把握认为“经常用流行语”与“年轻人”有关系,故选A.6.B由题知,样本数据x1,x2,x20的均值2,方差s8,故y1,y2,y20的均值2m4m,标准差sy4,故选B.7.B根据正相关、负相关及相关系数的概念,散点图中的点散布从左下角至右上角的带状区域,则是正相关,此时相关系数为正数;点散布在从左上角到右下角的带状区域,则是负相关,此时相关系数为负数.当散点集中于一条直线附近程度越高时,相关系数的绝对值越接近
18、于1.由题图知,r1与r3都是正数,且r1r3,r2与r4都是负数,且r2r4,所以r4r20r1r3,故选B.8.C由数据频率分布折线图知,甲组数据比较分散,乙组数据较为集中,因为数据波动越大,起伏越剧烈,与xi(i1,2,3,n)之间的差距越大,所以D1D2,故选C.9.ACD2020年总收入为x,则2021年总收入为y.因为2020年和2021年的材料设备费用相同,所以0.4x0.2y,即y2x,故C正确;2020年的利润为0.2x,2021年的利润为0.3y0.32x0.6x30.2x,故A正确;2021年的员工工资为0.25y0.5x,2020年的员工工资为0.2x,故B错误;202
19、1年的研发费用为0.15y0.3x,2020年的研发费用和工资费用之和为:0.1x0.2x0.3x,故D正确.故选ACD.10.ABD由图知,及格率为18%92%,故A错误;该测试得满分的同学百分比为18%32%48%12%,即样本中有12%20024(名)同学得满分,但总体学生数未知,故B错误;由图知,中位数为80分,平均数为408%6032%8048%10012%72.8(分),故C正确;由题意,3 000名学生成绩能得优秀的同学大约有3 000(48%12%)1 800(名),故D错误.故选ABD.11.ABC对于A,因为0.850,所以y与x具有正的线性相关关系,故A正确;对于B,经验
20、回归直线过样本点的中心(,),故B正确;对于C,因为经验回归方程为0.85x85.71,所以身高增加1 cm,则其体重约增加0.85 kg,故C正确;对于D,当x170时,0.8517085.7158.79,但这是预测值,不可断定其体重必为58.79 kg,故D错误.故选ABC.12.BC对A,经验回归方程x对应的直线可能不经过样本数据点中的任意一个点,故A错误;对B,恰好取到1件次品的概率为,故B正确;对C,设第19个数据为x,因为3060%18,所以8.2,解得x8.6,故C正确;对D,“至少有一个黑球”与“至少有一个红球”都包含“一个黑球一个红球”这个事件,故这两个事件既不互斥也不对立,
21、故D错误.故选BC.13.30从随机数中第2行第6列的数字开始,从左向右依次选取2个数字,符合题意的前10个编号依次为21,58,37,54,19,23,22,45,55,10,这些数据的中位数为30.14.68x30,y61,所以610.673054.9,解得a68.15.0.1506.1由频率分布直方图的性质可得(0.0250.0500.0750.1000.100a)21,解得a0.150,则(0.025120.050100.07520.10040.15060.1008)26.1.16.5由表中数据可知24,38,经验回归直线一定经过样本点中心(24,38),则有3824,又6830,联立
22、解得17.解(1)由题意知r20.995 3,r10.885 8,因为|r1|r2|1,所以用yc模型建立y与x的经验回归方程更合适.(2)因为10,109.94100.16111.54,所以关于x的经验回归方程为111.54.(3)由题意知20x20x2 230.82 230.8202 210.8,所以2 210.8,当且仅当x20时等号成立,所以当x为20时,z的预测值最大.18.解(1)记A表示事件“甲小区租户的月收入低于6千元”,记B表示事件“乙小区租户的月收入不低于6千元”,甲小区租户的月收入低于6千元的频率为(0.0600.160)30.66,故P(A)的估计值为0.66.乙小区租
23、户的月收入不低于6千元的频率为0.35,故P(B)的估计值为0.35.因为甲、乙两小区租户的月收入相互独立,所以事件M的概率的估计值为P(M)P(A)P(B)0.660.350.231.(2)设甲小区所抽取的100户的月收入的中位数为t,由频率分布直方图可知中位数在3,6)区间内,则0.0603(t3)0.1600.5,解得t5,故所抽取的甲小区100户租户的月收入的中位数为5.(3)根据题意,完成22列联表如下:幸福指数低幸福指数高合计甲小区租户6634100乙小区租户3862100合计10496200根据22列联表中的数据,得到215.70510.828x0.001.所以能在犯错误的概率不超过0.001的前提下认为“幸福指数高低与租住的小区有关”.