1、专题专题 38 38 成对数据的统计分析单元测试卷成对数据的统计分析单元测试卷 一、单选题一、单选题 1 (2020 甘肃省会宁县第二中学期中(文) )某商品销售量 y(件)与销售价格 x(元/件)负相关,则其回 归方程可能是( ) A 10200 y x B10200 y x C 10200 y x D10200 y x 2 (2020 福建湖里 厦门双十中学高二期中)在一组样本数据 1 (x, 1) y, 2 (x, 2) y,( n x,)(2 n yn, 1 x, 2 x, n x不全相等)的散点图中,若所有样本点( i x,)(1 i yi ,2,)n都在直线 1 2 3 yx 上,
2、 则这组样本数据的样本相关系数为( ) A1 B0 C 1 3 D1 3 (2020 福建湖里 厦门双十中学高二期中)已知四个命题: 在回归分析中, 2 R 可以用来刻画回归效果, 2 R 的值越大,模型的拟合效果越好; 在独立性检验中,随机变量 2 K 的值越大,说明两个分类变量有关系的可能性越大; 在回归方程 0.212yx 中,当解释变量x每增加 1 个单位时,预报变量y平均增加 1 个单位; 两个随机变量相关性越弱,则相关系数的绝对值越接近于 1; 其中真命题是: A B C D 4 (2020 河南南阳 期末(理) )利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通过随机
3、调查 200名高中生是否爱好某项运动,利用 2 2 列联表,由计算可得 K27.245,参照下表:得到的正确结 论是( ) 2 0 P Kk() 0.01 0.05 0.025 0.010 0.005 0.001 0 k 2.706 3.841 5.024 6.635 7.879 10.828 A有 99%以上的把握认为“爱好该项运动与性别无关” B有 99%以上的把握认为“爱好该项运动与性别有关” 、 C在犯错误的概率不超过 0.5%的前提下,认为“爱好该项运动与性别有关” D在犯错误的概率不超过 0.5%的前提下,认为“爱好该项运动与性别无关” 5 (2020 四川邻水实验学校开学考试(理
4、) )在一次独立性检验中得到如下列联表: A1 A2 总计 B1 200 800 1000 B2 180 a 180a 总计 380 800a 1180a 若这两个分类变量 A 和 B 没有关系,则 a 的可能值是( ) A200 B720 C100 D180 6 (2020 赣州市赣县第三中学月考(文) )某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性 检验法抽查了 3000 人,计算发现 2 K 的观测值6.023k ,根据这一数据查阅表,市政府断言“市民收入增 减与旅游愿望有关系”这一断言犯错误的概率不超过( ) 2 0 P Kk 0.25 0.15 0.10 0.05 0.0
5、25 0.010 0.005 0.001 0 k 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 A0.005 B0.025 C0.05 D0.1 7 (2020 福建期末)红铃虫是棉花的主要害虫之一,一只红铃虫的产卵数和温度有关.现收集了 7 组观侧数 据.用 4 种模型分别进行拟合.由此得到相应的回归方程并进行残差分析,进一步得到如图 4幅残差图,根据 残差图,拟合效果最好的模型是( ) A模型一 B模型二 C模型三 D模型四 8 (2020 辽宁期末)相关变量 , x y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据 图中
6、所有数据,得到线性回归方程 11 yb xa,相关系数为 1 r;方案二:剔除点(10,21),根据剩下数据得 到线性回归直线方程: 22 yb xa,相关系数为 2 r.则( ) A 12 01rr B 21 01rr C 12 10rr D 21 10rr 二、多选题二、多选题 9 (2020 山东省招远第一中学高二月考)某课外兴趣小组通过随机调查,利用22残联表和 2 K 统计量研 究数学成绩优秀是否与性别有关.计算得 2 6.748K ,经查阅临界值表知 2 6.6350.010P K ,则下列 判断正确的是( ) A每100个数学成绩优秀的人当中就会有1名是女生 B若某人数学成绩优秀
7、,那么他为男生的概率是0.010 C有99%的把握认为“数学成绩优秀与性别有关” D在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关” 10 (2020 南京市秦淮中学开学考试)为了对变量x与y的线性相关性进行检验,由样本点 11 ,x y、 22 ,x y、 1010 ,xy求得两个变量的样本相关系数为r,那么下面说法中错误的有( ) A若所有样本点都在直线21yx 上,则1r B若所有样本点都在直线21yx 上,则2r C若r越大,则变量x与 y的线性相关性越强 D若r越小,则变量x与 y的线性相关性越强 11 (2020 广东梅州 高二期末)针对时下的“抖音热” ,某校团委对
8、“学生性别和喜欢抖音是否有关“作了 一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的 4 5 ,女生喜欢抖音的人数占 女生人数 3 5 ,若有 95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )人 附表: 2 P Kk 0.100 0.050 0.010 0.005 0.001 k 2.706 3.841 6.635 7.879 10.828 附: 2 2 () ()()()() n adbc K ab cd ac bd A25 B35 C45 D60 12 (2020 广东南海 期末)某种产品的广告支出费用 x(单位:万元)与销售量 y(单位:万件)之间
9、的对 应数据如下表所示: 广告支出费用 x 2.2 2.6 4.0 5.3 5.9 销售量 y 3.8 5.4 7.0 11.6 12.2 根据表中的数据可得回归直线方程 2.27yxa , 2 0.96R ,以下说法正确的是( ) A第三个样本点对应的残差 3 1e B在该回归模型对应的残差图中,残差点比较均匀地分布在倾斜的带状区域中 C销售量的多少有96%是由广告支出费用引起的 D用该回归方程可以比较准确地预测广告费用为 20 万元时的销售量 三、填空题三、填空题 13 (2020 吉林高二期末(文) )某次国际会议为了搞好对外宣传工作,会务组选聘了 50 名记者担任对外翻 译工作,在如表
10、“性别与会外语”的22列联表中,abd _. 会外语 不会外语 总计 男 a b 20 女 6 d 总计 18 50 14 (2020 湖南期末)某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内国外 潜在用户代表各100名,调查用户对是否使用该手机的态度,得到如图所示的等高条形图.根据等高图, _(填“有”或“没有” )99.5%以上的把握认为持乐观态度和国内外差异有关. (参考公式与数据: 2 2 n adbc K abcdacbd ,其中 na b cd ) 2 0 P Kk 0.05 0.01 0.005 0.001 0 k 3.841 6.635 7.879 10
11、.828 15 (2019 湖北期中(理) )由样本数据得到,女大学生的身高预报体重的回归方程是0.8585.7yx(其 中 x,y的单位分别是cm,kg) ,则此方程在样本170,61处残差的绝对值是_. 16 (2017 北京石景山 高三一模(文) )在环境保护部公布的 2016 年 74 城市 PM2.5 月均浓度排名情况中, 某 14 座城市在 74 城的排名情况如下图所示,甲、乙、丙为某三座城市 从排名情况看, 在甲、乙两城中,2 月份名次比 1 月份名次靠前的城市是_; 在第 1 季度的三个月中,丙城市的名次最靠前的月份是_ 四、解答题四、解答题 17 (2020 沙坪坝 重庆一中
12、高三其他(文) )截止 2020年 5月 15 日,新冠肺炎全球确诊数已经超过 440万, 新冠肺炎是一个传染性很强的疾病,其病毒在潜伏期以内就具备了传染性.湖北省某医疗研究机构收集了 1000名患者的病毒潜伏期的信息,将数据统计如下表所示: 潜伏期 0-2 天 2-4 天 4-6 天 6-8 天 8-10 天 10-12 天 12-14 天 人数 40 160 300 360 60 60 20 (1)求 1000名患者潜伏期的平均数x(同一组中的数据用该组区间的中点值作代表) ; (2)潜伏期不高于平均数的患者,称为“短潜伏者” ;潜伏期高于平均数的患者,称为“长潜伏者”.为研 究潜伏期与患
13、者年龄的关系,以潜伏期是否高于平均数为标准分为两类进行分层抽样,从上述 1000名患者 中抽取 300 人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有 99.9%的把握认为潜伏期 长短与患者年龄有关. 短潜伏者 长潜伏者 合计 60 岁及以上 100 60 岁以下 140 合计 300 附表及公式: 2 0 P Kk 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 2 2 () ()()()() n adbc K ab cd ac bd 18 (2020
14、甘肃省会宁县第二中学期中(文) )2019年中央电视台在周日晚上推出的一档新的综艺节目, 为了解节目效果,一次节目结束后,现随机抽取了500名观众(含200名女性)的评分(百分制)进行分 析,分别得到如图所示的两个频率分布直方图. (1)计算女性观众评分的中位数与男性观众评分的平均分; (2)若把评分低于70分定为“不满意” ,评分不低于70分定为“满意”. (i)试比较男观众与女观众不满意的概率大小,并说明理由; (ii)完成下列22列联表,并回答是否有95%的把握认为性别和对该综艺节目是否满意有关. 女性观众 男性观众 合计 “满意” “不满意” 合计 参考数据: 2 2 () ()()(
15、)() n adbc K ab cd ac bd 2 P Kk 0.05 0.010 0.001 k 3.841 6.635 10.828 19 (2019 扶风县法门高中月考 (文) ) 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y(吨标准煤)的几组对照数据 x 3 4 5 6 y 2.5 3.5 4 5 (1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 ybxa; (2)已知该厂技术改造前 100 吨甲产品能耗为 90 吨标准煤.试根据(1)求出的线性回归方程,预测生产 100 吨甲产品的生产能耗比技术改造前降低多少吨标准煤? 2
16、0 (2020 江苏广陵 扬州中学开学考试)某企业新研发了一种产品,产品的成本由原料成本及非原料成本 组成每批产品的非原料总成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据: x 1 2 3 4 5 6 7 y 6 11 21 34 66 101 196 根据以上数据,绘制如图所示的散点图 观察散点图, 两个变量不具有线性相关关系, 现考虑用对数函数模型lnyabx和指数函数模型 x yc d 分别对两个变量的关系进行拟合 (1)根据散点图判断,lnyabx与 x yc d (c,d均为大于零的常数)哪一个适宜作为非原料总成 本y关于生产该产品的数量x的回归方程类型; (给出判
17、断即可,不必说明理由) (2)根据(1)的判断结果及表 1中的数据,建立y关于x的回归方程; (3)已知每件产品的原料成本为 10 元,若该产品的总成本不得高于 123470 元,请估计最多能生产多少千 件产品 参考数据: y v 7 1 ii i x y 7 1 ii i xv 0.54 10 62.14 1.54 2535 50.12 3.47 其中lg ii vy, 1 1 7 n i i vv 参考公式:对于一组数据 11 ,u v, 22 ,u v,, nn u v,其回归直线 vau的斜率和截距的最小二 乘估计公式分别为 1 22 1 n i i i n i i uvnuv unu
18、 , a vu 21 (2020 四川武侯 成都七中高三开学考试(理) )某厂生产不同规格的一种产品,根据检测标准,其合格 产品的质量 gy与尺寸(mm)x之间近似满足关系式 b yc x (b,c 为大于 0的常数).按照某指标测定, 当产品质量与尺寸的比在区间(0.302,0.388)内时为优等品.现随机抽取 6 件合格产品,测得数据如下: 尺寸(mm)x 38 48 58 68 78 88 质量( )y g 16.8 18.8 20.7 22.4 24 25.5 质量与尺寸的比 y x 0.442 0.392 0.357 0.329 0.308 0.290 (1)现从抽取的 6 件合格产
19、品中再任选 2 件,求选中的 2 件均为优等品的概率; (2)根据测得数据作了初步处理,得相关统计量的值如下表: 6 1 lnln ii i xy 6 1 ln i i x 6 1 ln i i y 6 2 1 ln i i x 75.3 24.6 18.3 101.4 根据所给统计量,求 y关于 x的回归方程. 附:对于样本,(1,2,6) ii v ui ,其回归直线ub va的斜率和截距的最小二乘法估计公式分别为: 11 2 22 11 nn iiii ii nn ii ii vvuuvunvu b vvvnv , a ubv ,2.7183e. 22 (2020 梅河口市第五中学其他(
20、理) )2019年的“金九银十”变成“铜九铁十”,国各地房价“跳水”严重, 但某地二手房交易却“逆市”而行如图是该地某小区 2018年 11月至 2019 年 1月间,当月在售二手房均价 (单位:万元/平方米)的散点图 (图中月份代码 113 分别对应 2018年 11 月2019年 11 月) 根据散点图选择yab x和lnycdx两个模型进行拟合,经过数据处理得到两个回归方程分别为 0.93690.0285yx 和0.95540.0306lnyx,并得到以下一些统计量的值: 0.93690.0285yx 0.95540.0306lnyx 13 2 1 ii i yy 0000591 000
21、0164 13 2 1 i i yy 0006050 (1)请利用相关指数 2 R 判断哪个模型的拟合效果更好; (2) 某位购房者拟于2020年4月购买这个小区(70160)mm平方米的二手房 (欲购房为其家庭首套房) 若购房时该小区所有住房的房产证均已满 2但未满 5 年,请你利用(1)中拟合效果更好的模型解决以下问 题: (i)估算该购房者应支付的购房金额; (购房金额房款税费,房屋均价精确到 0001 万元/平方米) (ii)若该购房者拟用不超过 100 万元的资金购买该小区一套二手房,试估算其可购买的最大面积 (精确 到 1平方米) 附注:根据有关规定,二手房交易需要缴纳若干项税费,
22、税费是按房屋的计税价格(计税价格房款)进 行征收的 房产证满 2 年但未满 5 年的征收方式如下:首套面积 90 平方米以内(含 90平方米)为1%;首套面积 90 平方米以上且 140平方米以内(含 140平方米)1.5%;首套面积 140平方米以上或非首套为3% 参考数据:ln20.69,ln3 1.10,ln172.83,ln192.94, 21.41 ,31.73,174.12, 194.36 参考公式:相关指数 2 2 1 2 1 1 n ii i n i i yy R yy 专题专题 38 38 成对数据的统计分析成对数据的统计分析单元测试卷单元测试卷 一、单选题一、单选题 1 (
23、2020 甘肃省会宁县第二中学期中(文) )某商品销售量 y(件)与销售价格 x(元/件)负相关,则其回 归方程可能是( ) A 10200 y x B10200 y x C 10200 y x D10200 y x 【答案】A 【解析】 因为商品销售量x与销售价格 y 负相关,所以排除 B,D 选项, 将0 x代入10200 y x 可得2000 y ,不符合实际故 A 正确 点睛:线性回归方程 ybxa当 0b 时 , x y负相关;当 0b 时 , x y正相关 2 (2020 福建湖里 厦门双十中学高二期中)在一组样本数据 1 (x, 1) y, 2 (x, 2) y,( n x,)(
24、2 n yn, 1 x, 2 x, n x不全相等)的散点图中,若所有样本点( i x,)(1 i yi ,2,)n都在直线 1 2 3 yx 上, 则这组样本数据的样本相关系数为( ) A1 B0 C 1 3 D1 【答案】A 【解析】 因为回归直线方程是 1 2 3 yx , 所以这两个变量是负相关,故这组样本数据的样本相关系数为负值, 又所有样本点( i x,)(1 i yi ,2, )n都在直线上, 所以1r , 所以相关系数1r 故选:A 3 (2020 福建湖里 厦门双十中学高二期中)已知四个命题: 在回归分析中, 2 R 可以用来刻画回归效果, 2 R 的值越大,模型的拟合效果越
25、好; 在独立性检验中,随机变量 2 K 的值越大,说明两个分类变量有关系的可能性越大; 在回归方程 0.212yx 中,当解释变量x每增加 1 个单位时,预报变量y平均增加 1 个单位; 两个随机变量相关性越弱,则相关系数的绝对值越接近于 1; 其中真命题是: A B C D 【答案】C 【解析】 对于,在回归分析中, 2 R 可以用来刻画回归效果, 2 R 的值越大,模型的拟合效果越好,正确;对于; 在独立性检验中,随机变量 2 K 的值越大,说明两个分类变量有关系的可能性越大,正确;对于,在回归 方程0.212 y x 中,当解释变量x每增加 1 个单位时,预报变量 y 平均增加0.2个单
26、位,错误;对于, 两个随机变量相关性越强,则相关系数的绝对值越接近于 1,错误;故选 C. 4 (2020 河南南阳 期末(理) )利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通过随机 调查 200名高中生是否爱好某项运动,利用 2 2 列联表,由计算可得 K27.245,参照下表:得到的正确结 论是( ) 2 0 P Kk() 0.01 0.05 0.025 0.010 0.005 0.001 0 k 2.706 3.841 5.024 6.635 7.879 10.828 A有 99%以上的把握认为“爱好该项运动与性别无关” B有 99%以上的把握认为“爱好该项运动与性别有关”
27、、 C在犯错误的概率不超过 0.5%的前提下,认为“爱好该项运动与性别有关” D在犯错误的概率不超过 0.5%的前提下,认为“爱好该项运动与性别无关” 【答案】B 【解析】 由 2 7.2456.635K ,可得有 99%以上的把握认为“爱好该项运动与性别有关”.故选 B 5 (2020 四川邻水实验学校开学考试(理) )在一次独立性检验中得到如下列联表: A1 A2 总计 B1 200 800 1000 B2 180 a 180a 总计 380 800a 1180a 若这两个分类变量 A 和 B 没有关系,则 a 的可能值是( ) A200 B720 C100 D180 【答案】B 【解析】
28、 当 a720 时,k0,易知此时两个分类变量没有关系 故答案为 B 6 (2020 赣州市赣县第三中学月考(文) )某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性 检验法抽查了 3000 人,计算发现 2 K 的观测值6.023k ,根据这一数据查阅表,市政府断言“市民收入增 减与旅游愿望有关系”这一断言犯错误的概率不超过( ) 2 0 P Kk 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0 k 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 A0.005 B0.025 C0.05 D0
29、.1 【答案】B 【解析】 6.023k ,6.0235.024, 市政府断言市民收入增减与旅游愿望有关系,这一断言犯错误的概率不超过 0.025, 故选:B 7 (2020 福建期末)红铃虫是棉花的主要害虫之一,一只红铃虫的产卵数和温度有关.现收集了 7 组观侧数 据.用 4 种模型分别进行拟合.由此得到相应的回归方程并进行残差分析,进一步得到如图 4幅残差图,根据 残差图,拟合效果最好的模型是( ) A模型一 B模型二 C模型三 D模型四 【答案】D 【解析】 当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适, 这样的带状区域的宽度越窄,说明拟合精度越好,拟合效果越好, 对比
30、 4 个残差图,可知模型四的图对应的带状区域的宽度最窄. 故选:D. 8 (2020 辽宁期末)相关变量 , x y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据 图中所有数据,得到线性回归方程 11 yb xa,相关系数为 1 r;方案二:剔除点(10,21),根据剩下数据得 到线性回归直线方程: 22 yb xa,相关系数为 2 r.则( ) A 12 01rr B 21 01rr C 12 10rr D 21 10rr 【答案】D 【解析】 由散点图得负相关,所以 12 ,0r r ,因为剔除点10,21后,剩下点数据更具有线性相关性,r更接近1, 所以 21 10rr
31、.选 D. 二、多选题二、多选题 9 (2020 山东省招远第一中学高二月考)某课外兴趣小组通过随机调查,利用22残联表和 2 K 统计量研 究数学成绩优秀是否与性别有关.计算得 2 6.748K ,经查阅临界值表知 2 6.6350.010P K ,则下列 判断正确的是( ) A每100个数学成绩优秀的人当中就会有1名是女生 B若某人数学成绩优秀,那么他为男生的概率是0.010 C有99%的把握认为“数学成绩优秀与性别有关” D在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关” 【答案】CD 【解析】 因为 2 6.7486.635K ,所以有99%的把握认为“数学成绩优秀与性别
32、有关”即在犯错误的概率不超过 1%的前提下认为“数学成绩优秀与性别有关”. 故选:CD 10 (2020 南京市秦淮中学开学考试)为了对变量x与y的线性相关性进行检验,由样本点 11 ,x y、 22 ,x y、 1010 ,xy求得两个变量的样本相关系数为r,那么下面说法中错误的有( ) A若所有样本点都在直线21yx 上,则1r B若所有样本点都在直线21yx 上,则2r C若r越大,则变量x与 y的线性相关性越强 D若r越小,则变量x与 y的线性相关性越强 【答案】ABD 【解析】 若所有样本点都在直线21yx 上,且直线斜率为负数,则1r ,A、B 选项均错误; 若r越大,则变量x与y
33、的线性相关性越强,C选项正确,D 选项错误. 故选:ABD. 11 (2020 广东梅州 高二期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关“作 了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的 4 5 ,女生喜欢抖音的人数 占女生人数 3 5 ,若有 95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )人 附表: 2 P Kk 0.100 0.050 0.010 0.005 0.001 k 2.706 3.841 6.635 7.879 10.828 附: 2 2 () ()()()() n adbc K ab cd ac bd A2
34、5 B35 C45 D60 【答案】CD 【解析】 设男生可能有 x 人,依题意得女生有 x人,可得22列联表如下: 喜欢抖音 不喜欢抖音 总计 男生 4 5 x 1 5 x x 女生 3 5 x 2 5 x x 合计 7 5 x 3 5 x 2x 若有 95%的把握认为是否喜欢抖音和性别有关,则 2 3.841K , 即 2 4231 2 25555 3.841 73 21 55 xxxxx Kx xx x x ,解得40.335x , 由题意知0 x,且 x 是 5 的整数倍,所以 45 和 60都满足题意. 故选:CD. 12 (2020 广东南海 期末)某种产品的广告支出费用 x(单位
35、:万元)与销售量 y(单位:万件)之间的对 应数据如下表所示: 广告支出费用 x 2.2 2.6 4.0 5.3 5.9 销售量 y 3.8 5.4 7.0 11.6 12.2 根据表中的数据可得回归直线方程2.27yxa, 2 0.96R ,以下说法正确的是( ) A第三个样本点对应的残差 3 1e B在该回归模型对应的残差图中,残差点比较均匀地分布在倾斜的带状区域中 C销售量的多少有96%是由广告支出费用引起的 D用该回归方程可以比较准确地预测广告费用为 20 万元时的销售量 【答案】AC 【解析】 由题意得 2.22.64.05.35.93.85.47.0 11.6 12.2 4,8 5
36、5 xy ,将之代入回归方程 2.27yxa 中得8 2.27 4a ,得 1.08a ,故回归直线方程为2.271.08yx,所以 3 72.27 4 1.081e ,A 正确; 由于 2 0.96R ,所以该回归模型拟合的效果比较好,故对应的残差图中残差点应该比较均匀地分布在水平 的带状区域中,B错误; 在线性回归模型中 2 R 表示解释变量对于预报变量的贡献率,R20.96,则销售量的多少有 96%是由广告支 出费用引起的,C正确; 由于样本的取值范围会影响回归方程的使用范围,而广告费用 20 万元远大于表格中广告费用值,故用该回 归方程不能准确地预测广告费用为 20万元时的销售量,故
37、D 错误 故选:AC 三、填空题三、填空题 13 (2020 吉林高二期末(文) )某次国际会议为了搞好对外宣传工作,会务组选聘了 50 名记者担任对外翻 译工作,在如表“性别与会外语”的22列联表中,abd _. 会外语 不会外语 总计 男 a b 20 女 6 d 总计 18 50 【答案】44 【解析】 由题意有: 618 20 650 a ab abd 所以12a ,8b,24d ,12 8 2444a bd . 故答案为:44. 14 (2020 湖南期末)某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内国外 潜在用户代表各100名,调查用户对是否使用该手机的态
38、度,得到如图所示的等高条形图.根据等高图, _(填“有”或“没有”)99.5%以上的把握认为持乐观态度和国内外差异有关. (参考公式与数据: 2 2 n adbc K abcdacbd ,其中 na b cd ) 2 0 P Kk 0.05 0.01 0.005 0.001 0 k 3.841 6.635 7.879 10.828 【答案】有 【解析】 依题意,可得出如下22列联表: 国内代表 国外代表 合计 不乐观 40 60 100 乐观 60 40 100 合计 100 100 200 2 22 2 4 2004060 87.879 100 K , 所以有99.5%以上的把握认为持乐观态
39、度和国内外差异有关. 故答案为:有. 15 (2019 湖北期中(理) )由样本数据得到,女大学生的身高预报体重的回归方程是0.8585.7yx(其 中 x,y的单位分别是cm,kg) ,则此方程在样本170,61处残差的绝对值是_. 【答案】2.2 【解析】 由样本数据得到,女大学生的身高预报体重的回归方程是0.8585.7yx, 当170 x 时,0.85 170 85.758.8y ; 此方程在样本170,61处残差的绝对值:58.8 612.2. 故答案为:2.2. 16 (2017 北京石景山 高三一模(文) )在环境保护部公布的 2016 年 74 城市 PM2.5 月均浓度排名情
40、况中, 某 14 座城市在 74 城的排名情况如下图所示,甲、乙、丙为某三座城市 从排名情况看, 在甲、乙两城中,2 月份名次比 1 月份名次靠前的城市是_; 在第 1 季度的三个月中,丙城市的名次最靠前的月份是_ 【答案】乙 二月份 【解析】 结合题设中提供的散点图可知:城市乙更靠近回归直线,答案应填乙;结合第二个散点图可以看出丙城市 的名次更靠近二月份,答案应填二月份 四四、解答题、解答题 17 (2020 沙坪坝 重庆一中高三其他(文) )截止 2020年 5月 15 日,新冠肺炎全球确诊数已经超过 440万, 新冠肺炎是一个传染性很强的疾病,其病毒在潜伏期以内就具备了传染性.湖北省某医
41、疗研究机构收集了 1000名患者的病毒潜伏期的信息,将数据统计如下表所示: 潜伏期 0-2 天 2-4 天 4-6 天 6-8 天 8-10 天 10-12 天 12-14 天 人数 40 160 300 360 60 60 20 (1)求 1000名患者潜伏期的平均数x(同一组中的数据用该组区间的中点值作代表) ; (2)潜伏期不高于平均数的患者,称为“短潜伏者”;潜伏期高于平均数的患者,称为“长潜伏者”.为研 究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准分为两类进行分层抽样,从上述 1000名患者 中抽取 300 人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有 9
42、9.9%的把握认为潜伏期 长短与患者年龄有关. 短潜伏者 长潜伏者 合计 60 岁及以上 100 60 岁以下 140 合计 300 附表及公式: 2 0 P Kk 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 2 2 () ()()()() n adbc K ab cd ac bd 【答案】 (1)6; (2)填表见解析;有 99.9%的把握认为潜伏期长短与患者年龄有关 【解析】 (1) 40160300360606020 135791113 100010001000
43、1000100010001000 x 40480 15002520540660260 1000 6000 1000 6. (2)抽取的短潜伏者的总人数为 40 160300 300150 1000 ,长潜伏者的总人数为300 150150. 列联表如下: 短潜伏者 长潜伏者 合计 60 岁及以上 100 60 160 60 岁以下 50 90 140 合计 150 150 300 2 2 300 (100 9050 60) 150 150 140 160 K 150 7 21.42910.828. 故有 99.9%的把握认为潜伏期长短与患者年龄有关. 18 (2020 甘肃省会宁县第二中学期中
44、(文) )2019年中央电视台在周日晚上推出的一档新的综艺节目, 为了解节目效果,一次节目结束后,现随机抽取了500名观众(含200名女性)的评分(百分制)进行分 析,分别得到如图所示的两个频率分布直方图. (1)计算女性观众评分的中位数与男性观众评分的平均分; (2)若把评分低于70分定为“不满意”,评分不低于70分定为“满意”. (i)试比较男观众与女观众不满意的概率大小,并说明理由; (ii)完成下列22列联表,并回答是否有95%的把握认为性别和对该综艺节目是否满意有关. 女性观众 男性观众 合计 “满意” “不满意” 合计 参考数据: 2 2 () ()()()() n adbc K
45、ab cd ac bd 2 P Kk 0.05 0.010 0.001 k 3.841 6.635 10.828 【答案】 (1)女性观众评分的中位数为75,男性观众评分的平均数为73.5(2) (i)男性观众不满意的概 率大,详见解析(ii)填表见解析;有95%的把握认为性别和对该综艺节目是否满意有关 【解析】 (1)根据题意,设女性观众评分的中位数为x, 10 0.01 10 0.02(70) 0.040.5x , 75x . 男性观众评分的平均数为55 0.15 65 0.25 75 0.3 85 0.2 95 0.173.5. (2) (i)男性观众不满意的概率大, 记 A C表示事件
46、:“女性观众不满意”; B C表示事件:“男性观众不满意”,由直方图得 A P C的估计值为 (0.01 0.02) 100.3, B P C的估计值为(0.0150.025) 100.4, 所以男性观众不满意的概率大. (ii)列联表如下图: 女性观众 男性观众 合计 “满意” 140 180 320 “不满意” 60 120 180 合计 200 300 500 所以 2 2 500 (140 120 180 60) 5.2083.841 200 300 320 180 K 故有95%的把握认为性别和对该综艺节目是否满意有关. 19 (2019 扶风县法门高中月考 (文) ) 下表提供了某
47、厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y(吨标准煤)的几组对照数据 x 3 4 5 6 y 2.5 3.5 4 5 (1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 ybxa; (2)已知该厂技术改造前 100 吨甲产品能耗为 90 吨标准煤.试根据(1)求出的线性回归方程,预测生产 100 吨甲产品的生产能耗比技术改造前降低多少吨标准煤? 【答案】 (1)0.80.15yx(2)9.85 【解析】 (1)由系数公式可知, 4.5,3.75, 所以 y 关于 x 的线性回归方程为0.80.15yx. (2)当 x=100 时, ,90-80.
48、15=9.85, 所以技术改造后预测生产 100 吨甲产品的生产能耗 80.15 吨标准煤,比技术改造前降低 9.85 吨标准煤. 20 (2020 江苏广陵 扬州中学开学考试)某企业新研发了一种产品,产品的成本由原料成本及非原料成本 组成每批产品的非原料总成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据: x 1 2 3 4 5 6 7 y 6 11 21 34 66 101 196 根据以上数据,绘制如图所示的散点图 观察散点图, 两个变量不具有线性相关关系, 现考虑用对数函数模型lnyabx和指数函数模型 x yc d 分别对两个变量的关系进行拟合 (1)根据散点图判断,
49、lnyabx与 x yc d (c,d均为大于零的常数)哪一个适宜作为非原料总成 本y关于生产该产品的数量x的回归方程类型; (给出判断即可,不必说明理由) (2)根据(1)的判断结果及表 1中的数据,建立y关于x的回归方程; (3)已知每件产品的原料成本为 10 元,若该产品的总成本不得高于 123470 元,请估计最多能生产多少千 件产品 参考数据: y v 7 1 ii i x y 7 1 ii i xv 0.54 10 62.14 1.54 2535 50.12 3.47 其中lg ii vy, 1 1 7 n i i vv 参考公式:对于一组数据 11 ,u v, 22 ,u v,, nn u v,其回归直线 vau的斜率和截距的最小二 乘估计公式分别为 1 22 1 n i i i n i i uvnuv unu , a vu 【答案】 (1) x yc d 适宜; (2) 0.25 3.47 10 x y ; (3)12千件产品 【解析】 (1)根据散点图判断, x yc d 适宜作为非原料总成本 y关于生产该产品的数量 x的回归方程类型 (2)由 x yc d ,两边同时取常用对数得lglglglg x yc dcxd 设l