1、 2018-2019 学年选修 1-2 第一章训练卷 统计案例(一)统计案例(一) 注意事项:注意事项: 1答题前,先将自己的姓名、准考证号填写在试题卷和答题卡上,并 将准考证号条形码粘贴在答题卡上的指定位置。 2选择题的作答:每小题选出答案后,用 2B 铅笔把答题卡上对应题目 的答案标号涂黑,写在试题卷、草稿纸和答题卡上的非答题区域均无效。 3非选择题的作答:用签字笔直接答在答题卡上对应的答题区域内。 写在试题卷、草稿纸和答题卡上的非答题区域均无效。 4考试结束后,请将本试题卷和答题卡一并上交。 一、选择题一、选择题(本大题共本大题共 12 个小题,每小题个小题,每小题 5 分,共分,共 6
2、0 分,在每小题给出的四个选分,在每小题给出的四个选 项中,只有一项是符合题目要求的项中,只有一项是符合题目要求的) 1下列关于等高条形图的叙述正确的是( ) A从等高条形图中可以精确地判断两个分类变量是否有关系 B从等高条例形图中可以看出两个变量频数的相对大小 C从等高条形图可以粗略地看出两个分类变量是否有关系 D以上说法都不对 2一位母亲记录了儿子 39 岁的身高,由此建立的身高与年龄的回归模型为 7.1973.93yx 用这个模型预测这个孩子10岁时的身高, 则正确的叙述是 ( ) A身高一定是145.83cm B身高在145.83cm以上 C身高在145.83cm以下 D身高在145.
3、83cm左右 3 设产品产量与产品质量之间的线性相关系数为0.87, 这说明二者存在着 ( ) A高度相关 B中度相关 C弱度相关 D极弱相关 4 某市政府调查市民收入增减与旅游愿望的关系时, 采用独立性检验法抽查了3000 人,计算发现 2 6.023K ,则根据这一数据查阅下表,市政府断言市民收入增减与 旅游愿望有关系的可信程度是( ) 2 P Kk 0.25 0.15 0.10 0.025 0.010 0.005 k 1.323 2.072 2.706 5.024 6.635 7.879 A90% B95% C97.5% D99.5% 5在两个学习基础相当的班级实行某种教学措施的实验,测
4、试结果见下表,则实 验效果与教学措施( ) 实验效果 教学措施 优、良、中 差 总计 实验班 48 2 50 对比班 38 12 50 总计 86 14 100 A有关 B无关 C关系不明确 D以上都不正确 6四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直 线方程,分别得到以下四个结论: y与x负相关且2.3476.423yx;y与x负相关且3.4765.648yx ; y与x正相关且5.4378.493yx;y与x正相关且4.3264.578yx 其中一定不正确的结论的序号是( ) 、 A B C D 7 如下图所示, 4个散点图中, 不适合用线性回归模型拟合其中两个变
5、量的是 ( ) 8预报变量的值与下列的哪些因素有关( ) A受解释变量的影响,与随机误差无关 B受随机误差的影响,与解释变量无关 C与总偏差平方和有关,与残差无关 此卷只装订不密封 班级 姓名 准考证号 考场号 座位号 D与解释变量和随机误差的总效应有关 9已知x与y之间的一组数据: x 0 1 2 3 y 1 3 5 7 则y与x的线性回归方程 ybxa必过( ) A2,2点 B1.5,0点 C1,2点 D1.5,4点 10下面是调查某地区男女中学生是否喜欢理科的等高条形图,阴影部分表示喜欢 理科的百分比,从下图可以看出( ) A性别与是否喜欢理科无关 B女生中喜欢理科的比为80% C男生比
6、女生喜欢理科的可能性大些 D男生中喜欢理科的比为60% 11 通过随机询问 110 名性别不同的大学生是否爱好某项运动, 得到如下的列联表: 男 女 合计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 附表: 2 P Kk 0.050 0.010 0.001 k 3.841 6.635 10.828 参照附表,得到的正确的结论是( ) A在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C有99%以上的把握认为“爱好该项运动与性别有关” D有99%以上的把握认为“爱好该项运
7、动与性别无关” 12以下关于线性回归的判断,正确的个数是( ) 若散点图中所有点都在一条直线附近,则这条直线为回归直线; 散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的 A,B, C 点; 已知直线方程为0.500.81yx,则25x 时,y的估计值为11.69; 回归直线方程的意义是它反映了样本整体的变化趋势 A0 B1 C2 D3 二、填空题二、填空题(本大题共本大题共 4 个小题,每小题个小题,每小题 5 分,共分,共 20 分,把正确答案填在题中横分,把正确答案填在题中横 线上线上) 13给出下列实际问题: 一种药物对某种病的治愈率; 两种药物治疗同一种病是否有关系;
8、 吸烟者得肺病的概率; 吸烟人群是否与性别有关系; 上网与青少年的犯罪率是否有关系 其中,用独立性检验可以解决的问题有_ 14有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结 果: 冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58 总计 88 80 168 则在犯错误的概率不超过_的前提下认为多看电视与人变冷漠有关系 15在 2013 年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销 售量及其价格进行调查, 五个商场的售价x元和销售量件之间的一组数据如下表所 示: 价格x 9 9.5 10 10.5 11 销售量y 11 10 8 6
9、 5 通过分析,发现销售量y对商品的价格x具有线性相关关系,则销售量y对商品的 价格x的回归直线方程为_ 16某小卖部为了了解热茶销售量y (杯)与气温x()之间的关系,随机统计了 某 4 天卖出的热茶的杯数与当天气温,并制作了对照表: 气温() 18 13 10 1 杯数 24 34 38 64 由表中数据算得线性回归方程 y bxa中的2b ,预测当气温为5 时,热茶 销售量为_杯 三、解答题三、解答题(本大题共本大题共 6 个小题,共个小题,共 70 分,解答应写出文字说明,证明过程或演算分,解答应写出文字说明,证明过程或演算 步骤步骤) 17 (10 分)考察黄烟经过培养液处理与是否跟
10、发生青花病的关系调查了 457 株 黄烟,得到下表中数据,请根据数据作统计分析 培养液处理 未处理 合计 青花病 25 210 235 无青花病 80 142 222 合计 105 352 457 附: 2 2 n adbc abcdac K bd 2 p Kk 0.05 0.01 0.005 0.001 k 3.841 6.635 7.879 10.828 18 (12 分) 某工业部门进行一项研究, 分析该部门的产量与生产费用之间的关系, 从该部门内随机抽选了 10 个企业为样本,有如下资料: 产量x(千件) 生产费用y(千元) 40 150 42 140 48 160 55 170 65
11、 150 79 162 88 185 100 165 120 190 140 185 (1)计算x与y的相关系数; (2)对这两个变量之间是否线性相关进行检验; (3)设回归方程为 ybxa,求回归系数 19 (12 分)某高校共有 15000 人,其中男生 10500 人,女生 4500 人,为调查该 校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集 300 位学生每周 平均体育运动时间的样本数据(单位:小时) (1)应收集多少位女生的样本数据? (2) 根据这300个样本数据, 得到学生每周平均体育运动时间的频率分布直方图(如 图所示),其中样本数据的分组区间为:0,2,(2,4
12、,(4,6,(6,8,(8,10, (10,12估计该校学生每周平均体育运动时间超过 4 个小时的概率 (3)在样本数据中,有 60 位女生的每周平均体育运动时间超过 4 个小时请完成 每周平均体育运动时间与性别列联表,并判断是否有 95%的把握认为“该校学生的 每周平均体育运动时间与性别有关” 附: 2 2 n adbc abcdac K bd P(K2k0) 0.10 0.05 0.010 0.005 k0 2.706 3.841 6.635 7.879 20 (12 分)在一段时间内,某种商品的价格 x 元和需求量 y 件之间的一组数据为 求出 y 对 x 的回归直线方程,并说明拟合效果
13、的好坏 价格 x 14 16 18 20 22 需求量 y 12 10 7 5 3 21 (12 分)电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取 了 100 名观众进行调查,其中女性有 55 名,下面是根据调查结果绘制的观众日均 收看该体育节目时间的频率分布直方图: 将日均收看该体育节目时间不低于 40 分钟的观众称为“体育迷”,已知“体育迷”中 有 10 名女性 (1)根据已知条件完成下面的 2 2 列联表,并据此资料你是否认为“体育迷”与性 别有关? 非体育迷 体育迷 合计 男 女 合计 (2)将日均收看该体育节目不低于 50 分钟的观众称为“超级体育迷”,已知“超级 体
14、育迷”中有 2 名女性,若从“超级体育迷”中任意选取 2 人,求至少有 1 名女性观 众的概率 附: 2 2 n adbc abcdac K bd P(K2k) 0.05 0.01 k 3.841 6.635 22 (12 分)为了解某市市民对政府出台楼市限购令的态度,在该市随机抽取了 50 名市民进行调查,他们月收入(单位:百元)的频数分布及对楼市限购令的赞成人数 如下表: 月收入 15,25) 25,35) 35,45) 45,55) 55,65) 65,75) 频数 5 10 15 10 5 5 赞成人 数 4 8 8 5 2 1 将月收入不低于 55 的人群称为“高收入族”,月收入低于
15、 55 的人群称为“非高收人 族” (1)根据已知条件完成下面的 2 2 列联表,有多大的把握认为赞不赞成楼市限购 令与收入高低有关? 已知: 2 2 n adbc abcdac K bd , 当 K22.706 时, 有 90%的把握判定赞不赞成楼市限购令与收入高低有关; 当 K23.841 时,有 95%的把握判定赞不赞成楼市限购令与收入高低有关;当 K26.635 时,有 99%的把握判定赞不赞成楼市限购令与收入高低有关 非高收入族 高收入族 总计 赞成 不赞成 总计 (2)现从月收入在55,65)的人群中随机抽取两人,求所抽取的两人中至少一人 赞成楼市限购令的概率 2018-2019
16、学年选修 1-2 第一章训练卷 统计案例(一)统计案例(一) 答答 案案 一、选择题一、选择题 1 【答案】C 【解析】在等高条形图中仅能粗略判断两个分类变量的关系,故 A 错 在等高条形图中仅能找出频率,无法找出频数,故 B 错故选 C 2 【答案】D 【解析】线性回归方程只能近似描述,不是准确值故选 D 3 【答案】A 【解析】0.870.87,与 1 接近,二者存在高度相关故选 A 4 【答案】C 【解析】 2 6.0235.024K ,故其可信度为97.5%故选 C 5 【答案】A 【解析】由公式计算得 2 2 10048 1238 2 50 50 8 8.3066.635 6 14
17、K , 则认为“实验效果与教学措施有关”的概率为 0.99故选 A 6 【答案】D 【解析】y与x正(或负)相关时,线性回归直线方程 ybxa中,x的系数0b (或 0b ) ,故错故选 D 7 【答案】A 【解析】题图 A 中的点不成线性排列,故两个变量不适合线性回归模型故选 A 8 【答案】D 【解析】预报变量既受解释变量的影响,又受随机误差的影响故选 D 9 【答案】D 【解析】计算得1.5x ,4y ,由于回归直线一定过 , x y点,必过1.5,4点 10 【答案】C 【解析】从图中可以看出,男生喜欢理科的比例为60%,而女生比例为仅为20%, 这两个比例差别较大,说明性别与是否喜欢
18、理科是有关系的, 男生比女生喜欢理科的可能性更大一些故选 C 11 【答案】C 【解析】由 2 2 n adbc abcdac K bd , 得 2 2 110 40 302020 60 5 7.8 0 60 50 K 故选 C 12 【答案】D 【解析】能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只 有按最小二乘法求得回归系数 a , b得到的直线ybxa才是回归直线, 不对;正确;将25x 代入0.500.81yx,得11.69y , 正确;正确,故选 D 二、填空题二、填空题 13 【答案】 【解析】独立性检验主要是对两个分类变量是否有关系进行检验,主要涉及两种变 量对
19、同一种事情的影响,或者是两种变量在同一问题上体现的区别等 14 【答案】0.001 【解析】可计算 2 K的观测值11.37710.828 15 【答案】3.240yx 【解析】 5 1 392 i i i yx ,10x ,8y , 2 5 1 2.5 i i xx ,代入公式,得 3.2b , 40aybx,故回归直线方程为3.240yx 16 【答案】70 【解析】根据表格中的数据可求得 1 181310110 4 x , 1 2434386440 4 y 4021060aybx , 260yx ,当5x 时,256070y 三、解答题三、解答题 17 【答案】见解析 【解析】根据公式
20、2 2 45725 14280 210 = 235 222 105 3 41. 1 2 6 5 K ,由于41.6110.828, 说明有99.9%的把握认为黄烟经过培养液处理与是否跟发生青花病是有关系的 18【答案】(1)0.808;(2)x与y之间具有线性相关关系;(3)0.398b ,134.8a 【解析】 (1)根据数据可得77.7x ,165.7y , 10 2 1 70903 i i x , 10 2 1 277119 i i y , 10 1 132938 ii i x y ,0.808r ,即x与y之间的相关系数0.808r ; (2)0.75r ,可认为x与y之间具有线性相关
21、关系; (3) 0.398b ,134.8a 19 【答案】 (1)90; (2)0.75; (3)有 95%的把握认为“该校学生的每周平均体育 运动时间与性别有关 【解析】 (1)3004500 1500090,应收集 90 位女生的样本数据 (2)由频率分布直方图得 12 (0.1000.025)0.75, 该校学生每周平均体育运动时间超过 4 小时的概率的估计值为 0.75 (3)由(2)知,300 位学生中有 300 0.75225 人的每周平均体育运动时间超过 4 小时,75 人的每周平均体育运动时间不超过 4 小时, 又样本数据中有 210 份是关于男生的,90 份是关于女生的,
22、每周平均体育运动时间与性别列联表如下: 男生 女生 总计 每周平均体育运动时间不超过 4 小时 45 30 75 每周平均体育运动时间超过 4 小时 165 60 225 总计 210 90 300 综合列联表可算得 K2 2 30045 60 165 30 75 225 210 90 100 21 4.7623.841 有 95%的把握认为“该校学生的每周平均体育运动时间与性别有关” 20 【答案】见解析 【解析】 x 1 5(1416182022)18, y 1 5 (1210753)7.4, 5 2 1 i i x 1421621822022221 660, 5 2 1 i i y 12
23、2102725232327, 5 1 ii i x y 14 1216 1018 720 522 3620, 5 1 52 2 2 1 5 6205 18 7.446 1.15 16605 1840 5 ii i i i x yx y b xx 7.41.15 1828.1a 回归直线方程为1.1528.1yx 列出残差表为: yiy i 0 0.3 0.4 0.1 0.2 yi y 4.6 2.6 0.4 2.4 4.4 2 5 1 0.3 ii i yy , 2 5 1 53.2 i i yy , 2 5 21 2 5 1 10.994 ii i i i yy R yy R20.994,因
24、而拟合效果较好 21 【答案】 (1)见解析; (2) 7 10 【解析】 (1)由频率分布直方图可知,在抽取的 100 人中,“体育迷”为 25 人,从 而完成 2 2 列联表如下: 非体育迷 体育迷 合计 男 30 15 45 女 45 10 55 合计 75 25 100 将 2 2 列联表中的数据代入公式计算,得 2 2 n adbc abcdac K bd 2 10030 1045 15 75 25 45 55 100 33 3030 3.0303.841,我们没有理由认为“体育迷”与性别有关 (2)由频率分布直方图可知,“超级体育迷”为 5 人,从而一切可能结果所组成的 集合为 1
25、2132311122122313212 ,a aa aa aa ba ba ba ba ba bb b , 其中 i a表示男性,i1,2,3, j b表示女性,j1,2 由 10 个基本事件组成,而且这些基本事件的出现是等可能的 用 A 表示“任选 2 人中,至少有 1 人是女性”这一事件, 则 11122122313212 ,a ba ba ba ba ba bbAb, 事件 A 由 7 个基本事件组成,因而 P(A) 7 10 22 【答案】 (1)有 90%的把握认为楼市限购令与收入高低有关; (2) 7 10 【解析】 (1) 非高收入族 高收入族 总计 赞成 25 3 28 不赞成 15 7 22 总计 40 10 50 K2 2 5025 7 15 3 40 10 22 28 3.43, 故有 90%的把握认为楼市限购令与收入高低有关 (2)设月收入在55,65)的 5 人的编号为a,b,c,d,e,其中 a,b 为赞成楼市 限购令的人,从 5 人中抽取两人的方法数有ab,ac,ad,ae,bc,bd,be,cd, ce,de 共 10 种,其中ab,ac,ad,ae,bc,bd,be 为有利事件数,因此所求概 率 P 7 10