1、=【 ;精品教育资源文库 】 = “统计与统计案例”双基过关检测 一、选择题 1 (2018 邯郸摸底 )某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一 600 人、高二 780 人、高三 n 人中,抽取 35 人进行问卷调查已知高二被抽取的人数为 13,则 n ( ) A 660 B 720 C 780 D 800 解析:选 B 由已知条件,抽样比为 13780 160, 从而 35600 780 n 160,解得 n 720. 2已知变量 x 与 y 正相关,且由观测数据算得样本平均数 x 3, y 3.5,则由该观测数据算得的线性回归方程可能为 ( ) A.y 0.4x
2、 2.3 B.y 2x 2.4 C.y 2x 9.5 D.y 0.3x 4.4 解析:选 A 依题意知,相应的回归直线的斜率应为正,排除 C, D.且直线必过点 (3,3.5),代入 A、 B, 知 A 正确 3从编号为 001,002, ? , 500 的 500 个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为 007,032,则样本中最大的编号应该为 ( ) A 480 B 481 C 482 D 483 解析:选 C 根据系统抽样的定义可知样本的编号成等差数列, 令 a1 7, a2 32,则 d 25,所以 7 25(n 1)500 , 所以 n20 ,最大编
3、号为 7 2519 482. 4根据如下样本数据: x 2 3 4 5 6 7 y 4.1 2.5 0.5 0.5 2.0 3.0 得到的回归方程为 y bx a,则 ( ) A.a0, b0 B.a0, b0 D.a 6.635 , 有 99%以上的把握认为 “ 生育意愿与城市级别有关 ” 8从甲、乙两个城市分别随机抽取 14 台自动售货机,对 其销售额进行统计,统计数据用茎叶图表示 (如图 ),设甲、乙两组数据的平均数分别为 x 甲 , x 乙 ,中位数分别为 m 甲 , m乙 ,则 ( ) A. x 甲 m 乙 B. x 甲 x 乙 , m 甲 m 乙 D. x 甲 x 乙 , m 甲
4、m 乙 ,故选 A. 二、填空题 9某中学采用系统抽样方法,从该校高一年级全体 800 名学生中抽 50 名学生做牙齿健康检查现将 800 名学生从 1 到 800 进行编号已知从 33 48 这 16 个数中取的数是 39,则 在第 1 小组 1 16 中随机抽到的数是 _ 解析:间隔数 k 80050 16,即每 16 人抽取一个人由于 39 216 7, =【 ;精品教育资源文库 】 = 所以第 1 小组中抽取的数为 7. 答案: 7 10某车间需要确定加工零件的加工时间,进行了若干次试验根据收集到的数据 (如表 ): 零件数 x/个 10 20 30 40 50 加工时间 y/分钟 6
5、2 68 75 81 89 由最小二乘法求得回归直线方程 y 0.67x a,则 a的值为 _ 解析: x 15(10 20 30 40 50) 30, y 15(62 68 75 81 89) 75, 回归直线方程 y 0.67x a过样本中心点 ( x , y ), a 75 0.6730 54.9. 答案: 54.9 11已知甲、乙、丙三类产品共有 1 200 件,且甲、乙、丙三类产品的数量之比为 34 5,现采用分层抽样的方法抽取 60 件进行质量检测,则乙类产品抽取的件数为 _ 解析:由题意可知,乙类产品抽取的件数为 60 43 4 5 20. 答案: 20 12某医疗研究所为了检验
6、某种血清预防感冒的作用,把 500 名使用血清的人与另外500 名未使用血清的人一年中的感冒记录作比较,提出假设 H0: “ 这种血清不能起到预防感冒的作用 ” ,利用 22 列联表计算得 K23. 918,经查临界值表知 P(K23.841)0.05. 则下列结论中,正确结论的序号是 _ 有 95%的把握认为 “ 这种血清能起到预防感冒的作用 ” ; 若某人未使用该血清,那么他在一年中有 95%的可能性得感冒; 这种血清预防感冒的有效率为 95%; 这种血清预防感冒的有效率为 5%. 解析: K23.9183.841 ,而 P(K23.814)0.05 , 所以有 95%的把握认为 “ 这种
7、血清能起到预防感冒的作用 ” 要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题 ,不要混淆 答案: =【 ;精品教育资源文库 】 = 三、解答题 13某地区 2011 年至 2017 年农村居民家庭人均纯收入 y(单位:千元 )的数据如表: 年份 2011 2012 2013 2014 2015 2016 2017 年份代号 x 1 2 3 4 5 6 7 人均纯收入 y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 (1)求 y 关于 x 的线性回归方程; (2)利用 (1)中的回归方程,分析 2011 年至 2017 年该地区农村居民家庭人均纯收
8、入的变化情况,并预测该地区 2019 年农村居民家庭人均纯收入 . 附 :回归直线的斜率和截距的最小二乘法估计公式分别为: b?i 1nxi x yi y?i 1nxi x 2, a y b x (其中 x , y 为样本平均值 ). 解: (1)由题意,得 x 17(1 2 3 4 5 6 7) 4, y 17(2.9 3.3 3.6 4.4 4.8 5.2 5.9) 4.3, ?i 17(xi x )(yi y ) ( 3)( 1.4) ( 2)( 1) ( 1)( 0.7) 010.5 20.9 31.6 14, ?i 17(xi x )2 ( 3)2 ( 2)2 ( 1)2 02 12
9、 22 32 28, 所以 b 1428 0.5, a y b x 4.3 0.54 2.3, 所以 y 关于 x 的线性回归方程为 y 0.5x 2.3. =【 ;精品教育资源文库 】 = (2)因为 b 0.50, 所以 2011年至 2017 年该地区农村居民家庭人 均纯收入逐年增加,平均每年增加 0.5千元, 因为 2019 的年份代号是 x 9,所以代入 (1)中的回归方程,可得 y 0.59 2.3 6.8, 所以预测该地区 2019 年农村居民家庭人均纯收入为 6 8 千元 14 (2018 唐山统考 )为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了 m 名学
10、生进行体育测试根据体育测试得到了这 m 名学生的各项平均成绩 (满足100 分 ),按照以下区间分为七组: 30,40), 40,50), 50,60), 60,70), 70,80), 80,90),90,100,并得到频率分布直方图 (如图 )已知测试平均成绩在区间 30,60)内有 20 人 (1)求 m 的值及中位数 n; (2)若该校学生测试平均成绩小于 n,则学校应适当增加体育活动时间根据以上抽样调查数据,该校是否需要增加体育活动时间? 解: (1)由频率分布直方图知第 1 组,第 2 组和第 3 组的频率分别是 0.02,0.02 和 0.06, 则 m(0.02 0.02 0.
11、06) 20,解得 m 200. 由直方图可知,中位数 n 位于 70,80)内, 则 0.02 0.02 0.06 0.22 0.04(n 70) 0.5,解得 n 74.5. (2)设第 i(i 1,2,3,4,5,6,7)组的频率和频数分别为 pi和 xi, 由图知, p1 0.02, p2 0.02, p3 0.06, p4 0.22, p5 0.40, p6 0.18, p7 0.10, 则由 xi 200 pi,可得 x1 4, x2 4, x3 12, x4 44, x5 80, x6 36, x7 20, 故该校学生测试平均成绩是 x 1200(35 x1 45x2 55x3 65x4 75x5 85x6 95x7) 74 74.5, 所以学校应该适当增加体育活动时间