1、=【 ;精品教育资源文库 】 = 第 11 讲 回归分析与独立性检验 1 (2016 年河南开封一模 )下列说法错误的是 ( ) A当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系 B在线性回归分析中,相关系数 r 的值越大,变量间的相关性越强 C在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高 D在回归分析中, R2为 0.98 的模型比 R2为 0.80 的模型拟合的效果好 2 (2015 年湖北 )已知变量 x 和 y 满足关系 y 0.1x 1,变量 y 与 z 正相关下列结论正确的是 ( ) A x 与 y 负相关, x 与 z 负相关
2、 B x 与 y 正相关, x 与 z 正相关 C x 与 y 正相关, x 与 z 负相关 D x 与 y 负相关, x 与 z 正相关 3为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机选取了 60 名高中生,通过问卷调查,得到以下数据: 项目 作文成绩优秀 作文成绩一般 合计 课外阅读量较大 22 10 32 课外阅读量一般 8 20 28 合计 30 30 60 由以上数据,计算得出 K2 9.643.根据临界值表,以下说法正确的是 ( ) A没有充足的理由认为课外阅读量较大与作文成绩优秀有关 B有 0.5%的把握 认为课外阅读量较大与作文成绩优秀有关 C有 99.5%的把握
3、认为课外阅读量较大与作文成绩优秀有关 D有 99.9%的把握认为课外阅读量较大与作文成绩优秀有关 4 (2016 年重庆 )已知变量 x, y 的取值如下表所示: x 4 5 6 y 8 6 7 若 y 与 x 线性相关,且线性回归方程为 y bx 2,则 b的值为 ( ) A 1 B.32 C.45 D.56 5甲、乙、丙、丁四名同学各自对 A, B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数 r 与残差平方和 m 如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 则哪位同学的试验结果体现 A, B 两变量有更强的线性相
4、关性 ( ) A甲 B乙 C丙 D丁 6 (2015 年福建 )为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5 户家庭,得到如下统计数据表: 收入 x /万元 8.2 8.6 10.0 11.3 11.9 支出 y/万元 6.2 7.5 8.0 8.5 9.8 根据上表可得回归直线方程 y bx a ,其中 b 0.76, a y bx .据此估计,该社区一户收入为 15 万元的家庭年支出为 ( ) =【 ;精品教育资源文库 】 = A 11.4 万元 B 11.8 万元 C 12.0 万元 D 12.2 万元 7 (2017 年陕西西安质检 )某车间为了规定工时定额,需要确定
5、加工零件所花费的时间,为此进行了 5 次试验,根据收集到的数据 (如下表 ),由最小二乘法得回归直线方程 y 0.68x 54.6,表中有一个数据模糊不清,请你推断该数据的值为 ( ) 零件个数 x/个 10 20 30 40 50 加工时间 y/min 62 75 81 89 A.68 B 68.2 C 70 D 75 8 (2015 年北京 )高三年级 267 名学生参加期末考试,某班 37 名学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图 X9111,甲、乙、丙为该班三名学生 图 X9111 从这次考试成绩看, (1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 _
6、; (2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 _ 9 (2015 年重庆 )随着我国经济的发展,居民的储蓄存款逐年增长设某地区城乡居民人民币储蓄存款 (年底余额 )如下表 . 年份 2010 2011 2012 2013 2014 时间代号 t 1 2 3 4 5 储蓄存款 y/千亿元 5 6 7 8 10 (1)求 y 关于 t 的回归方程 y bt a; (2)用所求回归方程预测该地区 2015 年 (t 6)的人民币储蓄存款 附:回归方程 y bt a中: 1122211( ) ( )()nni i i iiinniiiix x y y x y n x ybx x x
7、 n xa y b x? ? ? ? ? ? 10 (2017 年广东广州一模 )某企业生产的某种产品被检测出其中一项质量指标存在问=【 ;精品教育资源文库 】 = 题该企业为了检查生产该产品的甲,乙两条流水线的生产情况,随机地从这两条流水线上生产的大量产品中各抽取 50 件产品作为样本,测出它们的这一项质量指标值若该项质量指标值落在 (195,210内,则为合格品,否则为不合格品下表是甲流水线样本的频数分布表,图 X9112 是乙流水线样本的频率分布直方图 甲流水线样本的频数分布表 质量指标值 频数 (190,195 9 (195,200 10 (200,205 17 (205,210 8
8、(210,215 6 乙流水线样本频率分布直方图 图 X9112 (1)根据图 X9112,估计乙流水线生产产品该质量指标值的中位数; (2)若将频率视为概率,某个月内甲、乙两条流水线均生产了 5000 件产品,则甲、乙两条流水线分别生产出不合格品约多少件? (3)根据已知条件完成下面 22 列联表,并回答是否有 85%的把握认为 “ 该企业生产的这种产品的质量指标值与甲、乙两条流水线的选择有关 ” ? 甲生产线 乙生产线 合计 合格品 不合格品 合计 附 : K2 n ad bc2a b c d a c b d (其中 n a b c d 为样本容量 ) P(K2 k) 0.15 0.10
9、0.05 0.025 0.010 0.005 0.001 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 =【 ;精品教育资源文库 】 = 第 11 讲 回归分析与独立性检验 1 B 解析:根据相关关系的概念知 A 正确;当 r0 时, r 越大,相关性越强,当 r0),则将 y 0.1x 1 代入即可得 z k( 0.1x 1) b 0.1kx (k b)所以 0.1k0.所以 x 与 z 负相关故选 A. 3 C 4 A 解析:由表格,得 x 5, y 7.代入线性回归方程得 7 5b 2.解得 b 1.故选 A. 5 D 解析:在验证两个变量之间
10、的线性相关关系时,相关系数的绝对值越接近于 1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,拟合的效果越好,只有丁的残差平方和最小,综上可知丁的试验结果体现了 A, B 两变量有更强的线性相关性 6 B 解析:由已知得 x 8.2 8.6 10.0 11.3 11.95 10(万元 ), y 6.2 7.5 8.0 8.5 9.85 8(万元 ),故 a 8 0.7610 0.4.所以回归直线方程为 y0.76x 0.4,该社区一户收入为 15 万元的家庭年支出为 y 0.7615 0.4 11.8(万元 )故选 B. 7 A 解析:设表中有一个模糊看不清数据为 m, 由表中
11、数据,得 x 30, y m 3075 , 由最小二乘法求得回归方程 y 0.68x 54.6, 将 x 30, y m 3075 代入回归直线方程, 得 m 68.故选 A. 8 (1)乙 (2)数学 解析: (1)由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙 (2)由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学 成绩的排名更靠前,故填数学 9解: (1)列表计算如下: i ti yi t2i tiyi 1 1 5 1 5 2 2 6 4 12 3 3 7 9 21 4 4 8 16 32 5 5
12、 10 25 50 15 36 55 120 这里 n 5, t 1n1nii t? 155 3, y 1n1nii y? 365 7.2. 又 lnt 21nii t? n t 2 55 53 2 10, =【 ;精品教育资源文库 】 = lny1nii t?yi n t y 120 537.2 12. 从而 b lnylnt 1210 1.2, a y b t 7.2 1.23 3.6. 故所求回归方程为 y 1.2t 3.6. (2)将 t 6 代入回归方程可预测该地区 2015 年的人民币储蓄存款为 y 1.26 3.610.8(千亿元 ) 10解: (1)设乙流水线生产产品的该项质量
13、指标值的中位数为 x,因为 0 48 (0.012 0.032 0.052)50.5(0.012 0.032 0.052 0.076)5 0.86, 所以 (0.012 0.032 0.052)5 0.076( x 205) 0.5, 解得 x 390019 . (2)由甲、乙两条流水线各抽取的 50 件产品可 得,甲流水线生产的不合格品有 15 件, 则甲流水线生产的产品为不合格品的概率为 p 甲 1550 310, 乙流水线生产的产品为不合格品的概率为 p 乙 (0.012 0.028)5 15, 于是,若某个月内甲、乙两条流水线均生产了 5000 件产品,则甲、乙两条流水线生产的不合格品件数分别为 5000 310 1500,5000 15 1000. (3)22 列联表: 甲生产线 乙生产线 合计 合格品 35 40 75 不合格品 15 10 25 合计 50 50 100 则 K2 250507525 431.3. 因为 1.32.072, 所以没有 85%的把握认为 “ 该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关 ”