1、章末检测章末检测 一、选择题 1对于线性回归方程y bxa,下列说法中不正确的是( ) A直线必经过点( x , y ) Bx 增加 1 个单位时,y 平均增加b 个单位 C样本数据中 x0 时,可能有 ya D样本数据中 x0 时,一定有 ya 答案 D 解析 线性回归方程是根据样本数据得到的一个近似曲线, 故由它得到的值也是一个近似值 2根据如下样本数据: x 3 4 5 6 7 8 y 4 2.5 0.5 0.5 2 3 得到的线性回归方程为y bxa,则( ) A.a 0,b0,b0 C.a 0 D.a 6.635. 因为 P(K26.635)0.01, 所以“x 与 y 之间有关系”
2、出错的概率为 0.01. 14某数学老师身高 176 cm,他爷爷、父亲和儿子的身高分别是 173 cm、170 cm 和 182 cm. 因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 _ cm. 答案 185 解析 由题意可得父亲和儿子的身高组成了三个坐标(173,170)、(170,176)、(176,182), x 173170176 3 173, y 170176182 3 176, b 3 i1 xi x yi y 3 i1 xi x 2 1, a y b x 1761733, y x3, 即孙子的身高约为y 1823185. 三、解答题 15要分析学生
3、中考的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽 选 10 名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表: x 63 67 45 88 81 71 52 99 58 76 y 65 78 52 82 92 89 73 98 56 75 表中 x 是学生入学成绩,y 是高一年级期末考试数学成绩 (1)画出散点图; (2)求线性回归方程; (3)若某学生的入学成绩为 80 分,试预测他在高一年级期末考试中的数学成绩 解 (1)作出散点图如图,从散点图可以看出,这两个变量具有线性相关关系 (2)列表如下: x 63 67 45 88 81 71 52 99 58
4、 76 y 65 78 52 82 92 89 73 98 56 75 x2 3 969 4 489 2 025 7 744 6 561 5 041 2 704 9 801 3 364 5 776 y2 4 225 6 084 2 704 6 724 8 464 7 921 5 329 9 604 3 136 5 625 xy 4 095 5 226 2 340 7 216 7 452 6 319 3 796 9 702 3 248 5 700 可求得 x 1 10(636776)70, y 1 10(657875)76, t1 10 x2i51 474, i1 10 xiyi55 094.
5、b 55 094107076 51 47410702 0.765 56. a 760.765 567022.41, 故所求的线性回归方程为y 22.410.765 56x. (3)若学生入学成绩为 80 分,代入上面线性线性回归方程y 22.410.765 56x,可求得y 84(分) 故该同学高一期末数学成绩预测为 84 分 16 为了了解少年儿童的肥胖是否与常喝碳酸饮料有关, 现对 30 名六年级的学生进行了问卷 调查得到如下列联表平均每天喝 500 mL 以上为常喝,体重超过 50 kg 为肥胖. 常喝 不常喝 合计 肥胖 2 不肥胖 18 合计 30 已知在 30 人中随机抽取 1 人
6、,抽到肥胖的学生的概率为 4 15. (1)请将上面的列联表补充完整 (2)是否有 99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由 (3)现从常喝碳酸饮料且肥胖的学生中(其中有 2 名女生)抽取 2 人参加电视节目,则正好抽到 1 男 1 女的概率是多少? 解 (1)设常喝碳酸饮料且肥胖的学生有 x 人,则x2 30 4 15,解得 x6. 常喝 不常喝 合计 肥胖 6 2 8 不肥胖 4 18 22 合计 10 20 30 (2)由已知数据,得 K23061824 2 1020822 8.5237.879. 因此有 99.5%的把握认为肥胖与常喝碳酸饮料有关 (3)设常喝碳酸饮料的
7、肥胖者男生为 A, B,C, D,女生为 E, F,则任取 2 人有 AB,AC,AD, AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF 共 15 种其中 1 男 1 女有 AE, AF,BE,BF,CE,CF,DE,DF,故抽出 1 男 1 女的概率 P 8 15. 17 某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究, 他们分别记录了 12 月 1 日至 12 月 5 日的每天昼夜温差与实验室每天每 100 颗种子中的发芽 数,得到如下资料: 日期 12 月 1 日 12 月 2 日 12 月 3 日 12 月 4 日 12 月 5 日
8、 温差 x() 10 11 13 12 8 发芽数 y(颗) 23 25 30 26 16 该农科所确定的研究方案是:先从这五组数据中选取 2 组,用剩下的 3 组数据求线性回归方 程,再对被选取的 2 组数据进行检验 (1)求选取的 2 组数据恰好是不相邻 2 天数据的概率; (2)若选取的是 12 月 1 日与 12 月 5 日的两组数据,请根据 12 月 2 日至 12 月 4 日的数据,求 出 y 关于 x 的线性回归方程y bxa; (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2 颗,则认为得到 的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠
9、? 解 (1)设事件 A 表示“选取的 2 组数据恰好是不相邻 2 天的数据”,则 A 表示“选取的数 据恰好是相邻 2 天的数据” 基本事件总数为 10,事件 A 包含的基本事件数为 4. P( A ) 4 10 2 5, P(A)1P( A )3 5. (2) x 12, y 27, i1 3 xiyi977, i1 3 x2i434, b i1 3 xiyi3 x y i1 3 x2i3 x 2 97731227 4343122 2.5, a y b x 272.5123, y 2.5x3. (3)由(2)知:当 x10 时,y 22,误差不超过 2 颗; 当 x8 时,y 17,误差不
10、超过 2 颗 故所求得的线性回归方程是可靠的 18某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽 取 40 件产品作为样本,称出它们的质量(单位:克),质量值落在(495,510的产品为合格品, 否则为不合格品 下图是甲流水线样本的频率分布直方图, 乙流水线样本的频数分布表如下: 产品质量(克) 频数 490,495 6 (495,500 8 (500,505 14 (505,510 8 (510,515 4 (1)若以频率作为概率, 试估计从甲流水线上任取5件产品, 其中合格品的件数X的数学期望; (2)从乙流水线样本的不合格品中任取 2 件,求其中超过合格品重
11、量的件数 Y 的分布列; (3)由以上统计数据完成下面的 22 列联表,并回答有多大的把握认为“产品的包装质量与 两条自动包装流水线的选择有关” 甲流水线 乙流水线 总计 合格品 a b 不合格品 c d 总计 n 参数公式:K2 nadbc2 abcdacbd,其中 nabcd. 参数数据: P(K2k0) 0.15 0.10 0.05 0.025 0.010 k0 2.072 2.706 3.841 5.024 6.635 解 (1)由题图知甲样本中合格品数为(0.060.090.03)54036,故合格品的频率为36 40 0.9, 据此可估计从甲流水线上任取1件产品, 该产品为合格品的
12、概率p0.9, 则X(5,0.9), E(X)50.94.5. (2)由题表知乙流水线样本中不合格品共 10 个,超过合格品质量的有 4 件,则 Y 的可能取值 为 0,1,2,且 P(Yk)C k 4C 2k 6 C210 (k0,1,2),于是有 P(Y0)1 3,P(Y1) 8 15,P(Y2) 2 15. 所以 Y 的分布列为: Y 0 1 2 P 1 3 8 15 2 15 (3)22 列联表如下: 甲流水线 乙流水线 总计 合格品 a36 b30 66 不合格品 c4 d10 14 总计 40 40 n80 K2 nadbc2 abcdacbd 803601202 661440403.1172.706,所以有 90%的把握认为“产 品的包装质量与两条自动包装流水线的选择有关”