1、章末整合 专题一 回归分析 例1某地收集到的新房屋的销售价格y和房屋的面积x的数据如下表: 房屋面积x/m2 115 110 80 135 105 销售价格y/万元 24.8 21.6 18.4 29.2 22 (1)画出数据对应的散点图; (2)若y与x线性相关,建立y关于x的经验回归方程; (3)根据(2)的结果估计当房屋面积为150 m2时的销售价格. 解:(1)数据对应的散点图如图所示. (2)由散点图知 y 与 x 具有线性相关关系. 由表中数据知 = 1 5 =1 5 xi=109,y = 1 5 i=1 5 yi=23.2, =1 5 2=60 975, =1 5 xiyi=12
2、 952.设所求经验回归方程为 = x+ , 则 = =1 5 -5 =1 5 2-52 0.196 2, = 1.814 2. 故所求经验回归方程为 =0.196 2x+1.814 2. (3)由(2)可知,当 x=150 时, =0.196 2150+1.814 2=31.244 2.故销售 价格的估计值为 31.244 2 万元. 方法技巧 经验回归方程的求法及应用 在散点图中,样本点大致分布在一条直线附近,利用公式求出 , ,即 可写出经验回归方程,利用经验回归模型进行研究,可近似地利用经 验回归方程 = x+ 来预测. 变式训练1已知某连锁经营公司的5个零售店某月的销售额和利润 额资
3、料如下表: 商店名称 A B C D E 销售额x/千万元 3 5 6 7 9 利润额y/千万元 2 3 3 4 5 (1)画出散点图; (2)根据如下的参考公式与参考数据,建立利润额y与销售额x的经验 回归方程; (3)若该公司还有一个零售店某月销售额为10千万元,试估计它的利 润额是多少. 参考公式: = i=1 n - =1 2-2 , = .参考数 据: =1 5 xiyi=112, =1 5 2=200 解:(1)散点图如下. (2)由(1)中散点图可知,y与 x 线性相关.由已知数据计算得 n=5, = 30 5 =6, = 17 5 =3.4. = =1 5 -5 =1 5 2-
4、52 = 112-563.4 200-566 =0.5, =3.4-0.56=0.4. 故经验回归方程为 =0.5x+0.4. (3)将 x=10 代入经验回归方程中得到 =0.510+0.4=5.4, 即估计该零售店的利润额为 5.4 千万元. 专题二 一元线性回归模型分析 例2在研究弹簧伸长长度y(单位:cm)与拉力x(单位:N)的关系时,对 不同拉力的6根弹簧进行测量,测得如下表中的数据: x/N 5 10 15 20 25 30 y/cm 7.25 8.12 8.95 9.90 10.9 11.8 若依据散点图可知x与y线性相关,且由最小二乘法求出的经验回归 方程为 =0.18x+6.
5、34,求R2,并利用R2说明拟合效果. 解:列表求值如下: xi 5 10 15 20 25 30 yi 7.25 8.12 8.95 9.90 10.9 11.8 xiyi 36.25 81.2 134.25 198 272.5 354 xi 2 25 100 225 400 625 900 yi-y i 0.01 -0.02 -0.09 -0.04 0.06 0.06 yi-y -2.24 -1.37 -0.54 0.41 1.41 2.31 =17.5,9.49, =1 6 xiyi=1 076.2, i=1 6 2=2 275, =1 6 (yi- )2=0.017 4, =1 6 (
6、yi-)2=14.678 4. 所以 R2=1- 0.017 4 14.678 40.998 81,模型拟合效果较好. 方法技巧 一元线性回归模型拟合问题的求解策略 在一元线性回归模型中,R2与相关系数r都能刻画模型拟合数据的 效果.|r|越大,R2就越大,用模型拟合数据的效果就越好. 变式训练2关于x与y有以下数据: x 2 4 5 6 8 y 30 40 60 50 70 已知 x 与 y 线性相关,由最小二乘法得 =6.5. (1)建立 y 关于 x 的经验回归方程; (2)现有第二个模型:y =7x+17,且 R2=0.82. 若与(1)的模型比较,则哪一个模型拟合效果比较好,请说明理
7、由. 解:(1)依题意设 y 关于 x 的经验回归方程为 =6.5x+. = 2+4+5+6+8 5 =5, = 30+40+60+50+70 5 =50, 又经验回归直线经过(,), 50=6.55+ .=17.5. y 关于 x 的经验回归方程为 =6.5x+17.5. (2)由(1)的模型得 yi- 与 yi-的关系如下表: yi-y i -0.5 -3.5 10 -6.5 0.5 yi-y -20 -10 10 0 20 所以 =1 5 (yi-y )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155. =1 5 (yi-)2=(-20)2+(-10)2+10
8、2+02+202=1 000. 所以1 2=1- =1 5 (- ) 2 =1 5 (-)2 =1- 155 1 000=0.845. 因为 R2=0.82,所以1 2R2. 所以(1)的模型拟合效果比较好. 专题三 独立性检验 例3为了调查胃病是否与生活规律有关联,在某地对540名40岁以上 的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者 生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者 生活规律的共200人. (1)根据以上数据列出22列联表; (2)依据=0.005的独立性检验,能否认为40岁以上的人患胃病与生 活规律有关联? 解:(1)由题意可列22列联
9、表如下: 类型 患胃病 未患胃病 合计 生活规律 20 200 220 生活不规律 60 260 320 合计 80 460 540 (2)零假设为H0:40岁以上的人患胃病与生活规律无关联.根据列联 表得 2=540(20260-20060) 2 80460220320 9.6387.879=x0.005. 依据=0.005的独立性检验,我们推断H0不成立,即认为40岁以上的 人患胃病和生活规律有关联. 方法技巧 独立性检验的一般步骤 (1)根据样本数据制成22列联表; (2)根据公式计算2; (3)比较2与临界值x的大小关系,得到推断结论. 变式训练3为了解某班学生喜爱打篮球是否与性别有关
10、联,对本班 50人进行问卷调查得到了如下的列联表: 性别 喜爱打篮球 不喜爱打篮球 合计 男生 5 女生 10 合计 50 已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为 0.6. (1)请将上面的列联表补充完整(不用写计算过程). (2)依据=0.01的独立性检验,能否认为喜爱打篮球与性别有关联? 说明你的理由. (参考公式:2= (-)2 (+)(+)(+)(+) 解:(1)依题意可知喜爱打篮球的学生的人数为500.6=30. 列联表补充如下: 性别 喜爱打篮球 不喜爱打篮球 合计 男生 20 5 25 女生 10 15 25 合计 30 20 50 (2)零假设为H0:喜爱打篮球与性别无关联.根据列表中的数据,经计 算得到 2=50(2015-510) 2 25253020 8.3336.635=x0.01,依据 =0.01 的独立 性检验,我们推断H0不成立,即认为喜爱打篮球与性别有关联.