1、-1- 第三章第三章 统计案例统计案例 -2- 3 3.1 1 回归分析的基本思想及其初步应用 -3- 3.1 回归分析的基本 思想及其初步应用 首 页 JICHU ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点难点 SUITANG LIANXI 随堂练习 课程目标课程目标 学习脉络学习脉络 1.能知道用回归分析处理两个变量 之间的不确定关系的统计方法. 2.会利用散点图分析两个变量是否 存在相关关系.会用残差及 R2来刻画 线性回归模型的拟合效果. 3.能记住建立回归模型的方法和步 骤;能知道如何利用线性回归模型求 非线性回归模型. -4- 3.1 回归分析的基本 思想及其
2、初步应用 JICHU ZHISHI 基础知识 首 页 ZHONGDIAN NANDIAN 重点难点 SUITANG LIANXI 随堂练习 1.回归分析 (1)函数关系是一种确定性关系,而相关关系是一种非确定性关系. (2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用 方法. (3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),回归直线 y=bx+a 的斜率和截距的最小二乘估计公式分别为 = =1 (-)(-) =1 (-)2 = =1 -n =1 2-n2 , = ,其中,(,)称为样本点的中心. -5- 3.1 回归分析的基本 思想及其初步应用
3、JICHU ZHISHI 基础知识 首 页 ZHONGDIAN NANDIAN 重点难点 SUITANG LIANXI 随堂练习 思考1如果记录了x,y的几组数据分别为(0,1),(1,3),(2,5),(3,7), 则 y 关于 x 的线性回归直线必过点( ) A.(2,2) B.(1.5,2) C.(1,2) D.(1.5,4) 提示: x = 0+1+2+3 4 =1.5,y = 1+3+5+7 4 =4, 样本点的中心为(1.5,4),而回归直线过样本点的中心. -6- 3.1 回归分析的基本 思想及其初步应用 JICHU ZHISHI 基础知识 首 页 ZHONGDIAN NANDI
4、AN 重点难点 SUITANG LIANXI 随堂练习 2.随机误差 (1)随机误差的均值 E(e)=0,方差 D(e)=20. (2)线性回归模型的完整表达式为 y = bx + a + e, E(e) = 0,D(e) = 2.在线性回归模型 中,随机误差 e 的方差 2越小,用 bx+a 预报真实值 y 的精度越高. (3)对于样本点(x1,y1),(x2,y2),(xn,yn)而言,它们的随机误差为 ei=yi-bxi-a,i=1,2,n,其估计值为e i=yi-y i=yi-b xi-a ,i=1,2,n,e i称为相应于 点(xi,yi)的残差. -7- 3.1 回归分析的基本 思
5、想及其初步应用 JICHU ZHISHI 基础知识 首 页 ZHONGDIAN NANDIAN 重点难点 SUITANG LIANXI 随堂练习 (4)以样本编号为横坐标,残差为纵坐标作出的图形称为残差图. (5)我们可以用相关指数 R2来刻画回归的效果,其计算公式是 R2=1- i=1 n (yi-y i) 2 i=1 n (yi-y)2 . (6)R2越大,意味着残差平方和 i=1 n (yi-y i) 2 越小,也就是说,模型拟合的效 果越好. -8- 3.1 回归分析的基本 思想及其初步应用 JICHU ZHISHI 基础知识 首 页 ZHONGDIAN NANDIAN 重点难点 SU
6、ITANG LIANXI 随堂练习 思考 2如何刻画回归模型拟合效果? 提示: 类 别 残差图法 残差平方和法 R2法 特 点 残差点比较均匀地落 在水平的带状区域内, 说明选用的模型比较 适合,这样的带状区域 的宽度越窄,说明模型 拟合精度越高 残差平方和 =1 (yi- ) 2 越小, 模型的拟合效果 越好 R2=1- =1 (- ) 2 =1 (-)2 表示解释变 量对于预报变量变化的贡 献率,R2越接近于 1,表示回 归的效果越好 -9- 3.1 回归分析的基本 思想及其初步应用 JICHU ZHISHI 基础知识 首 页 ZHONGDIAN NANDIAN 重点难点 SUITANG
7、LIANXI 随堂练习 3.建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量. (2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存 在线性关系等). (3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性 回归方程 y=b x+a ). (4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差 呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合 适等. -10- 3.1 回归分析的基本 思想及其初步应用 JICHU ZHISHI 基础知识 首 页
8、 ZHONGDIAN NANDIAN 重点难点 SUITANG LIANXI 随堂练习 思考 3用回归方程求预报值应注意哪些问题? 提示:(1)回归方程只适用于所研究的样本的总体. (2)所建立的回归方程一般都有时间性. (3)样本的取值范围会影响回归方程的适用范围. (4)不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它 是预报变量的可能取值的平均值. -11- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 探究一 求线性回
9、归直线方程 (1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明 确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然 后再进行相关回归分析. (2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出 的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义. -12- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 【典型例题 1】 某商场经营一批进价是 30 元/件的小商品,在市场试验 中发现,
10、此商品的销售单价 x(x 取整数)元与日销售量 y 台之间有如下关系 x 35 40 45 50 y 56 41 28 11 (1)y 与 x 是否具有线性相关关系?如果具有线性相关关系,求出回归直线方 程.(方程的斜率保留一个有效数字) (2)设经营此商品的日销售利润为 P 元,根据(1)写出 P 关于 x 的函数关 系式,并预测当销售单价 x 为多少元时,才能获得最大日销售利润. -13- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四
11、 解:(1)散点图如图所示,从图中可以看出这些 点大致分布在一条直线附近,因此两个变量线性相 关. 设回归直线为y = b x+a ,由题知x=42.5,y=34, 则求得 b = i=1 4 (xi-x)(yi-y) i=1 4 (xi-x)2 =-370 125 -3. a = y b x=34-(-3) 42.5=161.5. y =-3x+161.5. -14- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 (2)依题意有 P=(
12、-3x+161.5)(x-30) =-3x2+251.5x-4 845 =-3 x- 251.5 6 2 + 251.52 12 -4 845. 当 x=251.5 6 42 时,P 有最大值,约为 426. 即预测当销售单价为 42 元时,才能获得最大日销售利润. -15- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 规律总结先根据所给数据画出散点图,判断 y 与 x 是否具 有线性相关关系,在此基础上利用回归方程系数的有关公式,求出
13、相应的系 数,然后结合函数知识求出日销售利润最大时的销售单价. -16- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 探究二 线性回归分析 解答本类题目应先通过散点图来分析两变量间的关系是否线性相关, 然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数 R2 来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分 析. -17- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难
14、点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 【典型例题 2】 在一段时间内,某种商品的价格 x 元和需求量 y 件之 间的一组数据为: x(元) 14 16 18 20 22 y(件) 12 10 7 5 3 且知 x 与 y 具有线性相关关系,求出 y 对 x 的回归直线方程,并说明拟合效 果的好坏. -18- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 解:
15、x = 1 5(14+16+18+20+22)=18,y = 1 5 (12+10+7+5+3)=7.4, i=1 5 xi 2=142+162+182+202+222=1 660, i=1 5 yi 2=122+102+72+52+32=327, i=1 5 xiyi=14 12+16 10+18 7+20 5+22 3=620, b = i=1 5 xiyi-5x y i=1 5 xi 2-5x2 = 620-5187.4 1 660-5182 = -46 40 =-1.15. a =7.4+1.15 18=28.1, 回归直线方程为y =-1.15x+28.1. -19- 3.1 回归分
16、析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 列出残差表为 yi- 0 0.3 -0.4 -0.1 0.2 yi- 4.6 2.6 -0.4 -2.4 -4.4 i=1 5 (yi-y i) 2=0.3, i=1 5 (yi-y)2=53.2,R2=1- i=1 5 (yi-y i) 2 i=1 5 (yi-y)2 0.994. 故 R20.994,说明拟合效果较好. -20- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIA
17、N 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 规律总结“相关指数 R2、残差图”在回归分析中的作用: (1)相关指数 R2是用来刻画回归效果的,由 R2=1- i=1 n (yi-y i) 2 i=1 n (yi-y)2 可知 R2越大, 意味着残差平方和越小,也就是说模型的拟合效果就越好. (2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分 布在水平带状区域中,带状区域越窄,说明模型拟合精度越高, 回归方程预 报精度越高. -21- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN
18、 NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 探究三 求非线性回归方程 非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据 的散点图.把它与必修模块数学 1 中学过的各种函数(幂函数、指数函数、 对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采 用适当的变量置换,把问题化为线性回归分析问题,使之得到解决. -22- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIAN
19、XI 随堂练习 探究一 探究二 探究三 探究四 【典型例题 3】 假设关于某设备的使用年限 x 和支出的维修费用 y(万 元),有如下表的统计资料: 使用年限 x 2 3 4 5 6 维修费用 y 2.2 3.8 5.5 6.5 7.0 若由资料知 y 与 x 具有线性相关关系,试求: (1)线性回归方程y = b x+a . (2)估计使用年限为 10 年时,维修费用是多少? (3)计算总偏差平方和、残差平方和及回归平方和. (4)求 R2并说明模型的拟合效果. -23- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI
20、 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 解:(1)将已知条件制成下表 i 1 2 3 4 5 合计 xi 2 3 4 5 6 20 yi 2.2 3.8 5.5 6.5 7.0 25 xiyi 4.4 11.4 22.0 32.5 42.0 112.3 2 4 9 16 25 36 90 =4;=5; =1 5 2=90; =1 5 xiyi=112.3 设回归方程为y = b x+a ,于是有b = i=1 5 xiyi-5xy i=1 5 xi 2-5x2 = 112.3-545 90-542 =1.23,a = y b x=5-1.23 4=0
21、.08,所以线性回归方程是y =1.23x+0.08. -24- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 (2)当 x=10 时,y =1.23 10+0.08=12.38, 即估计使用 10 年时维修费用是 12.38 万元. (3)总偏差平方和: i=1 5 (yi-y)2=15.78, 残差平方 和:y 1=2.46+0.08=2.54,y 2=3.77,y 3=5,y 4=6.23,y 5=7.46, i=1 5 (yi-y
22、 i) 2=0.651, 回归平方和:15.78-0.651=15.129. (4)R2=1- i=1 5 (yi-y i) 2 i=1 5 (yi-y)2 =1-0.651 15.78 0.958 7, 模型的拟合效果较好,使用年限解释了 95.87%的维修费用支出. -25- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 规律总结把非线性回归问题转化为线性回归问题,拓展了 解题思路. -26- 3.1 回归分析的基本 思想及其初步应用
23、 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 探究四 易错辨析 易错点 残差平方和与相关指数的理解不清致误 【典型例题 4】 对两个变量 y 和 x 进行回归分析,得到一组样本数 据:(x1,y1),(x2,y2),(xn,yn),则下列说法中不正确的是( ) A.由样本数据得到的回归方程 = x+ 必过样本点的中心(,) B.残差平方和越小的模型,拟合的效果越好 C.用相关指数 R2来刻画回归效果,R2的值越小,说明模型的拟合效果越 好 D.若变量 y 和 x 之间的相关系数
24、 r=-0.936 2,则变量 y 和 x 之间具有线 性相关关系 -27- 3.1 回归分析的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究四 错解:B 错因分析:对残差平方和和相关指数 R2理解错误. 正解:R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越 好. 答案:C -28- 3.1 回归分析的基本 思想及其初步应用 SUITANG LIANXI 随堂练习 首 页 JICHU ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点
25、难点 1 2 3 4 1.下表提供了某厂节能降耗技术改造后,在生产 A 产品过程中记录的产量 x(吨)与相应的生产能耗 y(吨)的几组对应数据: x 3 4 5 6 y 2.5 t 4 4.5 根据上表提供的数据,求出 y 关于 x 的线性回归方程为 =0.7x+0.35,那么上 表中 t=( ) A.3 B.3.15 C.3.5 D.4.5 解析:样本中心点是(,),即 4.5, 11+ 4 .因为回归直线过该点,所以 11+ 4 =0.74.5+0.35,解得 t=3. 答案:A -29- 3.1 回归分析的基本 思想及其初步应用 SUITANG LIANXI 随堂练习 首 页 JICHU
26、 ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点难点 1 2 3 4 2.如图所示有5组数据,去掉点 后,剩下的4组数据的线性相关性 更强. 答案:D -30- 3.1 回归分析的基本 思想及其初步应用 SUITANG LIANXI 随堂练习 首 页 JICHU ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点难点 1 2 3 4 3.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元), 调查显示年收入 x 与年饮食支出 y 具有线性相关关系,并由调查数据得到 y 对 x 的回归直线方程: =0.254x+0.321.由回归直线方程可知,
27、家庭年收入每 增加 1 万元,年饮食支出平均增加 万元. 解析:设年收入为 x1万元,对应的年饮食支出为 y1万元, 家庭年收入每增加 1 万元,则年饮食支出平均增加 0.254(1+1)+0.321-0.2541-0.321 1+1-1 =0.254(万元). 答案:0.254 -31- 3.1 回归分析的基本 思想及其初步应用 SUITANG LIANXI 随堂练习 首 页 JICHU ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点难点 1 2 3 4 4.高二(3)班学生每周用于数学学习的时间 x(单位:小时)与数学成绩 y(单位: 分)之间有如下数据: x 24 15
28、 23 19 16 11 20 16 17 13 y 92 79 97 89 64 47 83 68 71 59 若某同学每周用于数学学习的时间为 18 小时,试预测该同学的数学成绩. -32- 3.1 回归分析的基本 思想及其初步应用 SUITANG LIANXI 随堂练习 首 页 JICHU ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点难点 1 2 3 4 解:显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算 器进行计算. i 1 2 3 4 5 6 7 8 9 10 xi 24 15 23 19 16 11 20 16 17 13 yi 92 79 9
29、7 89 64 47 83 68 71 59 xiyi 2 208 1 185 2 231 1 691 1 024 517 1 660 1 088 1 207 767 =1 10 2=3 182, =1 10 2=58 375, =1 10 xiyi=13 578 -33- 3.1 回归分析的基本 思想及其初步应用 SUITANG LIANXI 随堂练习 首 页 JICHU ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点难点 1 2 3 4 设回归方程为 = x+ ,于是可得 = =1 10 -10 =1 2-102 = 545.4 154.4 3.53, = =74.9-3.5317.413.5. 因此可求得回归直线方程为 =3.53x+13.5. 当 x=18 时, =3.5318+13.577.故该同学预计可得 77 分.