1、统计案例统计案例 第一章第一章 1 回归分析回归分析 第一章第一章 第第2课时课时 可线性化的回归分析可线性化的回归分析 课堂典例探究课堂典例探究 2 课课 时时 作作 业业 3 课前自主预习课前自主预习 1 课前自主预习课前自主预习 1.进一步了解回归分析的基本思想,明确建 立回归模型的基本步骤 2了解回归模型与函数模型的区别,体会有 些非线性模型通过变换可以转化为线性回归 模型,了解在解决问题中寻找更好的模型的 方法 1.在实际问题中,当变量之间不是线性相关 关系时,不能用线性回归方程描述它们之间 的相关关系,需要进行非线性回归分析在 具体问题中,我们首先应该作出原始数据(x, y)的_,
2、从_中看出数 据的大致规律,再根据这个规律选择适当的 函数进行拟合 非线性回归问题 散点图 散点图 2可线性化的回归分析:非线性回归问题的 非线性回归方程一般很难求,因此把非线性 回归化为线性回归是解决问题的好方法:把 非线性回归化为_,再利用线性回 归的方法确定参数a及b的估计值 线性回归 在大量的实际问题中,研究的两个变量不一 定呈线性相关关系,它们之间可能呈指数关 系或对数关系在某些情况下可以借助线性 回归模型研究呈非线性关系的两个变量之间 的关系 非线性回归问题 (1)指数函数型 yaebx(a0) 函数 yaebx(a0)的图象,则图 1 处理方法: 两边取对数,得 lnyln(ae
3、bx),即 lnylnabx. 设 ylny xx, 则原方程变成 ylnabx. 具体计算时,先将原数据点(xi,yi)转化成(xi,lnyi),i 1,2,n,再根据一次线性回归模型的方法得出 lna 和 b. (2)对数函数型 yablnx 函数 yablnx 的图象,见图 2. 处理方法: 设 xlnx yy, 原方程就转化成 yabx, 然后按一次线性回归模型求出 a,b 的值 (3)二次函数型 ybx2a 处理方法:令 xx2, yy, 原方程就转化成 ybxa, 然后按一次线性回归模型求出 a、b 的值 非线性回归问题的解题方法是:(1)若问题中 已经给出公式,则可通过变换,将变
4、量的非 线性关系转化为线性关系,将问题转化为线 性回归问题来解决;(2)若问题中没有给出公 式,需要我们画出已知数据的散点图,通过 与各种函数(如指数函数、对数函数、幂函数 等)的图像作比较,选择一种与这些散点拟合 的最好的函数,然后采用适当的变量变换, 将问题转化为线性回归分析问题 1.幂函数曲线yxb,当b1时的图像为( ) 答案 A 解析 当b1时,图像为选项A;当0b1 时,图像为选项B;当b0,排除A、C,又 xR,排除D 3某地今年上半年患某种传染病的人数y(人) 与月份x(月)之间满足函数关系,模型为y aebx,确定这个函数解析式 _. 答案 ye3.911580.09x 月份
5、x/ 月 1 2 3 4 5 6 人数y/ 人 52 61 68 74 78 83 解析 设 ulny,clna,得 ucbx, 则 u 与 x 的数据关系如下表: x 1 2 3 4 5 6 ulny 3.95 4.11 4.22 4.304 4.356 7 4.418 8 由上表,得 i1 6 xi21, i1 6 ui25.359 5, i1 6 x2 i91, i1 6 u2 i107.334, i1 6 xiui90.3413, x3.5,u4.226 58, b i1 6 xiui6x u i1 6 x2 i6x 2 90.341 363.54.226 58 9163.52 0.0
6、9, cubx4.226 580.093.53.911 58, u3.911 580.09x. ye3.911 58 0.09x. 课堂典例探究课堂典例探究 我国19501959年人口数据资料 为: 给定函数模型,求回归方程 年份 1950 1951 1952 1953 1954 t 0 1 2 3 4 人口y/ 万 55 196 56 300 57 482 58 796 60 266 年份 1955 1956 1957 1958 1959 t 5 6 7 8 9 人口y/ 万 61 456 62 828 64 563 65 994 67 207 若y与t之间满足yaebt关系,求函数解析式,
7、 若按此增长趋势,估计大约在哪一年我国人 口达到14亿? 分析 函数模型为指数函数,可转化为线性 相关关系,从而求出 解析 设lny,clna,则cbt. t 0 1 2 3 4 10.918 6 10.938 4 10.959 2 10.981 8 11.006 5 t 5 6 7 8 9 11.026 1 11.048 2 11.075 4 11.097 3 11.115 5 i1 10 ti45, i1 10 i110.167 0, i1 10 t2 i285, i1 10 tii497.593 6,t4.5,11.016 7, b i1 10 tii10t i1 10 t2 i10t
8、2 497.593 6104.511.016 7 285104.52 0.022 3, cbt11.016 70.022 34.510.916 4, 所以 10.916 40.022 3t,ye10.916 4 0.022 3t. 令 y140 000,则 10.916 40.022 3tln140 00011.849 4, 所以 t41.838 5,即大约在 1950 年后的第 42 年(即 1992 年)我国人口达到 14 亿 方法规律总结 已知曲线类型进行回归分析的步骤: (1)将非线性函数通过变量代换转化为线性函数 (2)将所给数据点加以转换 (3)按最小二乘法原理求线性回归方程并进行
9、检验 (4)将线性回归方程转换为关于原始变量 x、y 的回归方程 (5)依据回归方程作出预报 在试验中得到变量 y 与 x 的数据如下表: x 0.066 7 0.038 8 0.033 3 0.027 3 0.022 5 y 39.4 42.9 41.0 43.1 49.2 由经验知,y 与1 x之间具有线性相关关系,试求 y 与 x 之间 的回归曲线方程,当 x00.038 时,预测 y0的值 答案 (1)y 34.320.29 x (2)y041.95 解析 令 z1 x,则 yabz,由已知数据制成下表: z1 x 14.992 5 25.773 2 30.030 0 36.630 0
10、 44.444 4 y 39.4 42.9 41.0 43.1 49.2 计算得z30.374 0,y43.12, i1 5 ziyi6 693.027 2, i1 5 z2 i 5 107.903 7. 5z y6 548.634 4,5z 24 612 .899 4. 于 是 有b i1 5 ziyi5z y i1 5 z2 i5z 2 6 693.027 26 548.634 4 5 107.903 74 612.899 4 0.29. aybz34.32. y 与 x 之间的回归曲线方程是 y34.320.29 x . 当 x00.038 时,y041.95,即 y0的值约为 41.9
11、5. 某种书每册的成本费y(元)与印刷 册数x(千册)有关,经统计得到数据如下: 函数模型的选取 x 1 2 3 5 10 20 30 50 100 200 y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15 检验每册书的成本费 y 与印刷册数的倒数1 x之间是否具有 线性相关关系,如有,求出 y 对 x 的回归方程 解析 设 u1 x,则 y 与 u 的数据关系如下表: u 1 0.5 0.33 0.2 0.1 0.05 0.033 0.02 0.01 0.005 y 10.15 5.52 4.08 2.85 2.11 1.62 1.41
12、 1.30 1.21 1.15 由此可得: i1 10 u2 i1.412 989, i1 10 y2 i171.803, i1 10 uiyi15.208 78,u0.224 8,y3.14, 则线性相关系数 r i1 10 uiyi10u y i1 10 u2 i10u 2 i1 10 y2 i10y 2 15.208 78100.224 83.14 1.412 989100.224 82 171.803103.142 0.999 8. 这表明 u 与 y 之间有较强的线性相关关系,从而求 y 与 u 的线性回归方程是有意义的 b i1 10 uiyi10u y i1 10 u2 i10u
13、 2 8.98, aybu3.148.980.224 81.12, y1.128.98u. x 与 y 之间的回归方程为 y1.128.98 x . 方法规律总结 实际问题中非线性相关的函数模型的选 取 1采集数据、画出散点图; 2根据散点图中点的分布状态选取所有可能的函数类型; 3作变量代换,将函数转化为线性函数; 4作出线性相关的散点图,或计算线性相关系数 r,通过 比较选定函数模型; 5求回归直线方程,并检查; 6作出预报 为了研究某种细菌繁殖的个数随时间 x 变化的情况,收集 数据如下: 天数 x/天 1 2 3 4 5 6 繁殖个数 y/个 6 12 25 49 95 190 (1)
14、用天数作为解释变量,繁殖个数作为预报变量,作出这 些数据的散点图; (2)描述解释变量与预报变量之间的关系 答案 (1)散点图略 (2)y e0.69x1.112 解析 (1)作出散点图如图所示 (2)由散点图看出样本点分布在指数型函数 yc1ec2x 的曲 线的周围,于是令 ulny,则 x 1 2 3 4 5 6 u 1.79 2.48 3.22 3.89 4.55 5.25 由计算器算得 u0.69x1.112,则有y e0.69x1.112. 在一次抽样调查中测得样本的5个 样本点,数值如下表: x 0.25 0.5 1 2 4 y 16 12 5 2 1 求出 y 与 x 之间的回归
15、方程 错解 由已知条件制成下表: i xi yi xiyi x2 i y2 i 1 0.25 16 4 0.062 5 256 2 0.5 12 6 0.25 144 3 1 5 5 1 25 4 2 2 4 4 4 5 4 1 4 16 1 7.75 36 23 21.312 5 430 所以x1.55,y7.2, 所以 b i1 5 xiyi5x y i1 5 x2 i5x 2 3.53. ayb x12.67. 所求的 y 与 x 之间的回归方程是 y3.53x12.67. 辨析 上述解答过程没有作出散点图(或求 相关系数r)进行判断,就直接求回归直线方 程导致错误 正解 根据散点图(如
16、图 1)可知 y 与 x 呈现出近似的反比 例函数关系,设 yk x,令 t 1 x,则 ykt,原数据变为: 图 1 图 2 t 4 2 1 0.5 0.25 y 16 12 5 2 1 由散点图(如图 2)也可以看出, 这些点基本上分布在一条直 线附近,可以认为 y 与 t 具有线性相关关系,列表如下: i ti yi tiyi t2 i y2 i 1 4 16 64 16 256 2 2 12 24 4 144 3 1 5 5 1 25 4 0.5 2 1 0.25 4 5 0.25 1 0.25 0.062 5 1 7.75 36 94.25 21.312 5 430 所以t1.55,y7.2. 所以 b i1 5 tiyi5t y i1 5 t2 i5t 2 4.134 4. ayb t0.791 7, 所以 y4.134 4t0.791 7. 所以 y 与 x 的回归方程是 y4.134 4 x 0.791 7.
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。