1、第一章 统计案例 1.1 回归分析的基本思想及 其初步应用 【自主预习自主预习】 1.1.回归分析回归分析 (1)(1)概念:回归分析是对具有相关关系的两个变量进行概念:回归分析是对具有相关关系的两个变量进行 统计分析的一种常用方法统计分析的一种常用方法. . (2)(2)步骤:画步骤:画_求求_用回归方程进行用回归方程进行 _._. 散点图散点图 回归方程回归方程 预报预报 2.2.线性回归模型线性回归模型 (1)(1)在线性回归方程在线性回归方程 = + x= + x中,中, =_=_ =_=_, =_=_,其中,其中 =_=_, =_=_, ( ( , ) )称为变量称为变量_,回归,回
2、归 直线过样本点的中心直线过样本点的中心. . abyb n ii i 1 n 2 i i 1 (xx) yy (xx) () a ybx x n i i 1 1 x n y n i i 1 1 y n xy n ii i 1 n 2 2 i i 1 x ynxy xnx 样本点的中心样本点的中心 (2)(2)线性回归模型线性回归模型y=bx+a+ey=bx+a+e,其中,其中e e称为称为_, 自变量自变量x x称为称为_变量,因变量变量,因变量y y称为称为_变量变量. . 随机误差随机误差 解释解释 预报预报 3.3.刻画回归效果的方式刻画回归效果的方式 残差残差 把随机误差的估计值把随
3、机误差的估计值 称为相应于点称为相应于点(x(xi i,y yi i) ) 的残差的残差 残差残差 图图 作图时纵坐标为作图时纵坐标为_,横坐标可以选为,横坐标可以选为_ _,或,或_,或,或_等,这等,这 样作出的图形称为残差图样作出的图形称为残差图 ie 残差残差 样本样本 编号编号 身高数据身高数据 体重估计值体重估计值 残差残差 图法图法 残差点比较均匀地落在水平的带状区域中,残差点比较均匀地落在水平的带状区域中, 说明选用的模型比较合适,这样的带状区域说明选用的模型比较合适,这样的带状区域 的宽度的宽度_,说明模型拟合精度越高,说明模型拟合精度越高 残差残差 平方平方 和和 残差平方
4、和为残差平方和为_,残差平方和,残差平方和 _,模型拟合效果越好,模型拟合效果越好 n 2 ii i 1 (y -y ) 越窄越窄 越小越小 相关相关 指数指数 R R2 2 R R2 2=1=1- -_,R R2 2表示表示_变量对变量对_ 变量变化的贡献率,变量变化的贡献率,R R2 2越接近于越接近于1 1,表示回归,表示回归 的效果越好的效果越好 n 2 ii i 1 n 2 i i 1 (y -y ) (y -y) 解释解释 预报预报 【即时小测即时小测】 1.1.对于两个变量对于两个变量x x,y y,若当,若当x x取一定值时,取一定值时,y y的取值的取值 具有一定的随机性,具
5、有一定的随机性,x x,y y之间的这种非确定性关系之间的这种非确定性关系 叫做叫做( ( ) ) A.A.函数关系函数关系 B.B.线性相关线性相关 C.C.相关关系相关关系 D.D.回归分析回归分析 【解析解析】选选C.C.根据相关关系的定义知选根据相关关系的定义知选C.C. 2.2.散点图在回归分析过程中的作用是散点图在回归分析过程中的作用是( ( ) ) A.A.统计个体个数统计个体个数 B.B.比较个体数据的大小比较个体数据的大小 C.C.研究个体分类研究个体分类 D.D.粗略判断变量是否线性相关粗略判断变量是否线性相关 【解析解析】选选D.D.根据散点图的意义及作用知选根据散点图的
6、意义及作用知选D.D. 3.3.在建立两个变量在建立两个变量y y与与x x的回归模型中,分别选择了的回归模型中,分别选择了4 4个个 不同的模型,它们的相关指数不同的模型,它们的相关指数R R2 2如下,其中拟合效果如下,其中拟合效果 最好的模型是最好的模型是( ( ) ) A.A.模型模型1 1的相关指数的相关指数R R2 2=0.98=0.98 B.B.模型模型2 2的相关指数的相关指数R R2 2=0.80=0.80 C.C.模型模型3 3的相关指数的相关指数R R2 2=0.50=0.50 D.D.模型模型4 4的相关指数的相关指数R R2 2=0.25=0.25 【解析解析】选选A
7、.A.因为回归模型的相关指数因为回归模型的相关指数R R2 2的值越大,的值越大, 拟合效果越好拟合效果越好. . 4.4.已知回归方程已知回归方程 =2x+1=2x+1,而试验得到一组数据是,而试验得到一组数据是(2(2, 4.9)4.9),(3(3,7.1)7.1),(4(4,9.1)9.1),则残差平方和等于,则残差平方和等于 _._. 【解析解析】(4.9(4.9- -5)5)2 2+(7.1+(7.1- -7)7)2 2+(9.1+(9.1- -9)9)2 2=0.03.=0.03. 答案:答案:0.030.03 y 【知识探究知识探究】 探究点探究点1 1 线性回归分析线性回归分析
8、 1.1.相关关系是确定性关系吗?相关关系是确定性关系吗? 提示:提示:相关关系是一种不确定性的关系相关关系是一种不确定性的关系. . 2.2.具有线性相关关系的两个变量,其散点图具有什么具有线性相关关系的两个变量,其散点图具有什么 特征?特征? 提示:提示:散点图中的点大部分分布在一个带形区域内散点图中的点大部分分布在一个带形区域内. .即即 分布在某条直线的附近分布在某条直线的附近. . 【归纳总结归纳总结】 对回归分析的三点说明对回归分析的三点说明 (1)(1)回归分析的前提是两个变量之间具有相关关系回归分析的前提是两个变量之间具有相关关系. . (2)(2)对两个变量之间数量变化进行一
9、般关系的测定,确对两个变量之间数量变化进行一般关系的测定,确 定一个相应的数学表达式,即线性回归方程,达到由定一个相应的数学表达式,即线性回归方程,达到由 一个已知量推测或控制另一个变量的值的目标,是统一个已知量推测或控制另一个变量的值的目标,是统 计的一个重要方法计的一个重要方法. . (3)(3)线性回归方程是根据样本数据得到的一个确定性的线性回归方程是根据样本数据得到的一个确定性的 函数关系,是用来对未知变量进行预测的,为了预测函数关系,是用来对未知变量进行预测的,为了预测 的效果更好,减小误差,应在求线性回归方程时尽量的效果更好,减小误差,应在求线性回归方程时尽量 多地选取样本,选择代
10、表性较强的样本,使得预测值多地选取样本,选择代表性较强的样本,使得预测值 尽量地接近真实值尽量地接近真实值. . 特别提醒:在对两个变量进行线性回归分析时,要首特别提醒:在对两个变量进行线性回归分析时,要首 先结合观察数据画出散点图,确定它们之间具有线性先结合观察数据画出散点图,确定它们之间具有线性 相关关系后,再进行线性回归分析相关关系后,再进行线性回归分析. . 探究点探究点2 2 非线性回归分析非线性回归分析 1.1.如何评价回归模型拟合效果的优劣?如何评价回归模型拟合效果的优劣? 提示:提示:计算相关指数计算相关指数R R2 2的值的值.R.R2 2越接近于越接近于1 1效果就越好效果
11、就越好. . 2.2.对于非线性回归模型,如何处理?对于非线性回归模型,如何处理? 提示:提示:对于非线性回归模型可转化为线性回归模型来对于非线性回归模型可转化为线性回归模型来 研究研究. . 【归纳总结归纳总结】 1.1.数据拟合效果的比较数据拟合效果的比较 对于给定的样本点对于给定的样本点(x(x1 1,y y1 1) ),(x(x2 2,y y2 2) ),(x(xn n,y yn n) ), 两个含有未知参数的模型两个含有未知参数的模型 (1) (1) 和和 (2) (2) 其中其中a a和和b b都是未知参数,可以都是未知参数,可以 按如下的步骤来比较它们的拟合效果:按如下的步骤来比
12、较它们的拟合效果: 2 1 yf x,ae, E e0,D e 2 2 yg x,b, E0,D, 分别建立对应于两个模型的回归方程分别建立对应于两个模型的回归方程 =f(x=f(x, ) ) 与与 =g(x=g(x, ) ),其中,其中 和和 分别是参数分别是参数a a和和b b的估计值的估计值. . 分别计算模型分别计算模型(1)(1)和模型和模型(2)(2)的的R R1 12 2,R R2 22 2. . 若若R R1 12 2R R2 22 2,则模型,则模型(1)(1)的拟合效果比模型的拟合效果比模型(2)(2)好;若好;若 R R1 12 2R R2 22 2,则模型,则模型(1)
13、(1)的拟合效果不如模型的拟合效果不如模型(2).(2). (1) ya (2) ybab 2.2.常见的几种变形形式常见的几种变形形式 (1)(1)幂函数曲线幂函数曲线y=axy=axb b. . 两边取对数变形为两边取对数变形为lny=lna+blnxlny=lna+blnx,令,令y=lny. y=lny. x=lnxx=lnx,a=lnaa=lna,从而得到,从而得到y=a+bx.y=a+bx. (2)(2)指数函数曲线指数函数曲线y=aey=aeb x b x. . 两边取对数变形为两边取对数变形为lny=lna+bxlny=lna+bx,令,令y=lnyy=lny,a=lnaa=l
14、na, 从而得到从而得到y=a+bx.y=a+bx. (3)(3)负指数函数曲线负指数函数曲线y= y= 两边取对数变形为两边取对数变形为lny=lna+ lny=lna+ ,令,令y=lnyy=lny, x= x= ,a=lnaa=lna,得,得y=a+bx.y=a+bx. (4)(4)对数函数曲线对数函数曲线y=a+blnx.y=a+blnx. 令令x=lnxx=lnx,得,得y=a+bx.y=a+bx. b x ae . b x 1 x 类型一类型一 线性回归模型线性回归模型 【典例典例】1.(20161.(2016东营高二检测东营高二检测) )有下列说法:线有下列说法:线 性回归分析就
15、是由样本点去寻找一条直线方程,刻画性回归分析就是由样本点去寻找一条直线方程,刻画 这些样本点之间的关系的数学方法;利用样本点的这些样本点之间的关系的数学方法;利用样本点的 散点图可以直观判断两个变量的关系是否可以用线性散点图可以直观判断两个变量的关系是否可以用线性 相关表示;通过线性回归方程相关表示;通过线性回归方程 及其回归系及其回归系 数数 ,可以估计和预报变量的取值和变化趋势;因,可以估计和预报变量的取值和变化趋势;因 为由任何一组观测值都可以求得一个线性回归方程,为由任何一组观测值都可以求得一个线性回归方程, 所以没有必要进行相关性检验所以没有必要进行相关性检验. .其中正确说法的个数
16、其中正确说法的个数 是是( ( ) ) A.1A.1 B.2B.2 C.3C.3 D.4D.4 ybxa b 2.(20142.(2014湖北高考湖北高考) )根据如下样本数据根据如下样本数据 得到的回归方程为得到的回归方程为 ,则,则( ( ) ) x x 3 3 4 4 5 5 6 6 7 7 8 8 y y 4.04.0 2.52.5 - -0.50.5 0.50.5 - -2.02.0 - -3.03.0 ybxa A.a0,b0 B.a0,b0 C.a0,b0 D.a0,b0 3.3.某种产品的广告费支出某种产品的广告费支出x(x(单位:百万元单位:百万元) )与销售额与销售额 y(
17、y(单位:百万元单位:百万元) )之间有如下对应数据:之间有如下对应数据: (1)(1)画出散点图画出散点图. . (2)(2)求求y y关于关于x x的回归方程的回归方程. . x x 2 2 4 4 5 5 6 6 8 8 y y 3030 4040 6060 5050 7070 【解题探究解题探究】1.1.典例典例1 1中,给定两个变量的一组样本点中,给定两个变量的一组样本点 数据,都能进行线性回归分析吗?数据,都能进行线性回归分析吗? 提示:提示:不是,只有当它们具有线性相关关系时,才能不是,只有当它们具有线性相关关系时,才能 进行线性回归分析,否则没有意义进行线性回归分析,否则没有意
18、义. . 2.2.典例典例2 2中,回归直线方程中,中,回归直线方程中, , 的几何意义是什的几何意义是什 么?么? 提示:提示: 是回归直线的斜率是回归直线的斜率. . 是回归直线在是回归直线在y y轴上的轴上的 截距截距. . ba ba 3.3.典例典例3 3中,画散点图的目的是什么?如何求关于中,画散点图的目的是什么?如何求关于x x的的 回归直线方程?回归直线方程? 提示:提示:画散点图的目的是分析变量画散点图的目的是分析变量x x,y y之间是否存在之间是否存在 线性相关关系;利用最小二乘法求线性相关关系;利用最小二乘法求y y关于关于x x的回归直线的回归直线 方程方程. . 【
19、解析解析】1.1.选选C.C.反映的是最小二乘法思想,是正确反映的是最小二乘法思想,是正确 的;反映的是散点图的作用,是正确的;反映的的;反映的是散点图的作用,是正确的;反映的 是求线性回归方程是求线性回归方程 的目的,也是正确的;的目的,也是正确的; 不正确,在求回归方程之前,必须进行相关性检验,不正确,在求回归方程之前,必须进行相关性检验, 以体现变量的相关关系以体现变量的相关关系. .故有故有3 3个正确说法个正确说法. . ybxa 2.2.选选A.A.由散点图及由散点图及 , 的意义知的意义知A A正确正确. . 3.(1)3.(1)散点图如图所示散点图如图所示. . ba (2)(
20、2)列出下表,并用科学计算器进行有关计算列出下表,并用科学计算器进行有关计算. . i i 1 1 2 2 3 3 4 4 5 5 x xi i( (百万元百万元) ) 2 2 4 4 5 5 6 6 8 8 y yi i( (百万元百万元) ) 3030 4040 6060 5050 7070 x xi iy yi i 6060 160160 300300 300300 560560 55 2 iii i 1i 1 x5 y50;x145;x y1 380 ; 于是可得于是可得 =50=50- -6.56.55=17.5.5=17.5. 于是所求的回归方程是于是所求的回归方程是 =6.5x+
21、17.5=6.5x+17.5 5 ii i 1 52 2 2 1 i 1 x y5xy 1 380 5 5 50 b 6.5, 145 5 5 x5x aybx y 【方法技巧方法技巧】 1.1.求线性回归方程的三个步骤求线性回归方程的三个步骤 (1)(1)算:根据数据计算算:根据数据计算 (2)(2)代:代入公式求代:代入公式求 , 的具体数值的具体数值. . (3)(3)求:由上面的计算结果求方程求:由上面的计算结果求方程 nn 2 iii i 1i 1 x,y,x ,x y . ba ybxa. 2.2.求线性回归方程的关键点求线性回归方程的关键点 相关性的验证:求线性回归方程前必须判断
22、两个变量相关性的验证:求线性回归方程前必须判断两个变量 是否线性相关,如果两个变量本身不具备相关关系,是否线性相关,如果两个变量本身不具备相关关系, 或者它们之间的相关关系不显著,那么即使求出回归或者它们之间的相关关系不显著,那么即使求出回归 方程也是毫无意义的方程也是毫无意义的. . 特别提醒:回归直线一定过样本点的中心特别提醒:回归直线一定过样本点的中心( ( , ) ), 这在很多问题的求解中起着很重要的作用这在很多问题的求解中起着很重要的作用. . y x 【变式训练变式训练】已知一个回归直线方程已知一个回归直线方程 =1.5x+45=1.5x+45, x xi i11,5 5,7 7
23、,1313,1919,则,则 =(=( ) ) A.53.5A.53.5 B.55.5B.55.5 C.58.5C.58.5 D.60.5D.60.5 y y 【解析解析】选选C.C.因为回归直线过样本点的中心因为回归直线过样本点的中心( )( ), 又又 所以所以 =1.5 +45=1.5=1.5 +45=1.59+45=58.5.9+45=58.5. x,y 1 5 7 13 19 x9. 5 y x 类型二类型二 线性回归分析线性回归分析 【典例典例】为研究质量为研究质量x(x(单位:克单位:克) )对弹簧长度对弹簧长度y(y(单位:单位: 厘米厘米) )的影响,对不同质量的的影响,对不
24、同质量的6 6个物体进行测量,数据个物体进行测量,数据 如表所示:如表所示: x x 5 5 1010 1515 2020 2525 3030 y y 7.257.25 8.128.12 8.958.95 9.909.90 10.910.9 11.811.8 (1)(1)作出散点图,并求线性回归方程作出散点图,并求线性回归方程. . (2)(2)求出求出R R2 2. . (3)(3)进行残差分析进行残差分析. . 【解题探究解题探究】本例中如何进行残差分析?本例中如何进行残差分析? 提示:提示:通过残差表或残差图进行残差分析通过残差表或残差图进行残差分析. . 【解析解析】(1)(1)散点图
25、如图所示散点图如图所示. . 因为因为 (5+10+15+20+25+30)=17.5(5+10+15+20+25+30)=17.5, (7.25+8.12+8.95+9.90+10.9+11.8)(7.25+8.12+8.95+9.90+10.9+11.8) 9.4879.487, =2275=2275, =1076.2.=1076.2. 计算得计算得 0.1830.183, 6.2856.285, 所以所求线性回归方程为所以所求线性回归方程为 =6.285+0.183x.=6.285+0.183x. 1 x 6 1 y 6 6 2 i i 1 x 6 ii i 1 x y ba y (2)
26、(2)列表如下:列表如下: 0.050.05 0.0050.005 - -0.080.08 - -0.0450.045 0.040.04 0.0250.025 - -2.242.24 - -1.371.37 - -0.540.54 0.410.41 1.411.41 2.312.31 ii yy i yy 所以所以 所以所以 所以回归模型的拟合效果较好所以回归模型的拟合效果较好. . 6 2 ii i 1 (yy )0.013 18, 6 2 i i 1 (yy)14.678 4. 2 0.013 18 R10.999 1, 14.678 4 (3)(3)由残差表中的数值可以看出第由残差表中的
27、数值可以看出第3 3个样本点的残差比个样本点的残差比 较大,需要确认在采集这个数据的时候是否有人为的较大,需要确认在采集这个数据的时候是否有人为的 错误,如果有的话,需要纠正数据,重新建立回归模错误,如果有的话,需要纠正数据,重新建立回归模 型;由表中数据可以看出残差点比较均匀地落在不超型;由表中数据可以看出残差点比较均匀地落在不超 过过0.150.15的狭窄的水平带状区域中,说明选用的线性回的狭窄的水平带状区域中,说明选用的线性回 归模型的精度较高,由以上分析可知,弹簧长度与质归模型的精度较高,由以上分析可知,弹簧长度与质 量成线性关系量成线性关系. . 【延伸探究延伸探究】1.1.在条件不
28、变的情况下,画出残差图在条件不变的情况下,画出残差图. . 【解析解析】如图所示:如图所示: 2.2.当当x=35x=35时,估计时,估计y y的值的值. . 【解析解析】当当x=35x=35时,时, =6.285+0.183=6.285+0.18335=12.69.35=12.69. y 【方法技巧方法技巧】残差分析的思路残差分析的思路 (1)(1)要根据散点图来粗略判断它们是否线性相关,是否要根据散点图来粗略判断它们是否线性相关,是否 可以用线性回归模型来拟合数据可以用线性回归模型来拟合数据. . (2)(2)通过残差通过残差 来判断模型拟合的效果,判断来判断模型拟合的效果,判断 原始数据
29、中是否存在可疑数据,这种分析工作称为残原始数据中是否存在可疑数据,这种分析工作称为残 差分析,可以借助残差图来进行观察差分析,可以借助残差图来进行观察. . 12ne ,e ,e, 【补偿训练补偿训练】对变量对变量x x,y y进行回归分析时,依据得到进行回归分析时,依据得到 的的4 4个不同的回归模型画出残差图,则下列模型拟合精个不同的回归模型画出残差图,则下列模型拟合精 度最高的是度最高的是( ( ) ) 【解析解析】选选A.A.用残差图判断模型的拟合效果,残差点用残差图判断模型的拟合效果,残差点 比较均匀地落在水平带状区域中,说明这样的模型比比较均匀地落在水平带状区域中,说明这样的模型比
30、 较合适较合适. .带状区域的宽度越窄,拟合精度越高带状区域的宽度越窄,拟合精度越高. .故选故选A.A. 类型三类型三 非线性回归分析非线性回归分析 【典例典例】电容器充电后,电压达到电容器充电后,电压达到100V100V,然后开始放,然后开始放 电,由经验知道,此后电压电,由经验知道,此后电压U U随时间随时间t t变化的规律用公变化的规律用公 式式U=AeU=Aebt bt(b0) (b0)表示,现测得时间表示,现测得时间t(s)t(s)时的电压时的电压U(V)U(V)如如 下表:下表: t/st/s 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 101
31、0 U/VU/V 100100 7575 5555 4040 3030 2020 1515 1010 1010 5 5 5 5 试求电压试求电压U U对时间对时间t t的回归方程的回归方程.(.(提示:对公式两边取提示:对公式两边取 自然对数,把问题转化为线性回归分析问题自然对数,把问题转化为线性回归分析问题) ) 【解题探究解题探究】本例中如何对等式“本例中如何对等式“U=AeU=Aebt bt” ”变形,使变形,使 其符合线性回归分析?其符合线性回归分析? 提示:提示:对对U=AeU=Aebt bt两边取对数得 两边取对数得lnU=lnA+btlnU=lnA+bt,令,令y=lnUy=ln
32、U, a=lnAa=lnA,x=tx=t,则,则y=a+bxy=a+bx,进而借助线性回归分析求解,进而借助线性回归分析求解, 最后回代便可最后回代便可. . 【解析解析】对对U=AeU=Aebt bt两边取对数得 两边取对数得lnU=lnA+btlnU=lnA+bt,令,令y=lnUy=lnU, a=lnAa=lnA,x=tx=t,则,则y=a+bxy=a+bx,得,得y y与与x x的数据如下表:的数据如下表: x x 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 1010 y y 4.64.6 4.34.3 4.04.0 3.73.7 3.43.4 3.
33、03.0 2.72.7 2.32.3 2.32.3 1.61.6 1.61.6 根据表中数据作出散点图,如图所示,根据表中数据作出散点图,如图所示, 从图中可以看出,从图中可以看出,y y与与x x具有较强的线性相关关系,由具有较强的线性相关关系,由 表中数据求得表中数据求得 =5=5, 3.0453.045,进而可以求得,进而可以求得 - -0.3130.313, =4.61=4.61,所以,所以y y对对x x的线性回归方程为的线性回归方程为 y=4.61y=4.61- -0.313x.0.313x. 由由y=lnUy=lnU,得,得U=eU=ey y,U=eU=e4.61 4.61- -
34、0.313x0.313x,因此电压 ,因此电压U U对时间对时间t t 的回归方程为的回归方程为U=eU=e4.61 4.61- -0.313t0.313t. . x yb a y bx 【方法技巧方法技巧】求非线性回归方程的步骤求非线性回归方程的步骤 (1)(1)确定变量,作出散点图确定变量,作出散点图. . (2)(2)根据散点图,选择恰当的拟合函数根据散点图,选择恰当的拟合函数. . (3)(3)变量置换,通过变量置换把非线性回归问题转化为变量置换,通过变量置换把非线性回归问题转化为 线性回归问题,并求出线性回归方程线性回归问题,并求出线性回归方程. . (4)(4)分析拟合效果:通过计
35、算相关指数或画残差图来判分析拟合效果:通过计算相关指数或画残差图来判 断拟合效果断拟合效果. . (5)(5)根据相应的变换,写出非线性回归方程根据相应的变换,写出非线性回归方程. . 【变式训练变式训练】若将函数若将函数y=axy=axb b转化为线性函数转化为线性函数u=c+bvu=c+bv, 则所作的变换是则所作的变换是( ( ) ) A.u=lnyA.u=lny,v=lnav=lna,c=lnxc=lnx B.u=lnxB.u=lnx,v=lnyv=lny,c=lnac=lna C.u=lnaC.u=lna,v=lnxv=lnx,c=lnyc=lny D.u=lnyD.u=lny,v=
36、lnxv=lnx,c=lnac=lna 【解析解析】选选D.D.对对y=axy=axb b两边取对数,得两边取对数,得lny=lna+blnx.lny=lna+blnx. 令令u=lnyu=lny,v=lnxv=lnx,c=lnac=lna,得,得u=c+bv.u=c+bv. 【补偿训练补偿训练】(2016(2016南京高二检测南京高二检测)A)A地六年来轻工业地六年来轻工业 产品利润总额产品利润总额y y与年次与年次x x的试验数据如表所示:的试验数据如表所示: 年次年次x x 1 1 2 2 3 3 4 4 5 5 6 6 利润总额利润总额 y y 11.3511.35 11.8511.8
37、5 12.4412.44 13.0713.07 13.5913.59 14.4114.41 由经验知,年次由经验知,年次x x与利润总额与利润总额y(y(单位:亿元单位:亿元) )有近似如有近似如 下的关系:下的关系:y=aby=abx xe e0 0,其中,其中a a,b b为正数,求为正数,求y y关于关于x x的回的回 归方程归方程. . 【解析解析】对对y=aby=abx xe e0 0两边取自然对数得两边取自然对数得lny=lnaelny=lnae0 0+xlnb+xlnb, 令令z=lnyz=lny,则,则z z与与x x的数据如表:的数据如表: 由由z=lnaez=lnae0 0
38、+xlnb+xlnb及最小二乘法公式得:及最小二乘法公式得: lnb0.0477lnb0.0477,lnaelnae0 02.3782.378, 即即 =2.378+0.0477x=2.378+0.0477x,故,故 =10.8=10.81.051.05x x. . yz x x 1 1 2 2 3 3 4 4 5 5 6 6 z z 2.432.43 2.472.47 2.522.52 2.572.57 2.612.61 2.672.67 自我纠错自我纠错 求回归方程求回归方程 【典例典例】在一化学反应过程中,某化学物质的反应速在一化学反应过程中,某化学物质的反应速 度度y(g/min)y(
39、g/min)与一种催化剂的量与一种催化剂的量x(g)x(g)有关,现收集了如有关,现收集了如 表所示的表所示的8 8组数据,试建立组数据,试建立y y与与x x的回归方程的回归方程. . 催化剂量催化剂量x(g)x(g) 1515 1818 2121 2424 2727 3030 3333 3636 化学物质反应化学物质反应 速度速度y(g/min)y(g/min) 6 6 8 8 3030 2727 7070 205205 6565 350350 【失误案例失误案例】 分析解题过程,找出错误之处,并写出正确答案分析解题过程,找出错误之处,并写出正确答案. . 提示:提示:错误的根本原因是解题
40、前没有审好题,原题求错误的根本原因是解题前没有审好题,原题求 的是回归方程,并不是回归直线方程,因此应首先进的是回归方程,并不是回归直线方程,因此应首先进 行相关性检验,然后再求回归方程,不能盲目地求回行相关性检验,然后再求回归方程,不能盲目地求回 归直线方程,正确解答过程如下归直线方程,正确解答过程如下. . 【解析解析】根据收集的数据作散点图,如图所示根据收集的数据作散点图,如图所示. . 根据样本点的分布情况,可选用指数型函数模型根据样本点的分布情况,可选用指数型函数模型y=y= (c(c1 1,c c2 2为待定的参数为待定的参数) ),令,令z=lnyz=lny,则,则z=cz=c2
41、 2x+lncx+lnc1 1,即,即 变换后样本点应该分布在直线变换后样本点应该分布在直线z=bx+a(a=lncz=bx+a(a=lnc1 1,b=cb=c2 2) ) 的周围,由的周围,由y y与与x x的数据表得的数据表得z z与与x x的数据表如下:的数据表如下: x x 1515 1818 2121 2424 2727 3030 3333 3636 z z 1.7921.792 2.0792.079 3.4013.401 3.2963.296 4.2484.248 5.3235.323 4.1744.174 5.8585.858 2 c x 1 c e 作出作出z z与与x x的散
42、点图,如图所示,由图可以看出变换后的散点图,如图所示,由图可以看出变换后 的样本点分布在一条直线附近,所以可用线性回归方的样本点分布在一条直线附近,所以可用线性回归方 程来拟合程来拟合. . 由表中数据可得由表中数据可得 0.18120.1812, - -0.84850.8485,故,故 =0.1812x=0.1812x- -0.84850.8485,所以,所以 =e=e0.1812x 0.1812x- -0.84850.8485,因此该 ,因此该 化学物质的反应速度与催化剂的量的非线性回归方化学物质的反应速度与催化剂的量的非线性回归方 程为程为 =e=e0.1812x 0.1812x- -0.84850.8485. . b a zy y