1、第一章 统计案例 1.1 回归分析的基本思想及其初步应用 【阅读教材阅读教材】 根据下面的知识结构图阅读教材根据下面的知识结构图阅读教材, ,进一步掌握线性回归分析方法进一步掌握线性回归分析方法, , 了解判断线性回归模型的拟合效果的方法了解判断线性回归模型的拟合效果的方法, ,初步认识解决非线性回归初步认识解决非线性回归 问题的方法问题的方法. . 【知识链接知识链接】 1.1.回归分析回归分析 回归分析是对具有不确定性关系的两个变量进行统计分析的一种方法回归分析是对具有不确定性关系的两个变量进行统计分析的一种方法. . 2.2.线性回归分析步骤线性回归分析步骤 基本步骤为画散点图基本步骤为
2、画散点图, ,求线性回归方程求线性回归方程, ,用线性回归方程进行预报用线性回归方程进行预报. . 主题一主题一: :回归分析的相关概念回归分析的相关概念 【自主认知自主认知】 1.1.一台机器由于使用时间较长一台机器由于使用时间较长, ,生产的零件有一些会有缺陷生产的零件有一些会有缺陷. .按不同转按不同转 速生产出有缺陷的零件的统计数据如下速生产出有缺陷的零件的统计数据如下: : 转速转速x(x(转转/ /秒秒) ) 1616 1414 1212 8 8 每小时生产有缺陷的零件数每小时生产有缺陷的零件数y(y(件件) ) 1111 9 9 8 8 5 5 在平面直角坐标系中作出散点图在平面
3、直角坐标系中作出散点图. . 提示提示: :散点图如图散点图如图 2.2.从散点图中判断从散点图中判断x x和和y y之间是否具有相关关系之间是否具有相关关系. . 提示提示: :点分布在一条直线附近点分布在一条直线附近, ,所以有相关关系所以有相关关系. . 3.3.若转速为若转速为1010转转/ /秒秒, ,能否预测机器每小时生产有缺陷的零件件数能否预测机器每小时生产有缺陷的零件件数? ? 提示提示: :可以可以. .根据散点图作出一条直线根据散点图作出一条直线, ,求出直线方程后可预测求出直线方程后可预测. . 根据以上探究根据以上探究, ,完成以下填空完成以下填空. . 1.1.相关关
4、系与函数关系相关关系与函数关系 相关关系是一种非确定性关系相关关系是一种非确定性关系,_,_是对具有相关关系的两个是对具有相关关系的两个 变量进行统计分析的一种常用方法变量进行统计分析的一种常用方法, ,函数关系是一种函数关系是一种_关系关系. . 回归分析回归分析 确定性确定性 2.2.在线性回归模型在线性回归模型y=bx+a+ey=bx+a+e中,最小二乘估计中,最小二乘估计 和和 就是未知参数就是未知参数a a 和和b b的最好估计,其计算公式如下:的最好估计,其计算公式如下: 其中,其中, 另外,另外,_称为样本点的中心,回归称为样本点的中心,回归 直线一定过样本点中心直线一定过样本点
5、中心. . b_,a_, n ii i 1 n 2 i i 1 (xx)(yy) (xx) ybx nn ii i 1i 1 11 xx ,yy , nn (x,y) ba 【合作探究合作探究】 1.1.线性回归模型是函数关系吗?线性回归模型是函数关系吗? 提示:提示:y=bx+a+ey=bx+a+e与函数关系不同,在回归模型中,与函数关系不同,在回归模型中,y y的值由的值由x x和随机和随机 误差误差e e共同确定,即共同确定,即x x只能解释部分只能解释部分y y的变化的变化. .因此有时我们把因此有时我们把x x称为解称为解 释变量,把释变量,把y y称为预报变量称为预报变量. . 2
6、.2.回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为 什么?什么? 提示:提示:不一定是真实值,利用线性回归方程求的值,在很多时候是个不一定是真实值,利用线性回归方程求的值,在很多时候是个 预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受 身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等. . 3.3.回归模型回归模型y=bx+a+ey=bx+a+e中中e e是什么是什么, ,它有怎样的作用
7、它有怎样的作用? ? 提示提示: :e e是随机误差是随机误差. .它的主要作用是提供选择模型的准则以及在模型它的主要作用是提供选择模型的准则以及在模型 合理的情况下探求最佳估计值合理的情况下探求最佳估计值a,ba,b的工具的工具. . 【过关小练过关小练】 1.1.下列有关回归直线方程下列有关回归直线方程 = x+ = x+ 的叙述:的叙述: 反映反映 与与x x之间的函数关系;反映之间的函数关系;反映y y与与x x之间的函数关系;之间的函数关系; 表示表示 与与x x之间的不确定关系;表示最接近之间的不确定关系;表示最接近y y与与x x之间真实关系的之间真实关系的 一条直线一条直线.
8、. 其中正确的是其中正确的是( )( ) A.A. B.B. C.C. D.D. y ba y y 【解析解析】选选D. = x+ D. = x+ 表示表示 与与x x之间的函数关系,而不是之间的函数关系,而不是y y与与x x之之 间的函数关系,但它反映的关系最接近间的函数关系,但它反映的关系最接近y y与与x x之间的真实关系之间的真实关系. .故选故选D.D. y ba y 2.2.设变量设变量y y对对x x的线性回归方程为的线性回归方程为 =2=2- -2.5x,2.5x,则变量则变量x x每增加一个单位每增加一个单位 时时,y,y平均平均 ( ( ) ) A.A.增加增加2.52.
9、5个单位个单位 B.B.增加增加2 2个单位个单位 C.C.减少减少2.52.5个单位个单位 D.D.减少减少2 2个单位个单位 【解析解析】选选C.C.回归直线的斜率回归直线的斜率 = =- -2.5,2.5,表示表示x x每增加一个单位每增加一个单位,y,y平均平均 减少减少2.52.5个单位个单位. . y b 主题二主题二: :线性回归分析线性回归分析 【自主认知自主认知】 1.1.在进行回归分析时由样本数据一般为什么先作出散点图在进行回归分析时由样本数据一般为什么先作出散点图? ? 提示提示: :作散点图的意义在于能直观明了地观察两变量间到底存在怎样作散点图的意义在于能直观明了地观察
10、两变量间到底存在怎样 的关系的关系, ,从而确定回归模型从而确定回归模型. . 2.2.得到线性回归模型后为何要进行残差分析得到线性回归模型后为何要进行残差分析, ,其作用是什么其作用是什么? ? 提示提示: :得到线性回归模型后进行残差分析得到线性回归模型后进行残差分析, ,可以判断原始数据中是否存可以判断原始数据中是否存 在可疑数据在可疑数据, ,并检验模型的拟合效果并检验模型的拟合效果, ,以便更准确地进行预报以便更准确地进行预报. . 根据以上探究根据以上探究, ,完成以下填空完成以下填空. . 刻画回归效果的形式刻画回归效果的形式 (1)(1)残差分析残差分析: : 残差图残差图:
11、:作图时纵坐标为作图时纵坐标为_,_,横坐标可以选为横坐标可以选为_,_,或或 _,_,或或_等等, ,这样作出的图形称为残差图这样作出的图形称为残差图. . 残差分析残差分析: :残差点比较残差点比较_地落在水平的带状区域中地落在水平的带状区域中, ,说明选用说明选用 的模型比较合适的模型比较合适, ,这样的带状区域的宽度这样的带状区域的宽度_,_,说明模型拟合精度说明模型拟合精度 越高越高, ,回归方程的预报精度越高回归方程的预报精度越高. . 残差残差 样本编号样本编号 身高数据身高数据 体重估计值体重估计值 均匀均匀 越窄越窄 (2)(2)残差平方和残差平方和: : 公式公式 残差平方
12、和为残差平方和为 (y(yi i- - i i) )2 2. . 刻画方式刻画方式 残差平方和残差平方和_,_,模型拟合效果越好模型拟合效果越好. . y n i 1 越小越小 (3)(3)相关指数相关指数R R2 2: : 公式公式 R R2 2=1=1- - _ 意义意义 R R2 2表示表示_变量对于变量对于_变量变化的贡献率变量变化的贡献率. . 刻画方式刻画方式 R R2 2越越_于于1,1,表示回归的效果越好表示回归的效果越好. . n 2 ii i 1 n 2 i i 1 (yy ) (yy) 解释解释 预报预报 接近接近 【合作探究合作探究】 1.1.要确定回归方程要确定回归方
13、程, ,需确定的量是什么需确定的量是什么? ? 提示提示: :要确定回归方程要确定回归方程, ,关键是确定关键是确定 和和 的值的值. . 2.2.相关指数相关指数R R2 2的作用是什么的作用是什么? ? 提示提示: :利用相关指数利用相关指数R R2 2可以刻画数据拟合效果的好坏可以刻画数据拟合效果的好坏. .在线性回归模型在线性回归模型 中中,R,R2 2的值越接近的值越接近1,1,说明残差平方和越小说明残差平方和越小, ,即说明模型的拟合效果越好即说明模型的拟合效果越好. . ba 【拓展延伸拓展延伸】非线性回归分析非线性回归分析 (1)(1)非线性相关关系非线性相关关系: :样本点分
14、布在某一条曲线的周围样本点分布在某一条曲线的周围, ,而不是一条直而不是一条直 线附近线附近, ,我们就称这两个变量之间不具有线性相关关系而是非线性相我们就称这两个变量之间不具有线性相关关系而是非线性相 关关系关关系. . (2)(2)非线性回归方程线性化非线性回归方程线性化 y=axy=axn n( (其中其中a,x,ya,x,y均为正值均为正值)()(幂函数型函数幂函数型函数) ) lgy=lga+nlgx,lgy=lga+nlgx,令令u=lgy,v=lgx,b=lga,u=lgy,v=lgx,b=lga, 则则u=nv+b,u=nv+b,图象为一直线图象为一直线. . y=cay=ca
15、x x(a0,c0)(a0,c0)(指数型函数指数型函数) ) lgy=xlga+lgc,lgy=xlga+lgc,令令u=lgy,b=lgc,d=lga,u=lgy,b=lgc,d=lga, 则则u=dx+b,u=dx+b,图象为一直线图象为一直线. . 【过关小练过关小练】 1.1.有下列数据有下列数据: : x x 1 1 2 2 3 3 y y 3 3 5.995.99 12.0112.01 下列四个函数中下列四个函数中, ,模拟效果最好的为模拟效果最好的为 ( ( ) ) A.y=3A.y=32 2x x- -1 1 B.y=logB.y=log2 2x C.y=3xx C.y=3x
16、 D.y=xD.y=x2 2 【解析解析】选选A.A.当当x=1,2,3x=1,2,3时时, ,分别代入求分别代入求y y值值, ,离离y y最近的值模拟效果最最近的值模拟效果最 好好, ,知知A A模拟效果最好模拟效果最好. . 2.2.已知方程已知方程 =0.85x=0.85x- -85.785.7是根据女大学生的身高预报体重的回归是根据女大学生的身高预报体重的回归 方程方程, ,其中其中x, x, 的单位分别是的单位分别是cm,kg,cm,kg,则该方程在样本则该方程在样本(165,57)(165,57)处的残处的残 差是差是 . . 【解析解析】当当x=165x=165时时, =0.8
17、5, =0.85165165- -85.7=54.55,85.7=54.55,所以方程在样本所以方程在样本 (165,57)(165,57)处的残差是处的残差是5757- -54.55=2.45.54.55=2.45. 答案答案: :2.452.45 y y y 【拓展延伸拓展延伸】 1.1.对非线性回归分析的认识对非线性回归分析的认识 在大量的实际问题中在大量的实际问题中, ,研究的两个变量不一定都呈线性相关关系研究的两个变量不一定都呈线性相关关系, ,它们它们 之间可能呈指数关系或对数关系或二次函数关系等非线性关系之间可能呈指数关系或对数关系或二次函数关系等非线性关系, ,可以可以 通过变
18、换通过变换( (选择恰当的函数选择恰当的函数) )化为线性关系得到回归直线方程化为线性关系得到回归直线方程, ,再通过再通过 相应变换得到非线性回归方程相应变换得到非线性回归方程. . 2.2.判断残差图异常的两个依据判断残差图异常的两个依据 (1)(1)个别数据对应残差过大个别数据对应残差过大. . (2)(2)残差呈现不随机的规律性残差呈现不随机的规律性. . 【归纳总结归纳总结】 对线性回归分析的四点说明对线性回归分析的四点说明 (1)(1)由线性回归方程给出的是一个预报值而非精确值由线性回归方程给出的是一个预报值而非精确值. . (2)(2)随机误差的主要来源随机误差的主要来源 线性回
19、归模型与真实情况引起的误差线性回归模型与真实情况引起的误差; ; 省略了一些因素的影响产生的误差省略了一些因素的影响产生的误差; ; 观测与计算产生的误差观测与计算产生的误差. . (3)(3)残差分析是回归分析的一种方法残差分析是回归分析的一种方法. . (4)(4)用相关指数用相关指数R R2 2来刻画回归效果来刻画回归效果.R.R2 2越大越大, ,意味着残差平方和越小意味着残差平方和越小, ,即即 模型的拟合效果越好模型的拟合效果越好;R;R2 2越小越小, ,残差平方和越大残差平方和越大, ,即模型的拟合效果越即模型的拟合效果越 差差. . 类型一类型一: :回归分析的概念回归分析的
20、概念 【典例典例1 1】(1)(1)有下列说法有下列说法: :线性回归分析就是由样本点去寻找一条线性回归分析就是由样本点去寻找一条 直线直线, ,使之贴近这些样本点的数学方法使之贴近这些样本点的数学方法; ;利用样本点的散点图可以利用样本点的散点图可以 直观判断两个变量的关系是否可以用线性关系表示直观判断两个变量的关系是否可以用线性关系表示; ;通过回归方程通过回归方程 = x+ ,= x+ ,可以估计和观测变量的取值和变化趋势可以估计和观测变量的取值和变化趋势; ;因为由任何一因为由任何一 组观测值都可以求得一个回归直线方程组观测值都可以求得一个回归直线方程, ,所以没有必要进行相关性分所以
21、没有必要进行相关性分 析析. .其中正确命题的个数是其中正确命题的个数是 ( ( ) ) A.1A.1 B.2B.2 C.3C.3 D.4D.4 y ba (2)(2)某产品的广告费用某产品的广告费用x x与销售额与销售额y y的统计数据如下表的统计数据如下表 广告费用广告费用x(x(万元万元) ) 4 4 2 2 3 3 5 5 销售额销售额y(y(万元万元) ) 4949 2626 3939 5454 根据上表可得回归方程根据上表可得回归方程 = x+ = x+ 中的中的 为为9.4,9.4,据此模型预报广告费据此模型预报广告费 用为用为6 6万元时销售额为万元时销售额为 ( ( ) )
22、A.63.6A.63.6万元万元 B.65.5B.65.5万元万元 C.67.7C.67.7万元万元 D.72.0D.72.0万元万元 y bab 【解题指南解题指南】(1)(1)根据相关概念及其性质逐一判断得出结论根据相关概念及其性质逐一判断得出结论. . (2)(2)利用回归直线方程过定点利用回归直线方程过定点( )( )求解求解. . x y, 【解析解析】(1)(1)选选C.C.反映的正是最小二乘法思想反映的正是最小二乘法思想, ,故正确故正确. .反映的反映的 是画散点图的作用是画散点图的作用, ,也正确也正确. .解释的是回归方程解释的是回归方程 = x+ = x+ 的作用的作用,
23、 , 故也正确故也正确. .是不正确的是不正确的, ,在求线性回归方程之前必须进行相关性分在求线性回归方程之前必须进行相关性分 析析, ,以体现两变量的关系以体现两变量的关系. . (2)(2)选选B.B.易求得易求得 =3.5, =42,=3.5, =42,则将则将(3.5,42)(3.5,42)代入代入 = x+ = x+ 中得中得: : 42=9.442=9.43.5+ ,3.5+ ,即即 =9.1,=9.1,则则 =9.4x+9.1,=9.4x+9.1,所以当广告费用为所以当广告费用为6 6万元万元 时销售额为时销售额为9.49.46+9.1=65.5(6+9.1=65.5(万元万元)
24、.). y ba x y y ba aa y 【规律总结规律总结】回归分析的四个关注点回归分析的四个关注点 (1)(1)收集数据收集数据: :随机抽取样本随机抽取样本, ,确定数据确定数据, ,形成样本点形成样本点. . (2)(2)画散点图画散点图: :由样本点形成散点图由样本点形成散点图, ,判断是否具有线性相关关系判断是否具有线性相关关系. . (3)(3)求回归直线方程求回归直线方程: :若线性相关若线性相关, ,由最小二乘法确定回归直线方程由最小二乘法确定回归直线方程. . (4)(4)看趋势看趋势: :由回归方程观察变量的取值及变化趋势由回归方程观察变量的取值及变化趋势. . 【巩
25、固训练巩固训练】关于变量关于变量y y与与x x之间的回归直线方程叙述正确的之间的回归直线方程叙述正确的 是是 ( ( ) ) A.A.表示表示y y与与x x之间的一种确定性关系之间的一种确定性关系 B.B.表示表示y y与与x x之间的相关关系之间的相关关系 C.C.表示表示y y与与x x之间的最真实的关系之间的最真实的关系 D.D.表示表示y y与与x x之间真实关系的一种效果最好的拟合之间真实关系的一种效果最好的拟合 【解析解析】选选D.D.回归直线方程能最大可能地反映回归直线方程能最大可能地反映y y与与x x之间的真实关系之间的真实关系, , 故选项故选项D D正确正确. . 【
26、补偿训练补偿训练】下列说法正确的有下列说法正确的有 ( ( ) ) 回归方程适用于一切样本和总体回归方程适用于一切样本和总体; ; 回归方程一般都有时间性回归方程一般都有时间性; ; 样本取值的范围会影响回归方程的适用范围样本取值的范围会影响回归方程的适用范围; ; 回归方程得到的预报值是预报变量的精确值回归方程得到的预报值是预报变量的精确值. . A.A. B.B. C.C. D.D. 【解析解析】选选C.C.回归方程只适用于我们研究的样本和总体回归方程只适用于我们研究的样本和总体. .我们所我们所 建立的回归方程一般都有时间性建立的回归方程一般都有时间性. .样本取值的范围会影响回归方程样
27、本取值的范围会影响回归方程 的适用范围的适用范围. .回归方程得到的预报值是预报变量可能取值的平均值回归方程得到的预报值是预报变量可能取值的平均值, , 并非精确值并非精确值, ,故正确故正确. . 类型二类型二: :线性回归分析线性回归分析 【典例典例2 2】已知某商品的价格已知某商品的价格x(x(元元) )与需求量与需求量y(y(件件) )之间的关系有如下之间的关系有如下 一组数据一组数据: : x x 1414 1616 1818 2020 2222 y y 1212 1010 7 7 5 5 3 3 ( (1 1) )画出画出y y关于关于x x的散点图的散点图. . ( (2 2)
28、)求出回归直线方程求出回归直线方程. . 【解题指南解题指南】正确利用求线性回归方程的步骤解答正确利用求线性回归方程的步骤解答. . 55 22 ii i 1i 1 555 22 iiiii i 1i 1i 1 x18,y7.4,x1 660,y327, x y620,(yy )0.3,(yy)53.2). (参考数据: 【解析解析】(1)(1)画散点图画散点图: : 5 2 i i 1 55 2 iii i 1i 1 5 ii i 1 5 2 2 i i 1 2 x18,y7.4,x1 660, y327,x y620, x y5xy 1.15. x5x ayx28.1, 1.15x28.1
29、. 所以b b 所以回归直线方程为y 【延伸探究延伸探究】 1.(1.(改变问法改变问法) )若本题条件不变若本题条件不变, ,计算计算R R2 2的值的值, ,并说明回归模型拟合程度并说明回归模型拟合程度 的好坏的好坏. . 【解析解析】 回归模型拟合效果很好回归模型拟合效果很好. . 5 2 ii i 1 (yy )0.3, 5 2 i i 1 5 2 ii 2 i 1 5 2 i i 1 (yy)53.2, (yy ) R10.994. (yy) 2.(2.(改变问法改变问法) )在本题条件不变的情况下在本题条件不变的情况下, ,画出残差图画出残差图. . 【解析解析】 【规律总结规律总
30、结】建立回归模型的一般步骤建立回归模型的一般步骤 【拓展延伸拓展延伸】残差图的分析方法残差图的分析方法 (1)(1)残差图的纵坐标为残差残差图的纵坐标为残差, ,横坐标通常可以是样本编号、解释变量或横坐标通常可以是样本编号、解释变量或 预报变量等预报变量等, ,残差图是一种散点图残差图是一种散点图. . (2)(2)残差散点图中的残差点比较均匀地落在水平的带状区域中残差散点图中的残差点比较均匀地落在水平的带状区域中, ,并且沿并且沿 水平方向散点的分布规律相同水平方向散点的分布规律相同, ,说明残差是随机的说明残差是随机的, ,所选择的回归模型所选择的回归模型 建模是合理的建模是合理的, ,这
31、样的带状区域的宽度越窄这样的带状区域的宽度越窄, ,说明模型拟合精度越高说明模型拟合精度越高, , 回归方程的预报精度越高回归方程的预报精度越高.(.(关键词关键词: :残差点比较均匀地落在水平带状残差点比较均匀地落在水平带状 区域中区域中) ) 【补偿训练补偿训练】甲、乙、丙、丁甲、乙、丙、丁4 4位同学各自对位同学各自对A,BA,B两变量做回归分析两变量做回归分析, , 分别得到散点图与残差平方和分别得到散点图与残差平方和 如下表如下表: : n 2 ii i 1 (yy ) , 甲甲 乙乙 丙丙 丁丁 散点图散点图 残差平方和残差平方和 115115 106106 124124 1031
32、03 哪位同学的试验结果体现拟合哪位同学的试验结果体现拟合A,BA,B两变量关系的模型拟合精度两变量关系的模型拟合精度 高高? ? ( ( ) ) A.A.甲甲 B.B.乙乙 C.C.丙丙 D.D.丁丁 【解析解析】选选D.D.从散点图上来看从散点图上来看, ,丁同学的散点图中的点更加近似在一丁同学的散点图中的点更加近似在一 条直线附近条直线附近; ;从残差平方和来看从残差平方和来看, ,丁同学的最小丁同学的最小, ,说明拟合精度最高说明拟合精度最高. . 类型三类型三: :非线性回归分析非线性回归分析 【典例典例3 3】在一次抽样调查中测得样本的在一次抽样调查中测得样本的5 5个样本点个样本
33、点, ,数据如下表数据如下表: : x x 0.250.25 0.50.5 1 1 2 2 4 4 y y 1616 1212 5 5 2 2 1 1 求求y y与与x x之间的回归方程之间的回归方程. . 【解题指南解题指南】先画散点图先画散点图, ,再选择合适的回归方程求解再选择合适的回归方程求解. .本题样本点不本题样本点不 是线性相关的是线性相关的, ,因而可通过代换转化为线性相关的两个变量来求解因而可通过代换转化为线性相关的两个变量来求解. . 【解析解析】画出散点图画出散点图, ,如图所示如图所示, , 观察可知观察可知y y与与x x近似是反比例函数关系近似是反比例函数关系. .
34、设设y= (k0),y= (k0),令令t= ,t= ,则则y=kt.y=kt. 可得到可得到y y关于关于t t的数据如下表的数据如下表: : t t 4 4 2 2 1 1 0.50.5 0.250.25 y y 1616 1212 5 5 2 2 1 1 k x 1 x 画出散点图如图所示画出散点图如图所示, ,观察可知观察可知t t和和y y有较强的线性相关性有较强的线性相关性, ,因此可利用因此可利用 线性回归模型进行拟合线性回归模型进行拟合, , 列表如下列表如下: : i i t ti i y yi i t ti iy yi i 1 1 4 4 1616 6464 1616 25
35、6256 2 2 2 2 1212 2424 4 4 144144 3 3 1 1 5 5 5 5 1 1 2525 4 4 0.50.5 2 2 1 1 0.250.25 4 4 5 5 0.250.25 1 1 0.250.25 0.06250.0625 1 1 7.757.75 3636 94.2594.25 21.312521.3125 430430 2 i t 2 i y 所以所以 =4.134 4t+0.791 7=4.134 4t+0.791 7, 所以所以y y与与x x之间的回归方程是之间的回归方程是 5 ii i 1 5 2 2 i i 1 t y5t y t1.55 y7
36、.24.134 4ybt0.791 7 t5t 所以, b, a, y 4.134 4 y0.791 7. x 【规律总结规律总结】非线性回归方程的求法非线性回归方程的求法 ( (1 1) )作散点图作散点图: :根据原始数据根据原始数据(x,y)(x,y)作出散点图作出散点图. . ( (2 2) )选择函数模型选择函数模型: :根据散点图选择恰当的拟合函数根据散点图选择恰当的拟合函数. . ( (3 3) )变换变换: :作恰当的变换作恰当的变换, ,将其转化成线性函数将其转化成线性函数, ,求线性回归方程求线性回归方程. . ( (4 4) )还原还原: :在在( (3 3) )的基础上
37、通过相应变换的基础上通过相应变换, ,即可得非线性回归方程即可得非线性回归方程. . 【拓展延伸拓展延伸】常见的非线性回归模型转化为线性回归模型的方法常见的非线性回归模型转化为线性回归模型的方法 曲线方程曲线方程 曲线图形曲线图形 变换变换 公式公式 变换后的变换后的 线性函数线性函数 y=axy=axb b c=lnac=lna v=lnxv=lnx u=lnyu=lny u=c+bvu=c+bv 曲线方程曲线方程 曲线图形曲线图形 变换变换 公式公式 变换后的变换后的 线性函数线性函数 y=aey=aebx bx c=lnac=lna u=lnyu=lny u=c+bxu=c+bx c=l
38、nac=lna v=v= u=lny u=lny u=c+bvu=c+bv 1 x b x yae 【巩固训练巩固训练】(2015(2015全国卷全国卷)某公司为确定下一年度投入某种产品某公司为确定下一年度投入某种产品 的宣传费的宣传费, ,需了解年宣传费需了解年宣传费x(x(单位单位: :千元千元) )对年销售量对年销售量y(y(单位单位:t):t)和年和年 利润利润z(z(单位单位: :千元千元) )的影响的影响, ,对近对近8 8年的年宣传费年的年宣传费x xi i和年销售量和年销售量y yi i(i=1,(i=1, 2,2,8),8)数据作了初步处理数据作了初步处理, ,得到下面的散点
39、图及一些统计量的值得到下面的散点图及一些统计量的值. . 46.646.6 563563 6.86.8 289.8289.8 1.61.6 1 4691 469 108.8108.8 x y w 8 2 i i 1 (xx) 8 2 i i 1 (ww) 8 ii i 1 (xx)(yy) 8 ii i 1 (ww)(yy) 8 iii i 1 1 wx ,ww . 8 (1)(1)根据散点图判断根据散点图判断,y=a+bx,y=a+bx与与y=c+d y=c+d 哪一个适宜作为年销售量哪一个适宜作为年销售量y y关关 于年宣传费于年宣传费x x的回归方程类型的回归方程类型?(?(给出判断即可
40、给出判断即可, ,不必说明理由不必说明理由) ) (2)(2)根据根据(1)(1)的判断结果及表中数据的判断结果及表中数据, ,建立建立y y关于关于x x的回归方程的回归方程. . x (3)(3)已知这种产品的年利润已知这种产品的年利润z z与与x,yx,y的关系为的关系为z=0.2yz=0.2y- -x.x.根据根据(2)(2)的结果的结果 回答下列问题回答下列问题: : 年宣传费年宣传费x=49x=49时时, ,年销售量及年利润的预报值是多少年销售量及年利润的预报值是多少? ? 年宣传费年宣传费x x为何值时为何值时, ,年利润的预报值最大年利润的预报值最大? ? 附附: :对于一组数
41、据对于一组数据(u(u1 1,v,v1 1),(u),(u2 2,v,v2 2),),(u,(un n,v,vn n),),其回归直线其回归直线v=v= + + u u 的斜率和截距的最小二乘估计分别为的斜率和截距的最小二乘估计分别为: : n ii i 1 n 2 i i 1 (uu)(vv) ,vu. (uu) 【解题指南解题指南】(1)(1)将相应的点代入到将相应的点代入到y=a+bxy=a+bx与与y=c+d y=c+d 中进行验中进行验 证证.(2).(2)令令w= ,w= ,先建立先建立y y关于关于w w的线性回归方程的线性回归方程, ,再确定再确定y y关于关于x x的回归的回
42、归 方程方程.(3).(3)将将x=49x=49代入到代入到(2)(2)中中y y关于关于x x的回归方程求解的回归方程求解. . x x 【解析解析】(1 1)由散点图可以判断,)由散点图可以判断,y=c+d y=c+d 适宜作为年销售量适宜作为年销售量y y关关 于年宣传费于年宣传费x x的回归方程类型的回归方程类型. . (2 2)令)令w= w= ,先建立,先建立y y关于关于w w的线性回归方程的线性回归方程. . 所以所以y y关于关于w w的线性回归方程为的线性回归方程为 =100.6+68w=100.6+68w,因此,因此y y关于关于x x的回归的回归 方程为方程为 =100
43、.6+68 .=100.6+68 . x x 8 ii i 1 8 2 i i 1 (ww)(yy) 108.8 68, 1.6 (ww) cyw563 68 6.8100.6 由于d d, y y x (3 3)由()由(2 2)知,当)知,当x=49x=49时,年销售量时,年销售量y y的预报值的预报值 =100.6+68 =576.6=100.6+68 =576.6, 年利润年利润z z的预报值的预报值 =576.6=576.60.20.2- -49=66.32.49=66.32. 根据(根据(2 2)的结果知,年利润)的结果知,年利润z z的预报值的预报值 =0.2(100.6+68
44、)=0.2(100.6+68 )- -x=x=- -x+13.6 +20.12.x+13.6 +20.12. 所以当所以当 =6.8=6.8,即,即x=46.24x=46.24时,时, 取得最大值取得最大值. . 故年宣传费为故年宣传费为46.2446.24千元时,年利润的预报值最大千元时,年利润的预报值最大. . y 49 z z xx 13.6 x 2 z 【补偿训练补偿训练】某学校开展研究性学习活动某学校开展研究性学习活动, ,某同学获得一组实验数据某同学获得一组实验数据 如下表如下表: : x x 1.991.99 3 3 4 4 5.15.1 6.126.12 y y 1.51.5
45、4.044.04 7.57.5 1212 18.0118.01 对于表中数据对于表中数据, ,现给出下列拟合曲线现给出下列拟合曲线, ,其中拟合程度最好的是其中拟合程度最好的是( ( ) ) A A. .y=y=2 2x x- -2 2 B B. .y=(y=( ) )x x C C. .y=logy=log2 2x x D D. .y=y= (x(x2 2- -1 1) ) 1 2 1 2 【解析解析】选选D D. .可以代入检验可以代入检验, ,当当x x取相应的值时取相应的值时, ,所求所求y y与已知与已知y y相差平相差平 方和最小的便是拟合程度最高的方和最小的便是拟合程度最高的. .