1、数学数学 第三章第三章 统计案例统计案例 3.13.1 回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用 数学数学 目标导航目标导航 课标要求课标要求 1.1.通过对典型案例的探究通过对典型案例的探究, ,了解回归分析的基本思想、方法了解回归分析的基本思想、方法 及其初步应用及其初步应用. . 2.2.会求回归直线方程会求回归直线方程, ,并用回归直线方程进行预报并用回归直线方程进行预报. . 3.3.了解最小二乘法的思想方法了解最小二乘法的思想方法, ,理解回归方程与一般函数的理解回归方程与一般函数的 区别与联系区别与联系. . 素养达成素养达成 通过本节的学习通过本节的学习,
2、,培养数据分析、数学运算和数学建模的核培养数据分析、数学运算和数学建模的核 心素养心素养. . 数学数学 新知导学新知导学 素养养成素养养成 课堂探究课堂探究 素养提升素养提升 数学数学 1.1.线性回归模型线性回归模型 新知导学新知导学素养养成素养养成 (2)(2)对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据(x(x1 1,y,y1 1),(x),(x2 2,y,y2 2),),(x,(xn n,y,yn n),),回归直线的斜率和回归直线的斜率和 截距的最小二乘估计分别为截距的最小二乘估计分别为b= = 1 2 1 ()() () n ii i n i i xx yy xx
3、 = = 1 2 2 1 n ii i n i i x ynx y xnx , ,a= =y- -bx, ,其中其中 称为样本点的中心称为样本点的中心. . 相关相关 (1)(1)回归分析是对具有回归分析是对具有 关系的两个变量进行统计分析的一关系的两个变量进行统计分析的一 种常用方法种常用方法. . ( (x, ,y) ) 数学数学 ( (3 3) )线性回归模型线性回归模型y=bx+a+e,y=bx+a+e,其中其中a a和和b b是模型的未知参数是模型的未知参数,e,e称为称为 ,x,x称为称为 ,y,y称为称为 . . 随机误差随机误差 解释变量解释变量 预报变量预报变量 思考思考 1
4、:1:线性回归方程线性回归方程y= =bx+x+a中中b的意义是什么的意义是什么? ?其中不随其中不随x x 的变化而变化的的变化而变化的 量是哪个量是哪个? ? 答案答案: :线性回归方程线性回归方程y= =a+ +bx x 中的中的b表示表示 x x 增加增加 1 1 个单位时个单位时, ,y的平均变化量的平均变化量 为为b, ,而而a表示表示y不随不随 x x 的变化而变化的量的变化而变化的量. . 数学数学 思考思考 2:2:对有线性相关关系的两个变量建立的回归直线方程对有线性相关关系的两个变量建立的回归直线方程y= =a+ +bx x 中中, ,回归回归 系数系数b能否为能否为 0?
5、0? 答案答案: :b=0=0 时时, ,两个变量不具有线性相关关系两个变量不具有线性相关关系, ,故故b0.0. 2.2.线性回归分析线性回归分析 (1)(1)残差的概念残差的概念 对于样本点对于样本点(x(x1 1,y,y1 1),(x),(x2 2,y,y2 2),),(x,(xn n,y,yn n) )而言而言, ,它们的随机误差为它们的随机误差为 e ei i= = , , i=1,2,i=1,2,n,n,其估计值为其估计值为 ie=y=yi i- - i y= = ,i=1,2,i=1,2,n,n,ie称为称为 相应于点相应于点(x(xi i,y,yi i) )的残差的残差. .
6、y yi i- -bxbxi i- -a a y yi i- -bx xi i- -a 数学数学 纵坐标纵坐标 (2)(2)残差图残差图 作图时作图时 为残差为残差, , 可以选为样本编号可以选为样本编号, ,或身高数或身高数 据据, ,或体重的估计值等或体重的估计值等, ,这样作出的图形称为残差图这样作出的图形称为残差图. .在残差图中在残差图中, ,残差点残差点 地落在水平的带状区域中地落在水平的带状区域中, ,说明选用的模型比较合适说明选用的模型比较合适, ,这样这样 的带状区域的宽度的带状区域的宽度 , ,说明模型拟合精度越高说明模型拟合精度越高, ,回归方程的预报回归方程的预报 精度
7、越高精度越高. . 横坐标横坐标 比较均匀比较均匀 越窄越窄 (3)(3)残差平方和残差平方和 残差平方和残差平方和 2 i 1 () n i i yy , ,残差平方和残差平方和 , ,模型拟合效果越好模型拟合效果越好. . 越小越小 数学数学 思考思考3:3:在画两个变量的散点图时在画两个变量的散点图时, ,预报变量在预报变量在x x轴上轴上, ,解释变量在解释变量在y y轴上吗轴上吗? ? 答案答案: :错误错误, ,由于预报变量的值可以类比为函数的函数值由于预报变量的值可以类比为函数的函数值, ,解释变量的值解释变量的值 可以类比为函数的自变量的取值可以类比为函数的自变量的取值, ,故
8、预报变量在故预报变量在y y轴上轴上, ,解释变量在解释变量在x x轴上轴上. . 3.3.建立回归模型的基本步骤建立回归模型的基本步骤 (1)(1)确定研究对象确定研究对象, ,明确哪个变量是明确哪个变量是 , ,哪个变哪个变 量是量是 . . 解释变量解释变量 预报变量预报变量 (2)(2)画出解释变量和预报变量的画出解释变量和预报变量的 , ,观察它们之间的关系观察它们之间的关系( (如如 是否存在线性关系等是否存在线性关系等).). 散点图散点图 数学数学 (3)(3)由经验确定回归方程的类型由经验确定回归方程的类型( (如观察到数据呈线性关系如观察到数据呈线性关系, ,则选用线性回归
9、则选用线性回归 方程方程y= =bx+x+a).). 残差图残差图 (4)(4)按一定规则按一定规则( (如最小二乘法如最小二乘法) )估计回归方程中的参数估计回归方程中的参数. . (5)(5)得出结果后分析得出结果后分析 是否有异常是否有异常( (如个别数据对应残差如个别数据对应残差 , , 残差呈现残差呈现 等等),),若存在异常若存在异常, ,则检查数据是否则检查数据是否 有误有误, ,或模型是否合适等或模型是否合适等. . 过大过大 不随机的规律性不随机的规律性 思考思考4:4:为什么在线性回归分析前必须先进行相关性检验为什么在线性回归分析前必须先进行相关性检验? ? 答案答案: :
10、因为具有相关关系是进行线性回归分析的前提因为具有相关关系是进行线性回归分析的前提, ,如果忽略了这一步如果忽略了这一步 骤骤, ,所求的回归方程无实际意义所求的回归方程无实际意义, ,所以在进行线性回归分析前必须进行相所以在进行线性回归分析前必须进行相 关性检验关性检验. . 数学数学 名师点津名师点津 残差图也是用来刻画回归效果的残差图也是用来刻画回归效果的, ,判断依据是判断依据是: :残差点比较均匀地分残差点比较均匀地分 布在水平带状区域中布在水平带状区域中, ,带状区域越窄带状区域越窄, ,说明模型拟合精度越高说明模型拟合精度越高, ,回归方程回归方程 预报精度越高预报精度越高. .
11、(1)(1)“R R 2 2、残差图”在回归分析中的作用 、残差图”在回归分析中的作用: : R R 2 2 是用来刻画回归效果的是用来刻画回归效果的, ,由由 R R 2 2=1 =1- - 2 1 2 1 () () n ii i n i i yy yy 可知可知 R R 2 2 越大越大, ,意味着残差意味着残差 平方和越小平方和越小, ,也就是说模型的拟合效果就越好也就是说模型的拟合效果就越好. . 数学数学 (2)(2)非线性回归分析非线性回归分析 非线性回归分析非线性回归分析 研究两个变量的关系时研究两个变量的关系时, ,我们常常根据样本数据作出散点图我们常常根据样本数据作出散点图
12、, ,观察散点观察散点 图中样本点的分布图中样本点的分布, ,从整体看从整体看, ,如果样本点没有分布在某一条直线附近如果样本点没有分布在某一条直线附近, , 我们就称这两个变量之间不具有线性相关关系我们就称这两个变量之间不具有线性相关关系, ,即非线性相关关系即非线性相关关系. . 若两个变量是非线性的相关关系若两个变量是非线性的相关关系, ,可以通过非线性函数进行拟合可以通过非线性函数进行拟合, ,其方其方 法是通过变换先将其转化成线性函数法是通过变换先将其转化成线性函数, ,利用最小二乘法得到线性回归方利用最小二乘法得到线性回归方 程再通过相应的变换程再通过相应的变换, ,得到非线性回归
13、方程得到非线性回归方程. . 常见的非线性回归模型及转化为线性模型的方法常见的非线性回归模型及转化为线性模型的方法 a.a.将幂函数将幂函数y=axy=axn n(a,n(a,n为常数为常数,a,x,y,a,x,y均为正值均为正值) )化为线性函数化为线性函数. .将将y=axy=axn n 两边取常用对数两边取常用对数, ,则有则有lg y=nlg x+lg a,lg y=nlg x+lg a,令令 =lg y,v=lg x,b=lg a=lg y,v=lg x,b=lg a代代 入上式得入上式得 =nv+b(=nv+b(其中其中n,bn,b是常数是常数),),其图象是一条直线其图象是一条直
14、线. . 数学数学 b.b.将指数函数将指数函数y=cay=cax x(a0,c0,a,c(a0,c0,a,c为常数为常数) )化为线性函数化为线性函数. .将将y=cay=cax x两边两边 取常用对数取常用对数, ,则有则有lg y=xlg a+lg c,lg y=xlg a+lg c,令令 =lg y,b=lg c,d=lg a,=lg y,b=lg c,d=lg a,代入代入 上式得上式得 =dx+b(d,b=dx+b(d,b是常数是常数),),它的图象是一条直线它的图象是一条直线. . c.c.将对数函数将对数函数y=a+bln x(a,by=a+bln x(a,b为常数为常数) )
15、化为线性函数化为线性函数, ,令令 =y,v=ln x,=y,v=ln x, 得线性函数得线性函数 =a+bv,=a+bv,它的图象是一条直线它的图象是一条直线. . 数学数学 课堂探究课堂探究素养提升素养提升 题型一题型一 回归直线方程回归直线方程 例例11 (2018(2018 临沂高二检测临沂高二检测) )下表提供了某厂节能降耗技术改造后生产下表提供了某厂节能降耗技术改造后生产 甲产品过程中记录的产量甲产品过程中记录的产量x(x(吨吨) )与相应的生产能耗与相应的生产能耗y(y(吨标准煤吨标准煤) )的几组的几组 对照数据对照数据: : x/x/吨吨 3 3 4 4 5 5 6 6 y/
16、y/吨标准煤吨标准煤 2.52.5 3 3 4 4 4.54.5 数学数学 (1)(1)请画出上表数据的散点图请画出上表数据的散点图; ; 解解: :(1)(1)由题设所给数据由题设所给数据, ,可得散点图如图可得散点图如图. . 数学数学 (2)(2)请根据上表提供的数据请根据上表提供的数据, ,用最小二乘法求出用最小二乘法求出 y y 关于关于 x x 的回归直线方程的回归直线方程y= =bx+x+a; ; 解解: :(2)(2)由数据由数据, ,计算得计算得: : 4 2 1 i i x =86,=86,x= = 3456 4 =4.5,=4.5,y= = 2.5344.5 4 =3.5
17、,=3.5, 又已知又已知 4 ii 1i x y =66.5,=66.5,由最小二乘法确定的回归方程的系数为由最小二乘法确定的回归方程的系数为: :b= = 4 1 4 2 2 1 4 4 ii i i i x yx y xx = = 2 66.544.53.5 8644.5 =0.7,=0.7,a= =y- -bx=3.5=3.5- -0.70.74.5=0.35,4.5=0.35,因此因此, ,所求的回归直线方所求的回归直线方 程为程为y=0.7x+0.35.=0.7x+0.35. 数学数学 (3)(3)已知该厂技改前已知该厂技改前100100吨甲产品的生产能耗为吨甲产品的生产能耗为90
18、90吨标准煤吨标准煤. .试根据试根据(2)(2) 求出的回归直线方程求出的回归直线方程, ,预测生产预测生产100100吨甲产品的生产能耗比技改前降低吨甲产品的生产能耗比技改前降低 多少吨标准煤多少吨标准煤? ? ( (参考数值参考数值:3:32.5+42.5+43+53+54+64+64.5=66.5)4.5=66.5) 解解: :(3)(3)由由(2)(2)的回归方程及技改前生产的回归方程及技改前生产100100吨甲产品的生产能耗吨甲产品的生产能耗, ,得降低得降低 的生产能耗为的生产能耗为9090- -(0.7(0.7100+0.35)=19.65100+0.35)=19.65吨标准煤
19、吨标准煤. . 数学数学 方法技巧方法技巧 求回归直线方程的三个步骤求回归直线方程的三个步骤 (1)(1)画散点图画散点图: :由样本点是否呈条状分布来判断两个量是否具有线性由样本点是否呈条状分布来判断两个量是否具有线性 相关关系相关关系. . (2)(2)求回归系数求回归系数: :若存在线性相关关系若存在线性相关关系, ,则求回归系数则求回归系数. . (3)(3)写方程写方程: :写出回归直线方程写出回归直线方程. .并利用回归直线方程进行预测说明并利用回归直线方程进行预测说明. . 数学数学 解析解析: :x= = 1 4 (0+1+3+4)=2,(0+1+3+4)=2,y= = 2.2
20、4.34.86.7 4 =4.5,=4.5,而回归直线方程过而回归直线方程过 样本点的中心样本点的中心(2,4.5),(2,4.5),所以所以a= =y- -0.950.95x=4.5=4.5- -0.950.952=2.6.2=2.6.故选故选 A.A. 即时训练即时训练1 1- -1:1:(2018(2018 南昌高二检测南昌高二检测) )已知已知x,yx,y的取值如表所示的取值如表所示: : x x 0 0 1 1 3 3 4 4 y y 2.22.2 4.34.3 4.84.8 6.76.7 若从散点图分析若从散点图分析,y,y 与与 x x 线性相关线性相关, ,且且y=0.95x+
21、=0.95x+a, ,则则a的值等于的值等于( ( ) ) (A)2.6(A)2.6 (B)6.3(B)6.3 (C)2(C)2 (D)4.5(D)4.5 数学数学 备用例题备用例题 某个服装店经营某种服装某个服装店经营某种服装, ,在某周内获纯利润在某周内获纯利润y(y(元元) )与该周与该周 每天销售这种服装件数每天销售这种服装件数x x之间的一组数据关系如表之间的一组数据关系如表: : x/x/件件 3 3 4 4 5 5 6 6 7 7 8 8 9 9 y/y/元元 6666 6969 7373 8181 8989 9090 9191 已知已知: : 7 2 1 i i x =280,
22、=280, 7 2 1 i i y =45 309,=45 309, 7 ii 1i x y x xi iy yi i=3 487.=3 487. 参考公式参考公式: :回归直线的方程是回归直线的方程是y= =bx+x+a, ,其中其中b= = 1 2 2 1 n ii i n i i x ynx y xnx , ,a= =y- -bx.x. 数学数学 解解: :(1)(1)x= = 3456789 7 =6,=6, y= = 66697381899091 7 = = 559 7 . . (1)(1)求求x, ,y; ; 数学数学 (2)(2)画出散点图画出散点图; ; 解解: :(2)(2)
23、散点图如图所示散点图如图所示. . 数学数学 (3)(3)求获纯利润求获纯利润y(y(元元) )与每天销售件数与每天销售件数x x之间的线性回归方程之间的线性回归方程. . 解解: :(3)(3)由散点图知由散点图知y y与与x x有线性相关关系有线性相关关系, ,设线性回归方程为设线性回归方程为y= =bx+x+a, , 因为因为 7 2 1 i i x =280,=280, 7 2 1 i i y =45 309,=45 309, 7 ii 1i x y =3 487,=3 487,x=6,=6,y= = 559 7 , , 所以所以b= = 559 348776 7 280736 = =
24、 133 28 =4.75,=4.75,a= = 559 7 - -6 64.754.7551.36,51.36, 所以线性回归方程为所以线性回归方程为y=4.75x+51.36.=4.75x+51.36. 数学数学 题型二题型二 线性回归分析线性回归分析 例例2 2 在一段时间内在一段时间内, ,某种商品的价格某种商品的价格x x元和需求量元和需求量y y件之间的一组数件之间的一组数 据为据为: : 价格价格x(x(元元) ) 1414 1616 1818 2020 2222 需求量需求量y(y(件件) ) 1212 1010 7 7 5 5 3 3 求出求出y y对对x x的回归直线方程的
25、回归直线方程, ,并说明拟合效果的好坏并说明拟合效果的好坏. . 数学数学 解解: :易知易知 x,yx,y 线性相关线性相关, ,x= = 1 5 (14+16+18+20+22)=18,(14+16+18+20+22)=18,y= = 1 5 (12+10+(12+10+ 7+5+3)=7.4,7+5+3)=7.4, 5 2 1 i i x =14=14 2 2+16 +16 2 2+18 +18 2 2+20 +20 2 2+22 +22 2 2=1 660, =1 660, 5 ii 1i x y = =141412+1612+16 10+1810+187+207+205+225+22
26、3=620,3=620,所以所以b= = 5 1 5 2 2 1 5 5 ii i i i x yx y xx = = 2 6205 187.4 16605 18 = = 46 40 = =- -1.15.1.15.a=7.4+1.15=7.4+1.1518=28.1.18=28.1.所以回归直线方程所以回归直线方程y= =- -1.15x+28.1.1.15x+28.1. 数学数学 列出残差表为列出残差表为 y yi i- - i y 0 0 0.30.3 - -0.40.4 - -0.10.1 0.20.2 y yi i- -y 4.64.6 2.62.6 - -0.40.4 - -2.4
27、2.4 - -4.44.4 所以所以 5 2 i 1 () i i yy =0.3,=0.3, 5 2 i 1 () i yy =53.2,R=53.2,R 2 2=1 =1- - 5 2 1 5 2 1 () () ii i i i yy yy 0.994.0.994. 因而拟合效果较好因而拟合效果较好. . 数学数学 方法技巧方法技巧 线性回归问题应先通过散点图来分析两变量间的关系是否线性相关线性回归问题应先通过散点图来分析两变量间的关系是否线性相关, , 然后再利用求回归方程的公式求解回归方程然后再利用求回归方程的公式求解回归方程, ,并利用残差图或并利用残差图或R R2 2来分析来分析
28、 函数模型的拟合效果函数模型的拟合效果, ,在此基础上在此基础上, ,借助回归方程对实际问题进行分析借助回归方程对实际问题进行分析. . 数学数学 即时训练即时训练2 2- -1:1:关于关于x x与与y y有以下数据有以下数据: : x x 2 2 4 4 5 5 6 6 8 8 y y 3030 4040 6060 5050 7070 已知已知 x x 与与 y y 线性相关线性相关, ,由最小二乘法得由最小二乘法得b=6.5.=6.5. (1)(1)求求 y y 与与 x x 的线性回归方程的线性回归方程; ; 解解: :(1)(1)依题意设依题意设 y y 与与 x x 的线性回归方程
29、为的线性回归方程为y=6.5x+=6.5x+a. .x= = 24568 5 = = 5,5,y= = 3040605070 5 =50,=50,因为因为y=6.5x+=6.5x+a经过经过( (x, ,y),),所以所以 50=50= 6.56.55+5+a. .所以所以a=1=17.5.7.5.所以所以 y y 与与 x x 的线性回归方程为的线性回归方程为y=6.5x+17.5.=6.5x+17.5. 数学数学 解解: :(2)(2)由由(1)(1)的线性回归模型得的线性回归模型得 y yi i- - i y与与 y yi i- -y的关系如表所示的关系如表所示: : y yi i- -
30、 i y - -0.50.5 - -3.53.5 1010 - -6.56.5 0.50.5 y yi i- -y - -2020 - -1010 1010 0 0 2020 所以所以 5 2 i 1 (y) i i y =155,=155, 5 2 i 1 (y) i y =1 000,=1 000, (2)(2)现有第二个线性回归模型现有第二个线性回归模型: :y=7x+17,=7x+17,且且 R R 2 2=0.82. =0.82.若与若与(1)(1)的线性回归模的线性回归模 型比较型比较, ,哪一个线性回归模型拟合效果比较好哪一个线性回归模型拟合效果比较好, ,请说明理由请说明理由.
31、 . 数学数学 所以所以 2 1 R=1=1- - 5 2 1 5 2 1 () () ii i i i yy yy =1=1- - 155 1000 =0.845,=0.845, 由于由于 2 1 R=0.845,R=0.845,R 2 2=0.82 =0.82 知知 2 1 RRR 2 2, , 所以所以(1)(1)的线性回归模型拟合效果的线性回归模型拟合效果比较好比较好. . 数学数学 题型三题型三 非线性回归分析非线性回归分析 例例3 3 在一次抽样调查中测得样本的在一次抽样调查中测得样本的5 5个样本点个样本点, ,数值如表数值如表: : x x 0.250.25 0.50.5 1
32、1 2 2 4 4 y y 1616 1212 5 5 2 2 1 1 试建立试建立y y与与x x之间的回归方程之间的回归方程. . 数学数学 解解: :画出散点图如图所示画出散点图如图所示. . 根据散点图可知根据散点图可知 y y 与与 x x 近似地呈反比例函数关系近似地呈反比例函数关系, ,设设 y=y= k x , ,令令 t=t= 1 x , , 则则y=kt,y=kt,原数据变为原数据变为: : t t 4 4 2 2 1 1 0.50.5 0.250.25 y y 1616 1212 5 5 2 2 1 1 数学数学 由置换后的数值表作散点图如图由置换后的数值表作散点图如图:
33、 : 由散点图可以看出由散点图可以看出y y与与t t呈近似的线性相关关系呈近似的线性相关关系. .列表如下列表如下: : 数学数学 序号序号 t ti i y yi i t ti iy yi i 2 i t 2 i y 1 1 4 4 1616 6464 1616 256256 2 2 2 2 1212 2424 4 4 144144 3 3 1 1 5 5 5 5 1 1 2525 4 4 0.50.5 2 2 1 1 0.250.25 4 4 5 5 0.250.25 1 1 0.250.25 0.062 50.062 5 1 1 7.757.75 3636 94.2594.25 21.
34、312 521.312 5 430430 数学数学 所以所以t=1.=1.55,55,y=7.2.=7.2. 所以所以b= = 5 1 5 2 2 1 5 5 ii i i i t yt y tt 4.134 4,4.134 4,a= =y- -bt0.8.0.8. 所以所以y=4.134 4t+0.8.=4.134 4t+0.8. 所以所以 y y 与与 x x 的回归方程是的回归方程是y= = 4.1344 x +0.8.+0.8. 数学数学 方法技巧方法技巧 解决非线性回归分析问题的一般方法和步骤解决非线性回归分析问题的一般方法和步骤: : (1)(1)确定变量确定变量: :确定解释变量
35、为确定解释变量为x,x,预报变量为预报变量为y.y. (2)(2)画散点图画散点图: :通过观察散点图并与已学过的函数通过观察散点图并与已学过的函数( (幂函数、指数函数、幂函数、指数函数、 对数函数、二次函数对数函数、二次函数) )作比较作比较, ,选取拟合效果好的函数模型选取拟合效果好的函数模型. . (3)(3)变量置换变量置换: :通过变量置换把非线性问题转化为线性回归问题通过变量置换把非线性问题转化为线性回归问题. . (4)(4)分析拟合效果分析拟合效果: :通过计算相关指数或相关系数等来判断拟合效果通过计算相关指数或相关系数等来判断拟合效果. . (5)(5)写出非线性回归方程写
36、出非线性回归方程. . 数学数学 即时训练即时训练3 3- -1:1:在一化学反应过程中某化学物质的反应速度在一化学反应过程中某化学物质的反应速度y(y(单位单位:g/min):g/min) 与一种催化剂的量与一种催化剂的量x(x(单位单位:g):g)有关有关, ,现收集了现收集了8 8组数据列于表中组数据列于表中, ,试建立试建立y y 与与x x之间的回归方程之间的回归方程. . 催化剂量催化剂量 x(g)x(g) 1515 1818 2121 2424 2727 3030 3333 3636 化学物质反化学物质反 应速度应速度 y(g/min)y(g/min) 6 6 8 8 3030
37、2727 7070 205205 6565 350350 数学数学 解解: :根据收集的数据作散点图根据收集的数据作散点图. . 根据根据x x与与y y的散点图可以认为样本点集中在某一条指数型函数曲线的散点图可以认为样本点集中在某一条指数型函数曲线y=cy=c1 1 的周围的周围. . 令令z=ln y,z=ln y,则则z=cz=c2 2x+ln cx+ln c1 1, ,即变换后样本点应该分布在直线即变换后样本点应该分布在直线 z=bx+a(a=ln cz=bx+a(a=ln c1 1,b=c,b=c2 2) )的周围的周围. . 由由y y与与x x数据表可得数据表可得z z与与x x
38、的数据表的数据表: : x x 1515 1818 2121 2424 2727 3030 3333 3636 z z 1.7921.792 2.0792.079 3.4013.401 3.2963.296 4.2484.248 5.3235.323 4.1744.174 5.8585.858 数学数学 作出作出 z z 与与 x x 的散点图的散点图, ,如图如图. . 由散点图可观察到样本数据点大致在一条直线上由散点图可观察到样本数据点大致在一条直线上, ,所以可用线性回归方程所以可用线性回归方程 来拟合它来拟合它. .由由 z z 与与 x x 数据表数据表, ,得到线性回归方程得到线性
39、回归方程, ,z z=0.181 2x=0.181 2x- -0.848 5,0.848 5,所以所以 非线性回归方程为非线性回归方程为 y=ey=e 0.181 2x0.181 2x- -0.848 50.848 5, ,因此 因此, ,该化学物质反应速度对催化剂的量该化学物质反应速度对催化剂的量 的非线性回归方程为的非线性回归方程为 y=y=e e 0.181 2x0.181 2x- -0.848 50.848 5. . 数学数学 备用例题备用例题 菜农定期使用低害杀虫农药对蔬菜进行喷洒菜农定期使用低害杀虫农药对蔬菜进行喷洒, ,以防止害虫的以防止害虫的 危害危害, ,但采集上市时蔬菜仍存
40、有少量的残留农药但采集上市时蔬菜仍存有少量的残留农药, ,食用时需要用清水清洗食用时需要用清水清洗 干净干净, ,下表是用清水下表是用清水x(x(单位单位: :千克千克) )清洗该蔬菜清洗该蔬菜1 1千克后千克后, ,蔬菜上残留的农蔬菜上残留的农 药药y(y(单位单位: :微克微克) )的统计表的统计表: : x/x/千克千克 1 1 2 2 3 3 4 4 5 5 y/y/微克微克 5858 5454 3939 2929 1010 (1)(1)令令=x=x 2 2, ,利用给出的参考数据求出 利用给出的参考数据求出y y关于关于的回归方程的回归方程y= =b+ +a( (a, ,b精确到精确
41、到0.1);0.1); 参考数据参考数据: : 5 1 i i =55,=55, 5 2 i 1 () i (y(yi i- -y)=)=- -751,751, 5 2 i 1 () i =374,=374,其中其中i i= = 2 i x, ,= = 5 1 1 5 i i . . 数学数学 解解: :(1)(1)由题意得由题意得=11,=11,y=38.=38. b= = 5 1 5 2 1 ()() () ii i i i yy = =- - 751 374 - -2.0.2.0. a= =y- -b=60.0,=60.0, 所以所以y= =- -2.02.0+60.0.+60.0. 数
42、学数学 (2)(2)对于某种残留在蔬菜上的农药对于某种残留在蔬菜上的农药, ,当它的残留量不高于当它的残留量不高于 2020 微克时对人体微克时对人体 无害无害, ,为了放心食用该蔬为了放心食用该蔬菜菜, ,请估计至少需要用多少千克的清水清洗请估计至少需要用多少千克的清水清洗 1 1 千克千克 蔬菜蔬菜?(?(精确到精确到 0.1,0.1,参考数据参考数据52.24).2.24). 附附: :对于一组数据对于一组数据(u(u1 1,v,v1 1),(u),(u2 2,v,v2 2),),(u,(un n,v,vn n),),其回归直线其回归直线 v=v= + + u u 的斜率的斜率 和截距的
43、最小二乘估计分别为和截距的最小二乘估计分别为= = 1 2 1 ()() () n ii i n i i uv vv uu , ,= =v- -u. . 数学数学 解解: :(2)(2)由由(1)(1)得得y= =- -2.02.0+60.0,+60.0, 所以所以y= =- -2.0x2.0x 2 2+60.0, +60.0, 当当y2020 时时, ,即即- -2.0x2.0x 2 2+60.0 +60.020,20, 解得解得 x x2 254.5.4.5. 所以为了放心食用该蔬菜所以为了放心食用该蔬菜, ,估计需要用估计需要用 4.54.5 千克的清水清洗千克的清水清洗 1 1 千克蔬
44、菜千克蔬菜. . 数学数学 题型四题型四 易错辨析易错辨析 例例4 4 下列关于相关系数下列关于相关系数r r的叙述正确的是的叙述正确的是 . . |r|(0,+),|r|r|(0,+),|r|越大越大, ,相关程度越强相关程度越强, ,反之反之, ,相关程度越弱相关程度越弱; ; |r|(|r|(- -,+),|r|,+),|r|越大越大, ,相关程度越强相关程度越强, ,反之反之, ,相关程度越弱相关程度越弱; ; |r|1,|r|1,且且|r|r|越接近于越接近于1,1,相关程度越强相关程度越强,|r|,|r|越接近于越接近于0,0,相关程度越弱相关程度越弱; ; |r|1,|r|1,且
45、且|r|r|越接近于越接近于1,1,相关程度越弱相关程度越弱,|r|,|r|越接近于越接近于0,0,相关程度越强相关程度越强. . 错解错解: : 纠错纠错: :|r|1,|r|1,且且|r|r|越接近于越接近于1,1,相关程度越强相关程度越强;|r|;|r|越接近于越接近于0,0,相关程度相关程度 越弱越弱. . 正解正解: : 数学数学 课堂达标课堂达标 C C 1.1.为了表示散点图中为了表示散点图中 n n 个点与某一条直线在整体上的接近程度个点与某一条直线在整体上的接近程度, ,我们常用我们常用 下面四个量中的下面四个量中的( ( ) ) (A)(A) i 1 () n i i yy
46、 (B)(B) i 1 () n i i yy (C)(C) 2 i 1 () n i i yy (D)(D) 2 i 1 () n i yy 数学数学 解析解析: :对于散点图对于散点图, ,我们用回归方程来拟合所给的点我们用回归方程来拟合所给的点, ,在度量上在度量上, ,用用 2 i 1 (y) n i i y 来表示散点图中来表示散点图中 n n 个点与某一条直线在整体上的接近程度个点与某一条直线在整体上的接近程度. .因因 此选此选 C.C. 数学数学 A A 2.2.线性回归方程线性回归方程y= =bx+x+a表示的直线必经过的一个定点是表示的直线必经过的一个定点是( ( ) ) (A)(A)( (x, ,y) ) (B)(B)(x,0),0) (C)(0,(C)(0,y) ) (D)(0,0)(D)(0,0) 解析解析: :因为线性回归方程一定过这组数据的样本点的中心因为线性回归方程一定过这组数据的样本点的中心, ,所以线性回归所以线性回归 方程方程y= =bx+x+a表示的直线必经过表示的直线必经过( (x, ,y).). 数学数学 3.3.工人工资工人工资 y(y(元元) )依劳动生产率依劳动生产率 x(x(千