1、第五节第五节 曲线拟合(非线性回归分析)曲线拟合(非线性回归分析)(可化为直线的曲线回归方程)(可化为直线的曲线回归方程) 一元线性回归方程是一种最简单的回归,但在实际工作中,遇到一元线性回归方程是一种最简单的回归,但在实际工作中,遇到的却也很多。因为任何一种曲线回归,在一个很小的区间内,都可以认的却也很多。因为任何一种曲线回归,在一个很小的区间内,都可以认为是直线回归。为是直线回归。 尽管如此,直线回归并不能代替曲线回归。尽管如此,直线回归并不能代替曲线回归。 生物学中呈曲线关系的例子很多:生物学中呈曲线关系的例子很多:细菌生长的数量与时间的关系细菌生长的数量与时间的关系年龄与身高的关系年龄
2、与身高的关系作物种植密度与作物产量的关系作物种植密度与作物产量的关系辐射强度与或药物的浓度与致死率的关系辐射强度与或药物的浓度与致死率的关系 我们将数据做适当的变换,将曲线化为直线,再按直线回归分析的我们将数据做适当的变换,将曲线化为直线,再按直线回归分析的方法处理,就可以求出相应的曲线回归方程,这一分析过程,就称为曲方法处理,就可以求出相应的曲线回归方程,这一分析过程,就称为曲线拟合。线拟合。为了将回归曲线直线化,首先要了解两个变量间所呈的函为了将回归曲线直线化,首先要了解两个变量间所呈的函数关系。数关系。两个变量间的函数关系,可以根据专业知识去判定。两个变量间的函数关系,可以根据专业知识去
3、判定。例如:例如:生长曲线一般呈生长曲线一般呈S形曲线关系。形曲线关系。细菌的生长量与时间的关系为指数函数关系等。细菌的生长量与时间的关系为指数函数关系等。此外还可以由散点图来判定两个变量的关系。此外还可以由散点图来判定两个变量的关系。一、对数函数曲线的拟合一、对数函数曲线的拟合1、对数方程的一般表达式:、对数方程的一般表达式:xbaylg2、对数曲线、对数曲线 的图象的图象xbaylg3、 直线化方法:直线化方法: 若令若令 ,则有,则有lgxx bxay4、求、求 a 和和 b 的值:的值:,xyxSSSSb xbyaxbaylg例:在水稻塑料薄膜青苗床内空气最高温度和室外空气最高温例:在
4、水稻塑料薄膜青苗床内空气最高温度和室外空气最高温度资料列于下表,试求它们之间的相关关系。度资料列于下表,试求它们之间的相关关系。序号序号12345678910X7.27.911.816.912.018.718.920.221.822.7Y13.821.424.933.632.339.540.136.940.242.6X0.85730.89761.07191.22791.07921.27181.27651.30541.33851.3560序号序号11121314151617181920X22.923.123.323.623.827.027.628.630.731.4Y44.636.635.144
5、.444.143.948.348.546.350.4X1.35981.36361.36741.37291.37651.43141.44091.45641.48711.4969X:室外气温:室外气温 Y:苗床内气温:苗床内气温首先首先,根据上表的数据根据上表的数据(x,y)绘制散点图。绘制散点图。由散点图看由散点图看x与与y的关系符合曲线类型,很象的关系符合曲线类型,很象b0时的对数函数曲线时的对数函数曲线y=a+blgx,所以做,所以做x=lgx的对数转换,并求的对数转换,并求x=lgx。以(。以(x,y)作散)作散点图,散点近似于线性分布。点图,散点近似于线性分布。求一级和二级数据:求一级和
6、二级数据:,835.25x, 5 .767y,5943.1022yxxyxSSSSb xylg6832.498058.25所以有:所以有:回归关系的检验可以进行回归系数或相关系数的检验。回归关系的检验可以进行回归系数或相关系数的检验。,2918. 1x6275. 0 xSS,375.38y6175.1721ySS1762.31/nyxyxSSyxxbya6832.496275. 01762.318058.252918. 16832.49375.38苗床内最高气温苗床内最高气温y与空气最高气温与空气最高气温x(lgx)之间的线性关系)之间的线性关系二、指数曲线的拟合二、指数曲线的拟合1、一般化方
7、程:、一般化方程:,xbaybxeay2、描述的现象:、描述的现象:细菌的繁殖细菌的繁殖土壤中某些杀虫剂的分解曲线土壤中某些杀虫剂的分解曲线放射性同位素的衰变放射性同位素的衰变水果、蔬菜的腐败和温度的关系水果、蔬菜的腐败和温度的关系,xbay3、直线化的方法:、直线化的方法:方程的两边取常用对数,有方程的两边取常用对数,有 lg y = lga + xlgb另另lgy = y,lga = a,lgb = b,则有:,则有:y=a+bx4、指数曲线、指数曲线 的图象的图象xaby 例:棉花红铃虫的产卵数与温度有关,试根据下表数据,建立棉花红铃例:棉花红铃虫的产卵数与温度有关,试根据下表数据,建立
8、棉花红铃虫产卵数与温度的回归方程。虫产卵数与温度的回归方程。x 温度温度21232527293235y 产卵数产卵数711212466115325y=lgy0.84511.04141.32221.38021.81922.06072.5119由由(x,y)的散点图可见,的散点图可见,x 与与 y 有曲线回归关系有曲线回归关系,散点分布近于指数函数曲散点分布近于指数函数曲线的分布,将线的分布,将y=lgy与与x做散点图做散点图(x,lgy),x与与lgy的分布近似于线性分布。的分布近似于线性分布。X 与与 lgy 的分布近似于线性分布,做线性回归:的分布近似于线性分布,做线性回归:xbay,lgl
9、glgbxay解:解:4510.17/0925. 2,5687. 1,981.107143.147,4286.27,192nyxyxSSSSyySSxxxyyx1181. 07143.1474510.17xxySSSSbxy3125. 10214. 06706. 14286.271181. 05687. 1xbya3125. 110101181. 0bb0214. 010106706. 1aa回归关系的检验:可以利用回归关系的检验:可以利用 b 或者或者 r 进行检验,主要是对线进行检验,主要是对线性关系的检验,线性回归或相关显著,则指数回归关系的拟性关系的检验,线性回归或相关显著,则指数回归
10、关系的拟合就显著。合就显著。三、幂函数曲线的拟合三、幂函数曲线的拟合1、一般化方程:、一般化方程:bxay2、幂函数、幂函数 曲线的图象曲线的图象bxay3、直线化的方法:、直线化的方法:两边取常用对数,使之线性化,得:两边取常用对数,使之线性化,得:xbaylglglg令:令:lgy = y,lgx = x,lga = a,则:,则:y= a+bx上式符合直线回归方程的一般形式。上式符合直线回归方程的一般形式。4、怎样知道利用对数转换、怎样知道利用对数转换 最好的方法依然是绘制两个变量的散点图,如果散最好的方法依然是绘制两个变量的散点图,如果散点不符合直线或狭长形的椭圆,则可在双边对数纸上,
11、点不符合直线或狭长形的椭圆,则可在双边对数纸上,再将散点绘制出来,若散点的分布符合线性或狭长椭圆,再将散点绘制出来,若散点的分布符合线性或狭长椭圆,则可以进行则可以进行x与与y的双对数转换。的双对数转换。例题:在突变实验中,用不同剂量的射线,照射植物的种子,结果苗期高例题:在突变实验中,用不同剂量的射线,照射植物的种子,结果苗期高度与成活株之间有一定的关系。用度与成活株之间有一定的关系。用X射线照射大麦的种子,记处理株第一射线照射大麦的种子,记处理株第一叶平均高度占对照株高度的百分数为叶平均高度占对照株高度的百分数为X,存活百分数为,存活百分数为Y,得到以下结果,得到以下结果,试对两者的关系进
12、行分析。试对两者的关系进行分析。X283240506072808085Y812182830556185801、画两个变量的散点图:、画两个变量的散点图:由不同数据变换的散点图可见,由不同数据变换的散点图可见,X与与Y的关系是幂函数的关系。的关系是幂函数的关系。bxay按照幂函数的直线化方法,求二级数据:按照幂函数的直线化方法,求二级数据:7361. 16245.152658. 0 xxSSx5022. 15202.130824. 1yySSy5297. 0/nyxyxSSyx9928. 12658. 05297. 0 xyxSSSSb9577. 17361. 19928. 15022. 1xb
13、yaY 对对 X 的回归方程为:的回归方程为:9928. 19577. 1 xy因为:因为:a = lga,所以:,所以:a = 10-1.9577 = 0.0110所以:所以:9928. 1011. 0 xy五、曲线的检验五、曲线的检验有时将同一组数据,我们将其做指数函数或幂函数形式的变有时将同一组数据,我们将其做指数函数或幂函数形式的变换,都能得到换,都能得到X与与Y的拟合曲线,并且可能在做线性回归关的拟合曲线,并且可能在做线性回归关系检验的时候,线性关系都显著。系检验的时候,线性关系都显著。 那么,究竟哪一条拟合曲线是最好的呢?那么,究竟哪一条拟合曲线是最好的呢?一般情况下,以剩余平方和
14、或称之为误差平方和的大小来判一般情况下,以剩余平方和或称之为误差平方和的大小来判断,即断,即SSe最小时的拟合曲线为最好的曲线。最小时的拟合曲线为最好的曲线。xxyyeSSSSSSSS/2niiieyySS12可以对一组数据尝试进行多种拟合,找出可以对一组数据尝试进行多种拟合,找出SSe最小,其为最好最小,其为最好的拟合曲线。的拟合曲线。必须用必须用 来计算,来计算,不可以用不可以用 来计算。来计算。四、概率对数变换四、概率对数变换在辐射育种和药理学实验中,经常遇到寻找半致死剂量的在辐射育种和药理学实验中,经常遇到寻找半致死剂量的问题。问题。致死率(致死率(y)与剂量()与剂量(x)间的关系曲
15、线往往呈)间的关系曲线往往呈S形。在半致形。在半致死处,曲线的斜率最大,与死亡率的交点最清楚,因此在死处,曲线的斜率最大,与死亡率的交点最清楚,因此在实际工作中,常常采用半致死剂量这一标准。实际工作中,常常采用半致死剂量这一标准。确定半致死剂量,最常用的方法就是概率对数转换,当我们确定半致死剂量,最常用的方法就是概率对数转换,当我们把死亡率做概率转换,辐射剂量做对数转换后,两者会呈很把死亡率做概率转换,辐射剂量做对数转换后,两者会呈很好的线性关系。好的线性关系。1、概率转换:、概率转换:P(u up)= p,其中,其中, p 为死亡率,即为为死亡率,即为 y 值,值,up为为y的值。的值。2、
16、对数转换:、对数转换:x= lgx,x 为辐射剂量。为辐射剂量。则:则:y=a+bx,y与与x间有很好的线性关系。间有很好的线性关系。3、半致死剂量:、半致死剂量:所谓的半致死剂量,即为所谓的半致死剂量,即为Y=50%时的辐射或药物剂量时的辐射或药物剂量X,用,用LD50来表示,当来表示,当p = y = 0.5时,时,P(uup)= 0.5,则,则 up= 0。将将up= y= 0 代入代入 y= a + bx,则有则有 :0 = a + bx,则有:则有:x= -a/b,因为因为 x = lgx,所以,所以 bax10此时的此时的x即为半致死剂量,即即为半致死剂量,即LD50。baLD10
17、50例题:用不同剂量的例题:用不同剂量的 射线照射小麦品种库斑克,调查死苗射线照射小麦品种库斑克,调查死苗率,得到以下结果:率,得到以下结果:剂量(剂量(Kr)x 14 16 18 20 22 24 26 死苗率(死苗率(%)y 6 10 40 70 80 93 95 x=lgx1.146 1.204 1.255 1.301 1.342 1.380 1.415y=up-1.555 -0.842 -0.253 0.524 0.842 1.476 1.645利用原始数据绘制散点图,利用原始数据绘制散点图,x与与y为为S形曲线形状,将形曲线形状,将y与与x做概率转换和对数转换,则两者的散点图呈线性关
18、系。做概率转换和对数转换,则两者的散点图呈线性关系。因此,对转换后的数据(因此,对转换后的数据(褐色褐色)进行线性分析:)进行线性分析: bxay求二级数据:求二级数据:057. 0,292. 1,043. 9xSSxx577. 8,262. 0,837. 1ySSyy10526.12057. 0690. 0 xyxSSSSb690. 0/nyxyxSSyx378.15292. 110526.12262. 0 xbya10526.12378.15 xy62.18101050270. 110625.12378.15LD五、曲线的检验五、曲线的检验有时将同一组数据,我们将其做指数函数或幂函数形式的
19、变有时将同一组数据,我们将其做指数函数或幂函数形式的变换,都能得到换,都能得到X与与Y的拟合曲线,并且可能在做线性回归关的拟合曲线,并且可能在做线性回归关系检验的时候,线性关系都显著,那么,究竟哪一条拟合曲系检验的时候,线性关系都显著,那么,究竟哪一条拟合曲线是最好的呢?线是最好的呢?一般情况下,以剩余平方和或称之为误差平方和的大小来判一般情况下,以剩余平方和或称之为误差平方和的大小来判断,即断,即SSe最小时的拟合曲线为最好的曲线。最小时的拟合曲线为最好的曲线。xxyyeSSSSSSSS/221niiieyySS可以对一组数据尝试进行多种拟合,找出可以对一组数据尝试进行多种拟合,找出SSe最小,其为最好的拟合曲线。最小,其为最好的拟合曲线。必须用必须用 来计算,来计算,不可以用不可以用 来计算。来计算。