1、第六章第六章 回归与相关分析回归与相关分析Chapter 6 Regression and Chapter 6 Regression and Correlation AnalysisCorrelation Analysis 本章重点和难点本章重点和难点 l理解并掌握回归与相关的区别与联系;理解并掌握回归与相关的区别与联系;l一元线性回归的基本原理、方法,线性回归的一元线性回归的基本原理、方法,线性回归的显著性检验、区间估计和预测;显著性检验、区间估计和预测;l相关系数的定义、性质和显著性检验;相关系数的定义、性质和显著性检验;l常用曲线方程的线性化方法及回归方程拟合情常用曲线方程的线性化方法及
2、回归方程拟合情况的比较。况的比较。本章内容本章内容 l 回归与相关的概念回归与相关的概念l 一元线性回归分析一元线性回归分析l 线性相关分析线性相关分析l 一元非线形回归(可直线化的曲线回归)一元非线形回归(可直线化的曲线回归)第一节第一节 回归与相关的概念回归与相关的概念l【本节内容本节内容】l回归与相关的概念回归与相关的概念l两者的主要差别两者的主要差别一、回归与相关的概念一、回归与相关的概念l1、回归分析(、回归分析(Regression Analysis)l概念概念:是研究一个随机变量是研究一个随机变量y y与另一些变与另一些变量(主要为固定变量)关系的一种统计量(主要为固定变量)关系
3、的一种统计方法。方法。l即:将一个变量即:将一个变量y y表述为另一些变量的函表述为另一些变量的函数,并通过建立变量间的函数关系,达数,并通过建立变量间的函数关系,达到根据一个或一些变量的取值去估计或到根据一个或一些变量的取值去估计或预测另一个变量的目的。预测另一个变量的目的。l自变量与因变量自变量与因变量l在某些问题中,在某些问题中,y y随随x x的变化而变化的变化而变化lx x带有带有“原因原因”的性质,称为的性质,称为“自变量自变量”ly y带有带有“结果结果”的性质,称为的性质,称为“因变量因变量”l有时有时x x和和y y之间并无明显的因果关系之间并无明显的因果关系l仍然沿用仍然沿
4、用上述名称上述名称l一元线性回归一元线性回归(Linear Regression)l如果自变量与因变量都是一个,且如果自变量与因变量都是一个,且y y和和x x大体上有线性关系,这种研究两个变量大体上有线性关系,这种研究两个变量线性关系的回归称为线性关系的回归称为一元线性回归一元线性回归。l多元回归多元回归l如果自变量如果自变量x x是多个,如是多个,如x x1 1,x x2 2,x xk k,而因变量是一个,而因变量是一个y y,这种研究因变,这种研究因变量量y y与多个自变量与多个自变量x x之间的定量关系的问之间的定量关系的问题称为题称为多元回归多元回归。l回归分析的研究目的回归分析的研
5、究目的l变量之间存在怎样的函数关系变量之间存在怎样的函数关系l能否通过这种关系,由能否通过这种关系,由x x的变化定量地解释或预的变化定量地解释或预测测y y的变化的变化l回归分析的变量类型回归分析的变量类型l因变量因变量y y 随机变量随机变量l自变量自变量x x 固定变量(为主)或随机变量固定变量(为主)或随机变量l回归分析中回归分析中x和和y的关系的关系l地位不平等地位不平等l关心的是关心的是y y依依x x的变化规律的变化规律l2、相关分析(、相关分析(Correlation Analysis)l概念:概念:是研究随机变量之间是研究随机变量之间“相关关系相关关系”的一种统计方法。用于研
6、究两个或数个的一种统计方法。用于研究两个或数个变量共同变化的程度,主要通过计算相变量共同变化的程度,主要通过计算相关系数来判断这种相关关系的强弱。关系数来判断这种相关关系的强弱。l相关关系:相关关系:是一种非确定性的关系,即一种随是一种非确定性的关系,即一种随机关系。按其形成的原因,可分为机关系。按其形成的原因,可分为l直接相关直接相关(real correlation)l间接相关间接相关(nonsense correlation)l二元相关分析(简单相关分析)二元相关分析(简单相关分析)l研究两个变量间相关关系的方法。研究两个变量间相关关系的方法。l只介绍简单相关。只介绍简单相关。l相关分析
7、的研究目的相关分析的研究目的l变量之间是否存在某种随机的共变关系变量之间是否存在某种随机的共变关系l各变量一起变化的程度各变量一起变化的程度l相关分析不具备预测性相关分析不具备预测性l相关分析的变量类型与关系相关分析的变量类型与关系l所有变量都必须是随机变量所有变量都必须是随机变量l没有自变量和因变量之分,没有自变量和因变量之分,x和和y的地位一样的地位一样l分析侧重于随机变量之间的相关特征分析侧重于随机变量之间的相关特征二、二者的主要差别二、二者的主要差别l回归分析与相关分析回归分析与相关分析在计算上有很多在计算上有很多相似相似之处之处,如果在应用时不注意所研究,如果在应用时不注意所研究变量
8、的变量的类型类型以及两种方法的以及两种方法的内在差别内在差别,很容易出,很容易出现错误。现错误。回归分析与相关分析的主要差别回归分析与相关分析的主要差别 统计方法统计方法相关分析相关分析回归分析回归分析研究对象研究对象若干变量一起若干变量一起变化的程度变化的程度一个变量与其它变量间的函一个变量与其它变量间的函数关系数关系变量关系变量关系变量间的共变变量间的共变关系关系一个因变量及一个或数个自一个因变量及一个或数个自变量,前者是后者的函数变量,前者是后者的函数变量类型变量类型均为随机变量均为随机变量因变量:为随机变量因变量:为随机变量自变量:为固定变量(为主)自变量:为固定变量(为主)或随机变量
9、或随机变量统计量统计量无量纲的相关无量纲的相关系数系数有单位的回归系数有单位的回归系数第二节第二节 一元线性回归分析一元线性回归分析l【本节内容本节内容】l一元线性回归的数学模型一元线性回归的数学模型l一元线性回归方程的建立一元线性回归方程的建立l线性回归的显著性检验线性回归的显著性检验l线性回归的区间估计和预测线性回归的区间估计和预测 一、一元线性回归的数学模型一、一元线性回归的数学模型l一元线性回归的常用数学模型为:一元线性回归的常用数学模型为:l:回归截距(回归截距(Intercept)()(又称回归常数)又称回归常数)l:回归系数(回归系数(Coefficient of regress
10、ion)iiixy二、一元线性回归方程的建立二、一元线性回归方程的建立 l(一)原理(一)原理最小二乘法最小二乘法l线性回归方程的一般形式为:线性回归方程的一般形式为:l残差:残差:l最小二乘法最小二乘法:使残差平方和(剩余平方和):使残差平方和(剩余平方和)最小的一种确定最小的一种确定a a 和和b b 的方法。的方法。bxayiiiyye使:使:l根据微积分学中的极值原理,必须使根据微积分学中的极值原理,必须使Q 对对a 和和b的一阶偏导数为的一阶偏导数为0:2020iiiiiiiQyabxaQyabxxb 22iiiiiiQyyyabx最小值整理得到整理得到l一元线性回归的正规方程组:一
11、元线性回归的正规方程组:2iiiiiiiiiiianbxyaxbxx yl(二)一元线性回归的计算(二)一元线性回归的计算 l(三)回归直线的图示(三)回归直线的图示l资料的散点图资料的散点图l回归直线图回归直线图 121()()()niiiniiXXYYSPbSSxXXaYbX(四)一元线性回归方程建立的基本步骤(四)一元线性回归方程建立的基本步骤(4 4步)步)l根据资料计算根据资料计算8个一级数据个一级数据 lx,x2,y,y2,xy ,n l计算计算3个二级数据:个二级数据:SSx,SSy,SP l计算参数的估计值计算参数的估计值a和和b,并写出回归方程并写出回归方程 l作出资料的散点
12、图和回归直线图作出资料的散点图和回归直线图 xyxaybxbSP SS yabxl为了研究特定条件下鱼类对水中某农药的为了研究特定条件下鱼类对水中某农药的富集能力,搜集了富集能力,搜集了10组有关数据如下组有关数据如下(g/L和和g/kg),),试建立二者间的一元线试建立二者间的一元线性回归方程。性回归方程。i12345678910水中水中含量含量(x)4.65.14.84.45.94.75.15.24.95.1鱼体鱼体含量含量(y)17.418.6 17.9 18.3 19.918.419.1 19.918.718.9【例例6.16.1】解解:经计算:经计算所以,所以,b=SP/SSx=1.
13、5508,a=10.987 x与与y的回归方程为:的回归方程为:10.987 1.5508yx4.98 1.563 18.71 5.6692.382xyxSSySSSP,散点图和回归直线图散点图和回归直线图某某农农药药的的水水中中含含量量与与鱼鱼体体中中含含量量的的关关系系y=10.987+1.5508xR2=0.65161516171819202134567x (ug/L)y(ug/kg)三、线性回归的显著性检验三、线性回归的显著性检验(一)线性回归的变异来源(一)线性回归的变异来源 l变异来源变异来源 随机变量随机变量y的观测值的观测值y1,y2,yn之间的变异是由两个方面的原因引起的:之
14、间的变异是由两个方面的原因引起的:l自变量自变量 x 取值的不同;取值的不同;l其它因素(试验误差)的影响。其它因素(试验误差)的影响。l平方和的分解平方和的分解(SSySSESSR)ly 的离均差平方和的离均差平方和SSy(总平方和总平方和SST):):l (dfTn1)l离回归平方和离回归平方和SSE(剩余平方和,残差平方剩余平方和,残差平方和和):):(dfEn2)2yiiSSyy2EiiiSSyy l回归平方和回归平方和SSR:(dfR1)SSSSR R的意义:的意义:根据等式根据等式SSySSySSSSE ESSSSR R可知,如可知,如果果SSSSR R的值较大,的值较大,SSSS
15、E E的数值便比较小,说明回归的数值便比较小,说明回归的效果好;反之,如果的效果好;反之,如果SSSSR R的值较小,的值较小,SSSSE E的数值的数值便比较大,说明回归的效果差。便比较大,说明回归的效果差。2RiiSSyy(二)(二)F F 检验检验当零假设当零假设H0:0成立时,成立时,SSR与与SSE相互相互独立,且统计量独立,且统计量当当F F时,时,H0:0不成立,称不成立,称回归方程回归方程显著显著1(1,2)2RESSFFnSSn具体检验可在方差分析表上进行:具体检验可在方差分析表上进行:SSESSySSR SSRbSPb2SSxSP 2SSx 变异来源变异来源自由度自由度平方
16、和平方和均方均方Fx1SSRsr2sr2se2残余残余n2SSEse2总和总和n1SSy【例例6.2】l根据例根据例6.16.1给出的鱼类对水中农药的富集给出的鱼类对水中农药的富集资料,试检验其线性回归方程的显著性。资料,试检验其线性回归方程的显著性。变异来源变异来源dfSSMSFF0.01回回 归归13.6943.69414.96*11.3离回归离回归81.9750.247总总 计计95.669(三)(三)t t 检验检验采用采用t检验可以检验回归系数检验可以检验回归系数b的显著性,进而的显著性,进而对回归方程的显著性作出判断。对回归方程的显著性作出判断。1、统计假设、统计假设 H0:0,H
17、A:02、b的标准误的标准误3、检验统计量、检验统计量4、判断:若、判断:若t t(n2),则否定,则否定H0,接受,接受HA。bexssSS(2)bbtt ns 前述资料回归关系的前述资料回归关系的t检验检验(2)1.975 80.497eEsSSn0.4971.5360.401bexssSS1.553.8650.401bbbbtss 0.010.01(102)(8)3.355tt0.01(8)tt所以,否定所以,否定H0,接受,接受HA,即,即b极显著。极显著。四、线性回归的区间估计和预测四、线性回归的区间估计和预测 l(一)(一)和和的区间估计的区间估计 l有时有时和和在专业上有特殊意义
18、时,要确在专业上有特殊意义时,要确定其置信区间。定其置信区间。l1、的置信区间的置信区间la 的标准误为:的标准误为:l而而 l所以所以 的置信区间为:的置信区间为:21aexxssnSS(2)aatt ns(,)aaat sat s l2、的置信区间的置信区间lb 的标准误为:的标准误为:l而而 l所以所以 的置信区间为:的置信区间为:bexssSS(2)bbtt ns(,)bbbt sbt s l(二)对(二)对x的区间估计的区间估计l对对x的区间估计,即是对总体均的区间估计,即是对总体均值(期望值)的区间估计。值(期望值)的区间估计。l当当xxi 时,估计标准误为:时,估计标准误为:21
19、ieyxxxssnSS lx的点估计为:的点估计为:l所以,所以,x 的置信度为(的置信度为(1)的置信)的置信区间为:区间为:iiyabx(2)iyytns l以鱼体对水中农药富集的数据为例:以鱼体对水中农药富集的数据为例:l在在x5.5处,处,y 的期望值的置信区间(的期望值的置信区间(95的置信度)为:的置信度)为:21(5.54.98)(10.99 1.55 5.5)2.306 0.247()101.53619.520.60(18.92,20.12)l(三)对(三)对y yxx的预测的预测l当当xxi 时,对时,对yx的预测,即对的预测,即对子总体的某一观察值子总体的某一观察值 yix
20、ii进行预进行预测,相当于预测个体值的问题。测,相当于预测个体值的问题。l预测标准误为:预测标准误为:l当当xxi 时,时,yi 的预测值的置信区间(置的预测值的置信区间(置信度为信度为1)为:)为:211iyexxxssnSS(2)iyytns l以鱼体对水中农药富集的数据为例以鱼体对水中农药富集的数据为例l求求x5.5 时鱼体内农药含量时鱼体内农药含量y 的预测区间。的预测区间。l在在x5.5 处,鱼体内农药含量处,鱼体内农药含量y 的置信度为的置信度为95的预测区间为:的预测区间为:21(5.5 4.98)(10.99 1.55 5.5)2.306 0.247(1)101.53619.5
21、2 1.29(18.23,20.81)l从计算可知,当从计算可知,当x5.5 时,时,y 的区间估计的区间估计的区间范围(的区间范围(18.92,20.12)小于)小于y 的预测的预测区间范围(区间范围(18.23,20.81)。)。l因此,回归分析的预测精度低于估计精度。因此,回归分析的预测精度低于估计精度。4.24.44.64.85.05.25.45.65.86.0 x17.017.518.018.519.019.520.020.5yy=10.987+1.5508 xr=0.80722回归方程的区间估计和预测区间回归方程的区间估计和预测区间第三节第三节 线性相关分析线性相关分析l【讲授内容
22、讲授内容】l相关系数相关系数l相关系数的显著性检验相关系数的显著性检验l相关与回归的关系相关与回归的关系 一、相关系数 如果两个变量间呈线性关系,又不需要如果两个变量间呈线性关系,又不需要由由x 来估计来估计 y,只需了解只需了解 x 和和 y 相关的性质相关的性质以及相关的程度,便可以通过计算表示以及相关的程度,便可以通过计算表示x 和和y 之间相关性质和相关程度的统计量之间相关性质和相关程度的统计量相相关系数关系数进行相关分析。进行相关分析。(一)双变量(正态)总体(一)双变量(正态)总体如果如果:研究对象仅仅涉及两个变量,而且这:研究对象仅仅涉及两个变量,而且这两个变量均服从正态分布(即
23、服从二元正态两个变量均服从正态分布(即服从二元正态分布分布Bivariate normal distribution)则则:研究样本所属的总体称为:研究样本所属的总体称为双变量(正态)双变量(正态)总体总体。(二)相关系数及其计算(二)相关系数及其计算 如果研究的两个变量服从如果研究的两个变量服从二元正态分布二元正态分布,则,则可以采用可以采用参数相关分析参数相关分析方法方法计算计算相关系相关系数数来研究变量间的线性相关关系。来研究变量间的线性相关关系。1、双变量总体的相关系数、双变量总体的相关系数 设:二元正态总体的两个变量为设:二元正态总体的两个变量为X和和Y,具有具有N对对(X,Y)则:
24、总体的相关系数为则:总体的相关系数为 221()()cov()()()11()()XYXYX X Y YXYX X Y YNSS SSX XY YNN 相关性质相关性质l0,X 和和Y 有有正相关关系(正相关)正相关关系(正相关),两个变,两个变量表现出共同增加或共同减少的趋势;量表现出共同增加或共同减少的趋势;l0,X 和和Y 有有负相关关系(负相关)负相关关系(负相关),一个变,一个变量的增加伴随着另一个变量的减小;量的增加伴随着另一个变量的减小;l0,X 和和Y 完全不相关完全不相关。l|1l1,完全正相关;,完全正相关;1,完全负相关。,完全负相关。2、样本的相关系数、样本的相关系数r
25、(对应对应)22()()()()xyxx yySPrSSSSxxyyl 从二元正态总体抽样,得到从二元正态总体抽样,得到n 对观察值(对观察值(xi,yi)l则:样本的相关系数则:样本的相关系数r 可由下式定义可由下式定义 例例6.3l Pearson和和Lee研究了研究了1401个家庭兄妹身个家庭兄妹身高的问题,我们从中抽取高的问题,我们从中抽取11对数据纪录如对数据纪录如下,试求样本的相关系数。下,试求样本的相关系数。编号编号1234567891011兄弟兄弟(x)7168666770717073726566姊妹姊妹(y)6964656365626564665962解:解:l1)先求出一些
26、基本统计量)先求出一些基本统计量 lx759,x252445 l(xx)274l y704,y245122 l(yy)266l xy48615,(xx)(yy)39 69x 64y l2)计算)计算r 统计量统计量22()()()()390.55874 66xySPxxyyrSSSSxxyy二、相关系数的显著性检验二、相关系数的显著性检验l1 1、t t 检验检验l统计假设统计假设 H0:0;HA:0l统计量统计量lr 的标准误:的标准误:l当当H0:0成立时,检验统计量成立时,检验统计量212rrsn(2)rrtt ns l判断:判断:给定显著性水平给定显著性水平,将,将|t|与与t(n2)
27、进行比较,即可作出进行比较,即可作出r 是否显著的结论。是否显著的结论。l2 2、利用、利用r r 和和R R 的相关系数表的相关系数表进行检验进行检验l将统计量将统计量t 变形,可得:变形,可得:l将将t(n2)代入上式,计算出)代入上式,计算出|r|的临界值的临界值r(n2),制作为,制作为“r和和R的相关系数表的相关系数表”。22trtnl将计算所得的将计算所得的|r|直接与临界值直接与临界值r(n2)进进行比较,也可以作出行比较,也可以作出r是否显著的结论。是否显著的结论。l若:若:|r|r(n2)l则:则:r 值在值在水平上显著水平上显著【实例实例】l试检验试检验【例例6.3】中相关
28、系数中相关系数r0.558的显的显著性。著性。l解:查表得解:查表得l由于由于 l所以,接受零假设所以,接受零假设H0:0,即样本的,即样本的相关系数相关系数r 不显著。不显著。0.05(9)0.602r0.050.5580.602(9)rr三、三、相关与回归的关系相关与回归的关系 l1 1、相关与回归的关系、相关与回归的关系l(1)从检验结果,即数量上从检验结果,即数量上,b 与与r 有着密切的联系,表现出一致性。对有着密切的联系,表现出一致性。对b 与与r 的显著性检验,其实质是完全相同的显著性检验,其实质是完全相同的,的,b 显著,则显著,则r 必显著;反之亦然。必显著;反之亦然。l(2
29、)从相关关系与回归关系的区别来看从相关关系与回归关系的区别来看l若若自变量为固定变量自变量为固定变量,则两变量间可进,则两变量间可进行回归分析,而相关系数没有任何几何行回归分析,而相关系数没有任何几何意义,意义,r 仅可用来间接反映回归方程的仅可用来间接反映回归方程的显著程度,即表示回归曲线与观测数据显著程度,即表示回归曲线与观测数据的吻合程度。的吻合程度。l如果如果两个变量均为随机变量两个变量均为随机变量,则相关系,则相关系数与回归系数均存在,这时两种关系的数与回归系数均存在,这时两种关系的显著性才是真正一致的。显著性才是真正一致的。|r|大时,回归大时,回归方程显著,且变量间线性相关关系密
30、切;方程显著,且变量间线性相关关系密切;当当|r|小时,则回归方程不显著,变量间小时,则回归方程不显著,变量间线性相关关系松懈。线性相关关系松懈。l2 2、决定系数、决定系数l如果仅考虑回归方程与观测数据的接近如果仅考虑回归方程与观测数据的接近程度,即回归方程对数据拟合的优劣,程度,即回归方程对数据拟合的优劣,那么决定系数提供了一个很好的度量,那么决定系数提供了一个很好的度量,可以避免将相关与回归混淆。可以避免将相关与回归混淆。l决定系数决定系数 l两变量均为随机变量即存在相关关系时,两变量均为随机变量即存在相关关系时,r2 的大小也反映了变量间的相关程度的的大小也反映了变量间的相关程度的大小
31、,但不能反映出相关性质(正相关大小,但不能反映出相关性质(正相关与负相关)。与负相关)。22RxyyySSSPb SPrSSSSSSSS第四节第四节 一元非线性回归(一元非线性回归(可可直线化的曲线回归直线化的曲线回归 )l【讲授内容讲授内容】l非线形回归及曲线类型的选择非线形回归及曲线类型的选择l常用曲线方程的线性化方法常用曲线方程的线性化方法 l非线形回归方程拟合情况的比较非线形回归方程拟合情况的比较一、非线形回归及曲线类型的选择一、非线形回归及曲线类型的选择 l1、非线性回归非线性回归(nonlinear regression)l在许多情况下,因变量与自变量之间的函在许多情况下,因变量与
32、自变量之间的函数关系不能用简单的回归直线来表述,采数关系不能用简单的回归直线来表述,采用适当的曲线方程往往更符合总体间的实用适当的曲线方程往往更符合总体间的实际关系,这就是所谓的非线性回归或曲线际关系,这就是所谓的非线性回归或曲线回归(回归(curvilinear regression)。)。l一元非线性回归一元非线性回归:只有一个自变量的非线:只有一个自变量的非线性回归。性回归。l2 2、曲线类型的选择方法、曲线类型的选择方法l选用正确、合适的曲线类型,是非线性选用正确、合适的曲线类型,是非线性回归的回归的关键关键。曲线类型的确定方式可以。曲线类型的确定方式可以是理论的,也可以是经验的。是理
33、论的,也可以是经验的。l(1 1)理论法(经验法)理论法(经验法)l根据专业知识或前人的经验选用合适的回根据专业知识或前人的经验选用合适的回归方程。归方程。l根据已知理论确定曲线类型虽是最理想的根据已知理论确定曲线类型虽是最理想的选择,但是,如果不考虑已知理论的应用选择,但是,如果不考虑已知理论的应用对象和条件而盲目照搬,将会造成错误的对象和条件而盲目照搬,将会造成错误的结论。结论。l(2)图示法)图示法 l描出(描出(xi,yi)的散点图,根据散点的变)的散点图,根据散点的变化趋势画出趋势线,并对照曲线图谱来选化趋势画出趋势线,并对照曲线图谱来选用合适的曲线类型。用合适的曲线类型。l(3 3
34、)拟合比较法)拟合比较法l如果采用图示法时遇到几种曲线形式与试如果采用图示法时遇到几种曲线形式与试验数据较接近,则可同时选择多个曲线方验数据较接近,则可同时选择多个曲线方程,求出回归系数后,再比较各个回归方程,求出回归系数后,再比较各个回归方程的拟合情况,从中选出拟合情况较好的程的拟合情况,从中选出拟合情况较好的回归方程作为所求的一元非线性回归方程。回归方程作为所求的一元非线性回归方程。二、常用曲线方程的线性化方法二、常用曲线方程的线性化方法 l“线性化线性化”是建立非线性回归方程的方法之一。是建立非线性回归方程的方法之一。一元非线性回归方程一元非线性回归方程直线形式直线形式(线性回归方程线性
35、回归方程)配合线性回归方程配合线性回归方程转换为转换为变量变换变量变换(一)(一)直接引入新变量直接引入新变量 l这一类非线性回归方程这一类非线性回归方程“线性化线性化”后,回后,回归系数没有变化,线性回归方程的系数也归系数没有变化,线性回归方程的系数也是非线性回归方程的系数。是非线性回归方程的系数。l1 1、抛物线、抛物线l令:令:l可化为:可化为:2 yabx2xx yabx0b 0b yx0 l2 2、型曲线型曲线l令:令:l可化为:可化为:1 yabx1yy yabx 0b0b xy0l3 3、双曲线(、双曲线(1 1)l l令:令:l可化为:可化为:byax1xx yabx00abx
36、y00,0abxy0l3 3、双曲线(、双曲线(2 2)l l令:令:l可化为:可化为:1()bxayyxaxb或或11xxyy yabx0b xy00b xy0l(4 4)对数函数曲线)对数函数曲线l l令:令:l可化为:可化为:lgyabx lnyabx(或或)lgxx yabx0b0b x0y(二)(二)原方程经过数学变换后再引入原方程经过数学变换后再引入新变量新变量 l这类曲线方程需要这类曲线方程需要“改变形式改变形式”后才可以后才可以线性化为线性方程。但是线性化为线性方程。但是“线性化线性化”前后前后两个方程的回归系数有变化,由线性回归两个方程的回归系数有变化,由线性回归方程的系数易
37、于求出非线性回归方程的系方程的系数易于求出非线性回归方程的系数。数。l1 1、指数函数曲线、指数函数曲线 l(1 1)bxyae0b 0b x0yl1 1、指数函数曲线、指数函数曲线 l(2 2)b xyae0b xy0a0b xy0al2 2、幂函数曲线、幂函数曲线 byax1b 1b 01baxy010b axy01l3 3、LogisticLogistic生长曲线生长曲线11a bxbxKKyeae 或或 Kxy0三、非线形回归方程拟合情况的比较三、非线形回归方程拟合情况的比较 l1 1、非线性回归的剩余平方和、非线性回归的剩余平方和li1,2,n l其中其中 来自非线性方程来自非线性方
38、程 2iiiQyyiyl2 2、非线性关系的相关指数、非线性关系的相关指数l非线性关系的非线性关系的相关指数相关指数 的大小与非线的大小与非线性回归方程性回归方程“线性化线性化”以后所得线性回归以后所得线性回归方程的方程的决定系数决定系数r2 的大小的大小并非总是一致的并非总是一致的。222()11()iiiyiiyyQRSSyy2Rlr r2 2 与与 的适用范围的适用范围l决定系数决定系数r2 适用于适用于线性回归线性回归的情况,反映的情况,反映线性回归方程拟合情况的优劣。线性回归方程拟合情况的优劣。l相关指数相关指数 适用于适用于非线性回归非线性回归的情况,的情况,反映了非线性回归方程拟
39、合的好坏。反映了非线性回归方程拟合的好坏。2R2Rl在多个一元非线性回归方程中,与观测值在多个一元非线性回归方程中,与观测值拟合情况较好的回归方程,其剩余平方和拟合情况较好的回归方程,其剩余平方和较小,相关指数较大。较小,相关指数较大。l【例例】假设变量假设变量x 与与y 的的9 组观测值如组观测值如下表所示。试选用多个一元非线性回归下表所示。试选用多个一元非线性回归方程进行拟合,并比较各个回归方程的方程进行拟合,并比较各个回归方程的拟合情况。拟合情况。i123456789xi123446688yi1.85 1.37 1.02 0.75 0.56 0.41 0.31 0.23 0.17l散点图
40、0123456789x0.00.20.40.60.81.01.21.41.61.82.0yl双曲线0123456789x-5051015202530354045yy.115925+1.92915/x Q0.282636386R0.944494312l幂函数0123456789x-202468101214161820222426yy1.98076 x0.81629 Q0.220066088R0.9570596930123456789x0.00.20.40.60.81.01.21.41.61.82.02.22.42.62.8yy2.5961 e0.32913 x Q0.032346580R0.99
41、3804707l指数曲线0123456789x-0.50.00.51.01.52.02.53.03.54.04.55.0yy1.869620.82528 ln(x)Q0.049921519R0.990422357l对数曲线本章复习思考题本章复习思考题l什么叫回归分析?其主要研究目的是什么?什么叫回归分析?其主要研究目的是什么?l什么叫相关分析?其主要研究目的是什么?什么叫相关分析?其主要研究目的是什么?l回归分析和相关分析之间的主要差别是什么?回归分析和相关分析之间的主要差别是什么?线性回归分析与线性相关分析之间有何联系?线性回归分析与线性相关分析之间有何联系?本章复习思考题本章复习思考题l一
42、元线性回归方程建立的基本原理是什么?一元线性回归方程建立的基本原理是什么?一元回归分析的基本方法和步骤是什么?一一元回归分析的基本方法和步骤是什么?一元回归方程显著性检验的实质是什么?常用元回归方程显著性检验的实质是什么?常用的显著性检验方法有哪几种?的显著性检验方法有哪几种?l相关系数和决定系数有何联系?它们分别有相关系数和决定系数有何联系?它们分别有何意义和实际用途?何意义和实际用途?本章复习思考题本章复习思考题l如何确定两个变量之间的曲线类型?可直线如何确定两个变量之间的曲线类型?可直线化的非线性回归分析的基本步骤是什么?化的非线性回归分析的基本步骤是什么?l非线性回归方程的显著性检验方法有哪些?非线性回归方程的显著性检验方法有哪些?能否用线性化的直线方程的相关系数来比较能否用线性化的直线方程的相关系数来比较非线形回归方程的拟合情况?为什么?非线形回归方程的拟合情况?为什么?