第四章相关分析和回归分析修改课件.ppt

上传人(卖家):晟晟文业 文档编号:4891510 上传时间:2023-01-22 格式:PPT 页数:81 大小:1.05MB
下载 相关 举报
第四章相关分析和回归分析修改课件.ppt_第1页
第1页 / 共81页
第四章相关分析和回归分析修改课件.ppt_第2页
第2页 / 共81页
第四章相关分析和回归分析修改课件.ppt_第3页
第3页 / 共81页
第四章相关分析和回归分析修改课件.ppt_第4页
第4页 / 共81页
第四章相关分析和回归分析修改课件.ppt_第5页
第5页 / 共81页
点击查看更多>>
资源描述

1、2023-1-221第四章第四章 相关分析和回归分析相关分析和回归分析.2023-1-222相关分析和回归分析相关分析和回归分析第一节第一节 地理要素间的地理要素间的相关分析相关分析第二节第二节 地理要素间的地理要素间的回归分析回归分析.32023-1-22一一 相关分析的概念相关分析的概念二二 地理要素的相关类型地理要素的相关类型三三 相关程度的程度方法及显相关程度的程度方法及显著性检验著性检验 第一节第一节 地理要素间的地理要素间的相关分析相关分析.42023-1-22一一 相关分析的概念相关分析的概念就是测度各个变量之间的关系就是测度各个变量之间的关系密切程度的数学方法。密切程度的数学方

2、法。相关分析仅限于测定两个或两个以相关分析仅限于测定两个或两个以上变量具有相关关系者,其主要目的在上变量具有相关关系者,其主要目的在于计算出表示两个或两个以上变量间相于计算出表示两个或两个以上变量间相关程度和性质。关程度和性质。.2023-1-225 所谓地理相关所谓地理相关,就是运用相关分析法来研究各地理要素间的相互关系和联系强度的一种度量指标。.2023-1-226n为了研究父亲与成年儿子为了研究父亲与成年儿子身高之间的关系,卡尔身高之间的关系,卡尔.皮皮尔逊测量了尔逊测量了1078对父子对父子的身高。把的身高。把1078对数字对数字表示在坐标上,如图。表示在坐标上,如图。n它的形状象一块

3、橄榄状的它的形状象一块橄榄状的云,中间的点密集,边沿云,中间的点密集,边沿的点稀少,其主要部分是的点稀少,其主要部分是一个椭圆。一个椭圆。.2023-1-227正相关 负相关 完全正相关 完全负相关 零相关.2023-1-228二二 地理要素间的相关类型地理要素间的相关类型曲线相关(非线性相关)曲线相关(非线性相关)按变量按变量 多少多少两个变量两个变量两个以上两个以上 变量变量直线相关(线性相关)直线相关(线性相关)复相关复相关偏相关偏相关按质量按质量等级相关(顺序相关)等级相关(顺序相关)品质相关品质相关.2023-1-229 三三 相关程度的测度方法相关程度的测度方法及显著性检验及显著性

4、检验由于地理相关类型各不相同,因此测度的方法也不同。由于地理相关类型各不相同,因此测度的方法也不同。(一)线性相关程度的测度(一)线性相关程度的测度所谓所谓相关程度相关程度,就是研究它们之间的相互关系是否密切。,就是研究它们之间的相互关系是否密切。所谓所谓相关方向相关方向,又可以分两种,即正相关和负相关。,又可以分两种,即正相关和负相关。用来测度直线相关程度和方向的指标就是相关系数。用来测度直线相关程度和方向的指标就是相关系数。.2023-1-22101、常用的相关系数的计算公式及检验、常用的相关系数的计算公式及检验niniiiniiiyyxxyyxxr11221)(*)()((1)相关系数的

5、性质)相关系数的性质相关系数的分布范围,介于相关系数的分布范围,介于-1-1和和+1+1之间之间当相关系数为正值时,表示两个要素(或变数)之间呈正相当相关系数为正值时,表示两个要素(或变数)之间呈正相关,相关系数为负值时,表示两个要素(或变数)之间为负相关;关,相关系数为负值时,表示两个要素(或变数)之间为负相关;相关系数的绝对值越大。表示两个要素间相关程度越密切。相关系数的绝对值越大。表示两个要素间相关程度越密切。当r=+1时,为完全正相关。R=-1时,为完全负相关;r=0则完全无关。.2023-1-2211 相关系数是根据要素之间的样本值计算出来相关系数是根据要素之间的样本值计算出来的,它

6、随着样本数的多少或取样方式的不同而不的,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。通过检验,才能知道它的可信度。(2)相关系数的显著性检验)相关系数的显著性检验 一般情况下,相关系数的检验,是在给定的一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系数检验的临界值表来置信水平下,通过查相关系数检验的临界值表来完成的。完成的。.2023-1-2212检验相关系数检验相关系数=0的临界值(的临界值(ra)表表prra=f f值称为自由度,值称为自由度,其数值为其数值为f=n-2

7、f=n-2,这里这里n n为样本数为样本数a a代表不同的代表不同的显著性水平显著性水平表内的数值表内的数值代表不同的代表不同的置信水平下置信水平下相关系数相关系数=0=0的临界的临界值,值,即即ra公式公式p=p=r rrara=a=a的意的意思是当所计算的相关系数思是当所计算的相关系数r r的的绝对值大于在绝对值大于在a a水平下的临界水平下的临界值值rara时,两要素不相关(即时,两要素不相关(即=0)=0)的可能性只有的可能性只有a a。.2023-1-2213相关系数相关系数r的具体检验方法步骤如下:的具体检验方法步骤如下:(1)计算相关系数)计算相关系数r(2)给定显著水平)给定显

8、著水平,按按n-2查相关系数临界值,查相关系数临界值,查出相应的临界值查出相应的临界值(3)比较)比较r的绝对值与临界值的大小。当的绝对值与临界值的大小。当r的绝的绝对值大于或等于临界值时,说明两变量在对值大于或等于临界值时,说明两变量在水平水平上达到显著性;若小于临界值,则说明两变量没上达到显著性;若小于临界值,则说明两变量没有达到所要求的精度。有达到所要求的精度。如果仍需研究二者的关系如果仍需研究二者的关系,可考虑降低精度,即修改显著性水平,可考虑降低精度,即修改显著性水平、相关系数的显著性检验步骤相关系数的显著性检验步骤.2023-1-22142、等级相关系数的计算公式及检验、等级相关系

9、数的计算公式及检验表示两个变量顺序间直线相关程度和方向表示两个变量顺序间直线相关程度和方向的系数,称为等级(或顺序)相关系数。等级的系数,称为等级(或顺序)相关系数。等级相关系数不仅适用于数量指标的相关分析,同相关系数不仅适用于数量指标的相关分析,同时亦适用于质量指标的相关分析。时亦适用于质量指标的相关分析。等级相关系数,又称顺序相关系数是将两等级相关系数,又称顺序相关系数是将两要素的样本值按数值的大小顺序排列位次,以要素的样本值按数值的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一各要素样本值的位次代替实际数据而求得的一种统计量。实际上,它是位次分析方法的数量种统计量。实际上,

10、它是位次分析方法的数量化。化。.2023-1-2215(1)等级相关系数的计算公式)等级相关系数的计算公式)1(*6121512nndRiid.2023-1-2216(2)等级相关系数的计算及检验)等级相关系数的计算及检验1985年全国各省(市,区年全国各省(市,区)总人口与社会总产值总人口与社会总产值.2023-1-2217.2023-1-2218即:总人口(即:总人口(x)x)与社会总产值(与社会总产值(y)y)的等级相关系的等级相关系数为数为0.7260.726.2023-1-2219等级相关系数检验的临界值等级相关系数检验的临界值.2023-1-2220在上例中,在上例中,n=29n=

11、29,表中没有给出相应的样本数,表中没有给出相应的样本数下的临界值下的临界值rara,但我们发现,在同一显著水平,但我们发现,在同一显著水平下,随着样本数的增大,临界值下,随着样本数的增大,临界值rara减少。在减少。在n=2 8n=2 8 时,查 表 可 知:时,查 表 可 知:r 0.0 5=0.3 1 7r 0.0 5=0.3 1 7,r0.01=0.448r0.01=0.448,由于,由于rxy=0.726rxy=0.726r0.01=0.448r0.01=0.448,故故rxyrxy在在a=0.01a=0.01的置信水平上是显著的。的置信水平上是显著的。等级相关系数检验结果等级相关系

12、数检验结果.2023-1-2221(二)简单非线性相关程度的测度(见课本)(二)简单非线性相关程度的测度(见课本)(三)(三)多要素间相关程度的测定多要素间相关程度的测定1.偏相关系数的计算与检验偏相关系数的计算与检验 在多要素所构成的地理系统中,当我们研究在多要素所构成的地理系统中,当我们研究某一个要素对另一个要素的影响或相关程度时,某一个要素对另一个要素的影响或相关程度时,把其它要素的影响视为常数(保持不变把其它要素的影响视为常数(保持不变),即,即暂不考虑其它要素的影响,而单独研究那两个暂不考虑其它要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,则称为偏要素之间的相互关系的密

13、切程度时,则称为偏相关。用以度量偏相关程度的统计量,称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。相关系数。.2023-1-2222624C当研究当研究2 2个相关变量个相关变量x1x1、x2x2的关系时的关系时,用直线相关,用直线相关系数系数r12r12表示表示x1x1与与x2x2线性相关的性质与程度。此时固定的线性相关的性质与程度。此时固定的变量个数为变量个数为0 0,所以直线相关系数,所以直线相关系数r12r12又叫做零级偏相关系又叫做零级偏相关系数。数。当研究当研究3 3个相关变量个相关变量x1x1、x2x2、x3x3的相关时的相关时,我们把我们把x3x3保持固定不变,保持固

14、定不变,x1x1与与x2x2的相关系数称为的相关系数称为x1x1与与x2x2的偏相关的偏相关系数,记为系数,记为r12.3r12.3,类似地,还有偏相关系数,类似地,还有偏相关系数r13.2r13.2、r23.1r23.1。这。这3 3个偏相关系数固定的变量个数为个偏相关系数固定的变量个数为1 1,所以都叫,所以都叫做一级偏相关系数。做一级偏相关系数。当研究当研究4 4个相关变量个相关变量x1x1、x2x2、x3x3、x4x4的相关时的相关时,须将其中的须将其中的2 2个变量固定不变,研究另外两个变量间的相个变量固定不变,研究另外两个变量间的相关。即此时只有二级偏相关系数才真实地反映两个相关变

15、关。即此时只有二级偏相关系数才真实地反映两个相关变量间线性相关的性质与程度。二级偏相关系数共有量间线性相关的性质与程度。二级偏相关系数共有6 6个:个:r12.34r12.34,r13.24r13.24,r14.23r14.23,r23.14r23.14,r24.13r24.13,r34.12r34.12。.2023-1-2223624C2/)1(2mmCm一般,当研究一般,当研究m个相关变量个相关变量x1、x2、xm的的相关时,只有将其中的相关时,只有将其中的m-2个变量保持固定不变,个变量保持固定不变,研究另外两个变量的相关才能真实地反映这两个研究另外两个变量的相关才能真实地反映这两个相关

16、变量间的相关,即此时只有相关变量间的相关,即此时只有m-2级偏相关系数级偏相关系数才真实地反映了这两个相关变量间线性相关的性才真实地反映了这两个相关变量间线性相关的性质与程度。质与程度。m-2级偏相关系数共有级偏相关系数共有个。个。xi与与xj的的m-2级偏相关系数记为级偏相关系数记为rij.(i,j=1,2,m,ij)。.2023-1-2224.2023-1-2225式(式(5)(7)表示三个偏表示三个偏相关系数,相关系数,称为一级偏称为一级偏相关系数。相关系数。.2023-1-2226在式(在式(8)8)中,中,r1234r1234表示在表示在x3x3和和x4x4保持不变保持不变的条件,的

17、条件,x1x1和和x2x2的偏相的偏相关系数。关系数。.2023-1-2227.2023-1-2228.2023-1-2229.2023-1-2230偏相关系数具有下述性质:偏相关系数具有下述性质:(1)偏相关系数分布的范围在偏相关系数分布的范围在-1到到1之间,譬如,固定之间,譬如,固定X3,则则X1与与X2间的偏相关系数满足间的偏相关系数满足-1r1231。当。当r123为正为正值时,表示在值时,表示在X3固定时,固定时,X1与与X2之间为正相关;当之间为正相关;当r123为负值时,表示在为负值时,表示在X3固定时,固定时,X1与与X2之间为负相关。之间为负相关。(2)偏相关系数的绝对值越

18、大,表示其偏相关程度越大。偏相关系数的绝对值越大,表示其偏相关程度越大。例如,例如,r123=1,则表示当,则表示当X3固定时,固定时,X1与与X2之间之间完全相关;当完全相关;当r123=0时,表示当时,表示当X3固定时,固定时,X1与与X2之间完全无关。之间完全无关。(3)偏相关系数的绝对值必小于或最多等于由同一系列资偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数,即料所求得的复相关系数,即R123r123。.2023-1-2231偏相关系数的显著性检验偏相关系数的显著性检验偏相关系数的显著性检验,一般采用偏相关系数的显著性检验,一般采用t-检验法。检验法。其统计量计算

19、公式为其统计量计算公式为在(在(15)15)式中,式中,r1234mr1234m为偏相关系数,为偏相关系数,n n为为样本数,样本数,m m为自变量个数。为自变量个数。.2023-1-2232对于前述计算得到的偏相关系数对于前述计算得到的偏相关系数r2413=0.821,由于由于n=23,m=3,故,故查查t分布表,可得出不同显著水平上的临界值分布表,可得出不同显著水平上的临界值ta,若若tt。则表示偏相关显著;反之,。则表示偏相关显著;反之,tta,则偏,则偏相关不显著。在自由度为相关不显著。在自由度为23-3-1=19时,查表得时,查表得t0.001=3.883,所以,所以tta,这表明在

20、置信度水平,这表明在置信度水平a=0.001上,偏相关系数上,偏相关系数r2413是显著的。是显著的。2.复相关系数的计算与检验(看课本)复相关系数的计算与检验(看课本).2023-1-22332.2.复相关系数的计算与检验复相关系数的计算与检验 复相关系数:反映几个要素与某一复相关系数:反映几个要素与某一个要素之间的复相关程度个要素之间的复相关程度 。复相关系数的计算复相关系数的计算 当有两个自变量时当有两个自变量时 当有三个自变量时当有三个自变量时)1)(1(11.221212.yyyrrR)1)(1)(1(112.321.2212123.yyyyrrrR.2023-1-2234当有当有k

21、个自变量时个自变量时)1)1)(1(1)1.(12.21.2212.12.kykyykyrrrR复相关系数的性质复相关系数的性质 复相关系数介于复相关系数介于0到到1之间,即之间,即1012.kyR.2023-1-2235 复相关系数越大,则表明要素(变量)之间复相关系数越大,则表明要素(变量)之间的相关程度越密切。复相关系数为的相关程度越密切。复相关系数为1,表示完,表示完全相关;复相关系数为全相关;复相关系数为0,表示完全无关。,表示完全无关。复相关系数必大于或至少等于单相关系数的复相关系数必大于或至少等于单相关系数的绝对值。绝对值。复相关系数的显著性检验复相关系数的显著性检验 F检验法。

22、其统计量计算公式为检验法。其统计量计算公式为kknRRFkyky11212.212.2023-1-2236例题:在上例中,若以例题:在上例中,若以x4 4为因变量,为因变量,x1 1,x2 2,x3 3为自变量,试计算为自变量,试计算x4 4与与x1 1,x2 2,x3 3之间的复相之间的复相关系数。关系数。解:按照公式(解:按照公式(3.1.16)计算)计算 检验:检验:,故复相关达到,故复相关达到了极显著水平。了极显著水平。974.0337.01)(956.01)(579.01(1)1)(1)(1(1222212.4321.42241123.4)rrrR3010.57190.12001.0

23、FF.2023-1-2237一一 回归分析的意义及其作用回归分析的意义及其作用二二 一元回归模型的建立一元回归模型的建立三三 多元回归模型多元回归模型四四 非线性回归模型非线性回归模型第二节第二节 地理要素间的地理要素间的相关分析相关分析.2023-1-2238一一 回归分析的意义及其作用回归分析的意义及其作用(一)回归分析的概念(一)回归分析的概念 就是对具有相互联系的要素,根据其就是对具有相互联系的要素,根据其联系的形态,选择一个合适的数学模式,联系的形态,选择一个合适的数学模式,用来近似地表达要素间平均变化关系。用来近似地表达要素间平均变化关系。这个数学模式称为回归模型(回归方程)这个数

24、学模式称为回归模型(回归方程).2023-1-2239 相关关系的变量之间尽管没有确定性的关系,但在大量数据相关关系的变量之间尽管没有确定性的关系,但在大量数据条件下,条件下,从一定的统计意义上来看,它们之间可能存在某种类型从一定的统计意义上来看,它们之间可能存在某种类型的函数关系,因此可以借助函数关系的数学表达式来表达。的函数关系,因此可以借助函数关系的数学表达式来表达。变量之间的函数关系,从理论上说是完全精确的函数关系。变量之间的函数关系,从理论上说是完全精确的函数关系。回归分析和相关分析都是研究和处理变量之间具有相关关系的回归分析和相关分析都是研究和处理变量之间具有相关关系的一种数理统计

25、方法。它们之间既有联系,又有区别。一种数理统计方法。它们之间既有联系,又有区别。(1)研究对象和内容是相同的,相关分析主要研究变量之间的密)研究对象和内容是相同的,相关分析主要研究变量之间的密切程度,并没有严格的自变量和因变量之分。切程度,并没有严格的自变量和因变量之分。(2)而回归分析则主要研究变量之间联系的数学表达式,因而有)而回归分析则主要研究变量之间联系的数学表达式,因而有自变量和因变量之分,从而就可以由自变量的取值来预测,因而回自变量和因变量之分,从而就可以由自变量的取值来预测,因而回归分析具有预测的功能。归分析具有预测的功能。应当注意:应当注意:.2023-1-2240(二)回归分

26、析研究的主要内容二)回归分析研究的主要内容 从一组地理数据出发,确定这些要素(变量)从一组地理数据出发,确定这些要素(变量)间的定量数学表达式,即回归模型。间的定量数学表达式,即回归模型。根据一个或几个要素(自变量)的值来预测根据一个或几个要素(自变量)的值来预测或控制另一个要素(因变量)的取值。或控制另一个要素(因变量)的取值。从影响某一地理过程中的许多要素中,找出从影响某一地理过程中的许多要素中,找出哪些要素(变量)是主要的,哪些因素是次要的,哪些要素(变量)是主要的,哪些因素是次要的,这些要素之间又有什么联系。这些要素之间又有什么联系。回归分析研究的地理数学模型,依要素(变量)回归分析研

27、究的地理数学模型,依要素(变量)的多少可分为一元地理回归模型和多元地理回归模的多少可分为一元地理回归模型和多元地理回归模型型。.2023-1-2241 二二 一元回归模型的建立一元回归模型的建立 一元地理回归所处理的问题,是要解决两个要素(变量)之间的定量关系。有的是线性关系,有的是非线性关系。因此判断研究的变量之间的线性与非线性归属问题是非常重要的。.2023-1-2242(一)一元回归模型类型的判断方法(一)一元回归模型类型的判断方法 作图法、作图法、差分法、曲度法和计算器法等。y=0.4734x+0.4241R2=0.86220246810120246810121416182022242

28、6工业总产值货运量.2023-1-2243(二)一元线性地理回归模型的建立(二)一元线性地理回归模型的建立定义:假设有两个地理要素(变量)定义:假设有两个地理要素(变量)x 和和y,x为自变量,为自变量,y为因变量。则一元线性回归模型为因变量。则一元线性回归模型的基本结构形式为的基本结构形式为式中:式中:a和和b为待定参数;为待定参数;为各组观测数为各组观测数据的下标;据的下标;为随机变量。为随机变量。iiibxay n,1,2,ii.2023-1-2244 记记 和和 分别为参数分别为参数a与与b的拟合值,的拟合值,则则一元线性回归模型为一元线性回归模型为 上式代表上式代表x与与y之间相关关

29、系的拟合直线,之间相关关系的拟合直线,称为回归直线;称为回归直线;是是y的估计值,亦称回归值。的估计值,亦称回归值。a bxbayy.2023-1-2245 参数a与b的最小二乘拟合原则要求yi与 的误差ei的平方和达到最小,即niiininiiiibxayyyeQ121122min)()(niiiiniiixbxaybxay110)(0)(iy 1 1、参数、参数a、b的最小二乘估计的最小二乘估计 根据取极值的必要条件,有.2023-1-2246niiniiixxxyxxyyxxLLb121)()(xbya2112111)(1)(1niiniininiiniiiixnxyxnyx 解上述正规

30、方程组式,得到参数a与b的拟合值.2023-1-2247以课本的例子为例以课本的例子为例(手算)手算)2 2、具体计算方法、具体计算方法(1 1)将原始数据根据需要列表)将原始数据根据需要列表(2 2)根据公式计算)根据公式计算b b(3 3)计算)计算a a(4 4)写出回归模型)写出回归模型(5 5)一般情况下还要求出相关系数)一般情况下还要求出相关系数.2023-1-2248用用ExcelExcel建立回归模型及其进行预测建立回归模型及其进行预测(1 1)确定变量,建立数据库)确定变量,建立数据库(2 2)作图,选择散点图)作图,选择散点图(3 3)图完成后,点击图表,然后点击)图完成后

31、,点击图表,然后点击添加趋势线,选择线性方程;然后点击添加趋势线,选择线性方程;然后点击选项,在选项栏中点中显示公式和相关选项,在选项栏中点中显示公式和相关系数的平方。系数的平方。.2023-1-2249(4 4)对图进行修饰)对图进行修饰(5 5)利用建立的回归方程,可以对原)利用建立的回归方程,可以对原始数据进行递推,检验误差;同时可以始数据进行递推,检验误差;同时可以对未来的趋势进行预测。对未来的趋势进行预测。用用ExcelExcel建立回归模型及其进行预测建立回归模型及其进行预测.2023-1-2250年份 耕地面积 年份 耕地面积 1985 4604.03 1990 4557.86

32、1986 4590.79 1991 4549.97 1987 4579.81 1992 4521.77 1988 4568.84 1993 4495.66 1989 4562.32 1994 4464.00 江苏省江苏省1985198519941994年耕地面积年耕地面积利用所给数据:利用所给数据:(1 1)建立江苏省耕地面积与时间的回归模型)建立江苏省耕地面积与时间的回归模型(2 2)计算耕地面积与时间的相关系数)计算耕地面积与时间的相关系数(3 3)并预测)并预测20102010年江苏耕地面积年江苏耕地面积.2023-1-2251y=-13.803x+32010R2=0.914744404

33、460448045004520454045604580460046201984198619881990199219941996耕地面积(千公顷)耕地面积线性(耕地面积)32010803.13xy 将将20102010带入上述方程中,可以求得带入上述方程中,可以求得20102010年年江苏省耕地面积江苏省耕地面积.2023-1-2252 方法:方法:F F 检验法。检验法。总的离差平方和:在回归分析中,表示总的离差平方和:在回归分析中,表示y y的的n n次次观测值之间的差异,记为观测值之间的差异,记为 可以证明可以证明niiyyyyLS12)(总niiyyyyLS12)(总niniiiiUQy

34、yyy1122)()(3、一元线性回归模型的显著性检验、一元线性回归模型的显著性检验.2023-1-2253 在上式中,在上式中,Q称为误差平方和,或剩余平方和称为误差平方和,或剩余平方和 而而 称为回归平方和。称为回归平方和。niiiyyQ12)(xyxxniiniiniiibLLbxxbxbabxayyU21221212)()()(.2023-1-2254 统计量F F越大,模型的效果越佳。统计量FF(1,n-2)。在显著水平下,若FF,则认为回归方程效果在此水平下显著。一般地,当FF0.10(1,n-2)时,则认为方程效果不明显。2nQUF.2023-1-2255变差来源平方和自由度方差

35、F回归(因素回归(因素x x)1S2uU/1剩余(随机因剩余(随机因素)素)n2S2QQ/n-2总和总和n-121)(yyUnii21)(iniiyyQ21)(yylSiniyy总)2/(1/nQUF.2023-1-22564、利用回归模型进行预测、利用回归模型进行预测 对所建立的回归模型经过检验效果显著时,便可以利用回归模型进行地理预测。所谓地理预测就是利用建立的回归模型,在给出一定信度条件下,求出在 的水平上预测y值的出现范围(或预测区间)。具体例子见课本。具体例子见课本。.2023-1-2257三、多元线性回归模型回归模型的建立回归模型的建立 多元线性回归模型的结构形式为 aakaaax

36、xxyk22110 式中:为待定参数;为随机变量。k,10a.2023-1-2258 回归方程:如果 分别为上式中 的拟和值,则回归方程为 在上式中,b0为常数,b1,b2,bk称为偏回归系数。偏回归系数的意义是,当其他自变量都固定时,自变量 每变化一个单位而使因变量平均改变的数值。kkxbxbxbby22110kbbb,10k,210ix.2023-1-2259 偏回归系数的推导过程:根据最小二乘法原理,的估计值 应该使 由求极值的必要条件得 方程组式经展开整理后得 min)()(122211012nakakaaanaaaxbxbxbbyyyQ),2,1(0)(20)(2110kjxyybQ

37、yybQnajaaajnaaa),2,1,0(kii)(k,1,2,0iib.2023-1-2260 方程组式称为正规方程组。引入矩阵nanaakanakkanakaakaanakananaaanakkaanaaaanaananaaanakkaanaaanaananaanakkanaaayxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxybxbxbxnb11122121101112122122121012111112121121011111212110)(.)()()()()()()()()()()()()()(.2023-1-2261knnnkkxxxxxxxxxxxx

38、X2132313222121k211111.11knnnkkkknkkknnTxxxxxxxxxxxxxxxxxxxxxxxxXXA213231322212121113212232221113121111111111.2023-1-2262nakanakaanakaanakanakaanaanaaanaanakaanaaananaanakanaanaaxxxxxxxxxxxxxxxxxxxxxn12121111212212112111211211111211nyyyY21nbbbbb210.2023-1-2263 则正规方程组式可以进一步写成矩阵形式BAb naakanaaanaaanaank

39、nkkknnTyyyxyxyyyyyxxxxxxxxxxxxYXB112111321321223222111312111111.2023-1-2264求解得引入记号 YXXXBAbTT11)(najjiiajiijxxxxLL1)(naaiiaiyyyxxL1)(),2,1,(kji),2,1(ki.2023-1-2265正规方程组也可以写成kkkykkkkkykkykkxbxbxbybLbLbLbLLbLbLbLLbLbLbL2211022112222212111212111)51.2.3(.2023-1-2266n回归模型的显著性检验回归模型的显著性检验 回归平方和U与剩余平方和Q:回归平

40、方和 剩余平方和为 F统计量为 计算出来F之后,可以查F分布表对模型进行显著性检验。k21x,x,xQULSyy总nanaiyiLbyyU112)(nayyaaULyyQ12)()1/(/knQkUF.2023-1-2267四四 非线性回归模型的建立非线性回归模型的建立 在许多实际地理问题中,有时变量之在许多实际地理问题中,有时变量之间的关系并不是线性的,而是某种非线间的关系并不是线性的,而是某种非线性,这时就需要选配适当类型的曲线,性,这时就需要选配适当类型的曲线,近似地表达两要素之间的平均变化关系。近似地表达两要素之间的平均变化关系。.2023-1-2268非线性关系线性化的几种情况非线性

41、关系线性化的几种情况对于指数曲线 ,令 ,可以将其转化为直线形式:,其中,;对于对数曲线 ,令 ,可以将其转化为直线形式:;对于幂函数曲线 ,令 ,可以将其转化为直线形式:其中,;bxdyexbayxbaylnxbaybdxy xbayyylnxx dalnyy xxlnyylnxxlndaln.2023-1-2269对于双曲线 ,令 ,转化为直线形式:;对于S型曲线 ,可 转化为直线形式:;对于幂乘积 ,只要令 ,就可以将其转化为线性形式 其中,;xbay1xbayxxxyybaye,1,e1令xbaykkxxdxy2121kkxxxy22110 xxyy1,1kkxxxxxxyyln,ln

42、,ln,ln2211dln0.2023-1-2270对于对数函数和 只要令 ,就可以将其化为线性形式 例例:表3.2.1给出了某地区林地景观斑块面积(area)与周长(perimeter)的数据。下面我们建立林地景观斑块面积A与周长P之间的非线性回归模型。kkxxxylnlnln22110kkxxxy22110kkxxxxxxyyln,ln,ln,2211.2023-1-2271 序号面积A周长P序号面积A周长P110 447.370625.39242232 844.3004 282.043215 974.730612.286434 054.660289.307330 976.770775.7

43、124430 833.840895.98049 442.902530.202451 823.355205.131510 858.9201 906.1034626 270.300968.060621 532.9101 297.9624713 573.9601 045.07276 891.680417.0584865 590.0802 250.43583 695.195243.90749157 270.4002 407.54992 260.180197.239502 086.426266.54110334.33299.729513 109.070261.8181111 749.080558.921

44、522 038.617320.396122 372.105199.667533 432.137253.335138 390.633592.893541 600.391230.030146 003.719459.467553 867.586419.406表3.2.1 某地区各个林地景观斑块面积(m2)与周长(m).2023-1-227215527 620.2006 545.291561 946.184198.66116179 686.2002 960.4755777.30556.9021714 196.460597.993587 977.719715.7521822 809.1801 103.0

45、705919 271.8201 011.1271971 195.9401 154.118608 263.480680.710203 064.242245.049 6114 697.1301 234.1142146 9416.7008 226.009624 519.867326.317225 738.953498.6566313 157.6601 172.916238 359.465415.151646 617.270609.801246 205.016414.790 654 064.137437.355.2023-1-2273303 638.766399.725712 656.824298.4

46、733158 5425.10011 474.770721 846.988179.8663235 220.6401 877.476731 616.684172.8083310 067.820497.394741 730.563172.1433427 422.5701 934.5967511 303.970881.0423543 071.5501 171.4137614 019.790638.1763657 585.9402 275.389779 277.172862.0883728 254.1301 322.7957813 684.750712.78738497 261.0009 581.298

47、791 949.164228.4033924 255.030994.906804 846.016324.481401 837.699229.40181521 457.4007 393.938411 608.625225.84282564 370.80012 212.410.2023-1-2274 解解:(1)作变量替换,令:)作变量替换,令:,将表,将表3.2.13.2.1中的原始中的原始数据进行对数变换,变换后得到的各新变量对应的观测数据如表数据进行对数变换,变换后得到的各新变量对应的观测数据如表3.2.23.2.2所示。所示。AylnPxln序号y=lnAx=LnP序号y=lnAx=LnP

48、1 9.254 1066.438 3794212.358 138.362 1862 9.678 7636.417 243 8.307 6225.667 487310.340 996.653 7824410.336 376.797 9184 9.153 0196.273 258457.508 4335.323 655 9.292 7427.552 8164610.176 196.875 2946 9.977 3387.168 551479.515 9096.951 8417 8.838 076.033 2264811.091 187.718 8798 8.214 7895.496 7894911

49、.965 727.786 3649 7.723 25.284 414507.643 2085.585 52810 5.812 1354.602 457518.042 0795.567 65111 9.371 536.326 008527.620 0275.7695 58表3.2.2 经对数变换后的数据.2023-1-2275127.771 5335.296 653538.140 9385.534 711139.034 8716.385 013547.378 0035.438 211148.700 1346.130 066558.260 3866.038 8391513.176 138.786

50、501567.573 6265.291 5971612.098 977.993 105574.347 7554.041 328179.560 7486.393 579588.984 4086.573 3341810.034 927.005 852599.866 3996.918 8211911.173 197.051 092609.019 6016.523 136208.027 5565.501 457619.595 4087.118 1092113.059 259.0150 56628.416 2385.787 871228.655 0326.211 917639.484 7597.067

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第四章相关分析和回归分析修改课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|