1、第四章 面模式分析方法4.1 空间接近性空间接近性就是面积单元之间的距离关系,它是测度面积单元的空间模式的基础。通常“距离”的测度有两种方法:边界邻接法:直接邻近、间接邻近、多重邻近;重心距离法:面积单元的中心或重心之间的距离与指定距离的比较。(a)邻接边界表示的接近性 (b)距离表示的接近性ABCDXEFGH(a)按照车的行走方式 (b)按照象的行走方式 (c)按照王后的行走方式ABCDXEFGHABCDXEFGH规则格网的接近性空间权重矩阵是空间接近性的定量化测度,对于任意的n个多边形,其两两之间都存在一个空间关系,于是总共有n*n对关系。这个关系可以用n*n的矩阵进行存储。ncbaooo
2、oooncbaW.1.11.01.4.2 空间权重矩阵4.2.1 二元邻接矩阵,其他距离范围内重心的的重心位于,其他共享边界和010, 1dAAWAAWijijijij在矩阵中,各单元的值要么为0,要么为1,它表示了个面积单元之间的邻接与否,这种矩阵称为二元邻接矩阵。其定义为邻接:距离:CrawfordRichland WyandotMorrowMarionKnoxDelaware LickingCrawford01111000Richland10010100Wyandot10001000Morrow11001110Marion10110010Knox01010011Delaware00011
3、101Licking00000110二元邻接矩阵的性质:二元邻接矩阵的性质: 对角线元素 矩阵具有对称性,即 矩阵中的行代表某一个区域单元与其他所有区域单元的空间关系,因此将某一行的所有值相加得到的行合计,代表与该行对应的区域单元相邻的区域单元的个数,0iicjiijcc jijicc.稀疏矩阵:邻居1邻居2邻居3邻居4邻居5CrawfordRichlandWyandotMorrowMarionRichlandCrawfordMorrowKnoxWyandotCrawfordMarionMorrowCrawfordRichlandMarionKnoxDelawareMarionCrawford
4、WyandotMorrowDelawareKnoxRichlandMorrowDelawareLickingDelawareMorrowMarionKnoxLickingLickingKnoxDelaware4.2.2 行标准化矩阵假设一个区域单元的各相邻单元对该区域单元产生的影响程度相同,则可以计算出各相邻单元的权重在总影响中中所占的比率。./iijijccw CrawfordRichland Wyandot MorrowMarionKnoxDelaware LickingCrawford00.250.250.250.25000Richland0.33000.3300.3300Wyandot
5、0.50000.5000Morrow0.20.2000.20.20.20Marion0.2500.250.25000.250Knox00.2500.25000.250.25Delaware0000.250.250.2500.25Licking000000.50.504.2.3 重心距离与权重矩阵使用距离作为权重描述空间关系。考虑距离的远近对于变量值的贡献,接近性测度定义为:因为空间关系作用随着距离的增加而减弱,因此在距离矩阵中权重是距离的倒数,但是很多空间关系的强度随着距离的减弱程度要强于线性比例关系,因此经常采用平方距离的倒数作为权重。其他重心距离, 0,ijijijddD2/1ijijdW
6、 Crawford Richland Wyandot Morrow MarionKnox Delaware LickingCrawford00.391 0.394 0.328 0.355 0.639 0.577 0.872Richland0.391 00.780 0.376 0.641 0.381 0.679 0.682 Wyandot0.394 0.780 00.574 0.312 0.955 0.642 1.114 Morrow0.328 0.376 0.574 00.322 0.385 0.310 0.558 Marion0.355 0.6410.312 0.322 00.702 0.3
7、31 0.817 Knox0.639 0.3810.955 0.385 0.702 00.548 0.306 Delaware0.577 0.6790.642 0.310 0.3310.548 00.547 Licking0.8720.682 1.114 0.558 0.817 0.3060.547 0重心距离矩阵CrawfordRichland Wyandot Morrow MarionKnoxDelaware LickingCrawford06.542 6.438 9.306 7.9422.447 3.008 1.317 Richland6.542 01.642 7.085 2.434 6
8、.872 2.167 2.148 Wyandot6.438 1.642 03.032 10.269 1.097 2.430 0.806 Morrow9.3067.085 3.032 09.643 6.746 10.374 3.217 Marion7.9422.434 10.2699.643 02.028 9.151 1.497 Knox2.447 6.8721.097 6.7462.028 03.328 10.675 Delaware3.008 2.1672.43010.3749.151 3.328 03.339 Licking2.148 0.682 0.806 3.217 1.49710.6
9、753.339 0空间权重矩阵4.3 空间自相关分析4.3.1空间自相关概念 空间自相关描述的是在空间域中位置上的变量与其邻近位置上的同一变量的相关性。 空间自相关是根据位置相似性和属性相似性的匹配情况来测度的。位置的相似可以通过空间权重矩阵W来描述,而属性的相似可以通过交叉乘积,或平方差异,或绝对差异来描述。 若存在正空间相关,则在近邻的空间位置上属性差异小;若存在负的空间自相关,则近邻的位置上属性值的差异大。4.3.2 连接数统计量 连接数统计量可以快速地定量描述一组连续多边形的聚集或分散程度。 只适用于属性为定类尺度计量(名义变量),且值为二分的情况。 在连接数统计中,将两个多边形之间的
10、共享边视为一个连接,所有的连接可以分为:黑-黑(BB)、白-白(WW)、黑白(BW)三种类型。 连接数统计的基本思想就是将观测到的各类连接的实际数量与随机模式下各种连接的期望数量进行比较,这就需要计算各类连接的观测值。ijjiijBWijjiijWWijjiijBBiixxwOBWWBxxwOWWxxwOBBxixi)(21: )1)(1 (21)(21012连接或对于连接:对于连接:对于为白,则令,如果为黑,则令如果多边形使用连接数统计量时,必须知道如何估计各面积单元拥有白值或黑值的可能性,估计方法的不同会影响连接数统计量显著性的检验效果。自由抽样:面积单元取B或W的可能性是以某已知理论或某
11、一更大区域的趋势为基础的,即取值不受该组中黑或白面积单元总数的影响或限制。也称正态抽样。非自由抽样:面积单元的取B或W的可能性受所研究区域黑或白面积单元总数的限制或影响。也称随机抽样。4.3.3 自由抽样在正态假设下,BB、WW、BW连接的数学期望为:。1,为黑色面积单元的数量其中,/设有其他信息的情况下,白色的可能性。如果没)为某个单元为-1或(能性,为某个单元为黑色的可连接的期望数量,和、分别是和、其中,21212122pqnnnppqpBWWWBBEEEWpqEWqEWpEBBBWWWBBBWWWBB如果空间权重矩阵为二元矩阵,则期望值可以简化为:BWWWBBBWWWBBOOOJJpqE
12、JqEJpE其中,222相应的标准差为: niiiiBWWWBBijjjiijijjiijBWWWBBiLLLKKJqppqKpqJKJqKqJqKJpKpJpwwSwwSpqpqSpqSqSpSpqpSqSqp122432432222121212212之间连接的数量与所有与其相邻的单元为面积单元,)1(其中,)(42)()(阵,则公式简化为:如果空间权重为二元矩)()(21其中,414414141abcd连接数连接数统计量的计算连接数统计量的计算根据属性值情况决定p和q,假定为p=0.4,q=0.6;计算Li(Li-1)的值;LL-1L(L-1)A326B212C326D5420E326F3
13、26G326L=22L(L-1)=528 .1)5211(6 .04 .04)52112(6 .04 .0)(4)2(65.2)5211(6 .0526 .0116 .0)(86.1)5211(4 .0524 .0114 .0)(28.56 .04 .0112296.36 .01176.14 .01122224324324324322222KJqpKJpqKJqKqJqKJpKpJpJpqEJqEJpEBWWWBBBWWWBB计算期望值和标准差统计观测值:计算Z=(O-E)/956.08 .128.57,362.065.296.33,409.086.176.11:511.18 .128.58,
14、362.065.296.33,946.086.176.10:711.08 .128.54,392.065.296.35,129.086.176.12:BWWWBBBWWWBBBWWWBBzzzczzzbzzza7, 3, 1:8, 3, 0:4, 5, 2:BWWWBBBWWWBBBWWWBBOOOcOOObOOOa 对于BB和WW连接,需要检验的是正空间自相关的显著性,且只有在观测值小于期望值,表现出正空间相关倾向时才进行检验,对于左侧单尾检验,=0.05,临界值为-1.645。 对于BW连接,则需检验的是负空间自相关的显著性,且只有在观测值大于期望值,表示出负空间相关倾向时才进行检验,对于
15、右侧单尾检验,=0.05,临界值为1.645。4.3.4 随机抽样一组多边形中某一个多边形为黑或者白的概率受研究区内两类多边形各自所占比例的限制。采用随机行标准化矩阵,各类连接期望数量的计算公式为:) 1()(21) 1() 1(21) 1() 1(21nnnnnWEnnnnWEnnnnWEBBBWWWWWBBBB标准差为:257.0 .7143236931428522 2.1674-1916218377I2)4()2()2()2(2)4()4()3()3(2)4()4()3()3(2)4()2()2(212)3(12)2(12)4()4(212)3()3(12)2(12)4()4(212)3
16、()3(12)2(1)1(4)1()1()1()1()1()1()1(准差为:,则相应的期望值和标如果采用二元连接矩阵)4)2()2(241)2()1(41)2()1(41BWWBWBBWBWWWWWWWWWBBBBBBBBWBBWWWWWBBBBBWWBWBWBWBBWWWWWWWWBBBBBBBEnnnKJJnnKnEEnnKJJnKnEEnnKJJnKnEnnnJnEnnnJnEnnnJnEEnnnSSWnnnnnSSnnnSEnnSSWnnSSnnnSEnnSSWnnSSnnnS4.4 全局空间自相关统计量对于区域单元属性值为定比或定距尺度变量,连接数统计量不适用。4.4.1 Mora
17、ns I元素之和是空间权重矩阵的所有的值,是区域单元其中,)()(2WixxxWxxxxwnIiijiji Morans I的取值在-1和1之间,-1表示极强的负空间自相关,1表示极强的正空间自相关。 如果不存在空间自相关,则Morans I的期望值为:EI=-1/n-1EI始终为负,与单元数n反向变动 当空间系统(n)较小时,EI可能是一个绝对值较大的负值,但不能因此认为存在较强的负空间自相关,只要所观测到的负Morans I值大于期望值,一个绝对值相对较小的负Morans I就仍可能表明不存在空间自相关,甚至存在正的空间自相关。 对于Morans I来说,0不能作为区分正空间自相关和负空间
18、自相关的参照点。实例:中值居民收入countrymedian-val Geauga10770038528.571484450814.1249Cuyahoga721002928.5718576530.4449Trumbull53300-15871.4251902245.8049Summit61900-7271.4352873673.8849Portage6920028.5714816.3249Ashtabula45800-23371.4546223674.8049Lake742005028.57125286530.3249summary69171.432369314285.7143 16667.
19、 0171257. 0 .7143236931428522 2.1674-1916218377IEI与随机模式相比,观测模式存在一定程度的空间自相关,但还必须检验Morans I的观测值与期望值之间的差异是偶然的还是系统的。) 1(3)(2222122nWWnSSnI3)()3)(2)(1(62)(3)33()(4422112221222nxxkkWnnnWnSSnnkWSnSnnnIi为峰度指数, 正态假设下,Morans I的方差为: 随机抽样下,Morans I的方差为:351.00661.0)16667.0(257.0)(0661.0)17(222232967447)(22222IZI
20、N正态假设下:随机假设下:329.00754.0)1667.0(257.0)(0754.022)37()27()17(226447244)77(2 .0223296744)3737(7)(222222IZIR4.4.2 Gearys C 比率)(2)()1(22xxwxxwnCiijjiijGearys C的值域在0和2之间,0表明存在完全正空间自相关,这是所有相邻的值均是相同的,因此分子等于0。而2则表明完全负空间自相关。Gearys C的期望值不受样本容量n影响,始终为1。 Morans I与Gearys C的关联IxxxxwnxxwnCjiijjiij )(2)()1(222212) 1
21、(24) 1)(2()(WnWnSSC正态假设下,方差为:随机假设下,方差为:2222222212)3)(2()1(3)2(63)1(41)1(33)1()(WnnnknnWknnnnSnknnnSnC4.4.3 广义G统计量在空间聚集分析中,较高值的局部聚集称为热点,而较低值的局部聚集则称为冷点。Morans I和Gearys C由于只关注邻近值是否相似,而无法判读相似的邻接值是较高的值还是较低的值,因此无法区分热点和冷点。广义G统计量则可以用来探测研究区内的热点和冷点。jixxxxdwdGjijiij其中,,)()( 广义G的计算公式: 相邻值越大,决定G(d)统计量大小的分子就相对越大;
22、相邻值越小,分子就越小。中等大小的G(d)值反映高值与中等值的空间关联,而相对较小的G(d)值则表明低值与低于平均水平的值空间关联。) 1()(nnWGE22)()()(GEGEGVar 对广义G统计量的值进行解释,必须依赖于期望值和标准化值(z值)。G(d)的期望值为: G(d)的方差为:214221322122212122120)(141431322241220)4(222128)1(2)1(46)3(232)(3)33()1).(1()(1)(1WSSBWSnSnBWSnnSBWnSSnnBWnSSnnBxnnnnxmmBmmBmmBmBmBnmmGESxijij以30英里为邻接标准,构
23、建二元邻接矩阵GeaugaCuyahogaTrumbullSummitPortageAshtabulaLakeGeauga0110111Cuyahoga1001001Trumbull1000110Summit0100100Portage1011000Ashtabula1010001Lake11000104.5 局部空间自相关统计量的标准差是变量值与均值的离差:是相应的和其中,xxxzxzzzwzIiijijjijii4.5.1 局部空间关联指标区域单元i的局部Moran统计量的计算公式: 随机假设下的期望值和方差及Z值,2,)()1()2)(1()2(2)1(1)(44222)2(.2222.
24、224)(224)2(.iiiiikihihikkhiiiiijijijijikhiiiiiIVarIEIIzijhkwwwnzmnzmjiwwwwnwnnnmmwnmmnwIVarnwIEi其中,4.5.2 局部G统计量局部层面的广义G统计量,是分别针对个区域单元计算的旨在表明所关注区域单元的值与其周边以距离d定义的相邻单元的值之间关联性的统计量。ijxxdwdGjjjjiji其中,)()(ijnnWWnnxWnWxGEGEGEGVardwWnWGEiijjiijjiiiijijiii,)2)(1() 1()2)(1()1()(1)()()()()(1)(22222其中, 期望值、方差:Gi(d)统计量标准化z值的含义情形Z(Gi)高高相邻较大的正值高中相邻中等大小的正值中中相邻0随机0高低相邻负值中低相邻中等大小的负值低低相邻绝对值较大的负值4.6 Moran散点图假设z是zi的矢量,其中zi为数据值与均值的离差,即 ,W为行标准化空间权重矩阵,则可以建立一个Wz关于z的回归模型,模型的斜率表示的是相邻值之间的关联性。/ )(xxzii将Z和Wz绘制在二维坐标下,则得到Moran散点图,可以反映出研究区内空间自相关水平异常的单元。七县中值居民收入的Moran散点图美国49州2000年外来人口比例图