1、 一旦数据模型确定,就必须选择与该模型相对应的数据结构来组织实体的数据,并且选择适合于记录该数据结构的文件格式。精心选择的数据结构可以带来更高运行速度或者存储效率的算法。图图3.2 基于对象的矢量数据简单模型基于对象的矢量数据简单模型矢量数据模型只需选取和记录反映地理实体分布矢量数据模型只需选取和记录反映地理实体分布形状特征的点,但点的数量对地理实体表示有影形状特征的点,但点的数量对地理实体表示有影响。它非常适合于表示线状实体和面状实体的范响。它非常适合于表示线状实体和面状实体的范围边界。围边界。矢量数据的获取方式主要有以下三种。矢量数据的获取方式主要有以下三种。由外业测量获得:可利用测量仪器
2、自动记录测量由外业测量获得:可利用测量仪器自动记录测量结果结果(常称为常称为“电子手薄电子手薄”),然后转到地理数据,然后转到地理数据库中。库中。由栅格数据转换获得:利用栅格数据矢量化技术,由栅格数据转换获得:利用栅格数据矢量化技术,把栅格数据转换为矢量数据(一般可由转换程序把栅格数据转换为矢量数据(一般可由转换程序执行)。执行)。由跟踪数字化获得:用跟踪数字化的方法,把地由跟踪数字化获得:用跟踪数字化的方法,把地图变成离散的矢量数据。图变成离散的矢量数据。常用的矢量数据结构有简单矢量数据结构、拓扑数据结构常用的矢量数据结构有简单矢量数据结构、拓扑数据结构和不规则三角网数据结构三种。和不规则三
3、角网数据结构三种。1.简单矢量数据结构:简单矢量数据结构:u在简单矢量数据结构中,空间数据按照基本的空间对象在简单矢量数据结构中,空间数据按照基本的空间对象(点、线、面或多边形)为单位进行单独组织。并以地理(点、线、面或多边形)为单位进行单独组织。并以地理实体(点、线、面)为单位,将地理实体特征点的坐标存实体(点、线、面)为单位,将地理实体特征点的坐标存储到一个数据文件中。储到一个数据文件中。u每个实体由其编号或识别码标识,实体的属性数据(如等每个实体由其编号或识别码标识,实体的属性数据(如等级、类型、大小等)设为属性码,以表的形式存储在另一级、类型、大小等)设为属性码,以表的形式存储在另一个
4、数据文件中,当需要查询、显示或分析某一实体的属性个数据文件中,当需要查询、显示或分析某一实体的属性数据时,数据时,GIS以实体编号为关键字从属性数据文件中将它以实体编号为关键字从属性数据文件中将它们读取出来。们读取出来。u其特点是结构简单,存取便捷。数据结构见表其特点是结构简单,存取便捷。数据结构见表3.3和表和表3.4。多边形的矢量数据结构与线的类似,但坐标串的首。多边形的矢量数据结构与线的类似,但坐标串的首尾坐标相同,如图尾坐标相同,如图3.2(c)所示。构成多边形边界的各个所示。构成多边形边界的各个线段,以多边形为单元进行组织。多边形矢量模型结构如线段,以多边形为单元进行组织。多边形矢量
5、模型结构如图图3.3所示。所示。图图3.3 面的矢量数据结构面的矢量数据结构图图3.4线状实体多边形线状实体多边形图图 3.5面状实体多边形面状实体多边形u不规则三角网在地形表达上的应用如图不规则三角网在地形表达上的应用如图3.7所示。所示。图图3.6 不规则三角网和多边形形成不规则三角网和多边形形成图图3.7 不规则三角网在地形表达上的应用图示不规则三角网在地形表达上的应用图示u将不规则分布的数据点连接成三角网的方将不规则分布的数据点连接成三角网的方法有好几种,其中最常用的为狄诺里法有好几种,其中最常用的为狄诺里(Delaunay)三角形。)三角形。u使用使用Delaunay三角构网法形成的
6、每一个三角构网法形成的每一个三角形,它的外接圆不含有除三个顶点以三角形,它的外接圆不含有除三个顶点以外的其他数据点,而这个外接圆的圆心正外的其他数据点,而这个外接圆的圆心正是与该三角形三个顶点相对应的多边形是与该三角形三个顶点相对应的多边形(也称泰森多边形,(也称泰森多边形,Thiessen或或Voronoi)的公共顶点,如图)的公共顶点,如图3.8所示。所示。u泰森多边形可用于泰森多边形可用于GIS定性分析、统计分定性分析、统计分析、邻近分析等。析、邻近分析等。图图3.8 Delaunay三角网和三角网和Voronoi多边形多边形图图3.9 泰森多边形的建立泰森多边形的建立狄诺里三角形和泰森
7、多边形的构建演示系统狄诺里三角形和泰森多边形的构建演示系统图图3.10 由由TIN表示的闽西根溪河流域的地势表示的闽西根溪河流域的地势4.4.网络数据模型与数据结构网络数据模型与数据结构u网络(网络(NetworkNetwork)是指一组相互连接的线状地理实体,如道路)是指一组相互连接的线状地理实体,如道路网、水系网、电力网、煤气和输油管道网等。网、水系网、电力网、煤气和输油管道网等。u在在GISGIS中,网络数据模型本质上是矢量数据模型,它把网络看中,网络数据模型本质上是矢量数据模型,它把网络看成是由结点(成是由结点(NodeNode)和路径()和路径(LinkLink)组成,并以结点和路径
8、为)组成,并以结点和路径为单位描述网络的几何、拓扑和专题特征如图单位描述网络的几何、拓扑和专题特征如图3.113.11所示(以道路所示(以道路网为例介绍网络数据结构)。网为例介绍网络数据结构)。uGISGIS网络分析中最常涉及到的是道路网,如图网络分析中最常涉及到的是道路网,如图3.123.12所示。每段所示。每段路径有一个起始点和一个终结点(按数字化的顺序),这些信路径有一个起始点和一个终结点(按数字化的顺序),这些信息都存储在表息都存储在表3.103.10中,每段路径的属性以及有关的阻强指标值中,每段路径的属性以及有关的阻强指标值存储在表存储在表3.113.11中,这些可能包括路段的长度、
9、速限、车道数、中,这些可能包括路段的长度、速限、车道数、允许的行使方向等。允许的行使方向等。u在表示允许的行使方向时,在表示允许的行使方向时,FTFT表示允许的方向是由起始点到终表示允许的方向是由起始点到终止点,止点,TFTF表示由终止点到起始点,表示由终止点到起始点,FTFT和和TFTF标志着相应的路径为标志着相应的路径为单行道,单行道,E E表示双行道,表示双行道,N N则表示该路径不允许车辆行使。则表示该路径不允许车辆行使。图3.12图3.11u结点表示道路交叉口或路口,从某一路径来到一结点表示道路交叉口或路口,从某一路径来到一个路口可以一直往前走,向左转,向右转或作个路口可以一直往前走
10、,向左转,向右转或作形转弯(形转弯(180)折回来走。)折回来走。u在一个路口可转弯的方向取决于路口道路的情况在一个路口可转弯的方向取决于路口道路的情况以及此路口的交通规则。以及此路口的交通规则。u在路口转弯所花的时间常称为转弯阻强(在路口转弯所花的时间常称为转弯阻强(Turn Impedance),在一般情况下,它与转弯的方),在一般情况下,它与转弯的方向有关。向有关。u交通网中每段路径在其结点处所有允许的转弯方交通网中每段路径在其结点处所有允许的转弯方向及转弯阻强都存储在一个转弯类型表中,如表向及转弯阻强都存储在一个转弯类型表中,如表3.12所示。所示。注意:注意:u在过去在过去3030几
11、年中,矢量数据模型是几年中,矢量数据模型是GISGIS中变化最大的方面。中变化最大的方面。u例如,例如,ESRIESRI公司在不同时期所开发的公司在不同时期所开发的GISGIS软件都相对应着软件都相对应着一种矢量数据模型,一种矢量数据模型,ArcViewArcView对应对应Shape-fileShape-file,Arc/InfoArc/Info对应对应CoverageCoverage,ArcGISArcGIS对于对于GeodatabaseGeodatabase。uShape-fileShape-file和和CoverageCoverage就是地理关系数据模型的代表,就是地理关系数据模型的代
12、表,GeodatabaseGeodatabase是面向对象数据模型的代表。是面向对象数据模型的代表。u矢量数据模型的演变是计算机技术发展和矢量数据模型的演变是计算机技术发展和GISGIS市场竞争的市场竞争的结果。结果。u对用户来说,有关矢量数据模型有许多新的概念和方法要对用户来说,有关矢量数据模型有许多新的概念和方法要学习。学习。3.1.2栅格数据结构表示法栅格数据结构表示法 栅格数据结构表示法以规则网格描述地理实体,记录和栅格数据结构表示法以规则网格描述地理实体,记录和表示地理数据。表示地理数据。3.1.2.1栅格数据模栅格数据模型型 栅格数据模型视栅格数据模型视地球表面为平面,地球表面为平
13、面,将其分割为一定大将其分割为一定大小、形状规则的格小、形状规则的格网(网(Grid),以网),以网格(格(Cell)为单位)为单位记录地理实体的分记录地理实体的分布位置和属性,如布位置和属性,如图图3.13所示。所示。图图3.13 栅格数据模型栅格数据模型u组成格网的网格可以是正方形、长方形、三角形或六边形,组成格网的网格可以是正方形、长方形、三角形或六边形,但通常使用正方形。但通常使用正方形。u使用这种栅格数据模型,一个点状地理实体表示为一个单使用这种栅格数据模型,一个点状地理实体表示为一个单一的网格或表示为单个像元;一个线状地理实体表示为一一的网格或表示为单个像元;一个线状地理实体表示为
14、一串相连的网格或在一定方向上连接成串的相邻像元的集合;串相连的网格或在一定方向上连接成串的相邻像元的集合;一个面状地理实体则由一组聚集在一起且相互连接的网格一个面状地理实体则由一组聚集在一起且相互连接的网格或由聚集在一起的相邻像元的集合表示。每个地理实体的或由聚集在一起的相邻像元的集合表示。每个地理实体的形状特征表现为由构成它的网格组成的形状特征。每个网形状特征表现为由构成它的网格组成的形状特征。每个网格的位置由其所在的行列号表示,如图格的位置由其所在的行列号表示,如图3.143.14所示。所示。图图3.14 栅格数据模型栅格数据模型的基本要素的基本要素栅格数据可以是一组数据矩阵,每个数据称为
15、网格值,栅格数据可以是一组数据矩阵,每个数据称为网格值,代表相应网格内地理实体的属性。根据属性值编码方代表相应网格内地理实体的属性。根据属性值编码方案的不同,网格值可以为整数或浮点数,有些案的不同,网格值可以为整数或浮点数,有些GIS还还允许以文字作为网格值。在最简单的情况下,网格值允许以文字作为网格值。在最简单的情况下,网格值为为0或或1,表示某一地理实体的存在与否。,表示某一地理实体的存在与否。u栅格数据不明确地表示地理实体的拓扑特性,但有些栅格数据不明确地表示地理实体的拓扑特性,但有些特性可以通过计算获得。例如,若已知一个网格的行特性可以通过计算获得。例如,若已知一个网格的行列坐标,就可
16、以很容易地找到与它相邻的网格。类似列坐标,就可以很容易地找到与它相邻的网格。类似地,根据网格的行列坐标和网格值,可以搜寻包含在地,根据网格的行列坐标和网格值,可以搜寻包含在一个面状实体内的另一个地理实体,等等以此类推。一个面状实体内的另一个地理实体,等等以此类推。u栅格数据的精度在很大程度上取决于网格的大小。栅格数据的精度在很大程度上取决于网格的大小。网格越大,精度越低;反之,网格越小,精度越网格越大,精度越低;反之,网格越小,精度越高。栅格数据的精度对地理实体几何形状特征表高。栅格数据的精度对地理实体几何形状特征表示的详细性和精确性影响很大,一般地,实体特示的详细性和精确性影响很大,一般地,
17、实体特征愈复杂,栅格尺寸越小,分辨率愈高。征愈复杂,栅格尺寸越小,分辨率愈高。u栅格数据量愈大(按分辨率的平方指数增加),栅格数据量愈大(按分辨率的平方指数增加),计算机成本就越高,处理速度就越慢。不管网格计算机成本就越高,处理速度就越慢。不管网格有多小,由于每个网格只能拥有一个数值,因此,有多小,由于每个网格只能拥有一个数值,因此,每个网格内有关地理实体属性变化的细节会全部每个网格内有关地理实体属性变化的细节会全部丢失。而且,栅格数据总会在某种程度上会歪曲丢失。而且,栅格数据总会在某种程度上会歪曲地理实体的细部特征,所以,在表示线状地理实地理实体的细部特征,所以,在表示线状地理实体时少用。体
18、时少用。当一个网格包含两种或两种以上不同类型的地理实体时,当一个网格包含两种或两种以上不同类型的地理实体时,只能将它表示为其中一种类型。通常使用的网格赋值规只能将它表示为其中一种类型。通常使用的网格赋值规则包括如下。则包括如下。(1)中心点法:选取位于栅格中心的属性值为该栅格的属)中心点法:选取位于栅格中心的属性值为该栅格的属性值。性值。(2)面积占优法:选取占据栅格单元属性值为面积最大者)面积占优法:选取占据栅格单元属性值为面积最大者赋值。常用于分类较细、地理类别图斑较小的情景。赋值。常用于分类较细、地理类别图斑较小的情景。(3)重要性法:定义属性类型的重要级别,选取重要的属)重要性法:定义
19、属性类型的重要级别,选取重要的属性值为栅格属性值,常用于有重要意义而面积较小的要性值为栅格属性值,常用于有重要意义而面积较小的要素,特别适用于点、线地理要素的定义。素,特别适用于点、线地理要素的定义。(4)长度占优法:定义每个栅格单元的值由该栅格中线段)长度占优法:定义每个栅格单元的值由该栅格中线段最长的实体的属性来确定。最长的实体的属性来确定。图图3.15栅格数据结构栅格数据结构栅格矩阵要求存储所有的网格值,所产生的数据文件的大小取决于网格的行数和列数(mn)。网格的大小对栅格数据量有很大的影响,即数据量随网格大小的改变呈平方变化。另外这种数据结构存储的网格值,冗余度较大。尤其对大量数据的栅
20、格矩阵表达在存储上会占据大量的空间,为解决这个问题,人们提出数据压缩的方法,常见的有:游程编码、链编码和四叉树编码等。图图3.16 游程长度编码游程长度编码图图3.18 四叉树结构的建立过程四叉树结构的建立过程u面向对象(面向对象(Object-OrientedObject-Oriented,简称,简称OOOO)技)技术最早出现在术最早出现在2020世纪世纪6060年代,但在年代,但在8080年代年代后期至今已得到广泛的应用。后期至今已得到广泛的应用。u在在GISGIS中,为更好地表示地理数据,也有用中,为更好地表示地理数据,也有用到面向对象的数据模型。到面向对象的数据模型。图图3.20“3.
21、20“城市城市”类与实例类与实例空间数据库的实现空间数据库的实现根据空间数据库逻辑设计和物理设计的结果,就可以在计算根据空间数据库逻辑设计和物理设计的结果,就可以在计算机上创建起实际的空间数据库结构,装入空间数据,并测机上创建起实际的空间数据库结构,装入空间数据,并测试和运行,这个过程就是空间数据库的实现过程,它包括:试和运行,这个过程就是空间数据库的实现过程,它包括:建立实际的空间数据库结构;建立实际的空间数据库结构;装入试验性的空间数据对应用程序进行测试,以确立其装入试验性的空间数据对应用程序进行测试,以确立其功能和性能是否满足设计要求,并检查对数据库存储空间功能和性能是否满足设计要求,并
22、检查对数据库存储空间的占有情况;的占有情况;装入实际的空间数据,即数据库的加载,建立起实际运装入实际的空间数据,即数据库的加载,建立起实际运行的空间数据库。行的空间数据库。通用的通用的SQLSQL查询语言与空间概念集成后产生了空间查询语言与空间概念集成后产生了空间SQLSQL查询语查询语言言,促使数据类型从简单的整数、小数、字符等扩展为点、促使数据类型从简单的整数、小数、字符等扩展为点、线、多边形、复杂线、复杂多边形等复杂的空间数据类线、多边形、复杂线、复杂多边形等复杂的空间数据类型,查询的操作谓词也扩展到针对空间数据的处理。在型,查询的操作谓词也扩展到针对空间数据的处理。在OGISOGIS、
23、SQL3SQL3等空间查询的标准中,针对空间问题的查询操等空间查询的标准中,针对空间问题的查询操作可以归纳为三类作可以归纳为三类(Shekhar and Chawla 2002)(Shekhar and Chawla 2002):(1 1)几何操作,诸如空间参考系确立、外接矩形生成、边)几何操作,诸如空间参考系确立、外接矩形生成、边界提取等。界提取等。(2 2)拓扑操作,包括对相等、分离、相交、相切交叉、包)拓扑操作,包括对相等、分离、相交、相切交叉、包含等拓扑关系的布尔判断。含等拓扑关系的布尔判断。(3 3)空间分析操作,包括缓冲区生成、多边形叠置、凸壳)空间分析操作,包括缓冲区生成、多边形叠置、凸壳生成等。生成等。niinmeanx1niinmeaniancex12)(var