1、第三章第三章 空间数据模型空间数据模型 11空间数据模型概念空间数据模型概念 地理数据也可以称为空间数据。地理空间是指物质、能量、信息的存在形式在形态、结构过程、功能关系上的分布方式和格局及其在时间上的延续。空间数据模型是关于现实世界中空间实体及其相互间联系的概念,它为描述空间数据的组织和设计空间数据库模式提供着基本方法。因此,对空间数据模型的认识和研究在设计GIS空间数据库和发展新一代GIS系统的过程中起着举足轻重的作用(图3-1)。1空间数据模型的基本问题 图图3-1:概念数据模型:概念数据模型1空间数据模型的基本问题 12 空间数据模型的类型空间数据模型的类型 GIS空间信息模型有三个
2、对象(要素)(Feature)模型 网络(Network)模型 场(Field)模型1空间数据模型的基本问题 13 GIS空间数据模型的学术前沿空间数据模型的学术前沿 时空数据模型、三维数据模型、动态空间数据结构、分布式空间数据管理、空间存取方法、GIS设计的CASE工具等是目前国际上GIS空间数据模型研究的学术前沿。1空间数据模型的基本问题 131时空数据模型时空数据模型 时空数据模型的核心问题是研究如何有效地表达、记录和管理现实世界的实体及其相互关系随时间不断发生的变化。这种时空变化表现为三种可能的形式,一是属性变化,其空间坐标或位置不变;二是空间坐标或位置变化,而属性不变,这里空间的坐标
3、或位置变化既可以是单一实体的位置、方向、尺寸、形状等发生变化,也可以是两个或两个以上的空间实体之间的关系发生变化;三是空间实体或现象的坐标和属性都发生变化。1空间数据模型的基本问题 1 13 32 2 三维空间数据模型三维空间数据模型 国际上关于三维空间数据模型的研究大体上可分为两个方向:一是三维矢量模型,其是用一些基元及其组合去表示三维空间目标,这些基元本身是可以用简单数学解析函数描述的。二是体模型,以体元(Voxel)模型为代表,这种体元模型的特点是易于表达三维空间属性的非均衡变化,其缺点是所占存储空间大、处理时间长。1空间数据模型的基本问题 133分布式空间数据模型分布式空间数据模型 分
4、布式空间数据库管理系统和联邦空间数据库是国际上关于分布式空间数据模型的两个主要研究方向。1空间数据模型的基本问题 134 CASE工具工具 当前国际上的一个重要发展方向是,根据GIS空间数据建模的特点和CASE工具的原理,在现有CASE软件平台上,发展GIS空间数据建模与系统设计的专用功能,这将有效地提高GIS空间数据建模及其应用系统设计的自动化程度和技术水平。1空间数据模型的基本问题2场模型 对于模拟具有一定空间内连续分布特点的现象来说,基于场的观点是合适的。例如,空气中污染物的集中程度、地表的温度、土壤的湿度水平以及空气与水的流动速度和方向。根据应用的不同,场可以表现为二维或三维。场模型可
5、以表示为如下的数学公式:z:s z(s)上式中,z为可度量的函数,s表示空间中的位置,因此该式表示了从空间域(甚至包括时间坐标)到某个值域的映射。2场模型 21 场的特征场的特征 211空间结构特征和属性域空间结构特征和属性域 空间结构可以是规则的或不规则的,但空间结构的分辨率和位置误差则十分重要,它们应当与空间结构设计所支持的数据类型和分析相适应。属性域的数值可以包含以下几种类型:名称、序数、间隔和比率。属性域的另一个特征是支持空值,如果值未知或不确定则赋予空值。2场模型 212 连续的、可微的、离散的连续的、可微的、离散的 如果空间域函数连续的话,空间域也就是连续的,即随着空间位置的微小变
6、化,其属性值也将发生微小变化,不会出现像数字高程模型中的悬崖那样的突变值。2场模型 图图3-2:某点的坡度取决于位置所在区域的各方向上的可微性:某点的坡度取决于位置所在区域的各方向上的可微性2场模型 213 各向同性和各向异性各向同性和各向异性 空间场内部的各种性质是否随方向的变化而发生变化,是空间场的一个重要特征。如果一个场中的所有性质都与方向无关,则称之为各向同性场。反之,这个场称为各向异性场。2场模型 图图3-3:在各向同性与各向异性场中的旅行时间面:在各向同性与各向异性场中的旅行时间面2场模型 214空间自相关空间自相关 空间自相关是空间场中的数值聚集程度的一种量度。距离近的事物之间的
7、联系性强于距离远的事物之间的联系性。如果一个空间场中的类似的数值有聚集的倾向,则该空间场就表现出很强的正空间自相关;如果类似的属性值在空间上有相互排斥的倾向,则表现为负空间自相关(下图3-4)。2场模型 22栅格数据模型栅格数据模型 栅格数据模型是基于连续铺盖的,它是将连续空间离散化,即用二维铺盖或划分覆盖整个连续空间;铺盖可以分为规则的和不规则*的,后者可当做拓扑多边形处理,如社会经济分区、城市街区;铺盖的特征参数有尺寸、形状、方位和间距。对同一现象,也可能有若干不同尺度、不同聚分性的铺盖。2场模型 图图3-5:三角形、方格和六角形划分:三角形、方格和六角形划分2场模型 基于栅格的空间模型把
8、空间看作像元(Pixel)的划分(Tessellation),每个像元都与分类或者标识所包含的现象的一个记录有关。2场模型 图3-6:栅格数据模型2场模型 体元(Voxels):GIS中基于的栅格表示可以被扩展到三维以产生一个体元(Voxel)模型,其中像元是由长方形,典型是立方体、立体元素所组成。这类模型的数据的一个比较合适的模型就是体元模型。该模型被广泛地应用于媒体成像,其中它们源于计算机辅助断层(CT)及核磁反应扫描仪。它们很好地表现渐进的、特殊的位置变化,并适于产生这种变化的剖面图。2场模型3要素模型 31 欧氏空间和欧氏空间中的三类地物要素欧氏空间和欧氏空间中的三类地物要素 根据常用
9、的公式就可以测量点之间的距离及方向,这个带坐标的空间模型叫做欧氏空间,它把空间特性转换成实数的元组特性,两维的模型叫做欧氏平面。欧氏空间中,最经常使用的参照系统是笛卡尔坐标系,它是由一个固定的、特殊的点为原点,一对相互垂直且经过原点的线为坐标轴。311点对象点对象 点是有特定的位置,维数为零的物体,包括:点实体:用来代表一个实体;注记点:用于定位注记;内点:记录多边形属性,存在于多边形内;结点:表示线的终点和起点;角点:表示线段和弧段的内部点。3要素模型 3 31 12 2 线对象线对象 线对象是GIS中非常常用的维度为1的空间组分,表示对象和它们边界的空间属性,由一系列坐标表示,并有如下特征
10、:实体长度 弯曲度 方向性 线状实体包括线段、边界、链、弧段、网络等,多边线如图3-7所示。3要素模型 313 多边形对象多边形对象 面状实体也称为多边形,是对湖泊、岛屿、地块等一类现象的描述。面状实体有如下空间特性:面积范围 周长 独立性或与其它的地物相邻 重叠性与非重叠性 在计算几何中,定义了许多不同类型的多边形,如图3-7所示。3要素模型 图图3-7:多边线和多边形:多边线和多边形3要素模型 32 要素模型的基本概念 基于要素的空间信息模型把信息空间分解为对象(Object)或实体(Entity)。一个实体必须符合三个条件:可被识别;重要(与问题相关);可被描述(有特征)。3要素模型 实
11、体的特征,可以通过静态属性、动态的行为特征和结构特征来描述实体。与基于场的模型不同,基于要素的模型把信息空间看作许多对象的集合,而这些对象又具有自己的属性。基于要素的模型中的实体可采用多种维度来定义属性,包括:空间维、时间维、图形维和文本/数字维。3要素模型 空间对象的定义取决于嵌入式空间的结构。常用的嵌入式空间类型有:(1)欧氏空间,它允许在对象之间采用距离和方位的量度,欧氏空间中的对象可以用坐标组的集合来表示;(2)量度空间,它允许在对象之间采用距离量度(但不一定有方向);(3)拓扑空间,它允许在对象之间进行拓扑关系的描述(不一定有距离和方向);(4)面向集合的空间,它只采用一般的基于集合
12、的关系,如包含、合并及相交等。3要素模型1)欧氏平面上的空间对象类型)欧氏平面上的空间对象类型 对象继承等级图 图图3-8:连续空间对象类型的继承等级:连续空间对象类型的继承等级空间对象延伸对象零维对象点二维对象一维对象环弧简单环简单弧面对象面域对象域单位对象3要素模型 2)离散欧氏平面上的空间对象)离散欧氏平面上的空间对象 欧氏空间的平面因连续而不可计算,必须离散化后才适合于计算。图3-8中所有的连续类型的离散形式都存在。图3-9表示了部分离散一维对象继承等级关系。3要素模型 图图3-9:离散一维对象的继承等级:离散一维对象的继承等级离散一维对象B 样条曲线多边线线段3要素模型 基于场的模型
13、和基于要素的模型各有长处,应该恰当地综合运用这两种方法来建模。在地理信息系统应用模型的高层建模中、数据结构设计中及地理信息系统应用中,都会遇到这两种模型的集成问题。图3-10描述了要素模型和场模型的比较。3要素模型 图图3-10:要素模型和场模型的比较:要素模型和场模型的比较 现实世界 选择要素 选择一个位置 要素模型 场模型 它在哪里 那里怎么样 数据 3要素模型 33矢量数据模型矢量数据模型 矢量方法(图3-11)强调了离散现象的存在,由边界线(点、线、面)来确定边界,因此可以看成是基于要素的。3要素模型 图图3-11:矢量数据模型:矢量数据模型3要素模型 矢量数据模型将现象看作原形实体的
14、集合,且组成空间实体。在二维模型内,原型实体是点、线和面;而在三维中,原型也包括表面和体。3要素模型4基于要素的空间关系分析 41空间关系的基本概念空间关系的基本概念 在地理信息系统中集中存储了以下的内容:空间分布位置信息 属性信息 拓扑空间关系信息。地理要素之间的空间区位关系可抽象为点、线(或弧)、多边形(区域)之间的空间几何关系,其关系如下,如图3-12示 图图3-12:地理要素之间的部分拓扑空间关系:地理要素之间的部分拓扑空间关系4基于要素的空间关系分析 1)点)点点关系点关系 相合 分离 一点为其它诸点的几何中心;一点为其它诸点的地理重心。4基于要素的空间关系分析 2)点)点线关系线关
15、系 点在线上:可以计算点的性质,如拐点等;线的端点:起点和终点;线的交点;点与线分离:可计算点到线的距离。4基于要素的空间关系分析 3)点)点面关系面关系 点在区域内,可以记数和统计;点为区域的几何中心;点为区域的地理重心;点在区域的边界上;点在区域外部。4基于要素的空间关系分析 4)线)线线关系线关系 重合;相接:首尾环接或顺序相接;相交:相切;并行。4基于要素的空间关系分析 5)线)线面关系面关系 区域包含线:可计算区域内线的密度;线穿过区域:线环绕区域:对于区域边界,可以搜索其左右区域名称;线与区域分离。4基于要素的空间关系分析 6)面)面面关系面关系 包含:如岛的情形;相合:相交:可以
16、划分子区,并计算逻辑与、或、非和异或;相邻:计算相邻边界的性质和长度;分离:计算距离、引力等。4基于要素的空间关系分析 42拓扑空间关系分析拓扑空间关系分析 421拓扑属性拓扑属性 假设欧氏平面是一张高质量无边界的橡皮,该橡皮能够伸长和缩短到任何理想的程度。想象一下基于这张橡皮所绘制的图形,允许这张纸伸长但是不能撕破或者重叠,这样原来图形的一些属性将保留,而有些属性将会失去。例如,在橡皮表面有一个多边形,多边形内部有一个点。无论对橡皮进行压缩或拉伸,点依然存在于多边形内部,点和多边形之间的空间位置关系不改变,而多边形的面积则会发生变化。前者则是空间的拓扑属性,后者则不是拓扑属性。4基于要素的空
17、间关系分析 表表3-2:欧氏平面上实体对象所具有的拓扑和非拓扑属性:欧氏平面上实体对象所具有的拓扑和非拓扑属性4基于要素的空间关系分析 图3-13为拓扑空间关系的形式化表达。图图3-13:拓扑空间中的点和邻域:拓扑空间中的点和邻域4基于要素的空间关系分析 422 拓扑描述的数学基础拓扑描述的数学基础点集拓扑学点集拓扑学 拓扑学是几何学分支之一,是研究图形在拓扑变化下不变的性质,拓扑学已成为地理信息系统空间关系的理论基础,为空间点、线、面之间的包含、覆盖、相离和相接等空间关系的描述提供直接的理论依据。4基于要素的空间关系分析 423 拓扑空间关系描述拓扑空间关系描述9交模型交模型 设有现实世界中
18、的两个简单实体A、B,B(A)、B(B)表示A、B的边界,I(A)、I(B)表示A、B的内部,E(A)、E(B)表示A、B余。一个由边界、内部、余的点集组成的9-交空间关系模型如下*:4基于要素的空间关系分析 424拓扑空间关系识别拓扑空间关系识别 在地理信息系统中,空间数据具有属性特征、空间特征和时间特征,基本数据类型包括属性数据、几何数据和空间关系数据。作为基本数据类型的空间关系数据主要指点/点、点/线、点/面、线/线、线/面、面/面之间的相互关系。4基于要素的空间关系分析 431 方向关系描述方向关系描述 方向关系又称为方位关系、延伸关系,它定义了地物对象之间的方位。为了定义空间目标之间
19、的方向关系,首先定义点目标之间的关系。给定定位参考,即相互垂直的X、Y坐标轴,方向关系的定义采用垂直于坐标轴的直线为参考。4基于要素的空间关系分析 4 43 32 2方向关系识别方向关系识别 MBR(Minimum Bounding Rectangle)指的是空间目标的外切矩形。MBR的表示非常简单,只需利用两点(左上、右下角点)表示即可。由于MBR的简单、实用性,MBR广泛应用于空间目标数据结构表示以及空间数据查询中。为了确定目标之间是否具有某种方向关系,首先可判断目标之间的MBR是否具有该关系,然后再利用点/点关系进一步进行关系判断,确定具体的关系。4基于要素的空间关系分析 4 44 4
20、度量空间关系分析度量空间关系分析 基本空间对象度量关系包含点/点、点/线、点/面、线/线、线/面、面/面之间的距离。在基本目标之间关系的基础上,可构造出点群、线群、面群之间的度量关系。例如,在已知点/线拓扑关系与点/点度量关系的基础上,可求出点/点间的最短路径、最优路径、服务范围等;已知点、线、面度量关系,进行距离量算、邻近分析、聚类分析、缓冲区分析、泰森多边形分析等。4基于要素的空间关系分析 441空间指标量算空间指标量算 定量量测区域空间指标和区域地理景观间的空间关系是地理信息系统特有的能力。其中区域空间指标包括:1)几何指标:位置、长度(距离)、面积、体积、形状、方位等指标;2)自然地理
21、参数:坡度、坡向、地表辐照度、地形起伏、河网密度、切割程度、通达性等;3)人文地理指标:如集中指标、区位商、差异指数、地理关联系数、吸引范围、交通便利程度、人口密度等。4基于要素的空间关系分析 442 地理空间的距离度量地理空间的距离度量 地理空间中两点间的距离度量可以沿着实际的地球表面进行,也可以沿着地球椭球体的距离量算:1)大地测量距离 2)曼哈顿距离 3)旅行时间距离 4)词典编纂距离4基于要素的空间关系分析 图图3-15:地球上各种形式的距离:地球上各种形式的距离4基于要素的空间关系分析5网络结构模型 51网络空间网络空间 网络拓扑系统研究的创始人被公认为数学家Leonard Eule
22、r,他在1736年解决了当时一个著名的问题,叫做Konigsberg桥问题。图3-16-a显示了该桥的一个概略的路线图。该问题就是找到一个循环的路,该路只穿过其中每个桥一次,最后返回到起点。一些实验表明这项任务是不可能的,然而,从认为没有这样的路线到说明它的步骤并不是这样容易的。Euler建立了该桥的一个空间模型,该模型抽象出了所有的仅有的桥之间的拓扑关系,见图3-16-b。图图3-16:Konigsberg Park中的图形理论模型中的图形理论模型5网络结构模型 52 网络模型网络模型 在网络模型中,地物被抽象为链、节点等对象,同时要关注其间连通关系*。基于网络的空间模型与基于要素的模型在一
23、些方面有共同点,因为它们经常处理离散的地物,但是最基本的特征就是需要多个要素之间的影响和交互,通常沿着与它们相连接的通道。相关的现象的精确形状并不是非常重要的,重要的是具体现象之间距离或者阻力的度量。网络模型的典型的例子就是研究交通,包括陆上、海上及航空线路,以及通过管线与隧道分析水、汽油及电力的流动。5网络结构模型6时空模型 6 61 1时空数据模型概述时空数据模型概述 6 61 11 1研究概述研究概述 能够同时处理时间维度的GIS叫TGIS(Temporal GIS)。在GIS中,具有时间维度的数据可以分为两类,一类是可以称为结构化的数据,如一个测站历史数据的积累,它可以通过在属性数据表
24、记录中简单地增加一个时间戳(Time Stamp)实现其管理;另一类是非结构化的,最典型的例子是土地利用状况的变化(图3-17),描述这种数据,是TGIS数据模型的重点要解决的问题。图图3-17:土地利用随时间的推移而变化:土地利用随时间的推移而变化6时空模型 6 61 12 TGIS2 TGIS的研究思路的研究思路 对TGIS模型的研究可以本着两种思路进行平行探索:综合模型和分解模型。先用分解模型思路针对典型应用领域(如土地利用动态监测工作)进行全面研究,同时不断丰富、充实综合模型,最后得到一个比较完善的综合模型。6时空模型 62 时空数据模型设计的基本思想时空数据模型设计的基本思想 时空数
25、据模型是一种有效组织和管理时态地理数据,属性、空间和时间语义更完整的地理数据模型。一个合理的时空数据模型必须考虑以下几方面的因素:节省存储空间、加快存取速度、表现时空语义。时空语义包括地理实体的空间结构、有效时间结构、空间关系、时态关系、地理事件、时空关系。时空数据模型设计的基本指导思想:6时空模型(1)根据应用领域的特点和客观现实变化规律,折中考虑时空数据的空间/属性内聚性和时态内聚性的强度,选择时间标记的对象。(2)同时提供静态(变化不活跃)、动态(变化活跃)数据建模手段(静态、动态数据类型和操作)。6时空模型(3)数据结构里显式表达两种地理事件:地理实体进化事件和地理实体存亡事件。(4)
26、时空拓扑关系一般指地理实体空间拓扑关系的拓扑事件间的时态关系。时空拓扑关系揭示了地理实体在时间和空间上的相关性。为了有效地表达时空拓扑关系,需要存储空间拓扑关系的时变序列。6时空模型7三维模型 GIS处理的与地球有关的数据,即通常所说的空间数据,从本质上说是三维连续分布的。从事关于地质、地球物理、气象、水文、采矿、地下水、灾害、污染等方面的自然现象是三维的,当这些领域的科学家试图以二维系统来描述它们时,就不能够精确地反映、分析或显示有关信息。三维GIS的要求与二维GIS相似,但在数据采集、系统维护和界面设计等方面比二维GIS要复杂得多。71 三维三维GIS的功能的功能 三维GIS研究的内容以及
27、实现的功能包括:1)数据编码 2)数据的组织和重构 3)变换 4)查询 5)逻辑运算 6)计算 7)分析 8)建立模型。9)视觉变换 10)系统维护7三维模型 72 三维数据结构三维数据结构 三维数据结构同二维一样,也存在栅格和矢量两种形式。栅格结构使用空间索引系统,它包括将地理实体的三维空间分成细小的单元,称之为体元或体元素。存储这种数据的最简单形式是采用三维行程编码,它是二维行程编码在三维空间的扩充。三维矢量数据结构表示有多种方法,其中运用最普遍的是具有拓扑关系的三维边界表示法和八叉树表示法。7三维模型 721 八叉树三维数据结构八叉树三维数据结构 用八叉树来表示三维形体,既可以看成是四叉
28、树方法在三维空间的推广,也可以是用三维体素列阵表示形体方法的一种改进。7三维模型八叉树的逻辑结构如下:假设要表示的形体V可以放在一个充分大的正方体C内,C的边长为2的n次方,形体VC,它的八叉树可以用以下的递归方法来定义:八叉树的每个节点与C的一个子立方体对应,树根与C本身相对应,如果V=C,那么V的八叉树仅有树根,如果V不等于C,则C等分为八个子立方体,每个子立方体与树根的一个子节点相对应。只要某个子立方体不是完全空白或完全为V所占据,就要被八等分,从而对应的节点也就有了八个子节点。这样的递归判断、分割一直要进行到结点所对应的立方体或是完全空白,或者是完全为V占据,或是其大小已是预先定义的体
29、素大小,并且对它与V之交作一定的“舍入”,使体素或认为是空白的,或认为是V占据的。7三维模型 如此所生成的八叉树上的节点可分为三类:1)灰节点,对应的立方体部分地为V所占据;2)白节点,所对应的立方体中无V的内容;3)黑节点,所对应的立方体全为V所占据。后两类又称为叶结点。由于八叉树的结构与四叉树的结构是非常相似的,所以八叉树的存储结构方式可以完全沿用四叉树的有关方法。7三维模型 1)规则的八叉树 八叉树的存储结构是用一个有九个字段的记录来表示树中的每个结点,其中一个字段用来描述该结点的特性,其余的八段用来作为存放指向其八个子结点的指针。这是最普通使用的表示树形数据的存储结构方式。规则八叉树缺
30、陷较多,最大的问题是指针占用了大量的空间。因此,这种方式虽然十分自然,容易掌握,但在存储空间的使用率方面不很理想。7三维模型 2)线形八叉树 线形八叉树注重考虑如何提高空间利用率,用某一预先确定的次序遍历八叉树,将八叉树转换成一贯线形表,表的每个元素与一个结点相对应。线形八叉树不仅节省存储空间,对某些运算也较为方便。但是为此付出的代价是丧失了一定的灵活性,如图3-18和图3-19所示。7三维模型 3-18:体元形式的三维数据:体元形式的三维数据 图图3-19:图:图3-18的线性八叉树编码的线性八叉树编码7三维模型 3)一对八式的八叉树 一个非叶结点有八个子节点,为了确定起见,将它们分别标记为
31、0,1,2,3,4,5,6,7。从上面的介绍可以看到,如果一个记录与一个结点相对应,那么在这个记录中描述的是这个结点的八个子结点的特征值。而指针给出的则是该八个子结点所对应记录的存放处,而且还隐含地假设了这些子结点记录存放的次序。7三维模型 722 三维数据的显示三维数据的显示 三维显示通常采用截面图、等距平面、多层平面和立体块状图等多种表现形式,大多数三维显示技术局限于CRT屏幕和绘图纸的二维表现形式,人们可以观察到地理现象的三维形状,但不能将它们作为离散的实体进行分析,如立体不能被测量、拉伸、改变形状或组合。7三维模型 722三维数据的显示三维数据的显示 借助三维显示技术,通过离散的高程点形成等高线图、截面图、多层平面和透视图,可以把这些最初都是人工完成的工作,用各种计算机程序迅速高效地完成。图3-20给出了一种三维数据的表示方法。7三维模型 图图3-20:通过:通过“围墙围墙”状的剖面表示三维数据状的剖面表示三维数据7三维模型