1、第三章第三章 空间数据的表达空间数据的表达 地理系统与地理现象地理系统与地理现象 空间对象及其关系空间对象及其关系 空间数据模型与数据结构空间数据模型与数据结构3.1 3.1 地理系统与地理现象地理系统与地理现象一、地理系统一、地理系统 地理系统 地球内部系统 天体系统 自然环境系统 社会经济环境系统地貌、土壤、气候、土地利用、水文、生物、海洋人口、工业、农业、交通运输、建筑、商业、贸易业、科学、教育、卫生、体育、金融、财政人地关系系统二、地理现象二、地理现象空间数据地图遥感影像特征关系行为观察选择抽象综合测量:位置编码:属性建立关系:表达 3.2 3.2 空间对象及其关系空间对象及其关系 空
2、间对象及其类型空间对象及其类型 空间对象表达空间对象表达 空间对象之间的关系空间对象之间的关系 0 点:零维0 线:一维0 面:二维0 体:三维0 时间:通常以第四维表达,但目前 GIS还 很难处理时间属性。0 空间对象的维数与比例尺是相关的 空间对象空间对象(空间实体空间实体)是空间现象的抽象是空间现象的抽象 空间实体类型空间实体类型 二、空间对象的表达二、空间对象的表达 矢量表达法矢量表达法 (Vector Representation)栅格表达法栅格表达法 (Raster Representation)不规则三角网表达法不规则三角网表达法 (TIN Representation)矢量表达
3、法矢量表达法(point)点在二维、三维欧氏空间中分别用(x,y)和(x,y,z)来表示。在数学上,点没有大小、方向。实体点(Entity point)注记点(Text point)内点(Label point)结点(Node)角点(Vertex)或中间点 表示空间中的线划要素,它包括线段、边界、弧段、表示空间中的线划要素,它包括线段、边界、弧段、网络等。在二维、三维欧氏空间中用有序的坐标对表网络等。在二维、三维欧氏空间中用有序的坐标对表示:示:一维空间对象自身的空间关系主要有如下几种一维空间对象自身的空间关系主要有如下几种 X1,Y1Xn,Yn 一维空间对象一维空间对象Line,Arc,Ne
4、tLine,Arc,Net)1(),),.(,(),()1(),(),.,(),(2221112211nzyxzyxzyxnyxyxyxnnnnnX1,Y1Xn,YnBCDEFGHIJKA二维空间对象面二维空间对象面表示空间的一个面状要素,在二维欧氏平面上是表示空间的一个面状要素,在二维欧氏平面上是指由指由所包围的空间区域。所包围的空间区域。地块地块湖泊湖泊行政区域界行政区域界线线 一般分为连续面和不连续面一般分为连续面和不连续面三维空间对象体三维空间对象体 表达三维空间中的现象和物体,是由一组表达三维空间中的现象和物体,是由一组或多组空间曲面所包围的空间对象,它具或多组空间曲面所包围的空间对
5、象,它具有体积、长度、宽度、高度、空间曲面的有体积、长度、宽度、高度、空间曲面的面积、空间曲面的周长等属性。面积、空间曲面的周长等属性。栅格表达法栅格表达法 TIN TIN表达方法表达方法三、空间对象关系三、空间对象关系 描述空间对象之间的空间相互作用关系 方法 绝对关系:坐标、角度、方位、距离等;相对关系:相邻、包含、关联等 相对关系类型拓扑空间关系拓扑空间关系:描述空间对象的相邻、包含等:描述空间对象在空间上的排列次序,如前后、左右、东、西、南、北等。:描述空间对象之间的距离等。拓扑空间关系拓扑空间关系 基于点集拓扑理论基于点集拓扑理论 拓扑元素:拓扑元素:点:孤立点、线的端点、面的首尾点
6、、链的连接点 线:两结点之间的有序弧段,包括链、弧段和线段 面:若干弧段组成的多边形 基本拓扑关系基本拓扑关系 关联:不同拓扑元素之间的关系 邻接:相同拓扑元素之间的关系 包含:面与其他元素之间的关系 层次:相同拓扑元素之间的层次关系 拓扑元素量之间的关系:欧拉公式 点、线、面之间的拓扑关系点、线、面之间的拓扑关系拓扑拓扑指指图形保持连续状态下变形图形保持连续状态下变形(将橡皮任意拉伸,压缩,将橡皮任意拉伸,压缩,但不能扭转或折叠但不能扭转或折叠),但图形关系不变的性质。,但图形关系不变的性质。拓扑变换拓扑变换(橡皮变换)(橡皮变换)基本拓扑关系基本拓扑关系N1A3N2N3N4P1P2P3A1
7、A2A4A5A6N5A7P4拓扑邻接:拓扑邻接:结点结点N1N1与结点与结点N2N2、N3N3相相邻,多边形邻,多边形P1P1与与P2P2、P3P3相邻。相邻。拓扑关联:拓扑关联:N1N1结点与弧段结点与弧段A1A1、A5A5、A3A3相关联,多边形相关联,多边形P2P2与弧段与弧段A3A3、A5A5、A6A6相关联相关联 。拓扑包含:拓扑包含:多边形多边形 B B 和和 C C 被多边被多边形形 A A 所包含所包含BCA空间关系的形式化表示3.3 3.3 空间数据模型与结构空间数据模型与结构 空间数据模型:空间数据模型:矢量模型、栅格模型、不规则三角网模型 空间数据结构:空间数据结构:矢量
8、数据结构、栅格数据结构、矢栅一 体化数据结构、镶嵌数据结构 数据模型与数据结构数据模型与数据结构 根据一定方案建立的数据逻辑组织方式表达数据模型的某种数据组织方式 矢量模型包括(二)、矢量数据结构(二)、矢量数据结构56100065550005810006575000HouseRiverPine ForestEucalyptsEPEHHReal WorldVector Representation点:坐标对(点:坐标对(x,y)+识别符识别符线:坐标对系列线:坐标对系列(x1,y1).(xn,yn)及及有关属性、其它属性有关属性、其它属性面:首尾相同的坐标串面:首尾相同的坐标串关系表关系表几何
9、位置坐标文件几何位置坐标文件连连接接矢量数据表示时矢量数据表示时应考虑以下问题应考虑以下问题:矢量数据自身的存贮和处理。矢量数据自身的存贮和处理。与属性数据的联系。与属性数据的联系。矢量数据之间的空间关系矢量数据之间的空间关系(拓扑关系拓扑关系)。数据组织数据组织 数据编码方式数据编码方式完整的多边形结构完整的多边形结构 (spaghetti-意大利式细面条意大利式细面条空心粉空心粉)基于弧基于弧结点结构(拓扑结构)结点结构(拓扑结构)双重独立地图编码(拓扑结构)双重独立地图编码(拓扑结构)(DIME)(DIME)多边形转换器(拓扑结构)多边形转换器(拓扑结构)(POLYVRT)(POLYVR
10、T)spaghetti 只记录空间对象的位置坐标和属性信息,不记录拓只记录空间对象的位置坐标和属性信息,不记录拓扑关系。又称面条结构。扑关系。又称面条结构。存储:存储:独立存储:空间对象直接跟随它的空间坐标独立存储:空间对象直接跟随它的空间坐标 点位字典:点坐标独立存储,线、面由点号组成点位字典:点坐标独立存储,线、面由点号组成 特征特征 无拓扑关系,主要用于显示、输出及一般查询无拓扑关系,主要用于显示、输出及一般查询 公共边重复存储,存在数据冗余,难以保证数据公共边重复存储,存在数据冗余,难以保证数据独立性和一致性独立性和一致性 多边形分解和合并不易进行,邻域处理较复杂多边形分解和合并不易进
11、行,邻域处理较复杂 处理嵌套多边形比较麻烦处理嵌套多边形比较麻烦 适用范围:适用范围:制图及一般查询,不适合复杂的空间分析制图及一般查询,不适合复杂的空间分析1063642363642310Original mapMap expressed inCartesian coordinatesFeatureNumberLocationPointLinePolygonX Y(single point)X1 Y1,X2 Y2,Xn Yn(string)X1 Y1,X2 Y2,X1 Y1(closed loop)X1 Y1,X2 Y2,X1 Y1(closed loop)10236364 独立存储独立存储
12、标识码标识码属性码属性码 空间对象编码唯一空间对象编码唯一连接几何和属性数据连接几何和属性数据数据库点:点号文件线:点号串面:点号串点号XY1112223344n5566存储方法存储方法点:(x,y)线:(x1,y1),(x2,y2),(xn,yn)面:(x1,y1),(x2,y2),(x1,y1)两种编码的比较两种编码的比较 拓扑数据结构拓扑数据结构 不仅表达几何位置和属性,还表示空间关系 表达对象之间的关联关系关联关系 表达方式全显式表达部分显式表达 拓扑结构:拓扑结构:全显式表达全显式表达N1B2N2N4N3B3B4B1A1A2A6A5A4A3A7A8N5A8B1B2B3B4A1A2A3
13、A4A5A6A7N1N2N3N4N5M面弧点面-弧拓扑面弧段弧-点拓扑弧起点弧-面拓扑弧左面点-弧拓扑点弧段终点右面指结点、弧段、面域之间的所有指结点、弧段、面域之间的所有拓扑关联关系拓扑关联关系都用都用关系表表达出来。关系表表达出来。弧弧结点结构结点结构 Arc-node StructureArc-node StructureN3N1N2N6N5N4a1a2a3a4a5a6ABCPolygon topologyPolygonArcsABCa1,a5,a3a2,a5,0,a6a60Outside mapNode topologyNodeArcsN1N2N3a1,a3,a4a1,a2,a5a2,
14、a3,a5N4a4N5N60a6Arc coordinatesArcStartX,Ya1a2a340,6070,5010,25a440,60a5a610,2555,27IntermediateX,YEndX,Y70,6070,10;10,1010,6030,5020,27;30,30;50,3255,15;40,15;45,2770,5010,2540,6030,4070,5055,27Arc topologyArcStartNodea1a2a3N1N2N3a4N4a5a6N3N6EndNodeLeftPolygonRightPolygonN2N3N1N1N2N6000AABABAABC属性数
15、据表达与组织属性数据表达与组织q属性特征类型l 类别特征:是什么l 说明信息:同类目标的不同特征q属性特征表达l 类别特征:类型编码l 说明信息:属性数据结构和表格q属性表的内容取决于用户q图形数据和属性数据的连接通过目标识别符或内部记录号实现点状对象目标标识目标标识地物编码坐 标关联的线目标精度控制点等级测量单位测量年限线状对象目标标识目标标识地物编码坐 标串起点、终点、左面、右面路面材料等级修建时间宽度管养单位面状对象目标标识目标标识地物编码边界目标号建筑日期所有者建筑面积建筑单位结构空间对象地物编码地物名称制图颜色几何类型制图符号编码属性表明地物类型特征与制图属性(一)、概述(一)、概述
16、 栅格模型的基本特征(栅格模型的基本特征(2 2)点实体点实体可用一个元表示;线实体线实体可用在一定方向上彼此连接成串的元集合表示;面实体面实体由聚集在一起的相邻象元的集合表示;EEERHRRRRRRRRRPRPPPPPEEEHEEReal WorldRaster Representation(二)、数据组织(二)、数据组织123123地形特征地形特征土壤类型土壤类型森林类型森林类型建筑物建筑物Real world 栅格数据模型对实体世界的表示ZYX 组织方法方法方法c c:以层为基础,以层为基础,每层内以多边形为每层内以多边形为序记录多边形的属序记录多边形的属性值和多边形内各性值和多边形内各
17、像元的坐标像元的坐标。节约。节约用于存储属性的空用于存储属性的空间。将同一属性的间。将同一属性的制图单元的制图单元的n n个像元个像元的属性只记录一次,的属性只记录一次,便于地图分析和制便于地图分析和制图处理。图处理。方法方法a a:以像元为记录序列,不同层上同一像元位置上以像元为记录序列,不同层上同一像元位置上的各属性值表示为一个列数组。的各属性值表示为一个列数组。N层中层中只记录一层的像只记录一层的像元位置,元位置,节约大量存储空间,节约大量存储空间,栅格个数很多。栅格个数很多。方法方法b b:每层每个像元的位置、属性一一记每层每个像元的位置、属性一一记录,录,结构最简单,但浪费存储。结构
18、最简单,但浪费存储。(三)、栅格单元尺寸及代码确定(三)、栅格单元尺寸及代码确定1)原则原则:应能:应能有效地逼近空间对象的分布有效地逼近空间对象的分布特征,又减少数据的冗余度。特征,又减少数据的冗余度。格网太大,忽略较小图斑,信息丢失。格网太大,忽略较小图斑,信息丢失。一般讲,实体特征愈复杂,栅格尺寸越小,一般讲,实体特征愈复杂,栅格尺寸越小,分辨率愈高,然而栅格数据量愈大(按分分辨率愈高,然而栅格数据量愈大(按分辨率的平方指数增加)计算机成本就越高,辨率的平方指数增加)计算机成本就越高,处理速度越慢。处理速度越慢。2)方法方法:用保证最小多边形的精度标准来:用保证最小多边形的精度标准来确定
19、尺寸经验公式:确定尺寸经验公式:h h为栅格单元边长为栅格单元边长 AiAi为区域所有多边形的面积。为区域所有多边形的面积。栅格代码(属性值)确定栅格代码(属性值)确定 当一个栅格单元内有多个可选属性值当一个栅格单元内有多个可选属性值时,按一定方法来确定栅格属性值。时,按一定方法来确定栅格属性值。中心点法中心点法 面积占优法面积占优法 重要性法重要性法 长度占优法长度占优法AB ba2 2 1 1CoverageMap layerZoneOrientationResolutionTitleMap layerMap layerValueLabelZoneZoneLocationLocationL
20、ocationRowcoordinateColumncoordinate 直接栅格编码直接栅格编码:将栅格数据看作一个数据矩阵,将栅格数据看作一个数据矩阵,逐行记录代码数据。逐行记录代码数据。每行都从左到右记录;每行都从左到右记录;AAAAABBBAABBAABBAAAAABBBAABBAABB奇数行从左到右,偶数行从右到左奇数行从左到右,偶数行从右到左特点特点:最直观、最基本的网格存贮结构,没有进行任最直观、最基本的网格存贮结构,没有进行任何数据压缩处理。但栅格数据量大,格网数多,数据量何数据压缩处理。但栅格数据量大,格网数多,数据量大。大。若矩阵的每个元素用一个双字节表示,则一个图层的若矩
21、阵的每个元素用一个双字节表示,则一个图层的全栅格数据所需的存储空间为全栅格数据所需的存储空间为m(m(行行)n(列列)2(2(字字节节)。A A A A A B B B A A B B A A B B 由于地理数据往往有较强的相关性,即相邻象元由于地理数据往往有较强的相关性,即相邻象元的值往往是相同的。的值往往是相同的。所以,出现了各种栅格数据压所以,出现了各种栅格数据压缩方法。缩方法。数据压缩是将数据表示成更紧凑的格式以减少存数据压缩是将数据表示成更紧凑的格式以减少存储空间的一项技术储空间的一项技术。分为:。分为:无损压缩无损压缩:在编码过程中信息没有丢失,经过解:在编码过程中信息没有丢失,
22、经过解码可恢复原有的信息码可恢复原有的信息-信息保持编码信息保持编码。有损压缩有损压缩:为最大限度压缩数据,在编码中损失:为最大限度压缩数据,在编码中损失一些认为不太重要的信息,解码后,这部分信息无一些认为不太重要的信息,解码后,这部分信息无法恢复。法恢复。-信息不保持编码信息不保持编码。游程编码游程编码 块码块码游程编码向二维扩展游程编码向二维扩展 采用采用方形区域方形区域作为记录单元,每个记录单元包括相邻的若干作为记录单元,每个记录单元包括相邻的若干栅格。栅格。数据对组成数据对组成:(初始行、列,半径,属性值):(初始行、列,半径,属性值)如:(如:(1,1,1,0),(1,2,2,4),
23、(1,4,1,7),(1,5,1,7)1,1,1,0),(1,2,2,4),(1,4,1,7),(1,5,1,7)依次扫描,编过的不重复。依次扫描,编过的不重复。1 2 3 4 5 6 7 8 1 0 4 4 7 7 7 7 72 4 4 4 4 4 7 7 73 4 4 4 4 8 8 7 7 4 0 0 4 8 8 8 7 75 0 0 8 8 8 8 7 86 0 0 0 8 8 8 8 87 0 0 0 0 8 8 8 88 0 0 0 0 0 8 8 8特点特点:具有可变分辨率,即当属性变化具有可变分辨率,即当属性变化小时图块大,对于大块图斑记录小时图块大,对于大块图斑记录单元大,分
24、辨率低,压缩比高。单元大,分辨率低,压缩比高。小块图斑记录单元小,分辨率高,小块图斑记录单元小,分辨率高,压缩比低压缩比低与游程编码类似,随图形复杂程与游程编码类似,随图形复杂程度的提高而降低分辩率。度的提高而降低分辩率。四叉树编码四叉树编码 基本思想:基本思想:将将2 2n n2 2n n象元组成的图像象元组成的图像(不足的用背景补上不足的用背景补上)按四个象限进行递归分割,按四个象限进行递归分割,并判断属性是否单一,并判断属性是否单一,单一:不分。单一:不分。不单一:递归分割。不单一:递归分割。最后得到一颗四分叉的倒向树。最后得到一颗四分叉的倒向树。四叉树的树形表示:四叉树的树形表示:用一
25、倒立树表示这种分割和分割结果。用一倒立树表示这种分割和分割结果。根根:整个区域:整个区域高高:深度、分几级,几次分割:深度、分几级,几次分割叶叶:不能再分割的块:不能再分割的块树叉树叉:还需分割的块:还需分割的块 每个树叉均有每个树叉均有4 4个分叉,叫四叉树。个分叉,叫四叉树。一种一种可变分辨率可变分辨率的的非均匀网格非均匀网格系统。系统。是最有效的栅格数据压缩编码方法之一是最有效的栅格数据压缩编码方法之一 AAAAABBBAABBAABB0123 常规四叉树常规四叉树(common quadtree(common quadtree)记录这棵树的叶结点外,中间结点,结点之间的联系用指针记录这
26、棵树的叶结点外,中间结点,结点之间的联系用指针联系,每个结点需要联系,每个结点需要6 6个变量:个变量:父结点指针、四个子结点的指针父结点指针、四个子结点的指针和本结点的属性值。和本结点的属性值。产生四叉树的方法:产生四叉树的方法:“Top-down”Top-down”和和“Bottom-up”Bottom-up”特点:特点:指针不仅指针不仅增加了数据的存储量增加了数据的存储量,还增加了操作的,还增加了操作的复复杂性杂性.所以,所以,常规四叉树并不广泛用于存储数据常规四叉树并不广泛用于存储数据,其价值在,其价值在于建立索引文件,进行数据检索。于建立索引文件,进行数据检索。11 34567 89
27、101112 13 141516171819NW NE SW SE12345678910111213 1415161718 线性四叉树(线性四叉树(Linear quadtreeLinear quadtree)记录叶结点的记录叶结点的位置,深度位置,深度(几次分割)和属性。(几次分割)和属性。地址码(定位码、地址码(定位码、MortonMorton码)码)四进制、十进制四进制、十进制优点:优点:存贮量小,只对叶结点编码,节省了大量中间结点存贮量小,只对叶结点编码,节省了大量中间结点的存储,地址码隐含着结点的分割路径和分割次数。的存储,地址码隐含着结点的分割路径和分割次数。线性四叉树可直接寻址,
28、通过其坐标值直接计算其线性四叉树可直接寻址,通过其坐标值直接计算其MortonMorton码,而不用建立四叉树。码,而不用建立四叉树。定位码容易存储和执行实现集合相加等组合操作。定位码容易存储和执行实现集合相加等组合操作。四进制的四进制的MortonMorton码码方法之一:自上而下分裂方法之一:自上而下分裂用用0 0、1 1、2 2、3 3共共4 4个数字来表示每次分裂后产生左个数字来表示每次分裂后产生左上、右上、左下、右下四象限的标号。上、右上、左下、右下四象限的标号。每分割一次,标号就增加一位。每分割一次,标号就增加一位。任意节点的标号(任意节点的标号(MortonMorton码),表示
29、为码),表示为M MQ Q,最后节最后节点的点的M MQ Q是所有各位上相应象限值的顺序排列:是所有各位上相应象限值的顺序排列:M MQ Q=q=q1 1q q2 2q q3 3 q qk k=q=q1 1 10 10k k+q+q2 2 10 10k-1k-1+q+q3 3 1010k-2k-2 +q+qk k 0 1011121320 21021121221322233031 320 32132232333 012310 11 12 1320210 211 21221322 2330 31320 321322 32333方法之二:自下而上合并方法之二:自下而上合并 计算每个格网的计算每个格
30、网的MortonMorton码,然后按一定的扫描方码,然后按一定的扫描方式自下而上合并建立四叉树。式自下而上合并建立四叉树。计算每个栅格对应的计算每个栅格对应的MQMQ MQ=2 MQ=2*Ib+JbIb+Jb I,JI,J化为二进制化为二进制Ib,JbIb,Jb 看最大的看最大的I,J,I,J,不足在前补零。不足在前补零。其其始行列号从始行列号从0 0计。计。按码的升序排成线性表,放在连续的内存块中。按码的升序排成线性表,放在连续的内存块中。依次检查每四个相邻的依次检查每四个相邻的MQMQ对应的属性值,相同合并对应的属性值,相同合并(不同码位去掉),不同则存盘(不同码位去掉),不同则存盘,直
31、到没有能够合并直到没有能够合并的子块为止。的子块为止。0 1 2 3 4 5 6 7 0 1 10 11 100 101 110 111 0 0 000 001 010 011 100 101 110 111 1 1 002 003 012 013 102 103 112 113 2 10 020 021 030 031 120 121 130 131 3 11 022 023 032 033 122 123 132 133 4 100 200 201 210 211 300 301 310 311 5 101 202 203 212 213 302 303 312 313 6 110 220
32、 221 230 231 320 321 330 331 7 111 222 223 232 233 322 323 332 333列号列号 MQ码MQMQ码的对比表。码的对比表。十进制的十进制的MortonMorton码码-MDMD一种按位操作的方法一种按位操作的方法:如行为如行为2 2、列为、列为3 3的栅格的的栅格的MDMD步骤:步骤:(1)(1)行、列号为二进制行、列号为二进制 Ib=1 0 JbIb=1 0 Jb=1 1=1 1(2)I(2)I行行J J列交叉列交叉 1 1 0 1 =131 1 0 1 =13(3)(3)再化为十进制再化为十进制.实质上是按左上、右上、左下、右下的顺
33、序,实质上是按左上、右上、左下、右下的顺序,从零开始对每个栅格进行自然编码。从零开始对每个栅格进行自然编码。A 0A 1A 4A 5A 2 B 3B 6B 7A 8A 9B 12B 13A 10A 11B 14B 15四进制四进制MortonMorton码直观上切合四叉码直观上切合四叉树分割,但许多语言不支持四进树分割,但许多语言不支持四进制变量,需用十进制表示制变量,需用十进制表示MortonMorton码码.矢量、栅格数据结构的选择矢量、栅格数据结构的选择 在在GISGIS建立过程中,应根据建立过程中,应根据应用目的应用目的和和应用特点应用特点、可能获得的可能获得的数据精度数据精度以及地理
34、信息系统以及地理信息系统软件和硬软件和硬件件配置情况,选择合适的数据结构。配置情况,选择合适的数据结构。栅格结构栅格结构:大范围小比例尺的自然资源、环境、大范围小比例尺的自然资源、环境、农林业等区域问题的研究。农林业等区域问题的研究。矢量结构:城市分区或详细规划、土地管理、矢量结构:城市分区或详细规划、土地管理、公用事业管理等方面的应用。公用事业管理等方面的应用。三、不规则镶嵌模型三、不规则镶嵌模型 用来进行镶嵌(Tesselations)的小面块具有不规则的形状或边界。其最典型的数据模型是和。TIN模型模型TIN 的拓扑关系的拓扑关系X-Y Coordinatesnode#coordinates12311.x1,y1x2,y2x3,y3.x11,y11Z Coordinatesnode#z_value12311.z1.z2z3z111236587911104ABCDEFGHIJKLMNEDGESadjacentABCDEFGHIJKLMNB,KA,C,LB,DC,E,LD,FE,GF,H,MG,IH,J,NI,KA,J,NB,D,MG,L,NI,K,MNODESnode#ABCDEFGHIJKLMN1,6,71,7,81,2,82,8,92,3,93,4,94,9,104,5,105,10,115,6,116,7,117,8,97,9,107,10,11 思思 考考 题题