1、表征地理空间内事物的数量、质量、分布、内在联系和变化规律的图形、图像、符号、文字和数据等统称为空间(地理)数据。空间数据是GIS的核心,也有人称它是GIS的血液,因为GIS操作对象是地理数据,因此,设计和使用GIS的第一步工作就是根据系统的功能,获取所需要的地理数据,并创建空间数据库。文件图表文件图表数据获取 原始原始数据数据存储检索空间查询空间分析数据编辑投影变换数据输出 制图、表格制图、表格 交互展示交互展示 结构化结构化数据数据空间数据库数据的处理与应用是GIS核心地理空间信息描述法地理空间信息描述法空间数据的基本特征空间数据的基本特征地理空间常规的地理空间信息描述法 地球空间模型 地理
2、空间坐标系 地图对地理空间的描述 遥感数据对地理空间的描述地理空间信息的数字化描述方法v地理空间范围 上至大气电离层,下至地幔莫霍面v地球空间模型 地球的自然表面 起伏不平,十分不规则 包括海洋底部、高山高原在内的固体地球表面 大地水准面 当海水处于完全静止的平衡状态时,从海平面延伸到所有大陆下部,而与地球重力方向处处正交的一个连续、闭合的水准面仍然起伏不平 地球自然表面相对抽象的面-大地水准面地球椭球体模型 以大地水准面为基准建立起来的地球椭球体模型 扁率=(a-b)/b平均椭球体全球范围内贴合大地基准面参考椭球体局部范围内贴合大地基准面1954 北京坐标系克拉索夫斯基椭球体1980 西安坐
3、标系数学模型 地球表面水准面大地水准面铅垂线地球椭球体确定地面点的位置,最直截了当的方法就是用地理坐标(纬度、经度)来表示地理坐标系直接建立在球体上用经度和纬度表达地理对象位置以地理极(北极、南极)为极点。地理极是地轴(地球椭球体的旋转轴)与椭球面的交点 含有地轴的平面,称为子午面 子午面与地球椭球体的交线,称为经线垂直地轴的平面与椭球体的交线为纬线地理坐标是一种球面坐标,难以进行距离、方向、面积等参数的计算,为此,最好把地面上的点表示在平面上,采用平面坐标系(笛卡儿平面直角坐标)。由于地球表面是不可展开的曲面,也就是说曲面上的各点不能直接表示在平面上,因此必须运用地图投影的方法,建立地球表面
4、和平面上点的函数关系,使地球表面上任一个由地理坐标(x,y)确定的点,在平面上必有一个与它相对应的点NSQ 赤道纬线本初子午线EA地图是现实世界的模型,它按照一定的比例、一定的投影原则,有选择地将复杂的三维现实世界的某些内容投影到二维平面媒介上,并用符号将这些内容要素表现出来。地图上各种内容要素之间的关系,是按照地图投影建立的数学规则,使地表各点和地图平面上的相应各点保持一定的函数关系,从而在地图上准确地表达地表空间各要素的关系和分布规律,反映它们之间的方向、距离和面积。在地图学上,把地理空间的实体分为点、线、面三种要素,分别用点状、线状、面状符号来表示。具体分述如下:点状要素。点状要素。指那
5、些占面积较小,不能按比例尺表示,又要定位的事物。因此,面状事物和点状事物的界限并不严格。如居民点,在大、中比例尺地图上被表示为面状地物,在小比例尺地图上则被表示为点状地物。对点状要素的质量和数量特征,用点状符号表示。线状要素线状要素对于地面上呈线状或带状的事物如交通线、河流、境界线、构造线等,在地图上均用线状符号来表示。当然,对于线状和面状实体的区分,也和地图的比例尺有很大的关系。如河流,在小比例尺的地图上,被表示成线状地物,而在大比例尺的地图上,则被表示成面状地物。通常用线状符号的形状和颜色表示质量的差别,用线状符号的尺寸变化(线宽的变化)表示数量特征。面状要素面状要素面状分布的地理事物很多
6、。其分布状况并不一样,有连续分布的,如气温、土壤等,有不连续分布的,如森林、油田、农作物等对于不连续分布或连续分布的面状事物的分布范围和质量特征,一般可以用面状符号表示。对于连续分布的面状事物的数量特征及变化趋势,常常可以用一组线状符号等值线表示,如等温线、等降水量线、等深线、等高线等,其中等高线是以后GIS建库中经常用到的一种数据表示方式。遥感影像对空间信息的描述主要是通过不同的颜色和灰度来表示的。这是因为地物的结构;成分、分布等的不同,其反射光谱特性和发射光诺特性也各不相同,传感器记录的各种地物在某一波段的电磁辐射反射能量也各不相同,反映在遥感影像上,则表现为不同的颜色和灰度信息。所以说,
7、通过遥感影像可以获取大量的空间地物的特征信息。对地理信息进行数字化描述,就是要使计算机能够识别地理事物的形状,为此,必须精确地指出空间模式如何处理、如何显示等。在计算机内描述空间实体有两种形式:显式描述和隐式描述。一条河流的表示 显示表示,就是栅格中的一系列像元。隐式表示,是由一系列定义了始点和终点的线及某种连接关系来描述,线的始点和终点坐标定义为一条表示河流及其河心洲形状的矢量计算机对地理实体的显式描述也称栅格数据结构,计算机对地理实体的隐式描述也称矢量数据结构。栅格和矢量结构是计算机描述空间实体的两种最基本的方式。空间数据的类型空间特征数据(定位数据)、时间属性数据(尺度数据)和专题属性数
8、据(非定位数据)。对于绝大部分地形信息系统的应用来说,时间和专题属性数据结合在一起共同作为属性特征数据,而空间特征数据和属性特征数据统称为空间数据(或地理数据)。1 1、空间特征、空间特征 空间特征又称定位特征或几何特征。数据的空间性是指这些数据反映现象的空间位置及空间位置关系。通常以坐标数据形式来表示空间位置,以拓扑关系来表示空间位置关系。2 2、属性特征、属性特征 数据的属性是指描述实体的特征,如实体的名称、类别、质量特征和数量特征等。属性数据本身属于非空间数据,但它是空间数据中的重要数据成分。3 3、时间特征、时间特征 空间数据的时间性是指空间数据的空间特征和属性特征随时间而变化。它们可
9、以同时随时间变化,也可以分别独立随时间变化。实体随时间的变化具有周期性,其变化的周期有超短周期的、短期的、中期的和长期的。空间特征是地理信息区别于其他信息的最重要的特征之一,地理信息的定位特征与时间过程相结合,大大提高了地理信息的应用价值。一般地,表示地理现象的空间数据可以细分为:类型数据:例如考古地点、道路线和土壤类型的分有等;面域数据:例如随机多边形的中心点、行政区域界线和行政单元等;网络数据:例如道路交点、街道和街区等;样本数据:例如气象站、航线和野外样方的分布区等;曲面数据:例如高程点、等高线和等值区域;文本数据:例如地名、河流名称和区域名称;符号数据:例如点状符号、线状符号和面状符号
10、(导线)等点 状 符 号线 状 符 号面 状 符 号地 点 名 称线 状 要 素 名 称区 域 名 称高 程 点等 值 线概 略 等 值 区气 象 站航 线样 方 分 布 区点 状 要 素线 状 要 素面 状 要 素区 域 中 心境 界 线行 政 单 元道 路 交 点街 道街 区6 06 15 9ABCD2 08 区2 09 区2 082 098 94 0 57 3雷 德 兰科 顿方 塔 内2 3 7商 业 区2 052 062 062 062 072 07.2 052 062 072 0 520620 7Metadata可以译成元数据,是描述数据的数据。在地理空间数据中,元数据说明数据内容、
11、质量、状况扣其他有关特征的背景信息。1)帮助数据生产单位有效地管用和维护空间数据、建立数据文档,并保证即使其主要工作人员离退时,也不会失去对数据情况的了解;2)提供有关数据生产单位数据存储、数据分类、数据内容、数据质量、数据交换网络及数据销售等方面的信息、便于用户查询检索地理空间数据;3)帮助用户了解数据,以便就数据是否能满足其需求作出正确的判断;4)提供有关信息,以便户处理和转换有用的数据。元数据是使数据充分发挥作用的重要条件之一,它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用相共享均有重要的作用。地理基础是地理信息数据表示格式与规范的重
12、要组成部分。统一的地图投影系统;统一的地理网格坐标系 统一的地理编码系统。它为各种地理信息的输入和输出以及匹配处理提供了一个统一的定位框架,从而使各种地理信息和数据能够具有共同的地理基础。地图投影的基本问题是如何将地球表面(椭球面或圆球面)表示到地图平面上。由于地球椭球面或圆球面是不可展开的曲面,即不能展开成平面,而地图又必须是一个平面,所以将地球表面展开成地图平面必然会产生裂隙或褶皱。那么采用什么样的数学方法将曲面展开成平面才能使其误差最小呢?回答是必须采用地图投影的方法,即用各种方法将地球表面的经纬网线投影到地图平面上。不同的投影方法具有不同性质和大小的投影变形,因此在各类地理信息系统的建
13、立过程中,选择恰当的地图投影系统就是首先必须要考虑的问题。直接建立在球体上的地理坐标,用经度和纬度表达地理对象位置建立在平面上的直角坐标系统,用(x,y)表达地理对象位置投影回顾旧知回顾旧知-坐标系坐标系1234地图投影与GIS5地图投影实质地图投影变形地图投影分类为什么要进行地图投影 不规则的地球表面可以用地球椭球体来替代 地理坐标为球面坐标,不方便进行距离、方位、面积等参数的量算与分析。地球椭球体为不可展曲面地图为平面,符合视觉心理,并易于进行距离、方位、面积等量算和各种空间分析地球椭球体是不可展曲面,而地图是一个平面,当球面展开为平面时必然产生破裂或褶皱。“地图投影”就是要解决球面不可展
14、的矛盾。地图投影地图投影保证信息保证信息连续连续性性、完整性完整性和和可测度性可测度性直接剥开,必然产生破直接剥开,必然产生破裂或褶皱,无法完整呈裂或褶皱,无法完整呈现原本的地球实际形态现原本的地球实际形态 简单地讲:地图投影的实质是将地球椭球面上的经纬网按照简单地讲:地图投影的实质是将地球椭球面上的经纬网按照一定的数学法则转移到平面上。一定的数学法则转移到平面上。具体来说:由于球面上一点的位置是用地理坐标具体来说:由于球面上一点的位置是用地理坐标(经度、纬经度、纬度度)表示,而平面上是用直角坐标表示,而平面上是用直角坐标(纵坐标、横坐标纵坐标、横坐标)或者极坐标或者极坐标(极径、极角极径、极
15、角)表示,所以要想将地球表面上的点转移到平面上,表示,所以要想将地球表面上的点转移到平面上,必须采用一定的数学方法来确定地理坐标与平面直角坐标或极必须采用一定的数学方法来确定地理坐标与平面直角坐标或极坐标之间的关系。坐标之间的关系。这种这种在球面和平面之间建立点与点之间函数关系的数学方法在球面和平面之间建立点与点之间函数关系的数学方法,称为称为地图投影地图投影。地图投影是保证地图精确度的重要的数学基础之一。可假设地球按比例尺缩小成一个透明的地球仪那样的球体,在其球心、球面或球外安放一个发光点,将地球仪上经纬线(连同控制点及地形、地物)投影到球外的平面上,即成为地图,如图所示:投影面局部投影变形
16、较大科学的投影方法是建立地球椭球面上的的经纬线网与平面上相应的经纬线网相应的数学基础,其实质就是建立地球椭球面上点的坐标(,)与平面上对应的坐标(x,y)的函数关系。.,;,fyfx由于要将不可展的地球椭球面展开成平面,且不能有断裂,那么图形必将在某些地方被拉伸,某些地方被压缩,因而投影变形是不可避免的。长度变形长度变形面积变形角度变形地图投影分类地图投影分类基于投影面与球面相关位置的分类基于投影面与球面相关位置的分类基于投影变形的分类基于投影变形的分类基于投影方程的分类基于投影方程的分类基于投影方法的分类基于投影方法的分类投影变形性质等角投影等积投影任意投影地图投影分类地图投影分类投影面及球
17、面的位置圆锥投影圆柱投影方位投影投影分类1:基于投影面与球面的位置形状不变面积不变特定方向距离不变等积投影任意投影等角投影1同纬度带内梯同纬度带内梯形面积不等的形面积不等的投影肯定不是投影肯定不是等积投影等积投影3投影为直线的投影为直线的经线经线(中央经中央经线线)上纬距不上纬距不等的投影肯定等的投影肯定不是不是等距投影等距投影2经纬网不是处经纬网不是处处正交的投影处正交的投影肯定不是肯定不是等角等角投影投影常见变形性质的确定常见变形性质的确定穆尔威投影:每一个小圆的圆面积相等,故为等积投影。可以保有正确的面积比例,中央地带最准确。经线和纬线都维持正确比例、一者放大,另一者呈反比的缩小。麦卡托
18、投影所有的小圆维持正圆,是典型的等角投影。纬度愈高,小圆的半径与面积愈大,表示高纬地区面积与长度被放大甚多。中心点至图上任何地点的距离,都具有相同、正确的比例,故为等距投影 纬线是一圈圈同心圆,经线由中心的北极向外呈放射状。世界图世界图全国图:正轴圆锥投影全国图:正轴圆锥投影地形图:高斯克吕格投影(分带)地形图:高斯克吕格投影(分带)南北半球(或两极)图:正轴方位投影、南北半球(或两极)图:正轴方位投影、亚洲图:斜轴方位投影亚洲图:斜轴方位投影 半球图半球图东西半球图:横轴方位投影东西半球图:横轴方位投影欧洲图:彭纳投影欧洲图:彭纳投影国内出版:等差分纬线多圆锥投影国内出版:等差分纬线多圆锥投
19、影国外出版:摩尔威特投影国外出版:摩尔威特投影地球仪:地球仪:普通多圆普通多圆锥投影锥投影海海 图:墨卡托投影图:墨卡托投影中国图中国图大洲图大洲图GIS中所存储记录、管理分析、显示应用的内容是地理信息,而地理信息的描述必须要有指定的地理参照系,且地理位置应以地理坐标或平面坐标的方式表达出来地图不仅是GIS的重要数据源,而且是表示地理信息的最佳媒介。由于GIS大多是以地图的方式来显示地理信息的,而地图是平面,地理信息则是在地球椭球体上的,因此,地图投影在GIS中是不可缺少的。地理基础地理基础(地图投影地图投影)(据边馥苓,(据边馥苓,1996)数据获取(数据源地图的投影)数据标准化预处理(按某
20、一参照系数字化)数据存储(统一的坐标基础)数据处理(投影转换)数据应用(检索查询、覆盖分析等)数据输出(具有相应投影的地图)n1:100万1:5000除1:100万外采用高斯克吕格投影n我国1:100万地形图采用Lambert投影,其分幅原则与国际地理学会规定的地球统一使用国际百万分之一地图投影保持一致n我国大部分省区图以及大多数这一比例尺的地图也采用Lambert投影和属于这一投影系统的Albers投影nLambert投影中,地球表面上两点间的最短距离(即大圆航线)表现为近于直线,这有利于地理信息系统中和空间分析量度的正确实施一、空间数据源二、空间数据采集 几何数据的采集 属性数据的采集三、
21、空间数据的检核地图数据地图数据野外实测数据野外实测数据数字数据数字数据影像数据影像数据多媒体数据多媒体数据文本数据文本数据扫描数字化扫描数字化摄影测量摄影测量野外数据采集野外数据采集键盘输入键盘输入数据交换数据交换空间数据库编编辑辑处处理理遥感图像处理遥感图像处理统计数据统计数据质质量量评评价价统计数据地图存储介质、现势性、投影转换遥感、航空影象和数据分辨率、变形规律、纠正、解译特征地面测量数字数据格式、精度多媒体,辅助GIS空间分析和查询GIS空间数据1.地图数据普通地图空间信息专题地图专题(属性)信息2.遥感(RS)影像数据数据图片3.实测数据空间数据:数字测图仪、GPS接收器属性数据:气
22、象气候数据等Global Positioning SystemRemote Sensing4.统计数据数字:人口、产值、收入、消费文字:土地类型、污染情况1、地图跟踪数字化2、地图扫描数字化小型扫描仪小型扫描仪工程扫描仪工程扫描仪扫描输入后的图像一般需要进行矢量化。通常是将地图扫描后,作为底图显示在屏幕上,用鼠标参照底图进行采点。由于鼠标定位不如数字化仪精确,所以一般用于输入一些示意图。纸地图扫描转换拼接子图块裁剪地图矢量图编辑矢量图合成图像处理矢量化扫描矢量化的主要步骤:分层采集:在进行数字化之前,首先要确定需要数字化哪些信息,GIS系统对空间数据往往采用分层管理,所以要确定输入哪些图层,以
23、及每个图层包含的具体内容。坐标系统、空间位置确定与匹配:确定坐标系统的方式 两次输入之间地图的位置匹配 不同时间输入,图件与数字化板可能相对于发生错动,导致前后两次录入的坐标就会偏移或旋转。输入至少三个定位点(Tick Marks),进行定位点坐标之间的关系进行匹配。选择输入模式:点模式(point mode)或流模式(stream mode)流模式可分为 距离流模式(Distance stream)和时间流模式(Time stream Mode)距离流模式(Distance stream)距离流方式记录数据是:按当前接收的点与上一点距离超过一定阈值才记录该点坐标值;时间流模式(Time st
24、ream Mode)采用时间流方式记录数据是:按照一定时间间隔对接收的点进行采样;采用时间流方式录入的优点是:当录入曲线比较平滑时,录入人员往往移动游标比较快,这样记录点的数目少;而曲线比较弯曲时,游标移动较慢,记录点的数目就多。而采用距离流方式时,容易遗漏曲线拐点,从而使曲线形状失真。所以在保证曲线的形状方面,时间流方式要优于距离流方式。图形拼接或边缘匹配处理图幅比较大或者使用小型数字化仪时1)输入、输出标准分幅的地形图 Original two map sheetsTwo sheets brought togethershowing discontinuitiesDerived singl
25、e sheet withedges adjusted空间数据定位的不准确伪节点(Pseudo Node)伪节点使一条完整的线变成两段 2)悬挂节点(Dangling Node)伪节点3)“碎屑”多边形或“条带”多边形(Sliver Polygon)一般由于重复录入引起,由于前后两次录入同一条线的位置不可 能完全一致,造成了“碎屑”多边形。4)不正规的多边形(Weird Polygon)是由于输入线时,点的次序倒置或者位置不准 确引起的(a)正常多边形(b)不正规多边形上述的错误,一般在建立拓扑的过程中都会发现,而且需要手工编辑修改;悬挂节点的问题则可以由软件系统自动修改。通常的实现办法是设置一
26、个“容许误差 Tolerance”,当节点之间、或者节点与线之间的距离小于此数值后,即自动连接悬挂接点。在图形错误修改完毕之后,可以建立图形数据的拓扑关系。拓扑关系的建立通常由计算机自动生成,目前大多数GIS软件具有完善的拓扑功能;每一次修改数据错误、或增加、减少图形数据后(即对矢量数据进行编辑后),对具有拓扑关系的矢量数据需要重新建立他们之间的拓扑关系 如在ArcInfo 系统中,建立拓扑关系的命令为:Build point;Build line;build polygon;Clean point;Clean line;Clean polygon属性数据的录入主要采用键盘输入的方法,有时也可
27、以辅助于字符识别软件。当属性数据的数据量较小时,可以在输入几何数据的同时,用键盘输入;但当数据量较大时,一般与几何数据分别输入,并检查无误后转入到数据库中。当空间实体的几何数据与属性数据连接起来之后,就可进行各种GIS的操作与运算了。411921 ID面积周长土壤类型443588018921058025116281140212125265015土壤类型名称pH15Black soil6.521Brown soil6.025Red soil5.0 在关系数据库中存储空间对象的属性特征值1、空间数据输入的误差2、空间数据的检查误差来源数据采集人为使用数据前处理野外测量遥感仪器人为误差数据转换数据输
28、入遥感解译理解与随意性数据处理过程误 差 来 源数据搜集野外测量误差:仪器误差、记录误差遥感数据误差:辐射和几何纠正误差、信息提取误差地图数据误差:原始数据误差、坐标转换、制图综合及印刷 数据输入数字化误差:仪器误差、操作误差不同系统格式转换误差:栅格-矢量转换、三角网-等值线转换数据存储数值精度不够空间精度不够:每个格网点太大、地图最小制图单元太大 数据处理分类间隔不合理多层数据叠合引起的误差传播:插值误差、多源数据综合分析误差,比例尺太小引起的误差数据输出输出设备不精确引起的误差输出的媒介不稳定造成的误差数据使用对数据所包含的信息的误解对数据信息使用不当 几何误差 属性误差 时间误差 逻辑
29、误差1)逻辑误差 停车场 停车场 桥 森林森林水库水库逻辑错误纠正后2)属性错误 属性错误 纠正后3)时间错误 时间错误 纠正后4)几何错误 点误差 线误差商业区住宅区住宅区商业区住宅区1972年 火场1989年 火场1989年 火场1972年 火场幼树阔叶林幼树阔叶林数据格式转换(Format conversion)数据输入(Data Input)边缘匹配(Edge matching)数据缩编与概化(Data reduction and generalization)插值(Interpolation)航片解译(Photo interpretation)Vector superimposedo
30、n rasterResulting rasterOriginal data setData after onethinning passFinal skeletonVector toraster conversionSkeletonizing矢量栅格数据转化中的误差地图固定不牢。如果地图发生了移动需要重新输入控制点在数字化的过程中,图纸可能发生伸展或收缩等变形,导致数字化点位偏移了原来位置。用户操作不当导致线段交叉点处的“不足”、“过头”或“细缝”空间数据输入过程中常见的误差 polygon not closed;sliver;gap;attribute errors,etc.设定坐标距离容限值(fuzzy tolerance)节点连接 拓扑关系重建(Re-building topology)边缘配准中的误差Original two map sheetsTwo sheets brought togethershowing discontinuitiesDerived single sheet withedges adjusted在自动或手工处理地图的合并过程中,常出现误差跨越地图边界处的目标在综合GIS数据库中常常会导致误差