1、第五章 空间数据采集与处理第一节 数据源种类第二节 空间数据采集第三节 空间数据的编辑与处理第四节 空间数据质量及其精度分析n地理信息系统的数据源是指建立地理信息系统数据库所需要的各种类型数据的来源。n地理信息系统的数据源是多种多样的,并随系统功能的不同而不同 第一节 数据源种类一、地图地图二、遥感影象数据二、遥感影象数据三、统计数据统计数据四、实测数据四、实测数据五、数字数据五、数字数据六、各种文字报告和立法文件六、各种文字报告和立法文件一、地图地图n各种类型的地图是GIS最主要的数据源,因为地图是地理数据的传统描述形式n是具有共同参考坐标系统的点、线、面的二维平面形式的表示,内容丰富n图上
2、实体间的空间关系直观,而且实体的类别或属性可以用各种不同的符号加以识别和表示。n我国大多数的GIS系统其图形数据大部分都来自地图。地图应用注意n地图存储介质的缺陷 由于地图多为纸质,由于存放条件的不同,都存在不同程度的变形,具体应用时,须对其进行纠正。n地图现势性较差 由于传统地图更新需要的周期较长,造成现存地图的现势性不能完全满足实际的需要。n地图投影的转换 由于地图投影的存在,使得对不同地图投影的地图数据进行交流前,须先进行地图投影的转换。二、遥感影象数据遥感影象数据n遥感影象是GIS中一个极其重要的信息源。n通过遥感影象可以快速、准确地获得大面积的、综合的各种专题信息,航天遥感影象还可以
3、取得周期性的资料,这些都为GIS提供了丰富的信息。n但是因为每种遥感影象都有其自身的成像规律、变形规律,所以对其的应用要注意影象的纠正、影象的分辨率、影象的解译特征等方面的问题。n三、统计数据三、统计数据n国民经济的各种统计数据常常也是GIS的数据源。如人口数量、人口构成、国民生产总值等等。n四、实测数据四、实测数据n各种实测数据特别是一些GPS点位数据、地籍测量数据常常是GIS 的一个很准确和很现势的资料。n五、数字数据五、数字数据n目前,随着各种专题图件的制作和各种GIS系统的建立,直接获取数字图形数据和属性数据的可能性越来越大。数字数据也成为GIS信息源不可缺少的一部分。但对数字数据的采
4、用需注意数据格式的转换和数据精度、可信度的问题。六、各种文字报告和立法文件六、各种文字报告和立法文件n各种文字报告和立法文件在一些管理类的GIS系统中,有很大的应用,如在城市规划管理信息系统中,各种城市管理法规及规划报告在规划管理工作中起着很大的作用。n对于一个多用途的或综合型的系统,一般都要建立一个大而灵活的数据库,以支持其非常广泛的应用范围。而对于专题型和区域型统一的系统,则数据类型与系统功能之间具有非常密切的关系。第二节 空间数据采集一、属性数据的采集属性数据的采集二、图形数据的采集二、图形数据的采集 一、属性数据的采集一、属性数据的采集n属性数据即空间实体的特征数据,一般包括名称、等级
5、、数量、代码等多种形式,属性数据的内容有时直接记录在栅格或矢量数据文件中,有时则单独输入数据库存储为属性文件,通过关键码与图形数据相联系。n对于要输入属性库的属性数据,通过键盘则可直接键入。n对于要直接记录到栅格或矢量数据文件中的属性数据,则必须先对其进行编码,将各种属性数据变为计算机可以接受的数字或字符形式,便于GIS存储管理。1、编码原则n(1)编码的系统性和科学性。n(2)编码的一致性。n(3)编码的标准化和通用性。n(4)编码的简捷性。n(5)编码的可扩展性。2、编码内容n(1)登记部分,用来标识属性数据的序号,可以是简单的连续编号,也可划分不同层次进行顺序编码;n(2)分类部分,用来
6、标识属性的地理特征,可采用多位代码反映多种特征;n(3)控制部分,用来通过一定的查错算法,检查在编码、录入和传输中的错误,在属性数据量较大情况下具有重要意义。3、编码方法n(1)列出全部制图对象清单。n(2)制定对象分类,分级原则和指标将制图对象进行分类、分级。n(3)拟定分类代码系统。n(4)设定代码及其格式。设定代码使用的字符和数字、码位长度、码位分配等。n(5)建立代码和编码对象的对照表这是编码最终成果档案,是数据输人计算机进行编码的依据。耕地 71园地 72林地 73牧草地 74居民点及公矿用地 75交通用地75水域 76未利用地 77土地利用类型 7有林地 731灌木地 732疏林地
7、 733迹地 735针叶树疏林地7331阔叶树疏林地7332未成林林地 734编码的类型n1)层次分类编码法:n是按照分类对象的从属和层次关系为排列顺序的一种代码,它的优点是能明确表示出分类对象的类别,代码结构有严格的隶属关系。上图以土地利用类型的编码为例,说明上图:土地利用类型编码(层次分类编码法)层次分类编码法所构成的编码体系。n2)多源分类编码法n又称独立分类编码法。是指对于一个特定的分类目标,根据诸多不同的分类依据分别进行编码,各位数字代码之间并没有隶属关系。表4-1以河流为例说明了属性数据多源分类编码法的编码方法。n表4-1 河流编码的标准分类方案和数码系统表 n(略)二、图形数据的
8、采集图形数据的采集n1、手扶跟踪数字化仪输入n (1)手扶跟踪数字化仪 n (2)数字化过程 n2、扫描仪输入n (1)扫描仪简介n (2)扫描过程(1)手扶跟踪数字化仪n手扶跟踪数字化仪,根据其采集数据的方式分为机械式、超声波式和全电子式三种,其中全电子式数字化仪精度最高,应用最广。按照其数字化版面的大小可分为A0、A1、A2、A3、A4 等。n 数字化仪由电磁感应板、游标和相应的电子电路组成,如图4-2所示。这种设备利用电磁感应原理:在电磁感应板的x,y方向上有许多平行的印刷线,每隔200m一条。n游标中装有一个线圈。当使用者在电磁感应板上移动游标到图件的指定位置,并将十字叉丝的交点对准数
9、字化的点位,按动相应的按钮时,线圈中就会产生交流信号,十字叉丝的中心也便产生了一个电磁场,当游标在电磁感应板上运动时,板下的印制线上就会产生感应电流。n印制板周围的多路开关等线路可以检测出最大信号的位置,即十字叉线中心所在的位置,从而得到该点的坐标值。通 向 计 算 机 接 口叉 丝游 标按 扭电 磁 感 应 板图4-2 手扶跟踪数字化仪示意图(2)数字化过程 n把待数字化的图件固定在图形输入板上,首先用鼠标器输入图幅范围和至少四个控制点的坐标,随后即可输入图幅内各点、曲线的坐标。n通过数字化仪采集数据数据量小,数据处理的软件也比较完备,但由于数字化的速度比较慢,工作量大,自动化程度低,数字化
10、的精度与作业员的操作有很大关系,所以,目前很多单位在大批量数字化时,已不再采用它。2、扫描仪输入扫描仪简介扫描过程(1)扫描仪简介n扫描仪直接把图形(如地形图)和图象(如遥感影象、照片)扫描输入到计算机中,以象素信息进行存储表示的设备。n按其所支持的颜色分类,可分为单色扫描仪和彩色扫描仪;按所采用的固态器件又分为电荷耦合器件(CCD)扫描仪、MOS电路扫描仪、紧贴型扫描仪等;按扫描宽度和操作方式分为大型扫描仪、台式扫描仪和手动式扫描仪。nCCD扫描仪的工作原理(2)扫描过程 n扫描模式的设置,(分二值、灰度、百万种彩色),对地形图的扫描一般采用二值扫描,或灰度扫描。对彩色航片或卫片采用百万种彩
11、色扫描,对黑白航片或卫片采用灰度扫描。n扫描分辨率的设置,根据扫描要求,对地形图的扫描一般采用300dpi或更高的分辨率。n针对一些特殊的需要,还可以调整亮度、对比度、色调、GAMMA曲线等。n设定扫描范围 n扫描参数设置完后,即可通过扫描获得某个地区的栅格数据。n通过扫描获得的是栅格数据,数据量比较大。如一张地形图采用300dpi灰度扫描其数据量就有20兆左右。n除此之外,扫描获得的数据还存在着噪声和中间色调像元的处理问题。n噪声是指不属于地图内容的斑点污渍和其它模糊不清的东西形成的像元灰度值。噪音范围很广,没有简单有效的方法能加以完全消除,有的软件能去除一些小的脏点,但有些地图内容如小数点
12、等和小的脏点很难区分。n对于中间色调像元,则可以通过选择合适的阈值选用一些软件如Photoshop等来处理。n一般对获得的栅格数据还要进行一些后续处理如图象纠正、矢量化 扫描的优点n扫描输入因其输入速度快n不受人为因素的影响n操作简单n计算机运算速度n存储容量的提高和矢量化软件的踊跃出现,使得扫描输入已成为图形数据输入的主要方法。第三节 空间数据的编辑与处理一、误差或错误的检查与编辑二、图象纠正 三、数据格式的转换四、地图投影转换五、图象解译六、图幅拼接一、误差或错误的检查与编辑n通过矢量数字化或扫描数字化所获取的原始空间数据,都不可避免的存在着错误或误差n属性数据在建库输入时,也难免会存在错
13、误,n对图形数据和属性数据进行一定的检查、编辑是很有必要的。图形数据和属性数据的误差原因n1、空间数据的不完整或重复:主要包括空间点、线、面数据的丢失或重复、区域中心点的遗漏、栅格数据矢量化时引起的断线等;图4-4 数字化几种误差示例n2、空间数据位置的不准确:主要包括空间点位的不准确、线段过长或过短、线段的断裂、相邻多边形结点的不重合等;n3、空间数据的比例尺不准确;n4、空间数据的变形;n5、空间属性和数据连接有误;n6、属性数据不完整;图4-4 数字化几种误差示例 检查方法n1、叠合比较法,是空间数据数字化正确与否的最佳检核方法,按与原图相同的比例尺用把数字化的内容绘在透明材料上,然后与
14、原图叠合在一起,在透光桌上仔细的观察和比较。一般,对于空间数据的比例尺不准确和空间数据的变形马上就可以观察出来,对于空间数据的位置不完整和不准确则须用粗笔把遗漏、位置错误的地方明显地标注出来。如果数字化的范围比较大,分块数字化时,除检核一幅(块)图内的差错外还应检核已存入计算机的其它图幅的接边情况;n2、目视检查法,指在屏幕上用目视检查的方法,检查一些明显的数字化误差与错误,如图所示,包括线段过长或过短、多边形的重叠和裂口、线段的断裂等;n3、逻辑检查法,如根据数据拓扑一致性进行检验,将弧段连成多边形,进行数字化误差的检查。有许多软件已能自动进行多边形结点的自动平差。另外,对属性数据的检查一般
15、也最先用这种方法,检查属性数据的值是否超过其取值范围。属性数据之间或属性数据与地理实体之间是否有荒谬的组合。二、图象纠正n1、由于受地形图介质及存放条件等因素的影响,使地形图的实际尺寸发生变形;n2、在扫描过程中,工作人员的操作会产生一定的误差,如扫描时地形图或遥感影象没被压紧、产生斜置或扫描参数的设置等因素都会使被扫入的地形图或遥感影象产生变形,直接影响扫描质量和精度;n3、由于遥感影象本身就存在着几何变形;n4、由于所需地图图幅的投影与资料的投影不同,或需将遥感影象的中心投影或多中心投影转换为正射投影等。n5、由于扫描时,受扫描仪幅面大小的影响,有时需将一幅地形图或遥感影象分成几块扫描,这
16、样会使地形图或遥感影象在拼接时难以保证精度。地形图和遥感影象的纠正过程及步骤n对扫描得到的图象进行纠正,主要是建立要纠正的图象与标准的地形图或地形图的理论数值或纠正过的正射影象之间的变换关系n目前,主要的变换函数有:仿射变换、双线性变换、平方变换、双平方变换、立方变换、四阶多项式变换等n具体采用哪一种,则要根据纠正图象的变形情况、所在区域的地理特征及所选点数来决定。1、地形图的纠正 n对地形图的纠正,一般采用四点纠正法或逐网格纠正法。n四点纠正法,一般是根据选定的数学变换函数,输入需纠正地形图的图幅行、列号、地形图的比例尺、图幅名称等,生成标准图廓,分别采集四个图廓控制点坐标来完成。n逐网格纠
17、正法,是在四点纠正法不能满足精度要求的情况下采用的。这种方法和四点纠正法的不同点就在于采样点数目的不同,它是逐方里网进行的,也就是说,对每一个方里网,都要采点。n具体采点时,一般要先采源点(需纠正的地形图),后采目标点(标准图廓),先采图廓点和控制点,后采方里网点。2、遥感影象的纠正图4-5 遥感影象纠正选点示例 n遥感影象的纠正,一般选用和遥感影象比例尺相近的地形图或正射影象图作为变换标准,选用合适的变换函数,分别在要纠正的遥感影象和标准地形图或正射影象图上采集同名地物点。n具体采点时,要先采源点(影像),后采目标点(地形图)。选点时,要注意选点的均匀分布,点不能太多(见图4-5)。n如果在
18、选点时没有注意点位的分布或点太多,这样不但不能保证精度,反而会使影象产生变形。另外选点时,点位应选由人工建筑构成的并且不会移动的地物点,如渠或道路交叉点、桥梁等,尽量不要选河床易变动的河流交叉点,以免点的移位影响配准精度。三、数据格式的转换n数据格式的转换一般分为两大类:不同数据介质之间的转换,即将各种不同的源材料信息如地图、照片、各种文字及表格转为计算机可以兼容的格式,主要采用数字化、扫描、键盘输入等方式,这在上一节中已经说明;第二类转换是数据结构之间的转换,而数据结构之间的转化又包括同一数据结构不同组织形式间的转换和不同数据结构间的转换。n同一数据结构不同组织形式间的转换包括不同栅格记录形
19、式之间的转换(如四叉树和游程编码之间的转换)和不同矢量结构之间的转换(如索引式和DIME之间的转换)。这两种转换方法要视具体的转换内容根据矢量和栅格数据编码的原理和方法来进行。n不同数据结构间的转换主要包括矢量到栅格数据的转换和栅格到矢量数据的转换两种。具体的转换方法在第四章中已有详细说明。四、地图投影转换n 1、正解变换:通过建立一种投影变换为另一种投影的严密或近似的解析关系式,直接由一种投影的数字化坐标x、y变换到另一种投影的直角坐标X、Y。n2、反解变换:即由一种投影的坐标反解出地理坐标(x、yB、L),然后再将地理坐标代入另一种投影的坐标公式中(B、LX、Y),从而实现由一种投影的坐标
20、到另一种投影坐标的变换(x、yX、Y)。n3、数值变换:根据两种投影在变换区内的若干同名数字化点,采用插值法,或有限差分法,最小二乘法、或有限元法,或待定系数法等,从而实现由一种投影的坐标到另一种投影坐标的变换。五、图象解译n包括:研究地理区域的一般知识;掌握影像分析的经验和技能;对影像特征的深入理解。有时,在图象解译之前,还会对其进行图象增强处理。n图像解译过程一般是建立在对图像及其解译区域进行系统研究的基础之上,具体包括图象的成像原理、图象的成像时间、图象的解译标志、成像地区的地理特征、地图、植被、气候学以及区域内有关人类活动的各种信息。n遥感图象的解译标志很多,包括图象的色调或色彩、大小
21、、形状、纹理、阴影、位置及地物之间的相互关系等。色调被认为是最基本的因素,因为没有色调变化,物体就不能被识别。大小、形状和纹理较复杂,需要进行个体特征的分析和解译。而阴影、类型、位置和相互关系则最为复杂,涉及特征间的相关关系。n影像分析是一个不断重复的过程,其中要对各种地物类型的信息以及信息之间的相关关系进行周密调查,收集资料、检验假说、作出解译并不断修正错误,才能最终得出正确的结果。n遥感图象的解译有目视判读和计算机自动解译两种方法,其中,自动解译又可分为监督分类和非监督分类两种。六、图幅拼接n在相邻图幅的边缘部分,由于原图本身的数字化误差,使得同一实体的线段或弧段的坐标数据不能相互衔接,或
22、是由于坐标系统、编码方式等不统一,需进行图幅数据边缘匹配处理。n图幅的拼接总是在相邻两图幅之间进行的。要将相邻两图幅之间的数据集中起来,就要求相同实体的线段或弧的坐标数据相互衔接,也要求同一实体的属性码相同,因此必须进行图幅数据边缘匹配处理。图像拼接的步骤1、逻辑一致性的处理 2、识别和检索相邻图幅 3、相邻图幅边界点坐标数据的匹配 4、相同属性多边形公共边界的删除 1、逻辑一致性的处理n由于人工操作的失误,两个相邻图幅的空间数据库在接合处可能出现逻辑裂隙,如一个多边形在一幅图层中具有属性A,而在另一幅图层中属性为B。此时,必须使用交互编辑的方法,使两相邻图斑的属性相同,取得逻辑一致性。图4-
23、6 图幅编号及图幅边缘数据提取范围 2、识别和检索相邻图幅n 将待拼接的图幅数据按图幅进行编号,编号有2位,其中十位数指示图幅的横向顺序,个位数指示纵向顺序(图4-6),并记录图幅的长宽标准尺寸。n因此,当进行横向图幅拼 接时,总是将十位数编号相同的图幅数据收集 在一起;进行纵向图幅拼接时,是将个位数编 号相同的图幅数据收集在一起。n其次,图幅数 据的边缘匹配处理主要是针对跨越相邻图幅的线段或弧而的,为了减少数据容量,提高处理速度,一般只提取图幅边界2cm范围内的数据作为匹配和处理的目标。n同时要求,图幅内空间实体的坐标数据已经进行过投影转换 3、相邻图幅边界点坐标数据的匹配n 相邻图幅边界点
24、坐标数据的匹配采用追踪拼接法。追踪拼接有四种情况(图47),只要符合下列条件,两条线段或弧段即可匹配衔接:相邻图幅边界两条线段或弧段的左右码各自相同或相反;相邻图幅同名边界点坐标在某一允许值范围内(如土O5mm)。n 匹配衔接时是以一条弧或线段作为处理的单元,因此,当边界点位于两个结点之间时,须分别取出相关的两个结点,然后按照结点之间线段方向一致性的原则进行数据的记录和存储。向右追踪向左追踪向上追踪向下追踪12121212212121212222111122221111ABCDABCDABCDABCD图4-7 追踪拼接法 4、相同属性多边形公共边界的删除n 当图幅内图形数据完成拼接后,相邻图斑
25、会有相同属性。此时,应将相同属性的两个或多个相邻图斑组合成一个图斑,即消除公共边界,并对共同属性进行合并。n 多边形公共界线的删除,可以通过构成每一面域的线段坐标链,删去其中共同的线段,然后重新建立合并多边形的线段链表(图48)。n对于多边形的属性表,除多边形的面积和周长需重新计算外,其余属性保留其中之一图斑的属性即可。41 11 52 12 06P1P2P1P24661 51 12 0+=41 51 12 02 12 1图 4-8 多边形公共边界的自动删除 第四节 空间数据质量及其精度分析一、空间数据质量的概念二、空间数据质量评价二、空间数据质量评价三、误差的类型(源误差、操作误差)三、误差
26、的类型(源误差、操作误差)四、四、GIS空间操作中误差的传播空间操作中误差的传播 五、空间数据质量的控制五、空间数据质量的控制一、空间数据质量的概念1、空间数据质量2、与数据质量相关的几个概念1、空间数据质量n 空间位置、专题特征以及时间是表达现实世界空间变化的三个基本要素。空间数据是 有关空间位置、专题特征以及时间信息的符号记录。而数据质量则是空间数据在表达这三 个基本要素时,所能够达到的准确性、一致性、完整性,以及它们三者之间统一性的程度。n空间数据是对现实世界中空间特征和过程的抽象表达。由于现实世界的复杂性和模糊 性,以及人类认识和表达能力的局限性,这种抽象表达总是不可能完全达到真值的,
27、而只 能在一定程度上接近真值。从这种意义上讲,数据质量发生问题是不可避免的;另一方面,对空间数据的处理也会导致出现一定的质量问题;例如,在某些应用中,用户可能根据需 要来对数据进行一定的删减或扩充,这对数据记录本身来说也是一种误差。n 因此,空间数据质量的好坏是一个相对概念,并具有一定程度的针对性。尽管如此,我们仍可以脱离开具体的应用,从空间数据存在的客观规律性出发来对空间数据的质量进行评价和控制。2、与数据质量相关的几个概念n(1)误差(Error):误差反映了数据与真实值或者大家公认的真值之间的差异,它是一 种常用的数据准确性的表达方式。n(2)数据的准确度(Accuracy):数据的准确
28、度被定义为结果、计算值或估计值与真实值或者大家公认的真值的接近程度。n(3)数据的精密度(Resolution):数据的精密度指数据表示的精密程度,亦即数据表示的有效位数。它表现了测量值本身的离散程度。由于精密度的实质在于它对数据准确度的影响,同时在很多情况下。它可以通过准确度而得到体现,故常把二者结合在一起称为精确度,简称精度。n(4)不确定性(Uncertainty):不确定性是关于空间过程和特征不能被准确确定的程度,是自然界各种空间现象自身固有的属性。在内容上,它是以真值为中心的一个范围,这个范围越大,数据的不确定性也就越大。二、空间数据质量评价二、空间数据质量评价1、空间数据质量标准2
29、、空间数据质量的评价1、空间数据质量标准n 空间数据质量标准是生产、使用和评价空间数据的依据,数据质量是数据整体性能的 综合体现。n目前,世界上已经建立了一些数据质量标准,如美国FGDC的数据质量标准等。n 空间数据质量标准的建立必须考虑空间过程和现象的认知、表达、处理、再现等全过 程。空间数据质量标准要素n(1)数据情况说明n(2)位置精度或称定位精度 n(3)属性精度n(4)时间精度。n(5)逻辑一致性n(6)数据完整性n(7)表达形式的合理性 2、空间数据质量的评价n空间数据质量的评价,就是用空间数据质量标准要素对数据所描述的空间、专题和时 间特征进行评价。n图 略三、误差的类型(源误差
30、、操作误差)1、源误差2、操作误差 n空问数据的质量通常用误差来衡量,而误差定义为空间数据与其真值的差别。n空间数据误差的来源是多方面的,例如,GIS的原始录入数据本身包含着数据采集过程中引入的源误差。n另外,在原始数据录入到空间数据库以及随后的数据分析处理和结果输出过程中,每一步都会引入新误差。n根据PABurrough(1986)的建议,可以将GIS数据误差的来源归纳为三类,如表4-3所示。1、源误差n(1)地面测量数字数据的误差n(2)地图数字化数据的误差n 制图误差n 数字化误差 n(3)遥感数据误差 n 数据获取误差n 数据预处理误差n 数据转换误差n 人工判读误差(1)地面测量数字
31、数据的误差n来源于地面测量的数字数据中含有控制测量和碎部测量误差。其中控制点误差又受控制网的参考基准、网形和观测精度以及观测费用等因素的影响。n碎部点误差随继承了控制点的误差外,还受自身的观测方法、观测精度和地界的人为判断,以及地物地貌的取舍等 因素的影响。n当然,原始观测误差受观测仪器、观测者和外界环境三种因素影响。地面测量数据中的误差可以表现为随机误差、系统误差或粗差。n一般而言,粗差采用可靠性理论探测剔除,系统误差采用实验方法校正或建立系统误差模型处理,随机误差采用随机模型,如最小二乘法平差处理。n利用误差传播律可求得点坐标的方差协方差阵或误差椭圆(球)元素采表达点坐标数据的精度。(2)
32、地图数字化数据的误差n目前GIS数据的主要来源之一是现有地图数字化。n原因固有误差和数字化过程误差是 地图数字化数据误差的主要来源。n原因固有误差除含有上述地面控制测量和碎部测量的全 部误差外,还含有制图误差。制图误差na、控制点展绘误差 nb、编绘误差nc、绘图误差nd、综合误差 ne、地图复制误差nf、分色板套合误差ng、绘图材料的变形误差 nh、归化到同一比例尺所引起的误差 ni、特征的定义nj、特征夸大误差 数字化误差n数字化方式主要有手工数字化和扫描数字化。n目前在生产实践中多采用扫描数字化,然后屏幕半自动化跟踪。n线划跟踪与扫描数字化所引起的平面误差较小,只是在扫描数字化时,要素结
33、合处出现的误差较大。(3)遥感数据误差 n数据获取误差n数据处理误差n数据分析误差n数据转换误差n人工判断误差 2、操作误差n(1)由计算机字长引起的误差 n(2)由拓扑分析引起的误差n(3)数据分类和内插引起的误差四、四、GIS空间操作中误差的传播空间操作中误差的传播n GIS产品是利用含有源误差的空间数据,通过GIS分析操作产生的。源误差和操作误差通过GIS操作经累积后传播到GIS的产品中。考虑如下的GIS空间操作:yf(xl,x2,.xn)n其中xi(i1,2n)为描述空间数据的自变量,它带有源误差;y为描述GIS产品的因变量,f()为描述GIS空间操作过程的数学函数,用以计算操作误差。
34、n根据f()的特征,可以分成两类运算:算术运算和逻辑运算 算术运算和逻辑运算的误差n 1、算术关系下的误差传播n 如果f()为算术关系,例如独立变量的和差关系、倍数关系或线性关系,则其中误差传播规律是众所周知的;若为相关或一般非线性函数时,其误差传播规律也在经典测量误差理论中已有详细介绍。n 2、逻辑关系下的误差传播n (1)布尔逻辑运算下的误差传播n (2)不精确推理关系下的误差传播 n GIS作为辅助决策工具常常需要进行综合分析、评判和基于知识的推理。在利用含有误差的知识时,经不精确推理所得结论的精度和可信度如何?这是推理关系下的传播定律所要解决的问题。n逻辑关系下的误差传播律正处于研究中
35、,借用信息论、模糊数学、人工智能和专家系统的基础理论可望解决这一问题。n通过上述讨论不难理解,由于GIS还是一门比较年轻的学科,对GIS数据的质量和精度问题还不大为人们所了解,还有许多问题有待于深入研究。n例如,由于用户的需求多式多样,对数据质量和精度还没有一致的意见;缺乏度量空间数据和GIS输出结果不确定性的方法;在GIS功能中没有标准方法来建立误差模型。n对如何处理误差,没有成熟的规范可循,现有的GIS能够提供一个派生信息的工具,但却没能提供一个关于系统可靠性的工具,即交出的最终结果没有附上一份相应的关于其可靠性的分析报告。五、空间数据质量的控制五、空间数据质量的控制n数据质量控制是个复杂的过程,要控制数据质量应从数据质量产生和扩散的所有过程和环节入手,分别用一定的方法减少误差。空间数据质量控制常见的方法有:n1、传统的手工方法 n2、元数据方法 n3、地理相关法 n数据质量控制应体现在数据生产和处理的各个环节n下面以地图数字化生成地图数据过程为例,说明数据质量控制的方法。n数字化过程的质量控制,主要包括数据预处理、数字化设备的选用、对点精度、数字化误差和数据精度检查等项内容。n1、数据预处理工作 n2、数字化设备的选用 n3、数字化对点精度(准确性)n4、数字化限差 n5、数据的精度检查