1、GIS中的数据中的数据 对空间数据的处理是对空间数据的处理是GIS的核心功能,的核心功能,GIS中的中的数据通常描述三部分信息:数据通常描述三部分信息:空间信息(位置,空空间信息(位置,空间关系等等),非空间的属性信息,时间信息间关系等等),非空间的属性信息,时间信息。由于各方面的原因,由于各方面的原因,GIS数据存在着质量问题,数据存在着质量问题,了解数据质量有利于数据的正确使用。数据质量了解数据质量有利于数据的正确使用。数据质量可以通过元数据进行描述,简单的说,元数据是可以通过元数据进行描述,简单的说,元数据是对数据的描述,在对数据的描述,在GIS应用不断发展、空间数据应用不断发展、空间数
2、据不断增长的情况下,元数据有助于数据的共享和不断增长的情况下,元数据有助于数据的共享和有效使用。有效使用。1.数据涵义与数据类型数据涵义与数据类型1.1数据的涵义数据的涵义(一一)数据数据数据是用以载荷信息的载体。它可以是记录下数据是用以载荷信息的载体。它可以是记录下来的某种可以识别的物理符号,数据的具体形来的某种可以识别的物理符号,数据的具体形式多种多样,如文本、图像、声音等都可以归式多种多样,如文本、图像、声音等都可以归入数据的范畴。虽然数据是信息的载体,但并入数据的范畴。虽然数据是信息的载体,但并非就是信息,只有理解了数据的含义、对数据非就是信息,只有理解了数据的含义、对数据做出解释,才
3、能得到数据中所包含的信息。做出解释,才能得到数据中所包含的信息。空间数据的特点n Spatially relatedqCan be assigned coordinates or any spatial reference.qOn the surface of the earth.qInvolves location and organization.n ScaleqCan be from general to specific.qSimple to complex.qA satellite can generate one terabyte(1012 bytes)of information
4、 per day.n DynamicsqSpatial dynamics(variations in space).qTemporal dynamics(variations in time).Coordinate systemScaleTime 1Time 21.数据涵义与数据类型数据涵义与数据类型1.1数据的涵义数据的涵义(二二)地理数据地理数据(空间数据空间数据)的基本特征的基本特征地理数据一般具有三个基本特征:地理数据一般具有三个基本特征:属性特征(非定位数据),表示实际现象或特属性特征(非定位数据),表示实际现象或特征,例如变量、级别、数量特征和名称等等。征,例如变量、级别、数量特征
5、和名称等等。空间特征(定位数据):表示现象的空间位置空间特征(定位数据):表示现象的空间位置或现在所处的地理位置。也称为几何特征或定位或现在所处的地理位置。也称为几何特征或定位特征,一般以坐标数据表示。特征,一般以坐标数据表示。时间特征(时间尺度):指现象或物体随时间时间特征(时间尺度):指现象或物体随时间的变化,其变化的周期有超短期的、短期的、中的变化,其变化的周期有超短期的、短期的、中期的、长期的等等(图期的、长期的等等(图5-1)。)。1.数据涵义与数据类型数据涵义与数据类型1.1数据的涵义数据的涵义空间特征n是GIS区别于其它的软件的根本特征n是由于地物或现象的空间分布所带来n通常是通
6、过特定空间参照系下的坐标直接表达n基于坐标的派生数据q定量的度量信息:面积、周长、质心、距离等q定性的空间关系:拓扑关系、方位关系时间特征n空间数据涉及时间特征的几个方面q地物的生命周期(产生、消亡)q地物的移动(移动点)q属性的时效性n相关的问题q时间关系时空关系n时态GISq数据模型是其关键(时空立方体模型等)专题属性特征n地物所固有的,不是由于地物空间分布所带来的特征n如某地的年降雨量、土地酸缄类型、人口密度、交通流量、空气污染程度等。n这类特征在其它类型的信息系统中均可存储和处理n专题属性特征通常以数字、符号、文本和图像等形式来表示1.数据涵义与数据类型数据涵义与数据类型1.2空间数据
7、的表示方法空间数据的表示方法 n类型数据:例如考古地点、道路线和土壤类型的分布等;类型数据:例如考古地点、道路线和土壤类型的分布等;n面域数据:例如随机多边形的中心点、行政区域界线和面域数据:例如随机多边形的中心点、行政区域界线和行政单元等;行政单元等;n网络数据:例如道路交点、街道和街区等;网络数据:例如道路交点、街道和街区等;n样本数据:例如气象站、航线和野外样方的分布区等;样本数据:例如气象站、航线和野外样方的分布区等;n曲面数据:例如高程点、等高线和等值区域;曲面数据:例如高程点、等高线和等值区域;n文本数据:例如地名、河流名称和区域名称;文本数据:例如地名、河流名称和区域名称;n符号
8、数据:例如点状符号、线状符号和面状符号(晕线)符号数据:例如点状符号、线状符号和面状符号(晕线)等。等。2.空间数据的测量尺度空间数据的测量尺度 测量的尺度大致可以分成四个层次,由粗略至测量的尺度大致可以分成四个层次,由粗略至详细依次为:详细依次为:n命名或类型命名或类型n次序次序n间隔间隔n比例比例2.空间数据的测量尺度空间数据的测量尺度(一一)命名命名(Nominal)量量定性而非定量,不能进行任何算术运算,如一个城定性而非定量,不能进行任何算术运算,如一个城市的名字。命名式的测量尺度也称为类型测量尺度,市的名字。命名式的测量尺度也称为类型测量尺度,只对特定现象进行标识,赋予一定的数值或符
9、号而只对特定现象进行标识,赋予一定的数值或符号而不定量描述。例如,可以用不同数值表示不同的土不定量描述。例如,可以用不同数值表示不同的土地利用类型、植被类型或岩石类型,但是这些数值地利用类型、植被类型或岩石类型,但是这些数值之间无数量关系,对命名数据的逻辑运算只有之间无数量关系,对命名数据的逻辑运算只有“等等于于”或或“不等于不等于”两种形式,而其近似均值只能使两种形式,而其近似均值只能使用众数。用众数。2.空间数据的测量尺度空间数据的测量尺度(二二)次序(次序(Ordinal)量)量线性坐标上不按值的大小,而是按顺序排列的数,线性坐标上不按值的大小,而是按顺序排列的数,例如,事故发生危险程度
10、的级别由大到小被标为例如,事故发生危险程度的级别由大到小被标为1,2,3,级别的序号越低,其危险性越大,但危,级别的序号越低,其危险性越大,但危险性到底有多大并未给予定量的表达。序数值相互险性到底有多大并未给予定量的表达。序数值相互之间可以比较大小,但不能进行加、减、乘、除等之间可以比较大小,但不能进行加、减、乘、除等算术运算。算术运算。不同次序之间的间隔大小可以不同。对次序数据的不同次序之间的间隔大小可以不同。对次序数据的逻辑运算除了逻辑运算除了“等于等于”与与“不等于不等于”之外,还可以之外,还可以比较它们的大小,即比较它们的大小,即“大于大于”。2.空间数据的测量尺度空间数据的测量尺度(
11、三三)间隔(间隔(Interval)量)量不参照某个固定点,而是按间隔表示相对位置的数。按间隔不参照某个固定点,而是按间隔表示相对位置的数。按间隔量测的值相互之间可以比较大小,并且它们之间的差值大小量测的值相互之间可以比较大小,并且它们之间的差值大小是有意义的。是有意义的。间隔测量尺度与比例测量尺度相似,但是间隔尺度的测量值间隔测量尺度与比例测量尺度相似,但是间隔尺度的测量值无真的零值。例如,温度是间隔尺度的数据而不是比例数据,无真的零值。例如,温度是间隔尺度的数据而不是比例数据,因为它的因为它的“0”测量值随着所使用的不同温度测量单位而不同。测量值随着所使用的不同温度测量单位而不同。不能说不
12、能说150F的温度是的温度是75F的温度的两倍,因为这个比例在使用的温度的两倍,因为这个比例在使用摄氏单位时就改变了。间隔量中的零值往往是人为规定的,摄氏单位时就改变了。间隔量中的零值往往是人为规定的,如摄氏温标中零摄氏度,时间中的零点等等。如摄氏温标中零摄氏度,时间中的零点等等。2.空间数据的测量尺度空间数据的测量尺度(四四)比率(比率(Ratio)量)量比例测量尺度的测量值指那些有真零值而且测量单位的间隔比例测量尺度的测量值指那些有真零值而且测量单位的间隔是相等的数据,比例测量尺度与使用的测量单位无关。是相等的数据,比例测量尺度与使用的测量单位无关。与某一固定点的比值计算,支持多种算术操作
13、,如加、减、与某一固定点的比值计算,支持多种算术操作,如加、减、乘、除等。有关该类型属性域的例子很多,如年降雨量、海乘、除等。有关该类型属性域的例子很多,如年降雨量、海拔高度、人口密度、发病率等。拔高度、人口密度、发病率等。比例数据或间隔数据可以比较容易地被转变成次序或命名数比例数据或间隔数据可以比较容易地被转变成次序或命名数据。而命名数据则很难被转化成次序、间隔数据或比例数据。据。而命名数据则很难被转化成次序、间隔数据或比例数据。由此可见,尽管命名数据或次序数据便于使用,易于理解,由此可见,尽管命名数据或次序数据便于使用,易于理解,但有时不够精确,不能用于较高级的算术运算。而比例数据但有时不
14、够精确,不能用于较高级的算术运算。而比例数据或间隔数据比较精确,便于计算机处理,但是在较复杂的或间隔数据比较精确,便于计算机处理,但是在较复杂的GIS应用中,往往上述几种测量尺度的数据均需用到应用中,往往上述几种测量尺度的数据均需用到 2.空间数据的测量尺度空间数据的测量尺度不同测量尺度数值可以进行的运算命名量=,!=次序量=,!=,+,-,*,/3.地理信息系统的数据质量地理信息系统的数据质量3.1数据质量的基本概念数据质量的基本概念n在GIS的几个主要因素中,数据是一个极为重要的因素。在计算机软件、硬件环境选定之后,GIS中数据质量的优劣,决定着系统分析质量以及整个应用的成败。GIS提供的
15、空间数据的分析方法被广泛用于各种领域,用于决策领域的数据,其质量要求应该是可知的或可预测的。n研究空间数据质量的目的在于加强数据生产过程中的质量控制,提高数据质量空间数据质量的重要性GeographicDatabaseQuery and AnalysisSpatial Data Input and ManagementOutput:DisplayHelp Prevent“Garbage in,Garbage out!”空间数据质量的相关概念n准确性(Accuracy)n精度(Precision)n空间分辨率(Spatial Resolution)n比例尺(Scale)n误差(Error)n不确
16、定性(Uncertainty)空间数据质量的相关概念n准确性(Accuracy)q一个记录值(测量或者观察值)与它的真实值之间的接近程度;q空间数据的准确性通常是根据所指的位置、拓扑或者非空间属性来分类的;q 可以误差(Error)来衡量空间数据的准确性;空间数据质量的相关概念n精度(Precision)q数据精度表示数据对现象描述的详细程度q数据精度和数据准确性的区别:n精度低的数据不一定准确度也低;n数据精度如果超出了测量仪器的已知准确度,这样的纪录数字在效率上是冗余的;例如:在设计精度为0.1mm的数字化仪上测量返回的坐标数据为(10.11mm,12.233mm),其中就含有冗余的数据;
17、空间数据质量的相关概念n空间分辨率(Spatial Resolution)q分辨率是两个可测量数值之间最小的可辨识的差异;q空间分辨率可以看作是记录变化的最小幅度;q空间分辨率示例:地图上最细线宽度对应的地理范围,遥感图像上一个像素代表的实际地理范围大小q空间分辨率 数据精度空间分辨率示例Real WorldVector DataRaster Data1 pixel =10mX10m 分辨率分辨率=10m10M10M1 Pixel空间数据质量的相关概念n比例尺(Scale)q地图上一个记录的距离和它所表现的“真实世界”的距离之间的一个比例;q如右图中,这幅地图的比例尺=10cm:1000m=1
18、:10000q比例尺是刻画数据精度的量(如最小线宽为地图的空间分辨率);空间数据质量的相关概念n误差(Error)q描述测量值和真实值之间的差别;q在大部分情况下,误差的大小是很不准确的,因为待测量的真实值往往无法得到;研究如何给出误差大小的最佳估计以及误差传播规律,是很有用的;q误差的分析包括:位置误差(如点、线、多边形的位置误差);属性误差;位置和属性误差之间的联系;空间数据质量的相关概念n不确定性(Uncertainty)q对于空间信息科学技术来说,数据的正确性与错误并存,正常与异常并存,精确与粗糙并存,质量高与质量低并存,什么时候是正确的,什么时候不正确的,这些都属于不确定性现象;qG
19、IS中数据的不确定性包括:位置的不确定性、属性的不确定性、时域的不确定性、逻辑上的不一致性以及数据的布完整性;q研究不确定性可以更好的了解测量数据的性质3.地理信息系统的数据质量地理信息系统的数据质量3.2空间数据质量问题的来源空间数据质量问题的来源n空间现象自身存在的不稳定性n空间现象的表达n空间数据处理中的误差n空间数据使用中的误差:3.地理信息系统的数据质量地理信息系统的数据质量3.2空间数据质量问题的来源空间数据质量问题的来源 (一一)空间现象自身存在的不稳定性空间现象自身存在的不稳定性 空间数据质量问题首先来源于空间数据质量问题首先来源于空间现象自身存在空间现象自身存在的不稳定性的不
20、稳定性。空间现象自身存在的不稳定性包括。空间现象自身存在的不稳定性包括空间特征和过程在空间特征和过程在空间、专题和时间空间、专题和时间内容上的不内容上的不确定性。空间现象在空间上的不确定性指其在空确定性。空间现象在空间上的不确定性指其在空间位置分布上的不确定性变化;空间现象在时间间位置分布上的不确定性变化;空间现象在时间上的不确定性表现为其在发生时间段上的游移性;上的不确定性表现为其在发生时间段上的游移性;空间现象在属性上的不确定性表现为属性类型划空间现象在属性上的不确定性表现为属性类型划分的多样性,非数值型属性值表达的不精确性。分的多样性,非数值型属性值表达的不精确性。因此,空间数据存在质量
21、问题是不可避免的。因此,空间数据存在质量问题是不可避免的。3.地理信息系统的数据质量地理信息系统的数据质量3.2空间数据质量问题的来源空间数据质量问题的来源 (二二)空间现象的表达空间现象的表达数据采集中的测量方法以及量测精度的选择等受数据采集中的测量方法以及量测精度的选择等受到人类自身的认识和表达的影响,这对于数据的到人类自身的认识和表达的影响,这对于数据的生成会出现误差。如在地图投影中,由椭球体到生成会出现误差。如在地图投影中,由椭球体到平面的投影转换必然产生误差;用于获取各种原平面的投影转换必然产生误差;用于获取各种原始数据的各种测量仪器都有一定的设计精度,如始数据的各种测量仪器都有一定
22、的设计精度,如GPS提供的地理位置数据都有用户要求的一定设提供的地理位置数据都有用户要求的一定设计精度,因而数据误差的产生不可避免计精度,因而数据误差的产生不可避免。3.地理信息系统的数据质量地理信息系统的数据质量3.2空间数据质量问题的来源空间数据质量问题的来源 (三三)空间数据处理中的误差空间数据处理中的误差在空间数据处理过程中,容易产生的误差有以下几种:在空间数据处理过程中,容易产生的误差有以下几种:n投影变换投影变换n地图数字化和扫描后的矢量化处理地图数字化和扫描后的矢量化处理n数据格式转换数据格式转换n数据抽象数据抽象n建立拓扑关系建立拓扑关系n与主控数据层的匹配与主控数据层的匹配n
23、数据叠加操作和更新数据叠加操作和更新n数据集成处理数据集成处理n数据的可视化表达数据的可视化表达n数据处理过程中误差的传递和扩散数据处理过程中误差的传递和扩散3.地理信息系统的数据质量地理信息系统的数据质量3.2空间数据质量问题的来源空间数据质量问题的来源 (四四)空间数据使用中的误差空间数据使用中的误差在空间数据使用的过程中也会导致误差的出现,主要包括在空间数据使用的过程中也会导致误差的出现,主要包括两个方面:两个方面:一是对数据的解释过程,二是缺少文档。一是对数据的解释过程,二是缺少文档。对于对于同一种空间数据来说,不同用户对它的内容的解释和理解同一种空间数据来说,不同用户对它的内容的解释
24、和理解可能不同,处理这类问题的方法是随空间数据提供各种相可能不同,处理这类问题的方法是随空间数据提供各种相关的文档说明,如元数据。另外,缺少对某一地区不同来关的文档说明,如元数据。另外,缺少对某一地区不同来源的空间数据的说明,如缺少投影类型、数据定义等描述源的空间数据的说明,如缺少投影类型、数据定义等描述信息,这样往往导致数据用户对数据的随意性使用而使误信息,这样往往导致数据用户对数据的随意性使用而使误差扩散差扩散 3.地理信息系统的数据质量地理信息系统的数据质量3.2空间数据质量问题的来源空间数据质量问题的来源 数据的主要误差来源数据的主要误差来源 数据处理过程数据处理过程误差来源误差来源数
25、据搜集数据搜集野外测量误差:仪器误差、记录误差野外测量误差:仪器误差、记录误差遥感数据误差:辐射和几何纠正误差、信息提取误差遥感数据误差:辐射和几何纠正误差、信息提取误差地图数据误差:原始数据误差、坐标转换、制图综合及印刷地图数据误差:原始数据误差、坐标转换、制图综合及印刷数据输入数据输入数字化误差:仪器误差、操作误差数字化误差:仪器误差、操作误差不同系统格式转换误差:栅格不同系统格式转换误差:栅格-矢量转换、三角网矢量转换、三角网-等值线转换等值线转换数据存储数据存储数值精度不够数值精度不够空间精度不够:每个格网点太大、地图最小制图单元太大空间精度不够:每个格网点太大、地图最小制图单元太大数
26、据处理数据处理分类间隔不合理分类间隔不合理多层数据叠合引起的误差传播:插值误差、多源数据综合分析多层数据叠合引起的误差传播:插值误差、多源数据综合分析误差误差比例尺太小引起的误差比例尺太小引起的误差数据输出数据输出输出设备不精确引起的误差输出设备不精确引起的误差输出的媒介不稳定造成的误差输出的媒介不稳定造成的误差数据使用数据使用对数据所包含的信息的误解对数据所包含的信息的误解对数据信息使用不当对数据信息使用不当3.地理信息系统的数据质量地理信息系统的数据质量3.3常见空间数据的误差分析常见空间数据的误差分析(一)误差类型(一)误差类型n逻辑误差逻辑误差n几何误差几何误差n属性误差属性误差n时间
27、误差时间误差属性误差和时间误差与普通信息系统中的误差概念是一致属性误差和时间误差与普通信息系统中的误差概念是一致的,几何误差是地理信息系统所特有的,而几何误差、属的,几何误差是地理信息系统所特有的,而几何误差、属性误差和时间误差都会造成逻辑误差,因此下面主要讨论性误差和时间误差都会造成逻辑误差,因此下面主要讨论逻辑误差和几何误差。逻辑误差和几何误差。3.地理信息系统的数据质量地理信息系统的数据质量3.3常见空间数据的误差分析常见空间数据的误差分析 n逻辑误差逻辑误差数据的不完整性是通过上述四类误差反映出来的。数据的不完整性是通过上述四类误差反映出来的。事实上检查逻辑误差,有助于发现不完整的数据
28、事实上检查逻辑误差,有助于发现不完整的数据和其他三类误差。对数据进行质量控制或质量保和其他三类误差。对数据进行质量控制或质量保证或质量评价,一般先从数据的逻辑性检查入手。证或质量评价,一般先从数据的逻辑性检查入手。比如桥或停车场等与道路是相接的,如果数据库比如桥或停车场等与道路是相接的,如果数据库中只有桥或停车场,而没有与道路相连,则说明中只有桥或停车场,而没有与道路相连,则说明道路数据被遗漏,使数据不完整。道路数据被遗漏,使数据不完整。3.地理信息系统的数据质量地理信息系统的数据质量3.3常见空间数据的误差分析常见空间数据的误差分析 3.地理信息系统的数据质量地理信息系统的数据质量3.3常见
29、空间数据的误差分析常见空间数据的误差分析 n几何误差几何误差由于地图是以二维平面坐标表达位置,在二维平面上的几由于地图是以二维平面坐标表达位置,在二维平面上的几何误差主要反映在点和线上。何误差主要反映在点和线上。(1)点误差)点误差关于某点的点误差即为测量位置(关于某点的点误差即为测量位置(x,y)与其真实位置)与其真实位置(x0,y0)的差异。真实位置的测量方法比测量位置的要)的差异。真实位置的测量方法比测量位置的要更加精确,如在野外使用高精度的更加精确,如在野外使用高精度的GPS方法得到。点误差可方法得到。点误差可通过计算坐标误差和距离的方法得到。坐标误差定义为:通过计算坐标误差和距离的方
30、法得到。坐标误差定义为:x=x-x0y=y-y0为了衡量整个数据采集区域或制图区域内的点误差,一般为了衡量整个数据采集区域或制图区域内的点误差,一般抽样测算(抽样测算(x,y)。抽样点应随机分布于数据采集区内,)。抽样点应随机分布于数据采集区内,并具有代表性。这样抽样点越多,所测的误差分布就越接并具有代表性。这样抽样点越多,所测的误差分布就越接近于点误差的真实分布。近于点误差的真实分布。3.地理信息系统的数据质量地理信息系统的数据质量3.3常见空间数据的误差分析常见空间数据的误差分析(2)线误差)线误差线在地理信息系统数据库中既可表示线性现象,又可以通线在地理信息系统数据库中既可表示线性现象,
31、又可以通过连成的多边形表示面状现象。过连成的多边形表示面状现象。第一类第一类是线上的点在真实是线上的点在真实世界中是可以找到的,如道路、河流、行政界线等,这类世界中是可以找到的,如道路、河流、行政界线等,这类的线性特征的误差主要产生于测量和对数据的后处理;的线性特征的误差主要产生于测量和对数据的后处理;第第二类二类是现实世界中找不到的,如按数学投影定义的经纬线、是现实世界中找不到的,如按数学投影定义的经纬线、按高程绘制的等高线,或者是气候区划线和土壤类型界限按高程绘制的等高线,或者是气候区划线和土壤类型界限等,这类线性特征的线误差及在确定线的界限时的误差,等,这类线性特征的线误差及在确定线的界
32、限时的误差,被称为解译误差。解译误差与属性误差直接相关,若没有被称为解译误差。解译误差与属性误差直接相关,若没有属性误差,则可以认为那些类型界线是准确的,因而解译属性误差,则可以认为那些类型界线是准确的,因而解译误差为零。误差为零。3.地理信息系统的数据质量地理信息系统的数据质量3.3常见空间数据的误差分析常见空间数据的误差分析 各种线(直线、折线、曲线)折线和曲线的误差 3.地理信息系统的数据质量地理信息系统的数据质量3.3常见空间数据的误差分析常见空间数据的误差分析 误差带模型,它在中间最窄而在两端较宽。基于误差带误差带模型,它在中间最窄而在两端较宽。基于误差带模型,可以把直线与折线误差分
33、布的特点分别看作是模型,可以把直线与折线误差分布的特点分别看作是“骨头型骨头型”或者或者“车链型车链型”的误差分布带模式的误差分布带模式。3.地理信息系统的数据质量地理信息系统的数据质量3.3常见空间数据的误差分析常见空间数据的误差分析 对于曲线的误差分布应当考虑对于曲线的误差分布应当考虑“串肠型模式串肠型模式”。3.地理信息系统的数据质量地理信息系统的数据质量3.3常见空间数据的误差分析常见空间数据的误差分析n其他数据质量问题q地图数据的质量问题n地图固有误差、地图材料变形、地图扫描及数字化误差;q遥感数据的质量问题n遥感仪器观测过程误差(表现为空间分辨率、光谱分辨率、几何畸变以及辐射误差等
34、)、图像处理和解译过程误差(校正匹配、解译判读、分类等)q测量数据的质量问题n选定的大地坐标系及投影、环境影响、测量仪器精度、操作误差、偶然误差等3.地理信息系统的数据质量地理信息系统的数据质量3.4空间数据质量控制空间数据质量控制n应从数据质量产生和扩散的所有过程和环节入手,分别用一定的方法减少误差;n常见的数据质量空间方法有:q传统的手工方法与原始地图或者属性数据比较;q元数据方法阅读元数据了解数据质量的信息;q地理相关法利用空间数据描述的地理特征要素自身的相关性3.地理信息系统的数据质量地理信息系统的数据质量3.4空间数据质量控制空间数据质量控制(一一)传统的手工方法传统的手工方法质量控
35、制的人工方法主要是将数字化数据与数据源进质量控制的人工方法主要是将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其他比较方法。逐个对比或其他比较方法。(二二)元数据方法元数据方法数据集的元数据中包含了大量的有关数据质量的信息,数据集的元数据中包含了大量的有关数据质量的信息,通过它可以检查数据质量,同时元数据也记录了数据通过它可以检查数据质量,同时元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数处理过程中质量的变化
36、,通过跟踪元数据可以了解数据质量的状况和变化。据质量的状况和变化。3.地理信息系统的数据质量地理信息系统的数据质量3.4空间数据质量控制空间数据质量控制(三三)地理相关法地理相关法用空间数据的地理特征要素自身的相关性来分析数据用空间数据的地理特征要素自身的相关性来分析数据的质量。如从地表自然特征的空间分布着手分析,山的质量。如从地表自然特征的空间分布着手分析,山区河流应位于微地形的最低点,因此,叠加河流和等区河流应位于微地形的最低点,因此,叠加河流和等高线两层数据时,如河流的位置不在等高线的外凸连高线两层数据时,如河流的位置不在等高线的外凸连线上,则说明两层数据中必有一层数据有质量问题,线上,
37、则说明两层数据中必有一层数据有质量问题,如不能确定哪层数据有问题时,可以通过将它们分别如不能确定哪层数据有问题时,可以通过将它们分别与其它质量可靠的数据层叠加来进一步分析。因此,与其它质量可靠的数据层叠加来进一步分析。因此,可以建立一个有关地理特征要素相关关系的知识库,可以建立一个有关地理特征要素相关关系的知识库,以备各空间数据层之间地理特征要素的相关分析之用以备各空间数据层之间地理特征要素的相关分析之用 4、空间元数据元数据概念元数据概念目 的目 的 1 1、促进数据集的高效利用、促进数据集的高效利用2 2、为计算机辅助软件工程、为计算机辅助软件工程(CASE)(CASE)服务。服务。内 容
38、内 容 对数据集的描述;对数据项、数据所有者、数据对数据集的描述;对数据项、数据所有者、数据生产历史等的说明;对数据质量的描述;对数据生产历史等的说明;对数据质量的描述;对数据处理信息的说明;对数据转换方法的描述;对数处理信息的说明;对数据转换方法的描述;对数据库的更新、集成方法等的说明。据库的更新、集成方法等的说明。性 质性 质 元数据应尽可能多地反映数据集自身的特征规律。元数据应尽可能多地反映数据集自身的特征规律。作 用作 用 通过元数据可以检索、访问数据库,可以有效的通过元数据可以检索、访问数据库,可以有效的利用计算机资源,可以对数据进行加工处理和二利用计算机资源,可以对数据进行加工处理
39、和二次开发等。次开发等。空间数据基础设施ArcCatalogInternetArcIMSMetadata ServerArcSDEAuthorPublishDiscoverMetadata ServerGeography NetworkZ39.50 Clearinghouses元数据的类型(元数据的类型(1)分类标准分类标准类型类型 内容内容1 1、科研型元数据、科研型元数据2 2、评估型元数据、评估型元数据3 3、模型元数据、模型元数据描述对象描述对象 1 1、数据层元数据、数据层元数据2 2、属性元数据、属性元数据3 3、实体元数据、实体元数据元数据的类型(元数据的类型(2)分类标准分类标
40、准类型类型 在系统在系统中的作用中的作用1 1、系统级别元数据、系统级别元数据2 2、应用层元数据、应用层元数据元数据的元数据的作用作用1 1、控制层元数据、控制层元数据2 2、说明元数据、说明元数据空间元数据的概念和标准空间元数据的概念和标准名称名称概念概念 空间数据空间数据Geospatial data用于确定具有自然特征或者人工建筑特征的地用于确定具有自然特征或者人工建筑特征的地理实体的地理位置、属性及其边界的信息。理实体的地理位置、属性及其边界的信息。类型类型 Type数据类型指该数据能接受的值的类型。数据类型指该数据能接受的值的类型。对象对象Object指地理实体的部分或整体的数字表
41、达。指地理实体的部分或整体的数字表达。实体类型实体类型Entity type对于具有相似地理特征的地理实体集合的定义对于具有相似地理特征的地理实体集合的定义和描述。和描述。点点Point确定位置的确定位置的0维地理对象。维地理对象。结点结点Node拓扑连接两个或多个链或环的一维对象。拓扑连接两个或多个链或环的一维对象。标识点标识点 Label point显示地图或图表时用于特征标识的参考点。显示地图或图表时用于特征标识的参考点。名称名称概念概念线线 Line一维对象的一般术语;一维对象的一般术语;线段线段 Line segment两个点之间的直线段;两个点之间的直线段;线线 String由相互
42、连接的一系列线段组成的没有分支由相互连接的一系列线段组成的没有分支线段,线可以自身或与其他线相切;线段,线可以自身或与其他线相切;弧弧 Arc由数学表达式确定的点集组成的弧状曲线;由数学表达式确定的点集组成的弧状曲线;链链 Link两个结点之间的拓扑关联;两个结点之间的拓扑关联;环环 Ring封闭状不相切链环或弧段序列;封闭状不相切链环或弧段序列;链环链环 Chain非相切线段或由结点区分的弧段构成的有非相切线段或由结点区分的弧段构成的有方向无分支序列;方向无分支序列;名称名称概念概念多边形多边形 Polygon在二维平面中由封闭弧段包围的区域;在二维平面中由封闭弧段包围的区域;外多边形外多边
43、形 Universe Polygon数据覆盖区域内最外侧的多边形;数据覆盖区域内最外侧的多边形;内部区域内部区域 Interior area不包括其边界的区域;不包括其边界的区域;格网格网 Grid组成一规则或近似规则的棋盘状镶嵌表面的格组成一规则或近似规则的棋盘状镶嵌表面的格网或表面的点的集合;网或表面的点的集合;格网单元格网单元 Gridcell表示格网最小可分要素的二维对象;表示格网最小可分要素的二维对象;矢量矢量 Vector有方向线的组合;有方向线的组合;栅格栅格 Raster同一格网或数字影像的一个或多个叠加层;同一格网或数字影像的一个或多个叠加层;名称名称概念概念像元像元 Pix
44、el二维图形要素,它是数字影像最小要素;二维图形要素,它是数字影像最小要素;栅格对象栅格对象 Raster object一个或多个影像或格网,每一个影像或格一个或多个影像或格网,每一个影像或格网表示一个数据层,各层之间的格网单元网表示一个数据层,各层之间的格网单元或像元一致且相互套准。或像元一致且相互套准。图形图形 Graph与预定义的限制规则一致的与预定义的限制规则一致的0维、一维、二维、一维、二维有拓扑相关的对象集;维有拓扑相关的对象集;数据层数据层 Layer集成到一起的面域分布空间数据集,它用集成到一起的面域分布空间数据集,它用于表示一个主体中的实体,或者有一公共于表示一个主体中的实体
45、,或者有一公共属性或属性值的空间对象的联合;属性或属性值的空间对象的联合;层层 Stratum在有序系统中数据层、级别或梯度系列;在有序系统中数据层、级别或梯度系列;经度经度 Longitude 经线面到格林尼治中央经线面的角度距离;经线面到格林尼治中央经线面的角度距离;纬度纬度 Latitude在中央经线上度量,以角度为单位度量离在中央经线上度量,以角度为单位度量离开赤道的距离;开赤道的距离;名称名称概念概念中央经线中央经线Meridian穿过地球两极的地球的大圆圈;穿过地球两极的地球的大圆圈;坐标坐标 Ordinate在笛卡尔坐标系中沿平行于在笛卡尔坐标系中沿平行于X轴和轴和Y轴测量轴测量
46、的坐标值。的坐标值。投影投影 Projection 将地球球面坐标系中的空间特征(集)转将地球球面坐标系中的空间特征(集)转化到平面坐标系时使用的数学方法;化到平面坐标系时使用的数学方法;投影参数投影参数Projection Parameters对数据集进行投影操作时用于控制投影误对数据集进行投影操作时用于控制投影误差、变形实际分布的参考特征;差、变形实际分布的参考特征;地图地图 Map空间现象的空间表征,通常以平面图形表空间现象的空间表征,通常以平面图形表示;示;现象现象 Phenomenon事实、发生的事件、状态等;事实、发生的事件、状态等;名称名称概念概念分辨率分辨率 Resolutio
47、nResolution由涉及到或使用的测量工具或分析方法能由涉及到或使用的测量工具或分析方法能区分的两个独立测量或计算的值的最小差区分的两个独立测量或计算的值的最小差异;异;质量质量 QualityQuality数据符合一定要求的基本或独特的性质;数据符合一定要求的基本或独特的性质;详述详述 ExplicitExplicit由一对或三个数分别直接描述水平位置和由一对或三个数分别直接描述水平位置和三位位置的方法三位位置的方法介质介质 MediaMedia用于记录、存贮或传递数据的物理设备;用于记录、存贮或传递数据的物理设备;空间数据元数据标准空间数据元数据标准空间数据元数据标准空间数据元数据标准
48、元数据标准名称元数据标准名称建立标准的组织建立标准的组织 CSDGM地球空间数据元数据地球空间数据元数据内容标准内容标准FGDC,美国联邦空间数,美国联邦空间数据委员会据委员会 GDDD数据集描述方法数据集描述方法MEGRIN,欧洲地图事务,欧洲地图事务组织组织 CGSB空间数据集描述空间数据集描述CSC,加拿大标准委员会,加拿大标准委员会 CEN地学信息一数据描述一元地学信息一数据描述一元数据数据CENTC287 DIF目录交换格式目录交换格式NASA ISO地理信息地理信息ISOTC211空间数据元数据的获取空间数据元数据的获取 空间数据元数据获取的五种方法空间数据元数据获取的五种方法空间
49、数据元数据的管理空间数据元数据的管理空间数据元数据的应用空间数据元数据的应用空间数据元数据的应用空间数据元数据的应用帮助用户获取数据帮助用户获取数据通过元数据,用户可对空间数据库进行浏览、检通过元数据,用户可对空间数据库进行浏览、检索和研究等。一个完整的地学数据库除应提供空索和研究等。一个完整的地学数据库除应提供空间数据和属性数据外,还应提供丰富的引导信息,间数据和属性数据外,还应提供丰富的引导信息,以及由纯数据得到的分析、综述和索引等。通过以及由纯数据得到的分析、综述和索引等。通过这些信息用户可以明白一系列问题,如这些信息用户可以明白一系列问题,如“这些数这些数据是什么数据?据是什么数据?”
50、,“这个数据库是否有用?这个数据库是否有用?”等等。空间数据质量控制空间数据质量控制无论是统计数据还是空间数据都存在数据精确问题,无论是统计数据还是空间数据都存在数据精确问题,影响空间数据精度的原因主要有两个方面:一是源数影响空间数据精度的原因主要有两个方面:一是源数据的精度;一是数据加工处理工程中精度质量的控制据的精度;一是数据加工处理工程中精度质量的控制情况。空间数据质量控制内容包括:(情况。空间数据质量控制内容包括:(1)有准确定义)有准确定义的数据字典,以说明数据的组成,各部分的名称,表的数据字典,以说明数据的组成,各部分的名称,表征的内容等;(征的内容等;(2)保证数据逻辑科学地集成