1、靖娟利制作/04/9 数据与数据文件数据与数据文件 数据库与数据库管理系统数据库与数据库管理系统 空间数据库模型空间数据库模型 空间数据库设计空间数据库设计 空间数据库建立与维护空间数据库建立与维护一、数据组织的分级一、数据组织的分级数据组织的层次数据组织的层次 按逻辑单位分级:按逻辑单位分级:数据项、记录、文件和数据库。数据项、记录、文件和数据库。按物理单位分级:按物理单位分级:比特、字节、字、块、桶和卷。比特、字节、字、块、桶和卷。数据库中的数据组织数据库中的数据组织 数据项:数据项:定义数据的最小单位,也叫基本项、字段等;有一定的取值范围,即域;可以是数值、字母、字母数字、汉字等形式。记
2、录:记录:由若干相关联的数据项组成,是处理和存储信息的基本单位;有“型”和“值”的区别;每个记录有唯一的标识符(关键字)。文件文件:是一给定类型的(逻辑)记录的全部具体值的集合;用文件名标识;根据组织和存取方法分为顺序文件、索引文件、直接文件和倒排文件。数据库数据库:具有特定联系的数据的集合(多种类型的记录集合);是具有某种联系的文件集合。(例如例如,一个GIS工程可能含有几千幅图,每幅图可能有点、线、面多种数据文件和多种属性表,因而一个GIS工程可作为一个空间数据库,但他们可能涉及成千上万个文件。)二、数据间的逻辑联系二、数据间的逻辑联系 数据间的逻辑联系主要指记录之间的联系。数据间的逻辑联
3、系主要指记录之间的联系。数据间的逻辑联系数据间的逻辑联系 一对一的联系(一对一的联系(1:1):):在集合在集合A中存在一个元素中存在一个元素ai,则在集合则在集合B中有且仅有一个中有且仅有一个bj与之联系。与之联系。A BABA BABA BAB三、常用数据文件文件的组织方式主要有:文件的组织方式主要有:顺序文件:对记录按主关键字的顺序进行组织。索引文件:除了存储记录本身(主文件)以外,还建立若干索引表。直接文件:也称随机文件,根据记录关键字的值,通过某种转换方法得到一个物理存储位置,然后把记录存储在该位置上。倒排文件:带有辅索引的文件。一、数据库的概念 概念:是为一定目的服务,以特定的结构
4、存储的相关的数据集合。特点:数据集中控制 数据冗余度小 数据独立 复杂的数据模型 数据保护:安全性控制、完整性控制、并发控制、故障 的发现和恢复 基本结构基本结构 物理级:数据库最内的一层;是物理设备上实际存储的数据集合;由物理模式描述。概念级:数据库的逻辑表示,包括每个数据的逻辑定义以及数据间的逻辑联系;由概念模式定义。用户级:用户所使用的数据库,是一个或几个特定用户所使用的数据集合,是概念模型的逻辑子集;用外模式定义。DBMS:是处理数据库存取和各种管理控制的软件;是DB的中心枢纽,与各部分有密切联系。DBMS的功能:数据库定义、管理、维护、通讯 DBMS的组成:语言处理程序、系统运行控制
5、程序、建立和维护程序 DBA:掌握数据库全面情况并作为数据库设计和管理骨干的人;主要功能是建立和维护数据。空间数据库:空间数据库:指指GISGIS在计算机物理存储介质上存在计算机物理存储介质上存储的与应用相关的地理空间数据的总和。储的与应用相关的地理空间数据的总和。空间数据特征空间数据特征:1 1)空间特征)空间特征:一般需要建立空间索引。:一般需要建立空间索引。2 2)非结构化特征)非结构化特征:结构化的,即满足第一范式结构化的,即满足第一范式:每条记录定长,且数据项是原子数据每条记录定长,且数据项是原子数据;而空间数而空间数据数据项变长,对象包含一个或多个对象,需要据数据项变长,对象包含一
6、个或多个对象,需要嵌套记录。嵌套记录。3 3)空间关系特征)空间关系特征:拓扑数据给空间数据的一致拓扑数据给空间数据的一致性和完整性维护增加了复杂性。性和完整性维护增加了复杂性。4 4)分类编码特征:)分类编码特征:一种地物类型对应一个属性一种地物类型对应一个属性数据表文件。多种地物类型共用一个属性数据表数据表文件。多种地物类型共用一个属性数据表文件。文件。5 5)海量数据特征。)海量数据特征。空间数据库特点:空间数据库特点:1)数据量特别大;2)数据种类多,复杂;3)数据应用面相当广。空间数据库管理系统:空间数据库管理系统:1)是指能够对物理介质上存储的地理空间数据进行语义和逻辑上的定义;2
7、)提供必须的空间数据查询、检索和存取功能;3)能够空间数据进行有效的维护和更新的一套软件系统。数据模型:描述数据内容和数据之间联系的工具,是衡量数据库能力强弱的主要标志之一。传统数据模型:层次模型、网络模型、关系模型 面向对象模型:层次模型 以记录类型为结点的有向树。将数据组织成有向图结构,结点代表数据记录,连线描述不同结点数据间的关系。传统数据库与空间数据库的比较传统数据库与空间数据库的比较传统数据库空间数据库数据连续性/相关性不连续相关性小连续较强空间相关性实体类型/空间关系少简单固定多复杂且不固定记录长度结构化等长非结构化不等长查询与操作文字、数字文字数字空间图形二二 、面向对象模型、面
8、向对象模型1 1、对象、对象:含有数据和操作方法的独立模块,可以认为是含有数据和操作方法的独立模块,可以认为是数据数据和行为的统一体和行为的统一体。(如一个城市、一棵树均可作为地(如一个城市、一棵树均可作为地理对象。)理对象。)具有一个具有一个唯一的标识唯一的标识,以表明其存在的独立性;,以表明其存在的独立性;具有一组描述特征的具有一组描述特征的属性属性,以表明其在某一时刻的,以表明其在某一时刻的状态状态静态属性静态属性数据;数据;具有一组表示行为的具有一组表示行为的操作方法操作方法,用以改变对象的状,用以改变对象的状态。态。-作用、功能作用、功能函数、方法。函数、方法。地理对象地理对象属性属
9、性数据数据行为行为方法方法 基本概念基本概念 2、类:、类:共享同一属性和方法集的所有对象的集合共享同一属性和方法集的所有对象的集合。如河流均具有共性,如名称、长度、流域面积等,如河流均具有共性,如名称、长度、流域面积等,以及相同的操作方法,如查询、计算长度、求流以及相同的操作方法,如查询、计算长度、求流域面积等,因而可抽象为河流类。域面积等,因而可抽象为河流类。3 3、实例:、实例:被抽象的对象,被抽象的对象,类的一个具体对象。类的一个具体对象。如长江、黄如长江、黄河等。(真正抽象的河流不存在,只存在河流的例子。)河等。(真正抽象的河流不存在,只存在河流的例子。)类是抽象的对象,是实例的组合
10、,类是抽象的对象,是实例的组合,类、实例是相对的类、实例是相对的,类,类和实例的关系为上下层关系。类和实例的关系为上下层关系。类-申请实例申请实例-成为具体成为具体对象。对象。4 4、消息、消息:对象之间的请求和协作对象之间的请求和协作。(并不独立存在)对象之间的关系,(并不独立存在)对象之间的关系,如点某按纽,就是对按纽提出请求。如点某按纽,就是对按纽提出请求。类类实例实例1实例实例2对对象象1对对象象2请求和协作请求和协作消息消息 面向对象的特性面向对象的特性1 1、抽象、抽象:是对现实世界的简明表示。形:是对现实世界的简明表示。形成对象的关键是抽象,对象是抽象思维的成对象的关键是抽象,对
11、象是抽象思维的结果。结果。2 2、封装:、封装:将方法与数据放于一对象中,将方法与数据放于一对象中,以使对数据的操作只可通过该对象本身的以使对数据的操作只可通过该对象本身的方法来进行方法来进行(指把对象的状态及其操作集指把对象的状态及其操作集成化,使之不受外界影响)。成化,使之不受外界影响)。3 3、多态:、多态:是指同一消息被不同对象接收是指同一消息被不同对象接收时,可解释为不同的含义时,可解释为不同的含义。同一消息,对不同对象,功能不同。同一消息,对不同对象,功能不同。现实世界现实世界抽象抽象对对象象1对对象象n对对象象2图元类图元类 CLineCLineCCircleCCircledra
12、w()draw()draw(p1,r)draw(p1,r)draw(p1,p2)draw(p1,p2)LineLineCircleCircle 四种核心技术四种核心技术1 1、分类:、分类:分类是把一组具有相同属性结分类是把一组具有相同属性结构和操作方法的对象归纳或映射为一个公构和操作方法的对象归纳或映射为一个公共类的过程共类的过程。(。(instance-ofinstance-of)2 2、概括:、概括:将相同特征和操作的类再抽象将相同特征和操作的类再抽象为一个更高层次、更具一般性的超类的过为一个更高层次、更具一般性的超类的过程。程。(is-a)(is-a)3 3、聚集:、聚集:聚集是把聚集
13、是把几个不同性质类几个不同性质类的对的对象组合成一个更高级的复合对象的过程。象组合成一个更高级的复合对象的过程。(parts-of)(parts-of)4 4、联合:、联合:相似对象相似对象抽象组合为集合对象。抽象组合为集合对象。其操作是成员对象的操作集合。其操作是成员对象的操作集合。(member-(member-of)of)面向对象数据模型的核心工具面向对象数据模型的核心工具 1 1、继承、继承:一类对象可继承另一类对象:一类对象可继承另一类对象的特性和能力,的特性和能力,子类继承父类的共性,子类继承父类的共性,它服务于概括它服务于概括,分为分为单重继承和多重继单重继承和多重继承承。继承机
14、制。继承机制减少代码冗余,减少相减少代码冗余,减少相互间的接口和界面互间的接口和界面。人工交通线自然交通线不可航行河流可航行河流高速公路运河水系池塘河流交通线2 2、传播、传播是作用于联合和聚集的工具,它通过一种强制手段将子目是作用于联合和聚集的工具,它通过一种强制手段将子目标的属性信息传播给复杂对象。标的属性信息传播给复杂对象。成员对象的属性只存储一成员对象的属性只存储一次,保证数据一致性和减少冗余。次,保证数据一致性和减少冗余。如桂林市总人口,由存如桂林市总人口,由存储在各成员对象中的各区人口总和。储在各成员对象中的各区人口总和。3 3、继承与传播(区别)、继承与传播(区别)1 1)继承服
15、务于概括,传播作用于联合和聚集;)继承服务于概括,传播作用于联合和聚集;2 2)继承是从上层到下层,应用于类,而传播是自下而上,)继承是从上层到下层,应用于类,而传播是自下而上,直接作用于对象;直接作用于对象;3 3)继承包括属性和操作,而传播一般仅涉及属性;)继承包括属性和操作,而传播一般仅涉及属性;4 4)继承是一种)继承是一种信息隐含机制信息隐含机制,只要说明子类与父类的关,只要说明子类与父类的关系,则父类的特征一般能自动传给它的子类,而传播是一系,则父类的特征一般能自动传给它的子类,而传播是一种种强制性工具强制性工具,需要在复合对象中显式定义它的每个成员,需要在复合对象中显式定义它的每
16、个成员对象,并说明它需要传播哪些属性值。对象,并说明它需要传播哪些属性值。三、现行空间数据库管理方案三、现行空间数据库管理方案0基于文件与关系式数据库的空间数据混合管理方案0基于关系式数据库的空间数据管理方案0基于对象关系式数据库的空间数据管理方案。文文件件 关关系系数数据据库库混混合合管管理理方方案案q 属性数据建立在RDBMS上,数据存储和检索比较可靠、有效;q 几何数据采用图形文件管理,功能较弱,特别是在数据的安全性、一致性、完整性、并发控制方面,比商用数据库要逊色得多。q 空间数据分开存储,数据的完整性有可能遭到破坏。q GIS软件:Arc/Info,MGE,GenMap等几何数据属性
17、数据ID数据文件数据库早期图形用户界面图形处理DBMS属性用户界面图形文件库属性数据库GIS用户界面图形处理DBMS图形文件库属性数据库高级语言ODBC协议GIS用户界面图形处理DBMS图形文件库属性数据库高级语言数据库开发语言数据库开发数据库开发全全关关系系式式数数据据库库管管理理方方案案q 属性数据、几何数据同时采用关系式数据库进行管理q 空间数据和属性数据不必进行烦琐的连接,数据存取较快q 属性间接存取,效率比DBMS的直接存取慢,特别是涉及空间查询、对象嵌套等复杂的空间操作q GIS软件:System9,Small World、Geovision等GIS界面属性数据(定长记录)空间数据
18、(变长记录)DBMS空间数据库关系表二进制块对对象象关关系系数数据据库库管管理理方方案案q 对现有的关系数据库进行扩展,增加空间数据类型q 解决了空间数据变长记录的存储问题,由数据库软件商开发,效率较高q 用户不能根据GIS要求进行空间对象的再定义,因而不能将设计的拓扑结构进行存储q GIS软件:TIGER,Geo+、Geo Tropics等GIS界面空间数据处理DBMS空间数据库扩充实体类型(点、线、面、圆等)面向对象空间数据库管理系统面向对象空间数据库管理系统面向对象模型面向对象模型最适合于最适合于空间数据的表达和管理,它不仅空间数据的表达和管理,它不仅支持变长记录,且支持对象的嵌套,信息
19、的继承和聚集。支持变长记录,且支持对象的嵌套,信息的继承和聚集。允许用户定义对象和对象的数据结构及它的操作允许用户定义对象和对象的数据结构及它的操作。可以。可以将空间对象根据需要,定义合适的数据结构和一将空间对象根据需要,定义合适的数据结构和一组操作。这种空间数据结构可以带和不带拓扑,当带拓组操作。这种空间数据结构可以带和不带拓扑,当带拓扑时,涉及对象的嵌套、对象的连接和对象与信息聚集。扑时,涉及对象的嵌套、对象的连接和对象与信息聚集。面向对象的地理数据模型的面向对象的地理数据模型的核心核心是对是对复杂对象复杂对象的模拟和的模拟和操纵。操纵。四、四、GISGIS空间数据组织空间数据组织研究区域
20、研究区域GIS工程并发控制空间索引工作区1工作区2工作区n工作层地物类逻辑层Arc/InfoMGEGeoStar属性数据Arc/InfoMGEGeoStarq ARCINFO,属性数据文件建在对应的coverage目录下;q MGE,一个地物类对应于一个属性表文件,且所有属性都放在工程目录下;q GeoStar,结合前两者的优点;五、空间数据索引五、空间数据索引q空间索引概念根据空间对象位置和形状或空间对象的某种空间关系,按一定顺序排列的数据结构,包含空间对象的概要信息,以提高空间操作的效率qGIS中引入空间索引的必要性l工作区建立l查询、显示l数据提取q常见空间索引方法l对象范围索引l格网索
21、引l四叉树索引lR树和R+树索引空间索引:空间索引:对象范围索引对象范围索引IDXmaxXminYmaxYmin1234YmaxYminXminXmax空间对象集合123456检索窗口XNYWYEXSXmaxXN OR XminXS OR YmaxYE OR YminYW空间对象不被检索XEXmax,XminXN ANDYWYmax,YminYE空间对象被检索XNYWYEXS236空间索引:空间索引:格网索引格网索引空间索引:空间索引:四叉树索引四叉树索引 线性四叉树q 采用Morton码编码(Peano键)q 根据空间对象覆盖范围,进行四叉树分割q 建立Peano键与空间目标的索引关系 层次
22、四叉树q 记录中间节点和父节点到子节点的指针q 若某个记录覆盖了哪一个中间节点,还要记录该空间对象的标识空间索引:空间索引:R R树和树和R+R+树索引树索引5-4 5-4 空间数据库的设计空间数据库的设计 空间数据库的设计是指在空间数据库的设计是指在现在数据库管理系现在数据库管理系统统的基础上建立空间数据库的整个过程。的基础上建立空间数据库的整个过程。现实世界现实世界地理实体地理实体数据层设计数据层设计结构设计结构设计需求分析需求分析数据字典设计数据字典设计一、需求分析一、需求分析 需求分析是整个空间数据库需求分析是整个空间数据库设计与建立的基础设计与建立的基础,主,主要进行以下工作:要进行
23、以下工作:1 1、调查用户需求、调查用户需求:了解用户特点和要求,取得设计者与:了解用户特点和要求,取得设计者与用户对需求的一致看法。用户对需求的一致看法。2 2、需求数据的收集和分析、需求数据的收集和分析:包括信息需求:包括信息需求(信息内容、信息内容、特征、需要存储的数据特征、需要存储的数据)、信息加工处理要求、信息加工处理要求(如响应时如响应时间间)、完整性与安全性要求等。、完整性与安全性要求等。3 3、编制用户需求说明书、编制用户需求说明书:包括需求分析的目标、任务、:包括需求分析的目标、任务、具体需求说明、系统功能与性能、运行环境等,是需求具体需求说明、系统功能与性能、运行环境等,是
24、需求分析的最终成果。分析的最终成果。在需求分析阶段完成:在需求分析阶段完成:数据源的选择数据源的选择和对和对各种各种数据集的评价数据集的评价(一般、空间、属(一般、空间、属性评价)性评价)。二、结构设计二、结构设计 指指空间数据结构空间数据结构设计,结果是得到一个设计,结果是得到一个合理的空间合理的空间数据模型数据模型,是空间数据库设计的,是空间数据库设计的关键关键。空间数据库设计的空间数据库设计的实质实质是将地理空间实体以一定的是将地理空间实体以一定的组织形式在数据库系统中组织形式在数据库系统中加以表达加以表达的过程,也就是地的过程,也就是地理信息系统中空间实体的理信息系统中空间实体的模型化
25、模型化问题。问题。现实世界现实世界地理实体地理实体逻辑模型逻辑模型物理模型物理模型概念模型概念模型需求分析需求分析结构设计结构设计1 1、概念模型、概念模型 是通过对错综复杂的现实世界的是通过对错综复杂的现实世界的认识与抽象认识与抽象,最终,最终形成空间数据库系统及其应用系统所需的模型。形成空间数据库系统及其应用系统所需的模型。表示概念模型最有力的工具是表示概念模型最有力的工具是E ER R模型模型,即实体,即实体联系模型,包括联系模型,包括实体、联系和属性实体、联系和属性三个基本成分。用它三个基本成分。用它来描述现实地理世界,来描述现实地理世界,不必考虑不必考虑信息的存储结构、存取信息的存储
26、结构、存取路径及存取效率等与计算机有关的问题,比一般的数据路径及存取效率等与计算机有关的问题,比一般的数据模型更接近于现实地理世界,具有模型更接近于现实地理世界,具有直观、自然、语义较直观、自然、语义较丰富丰富等特点,在地理数据库设计中得到了广泛应用。等特点,在地理数据库设计中得到了广泛应用。市区要素市区要素空间实体空间实体空间实体属性空间实体属性空间实体关系空间实体关系边线边线走向走向街道街道路面质量路面质量所属路段所属路段所属街道所属街道组成组成长度等长度等m1模模型型E_RE_R2 2、逻辑模型、逻辑模型 逻辑模型的设计是将逻辑模型的设计是将概念模型概念模型结构转换转换为结构转换转换为具
27、体具体DBMSDBMS可处理可处理的地理数据库的的地理数据库的逻辑结构逻辑结构(或外模式或外模式),包包括括确定数据项、记录及记录间的联系、安全性、完整确定数据项、记录及记录间的联系、安全性、完整性和一致性约束等。性和一致性约束等。从从E ER R模型向关系模型模型向关系模型转换的主要过程为:转换的主要过程为:确定各实体的确定各实体的主关键字主关键字;确定并写出实体确定并写出实体内部属性内部属性之间的数据之间的数据关系表达式关系表达式(函数依赖关系)(函数依赖关系),即某一数据项决定另外的数据项;,即某一数据项决定另外的数据项;把经过把经过消冗处理消冗处理(规范化处理)(规范化处理)的数据关系
28、表达式的数据关系表达式中的实体作为相应的主关键字;中的实体作为相应的主关键字;根据根据、形成新的关系。形成新的关系。完成转换后,进行完成转换后,进行分析、评价和优化分析、评价和优化。3 3、物理设计、物理设计 是指有效地将空间数据库的是指有效地将空间数据库的逻辑结构逻辑结构在物理存储在物理存储器上实现,确定数据在介质上的器上实现,确定数据在介质上的物理存储结构物理存储结构,其,其结果是导出地理数据库的结果是导出地理数据库的存储模式存储模式(内模式内模式)。主要内容主要内容包括确定记录存储格式,选择文件存储包括确定记录存储格式,选择文件存储结构,决定存取路径,分配存储空间。结构,决定存取路径,分
29、配存储空间。物理设计的好坏将对地理数据库的性能物理设计的好坏将对地理数据库的性能影响很大影响很大,一个好的物理存储结构必须满足两个条件:一个好的物理存储结构必须满足两个条件:一是地理数据一是地理数据占有较小的存储空间占有较小的存储空间;二是对数据;二是对数据库的操作具有库的操作具有尽可能高的处理速度尽可能高的处理速度。在完成物理设计后,要进行性能分析和测试。在完成物理设计后,要进行性能分析和测试。三、数据层设计三、数据层设计 GIS GIS的数据可以按照空间数据的的数据可以按照空间数据的逻辑关系逻辑关系或或专业属性专业属性分分为各种为各种逻辑数据层逻辑数据层或或专业数据层专业数据层,原理上类似
30、于图片的,原理上类似于图片的叠置。叠置。数据层的设计一般是按照数据层的设计一般是按照数据的专业内容和类型数据的专业内容和类型进行进行的。数据的的。数据的专业内容的类型专业内容的类型通常是数据分层的通常是数据分层的主要依据主要依据,同时也要考虑同时也要考虑数据之间的关系数据之间的关系。如需考虑两类物体共享。如需考虑两类物体共享边界边界(道路与行政边界重合、河流与地块边界的重合道路与行政边界重合、河流与地块边界的重合)等,等,这些数据间的关系在数据分层设计时应体现出来。这些数据间的关系在数据分层设计时应体现出来。同类型的数据由于其应用功能相同同类型的数据由于其应用功能相同,在分析和应用时,在分析和
31、应用时往往会同时用到,因此在设计时应反映出这样的需求,往往会同时用到,因此在设计时应反映出这样的需求,即可将这些数据作为一层。(如道路、加油站、停车即可将这些数据作为一层。(如道路、加油站、停车场场交通层)交通层)最后得出最后得出各层数据的各层数据的表现形式表现形式,各层数据的,各层数据的属性内容属性内容和和属性表之间的关系属性表之间的关系等。等。四、数据字典设计四、数据字典设计 数据字典数据字典:用于描述数据库的整体结构、数据内容和定义等。用于描述数据库的整体结构、数据内容和定义等。数据字典的内容包括:数据字典的内容包括:数据库的总体组织结构数据库的总体组织结构 数据库总体设计的框架数据库总体设计的框架 各数据层详细内容的定义及结构各数据层详细内容的定义及结构 数据命名的定义、元数据等内容。数据命名的定义、元数据等内容。建立空间数据库结构建立空间数据库结构 数据装入数据装入 调试运行调试运行一、空间数据库的建立一、空间数据库的建立5-5 5-5 空间数据库的建立与维护空间数据库的建立与维护二、空间数据库的维护二、空间数据库的维护 空间数据库的重组织空间数据库的重组织 空间数据库的重构造空间数据库的重构造 空间数据库的完整性、安全性控制空间数据库的完整性、安全性控制
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。