1、 1地理实体编码方案设计地理实体编码方案设计 地理编码技术与方法地理编码技术与方法234 地理实体编码的生成与实现地理实体编码的生成与实现5地理编码技术的概念地理编码技术的概念地理实体编码存在的问题地理实体编码存在的问题关键点的解决方法关键点的解决方法 6按照一定的数学规则对地球表面进行划分而成的格网。按照一定的数学规则对地球表面进行划分而成的格网。一、地理编码技术的概念一、地理编码技术的概念名词解释名词解释一、地理编码技术的概念一、地理编码技术的概念名词解释名词解释标识:如身份证;更新、关联、共享、交换等识别:定量信息可以被计算机直接识别,而定性信息通 过一种编码方法输入计算机中;整合:地址
2、空间范围(即行政区,人口普查区,街道)内进 行信息的整合、统计和计算统计和计算;定位:基于空间位置的信息服务;寻址:地址解析器:寻址位置。一、地理编码技术的概念一、地理编码技术的概念为什么?为什么?广义地理编码:广义地理编码:地理对象空间位置标识、计算和处理的过程,地理对象空间位置标识、计算和处理的过程,狭义的地理编码狭义的地理编码:即地址匹配(:即地址匹配(Address Matching),),指建立地理位置坐标与给定地名地址一致性的过程,这里的地址已较指建立地理位置坐标与给定地名地址一致性的过程,这里的地址已较为明确的指代为街道地址、行政区域等,其地理对象也明确为地理实为明确的指代为街道
3、地址、行政区域等,其地理对象也明确为地理实体。体。地理对象:地理对象:地理实体、地理要素类、地理区域和范围等。地理实体、地理要素类、地理区域和范围等。地理对象在确定的参考系中按一定的规则赋予唯一的、可地理对象在确定的参考系中按一定的规则赋予唯一的、可识别的代码,唯一地确定地理对象的空间位置,建立地理识别的代码,唯一地确定地理对象的空间位置,建立地理对象与代码之间的映射关系,它可以是对象与代码之间的映射关系,它可以是地理对象与地址地理对象与地址的的映射,也可以是映射,也可以是地理对象与坐标系统地理对象与坐标系统的映射。的映射。一、地理编码技术的概念一、地理编码技术的概念定义定义地理编码技术:编码
4、、解析、地址匹配 (1)编码的基本规则和编码方式;编码的基本规则和编码方式;(2)智能语义解析算法,智能化中文地址模糊匹配算法智能语义解析算法,智能化中文地址模糊匹配算法实现自然语言的地址和标准地址编码数据库的智能 匹配,获得最精确的地理编码和地理坐标;(3)编码器、解析器和匹配器编码器、解析器和匹配器根据编码方案规则或者是既有标准进行地理编码;根据编码规则对输入的实体进行解析;根据地理编码去识别、定位、寻址等。二、地理编码技术与方法二、地理编码技术与方法1、基于地理格网的地理编码、基于地理格网的地理编码地理格网是按一定的数学规则对地球表面进行分割地理格网是按一定的数学规则对地球表面进行分割,
5、形成彼此邻接形成彼此邻接又不交叉的多个多边形又不交叉的多个多边形(四边形、三角形四边形、三角形),并赋予标识符并赋予标识符(即地理即地理编码编码)。采用地理对象与地址通过格网建立相对关联的方法。采用地理对象与地址通过格网建立相对关联的方法,建立地建立地理对象的地址属性。实质是对地理对象的二维地理位置编码理对象的地址属性。实质是对地理对象的二维地理位置编码(实体实体地理位置、格网坐标地理位置、格网坐标)和解码和解码(地理位置、格网坐标地理位置、格网坐标实体实体)。其。其实就是表示地理实体在地理格网中位置定位信息实就是表示地理实体在地理格网中位置定位信息(直接指明或者给直接指明或者给定一个大小视地
6、理编码精度而定的范围定一个大小视地理编码精度而定的范围),当建立格网之后当建立格网之后,地理对地理对象与编码象与编码(格网标识格网标识)之间的对应关系被唯一的确定了。之间的对应关系被唯一的确定了。优点优点:定位精确,精度可控制。定位精确,精度可控制。缺点缺点:难以建立地理对象之间的空间拓扑关系,需要建立一整套严密的难以建立地理对象之间的空间拓扑关系,需要建立一整套严密的从大地基准、参考椭球、投影方式、格网的规定、格网原点、格网从大地基准、参考椭球、投影方式、格网的规定、格网原点、格网划分规则、格网标识编码以及格网精度等各个方面去描述的格网系划分规则、格网标识编码以及格网精度等各个方面去描述的格
7、网系统,需要考虑包括确定编码的最小地理对象或单元在内的多种因素。统,需要考虑包括确定编码的最小地理对象或单元在内的多种因素。二、地理编码技术与方法二、地理编码技术与方法2、基于地理实体的地理编码、基于地理实体的地理编码 采用地理实体与地址建立直接关联的方法,建立地理实体的地址采用地理实体与地址建立直接关联的方法,建立地理实体的地址属性。将地址、门牌、建筑物名、企事业单位名称等空间位置的自然属性。将地址、门牌、建筑物名、企事业单位名称等空间位置的自然语言描述转化为地址编码,实质就是建立地理实体与地址语言描述转化为地址编码,实质就是建立地理实体与地址(空间位置空间位置)的一一对应关系的一一对应关系
8、,也是对地理对象的二维地理位置编码也是对地理对象的二维地理位置编码(实体实体地址地址)和解码和解码(地址地址实体实体)。它一般建立在基于坐标的空间参考系中。它一般建立在基于坐标的空间参考系中。如如“市政监管信息化市政监管信息化 地理编码地理编码”。优点优点:易于被大家接受,符合人们惯用的思维方式易于被大家接受,符合人们惯用的思维方式缺点缺点:在于中文地址本身的不规范性和重复性,使得这种编码方式存在在于中文地址本身的不规范性和重复性,使得这种编码方式存在技术上的难点。技术上的难点。二、地理编码技术与方法二、地理编码技术与方法1、明确地理对象、明确地理对象 明确需要编码的地理对象明确需要编码的地理
9、对象,地理对象不同则实现的方法不同地理对象不同则实现的方法不同;2、确定的参考系统、确定的参考系统 可以是基于坐标的或是基于地理标识的可以是基于坐标的或是基于地理标识的,地址就是一种建立在地理地址就是一种建立在地理标识参考系下使用自然语言描述地理位置的参考系统标识参考系下使用自然语言描述地理位置的参考系统;3、唯一的编码规则唯一的编码规则地理编码也是一种数据组织、数据模型建立或是已有数据重新组织的地理编码也是一种数据组织、数据模型建立或是已有数据重新组织的过程。它也是一种地理空间的间接参考系过程。它也是一种地理空间的间接参考系,是整合多源空间信息资源是整合多源空间信息资源的一个重要环节的一个重
10、要环节,成为基础地理信息数据作为空间基础框架整合信息成为基础地理信息数据作为空间基础框架整合信息资源的重要手段。资源的重要手段。二、地理编码技术与方法二、地理编码技术与方法几个要素几个要素1、一种地理对象、一种地理对象在地理编码的三个要素中在地理编码的三个要素中,地理对象决定着参考系统的采用和编码规地理对象决定着参考系统的采用和编码规则的确定则的确定,也决定着地理编码采用的方法。地理对象应尽可能只是一也决定着地理编码采用的方法。地理对象应尽可能只是一种种,或者是地理实体或者是地理实体,或是地理区域或是地理区域,多种地理对象同时进行地址编码多种地理对象同时进行地址编码时时,会因为地理概念、地理区
11、域与实体在空间的关系中的相关性等产会因为地理概念、地理区域与实体在空间的关系中的相关性等产生问题生问题,影响地址编码规则的实现。影响地址编码规则的实现。2、明确最小地理对象、明确最小地理对象明确最小地理对象明确最小地理对象(或称最小地理单元或称最小地理单元)的划分的划分,对于地理编码的实现对于地理编码的实现也具有不可忽视的作用也具有不可忽视的作用,试想以城市管理的每一个部件试想以城市管理的每一个部件(一个信箱、信一个信箱、信号灯等号灯等)作为最小地理对象和以街道、单位为最小地理对象的地理编作为最小地理对象和以街道、单位为最小地理对象的地理编码将会存在很大的不同。最小地理对象尽可能不可再分、相互
12、不重叠、码将会存在很大的不同。最小地理对象尽可能不可再分、相互不重叠、或在一个工作平面上可以连续分割空间且不交叉应该是最小地理对象或在一个工作平面上可以连续分割空间且不交叉应该是最小地理对象划分的基本原则。划分的基本原则。二、地理编码技术与方法二、地理编码技术与方法注意的问题注意的问题地理实体编码存在的问题地理实体编码存在的问题 地理实体编码存在的问题地理实体编码存在的问题地理实体编码存在的问题地理实体编码存在的问题地理实体编码存在的问题地理实体编码存在的问题地理实体编码存在的问题地理实体编码存在的问题四、地理实体编码方案设计四、地理实体编码方案设计目前我们的实体划分层次关系到关系到“层次编码
13、层次编码”,河流河流 水库水库 湖泊湖泊 公路公路 街道街道 地名地址地名地址一级流域一级流域 一级流域一级流域 一级流域一级流域 所属类别所属类别 所属类别所属类别 街道名、小区名街道名、小区名二级流域二级流域 二级流域二级流域 化学性质化学性质 门(楼)址、门(楼)址、标志物名、兴趣点名标志物名、兴趣点名河流类别河流类别 所在河流所在河流 兴趣点按行业兴趣点按行业分为分为13子类子类水库实体编码河流实体编码湖泊实体编码1)水系类标识码)水系类标识码四、地理实体编码方案设计四、地理实体编码方案设计公路实体编码2)交通类标识码)交通类标识码街道实体编码四、地理实体编码方案设计四、地理实体编码方
14、案设计3)地名地址类标识码)地名地址类标识码4)行政区划类标识码)行政区划类标识码四、地理实体编码方案设计四、地理实体编码方案设计3、图元编码设计、图元编码设计A、图元编码结构(后、图元编码结构(后26位编码均采用位编码均采用16进制):进制):*行号行号 列号列号 级别级别 代表点相对代表点相对X 代表点相对代表点相对Y 面积面积/长度长度 方位编码方位编码1、选取、选取27N、118E为坐标原点,最大格网南北纬差为坐标原点,最大格网南北纬差5、经差、经差5,此网格为,此网格为覆盖浙江全省最大网格(边长覆盖浙江全省最大网格(边长556596米)。米)。2、然后将经纬度转换为以米为单位,可知原
15、点坐标为(、然后将经纬度转换为以米为单位,可知原点坐标为(-278298,-278298),),最大网格边长为最大网格边长为556598 米,最小网格边长米,最小网格边长1米,行列号最大值为米,行列号最大值为87E35,网格划分,网格划分为为20等级。等级。四、地理实体编码方案设计四、地理实体编码方案设计1、编码生成方法、编码生成方法分类编码编译分类编码编译测绘行业:按照行业标准,在数据采集时生成行业基础分类码。测绘行业:按照行业标准,在数据采集时生成行业基础分类码。其他行业:依据来源行业信息,从来源数据要素分类编码中提取所需要素分其他行业:依据来源行业信息,从来源数据要素分类编码中提取所需要
16、素分类编码字段,依照行业分类对照关系,转换生成行业基础分类码。类编码字段,依照行业分类对照关系,转换生成行业基础分类码。行业编码:参照行业编码:参照政务信息资源目录体系政务信息资源目录体系行业编码生成。行业编码生成。级别对应边长原点坐标中心点坐标)/-(XX级别对应边长原点坐标中心点坐标)/-(YY1、原始数据中的图元合并为自然界地理实体、原始数据中的图元合并为自然界地理实体根据实体的固有属性(名称、要素类别、等级和隶属关系、空间坐落位置、行政区域位根据实体的固有属性(名称、要素类别、等级和隶属关系、空间坐落位置、行政区域位置)和图元之间的连通性来置)和图元之间的连通性来综合指导综合指导图元合
17、并为实体。图元合并为实体。3、多比例尺实体关联、多比例尺实体关联潭港潭港潭港潭港210101500210101500000000800000130600000080000013062:名称:名称1:类别:类别3:网格或:网格或行政区划行政区划(位置)(位置)1:1万万1:5万万然后通过名称筛选,实现多比例尺间的实体然后通过名称筛选,实现多比例尺间的实体对应关系对应关系首先通过实体要素类别筛选,剔除非同类地物首先通过实体要素类别筛选,剔除非同类地物由于不同比例尺缩编原因导致的实体形变,已不能采用面积、长度、代表点由于不同比例尺缩编原因导致的实体形变,已不能采用面积、长度、代表点来确定实体的关联关系,所以在类别和名称的基础上引用定位码(四叉树网来确定实体的关联关系,所以在类别和名称的基础上引用定位码(四叉树网格部分)来区分同名地物情况格部分)来区分同名地物情况