专题地图课件:第六讲第三章.ppt

上传人(卖家):罗嗣辉 文档编号:2058951 上传时间:2022-01-26 格式:PPT 页数:35 大小:266KB
下载 相关 举报
专题地图课件:第六讲第三章.ppt_第1页
第1页 / 共35页
专题地图课件:第六讲第三章.ppt_第2页
第2页 / 共35页
专题地图课件:第六讲第三章.ppt_第3页
第3页 / 共35页
专题地图课件:第六讲第三章.ppt_第4页
第4页 / 共35页
专题地图课件:第六讲第三章.ppt_第5页
第5页 / 共35页
点击查看更多>>
资源描述

1、第三章第三章 专题制图要素的数据类型与数据处理专题制图要素的数据类型与数据处理 地图数据 :说明性数据(如图名、图例、文字说明) 地理数据(定位数据、属性数据、时间数据) 属性数据:是非定位数据、描述数据或语义数据,是对地图要 素质量特征和数量特征的描述。 3.1 3.1 专题制图要素的数据类型专题制图要素的数据类型 属性数据的形式:数字、文字、图形、图像、语言等。 地理变量:是对地理现象的定性描述或定量描述。地理变量按精确程度基于量表系统分为定名量表、顺序量表、间隔量表、比率量表。在制图时需对这些地理变量进行分类、处理才能变成地理数据。属性数据用于专题制图时,可根据其对现象描述的精确程度分为

2、定性数据和定量数据。 定名量表:研究事物时,只使用定性关系,不使用定量关系。如地图上表达物体的分布、性质、状态等。 顺序量表:按某种标志把制图物体或现象排序,表现为一种相对的等级。如大小、新旧、主次等。无起点,也无单位。间隔量表:如果给顺序量表赋予一定的量的概念,即利用某种单位对顺序增加距离信息,就成了间隔量表。比率量表:这是一种完整的定量化的方法,它不但要有计量单位,而且有起始点,可以描述客体的绝对量。 一一 定性数据定性数据 只描述现象的固有特征或相对等级、次序,即描述现象的定性特征而不涉及定量特征的数据。如在地图上表达物体的分布、状态、性质、大小、主次等的数据。这类数据没有量的概念。如人

3、口按民族可分为汉、回、满、维等,农作物分为粮食作物、经济作物、油料作物等,陆地地貌按外表形态可分为山地、高原、丘陵、平原、盆地等,城市按规模分为大城市、中等城市、小城市。定性数据蕴涵着事物的分类系统,而且绝大多数的分类系统都是一个层次结构,因此,定性数据不仅表达事物的同与异,而且可反映事物在分类树中所处的相对位置。当定性数据表示事物的等级和次序时,稍具有“量”的色彩,可将事物以一定的次序排列起来,虽不可进行数值运算但可进行统计分析。定性数据对应于量表系统的定名量表和顺序量表。 二定量数据二定量数据 定量数据包括两种类型,完全定量化数据和分级数据。定量数据对应于量表系统的间隔量表和比率量表。 完

4、全定量化数据:可完整地定量化描述物体,它不但有计量单位,而且有起始点,可描述物体的绝对量。完全定量数据除了具有分级数据描述事物差异的能力外,还可以明确描述事物间的比率关系。完全定量数据的零点不能随意设定,它具有重要的物理意义,亦即“无”,完全定量化数据描述物体有“有”与“无”的概念,并具有可加性。如A县的国内生产总值为18亿元,B县的国内生产总值为12亿元,则A、B两县的国内生产总值为30亿元。 分级数据: 不仅可以描述事物的等级和次序而且可以定量地描述事物间差异的大小。有人称这种差异为“距离”。分级数据反映事物的相对关系,而不是绝对关系。当两事物的距离为零时,两事物是相同的,否则是相异的。距

5、离越大其差异也越大。分级数据以数值来描述事物,但当数值为零时,并不意味着“没有”。 温度就是一个典型的例子,某地气温为20 ,另一地气温为40 ,两地温差为20,但这并不意味两地气温相差一倍。分级数据其数值的零点设置具有随意性,人们关心的是事物间的间隔,而不是绝对数值。使用分级数据必须统一数值的单位,如城市人口状况按人口密度分级,100,100500,5001000,1000,单位统一为人/平方公里。农业生产水平按总产值(万元)分为 1000,10005000,500010000, 10000等。 以上两种类型的数据对事物量的描述逐渐增强。在专题制图时,可以把完全定量数据处理成分级数据或定性数

6、据,而定性数据不能转化为定量数据。分级数据也不能转化为完全定量化数据。定性数据表达事物的质量差异和等级感,分级数据和完全定量化数据表达事物的数量差异,完全定量化数据比分级数据更加精确地描述事物的数量特征。 完全定量数据 分级数据 定性数据点状符号医院河流道路停车场线状符号面状符号定名量表顺序量表比率量表间隔量表P灌森林农业分区大中小国道省道县级公路乡村路大工业区中工业区小工业区人口密度高程200米400米600米800米1000米煤钢材食品每毫米带宽代表100吨。每毫米柱高代表 1万人。旅游点旅游人数铁路运输居民点人口数100-300300-500 500 100 100100-300300-

7、500 500人口移动1000130012001100 3.2 3.2 数据源及数据获取数据源及数据获取 编制专题地图的数据收集和整理是一项十分重要的基础工作,准确实时的数据是编制专题地图的前提条件。从专题制图的角度考虑,其数据源主要有以下几类: 一 地图数据 地图数据是编制专题地图主要的数据来源,包括各种比例尺的普通地图和专题地图 。普通地图用于编制专题地图的地理基础底图和某些专题要素 。各种比例尺的专题地图,提供地质、地貌、土壤、植被和土地利用等图种的原始资料。此外,中小比例尺的专题地图也可作为编制其它专题地图的补充资料 。 地图数据形式:纸质地图、电子地图、数字地图或GIS中地理数据库数

8、据。 二 遥感数据 遥感数据是编制专题地图重要的数据源。从卫星或飞机上获取的图像信息主要有胶片和数字磁带两种记录形式。胶片是一种模拟信号,必需通过A/D转换装置将模拟量转换为数字量后才能送入计算机内进行存贮和分析。数字磁带是一种数字图像记录,简称CCT。用户得到CCT磁带后可以根据磁带密度要求将数据读入计算机,然后通过图像处理系统的监视器显示图像,供用户分析。遥感数据具有覆盖面积大、同步性、时效性、综合性和可比性等特点,因此利用遥感数据编制专题地图越来越成为一种重要的手段和方法。航空像片具有比例尺大、碎部详细、可进行立体观察和测量等优点。遥感数据用于专题制图主要有: 1、 经过目视解译和计算机

9、自动识别,从遥感图像中提取所需的专题信息,如土地利用分类、森林类型、地质类型等数据,作为专题地图专题内容的基本资料。 2、 编制专题影像地图,专题影像地图是在遥感影像中突出而完备地表示一种或几种自然要素或社会经济要素,如土地利用影像地图、植被类型影像地图等。 三 统计数据和数字资料 统计数据和其它数字资料对于许多专题地图有着特别的意义。包括社会经济数据、人口普查数据、野外调查、监测和观测数据。如全国国民生产总值统计数据、气象观测数据、环境污染监测数据等。 除了传统的统计表格形式外,已建立起各种专题的电子表格、数据库,数据的建立、传输和汇总可以在计算机上实现。 四 文字报告和图片 文字报告主要包

10、括科学论文、科研报告、资料说明以及与专题内容相关的文章。文字报告和图片有时直接构成专题地图的内容。 3.3 3.3 数据的分类处理数据的分类处理 专题地图的数据处理 : 1、数据的分类处理 2、数据的分级处理 3、数量指标的改变 一基本原则 1、自然要素的分类是相应学科的任务,但是由于制图表象的特殊性,还存在着适宜于制图表达的制图分类方法。学科分类与制图分类并不总是一致的,学科分类是基础,制图分类是在符合于学科分类原则下的具体应用。 学科分类是按照该学科研究确定的指标进行分类的,如地貌类型是按成因和形态因素的组合划分的,但在为农业用途的地貌类型图上,形态指标的划分可能更细,同时可加入地面组成物

11、质因素甚至人类耕作对地貌景观的影响等因素对地貌予以分类,这种农业地貌类型图对农业生产更有意义。 由于地图比例尺的限制,学科分类的多级制不一定能够在地图上完全反映出来,通常小比例尺图上反映较高的一、二级,大比例尺图上反映较低的一、二级。 由于地图表达能力的限制,某些学科分类的分级制不一定能全部用制图方法显示, 如土壤类型中的“复区”。 自然要素的分类标志主要是按要素的发生、发育状况或某些条件下的发生学进行分类,这种分类方法具有科学的和实用的价值,如地貌按在内外力作用下的成因并结合形态进行分类;气候按大气环流形成的过程分类;土壤按土壤发生发育过程的规律分类;植被按其在外界生存条件的密切影响下,经过

12、漫长的发展过程而形成特殊的组合分类。除了这些分类标志外,还有按要素的某些基本特征分类的,如地貌按形态的组合,气候按特征的综合,土壤按粒度分析和矿物质组成进行分类。 综上所述,选用什么分类原则与地图用途有关,而分类的详细性则要顾及到地图比例尺的可能和制图区域的特点(同时也涉及到用图的要求),并且分类也影响到制图综合的复杂程度。 人文要素也有分类问题,如居民点的类型,不同的工业企业类型,科技、文教的不同门类,农业各专业化区域等等。三角形图表法就是根据多维指标进行组合分类的一种简便方法。 二、数据的分类方法 主要有: 判别分析方法 系统聚类方法 动态聚类方法 模糊聚类法。 1 判别分析方法判别分析方

13、法 基本原理:根据已掌握的和历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立判别公式和判别准则,判别该样本所属的类型。判别分析必须事先知道各种判别的类型和数目,并要有一批来自各类的样品,才能建立判别函数对未知属性的样品判别和归类。例如,在评价产品的市场竞争力时,可根据产品的多项指标(如其内在质量、外型美观以及包装、价格等)判别消费者对商品喜欢或不喜欢。判别分析依其判别类型的多少与方法的不同,可分为两总体判别、多总体判别和逐步判别等。 步骤:首先根据已知的特征值进行线性组合,构成一个线性判别函数 ;为了使判别函数能充分地反映出、两种类型的类别,就要使两类之间的均值差与各类内部

14、的离差平方和的比值达到最大,从而能将两类清楚地分开。判别函数求出以后,还需要计算出判别临界值,然后进行归类。 2 2 系统聚类方法系统聚类方法 系统聚类法是应用最多的一种聚类方法,聚类的依据是把相似的样本归为一类,把差异大的样本区别开来,成为不同的类。样本之间的相似性和差异性统计量有多种定义方法。它是一种定量方法,这种方法的基本思想是:先将几个样本(或指标)各自为一类,计算它们之间的距离,选择距离小的两个样本归为一类,计算新类和其它样本的距离,选择距离最小的两个样本或新类归为另一个新类,每次合并缩小一个类,直到所有样本划为一个类(或所需分类的数目)为止。类与类之间的距离可以有许多定义,广泛应用

15、的计算方法是最短距离法。 最短距离法最短距离法 最短距离法的基本思想是: 首先将所有各样本均作为一个独立类别,看哪两个样本的距离最接近,先将其合并得出新类,再求新类与其它类之间的距离值,然后逐步地合并成需要的几个类。 除了常用的最短距离法外,还有其它的系统聚类方法,如最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法和离差平方和法。 3 动态聚类方法 在初始状态给出样品概略的分类,然后基于一定原则在类别间重新组合样本,直到分类比较合理为止,这种聚类方法就是动态聚类。ISODATA(Iterative Self-Organizing Data Analysis Techniques

16、Algorithm)迭代自组数据分析方法在动态聚类法中具有代表性,下面给出其分类过程: 1按照某个原则选择一些初始类聚类中心。 2计算样品与初始类别中心的距离,把该样品分配到最近的类别中。 3计算并改正重新组合的类别中心,如果重新组合的样品数在最小允许值以下,则将该类别取消,并使总类别数减。当类别数在一定的范围,类别中心间的距离在阈值以上,类别内的方差的最大值为阈值以下时,可以看作动态聚类的结束。当不满足动态聚类的结束条件时,就要通过类别的合并及分离,调整类别的数目和中心间的距离等,然后返回到2,重复进行组合的过程。 4 模糊聚类法 客观事物有两种,一种是定性的,一种是不定性的,经典数学讨论的

17、都是定性问题,而概率论是研究不定性问题,但概率论研究的对象本身是确定的。有的事物本身就是不确定的,如地形复杂,土壤肥沃等。美国数学家L . A .Zadeh于1965年提出模糊理论(fuzzy theory)。该理论认为,在是与非之间存在中间状态,不确定性事物的归属度可以用概率方式表示出它的模糊性及不确定性。模糊数学在地图制图中广阔的应用前景。例如,在数据处理,要素或区域聚类,制图综合方法,遥感图像识别以及地图的分析评价等方面可广泛应用。 3.3 3.3 数据的分级处理数据的分级处理 专题数据中的定量数据大多是呈离散分布的,但原始的数据并不能直观地反映现象在空间分布上的规律性、由于数量差异而产

18、生的质量差异感、特殊的水平或集群性。因此对原始数据进行统计分析后建立分级模型十分必要。如何用恰当的方法使分级后的数据能够客观反映现象分布的地理规律性并满足专题制图的要求是数据分级处理的主要任务。统计地图中最常见的分级统计图法,所表示的就是分级数据。在分区统计图表中,也常常出现分级数据。分级的最重要的任务是找出关键的临界值,以增强同一级别区域间的同质性和各级之间的差异性。 一 基本原则 专题要素的分级处理主要包括分级数的确定和分级界限的确定。它们受地图用途、地图的比例尺、数据分布特征、表示方法、数据内容实质、使用方式等多个因素的制约。 1分级数量的确定 分级数量的确定,要做到详细性与地图的易读性

19、、规律性的统一。依据统计学原理,分级数的多少与对数据的概括程度成反比,即分级数越多,概括程度越小,在图上表示的越详细,反之亦然。 分级后的数据作为直接使用的制图数据将以符号的形式表示在地图上,因此分级数与采用的表达手段有着密切的关系。 符号法:艺术符号,通常只宜分为3级。 几何符号,可以区分57级。线状符号:分级数量同艺术符号相似。分级统计图:在使用同种色表达时,最多分为5级, 如果用两个颜色来表达,则可以明确地区分78级。分区统计图表:较粗略时分3级,最多不超过57级。 2、 分级界限的标定 在国内外的地图和地图集上,我们常常看到在图例中分级界限标定的混乱,例如,表示人均收入时表示为:100

20、0(元/人)1001(元/人)099 100299 300499 500699 700999 1000(元/人)。 正确的标定方法是采用左闭右开或左开右闭的形式,如下:100 100300 300500 500700 7001000 1000(元/人)100 101300 301500 501700 7011000 1001(元/人)。 3、分级界限的确定 分级界限的确定是分级的最主要问题,其主要原则是保持数据分布特征和分级数据有一定的统计精度。用等值线法和分级统计图法编制的地图,主要任务是解决级别划分的原则(有的原则也适用于符号法和分区统计图表法地图的分级)。根据反映现象分布的目的可有三种情

21、况:(1)按数据分布特征分级的原则,适用于任何要素和现象;(2)按各分级单元的个数分布的原则,适合于按一定指令性标准反映单元个数的统计;(3)按地图上各级面积分布的原则,适合于与实地面积有关的分布现象,如人口密度。 按数据分布特征分级的基本原则: (1) 客观反映数据的分布特征,应以数据的集群性作为分级数的重要依据。 (2) 分级界限应在数据变化显著的特征点上,使各级内部差异尽可能小,等级之间的差异尽可能大。 (3) 分级的结果,一般是中间级别包含的单元多,而两端级别所包含的单元较少,尤其数据较大的级别包含的单元更少些。也有要求分级单元数近似相等的。 (4) 根据地图的用途和要素特征,要保留个

22、别的特征级别和分级界,例如某地势图上,反映地形起伏特征的200米等高线,国家规定的控制人口增长率的界线,经济上的一些特征数据。 (5) 在分级的基础上,为了用图的方便,保持凑整的分级界限。 (6)对于离散分布的现象,且物体个数不多时,相邻级别的分级界限可以断开,即各级别中的某两级之间并不相互连接,以反映数据的客观分布,而对于连续分布现象的分级,其界限必须相互连接。并要正确处理分界点的所属关系。专题数据分级处理的方法很多,从数据的特征方面来看,主要有以下三类: 1、考虑数据类型及其分布特征的分级方法。下面将详细介绍这种方法。 2、按分级数据单元物体的个数进行分级的方法。这种方法常用于依据给定的某

23、一或几级数量指标标准的社会经济现象的分级。例如,在编制黑龙江省农业地图集中的“贫困人口”图幅时,把各县的某项经济指标按照县级贫困县、省级贫困县、国家级贫困县的标准分级,主要反映各级贫困县的个数和分布。这种分级方法较为简单,适用于绝对数量和相对数量指标的分级。 3、按地图上各级分布面积对比的分级方法。该方法主要用于反映与面积相关的数量指标的分级,通常为相对指标,如,人口密度、森林覆盖率等。 二 考虑数据类型及其分布特征的分级方法 数学法则分级方法: 数列分级方法、级数分级方法等 。 统计学分级方法: 统计量分级(平均值、标准差、逐次平均、分位数)、自然裂点法、自然聚类法、迭代法、逐步聚类法、模糊

24、聚类法、模糊识别分级法等。 等间隔分级; 其间隔有系统地向量表的高端变大或变小的分级; 按某种变量系统确定间隔的分级; 按需要自由的分级。 1、 数列分级方法 数列分级的特点是分级界限是某种数列中的一些点,一旦选定了某种数列,则分级界限完全取决于数据的最大值、最小值和分级数。数列分级方法的优点是分级界限(间隔)严格按照数学法则确定,但它不能很好地顾及数据本身的随机分布特征。设H为数列的最高值,L 为数列的最低值,K 为欲分的级数,则有: (1)等差数列分级 这是一种最简单的分级形式,用于具有均匀变化的制图现象,其特点是级差相等便于比较。,N 表示分级间隔(级差),则数列分级后的各级下限为: 实

25、际使用时,N 和 Ai 都应当凑成整数。)(1LHKiLAi , 1(i ) 1, 2K N=H-L/K 有时可直接给一个恒定的间隔作为分级的惟一依据,例如,粮食平均亩产200 ,200400 ,400600 ,600800, 8001000,1000(千克)。0100,100200,200300,300400,400500,500(千克)。0100,100300,300600,6001000,10001500,15002100。 在专题制图时,当待分级的数据分布较均匀,没有明显的集群性,而且最大值和最小值相差不是过于悬殊时,通常可采用等差分级的方法。(2)等比数列分级 KiLAi1loglo

26、g)log(logLH 即 KiiLHLA1 , 1( i ) 1, 2K (3)倒数数列分级 LHKiLAi11111 即 11111LHKiLAi , 1( i ) 1, 2K 2级数分级方法 数列分级方法,其特点是按选定的数列直接对分级界限选择,而有时,人们关注的是分级间隔的变化。级数分级方法的特点是直接对分级间隔选择,通常有算术级数和几何级数两种。通用模型为 这里,Y级差基数; Bi某级所需级差基数的倍数值。式中,L、H的意义同前, 为数列中的第I项。对于任意给定的L、H和等差或等比数列中的Bi ,从等式中解出Y, 便可确定分级界线Si: YBYBYBLi21=H ), 2 , 1(K

27、iBi (1) 算术级数分级 算术级数定义为:a, a+d,a+2d,a+3d,a+(n-1)d, 则Bi由下式确定: 式中, a为首项的值、d为公差、i为要确定的序数。算术级数法是一种可变的、规则的数学区分分级间隔的系统,一般形式随公差的正负形式变化。只有当数据形状接近算术级数的形状时才可以使用。KiiBLHY1 11ijjiBYLS , 1( i ) 1, 2K diaBi) 1( (2) 几何级数分级 对几何级数分级定义为: ,则Bi由下式确定: 式中,g为第一个非零项的值、r为公比、i为要确定项的序数。 通过改变d或r,就能改变算术级数或几何级数的分级间隔,r和d的不同取值可以得到无数

28、种级数分级,分级间隔可有系统地向量表高端变大或变小, 这是一种不等梯级但有递变方向的分级间隔系统。所采用的级差可以是算术级数或几何级数两种类型,它们又都可以采用以下6处变化方法来确定分级间隔:132,ngrgrgrgrg1iigrB按某一恒定速率递增;按某一加速度递增;按某一减速度递增;按某一恒定速率递减;按某一加速度递减;按某一减速度递减。这两种数学方法确定的分级间隔系统形成分级界线和规则变化的分级间隔。如果制图数据的排列表现为连续递变,才能使用这些方法。上述各种传统分级方法计算简单,分级界线(或分级间隔)的变化有规律可循,便于读者理解和对比分析等判读工作。但这种方法的主要不足是不能很好地顾

29、及数据本身的随机分布特征。 3按某种变量系统确定分级间隔 它同上述分级方法的差别是其分级间隔的大小并非朝一个方向有系统地变化。 这种分级方式事实上又分为两大部分,一类是完全不规则的分级界限;另一类是有规则的,但不具有单调递增或递减的规则。前者使用的方法通常是自然裂点法,后者则有按正态分布参数分级,按嵌套平均值分级,按分位数分级,按面积等梯级分级,按面积正态分布分级等。 自然裂点法, 按正态分布参数分级 , 按嵌套平均值分级 , 按分位数分级, 按面积等梯级分级, 按面积正态分布分级. 4分级结果的检验 不论用哪种方法分级,其分级结果都应能够反映区域的地理特征,一般情况下用下面两种标志来衡量分级

30、的优劣。(1)各级中样本数成正态分布或均匀分布 多数情况下希望各级中的样本数量成正态分布趋势,即把突出高数值和突出低数值的数列段从数列中区分出来,如特别富的地区和特别穷的地区,要能明显地从一般的地区中区分出来,就要求两端的级别所代表的样点数较小。 有时为了研究问题的需要,希望每个级别中包含样本的数量接近或相等,例如把工厂按其利税率分为“甲级队”,“乙级队”等,当然,其衡量标准就要随之变化。(2)同级区域的连通度 处于同一等级的区域,在地理上具有相似的条件,因此,表现在地图上它们各自应组成相对完整的地域。优良的分级应当使分级后产生的区域数相对较少,即连通度较大. 五聚类分级方法 聚类分级就是采用多元统计分析中的聚类分析方法,对各数据(相当样本单元)进行分类。由于分类是根据数据进行的,所以分类的结果必然保证了数值差异较小的单元分在同一类内,而差异较大的分在不同类内,从而达到分级的目的。聚类的基本方法是:根据样品的相似性,将样品归并为若干类,使每类的个体之间具有密切的关系,而各类之间的关系相对地比较疏远。 1 逐步聚类分级法 2模糊聚类分级法

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(专题地图课件:第六讲第三章.ppt)为本站会员(罗嗣辉)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|