1、2022-6-91 GIS中存贮了海量数据,迫切需要高效、精确、科学地分析,找出数据所蕴涵的意义,进而了解事物的性质与规律,为科学决策提供必需的信息。(对数据“点石成金” ) 因此,GIS领域由原来重点关注数据库创建和系统开发建设,逐渐转向重点关注空间分析和空间建模。 2022-6-92 GIS的奠基人之一M.F.Goodchild曾指出:“地理信息系统真正的功能在于它利用空间分析技术,对空间数据的分析”。 空间分析使GIS超越一般空间数据库、信息系统和地图制图系统, 能挖掘出对科学决策具有指导意义的信息,从而解决复杂的地学应用问题,进行地学综合研究的技术系统。 2022-6-93 目前多数G
2、IS的应用还局限于数据库型GIS层面上,没有充分利用和开发GIS的空间分析功能。 因此,建立完善的空间数据分析理论和方法体系,集成先进的空间数据分析工具,增强GIS的空间分析能力,使数据库使数据库型型GISGIS上升为分析型上升为分析型GISGIS,是GIS技术与应用的发展目标和趋势目标和趋势。 2022-6-941.1 地理空间数据处理与建模1.2 地理空间数据挖掘1.3 GIS环境下的空间分析第1章 地理空间数据分析与GIS2022-6-95 第一节:第一节:简要回顾20世纪50年代以来地理空间数据处理与建模领域重要的技术方法-数量地理学、地理信息系统和地理计算; 第二节:第二节:论述数据
3、分析领域中迅速发展的新技术数据挖掘; 第三节:第三节:讨论GIS环境下空间分析的基本框架。 2022-6-961.1 地理空间数据处理与建模 地理空间数据分析地理空间数据分析: 是地理学和地理信息科学领域的重要研是地理学和地理信息科学领域的重要研究内容。究内容。通过研究地理空间数据及其相应分析理论、方法和技术,探索、证明地理要素之间的关系,揭示地理特征和过程的内在规律和机理,实现对地理空间信息的认知、解释、预测和调控。 2022-6-971.1 地理空间数据处理与建模地理空间数据分析的发展地理空间数据分析的发展: 从对地理现象及其空间关系的文字记载,到利用数学概念和方法进行解释性描述; 从传统
4、统计学方法和数学模型对地理现象和过程的模拟,到基于地理信息系统的多维地理空间数据表达、管理、地理过程的动态模拟、可视化分析和决策支持; 从空间数据挖掘技术到高性能计算技术支撑下的地理计算方法 。数量地理学 地理信息系统 地理计算2022-6-981.1 地理空间数据处理与建模 1.1.1 数量地理学 1.1.2 地理信息系统 1.1.3 地理计算2022-6-991.1.1 数量地理学 数量地理学(Quantitative Geography)又称计量地理学或地理数量方法,是应用数学思想方法和计算机技术进行地理学研究的科学。 数量地理学数量地理学是地理学领域中最先(上世纪50年代)采用数学原理
5、方法来探讨地理数据分析处理与建模的学科 2022-6-9101.1.1 数量地理学 数量地理学的产生与发展数量地理学的产生与发展 数量地理学与传统地理学的比较数量地理学与传统地理学的比较 数量地理学中地理数据分析模拟方法数量地理学中地理数据分析模拟方法2022-6-911数量地理学的发展阶段 数量地理学发数量地理学发展初期阶段展初期阶段数量地理学发数量地理学发展中期阶段展中期阶段数量地理学数量地理学日趋成熟阶段日趋成熟阶段20世纪世纪50年代年代末至末至60年代末年代末20世纪世纪60年代年代末至末至70年代年代20世纪世纪70年代年代末至今末至今把统计学方法把统计学方法引入地理学研究引入地理
6、学研究在地理学研究中应用在地理学研究中应用多元统计方法和计算机技术多元统计方法和计算机技术 地理学与运筹学、模糊数学、地理学与运筹学、模糊数学、系统科学、系统科学、GIS技术等结合技术等结合2022-6-912数量地理学与传统地理学的比较 数学方法是人们进行数字运算和求解的工具,能以严密的逻辑和简洁的形式描述复杂的问题,表达极为丰富的实质性思想。 对于现代地理学而言,数学方法不仅是应用地理学研究中进行预测、决策、规划及优化设计的工具,也是理论地理学研究中进行逻辑推理和理论演绎的手段。2022-6-913数量地理学与传统地理学研究方法比较 实地考察实地考察收集资料收集资料根据已有的概念根据已有的
7、概念体系条理化体系条理化比较比较归纳、概括归纳、概括地理解释地理解释建立理论与法则建立理论与法则观察实践观察实践先期模式先期模式资料筛选资料筛选建立理论与法则建立理论与法则反复检验反复检验成功成功建立模型建立模型提出假设提出假设失败失败 传统地理学传统地理学分析方法所采分析方法所采用的推理方式用的推理方式以经验归纳型以经验归纳型综合为主,以综合为主,以观察材料和事观察材料和事实为基础,由实为基础,由直接的类推得直接的类推得出现实世界的出现实世界的结论,结论,这一方法难以回避特殊情况或解释者的主观好恶问题。 数量地数量地理学以理论理学以理论演绎为主,演绎为主,整个研究过整个研究过程经历了提程经历
8、了提出假设、建出假设、建立模式、检立模式、检验假设和建验假设和建立理论四个立理论四个步骤,步骤,符合感性理性实践这一认识的过程规律。2022-6-914地理系统分析123随机数学方法地理系统数学模拟数量地理学中地理数据分析模拟方法 2022-6-915 地理系统分析地理系统分析:指扬弃地理事物繁琐的枝节,抽象出地理事物在结构与功能上的主线,揭示地理事物动态演变的方向与强度,预测其状态变化和稳定性程度,将复杂、高级的地理系统简化为次一级简单的系统,进而探讨地理要素之间的数量关系。 步骤步骤:(1)列出所研究等级系统的要素清单;(2)根据地理系统的实际绘出各要素的联系框图;(3)再以定量方法研究系
9、统要素之间的关系。地理系统分析2022-6-916随机数学方法 地理系统输入与输出之间一般具有随机性,数量地理学研究方法中随机数学随机数学占很大比重。 (1)地理系统是多级、多元系统,在进行系统分析时,分析一组或几组地理要素之间的关系经常应用多元统计分析方法(多元线性回归、逐步回归、主成分分析、因子分析等); (2)地理系统是具有空间范围和地域界线的系统,确定界线、进行地理区域的划分等(二级判别分析、多级判别、逐步判别等数学分类技术); (3)在探讨地理系统结构、类型组合、空间关系时,常运用系统聚类分析方法; (4)分析地理系统的空间特性时,常用趋势面分析方法; (5) 地理系统研究中十分重视
10、系统目标、系统结构的研究,以使地理系统达到符合一定目标的最佳状态,常用运筹学方法; (6)模拟地理系统状态的转移规律时还包括马尔柯夫链、多元线性方程组、微分方程的应用等。2022-6-917 地理系统的数学模拟地理系统的数学模拟(简称地理模型): 建立地理系统数学模型的过程。 地理系统数学模拟的一般过程地理系统数学模拟的一般过程: (1)从实际的地理系统或其要素出发,对空间状态、空间成分、空间相互作用进行分析,建立地理系统或要素的数学模型。 (2)经验检查,若与实际情况不符,则要重新分析,修改模型;若大致相符,则选择计算方法,进行程序设计、程序调试和上机运算,从而输出模型解。 (3)分析模型解
11、,若模型解出错,则修改模型;若模型解正确,则对成果进行地理解释,提出切实可行的方案。 可见,地理系统数学模拟过程是反复修改数学模型、调试和修改程序的过程。 地理系统数学模拟2022-6-9181.1.2 地理信息系统 英国著名地理学家R.J. Johnston在1995 年曾指出“计量革命的直接成果是导致了GIS革命的到来”。 GIS起源于20世纪60年代,是对地理空间数据进行采集、存储、表达、更新、检索、管理、综合分析与输出的计算机应用技术系统。 GIS 是以应用为导向的空间信息技术,强调空间实体及其关系,注重空间分析与模拟,是重要的地理空间数据管理和分析工具。2022-6-919GIS是客
12、观现实世界抽象化的数字模型GIS是地理空间数据管理、显示与制图的集成工具 GIS是地理空间数据分析模拟与可视化的技术平台 2022-6-920 客观现实世界极其复杂,运用各种数据采集手段和量测工具,如野外调查、遥感技术等,获取有关客观世界的数据,把各种来源和类型的地理空间数据数字化,输入计算机,按一定的规则组织管理,构建客观现实世界的抽象化数字模型,即GIS。2022-6-921空间数据管理GIS空间数据获取空间数据输入基于数学法则客观世界数据数据库客观世界的抽象化过程2022-6-9221.1.3 地理计算 随着计算机技术、数学方法的不断进步,空间数据分析处理方法论也随之革新,20世纪90年
13、代,一门融合了计算机科学、地理学、地球信息科学(Geomatics)、信息科学、数学和统计学理论与方法的地理计算(GeoComputation)开始形成并逐渐发展起来,数量地理学进入全新的计算地理学(Geocomputational Geography)时代,地理空间数据分析与建模有了一个新的技术平台。2022-6-9231.1.3 地理计算1. 地理计算的概念与内涵2. 地理计算模型与方法2022-6-9241.地理计算的概念与内涵 20世纪90年代中期,英国著名地理学家,里兹大学计算地理研究中心Stan Openshaw教授认为空间数据挖掘已成为数量地理学中一个重要分支,并以地理计算命名这
14、个新的学科。 Stan Openshaw因此被称为“地理计算之父”。 2022-6-925地理计算的各种定义地理计算的各种定义Opens haw在2000年进一步深化对于地理计算的理解,认为:地理计算是一种高性能计算,用以解地理计算是一种高性能计算,用以解决目前不能解决的、甚至未知的空间问题的科学。决目前不能解决的、甚至未知的空间问题的科学。具有三方面特点具有三方面特点:(:(1)是强调地理主题;()是强调地理主题;(2)对现存问题承认有新的或更好的解决办法,且可对现存问题承认有新的或更好的解决办法,且可以解决以前不能解决的问题;(以解决以前不能解决的问题;(3)地理计算需要)地理计算需要独特
15、的思考方式,由于基于海量计算代替残缺的独特的思考方式,由于基于海量计算代替残缺的知识或理论的过程,故能够增强机器的智能。知识或理论的过程,故能够增强机器的智能。 英国里兹大学著名地理学家Rees等提议将地理计算定义为:应用计算技术求解地理问题的理论、方应用计算技术求解地理问题的理论、方法和过程法和过程。 2022-6-926 Gahegan在1999年发表的论文中细致地谈到“地理计算地理计算关注利用一系列方法的工具箱丰富地理模拟和分析大量高关注利用一系列方法的工具箱丰富地理模拟和分析大量高度复杂的、非确定性的问题度复杂的、非确定性的问题这是人类有意识的努力去探这是人类有意识的努力去探索地理学与
16、计算机科学之间的关联。这是一个真正的对于索地理学与计算机科学之间的关联。这是一个真正的对于数量地理学家的技术,也是计算机科学家进行计算性应用数量地理学家的技术,也是计算机科学家进行计算性应用的丰富源泉。的丰富源泉。” Conclelis(1998)采用相对简洁的定义:地理计算是应用地理计算是应用数学计算方法与技术来描述空间特征、解释地理现象、解数学计算方法与技术来描述空间特征、解释地理现象、解决地理问题。决地理问题。 Openshaw和Abrahart(2000)认为:地理计算是一门新地理计算是一门新兴的交叉学科,它是在科学方法的整体范围内利用各种不兴的交叉学科,它是在科学方法的整体范围内利用
17、各种不同类型的地理数据发展相关的地理工具和模型。同类型的地理数据发展相关的地理工具和模型。 2003年8月,我国亚运村地理学术沙龙谈到“虚拟地理实验室”建设,认为地理计算既不是数量地理学,也不是地理计算既不是数量地理学,也不是GIS,而是智能计算在地理学中的精确应用,是强大的高,而是智能计算在地理学中的精确应用,是强大的高性能计算,其理论驱动是科学。性能计算,其理论驱动是科学。 2022-6-927地理计算定义(广义、狭义) 广义:广义:地理计算是以计算机方法为基本科学工具的处理地理信息和分析地理现象的地理学分支,它包括地理信地理信息处理与管理、地理数据挖掘、地理过程建模模拟以及支息处理与管理
18、、地理数据挖掘、地理过程建模模拟以及支持这些处理与分析的软件工程和计算体系持这些处理与分析的软件工程和计算体系研究,如地理信息系统、地理决策支持系统和空间网格体系。它是地理信息科学的另一种说法,外延包括数量地理学、遥感、地理信息系统、建模模拟和计算体系。 狭义:狭义:地理计算是地理信息科学的核心内容之一,主要研究地理信息科学的方法学问题,包括算法、建模和计算体系。我们主张一般情况下采用狭义定义。地理计算的内容除了建模、算法之外,还有一般方法学问题。 2022-6-9282. 地理计算模型与方法 地理计算的目标: 是将地理学领域的知识引入计算机工具,设计合适的地理数据挖掘和知识发现操作,研发时空
19、尺度上的集群算法,获得超越目前软件、硬件能力的地理数据分析方法,用可视化和虚拟现实的手段实现地理问题的理解与交流。 计算地理学计算地理学是数量地理学向深层次的拓展,强调数学模型与模拟实验并重的理念数学模型与模拟实验并重的理念,凭借计算机工具对地理学问题进行定量或非定量分析的抽象概括和综合研究,解决海量、复杂数据集或数据库分析的复杂空间问题。2022-6-929 地理计算学地理计算学包含丰富的模型和方法体系,不仅采纳了传统的数量地理学理论与模型 还涉及一系列新的理论技术方法: (1)GIS:创建数据库; (2)人工智能技术(人工智能技术(AI)和智能计算技术)和智能计算技术(CI):):提供计算
20、原理和计算工具; 智能计算技术:智能计算技术:神经网络模型(NN)、模糊逻辑模型、遗传算法模型(GA)、元胞自动机模型(CA)以及分形分析等 (3)高性能计算服务系统高性能计算服务系统:提供动力。 高性能计算:高性能计算:是利用超级计算机对大容量资料、需要进行实时分析与控制的系统以及那些复杂而又不能用其他手段来处理的现实世界所实施的计算。2022-6-9301.1 地理空间数据处理与建模1.2 地理空间数据挖掘地理空间数据挖掘1.3 GIS环境下的空间分析第1章 地理空间数据分析与GIS2022-6-9311.2 地理空间数据挖掘产生背景:产生背景:(1)人类正被数据淹没人类正被数据淹没(数据
21、丰富)(数据丰富) 空间科学技术的发展,获得了大量对地观测数据。 数据库技术的成熟与应用普及,人类累积累积的数据量正在呈指数级增长的数据量正在呈指数级增长,全世界每天存入数据数量超过万兆字符。(2)人类饥渴信息人类饥渴信息(知识贫乏)(知识贫乏) 面临浩如烟海的数据,人们呼唤从数据的汪洋大海中去芜存精、去伪存真2022-6-9321.2 地理空间数据挖掘1.2.1 地理空间数据挖掘概述1.2.2 地理空间数据立方体1.2.3 联机分析处理技术1.2.4 地理空间数据挖掘典型方法2022-6-9331.2.1 地理空间数据挖掘概述 数据挖掘 (1)技术上定义:是从大量的数据中,抽取出潜在的、有价
22、值的知识(模型、规则、规律)的过程。 (2)学科定义: 是一个由数据库、人工智能、数理统计和可视化等多学科与技术交叉、渗透、融合形成的交叉学科。数据挖掘的过程2022-6-934 数据挖掘与传统分析方法的区别数据挖掘与传统分析方法的区别 是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。 数据挖掘所得到的信息应具有三个特征:数据挖掘所得到的信息应具有三个特征: (1)先前未知。)先前未知。先前未知的信息是指该信息是预先未曾预料到的,即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值. (2)有效。)有效。 (3)可实用。
23、)可实用。2022-6-935进进 化化 阶阶 段段技技 术术 手手 段段数据搜集数据搜集(20世纪世纪60年代)年代)数据访问数据访问(20世纪世纪80年代)年代)数据仓库数据仓库(20世纪世纪90年代)年代)数据挖掘数据挖掘(目前)(目前) 计算机、磁带和磁盘计算机、磁带和磁盘关系数据库、结构化关系数据库、结构化查询语言、查询语言、ODBC 联机分析处理、联机分析处理、多维数据库、数据仓库多维数据库、数据仓库 高级算法、多处理器高级算法、多处理器 计算机、海量数据库计算机、海量数据库数据挖掘与知识发现的进化历程数据挖掘与知识发现的进化历程 数据仓库数据仓库包含了完整的、主题明确的、净化的、
24、综合性的数据,可以为数据挖掘提供新的支撑平台。2022-6-9361.2.1 地理空间数据挖掘概述 地理空间数据挖掘地理空间数据挖掘 是数据挖掘的一个研究分支。其实质是从地理空间数据库中挖掘时空系统中潜在的、有价值的信息、规律和知识的过程,包括空间模式与特征、空间与非空间数据之间的概要关系等。由于空间数据具有海量、多维和自相关性等特征,使得地理空间数据挖掘更为复杂。 2022-6-937空间数据挖掘的原型系统空间数据挖掘的原型系统 加拿大西蒙菲莎(Simon Fraser)大学计算机科学系Han Jiawei教授领导的小组进行了基于关系数据库挖掘系统的研究,在MapInfo平台上开发了空间数据
25、挖掘原型系统GeoMiner,并设计了专门用于空间数据挖掘的语言GMQL,实现了空间数据特征描述、空间比较、空间关联、空间聚类和空间分类等空间数据分析方法的集成。GeoMiner原型系统原型系统图形用户接口图形用户接口各种数据挖掘模块各种数据挖掘模块空间数据库空间数据库空间数据库服务器和数据立方体空间数据库服务器和数据立方体空间数据库空间数据库 空间数据库空间数据库2022-6-938空间数据挖掘的基本过程空间数据挖掘的基本过程2022-6-939空间聚类规则发现空间聚类规则发现空间关联规则发现空间关联规则发现空间序列模式发现空间序列模式发现空间预测模型发现空间预测模型发现空间异常值发现空间异
26、常值发现空间趋势模型发现空间趋势模型发现空间数据立方体空间数据立方体图形用户界面图形用户界面空间依赖关系发现空间依赖关系发现未来空间发现模块未来空间发现模块挖掘模块集合挖掘模块集合空间数据库服务器空间数据库服务器空间数据库空间数据库非空间数据库非空间数据库相关概念相关概念数据库和知识库数据库和知识库 四个组成部分四个组成部分:(1)图形用户界面)图形用户界面 (2)挖掘模块集合)挖掘模块集合 (3)空间数据库服务器)空间数据库服务器 (4)数据库和知识库)数据库和知识库 空间数据挖掘的体系结构空间数据挖掘的体系结构2022-6-940 (1)地理空间数据立方体地理空间数据立方体 通过访问地理空
27、间数据立方体,才能进行深层次的分析,寻求有意义的信息。 (2)联机分析处理联机分析处理(OLAP)模块)模块 OLAP为数据挖掘提供了一个极佳的操作平台 (3)空间数据挖掘模块空间数据挖掘模块。 进行相应的数据挖掘 地理空间数据挖掘系统三大支柱模块地理空间数据挖掘系统三大支柱模块 2022-6-9411.2.2 地理空间数据立方体 人们很容易理解一个二维表,对于三立方体同样也容易理解,但是要再加一维或任意多维,则图形很难想象,也不容易在屏幕上画出来。 地理空间数据立方体(又称为多维数据集)地理空间数据立方体(又称为多维数据集) 是一个面向对象的、集成的、以时间为变量的、持续采集空间与非空间数据
28、的多维数据集合,组织和汇总成一个由一组维度和度量值定义的多维结构,用以支持地理空间数据挖掘技术和决策支持过程。 作用:作用:基于空间数据立方体中的数据进行挖掘,可以利用已有的聚合信息和计算结果,有效地提供数据挖掘算法的执行效率。2022-6-942 数据立方体在逻辑上一般由一个事实数据表和多个维度表构成一种星形构架星形构架,其核心是事实数据表。事实数据表是数据立方体中度量值的源,维度表是数据立方体中维度的源 。2022-6-943地理空间数据立方体涉及的概念地理空间数据立方体涉及的概念 维度维度 是数据立方体的一种结构特性,是描述事实数据表中数据级别的有组织的层次结构。包括:(1)非空间维度;
29、(2)空间非空间维度;(3)空间空间维度。 度量值度量值 是在数据立方体内基于该数据立方体的事实数据表中某列的一组值,它们通常是数字。包括:数值度量、空间度量。 成员属性成员属性 是维度表的一个可选特性,为最终用户提供成员的其他信息,仅从属于级别。2022-6-9441.2.3 联机分析处理技术 OLAP的概念:的概念: 是共享多维信息的、针对特定问题的联机数据访问和分析的软件技术,具有汇总、合并、聚集以及从不同角度观察消息的能力。 是一种软件技术,它使分析人员能够迅速、一致、是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目交互地从各个方面观察信息,
30、以达到深入理解数据的目的。这些信息是从原始数据转换过来的,按照用户的理的。这些信息是从原始数据转换过来的,按照用户的理解,反映了真实情况。解,反映了真实情况。联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的。 它可以跨越空间数据库模式的多个版本,处理来自不同组织的信息和由多个数据存储集成的信息。 2022-6-945 当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing)。OLTP是传统的关系型数据库的主要
31、应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。下表列出了OLTP与OLAP之间的比较。2022-6-946联机分析处理是共享多维信息的快速分析。联机分析处理是共享多维信息的快速分析。 体现了四个特征:体现了四个特征:(1)快速性)快速性:用户对:用户对OLAP的快速反应能力有很的快速反应能力有很高的要求。高的要求。(2)可分析性)可分析性:OLAP系统应能处理任何逻辑分系统应能处理任何逻辑分析和统计分析。析和统计分析。 (3)多维性)多维性:系统必须提供对数据分析的多维:系统必须提供对数据分析的
32、多维视图和分析。视图和分析。(4)信息性)信息性:OLAP系统应能及时获得信息,并系统应能及时获得信息,并且管理大容量的信息。且管理大容量的信息。2022-6-947数据切片:数据切片:多维数据是由多个维度组成的,如果在某个维度上选定一个取值,则多维数据从n维下降成n-1维数据切块数据切块:将完整的数据立方体切取一部分数据而得到的新的数据立方体。数据钻取数据钻取(下钻下钻):从较高的维度层次下降到较低的维度层次上来观察多维数据数据聚合数据聚合(上卷上卷):对数据进行高层次综合的操作数据旋转数据旋转:改变维度的位置关系,使最终用户可从其他视角来观察多维数据。OLAP的基本操作的基本操作2022-
33、6-948 业业 务务处理系统处理系统数据提取数据提取数据准备区数据准备区OLAP服务器服务器多维化多维化处处 理理客客 户户 端端可视化处理可视化处理地理空间地理空间数据立方体数据立方体数据数据加载加载地理空间数据立方体与地理空间数据立方体与OLAP的关系的关系 OLAP技术则可利用数据立方体中的数据进行联机分析,将复杂的分析查询结果快速地返回用户。 2022-6-9491.2.4 地理空间数据挖掘典型方法1. 地理空间统计方法2. 地理空间聚类方法3. 地理空间关联分析4. 地理空间分类与预测分析5. 异常值分析1 12022-6-9501.地理空间统计方法 地理空间统计是指分析地理空间数
34、据的统计方法,主要是基于空间中邻近的要素通常比相离较远的要素具有较高的相似性这一原理。 地理空间统计分析与传统分析主要有两大差异:(1)空间数据间并非独立,而是在D维空间中具有某种空间相关性,且在不同的空间分辨率下呈现不同的相关程度;(2)大多数空间问题仅有一组(不规则分布空间中)观测值,而无重复观测的资料。 2022-6-951目前地理空间统计模型大致可分为三类目前地理空间统计模型大致可分为三类 : 地统计地统计:是以区域化变量理论为基础,以变差函数为主要工具,研究空间分布上既具有随机性又具有结构性的自然现象的科学。 格网空间模型:格网空间模型:用以描述分布于有限(或无穷离散)空间点(或区域
35、)上数据的空间关系。 空间点分布形态:空间点分布形态:在自然科学研究中,许多资料是由点(或小区域)所构成的集合,比如,地震发生地点分布、树木在森林中的分布、某种鸟类鸟巢的分布、生物组织中细胞核的分布,太空中星球的分布等,称之为空间点分布形态,其中点的位置为事件。 2022-6-952 优势:优势: 空间数据统计分析空间数据统计分析是分析空间数据广泛使用的一种方法,能够很好地处理数字数据,提出空间现象的现实模型。 局限性:局限性: 然而,需要指出的是统计分析方法往往假设在空间中分布的数据具有统计独立性,而在现实中,空间物体相关性很大。此外,绝大多数统计模型需要在有丰富领域知识和统计专门技术的专家
36、的协助下才能实现。而且,统计模型不能很好地处理字符值、不完整或非确定性数据。2022-6-9532.地理空间聚类方法 地理空间数据聚类是按照某种距离度量准则,在大型、多维数据集中标识出聚类或稠密分布的区域,从而发现数据集的整体空间分布模式。 该方法把空间数据库中的对象分为有意义的子类,使同一子类内部的成员有尽可能多的相同属性,而不同的子类之间差异较大。 2022-6-954 目前,地理空间聚类方法主要有四类: 分割法、层次法、基于密度的方法及基于网格的方法。 而经典聚类法包括K-mean、K-mediods、ISODATA等。 2022-6-955完全的空间任意分布完全的空间任意分布地理空间聚
37、类地理空间聚类 聚集型分布聚集型分布分散型分布分散型分布11222233333341:极密:极密 2:密:密 3:一般密:一般密 4:稀疏:稀疏经经 典典 聚聚 类类完全的空间任意完全的空间任意分布模式分布模式空空 间间 聚聚 类类分散分布模式分散分布模式2022-6-9563.地理空间关联分析 地理空间关联分析:地理空间关联分析:利用空间关联规则提取算法发现空间数据库中空间目标间的关联程度,是空间数据库知识发现研究中的一个重要研究课题。 GIS数据库是典型的空间数据库,从GIS数据库中挖掘空间关联规则是理解GIS模型和将GIS数据转化成知识的一种有效方法。 2022-6-957 地理空间关联
38、分析的核心内容是挖掘空间关联规则。空间关联规则是指空间目标间相邻(如村落与道路相邻)、相连(如火车站与铁路相连)、共生(如蒙古包与草场的关系)、包含(如区域中包含的城市)等空间相关关系。 具体而言,空间关联规则中包含各种不同的空间谓词,它们不但可以表示空间对象之间的拓扑关系(如相交、不相交、相邻等),还可以表示空间方位、排列次序(如东、西、南、北等)以及距离信息(如靠近、远离等)。 2022-6-958 空间关联规则指明了空间谓词与非空间谓词间存在的关联性。例如,通过挖掘GIS数据库,可能发现“靠近海滩的房屋”有90%“价格很贵”,“加油站”有75%“靠近高速公路”等。 空间关联规则提取算法并
39、不唯一,较常用的是利用MBR技术、R+树及其他快速方法进行空间分析,并采用概念层次树对拓扑关系进行概化形成拓扑关系数据表,从而提取关联规则。2022-6-9594.地理空间分类与预测分析 地理空间分类与预测是根据已知的分类模型把数据库中的数据映射到给定类别中,进行数据趋势预测分析的方法。 分类是将数据库中的对象根据一定的意义划分为若干个子集。 预测是利用历史数据记录自动推导出对给定数据的推广描述,实现对未来数据的趋势分析。 2022-6-960 分类和聚类算法的差别分类和聚类算法的差别在于:聚类算法是根据一定要求将对象聚为一个集合,最后得到的分布模式是聚类之前未确知的;分类算法则是根据已知分布
40、模式的属性要求,将数据库对象归入相应的分类中。在机器学习中,数据分类一般称为监督学习,而数据聚类则称为非监督学习。 地理空间数据分类包括两个步骤:地理空间数据分类包括两个步骤:通过分析数据库中各数据行的内容建立一个分类模型(分类器),描述已知数据集类别或概念。利用所获得的分类模型(分类器)进行分类操作。 2022-6-961 分类和回归都可用于预测,空间回归规则与空间分类规则相似,也是一种分类器,其差别在于空间分类规则的预测值是离散的,空间回归规则的预测值是连续的。 二者常表现为一棵决策树,根据数据值从树根开始搜索,沿着满足条件的分支往上走,走到树叶就能确定类别。 空间分类或回归的规则是普及知
41、识,实质是对给定数据对象集的抽象和概括,可用宏元组表示。 2022-6-9625. 异常值分析 若一个数据库包含的数据目标与通常的行为或数据模型不一致,则这些数据目标被称为异常值。绝大多数数据挖掘方法把异常值作为噪音或例外数据,然而,在很多情况下这将会导致重要隐含信息的丢失。 基于计算机的异常值分析方法主要有三种:基于统计的异常值分析;基于距离的异常值探测;基于偏差的异常值探测。 2022-6-9631.1 地理空间数据处理与建模1.2 地理空间数据挖掘1.3 GIS环境下的空间分析环境下的空间分析第1章 地理空间数据分析与GIS2022-6-9641.3 GIS环境下的空间分析1.3.1 空
42、间分析概念1.3.2 空间分析的萌芽与发展1.3.3 GIS与空间分析1.3.4 GIS环境下空间分析框架2022-6-9651.3.1 空间分析概念 空间分析(空间分析(Spatial Analysis,SA)是地理学的精髓,是为解答地理空间问题而进行的数据分析与挖掘。 空间分析空间分析是集空间数据分析和空间模拟于一体的技术方法,通过地理计算和空间表达挖掘潜在空间信息,以解决实际问题。 理解:理解:以地理空间数据库为基础,运用逻辑运算、一般统计和地统计、图形与形态分析、数据挖掘等技术,提取隐含在空间数据内部的与空间信息有关的知识和规律,包括位置、形态、分布、格局以及过程等内容,以解决涉及地理
43、空间的各种理论和实际问题。1. 空间分析的定义空间分析的定义 2022-6-966空间分析的本质特征包括:空间分析的本质特征包括: 探测空间数据中的模式; 研究空间数据间的关系并建立相应的空间数据模型; 提高适合于所有观察模式处理过程的理解; 改进发生地理空间事件的预测能力和控制能力。2022-6-9672. 空间分析的研究对象空间分析的研究对象 空间分析的研究对象空间分析的研究对象:空间目标。:空间目标。 空间分析主要通过对空间数据和空间模型的联合分析来空间分析主要通过对空间数据和空间模型的联合分析来挖掘空间目标的潜在信息。挖掘空间目标的潜在信息。 空间目标具有空间位置、分布、形态、空间关系
44、(距离、空间目标具有空间位置、分布、形态、空间关系(距离、方位、拓扑、相关场)等基本特征。方位、拓扑、相关场)等基本特征。空间分析的主要内容空间分析的主要内容 空间位置:空间位置: 借助于空间坐标系传递空间对象的定位信息,是空间对象表述的研究基础,即投影与转换理论。 空间分布:空间分布:同类空间对象的群体定位信息,包括分布、趋势、对比等内容。 空间形态:空间形态:空间对象的几何形态 空间距离空间距离:空间物体的接近程度 空间关系:空间关系:空间对象的相关关系,包括拓扑、方位、相似、相关等。2022-6-9683. 空间分析研究的主要目标空间分析研究的主要目标 (或称:空间分析功能的实现分为以下
45、(或称:空间分析功能的实现分为以下5个层次)个层次) 认知。认知。有效获取空间数据,并对其进行科学的组织描述,利用数据再现事物本身,例如绘制风险图。 解释。解释。理解和解释地理空间数据的背景过程,认识事件的本质规律,例如住房价格中的地理邻居效应。 预报。预报。在了解、掌握事件发生现状与规律的前提下,运用有关预测模型对未来的状况做出预测,例如传染病的爆发。 调控。调控。对地理空间发生的事件进行调控,例如合理分配资源。 空间分析的根本目标:空间分析的根本目标:是建立有效的空间数据模型来表达地理实体的时空特性,发展面向应用的时空分析模拟方法,以数字化方式动态地、全局地描述地理实体和地理现象的空间分布
46、关系,从而反映地理实体的内在规律和变化趋势。 2022-6-9691.3.2 空间分析的萌芽与发展 (1)在古代,人类出于生存和发展的需要,要学会分析周围地理事物的空间关系,因而始终在进行着各种类型的空间分析。从某种意义上讲,空间分析孕育了地理学空间分析孕育了地理学。 (2)地图的出现使人类的空间分析能力大大增强。)地图的出现使人类的空间分析能力大大增强。为使地图有助于空间分析,地理学家试图寻找一种能以形象方式描述数据空间分布的方法,这就是早期的空间统计方法早期的空间统计方法。 (3)随着地图理论与应用的广泛深入,物理、数学概念概念与方法的不断引入与方法的不断引入以及地学各分支的发展,传统的空
47、间分析传统的空间分析能力大大加强能力大大加强,人们对地图表达空间信息的理解与解译能力显著提高。2022-6-9701.3.2 空间分析的萌芽与发展 (4)现代现代“空间分析空间分析”概念的提出源于20世纪60年代地理与区域科学的计量革命。 初始阶段初始阶段主要是应用统计分析方法,定量描述点、线、面的空间分布模式;后期后期逐渐强调地理空间本身的特征、空间决策过程和复杂空间系统的时空演化过程。GIS使空间分析能力发生了质的飞跃。 (5)新一代空间分析新一代空间分析的主要目的是从现有数据的空间关系中挖掘新的信息。 随着GIS技术的不断进步,空间分析成为地理信息系统的核心,是地理信息系统区别于一般空间
48、数据库和普通制图系统的标志。“从某种意义上讲,空间分析与从某种意义上讲,空间分析与GIS间的间的关系类似于统计学与统计软件包间的关系关系类似于统计学与统计软件包间的关系” 。2022-6-971国内外国内外GIS软件空间分析比较软件空间分析比较2022-6-9721.3.3 GIS与空间分析空间分析一般采用专业分析模型与空间分析一般采用专业分析模型与GIS集成方式(两种):集成方式(两种):专业专业模型模型 统计统计 分析分析 网络网络 分析分析 其他其他空间分析模块空间分析模块 用户界面用户界面GIS管理系统管理系统空间数据库空间数据库(1)紧耦合。)紧耦合。把空间分析模块作为一个高级应用模
49、块嵌入GIS软件包中,GIS不仅可以为空间分析提供图形显示功能,而且GIS中的有关数据直接参与空间分析计算。这种方式可以为用户提供方便、全面、有效的使用功能,但造价高,实现周期长。GIS与空间分析的紧耦合与空间分析的紧耦合2022-6-973GIS与空间分析的松耦合与空间分析的松耦合数据交换接口数据交换接口用用 户户GIS管理系统管理系统空间分析模型空间分析模型空间数据库空间数据库数据文件数据文件(2)松耦合。)松耦合。在两个相对独立的GIS软件和空间分析软件之间增加数据交换接口,使空间分析数据及相关的影响因素和空间分析结果能够在GIS中以各种简单的或复杂的图形方式显示出来,这种方式适用于短期
50、且费用较小的情况。2022-6-9741.3.4 GIS环境下空间分析框架空间分析是空间分析是GIS的核心的核心空间分析是空间分析是GIS的核心功能的核心功能2022-6-975GIS环境中的空间分析(Anselin L提出的一般性框架 )缩放缩放浏览浏览空间查询空间查询缓存缓存视图视图选择选择空间采样空间采样地图提取地图提取质心质心镶嵌镶嵌聚集聚集分散分散空间权重空间权重拓扑拓扑插补插补覆盖覆盖空间分布空间分布全局空间组织全局空间组织局域空间组织局域空间组织空间回归空间回归模型评价模型评价模型诊断模型诊断空间预测空间预测探索空间探索空间数据分析数据分析操作操作确认空间确认空间数据分析数据分析