1、第一部分 地理数据与空间统计学 1.地理数据的时空尺度 2.地理数据的统计处理 3.地理数据的空间统计学 4.GIS与地理数据分析 5.大数据与地理学第第1 1讲讲地理数据的时空尺度地理数据的时空尺度cnucug126三个方面内容三个方面内容n地理时空分布地理时空分布n地理时空测度与建模地理时空测度与建模n地理时空尺度地理时空尺度地理学第一定律(地理学第一定律(FLGFLG):1.1 1.1 地理时空分布的基本思想地理时空分布的基本思想Waldo Tobler(born in 1930)receiving a plaque for his contributions to geography.
2、On the event of his November 2000 birthday.en.wikipedia.org/wiki/Waldo_R._Tobler Tobler,W.R.(1970).A computer movie simulating urban growth in the Detroit region.Economic Geography,46(2):234-240.FLGFLG的一般性的一般性:自然地理、人文地理、社会经济High impactLow impactPointLineAreaQuantitativeOrdinalQualitative51015Each do
3、t represents500 personsProportional symbolsLargeMediumSmallQTownAirportFlowContour30 4050HighwayRoadStreetRoadBoundaryRiver10020Population densitySwampDesertForest1.2 1.2 地理时空分布的基本类型地理时空分布的基本类型n离散对象(discrete objects)n地理世界由具有定义良好边界的对象组成n地理对象的维数:0、1、2、3维n强调个体现象n一个对象必须符合三个条件n可被识别n重要(与问题相关)n可被描述(有特征)1.3
4、 1.3 地理时空分布表达形式地理时空分布表达形式n连续场(continuous fields)n将地理空间中的事物和现象作为连续的变量或体来看待n可以表示为二维、三维n模拟具有一定空间内连续分布的现象n栅格n空间被划分成一组规则格网n栅格中的每个像元(像素)是一个可量测的量n一般用于表达影像数据或连续数据点线面n矢量n以点、线、多边形表达特征n将现象看作原型实体的集合n矢量和栅格的比较n连续场的六种表达方式(A)等间距采样点;(B)非等间距采样点;(C)规则格网;(D)不规则多边形;(E)不规则三角网;(F)等高线。地理信息系统-学术关注1.4 1.4 地理时空分布时间序列地理时空分布时间序
5、列全球环境变化-学术关注三个方面内容三个方面内容n地理时空分布地理时空分布n地理时空测度与建模地理时空测度与建模n地理时空尺度地理时空尺度2.1 2.1 点状分布的测度点状分布的测度n如何确定点状地物分布的特征?点状地物空间分布有三种模式:u均等(离散)(uniform,dispersed)u随机(random)u凝聚(clumped)RANDOMCLUSTERED北京市公交站点分布北京市公交站点分布北京市高级中学位置分布北京市高级中学位置分布2.2 2.2 线状分布线状分布网络网络n现实地理系统中,对于地理位置、地理实体、地理区域以及它们之间的相互联系,可以经过一定的简化与抽象,将它们描述为
6、图论意义下的地理网络,即图。n地理位置、地理实体、地理区域,譬如,山顶、河流汇聚点、车站、码头、村庄、城镇等点。n它们之间的相互联系,譬如,构造线、河流、交通线、供电与通讯线路、人口流、物质流、资金流、信息流、技术流等点与点的连线。n一个由基本流域单元组成的复杂的流域地貌系统,如果舍弃各种复杂的地貌形态,各条河流线,河流分岔或汇聚处点,流域地貌系统水系的基本结局(树)。2.32.3离散区域分布的测度离散区域分布的测度n以行政区为单位的经济数据,可以画出油等值线的地图。比如,按行政区的人口密度,农作物单产,人均收入或者产值等,讨论综合分析这一类数据和资料的方法。这些方法都是采取比较的途径,即把实
7、际的地区数据与标准分布(可以是实际的,以某一地区为代表的,也可以是假设的)作对比,用以测度经济地理现象在区域空间上的集中程度与分散程度。n罗伦兹曲线是研究离散区域分布的重要方法。罗伦兹是一位经济统计学家,20世纪20年代发表关于工业集中化的统计方法,提出频率累积曲线cumulative frequency curve,即罗伦兹曲线Lorenz curve。因此,利用罗伦兹曲线,可以对比不同经济地理现象在区域分布的差异,查明他们的地区分布特征与规律。钢铁工业比食品工业在地区分布上更为集中The Lorenz Curve10001005050Cumulative%of XCumulative%of
8、 YPerfect equality lineLorenz curvePerfect inequality lineAB n全市共全市共20192019所小学,在校所小学,在校生总人数生总人数6666万万n10001000人规模以上学校人规模以上学校123123所,所,占全市小学总数的占全市小学总数的6%6%n10001000人规模以上学校学生人规模以上学校学生人数为人数为19.719.7万,占万,占30%30%n中关村一小中关村一小42174217人,中关人,中关村三小村三小36073607人,海淀实验人,海淀实验小学小学35303530人人小学小学基尼系数基尼系数n20世纪初意大利经济学家
9、基尼,根据洛伦茨曲线找出了判断分配平等程度的指标,设实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线左上方的面积为B。并以A除以A+B的商表示不平等程度。这个数值被称为基尼系数或称洛伦茨系数。n如果A为零,基尼系数为零,表示收入分配完全平等;如果B为零则系数为1,收入分配绝对不平等。该系数可在零和1之间取任何值。收入分配越是趋向平等,洛伦茨曲线的弧度越小,基尼系数也越小,反之,收入分配越是趋向不平等,洛伦茨曲线的弧度越大,那么基尼系数也越大。北京市小学资源分布洛伦茨曲线(北京市小学资源分布洛伦茨曲线(G=?G=?)2.4 2.4 连续区域分布的测度连续区域分布的测度 高程
10、曲线高程曲线n高程曲线实际上是面积高程累积曲线,即表示一个流域中哪一部分面积是位于某一高程之上的曲线。n相对高程值采用极差标准化,即 相对高度=(绝对高度高程最低值)/(高程最高值高程最低值)高程积分法高程积分法 n将高程曲线与坐标轴包围的面积作比较。聚类分析趋势面分析回归分析马尔科夫过程克里格法网络分析小波分析细胞自动机2.5 2.5 地理建模地理建模n认识地理现象的本质。n揭示地理要素之间的关系;n揭示地理系统演化规律n模拟预测未来 由于地理现象是必然性与偶然性融合的复杂现象,因此用演绎、归纳、类比相结合的数学方法来解决。从逻辑的角度看,无论是定性还是定量问题,无非是分演绎推理、归纳推理、
11、类比推理三种类型。数学物理方程属于演绎推理的定量方法;数理统计公式属于归纳推理的定量方法;地理现象推理用类比的方法比较多,但是过去很少用地理相似准则进行定量计算。笔者经过长期研究,认为只有将演绎只有将演绎(数理方数理方程程)、归纳、归纳(数理统计数理统计)、类比、类比(相似准则相似准则)融为一体,建立非融为一体,建立非线性、复杂性、相似性、区域性、时序性的地理方程,才能线性、复杂性、相似性、区域性、时序性的地理方程,才能解决地理复杂现象的定量问题解决地理复杂现象的定量问题。笔者做过十几种地理遥感信息模型,发现了一种适合于地理复杂现象的一般地理方程。随着科学技术的进步,研究深入的程度与地理复杂方
12、程是可发展的。马蔼乃-钱学森论地理科学三个方面内容三个方面内容n地理时空分布地理时空分布n地理时空测度与建模地理时空测度与建模n地理时空尺度地理时空尺度 我们差不多可以对英国海岸线的长度有个概念,因为我们以一个适当的量度来测量它.当我们换一个标度(采用更小的单位)来量度它的长度的时候,我们会发现海岸线的长度被大大增加了.这是为什么呢?3.13.1“英国海岸线英国海岸线”问题问题5-minute1/2-degree1-degreeCoarsening of geographic features5-minute1/2-degree1-degreeNarrow features altered a
13、nd merged with others3.2 3.2 地理学中研究尺度的意义地理学中研究尺度的意义对于地理学家和生态学家来说,自然或人文的过程与格局是相当复杂的,尺度效应对其作用也是不言而喻的。分形理论的创始人曼德布罗特曾在科学杂志上撰文指出,英国的海岸线的长度是不确定的,它依赖于测量时所用的尺度。结果令人诧异吗?其实道理很简单,用一公里的标尺和用一米的标尺度量海岸长度所得到的结果肯定是不一样的,这就是尺度效应。尺度问题对于大多科学来说都是存在的。哈维说过,空间是一个变量。那么,对于研究空间分布的传统地理学来讲,空间这个变量肯定也存在“尺度”问题。所谓本征尺度是指自然本质存在的,隐匿于自然
14、实体单元、格局和过程中的真实尺度。它也是个变量,不同的格局和过程在不同的尺度上发生,不同的分类单元或自然实体也从属于不同的空间、时间或组织层次。一般本征尺度可区分为空间尺度、时间尺度、组织尺度、功能尺度等等。划分依据尺度类型空间范围全球尺度、区域尺度、地方及以下尺度长程型、中程型、短程型、非重现型关联型、弱关联型、随机型地质尺度、历史尺度、年际尺度、年及以下周期性、阵发型、随机型依存型、弱依存型、随机型空间周期空间相关时间长短时间特性时间相关3.33.3 本征尺度与非本征尺度本征尺度与非本征尺度本征尺度与非本征尺度的匹配问题本征尺度与非本征尺度的匹配问题如果观测的尺度大于过程尺度,也就是取样太
15、少,所得结果是噪声而不是信号,结果导致对变化的低估;当观测尺度小于过程尺度时,也就是取样太频繁,真实的过程也没有探测到,真正的变化趋势难以把握,同样变化也被低估;当观测的粒度或粗糙度超过过程尺度时,也就是说,样区大小基本与过程尺度相近,或者甚至还超过了过程尺度,那么过程或过程中的格局就会被过度平滑,其间的信息就会被过度聚合。qUpscalingUpscaling所谓Upscaling就是将精微尺度上的观察、试验以及模拟结果外推值较大尺度的过程,它是研究成果的“粗粒化”。q DownscalingDownscaling Downscaling是将宏大尺度上的观测、模拟结果推绎至精微尺度上的过程。
16、Downscaling最大的任务就是从较粗糙的空间和时间分辨率参数化更详细的尺度异质性信息。Downscaling的目的就是将宏大的观测数据或模型模拟结果应用到局部区域,以解决当地的实际问题。3.43.4 主要的主要的ScalingScaling途径途径DownscalingDownscalingUpscalingUpscalingUpscaling和和Downscaling过程示意过程示意Upscaling&DownscalingUpscaling从采样角度看,空间和时间的Upscaling相当于采样点的舍弃,是数据的一种聚合过程。在空间案例中,采样粒度的空间范围逐渐增大,在时间案例中,采样
17、频率由密至疏。数据平均法 参数化的回归方法 块克立格和块协克立格法(block kriging and block cokriging)重正化群方法(renormalization group)数据平均聚合示意图数据平均聚合示意图 Downscaling与Upscaling相反,Downscaling实际上是一种数据解聚(disaggregation)的过程,常用于大尺度的气候模式(GCMs)在区域上的输出结果。点克立格和点协克立格法(point kriging and point cokriging)层次时空贝叶斯模型现在有几种新的贝叶斯基的统计模型途径,如贝叶斯统计小波变换;贝叶斯统计CA
18、RT;贝叶斯统计ANN;贝叶斯统计SVM;层次贝叶斯时空模型等等 总的来说,地学和生态学中的格局与过程是多层次系统,层次间相互联系,过程间存在着许多耦合与反馈。另外,许多过程是随机性的混沌过程(R.Schulze,2000)。因此,尺度和标度变换问题不可避免。3.5 3.5 尺度存在的原因尺度存在的原因q地学格局与过程的空间异质性 q响应与反馈的非线性特征 q涌现特性的发展 q优势过程的尺度改变 q干扰因素的影响 q图示法图示法 q谱分析方法谱分析方法 q空间相关分析技术空间相关分析技术 q半方差方法半方差方法q人工神经网络和小波分析人工神经网络和小波分析3.6 3.6 尺度及尺度域觉察的方法
19、与技术尺度及尺度域觉察的方法与技术尺度觉察技术(图示法)尺度觉察技术(图示法)图示法是尺度及尺度域觉察最为常用的方法,它是将表征尺度变化的各种变量和特征值以不同空间和时间取样单位表现在图上,通过检视其中的曲线规律来获得尺度信息。在图示中,可用实值对特征值与空间或时间取样单位做图,但更多的是用双对数的来标示。一般而言,曲线中明显的拐点可以认为是两个尺度域的分界点。谱分析通过是一种时频分析技术,其中傅立叶变换(Fourier transform)是一种经典而又实用的频谱分析手段。该方法的基本原理是拟合实际观测数据与确定波谱特性数据,当有意义的匹配实现时,格局或过程就会被检视出来。谱分析尤其适合于分
20、析具有周期性结构的空间和时间数据。由于采用三角函数转换,它不受空间数据起始位置的影响。尺度觉察技术(谱方法)尺度觉察技术(谱方法)小波分析示意图小波分析示意图格局与过程的尺度问题格局与过程的尺度问题q对于过程和格局而言,是否存在可以表征的时间和空间尺度,若有,如何表达?q不同尺度的过程与格局之间是如何相互作用的,如何耦合,采用什么方法去耦?如何役使,用什么方法判断?解除役使的外力需要多大,时间有多长?格局与尺度关系格局与尺度关系q格局尺度大小不同,其诸多特性表现出差异。首先,形成与维持的格局的时间随着尺度的增大而加长;其次,在格局形成的动力上,小尺度以自组织力为主,而大尺度以他组织力为主,同时
21、,随着尺度增大,高斯噪声呈逐渐淬灭趋势;第三,格局形成的过程周期上,小尺度以短周期过程为主,多表现为瞬时或脉冲作用,而大尺度的格局则以长周期过程为主,是区域过程多种因素共同作用的产物;第四,在格局内部的联结性上,小尺度格局表现出强联结性,而大尺度格局的内部联结较为松散。过程与尺度关系过程与尺度关系q 在一个变化过程的序列中,包含许多频率的成分,最为明显的典型的是趋势成分和噪声成分。不同的频率成分性态不同,高频不稳,生长较快;相反,低频较稳,变化较为缓慢。以尺度来区分,生长快的高频成分,通常生存周期比较短,能量主要分布在比较少的尺度上;生长较慢的低频成分,往往生存周期比较长,分布的尺度域大,常成
22、为某一过程的背景。举例来说,自工业革命以来的全球气温变化曲线就是气候系统自身的变化趋势叠加一些随机噪声而形成的,其中主要的噪声项是人类活动对全球气温变化的影响。一般来说,随着尺度的增加,过程通常由非平稳序列转变成平稳序列。格局和过程与尺度关系格局和过程与尺度关系q一般来说,随着格局尺度的增大,作用于格局之上的过程的周期加长,过程“毛刺”被剔除,一些细节被“平滑”,曲线变得相对“光滑”。从成因上说,格局尺度增大,内部的空间异质性就会相应增大,高空间异质性会阻尼或削减外部作用力的变异效果。按照役使原理,短时间尺度的随机力作用于大尺度格局时,格局内部缀块之间的过渡区域将成为随机力作用效应的“壁垒”。
23、格局和过程与尺度关系格局和过程与尺度关系尺度研究的框架体系尺度研究的框架体系研究范式研究范式转换途径转换途径转换技术转换技术top-downtop-downbottom-upbottom-upSCSSCSdownscalingdownscalingupscalingupscaling自适应尺度系自适应尺度系统统传统统计方法传统统计方法(RA(RA、CARTCART等等)地统计方法地统计方法(point kriging(point kriging与与point point cokriging)cokriging)其它其它传统统计方法(传统统计方法(RARA、CARTCART等)等)地统计方法地统
24、计方法(block kriging(block kriging与与block block cokriging)cokriging)重整化群方法重整化群方法小波方差、小波熵等小波方差、小波熵等二叉树变换等二叉树变换等1.Simon A Levin.The problem of pattern and scale in ecologyJ.Ecology 1992,73(6):1943-19672.Sten Bergstrm,L.Phil Graham.On the scale problem in hydrological modelingJ.Journal of Hydrology 2019,2
25、11:253-2653.David A.Perry.Self-organizing systems across scalesJ.Tree 2019,10(6):241-2444.Marcel R.Hoosbeek.Incorporating scale into spatio-temporal variability:applications to soil quality and yield dataJ.Geoderma 2019,85:113-1315.Heather A.Viles.Scale issues in weathering studiesJ.Geomorphology 20
26、19,41:63-726.A.Stein,J.Riley,N.Halberg.Issues of scale for environmental indicatorsJ.Agriculture,Ecosystems and Environment 2019,87:215-2327.Roland Schulze.Transcending scales of space and time in impact studies of climate and climate change on agrohydrological responsesJ.Agriculture,Ecosystems and
27、Environment 2019,82:185-2128.Fred L.Bunnell,David J.Huggard.Biodiversity across spatial and temporal scales:problems and opportunitiesJ.Forest Ecology and Management.2019,115:113-126 有关尺度研究的重要文献有关尺度研究的重要文献9.Clark C.Gibson et al.The concept of scale and human dimensions of global change:a surveyJ.Eco
28、logical Economic.2000,32:217-23910.Philip C.Elkie,Robert S.Rempel.Detecting scales of pattern in boreal forest landscapesJ.Forest Ecology and Management.2019,147:253-26111.R.K.Gupta et al.Problems in upscaling of high resolution remote sensing data to coarse spatial resolution overland surfaceJ.Adv.
29、Space Res.2000,26(7):1111-112112.L.Lau et al.Downscaling global information for regional benefit:coupling spatial models at varying space and time scalesJ.Environmental Modelling&Software,2019,14:51952913.Michael P.Bishop et al.Scale-dependent analysis of satellite imagery for characterization of gl
30、acier surfaces in the Karakoram HimalayaJ.Geomorphology 2019,21:217-23214.T.W.Payn et al.Scaling up or scaling down:the use of foliage and soil information for optimizing the phosphate nutrition of radiata pineJ.Forest Ecology and Management 2000,138:79-8915.I.Linati et al.A numerical comparison between two upscaling techniques:non-local inverse based scaling and simplified renormalizationJ.Advances in Water Resources 2019,24:913-929有关尺度研究的重要文献有关尺度研究的重要文献