1、答答辩人:辩人: 罗艳青罗艳青指导教师:邹滨副教授指导教师:邹滨副教授专业:专业: 地图学与地理信息系统地图学与地理信息系统2012014 4-5-5-1111目目 录录结论及展望结论及展望研究结果及讨论研究结果及讨论数据收集及预处理数据收集及预处理LUR关键问题分析及技术路线设计关键问题分析及技术路线设计研究背景及意义研究背景及意义研究背景及意义研究背景及意义 随着社会经济的发展,石油、煤炭等化石燃料的广泛利用,大量的有害气体进入大气中,达到足够的浓度,对人体的舒适、健康、福利或环境造成危害,严重威胁到人类的生存。研究背景及意义研究背景及意义2001-2006年全球PM2.5年均浓度分布图全
2、球绝大部分地区PM2.5年均浓度超过WHO划定的安全界限(10ug/m3)。其中,北非、东亚和中国等地区PM2.5平均浓度高于50ug/m3,部分地区甚至接近80ug/m3。全球每年因PM2.5污染导致的过早死亡人数高达320万,造成超过7600万健康生命年(1个人减少1年寿命为1健康生命年)的损失。研究背景及意义研究背景及意义土地利用回归建模具有数据要求低、考虑因素齐全、模土地利用回归建模具有数据要求低、考虑因素齐全、模拟精度和空间分辨率较高、适用范围广等优点。拟精度和空间分辨率较高、适用范围广等优点。空气污染浓度模拟方法:空气污染浓度模拟方法:原理简单计算简便误分类明显邻近模型空间插值扩散
3、模型LUR模型原理复杂操作复杂对数据要求较高精度较高原理简单操作相对简单数据相对易获取空间可迁移性差时间分辨率不高原理简单操作简便对采样点数据依赖性强目目 录录结论及展望结论及展望关键问题研究结果及讨论关键问题研究结果及讨论数据收集及预处理数据收集及预处理LUR关键问题分析及技术路线设计关键问题分析及技术路线设计研究背景及意义研究背景及意义LUR关键问题分析及技术路线设计关键问题分析及技术路线设计LURLUR(土地利用回归模型)是一种基于空气质(土地利用回归模型)是一种基于空气质量监测站点量监测站点PMPM2.52.5观测浓度及其周边地理要素观测浓度及其周边地理要素变量,借助最小二乘法建立的用
4、于预测研究变量,借助最小二乘法建立的用于预测研究区内任意空间位置点区内任意空间位置点PMPM2.52.5浓度的多变量回归浓度的多变量回归建模手段。建模手段。模型模型精度精度模型构建模型构建与检验与检验样本样本选取选取特征变特征变量筛选量筛选LUR关键问题分析及技术路线设计关键问题分析及技术路线设计样本数据选取样本数据选取:文献文献数据来源数据来源站点站点监测周期监测周期时间分辨率时间分辨率27自主采样40-42-年均20自主采样404个14天年均22常规监测49-年均23常规监测23-年均28自主采样407天年均29自主采样116-年均30自主采样262个7天年均24常规监测32-年均32自主
5、采样318-年均25常规监测18-年均31自主采样50-年均37常规监测77-日均36常规监测347天月均38常规监测18-日均26常规监测13-周均样本数据来源:自主采样;常规监测。自主采样周期:1-4个7天。样本数据大小:13-318个不等,普遍在20-80之间。LUR关键问题分析及技术路线设计关键问题分析及技术路线设计特征变量筛选特征变量筛选:LUR关键问题分析及技术路线设计关键问题分析及技术路线设计LUR模型构建模型构建与检验与检验模型检验:模型检验:残差、异方差和预测变量之间的相关性检验残差空间自相关检验n-1交叉验证法预留检验样本法模型构建:模型构建:多元线性回归多元逐步回归模型与
6、贝叶斯最大熵法(BME)结合GAM模型与LUR模型结合地理加权回归模拟LUR关键问题分析及技术路线设计关键问题分析及技术路线设计模型精度模型精度:PM2.5 LUR模型中通常只包含少数的预测变量(约2-6个);LUR模型解释PM2.5空间分异的百分比在40-80左右;模型的检验标准误差在1.00ug/m3-3.30ug/m3之间。1地理要素“污染贡献”空间尺度方面:“各类特征变量污染贡献估算的最佳空间作用尺度究竟是多大”及其对模型精度的影响尚不明确LUR模型空间迁移特性方面:PM2.5LUR模型可迁移性探索研究较少;模型迁移特性不明确;模型迁移条件不明确。步的探索分析LUR关键问题分析及技术路
7、线设计关键问题分析及技术路线设计PMPM2.52.5LURLUR模型存在的主要问题模型存在的主要问题23模型精度评价方面:基于点的模型精度评价方法,评价范围局限于污染物浓度监测样本点,易受站点数量分布特征影响。LUR关键问题分析及技术路线设计关键问题分析及技术路线设计研究内容:研究内容:特征变量空间尺度依赖研究模型精度评价方法研究模型空间迁移特性研究u 区域模型对比区域模型对比u 模型互相迁移模型互相迁移u 迁移效果分析迁移效果分析u 浓度表面模拟浓度表面模拟u 基于检验点的基于检验点的模型精度评价模型精度评价u 基于面的模型基于面的模型精度评价精度评价u 特征变量与特征变量与PM2.5年均浓
8、度值之间年均浓度值之间的相关关系随缓的相关关系随缓冲区半径大小的冲区半径大小的变化情况变化情况u 特征变量空间尺特征变量空间尺度的选取对模型度的选取对模型精度的影响精度的影响LUR关键问题分析及技术路线设计关键问题分析及技术路线设计技术路线:技术路线:目目 录录结论及展望结论及展望关键问题研究结果及讨论关键问题研究结果及讨论数据收集及预处理数据收集及预处理LUR关键问题分析及技术路线设计关键问题分析及技术路线设计研究背景及意义研究背景及意义数据收集及预处理数据收集及预处理研究区域概括:研究区域概括:研究区位于美国本土东部沿海地区,覆盖Alabama、Maryland、Florida等21各州区
9、,1066个县,占地面积1,515,453km2。数据收集及预处理数据收集及预处理气象等气象等地理要素数据地理要素数据数据采集数据采集数据预处理数据预处理浓度监测数据浓度监测数据土地利用数据土地利用数据道路数据道路数据人口分布数据人口分布数据区划数据区划数据数据收集及预处理数据收集及预处理ID站点号站点号年均浓度年均浓度最小值最小值最大值最大值平均值平均值RMSE101-005-000212.794.4321.8212.942.71201-027-000113.47301-049-100314.2401-089-001415501-119-000212.13 45023-011-20069.7
10、监测数据:监测数据:污染特征:污染特征:共450个监测站点,PM2.5年均浓度值范围:4.43-21.82 ug/m3,平均浓度值为12.94 ug/m3。PM2.5污染呈南北两端浓度低,中间区域浓度高的分布趋势,Pennsylvania、New Jersey、Maryland、Alabama、Georgia州区域的污染较严重数据收集及预处理数据收集及预处理地理要素数据:地理要素数据:数据收集及预处理数据收集及预处理区域区域训练样本训练样本检验样本检验样本数量最小值最大值均值数量最小值最大值均值全区全区3624.4321.8210.72884.4419.0012.98子区域子区域1244.43
11、15.029.5854.4413.988.70子区域子区域21245.0022.0013.00316.2717.4613.12子区域子区域32147.0018.0012.00528.0019.0013.31数据预处理:数据预处理:区域划分及样本数据分组数据收集及预处理数据收集及预处理数据预处理:数据预处理:特征变量提取土地利用类型分为:水体、自由用地、低密度城区、中密度城区、高密度城区、荒地、林地、耕地、湿地九个类别;使用面积占比特征变量。道路交通:主要道路、次要道路、当地道路、高速道路、其他道路五种道路类型。使用缓冲区内道路长度和到道路最近距离特征变量。人口分布:人口密度;住房密度。其他:距
12、海距离缓冲区半径:10000m、5000m、4500m、4000m、3500m、3000m、2500m、2000m、1500m、1000m、800m、500m、400m、300m、200m、100m目目 录录结论及展望结论及展望关键问题研究结果及讨论关键问题研究结果及讨论数据收集及预处理数据收集及预处理LUR关键问题分析及技术路线设计关键问题分析及技术路线设计研究背景及意义研究背景及意义关键问题研究结果及讨论(关键问题研究结果及讨论(1 1)PM2.5 LUR建模特征变量空间尺度依赖研究建模特征变量空间尺度依赖研究PM2.5浓度与特征变量相关性分析不同地理要素特征变量与PM2.5年均浓度的相关
13、系数均存在较大差异;土地利用类型和道路交通要素与PM2.5年均浓度的相关性较强。各特征变量有其特有的空间尺度效应。如水体、荒地、林地、耕地和湿地与PM2.5年均浓度负相关,分别在10000m、10000m、100m、5000m和10000m处达到最强相关;自由用地、低/中/高密度区域与PM2.5年均浓度呈正相关,分别在10000m、5000m、100m和3500m处达到最相关。关键问题研究结果及讨论(关键问题研究结果及讨论(1 1)PM2.5 LUR建模特征变量空间尺度依赖研究建模特征变量空间尺度依赖研究模型拟合度:最佳空间尺度模型、5000m、200m-800m尺度模型。模型预测变量:5-8
14、个不等,预测变量类型在一定尺度范围存在较强的相似性,如3500m-4500m;2000m-3000m;200m-1500m。预测变量:距道路/海距离特征变量对PM2.5污染的贡献较稳定,自由用地、高密度区域和道路长度类特征变量在考虑缓冲区范围较大时贡献大,林地、湿地、人口密度类特征变量则在考虑缓冲区范围较小时贡献大。关键问题研究结果及讨论(关键问题研究结果及讨论(1 1)PM2.5 LUR建模特征变量空间尺度依赖研究建模特征变量空间尺度依赖研究研究结果:研究结果:u距海距离和土地利用类要素相比道路交通、人口分布类要素与PM2.5年均浓度相关性更高。u不同特征变量对PM2.5浓度的影响方向不一样
15、,不同的特征变量与PM2.5年均浓度的相关性随空间尺度增大的变化趋势不一致。u水体、自由用地、湿地、道路长度、人口密度和住房密度最佳空间尺度为10000m,中密度区域和林地的最佳空间尺度为100m,低密度区域、耕地为5000m,高密度区域为3500m。u最强相关空间尺度变量构建的LUR模型无论是拟合度优于其他尺度变量下的模型(R2:0.37 vs 0.33-0.35)研究局限:研究局限:u考虑地理要素有限:考虑了土地利用类型、道路交通、人口分布、距海距离等地理要素,可增加排放特征,城市形态、气候场、背景污染浓度等要素。u缓冲区半径设置范围有限:100m-10km离散半径设置,对于特征变量最佳空
16、间尺度的选取仍然是一个相对粗略的概念。u统计回归方法选取:相关分析缺乏对空间分布特征的考虑易受训练样本选取的影响;多元线性回归建模方法没有考虑到特征变量对污染贡献的地域差异。关键问题研究结果及讨论(关键问题研究结果及讨论(2 2)ID区域区域预测变量预测变量adj R21全区X11-10000, X17-100, X23-10000, X32-10000,X45, X41, X42, X5,0.372子区1X14-50000.523子区2X13-1500,X19-10000, X17-100, X22-10000, X31-800, X50.594子区3X14-10000, X19-10000
17、,X15-1500, X5, X410.39PM2.5 LUR模型的空间迁移特性研究模型的空间迁移特性研究子区模型的模拟性能高于全区模型;各模型建模变量的数量分别为8个、1个、6个和5个;各模型预测变量差异较大。关键问题研究结果及讨论(关键问题研究结果及讨论(2 2)PM2.5 LUR模型的空间迁移特性研究模型的空间迁移特性研究表表4-3 模型迁移结果模型迁移结果模型ID子区1 子区2子区3 全区10.53 0.510.310.3720.520.010.040.0430.290.590.320.3040.460.440.390.26迁移效果较好的模型依次为:模型1、模型4、模型3和模型2。除模
18、型1迁移到子区1外,其他均表现为本地模型优于迁移模型。大区域下LUR模型的迁移效果优于小区域模型的迁移效果。预测变量多的LUR模型迁移效果相对较好。关键问题研究结果及讨论(关键问题研究结果及讨论(2 2)PM2.5 LUR模型的空间迁移特性研究模型的空间迁移特性研究本地模型模型2模型3模型4本地模型模型1模型3模型4全区全区子区子区1关键问题研究结果及讨论(关键问题研究结果及讨论(2 2)PM2.5 LUR模型的空间迁移特性研究模型的空间迁移特性研究子区子区2子区子区3本地模型模型1模型2模型4本地模型模型1模型2模型3关键问题研究结果及讨论(关键问题研究结果及讨论(2 2)研究结果:研究结果
19、:u各区域特征变量强相关空间尺度差异较大,如耕地面积占比在四个区域的强相关空间尺度分别为10000m、2000m、10000m、500m。u区域LUR模型,无论数量还是预测变量均存在较大差异。u本地模型优于迁移模型。u大区域下LUR模型或的预测变量多的LUR模型迁移效果相对较好。研究局限:研究局限:u区域划分因子单一:仅基于气候条件划分子区,各子区内部仍然存在较大的污染环境差异。应综合考虑地形、气候、城市密度、PM2.5排放结构等污染环境要素,构建适用于LUR模型迁移的区域判别因子。u建模方法存在不足:使用统一流程建模后区域模型预测变量数量较少,区域间模型预测变量相似性低。应尽量增加区域模型相
20、似性。PM2.5 LUR模型的空间迁移特性研究模型的空间迁移特性研究关键问题研究结果及讨论(关键问题研究结果及讨论(3 3)PM2.5 LUR模型精度评价方法研究模型精度评价方法研究区域最佳拟合度模型模拟全区浓度(LUR模型):子区1使用了模型1,子区2使用了模型3,子区3使用了模型4。并与OK、IDW空间插值模型比较。关键问题研究结果及讨论(关键问题研究结果及讨论(3 3)PM2.5 LUR模型精度评价方法研究模型精度评价方法研究表表5-1 基于检验样本的模拟精度验证结果(基于检验样本的模拟精度验证结果(RMSE,单位:,单位:ug/m3)全区子区1子区2子区3LUR2.203.073.03
21、1.96OK1.702.721.801.50IDW1.842.842.101.53OK模型模拟精度较好,其次是IDW模型和LUR模型;基于不同检验样本下的模型精度评价结果存在偏差;子区3的检验精度优于全区、子区2、子区1;OK和IDW模型的模拟精度比较接近。关键问题研究结果及讨论(关键问题研究结果及讨论(3 3)PM2.5 LUR模型精度评价方法研究模型精度评价方法研究表表5-2 PM2.5年均浓度表面统计特征(浓度单位:年均浓度表面统计特征(浓度单位:ug/m3)最小值最大值范围均值STD信息熵LUR1.1119.1918.0811.871.98 6.95OK6.2619.4313.1812
22、.772.10 7.18IDW4.4321.8117.3812.632.20 7.52IDW模型模拟PM2.5年均浓度范围与实际观察浓度范围(4.43ug/m3-21.82 ug/m3)最接近;LUR模型模拟浓度均值与监测均值(10.72 ug/m3)最接近;LUR模型模拟浓度表面的图像信息相对丰富。空间分辨率高。关键问题研究结果及讨论(关键问题研究结果及讨论(3 3)PM2.5 LUR模型精度评价方法研究模型精度评价方法研究IDW模拟浓度变化频率高,起伏大,起伏变化接近观测站点浓度分布;OK模型起伏情况与IDW较相似,但是起伏范围相对将少;LUR模型模拟结果变化趋势平缓,起伏频率低、幅度小。
23、关键问题研究结果及讨论(关键问题研究结果及讨论(3 3)研究结果:研究结果:uLUR模型模拟美国东部地区2006年PM2.5年均浓度表现为南北两端浓度低,中间区域浓度高的分布,并且中间区域呈明显的沿海向内地浓度值增加的变化趋势。OK、IDW模型模拟美国东部地区2006年PM2.5年均浓度分布较接近,均表现为南北两端向中间浓度增高的变化趋势。u离散点方式下的模型精度评价结果表明:OK模型模拟精度优于IDW模型,LUR模型模拟精度最差。u基于连续面的模型精度评价结果表明:LUR模型模拟表面包含较多的浓度变化信息,模型模拟浓度范围大,模拟平均浓度接近实际监测浓度,但是模拟浓度值普遍偏低,变化趋势缓慢
24、。研究局限:研究局限:u图像信息熵作为模拟浓度表面不同浓度值出现概率的统计结果,尽管能够在一定程度上反映模拟的年均浓度表面包含PM2.5年均浓度变化信息多寡,但是评估效力有限,并且熵值大小与模型模拟精度之间尚未建立起明确的科学对应关系。u趋势面分析方法,在查看模型模拟浓度变化趋势上面有独特的优势,但是仍然在一定程度上依赖于监测样本数据的分布,且操作起来复杂,不利用推广。u本研究样本数量较大,满足OK、IDW模型模拟PM2.5浓度分布条件,实验结果是否可适用于其他地区或是否会随研究区域空间尺度大小改变也有待进一步探索。PM2.5 LUR模型精度评价方法研究模型精度评价方法研究目目 录录结论及展望
25、结论及展望关键问题研究结果及讨论关键问题研究结果及讨论数据收集及预处理数据收集及预处理LUR关键问题分析及技术路线设计关键问题分析及技术路线设计研究背景及意义研究背景及意义结论及展望结论及展望LUR建模中特征变量存在空间尺度依赖性特征,不同类型地理要素乃至同一地理要素类不同特征变量的空间尺度依赖差异较大,各特征变量依赖空间尺度的大小取决于地理要素特征变量影响PM2.5浓度变化的物理机制及其作用范围大小。受模型预测变量差距较大的影响,LUR模型空间迁移特性较差。相对而言,全区模型的迁移效果较好,大区域模型或预测变量多模型迁移效果较好。如模型1和模型4的迁移效果优于模型2和模型3点面结合的模型检验
26、方法评价结果更稳定、更准确,评价的方面也更广泛。本研究对于LUR、OK、IDW模型的评价结果表明:OK模型模拟精度最好,其次是IDW模型和LUR模型,但是,LUR模型空间分辨率高、图像信息丰富的优势明显。研究结论:研究结论:结论及展望结论及展望污染特征库的构建与筛选:系统分析LUR建模潜在地理要素、可用特征变量,分类评估特征变量的代表性,选取数据易获取、代表性强、能广泛应用的特征变量做为地理要素标准建模变量,并构建污染特征数据库。模型的时空尺度效应研究:研究区域大小和研究对象的时空分辨率对模型变量选取及模型精度的影响,以及LUR模型的时空迁移特性。深化LUR模型的应用。模型构建方法优化:如优化特征变量提取方法,使用主成分分析等方法提高特征变量的预测能力;地理加权建模;模型检验方法优化;分层模型构建;时空模型构建等。应用方向扩展:如PM2.5浓度的实时预测预报,将PM2.5 LUR模型的应用于居民健康出行路线设置,商品房/学校位置选取,高速公里封闭路线选取、重要污染源关停等方面。研究展望:研究展望:敬请各位老师和同学对论文提出宝贵意见 谢 谢!