1、1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。2空间依赖、空间异质性空间依赖、空间异质性 n传统的统计理论是一种建立在独立观测值假定基础上传统的统计理论是一种建立在独立观测值假定基础上的理论。然而,在现实世界中,特别是遇到空间数据的理论。然而,在现实世界中,特别是遇到空间数据问题时,独立观测值在现实生活中并不是普遍存在的问题时,独立观测值在现实生活中并不是普遍存在的(Getis,1997)。)。n对于具有地理空间属性的数据,一般认为离的近的变对于具有地理空间属性的数据,一般认为离的近的变量之间比在空间上离的远的变量之间具有更加
2、密切的量之间比在空间上离的远的变量之间具有更加密切的关系(关系(Anselin&Getis,1992)。正如著名的)。正如著名的Tobler地理学第一定律所说:地理学第一定律所说:“任何事物之间均相关,任何事物之间均相关,而离的较近事物总比离的较远的事物相关性要高。而离的较近事物总比离的较远的事物相关性要高。”(Tobler,1979)n地区之间的经济地理行为之间一般都存在一定程度的地区之间的经济地理行为之间一般都存在一定程度的Spatial Interaction,Spatial Effects):):Spatial Dependence and Spatial Autocorrelatio
3、n)。)。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。9空间异质性空间异质性n空间异质性(空间差异性),是空间计量学模空间异质性(空间差异性),是空间计量学模型识别的第二个来源。型识别的第二个来源。n空间异质性或空间差异性,指地理空间上的区空间异质性或空间差异性,指地理空间上的区域缺乏均质性,存在发达地区和落后地区、中域缺乏均质性,存在发达地区和落后地区、中心(核心)和外围(边缘)地区等经济地理结心(核心)和外围(边缘)地区等经济地理结构,从而导致经济社会发展和创新行为存在较构,从而导致经济社会发展和创新行为存在较大的空间上
4、的差异性。大的空间上的差异性。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。10空间异质性空间异质性n空间异质性反映了经济实践中的空间观测单元空间异质性反映了经济实践中的空间观测单元之间经济行为(如增长或创新)关系的一种普之间经济行为(如增长或创新)关系的一种普遍存在的不稳定性。遍存在的不稳定性。n区域创新的企业、大学、研究机构等主体在研区域创新的企业、大学、研究机构等主体在研发行为上存在不可忽视的个体差异,譬如研发发行为上存在不可忽视的个体差异,譬如研发投入的差异导致产出的技术知识的差异,投入的差异导致产出的技术知识的差异,
5、n这种创新主体的异质性与技术知识异质性的耦这种创新主体的异质性与技术知识异质性的耦合将导致创新行为在地理空间上具有显著的异合将导致创新行为在地理空间上具有显著的异质性差异,进而可能存在创新在地理空间上的质性差异,进而可能存在创新在地理空间上的相互依赖现象或者创新的局域俱乐部集团。相互依赖现象或者创新的局域俱乐部集团。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。11空间异质性空间异质性n对于空间异质性,只要将空间单元的特性考虑对于空间异质性,只要将空间单元的特性考虑进去,大多可以用经典的计量经济学方法进行进去,大多可以用经典的
6、计量经济学方法进行估计。估计。n但是当空间异质性与空间相关性同时存在时,但是当空间异质性与空间相关性同时存在时,经典的计量经济学估计方法不再有效,而且在经典的计量经济学估计方法不再有效,而且在这种情况下,问题变得异常复杂,区分空间异这种情况下,问题变得异常复杂,区分空间异质性与空间相关性比较困难。质性与空间相关性比较困难。n空间变系数的地理加权回归模型空间变系数的地理加权回归模型(Geographical Weighted Regression,简,简记为记为GWR)是处理空间异质性的一种良好的)是处理空间异质性的一种良好的估计方法。估计方法。1/29/2023天行健,君子以自强不息;地势坤,
7、君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。12空间依赖性及集群的识别与检验空间依赖性及集群的识别与检验 n将空间依赖性考虑进来以后,在建立模型进行将空间依赖性考虑进来以后,在建立模型进行创新分析研究之前,一般必须先进行空间相关创新分析研究之前,一般必须先进行空间相关性的预检验性的预检验n如果空间效应在发挥作用,则需要将空间效应如果空间效应在发挥作用,则需要将空间效应纳入模型分析框架之中,并采用适合于空间计纳入模型分析框架之中,并采用适合于空间计量经济模型估计的方法进行估计量经济模型估计的方法进行估计n如果没有表现出空间效应,则可直接采用一般如果没有表现出空间效应,则可直接
8、采用一般估计方法(如估计方法(如OLS)估计模型参数。)估计模型参数。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。13空间依赖性及集群的识别与检验空间依赖性及集群的识别与检验 n在引入空间变量或者经过空间过滤的空间计量在引入空间变量或者经过空间过滤的空间计量模型建立之后,其效果的好坏还需要通过空间模型建立之后,其效果的好坏还需要通过空间相关检验进行判断,一般可通过对真实值和模相关检验进行判断,一般可通过对真实值和模型估计值之间的残差进行空间相关性检验实现。型估计值之间的残差进行空间相关性检验实现。n如果参数经过检验在空间上没
9、有表现出相关性,如果参数经过检验在空间上没有表现出相关性,则表明在引入空间变量或者经过考虑了空间效则表明在引入空间变量或者经过考虑了空间效应后的模型已经成功地处理了空间相关性。应后的模型已经成功地处理了空间相关性。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。14空间依赖性及集群的识别与检验空间依赖性及集群的识别与检验 n计算和检验一个地区的创新行为在地理空间上计算和检验一个地区的创新行为在地理空间上有没有表现出空间自相关(依赖)性(有没有表现出空间自相关(依赖)性(Cliff&Ord,1981;Cressie,1993)、是
10、否存在集)、是否存在集群现象(吴玉鸣,群现象(吴玉鸣,2006a,2006b)。)。n空间统计和空间计量经济学的方法有许多种,空间统计和空间计量经济学的方法有许多种,最著名也最常用的有:最著名也最常用的有:Morans I(Moran,1950)、)、Gearys C、Getis指数(指数(Ord&Getis,1995)。)。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。15空间依赖性及集群的识别与检验空间依赖性及集群的识别与检验 n以上方法各有其功用,各有其优缺点,同时亦以上方法各有其功用,各有其优缺点,同时亦有其适用范围及
11、限制。有其适用范围及限制。n一般来说,这些方法在功用上可大致分为两大一般来说,这些方法在功用上可大致分为两大类:全域空间自相关(类:全域空间自相关(Global Spatial Autocorrelation)和局域空间自相关()和局域空间自相关(Local Spatial Autocorrelation)。)。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。16全域空间相关性检验与分析 n全域空间自相关(全域空间自相关(Global Spatial Autocorrelation)是从区域空间的整体上刻画)是从区域空间的整体上
12、刻画区域创新活动空间分布的集群情况。区域创新活动空间分布的集群情况。n在实际的空间相关分析应用研究中,由于在实际的空间相关分析应用研究中,由于Morans I指数和指数和Gearys C比率的作用基本相比率的作用基本相同,其不同之处是同,其不同之处是Morans I主要针对于全域空主要针对于全域空间相关性分析,而间相关性分析,而Gearys C指数则适用于局域指数则适用于局域空间关联分析。空间关联分析。n在许多实证研究中,在许多实证研究中,Morans I 和和Gearys C是是常用方法,已在大量文献中出现,尤其是前者。常用方法,已在大量文献中出现,尤其是前者。因此,以下介绍常用的因此,以下
13、介绍常用的Morans I指数的计算及指数的计算及检验过程。检验过程。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。17全域空间相关性检验与分析nMorans I定义如下:定义如下:n其中,其中,表示第表示第 个地个地区的观测值(如专利数),为地区总数(如省域),区的观测值(如专利数),为地区总数(如省域),为二进制的邻近空间权值矩阵,表示其中的任一元素,为二进制的邻近空间权值矩阵,表示其中的任一元素,采用邻近标准或距离标准,其目的是定义空间对象的采用邻近标准或距离标准,其目的是定义空间对象的相互邻近关系。相互邻近关系。nin
14、jijninjjiijWSYYYYWIsMoran11211)(niiYYnS12)(1niiYnY11iYii1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。18全域空间相关性检验与分析n如果如果Morans I的正态统计量的的正态统计量的Z值均大于正态值均大于正态分布函数在分布函数在0.05(0.01)水平下的临界值)水平下的临界值1.65(1.96),表明区域创新在空间分布上具有明),表明区域创新在空间分布上具有明显的正向相关关系,显的正向相关关系,n正的空间相关代表相邻地区的类似特征值出现正的空间相关代表相邻地区的类似特
15、征值出现集群(集群(Clustering)趋势。)趋势。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。19目前计量研究方法及其局限性目前计量研究方法及其局限性 n目前有关研究的计量方法主要是传统的回归分析目前有关研究的计量方法主要是传统的回归分析方法(如多元统计分析、回归分析、数据包络分方法(如多元统计分析、回归分析、数据包络分析析DEA等方法),其实质上都是线性的变量之间等方法),其实质上都是线性的变量之间相互关系的一种测量方法,适合于企业或产业部相互关系的一种测量方法,适合于企业或产业部门时间序列层面的经验研究,未考虑区域
16、(或截门时间序列层面的经验研究,未考虑区域(或截面单元)之间的空间关联,局限性比较明显。面单元)之间的空间关联,局限性比较明显。n区域之间的经济行为会相互影响,这使其存在显区域之间的经济行为会相互影响,这使其存在显著的外部效应,导致地区之间的经济行为存在溢著的外部效应,导致地区之间的经济行为存在溢出效应。出效应。n经济产出不仅受到本地投资的强度、而且还会受经济产出不仅受到本地投资的强度、而且还会受到周边其他地区的投资活动产生的溢出效应及政到周边其他地区的投资活动产生的溢出效应及政策的影响。策的影响。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤
17、,君子以厚德载物。20目前计量研究方法及其局限性目前计量研究方法及其局限性 n经济集群行为可以通过检验一个代表地区间考虑交互经济集群行为可以通过检验一个代表地区间考虑交互作用的生产函数,即该地区的经济活动及其自身的特作用的生产函数,即该地区的经济活动及其自身的特征与其他地区的经济活动的关系,来考察区域经济行征与其他地区的经济活动的关系,来考察区域经济行为的集群行为。为的集群行为。n可通过纳入空间效应(空间相关和空间差异)的空间可通过纳入空间效应(空间相关和空间差异)的空间计量经济模型计量经济模型空间回归模型,包括常系数的空间空间回归模型,包括常系数的空间滞后模型(滞后模型(Spatial La
18、g Model,SLM)与空间误差)与空间误差模型两种(模型两种(Spatial Error Model,SEM)()(Anselin,1988;Anselin,Florax,1995;吴玉鸣,;吴玉鸣,2005)和变系数的地理加权回归模型(和变系数的地理加权回归模型(Geographical Weighted Regression,GWR)来实现。)来实现。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。21空间计量经济模型及估计技术空间计量经济模型及估计技术 n空间计量经济学是计量经济学的一个分支,研究的是空间计量经济学是计
19、量经济学的一个分支,研究的是在横截面数据(在横截面数据(Cross-sectional Data)和面板数据)和面板数据(Panel Data)的回归模型中如何处理空间交互作用)的回归模型中如何处理空间交互作用(空间自相关)和空间结构(空间非均匀性)(空间自相关)和空间结构(空间非均匀性)(Anselin,1988)。)。n最近发展起来的空间统计学和空间计量经济学不仅解最近发展起来的空间统计学和空间计量经济学不仅解决了标准统计方法在处理空间数据时的失误问题决了标准统计方法在处理空间数据时的失误问题,更更重要的是为测量这种空间联系及其性质、并在建模时重要的是为测量这种空间联系及其性质、并在建模时
20、明确地引入空间联系变量以估算与检验其贡献提供了明确地引入空间联系变量以估算与检验其贡献提供了全新的手段(应龙根,宁越敏,全新的手段(应龙根,宁越敏,2005)。)。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。22空间计量经济模型及估计技术空间计量经济模型及估计技术 n实际上,早在实际上,早在1970年代欧洲就展开了空间计量经济年代欧洲就展开了空间计量经济学研究,并将它作为一个确定的领域。学研究,并将它作为一个确定的领域。Paelinck&Klaassen(1979)定义了这个领域,包括:空间相)定义了这个领域,包括:空间相互
21、依赖在空间模型中的任务;空间关系不对称性;位互依赖在空间模型中的任务;空间关系不对称性;位于其他空间的解释因素的重要性;过去的和将来的相于其他空间的解释因素的重要性;过去的和将来的相互作用之间的区别;明确的空间模拟。互作用之间的区别;明确的空间模拟。nAnselin(1988)将空间计量经济学定义为:处理由)将空间计量经济学定义为:处理由区域科学模型统计分析中的空间所引起的特殊性的技区域科学模型统计分析中的空间所引起的特殊性的技术总称。换句话说,空间计量经济学研究的是明确考术总称。换句话说,空间计量经济学研究的是明确考虑空间影响(空间自相关和空间不均匀性)的方法。虑空间影响(空间自相关和空间不
22、均匀性)的方法。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。23空间常系数回归模型及估计技术空间常系数回归模型及估计技术 n目前,空间计量经济学研究包括以下四个感兴目前,空间计量经济学研究包括以下四个感兴趣的领域:趣的领域:n计量经济模型中空间效应的确定;计量经济模型中空间效应的确定;n合并了空间影响的模型的估计;合并了空间影响的模型的估计;n空间效应存在的说明、检验和诊断;空间效应存在的说明、检验和诊断;n空间预测。空间预测。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,
23、君子以厚德载物。24空间常系数回归模型及估计技术空间常系数回归模型及估计技术 n空间计量经济学模型有多种类型(空间计量经济学模型有多种类型(Anselin,et al.2004)。)。n首先介绍纳入了空间效应(空间相关和空间差异)、首先介绍纳入了空间效应(空间相关和空间差异)、适用于截面数据的空间常系数回归模型,包括空间滞适用于截面数据的空间常系数回归模型,包括空间滞后模型(后模型(Spatial Lag Model,SLM)与空间误差模)与空间误差模型(型(Spatial Error Model,SEM)两种,以及空间)两种,以及空间变系数回归模型变系数回归模型地理加权回归模型地理加权回归模
24、型(Geographical Weighted Regression,GWR)。)。n适用于时间序列和截面数据合成的空间面板数据计量适用于时间序列和截面数据合成的空间面板数据计量经济学模型将在以后予以介绍。经济学模型将在以后予以介绍。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。25空间滞后模型空间滞后模型SLMn空间滞后模型(空间滞后模型(Spatial Lag Model,SLM)主要是)主要是探讨各变量在一地区是否有扩散现象(溢出效应)。探讨各变量在一地区是否有扩散现象(溢出效应)。其模型表达式为:其模型表达式为:n参数
25、参数 反映了自变量对因变量的影响,空间滞后因变反映了自变量对因变量的影响,空间滞后因变量量 是一内生变量,反映了空间距离对区域行为的作是一内生变量,反映了空间距离对区域行为的作用。用。XWyyWy1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。26空间滞后模型空间滞后模型SLMn区域行为受到文化环境及与空间距离有关的迁区域行为受到文化环境及与空间距离有关的迁移成本的影响,具有很强的地域性(移成本的影响,具有很强的地域性(Anselin et al.,1996)。)。n由于由于SLM模型与时间序列中自回归模型相类似,模型与时间序列
26、中自回归模型相类似,因此因此SLM也被称作空间自回归模型(也被称作空间自回归模型(Spatial Autoregressive Model,SAR)。)。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。27空间误差模型空间误差模型SEM n空间误差模型(空间误差模型(Spatial Error Model,SEM)的数学表达式为:的数学表达式为:n式中,式中,为随机误差项向量,为为随机误差项向量,为n*1阶的截面因阶的截面因变量向量的空间误差系数,变量向量的空间误差系数,为正态分布的随为正态分布的随机误差向量。机误差向量。XyW
27、1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。28空间误差模型空间误差模型SEMnSEM中参数中参数 反映了自变量反映了自变量X对因变量对因变量y的影响。的影响。参数参数 衡量了样本观察值中的空间依赖作用,衡量了样本观察值中的空间依赖作用,即相邻地区的观察值即相邻地区的观察值y对本地区观察值对本地区观察值y的影响的影响方向和程度。方向和程度。n存在于扰动误差项之中的空间依赖作用,度量存在于扰动误差项之中的空间依赖作用,度量了邻近地区关于因变量的误差冲击对本地区观了邻近地区关于因变量的误差冲击对本地区观察值的影响程度。由于察值的
28、影响程度。由于SEM模型与时间序列模型与时间序列中的序列相关问题类似,也被称为空间自相关中的序列相关问题类似,也被称为空间自相关模型(模型(Spatial Autocorrelation Model,SAC)。)。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。29估计技术估计技术n鉴于空间回归模型由于自变量的内生性,对于鉴于空间回归模型由于自变量的内生性,对于上述两种模型的估计如果仍采用上述两种模型的估计如果仍采用OLS,系数估,系数估计值会有偏或者无效,需要通过计值会有偏或者无效,需要通过IV、ML或或GLS、GMM等其他方
29、法来进行估计。等其他方法来进行估计。nAnselin(1988)建议采用极大似然法估计空)建议采用极大似然法估计空间滞后模型(间滞后模型(SLM)和空间误差模型()和空间误差模型(SEM)的参数。的参数。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。30空间自相关检验与空间自相关检验与SLM、SEM的选择的选择n判断地区间创新产出行为的空间相关性是否存在,以及判断地区间创新产出行为的空间相关性是否存在,以及SLM和和SEM那个模型更恰当,一般可通过包括那个模型更恰当,一般可通过包括Morans I检验、两个拉格朗日乘数(检验、
30、两个拉格朗日乘数(Lagrange Multiplier)形)形式式LMERR、LMLAG及其稳健(及其稳健(Robust)的)的R-LMERR、R-LMLAG)等形式来实现。)等形式来实现。n由于事先无法根据先验经验推断在由于事先无法根据先验经验推断在SLM和和SEM模型中是模型中是否存在空间依赖性,有必要构建一种判别准则,以决定否存在空间依赖性,有必要构建一种判别准则,以决定哪种空间模型更加符合客观实际。哪种空间模型更加符合客观实际。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。31空间自相关检验与空间自相关检验与SLM、
31、SEM的选择的选择nAnselin和和Florax(1995)提出了如下判别准则:)提出了如下判别准则:如果在空间依赖性的检验中发现如果在空间依赖性的检验中发现LMLAG较之较之LMERR在统计上更加显著,且在统计上更加显著,且R-LMLAG显著而显著而R-LMERR不显著,则可以断定适合的模型是空不显著,则可以断定适合的模型是空间滞后模型;相反,如果间滞后模型;相反,如果LMERR比比LMLAG在统在统计上更加显著,且计上更加显著,且R-LMERR显著而显著而R-LMLAG不不显著,则可以断定空间误差模型是恰当的模型。显著,则可以断定空间误差模型是恰当的模型。1/29/2023天行健,君子以
32、自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。32空间自相关检验与空间自相关检验与SLM、SEM的选择的选择n除了拟合优度除了拟合优度R2检验以外,常用的检验准则还检验以外,常用的检验准则还有:自然对数似然函数值(有:自然对数似然函数值(Log likelihood,LogL)、似然比率()、似然比率(Likelihood Ratio,LR)、)、赤池信息准则(赤池信息准则(Akaike information criterion,AIC)、施瓦茨准则()、施瓦茨准则(Schwartz criterion,SC)。)。n对数似然值越大,对数似然值越大,AIC
33、和和SC值越小,模型拟合效值越小,模型拟合效果越好。这几个指标也用来比较果越好。这几个指标也用来比较OLS估计的经典估计的经典线性回归模型和线性回归模型和SLM、SEM,似然值的自然对,似然值的自然对数最大的模型最好。数最大的模型最好。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。33空间变系数回归模型及估计空间变系数回归模型及估计n就目前国内外的研究来看,大多直接假定横截就目前国内外的研究来看,大多直接假定横截面单元是同质的,即地区或企业之间没有差异。面单元是同质的,即地区或企业之间没有差异。n传统的传统的OLS只是对参数进
34、行只是对参数进行“平均平均”或或“全域全域”估计,不能反映参数在不同空间的空间非稳定估计,不能反映参数在不同空间的空间非稳定性(吴玉鸣,李建霞,性(吴玉鸣,李建霞,2006;苏方林,;苏方林,2007)。)。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。34空间变系数回归模型及估计空间变系数回归模型及估计n当用横截面数据建立计量经济学模型时,由于当用横截面数据建立计量经济学模型时,由于这种数据在空间上表现出的复杂性、自相关性这种数据在空间上表现出的复杂性、自相关性和变异性,使得解释变量对被解释变量的影响和变异性,使得解释变量对
35、被解释变量的影响在不同区域之间可能是不同的,假定区域之间在不同区域之间可能是不同的,假定区域之间的经济行为在空间上具有异质性的差异可能更的经济行为在空间上具有异质性的差异可能更加符合现实。加符合现实。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。35空间变系数回归模型及估计空间变系数回归模型及估计n空间变系数回归模型(空间变系数回归模型(Spatial Varying-Coefficient Regression Model)中的地理加)中的地理加权回归模型(权回归模型(Geographical Weighted Regres
36、sion,GWR)是一种解决这种问题的)是一种解决这种问题的有效方法。有效方法。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。36 地理加权回归模型地理加权回归模型GWRn 地理加权回归模型是一种相对简单的回归估地理加权回归模型是一种相对简单的回归估计技术,它扩展了普通线性回归模型。计技术,它扩展了普通线性回归模型。n在扩展的在扩展的GWR模型中,特定区位的回归系数模型中,特定区位的回归系数不再是利用全部信息获得的假定常数,而是利不再是利用全部信息获得的假定常数,而是利用邻近观测值的子样本数据信息进行局域用邻近观测值的子样本数
37、据信息进行局域(Local)回归估计而得的、随着空间上局域)回归估计而得的、随着空间上局域地理位置变化而变化的变数,地理位置变化而变化的变数,GWR模型可以模型可以表示为:表示为:1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。37 地理加权回归模型地理加权回归模型GWRn式中,式中,系数的下标系数的下标j表示与表示与 观测值联系的观测值联系的阶待估计参数向量,是关于地理位置阶待估计参数向量,是关于地理位置 的的k+1元函数。元函数。GWR可以对每个观测值估计出可以对每个观测值估计出k个参数向量的估计值,个参数向量的估计值,是第
38、是第i个区域的随机误个区域的随机误差,满足零均值、同方差、相互独立等球形扰差,满足零均值、同方差、相互独立等球形扰动假定。动假定。iijiijjiiixvuvuy,k10j1miivu,1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。38 地理加权回归模型地理加权回归模型GWRn实际上,以上模型可以表示为在每个区域都有实际上,以上模型可以表示为在每个区域都有一个对应的估计函数,其对数似然函数可以表一个对应的估计函数,其对数似然函数可以表示为:示为:211020,21|,lognikjiiikiiikxvuvuyMvuvuLL1/
39、29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。39 地理加权回归模型地理加权回归模型n式中,式中,为常数,为常数,。由由于极大似然法(于极大似然法(ML)的解不是唯一的,)的解不是唯一的,Hastie和和Tibshirani(1993)认为用该方法求解是不恰)认为用该方法求解是不恰当的。当的。Tibshirani和和Hastie(1987)提出了局域)提出了局域求解法,原理与方法如下:求解法,原理与方法如下:n对于第对于第s个空间位置个空间位置 ,任取一,任取一空间位置空间位置 与其位置邻近,构造一个简单的与其位置邻近,构造一个简
40、单的回归模型:回归模型:kjnivuxyMiiiji,2,1,2,1,nsvuss,2,1,00,vu1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。40 地理加权回归模型地理加权回归模型GWRn式中,每个式中,每个 为常数且为为常数且为GWR模型中模型中 的近似值,通过考虑与点的近似值,通过考虑与点 相邻近的点来相邻近的点来校正经典回归模型中的解。一个基本的方法就校正经典回归模型中的解。一个基本的方法就是采用加权最小二乘法(是采用加权最小二乘法(WLS),寻找合适),寻找合适的使得下式最小:的使得下式最小:kjiijjixy1
41、0jssjvu,00,vu21010kjijjiniixydW1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。41地理加权回归模型地理加权回归模型GWRn式中,式中,为位置为位置 和和 之间的空间距离,之间的空间距离,n 为空间权值。令为空间权值。令 为为 的估计值,的估计值,可得可得GWR模型在空间位置模型在空间位置 上的估计上的估计值值 。对上式求。对上式求 的的一阶偏导数,并令其等于一阶偏导数,并令其等于0,可得:,可得:id000,vuiivu,idW0jssjvu,ssvu,sskssssvuvuvu,10j YWXX
42、WXj201201/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。42地理加权回归模型地理加权回归模型n式中,式中,为为 的对角线矩的对角线矩阵。可以看出,阵。可以看出,的的GWR估计值是估计值是随着空间权值矩阵随着空间权值矩阵 的变化而变化的,因此的变化而变化的,因此n 的选择至关重要,一般由观测值的空间(经的选择至关重要,一般由观测值的空间(经纬度)坐标决定。纬度)坐标决定。0WndWdWdW00201,),2,1(jkjijWijW1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势
43、坤,君子以厚德载物。43地理加权回归模型地理加权回归模型n实际研究中常用的空间距离权值计算公式有三实际研究中常用的空间距离权值计算公式有三种(种(LeSage,2004)。)。n(1)高斯距离权值()高斯距离权值(Gaussian Distance)n(2)指数距离权值()指数距离权值(Exponential Distance)n(3)三次方距离权值()三次方距离权值(Tricube Distance)/ijijdWqdWijij/exp 33/1ijijdW1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。44地理加权回归模型地
44、理加权回归模型n其中其中 为第为第i个区域与第个区域与第j个区域间的地理距离,个区域间的地理距离,为标准正态分布密度函数,为标准正态分布密度函数,q为观测值为观测值i到第到第q个最近邻居之间的距离,个最近邻居之间的距离,为距离向量的标准为距离向量的标准差,差,为衰减参数(窗宽)。为衰减参数(窗宽)。ijdijd1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。45地理加权回归模型地理加权回归模型n在空间权值矩阵中,在空间权值矩阵中,d和和非常关键。如果非常关键。如果d较较大,则局域模型的解越趋向于全域模型的解;大,则局域模型的解越
45、趋向于全域模型的解;如果如果d等于所研究空间任意两点间的最大距离,等于所研究空间任意两点间的最大距离,则全域和局域两个模型将相等,反之则相反。则全域和局域两个模型将相等,反之则相反。n若若趋于无穷大,任意两点的权重将趋于趋于无穷大,任意两点的权重将趋于1,则,则被估计的参数变成一致时,被估计的参数变成一致时,GWR就等于以就等于以OLS估计的经典线性回归;反之,当带宽变得估计的经典线性回归;反之,当带宽变得很小时,参数估计将更加依赖于邻近的观测值。很小时,参数估计将更加依赖于邻近的观测值。计算适当的窗宽或衰减函数的原理方法很多,计算适当的窗宽或衰减函数的原理方法很多,最小二乘法仍然是一般常用的
46、方法,其原理是:最小二乘法仍然是一般常用的方法,其原理是:1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。46地理加权回归模型地理加权回归模型n式中,式中,是用窗宽是用窗宽计算所得的计算所得的 的拟合值。的拟合值。021niiiyyD iy iy1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。47空间权值矩阵的确定空间权值矩阵的确定 n在区域经济管理研究中,将空间效应因素引入在区域经济管理研究中,将空间效应因素引入经济管理过程的研究,建立空间计量经济模型经济管理过
47、程的研究,建立空间计量经济模型进行空间统计分析时,一般要用空间权值矩阵进行空间统计分析时,一般要用空间权值矩阵来表达空间相互作用。来表达空间相互作用。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。48空间权值矩阵的基本原理空间权值矩阵的基本原理 n空间权值矩阵是一种与被解释变量的空间自回空间权值矩阵是一种与被解释变量的空间自回归过程相联系的矩阵。在实际的区域分析中,归过程相联系的矩阵。在实际的区域分析中,该矩阵的选择设定是外生的,原因是该矩阵的选择设定是外生的,原因是nn维维的的W包含了关于区域包含了关于区域i和区域和区域j之
48、间相关的空间之间相关的空间连接的外生信息,不需要通过模型来估计得到连接的外生信息,不需要通过模型来估计得到它,只需通过权值计算出来就行了。它,只需通过权值计算出来就行了。1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。49空间权值矩阵的基本原理空间权值矩阵的基本原理 nW中对角线上的元素中对角线上的元素 被设为被设为0,而,而 表示区表示区域域i和区域和区域j在空间上相连接的原因。为了减少在空间上相连接的原因。为了减少或消除区域间的外在影响,权值矩阵被标准化或消除区域间的外在影响,权值矩阵被标准化()成行元素之和为)成行元素之和
49、为1。对于变。对于变量量x,这种转换意味着定义成空间滞后变量的,这种转换意味着定义成空间滞后变量的 n 仅仅表示邻近观测值的加权平均数。仅仅表示邻近观测值的加权平均数。ijWijWnjijijijwww1xW1/29/2023天行健,君子以自强不息;地势坤,君子以厚德载物。天行健,君子以自强不息;地势坤,君子以厚德载物。50空间权值矩阵的基本原理空间权值矩阵的基本原理 n间权值矩阵间权值矩阵W确定的方法有多种,根据空间统计和空确定的方法有多种,根据空间统计和空间计量经济学原理,一般可将现实的地理空间关联或间计量经济学原理,一般可将现实的地理空间关联或者经济联系考虑到模型中来,以达到正确设定权值
50、矩者经济联系考虑到模型中来,以达到正确设定权值矩阵的目的。其中,衡量地理联系的方法通常有两种主阵的目的。其中,衡量地理联系的方法通常有两种主要方式:邻近指标和距离指标。要方式:邻近指标和距离指标。n按照这两种方法确定的按照这两种方法确定的 为二进制的邻近空间权值矩为二进制的邻近空间权值矩阵,表示其中的任一元素,采用邻近标准或距离标准,阵,表示其中的任一元素,采用邻近标准或距离标准,其目的是定义空间对象的相互邻近关系,便于把地理其目的是定义空间对象的相互邻近关系,便于把地理信息系统数据库中的有关属性放到所研究的地理空间信息系统数据库中的有关属性放到所研究的地理空间上来对比。上来对比。ijW1/2