最新地理加权回归-GWR

上传人：z*** IP属地：天津上传时间：2022-09-19 格式：DOCX 页数：9 大小：23.70KB 积分：18 举报 版权申诉

已阅读5页，还剩4页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、精品文档空间计量经济学打破大多数经典统计和计量分析中相互独立的基本假设，主要解决如何在横截面数据和面板数据的回归模型中处理空间相互作用（空间自相关）和空间结构（空间不均匀性）分析的问题。空间计量经济理论认为一个地区空间单元上的某种经济地理现象或某一属性值与邻近地区空间单元上同一现象或属性值是相关的。也就是说，各区域之间的数据存在与时间序列相关相对应的空间相关。空间计量模型所研究的空间效应包括空间自相关和空间差异性。空间相关性在空间回归模型中体现在误差项和因变量的滞后项，因此，空间计量的两个模型分别是空间自回归模型（Spatial Auto Regressive Model , SAR）与空

2、间误差模型（Spatial Error Model , SEM）,空间自回归模型研究各变量在一个地区是否有扩散效应，空间误差模型考察邻接地区关于因变量的误差冲击对本地区观察值的影响。其表达式分别为：其中，Y为因变量； W为n n阶的空间权重矩阵，权数系数可以根据实际情况决定，一般用邻接矩阵； Wy为空间滞后因变量，反映了空间距离对区域行为的作用；为空间自回归系数，反映相邻区域的观测值 Wy对本地区观察值 y的影响方向和程度；X为n k的外生解释变量向量（包括常数项）, 为变量系数，反映了自变量 X对因变量Y的影响；为误差成分；为n 1的因变量向量的空间误差系数，衡量了相邻地区的观察值Y

3、对本地区观察值Y的影响方向和程度；为正态分布的随机误差向量。上述两种模型的估计如果仍采用OLS,往往导致各种结果和推论不够完整、科学。本文采用极大似然法估计参数。常用检验准则有合优度 R2和对数似然值 LogL。拟合优度和对数似然值越大，模型拟合效果越好，对数似然值最大的模型最好。（一）空间权重矩阵的选取空间权重矩阵 W表征了空间单位之间的相互信赖性与关联程度。实证研究中，通常采用相邻规则与距离规则来定义空间加权矩阵。为了研究需要，本文从地理位置特征与社会经济特征两个不同角度分别建立包括相邻规则与距离规则的空间加权矩阵，以便更准确地把握房价的区域相关关系。1.地理位置特征加权矩阵。本文采用

4、两种常用的地理位置特征矩阵体现房价的空间相关关系：第一种是空间相邻加权矩阵 W1,其中的元素wi , j= 1表示两个地区拥有共同的边界， wi , j= 0表示两个地区没有共同的边界，然后对矩阵进行标准化处理。为了避免“单精品文档精品文档个岛屿效应”，设定海南省与广东省、广西壮族自治区有共同边界。第二种是空间距离加权矩阵 W2,其元素wi , j=1 / d2iji丰j0i =j ,即两地区之间距离越远，相互之间的影响程度越小，两地区之间的距离di , j为两地区省会城市之间的距离2.社会经济特征加权矩阵匚以地科!区位差异及映出区域房价的空间联系体现了地理位置特征的影响，但区域房价

5、的空间联系可能会受经济发展水平等其他因素的影畸.因此本部分迸一小建立空间经济加权矩阵具体为= 哨IP匕FJK，1/）, 其中一十工匕为样本期内第，个省份型际人均1 二GDP的平均侑夏=形工兀为样本期内实际人均C1W的总平均值，当心=均忖得经济相邻加权矩阵当叽=时，得经济距离加权矩阵 U迎过空间经济加权短环叮以发现,当一个地M 实际人均GDP比较大时（即匕八 Y /Y ） .对其周边地区的影响也戕大（林/ 于是进一步用更能反映经济变量之间的空间依赖性的地理加权回归（GWR方法，以全国30个省市为例，建立模型小0（Ui,Vi）k（Ui,Vi）Xik i, i 1,2,n ,其中（U

6、i，Vi）是第 i 个样k本点的空间坐标；利用加权最小二乘法来估计，估计出30个省市的模型参数，并就此分析了各省市之间的差异。最后比较了普通回归与地理加权回归的优劣，得出了教育支出促进经济增长，不同地区间促进的效果不同的结论。长期以来，在主流的经济学理论中，空间事物无关联及均质性假定的局限精品文档精品文档以及普遍使用忽视空间效应的普通最小二乘法 (OL S)进行模型估计，使得在实际应用中往往存在模型的设定偏差问题，进而导致经济学研究得出的各种结果和推论不够完整、科学，缺乏应有的解释力。经典计量经济学中的线性回归模型的经典假定，以及回归模型的系数B是一个常数假定，面对异常复杂的经济系

7、统和因素变量之间的交互影响，尤其是碰到横截面数据之间存在空间自相关性和空间异质性时，经典计量的线性回归模型就显得有些力不从心，需要发展新的方法来弥补这种不足。111空间计量经济学(Anselin ,1988)理论认为,一个地区空间单元上的某种经济地理现象或某一属性值与邻近地区空间单元上同一现象或属性值是相关的。几乎所有的空间数据都具有空间依赖性或空间自相关性的特征，空间依赖的存在打破了大多数经典统计和计量分析中相互独立的基本假设。也就是说，各区域之间的数据存在与时间序列相关、相对应的空间相关。空间统计和空间计量经济方法是在继承和发展完善经典统计和计量方法的基础上，将经典统计和计量方法应用

8、于与地理位置及空间交互作用相关的地理空间数据，通过地理位置与空间联系建立的统计与计量关系，以统计和计量方法识别和度量空间变动的规律与空间模式的决定因素。(一)空间经济计量学介绍空间统计和空间计量经济学理论与方法继承和发展了经典统计和计量理论方法，将经典统计和计量方法应用于与地理位置及空间交互作用相关的地理空间数据，通过地理位置与空间联系建立统计与计量关系，以统计和计量方法识别和度量空间变动规律及空间模式的决定因素。空间经济计量学主要研究存在空间效应的问题。空间效应主要包括空间相关和空间差异性。在研究中涉及空间相邻、空间相邻矩阵等概念。.空间相关空间相关指在样本观测中，位于位置i的观测与

9、其它jwi的观测有关，即存在空间相关的原因有两方面：相邻空间单元存在测量误差，空间交互影响的存在。测量误差是由于调查过程中，数据的采集与空间中的单位有关，如数据是按盛市、县等统计的，但设定的空间单位与研究问题不一致，存在测量误差。空间相关不仅意味着空间上的观测缺乏独立性，并且意味着潜在于这种空间相关中的空间结构，也就是说空间相关的强度及模式由绝对位置和相对位置(布局，距离)决定。精品文档精品文档.空间差异性空间差异性指空间上的区域缺乏均一性，如存在中心区和郊区、先进和后进地区等。例如，我国沿海地区和中西部地区经济存在较大差别。对于空间差异性，只要将空间单元的特性考虑进去，大多可以用

10、经典经济计量学方法解决。但当空间差异性与空间相关共同存在时，经典经济计量学方法不再适用，而且这时问题可能变得非常复杂，因为这时要区分空间差异性与空间相关可能非常困难。.时空数据空间模型在模型中考虑时间维增加了描述的复杂性，但综合时间空间的模型在实际工作中非常有用。在经典的经济计量学模型中，这是综合截面和时间序列数据的情形。如果数据不存在空间相关，则可以采用PanelData模型。Anselin(1988)将似不相关(SUR股型扩展到空间的情形，提出空间 SUR真型。 (五)空间计量经济学中的空间自相关分析151根据空间统计和空间计量经济学原理方法，首先应采用空间统计分析Moran 指数

11、法检验因变量(被解释变量)是否存在空间自相关性或集聚现象，如果存在，则需要在空间计量经济学理论方法支持下，建立空间计量经济模型，进行区域经济增长集聚的空间计量估计和检验。Morans I定义如下：n nWj(Y Y)(Yj Y) I i 1 j 1In n2S2Wji 1 j 11 n _1 n其中，S2 (Y Y), Y Y,n i 1n i 1表示第i地区的观测值,n为地区总数，Wj为二进制的邻接空间权值矩阵,表示其中的任一元素，采用邻接标准或距离标准，其目的是定义空间对象的相互邻接关系股邻接标准的为Wj1,当区域i和区域j相邻；0,当区域i和区域j不相邻;式中，i 1,2，n；

12、j=1,2,? ,n； m=inm n。MoransI可看作各地区观测值的乘积和，其取值范围为1 I 1。若各地区间经精品文档精品文档济行为为空间正相关，I的数值应当较大；负相关则较小。(六)空间变系数回归模型当用横截面数据建立计量经济学模型时，由于这种数据在空间上表现出的复杂性、自相关性和变异性，使得解释变量对被解释变量的影响在不同区域之间可能是不同的，假定区域之间的经济行为在空间上具有异质性的差异可能更加符合现实。空间变系数回归模型 (Spatial Varying -Coefficient Regression Model)中的地理加权回归模型(Geographical We

13、ighted Regression , GWR)是一种解决这种问题的有效方法。本文即主要采用的这种模型对全国30个省市教育与经济增长之间的关系进行了探究与分析。1. GWR本模型考虑如下的全局回归模型：yi0 kXik ii 1,2,nk地理加权回归(GWR)扩展了传统的回归框架，容许局部而不是全局的参数估计，扩展后模型的参数是位置i的函数，扩展后的模型如下：yi0(Ui,Vi)k(Ui,Vi)Xiki i 1,2,nk其中Si1v)是第i个样本点的空间坐标，k(u,Vi)是连续函数k(u,v)在i 点的值。如果k(u,v)在空间保持不变，则GWR型就变为全局模型。因此GWR 方程认可空

14、间变化关系可能是存在的，并且提供了一种可度量的方法。由上面可知GWR真型中的参数在每个回归点是不同的，就不能用最小二乘方法(OL S)估计参数。Fotheringham , Brunsdon , Charlton (1996) 依据“接近位置i的观察数据比那些离位置远一些的数据对k(u,v)的估计有更多的影响”的思想，利用加权最小二乘法来估计参数。因此，其结果是区域性的并非全域性的参数估计，从而就能够探测到空间数据的空间非平稳性。我们知道，普通最小二乘法可以得到全局的参数估计向量：(X X) 1XY值得提到的是，使用最小二乘估计的前提条件是：E(Y) X ,Var(Y)21n(In是单位

15、矩阵)成立。这里第二个条件不满足，可以改为Var(Y)2Wi1 ,因为Wi10,存在n阶非奇异对称阵B,使得wJB2。令Y* B1Y,X* B 1X ,则 E(Y*) B 1E(Y) B 1X X *Var(Y*) B 1Var(Y)B 121n于是，我们得到回归点i的参数估计向量可以表示如下：精品文档精品文档1(Ui,Vi) (XW(ui,vi)X) XW(ui,vi)Y其中W(ui, v )是n n的加权矩阵，对角线上的每个元素都是关于观测值所在位置j与回归点i的位置之间距离的函数，其作用是权衡不同空间位置j (j = 1 ,2 , ?, n)的观测值对于回归点i参数估计的影响程度，而非

16、对角元素为0. 矩阵W(ui, vi)可以表示为如下形式：WiiW(2 W(ui,vi)OWin记做 Widiag (Wi1, Wi2,- -, W)。.加权矩阵函数的选择为了估计方程中GWR参数，选择一个标准来决定加权矩阵 Wi是很重要的. 在空间分析中，一般认为距离回归点i较近的观测值对回归点i处的参数估计影响较大，而远离回归点i的观测值的影响就较小.所以，在估计回归点i的参数时，必须给予离i较近的地区更多的关注，也就是优先考虑较近观测值的影响. 根据这一思想，可供选择的权函数有多种形式，比如距离的倒数.通常选择 Gauss函数作为权函数，其形式如下：2Wj exp( dij)这里di

17、j是回归点i和位置j中心的距离，是带宽.Wj是关于dj的连续单调递减函数，随dj的增大而减小，并且当dj = 0时，Wj = 1。.距离衰减参数的确定式中的是一个描述权重与距离之间函数关系的非负距离衰减参数，不同的将产生不同的权重 Wj .对于给定的dj ,如果越大，在位置j的观测值的权重就越小，反之，则在位置j的观测值的权重就越大.另一方面，对于给定的对离i距离越近的点来说，权重逐渐趋近于1，对于那些离i距离很远的点来说，权重会逐渐减小到0 ,从而在估计回归点i的参数时能够有效地排除那些远离i 点位置上的观测值,同时又保持了空间数据的连续性。从上面分析可知不同的会产生不同白权重矩

18、阵 Wi (i 1,2，,n),而且可以选择的不是惟一的。Brunsdon等用交叉实证方法(即Cross2Validation) 来选择一个最合适的。如果的值过大，这样会使得除回归点外其它观测值点的权重接近零，从而在参数估计中失去作用，因此不宜取值太大.一般选择一个精品文档精品文档较小的，根据等式来计算加权矩阵 Wi （i 1,2，,n）,通过加权最小二乘方法获得参数的估计值一将估计值i代入地理加权回归（GWR模型中，我们就得到了丫的估计值Yi（）通过下式计算得到CV值：n2CVjY Yi（）（j 1,2，,m）i 1这里Yi（）表示回归点i的观测值不参与估算过程得到的 Y的

19、估计值。Yi（）作为Y的估计值,在迭代的过程中省略了与施有关的计算，只需要计算回归i附近位置的观测数据，而不计算它本身的观测数据。重新选择一个重复上述过程得到m个不同的CV值，通过CV min（CV1,CV2，CVm）来寻找最合适的值（即CV寸应的）。（一）数据来源响为了进一步探索不同地区间教育与经济间的差异关系，本文还引入了 30个省市省会地区相互之间的公路营运里程，作为衡量各省之间距离的指标，这些数据来源于中国高速公路及各等级公路网地图册。各省市地区说明本文所涉及到得省市地区依次为：北京，天津，河北，山西，内蒙古，辽宁，吉林，黑龙江，上海，江苏，浙江，安徽,福建，江西，山

20、东，河南，湖北，湖南，广东，广西，重庆，四川，贵州，云南，西藏，陕西，甘肃，青海，宁夏，新疆。涉及到得省会地区依次为：北京，天津，石家庄，太原，呼和浩特，沈阳，长春，哈尔滨，上海，南京，杭州，合肥，福州，南昌，济南，关B州，武汉，长沙，广州，南宁，重庆，成都，贵阳，昆明，拉萨，西安，兰州，西宁，银川，乌鲁木齐。之所以没有涉及海南省以及其省会城市海口，是因为隔海的原因，不好估算其公路营运历程，故将其舍去。二、我国30个省市地区教育经费与经济间的一元线性分析（一）模型建立与分析之前，本文已经对基于最小二乘法（OLS的传统线性回归做了详细的理论精品文档精品文档说明，下面，本文将SA驮件

21、对经过处理彳#到的省域人均 GDP（也就是GRP）、人均教育经费两项指标进行分析，其中省域人均 GD的因变量，人均教育经费为自变量。四、五、地理加权回归（GWR）技术一般线性回归模型把研究区域作为一个整体来看待，其结果是对研究区域整体趋势的一种拟合或平均水平的一种描述，具掩盖了许多有意义的地理、社会、经济现象.而在更多的情况下，我们需要了解研究区域内部的变化情况，地理加权回归方法是一种局域空间分析的方法，展示了研究区域内部空间关系的变化图景，为我们进一步研究复杂的空间变化提供非常有意义的线索，地理加权回归方法必将成为空间分析的重要工具之一.不过该技术方法还有些问题需要做进一步研

22、究加以完善，如在整个研究区域内权函数的距离衰减参数是固定不变的，作为局域空间分析方法该参数在不同的地区应该是不一样的。由表1可以看出，当前，我国接受教育的情况还是比较低的。同时，东部地区明显比西部地区受教育年数高，体现了地区间的差异性。地理加权回归模型（GWR懊型建立及分析通过上述初步分析可以看出，我国省域之间还是存在着一定差距的。不能用一般线性回归模型把其作为一个整体来看待，应该用地理加权回归方法为进一步研究复杂的空间变化。关于地理加权回归模型（GWR蟆型，其理论部分参见第一部分空间变系数回归模型的GWR型。下面直接用SASS行编程建模，以下是建模后得到的各省域的GWR数估计结果。表6 GWRI型各省域参数估计由GWR型得出的表格6,可以进一步看出地区间的差异。就教育投入对经济增长的影响来看，不同地区人均教育经费对人均 GDPJ作用相差很大，像最高的安徽省市，人均教育经费对人均GDPJ作用达到了 39.977127,广西，广东紧随其后，人均教育经费对人均GDPE效应比较大的地方还有辽宁，福建，新疆，贵州，江苏，浙江，吉林，江西，上海。而另一方面，陕西人均教育经费对人均GD的作用居然是-5.55705,意味着教育投入对经济增

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新地理加权回归-GWR

文档简介

温馨提示

最新文档

评论

最新地理加权回归-GWR

文档简介

温馨提示

最新文档

评论

相关文档