空间分析(基于矢量数据)(2014)_第1页
空间分析(基于矢量数据)(2014)_第2页
空间分析(基于矢量数据)(2014)_第3页
空间分析(基于矢量数据)(2014)_第4页
空间分析(基于矢量数据)(2014)_第5页
已阅读5页,还剩147页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 九、空间分析(基于矢量数据) 空间统计空间统计 叠置分析 邻近分析 利用统计方法分析对象的空间分布特征、空间模式、空间集聚以及空间关系。 ArcGIS中的空间统计(Spatial Statistics)工具箱包括空间分布测量、空间分布模式、空间集聚及空间关系等工具集。空间分布测量 测量对象的空间分布特征,包括如下工具: 平均中心(Mean Center) 中位中心(Median Center) 中心位置要素(Central Feature) 标准距离(Standard Distance) 方向分布(Directional Distribution) 线要素的平均方向(Linear Direc

2、tional Mean)1平均中心 平均中心是指研究区内所有要素的几何中心。 对点要素,Mean Center工具是通过计算所有点要素的x和y坐标的平均值来获得平均中心。 对线或多边形要素,每个要素的平均中心是该要素所有顶点的x和y坐标的平均值。如输入数据有多个要素,Mean Center工具先计算每个要素的几何中心,在此基础上,再计算平均中心。 在计算平均中心时,可以考虑要素的权重, 对x和y坐标进行加权平均,这时所得到中心点也称为重心。平均中心示意图平均中心的计算公式 在Mean Center工具对话框中,可以设置权重字段、分组字段(每组计算一个重心)、Dimension字段(用于计算字段

3、平均值)。几何中心几何中心人口重心人口重心根据州中心计算出的美国本土的几何中心和人口重心 思考: 同个区域不同分区计算出的几何中心是否一致? 同个区域不同分区计算出的重心是否一致?同个区域不同分区计算出的几何中心多边形密度一致情况下计算出的重心多边形密度不一致情况下计算出的重心直接计算出直接计算出的几何中心的几何中心分州计算出分州计算出的几何中心的几何中心按州计算出按州计算出的人口重心的人口重心按大区计算出按大区计算出的人口重心的人口重心中位中心 中位中心是与其它要素的距离之和为最小的点,采用迭代算法获得。中位中心的算法受异常值的影响较小。美国城市的平均中心和中位中心几何中心几何中心中位中心中

4、位中心红色为美国本土所有城市的几何中心和中位中心,绿色为美国所有城市的几何中心和中位中心。中心位置要素 要素类(点、线或多边形)中,与其它要素距离之和为最小的要素即中心位置要素。在计算时可以选择某个字段值作为权重,线和多边形是以中心点进行计算。美国中心位置州红色:不考虑权重(Illinois州)。绿色:以人口为权重(Indiana州)。标准距离 反映要素围绕几何中心的集聚(或发散)程度,可用于分析犯罪案件的范围、传染病的扩散范围等。输出结果包括中心点x、y坐标和标准差距离。标准距离的计算公式犯罪案件的范围方向分布 方向分布(Directional Distribution)即标准偏差椭球体,以

5、X方向和Y方向的标准距离作为椭球体的长短轴。方向分布计算公式犯罪案件的范围(反映方向)线方向平均 线方向平均(Linear Directional Mean)工具用于计算线要素方向(direction)或走向(orientation)的平均角度。 有些线要素是有方向性的,如表示台风路径的线要素,有起点和终点。方向的角度为0-360。 有些线要素没有起点和终点,如断层线,只有走向。走向的角度为0-180。方向线和走向线示意 线方向平均(Linear Directional Mean)工具用于计算输入的多个线要素的方向平均,在计算时,每条线只考虑起点和终点,不考虑线的其它顶点。线方向平均也可以分组

6、计算。 在计算时,如选择只考虑走向,则所有线的角度限制在0-180。 线方向平均工具的计算结果将产生一个线要素类。如不是分组计算,输出的线要素类只有一个线要素;如是分组计算,每个组都将会有一个线要素。 输出的线要素有如下属性: 输出线要素的中心点坐标。 输入要素的平均长度(输出线要素的长度)。 输入要素的方向均值(从东开始逆时针)。 输出线要素的指北针角度(Compass Angle,从北开始顺时针)。 Circular方差(表示方向偏差)。 计算线要素平均方向可用于: 比较两种动物迁移方向。 根据森林中树木的倒向分析区域的风向。 分别计算每个台风的方向所有台风的平均方向空间分布模式 地理现象

7、的空间分布一般可以分为三种类型:均匀型(或离散型)、随机型以及集聚型。2 对点要素来说,如果分布是集聚的,则大多数点与它最近邻点的距离比较小;如果分布是均匀的(或离散的),则大多数点与它最近邻点的距离比较大;随机型则介于两者之间。 对多边形要素来说,空间分布模式是指空间上相近的多边形其属性值的相近或相异程度。如果相近多边形有相近的属性值,则认为分布是集聚的;如果相近多边形有相异的属性值,则认为分布是离散的;介于之间的分布为随机。 在ArcGIS的Analyzing Patterns工具集中,有五个工具: 平均最邻近距离(Average Nearest Neighbor) 多距离空间集聚分析(M

8、ulti-Distance Spatial Cluster Analysis) 空间自相关(Spatial Autocorrelation) 递增空间自相关(Incremental Spatial Autocorrelation) 高/低集聚(High/Low Clustering) 前两个主要用于分析点要素,后三个主要用于分析多边形要素。Average Nearest Neighbor 平均最邻近距离(Average Nearest Neighbor)工具是计算每个要素与最邻近要素的距离,然后对所有最邻近距离进行平均。如果平均距离小于随机模式下的平均最邻近距离,则要素的分布被认为具有集聚(C

9、lustered)趋势;如平均距离大于随机模式下的平均最邻近距离,则要素的分布被认为具有离散(Dispersed)趋势。 要素分布是否是集聚或离散(即不是随机的)需要从统计学角度来分析。从理论上说,计算出的平均距离与随机模式下的平均距离差值越大,非随机的概率就越大,因此,可通过概率统计方法计算假设成立的置信度。 平均最邻近距离工具计算结果返回5个值: 观测的平均距离 期望平均距离(与区域范围和点数有关) 最近邻指数(观测的平均距离与期望平均距离比值,小于1趋向集聚,大于1趋向离散) z值(反映观测值和期望值的差异) p值(置信度) 上述值显示在计算结果窗口(Results window)中 。

10、此外,计算结果窗口还有一个HTML文件,可以图形形式显示计算结果。平均最邻近距离工具计算公式平均最邻近距离工具计算结果显示 演示:计算美国城市分布的空间模式。 美国本土3128个城市的实际分布。 在美国本土范围内3128个点的随机分布(可利用Create Random Points工具产生)。 计算观测的平均距离、期望平均距离、最近邻指数、z值和p值。美国本土3128个城市的实际分布在美国本土范围内3128个点的随机分布计算结果显示超过99%的概率城市分布是集聚的多距离空间集聚分析 多距离空间集聚分析(也称为K函数),是Ripley于1976年提出的。 多距离空间集聚分析的理论依据是:如果点要

11、素为集聚模式,则点与点之间距离小的点对点对多,随着距离增加,点对数减少;反之,如果点要素为离散模式,则点与点之间距离小的点对点对少,随着距离增加,点对数增加。 该方法的基本步骤如下: 计算每个点与其它点之间的距离。 确定距离分级数(分带数),并根据点间的最大距离和起始距离确定步长(距离增量)。 确定每个带的范围,计算落在每个带内的点对数。 同样方法,计算随机模式在每个距离带内的点对数。 根据距离和累积点对数画出K函数线,如观测数据的K函数线在期望K函数线的上方,表示集聚,反之,为离散。 多距离空间集聚分析工具的运行结果将输出一个表格(不同距离带观测到的点数与期望点数的比较),同时也可以显示一个

12、图表。空间自相关 空间自相关(Spatial Autocorrelation)是指相邻对象属性值的相似程度。 空间自相关包括全局空间自相关和局部空间自相关,其中全局空间自相关用于分析空间分布模式。 确定空间权重方法: INVERSE_DISTANCE(倒数距离),距离越近,权重越大。 INVERSE_DISTANCE_SQUARED(倒数距离平方),同倒数距离,但随着距离的变化,权重变化的速度更快。 FIXED_DISTANCE_BAND(固定距离带),定义一个阈值距离,如两个要素的距离大于阈值距离,则空间权重为0;如小于阈值距离,则空间权重为1。 ZONE_OF_INDIFFERENCE(无

13、差异区),定义一个阈值距离,如两个要素的距离小于阈值距离,则空间权重为1;如两个要素的距离大于阈值距离,则随着距离增加权重减少。 CONTIGUITY_EDGES_ONLY(邻近边),有公共边或有重叠的相邻多边形权重为1,其它为0。 CONTIGUITY_EDGES_CORNERS(邻近边和邻近节点),有公共边或有公共节点或有重叠的相邻多边形权重为1,其它为0。 GET_SPATIAL_WEIGHTS_FROM_FILE(从文件中得到空间权重),从空间权重文件中得到空间权重。 尽管确定空间权重的方法很多,但总的来说,都是距离越近,权重越大;距离越远,权重越小。即主要是考虑邻近要素之间的关系。

14、如果要素的分布模式是邻近要素相似,非邻近要素相异。则邻近要素与平均值差值的乘积通常为正值,这时的权重也较大,最终得到的值为较大的正值。 如果要素的分布模式是邻近要素相异,非邻近要素相似。则邻近要素与平均值差值的乘积通常为负值,这时的权重也较大,最终得到的值为较大的负值。 如果要素的分布模式是随机的,邻近要素与平均值差值的乘积可能为负值,也可能为负值,则最终得到的值接近0。 Morans I的取值在-1到1之间,其中-1表示极强的负空间自相关,1表示极强的正空间自相关。 观测数据的Morans同样需要和随机状态下的Morans值(的期望值)进行比较,确定符合假设的置信值。Morans I和zI的

15、计算公式 演示:美国黑人人口的空间分布模式。 数据:以美国本土以县为单位的行政区划数据(含不同类型的人口字段)。 分析字段:每个县黑人人口占总人口的比例(每一万人口中黑人人口数)。美国黑人人口比例计算出的结果为集聚(置信度99%以上)取其中一个子集进行分析分析结果表明与随机分布没有显著差异 在空间自相关分析时,如空间权重采用固定距离带方法,不同的距离值会有不同的分析结果。递增空间自相关是分析一系列不同距离值的空间自相关,得到不同距离值与相应z值关系图。 通过分析不同距离值与相应z值关系图,可以发现哪些距离值有比较显著的集聚性,可以作为其它需要确定距离值工具的参考。递增空间自相关距离值与z值关系

16、图高/低集聚 用Morans I统计量可以分析空间分布模式是集聚的、离散的还是随机的,但不能分析集聚模式是高/高集聚还是低/低集聚。 高/低集聚(High/Low Clustering)工具是利用广义G统计量,该统计量是Getis和Ord在1992年提出的,它也是一个全局空间自相关统计量,与Morans I相比,它的优势在于能够判断是高/高集聚还是低/低集聚。广义G统计量计算公式 与Morans I比较,广义G统计量是利用区域属性值的两两乘积之和,而不是区域属性值与均值差的两两乘积之和。由于空间权重一般是距离越近,值越大,因此,属性值大的对象越集中,广义G统计量就越大;属性值小的对象越集中,广

17、义G统计量就越小;随机模式的广义G统计量介于之间。 演示:利用广义G统计量分析美国黑人人口的空间分布模式。计算出的结果为高/高集聚(置信度99%以上)集聚分析 集聚分析(Mapping Clusters)是在了解空间分布模式存在集聚的情况下,进一步分析集聚的分布区域。是对每个要素进行局部空间自相关分析。3 集聚分析工具集有三个工具: Cluster and Outlier Analysis(Anselin Local Morans I) Hot Spot Analysis(Getis-Ord Gi*) Grouping AnalysisCluster and Outlier Analysis

18、集聚和异常分析工具计算每个对象的局部Morans值。较大的值表示相邻对象具有相似值(可能是高值集聚,也可能是低值集聚),较小的值表示相邻对象为相异值,如一个对象和周围对象的属性值有明显差异,则可能为异常值。局部Morans I值的计算公式应为j 该工具将产生一个新的要素类,新的要素类包括如下字段: Local Morans I index z-score p-value cluster/outlier type (COType) 如果一个对象具有较高的z-score,表示和相邻对象有相似值,如果属性值高于平均值,则COType字段是HH,如属性值小于平均值,则COType字段是LL。 如果一个

19、对象具有较低的z-score(如 -1.96),则表示空间异常,如果属性值高于周围对象的属性值,则COType字段值为HL,反之COType字段值为LH。美国黑人人口的集聚与空间异常分析无空间异常的要素Hot Spot Analysis 热点分析工具计算每个对象的Getis-Ord Gi*统计量,新的要素类包含z-score和p-value两个字段。 一个对象如有一个高的z-score和小的p-value表示高值的空间集聚(热点);如有一个低的z-score(负值)表示低值空间集聚(冷点)。z-score值(绝对值)越大,集聚越明显;z-score值越接近0,集聚越不明显。Getis-Ord

20、Gi*统计量计算公式美国黑人人口分布的热点与冷点分析 Grouping Analysis是对数据进行分组,分组的原则是组内的要素尽可能相似,组间的要素差异尽可能大。 要素相似或相异是基于用户指定的字段(可以是多个字段),也可以选择加入空间或时空限制。当指定空间或时空限制时,算法使用连接图(最小生成树)进行分组,如不使用空间限制,使用K均值算法进行分组。Grouping Analysis 空间限制选项包括: CONTIGUITY_EDGES_ONLY,同组中的任何一个多边形至少要和同组中另外一个多边形具有公共边,即同组中的多边形在空间上是连续的。 CONTIGUITY_EDGES_CORNERS

21、,同组中的任何一个多边形至少要和同组中另外一个多边形具有公共边或公共顶点,即同组中的多边形在空间上是连续的。 DELAUNAY_TRIANGULATION,同组中的任何要素至少要和同组中的另一个要素有自然连接,自然连接关系基于Delaunay三角网,是根据要素中心点构建的三角格网。 K_NEAREST_NEIGHBORS,同组中的要素是相互邻近的,邻近关系是基于最近邻的K个要素来确定。 GET_SPATIAL_WEIGHTS_FROM_FILE,从文件中得到空间权重,参与分组。美国(本土)离婚人数比例分组图(10组,空间限制选8最近邻)空间关系建模 分析不同变量之间的关系,建立回归模型。在Ar

22、cGIS中包括: 普通最小二乘法(Ordinary Least Squares,OLS)。 空间权重回归(Geographically Weighted Regression,GWR)。 OLS和GWR都是用于构建线性回归模型。4普通最小二乘法 通过观测对象的自变量(explanatory variables)和因变量(dependent variable)的关系分析,建立预测因变量的线性回归方程。 OLS方法不考虑对象的空间关系。线性回归方程 回归方程中的系数反映自变量与因变量的关系及影响强度,如系数为正,则表示正关系;如系数为负,则表示负关系。系数越大(相对于自变量的单位),则影响越大;系

23、数接近于0,表示该自变量与因变量的关系不大。0 为回归方程的截距,表示在所有自变量为零的情况下,应变量的期望值。 大多数回归方法将对每个变量的系数进行统计检测计算一个概率,称为p值。统计检测的零假设是系数和零的差异是不显著的,小的p值反映小的概率,表示系数对模型是重要的。如一个变量系数的p值为0.01,表示有99%的置信度该变量是一个有效的指示器。 在Ordinary Least Squares工具对话框中,用户可以设置因变量和自变量以及输出结果。 OLS工具的输出结果包括: 包含所有输入要素的要素类,记录输入要素的自变量值、应变量值、预测值、残差以及标准残差。 系数表(可选),记录模型的系数

24、及检验统计值的dbf文件。 诊断表(可选),记录模型各种诊断值得dbf文件。 Report文件(可选),全面记录各种信息的pdf文件。模型系数表模型诊断表PDF文件中记录的信息 输出结果还可以在Result窗口中查看。 OLS运行后,首先要查看Report中的相关指标,主要指标包括: Multiple R-squared和adjusted R-squared。用于评价模型的拟合程度,值在0.01.0之间,值越大,拟合程度越高。adjusted R-squared值比Multiple R-squared小一些,但更准确。如Adjusted R-Squared的值为0.39,表示模型能解释约39%

25、的因变量变化。AICc也是评价回归模型拟合程度的一个指标,AICc不是一个绝对的拟合度测量值,它用于比较不同自变量对同个应变量的回归模型,值越小表示拟合度越好,如果两个模型的AICc值之差超过3,AICc小的模型就可以认为是一个较好的模型。 Coefficient、Probability、Robust Probability和Variance Inflation Factor (VIF)。 Coefficient反映自变量与应变量的关系和强度;Probability(T检验)和Robust Probability用于评价自变量在统计上是否是显著的,零假设是系数为0(即该自变量对模型没有帮助),

26、当p-value非常小时,系数为0的可能性也很小,如是显著的,则加星号(*)表示,在Koenker检验是显著的情况下,利用Robust Probability评价自变量的统计显著性;VIF反映自变量的冗余度,如自变量的VIF值大于7.5,应去从相关的自变量中去除一个自变量。 Joint F-Statistic和Joint Wald Statistic。用于检验整个模型的统计显著性,零假设是模型中的自变量是无效的,如p-value小于0.05,则有95%的置信度自变量是有效的。其中,Joint F-Statistic只在Koenker(BP)不显著的情况下使用,如果Koenker(BP)统计是显

27、著的,应利用Joint Wald Statistic评价整个模型的显著性。 Koenker (BP) Statistic 。用于检验模型在地理空间和数据空间上是否有一致性。地理空间的一致性是指自变量与应变量的关系在不同位置是否一致;数据空间的一致性是指自变量与应变量的关系在不同数值区间是否一致,如犯罪和收入的关系,在低收入区间下和在高收入区间下,可能会有不同的关系。检验的零假设是一致的,p-value小于0.05 表示有95%的概率模型是不一致的,在这种情况下可考虑使用GWR分析。不同区域报警电话与人口的关系 Jarque-Bera statistic。用于评价模型的残差是否是正态分布,零假设

28、是正态分布,当p-value是小的情况下,表示残差不是正态分布,即模型是有偏差。 OLS工具运行结束后,会有一个WARNING信息, 提示利用空间自相关(Global Morans I)工具检验残差是否存在空间自相关,如存在空间自相关,表明模型存在问题(如缺少一个关键的自变量)。 演示:利用OLS建立报警电话与社区居住人口(Pop)、就业人口(Jobs)、低教育程度人口(LowEduc)以及离市中心距离(Dst2UrbCen)的关系模型,演示数据:ObsData911Calls.shp。空间权重回归 OLS是全局回归模型。由于对象的自变量和因变量的关系不一定是全局的,会应区域的差异而发生变化。

29、如不同区域人口与报警电话数之间的关系。 空间权重回归是对分布在不同空间位置的对象采用不同的回归模型。一个对象的回归模型是通过对落在该对象缓冲带内的观测点进行回归分析而获得,缓冲带的形状和大小通过用户输入的Kernel类型、带宽方法、距离和相邻对象数等确定。 Kernel的类型包括FIXED和ADAPTIVE两种,前者距离固定,后者相邻对象数固定。距离和相邻对象数的确定可以自定义,也可以选择AICc或CV方法,前者将根据Akaike Information Criterion,后者将根据Cross Validation确定kernel的范围。但在有些情况(如多重共线性)下,AICc和CV不能确定

30、理想的kernel范围,需要根据情况输入。 该工具要求输入数据有足够多的要素(几百个),否则,不能得到好的结果。 该工具最终可输出系数栅格数据,每个栅格值记录因变量的系数。 还可以指定一个有自变量值的要素类,根据每个要素的位置得到该位置对应的模型系数,结合自变量的值可以计算出因变量的预测值。 演示:利用空间权重回归方法建立报警电话与社区居住人口(Pop)、就业人口(Jobs)、低教育程度人口(LowEduc)以及离市中心距离(Dst2UrbCen)的回归模型,并根据预测的社区居住人口(PopFY)、就业人口(JobsFY)、低教育程度人口(LowEducFY)以及离市中心距离(Dst2UrbC

31、en)预测报警电话。不同区域报警电话不同区域报警电话预测 空间统计 叠置分析叠置分析 邻近分析 叠置分析是通过两个或多个要素类的叠置,对重叠部分进行处理,输出一个新的要素类。 在ArcGIS Analysis工具箱中包含叠置分析(Overlay)工具集,有Erase、Identity、Intersect、Union、Symmetrical Difference、Update等工具,此外,Extract工具集中的Clip和Split、Geoprocessing菜单下的Merge等也是叠置分析工具。Clip 切割工具。利用Clip要素类中的要素对输入要素类进行切割,提取出所需区域的数据,如切割出某

32、一区域的水系图。Split 分区切割工具。利用Split要素类中的分区要素对输入要素类切割,产生多个区域的数据,如产生分区域的水系图。 在利用Split工具时,需要选择Split字段(即分区字段,如区县名)以及存放输出数据的工作空间,输出数据的文件名为分区字段名。Erase 切除工具。以ERASE要素类中的要素对输入要素类进行切割删除,和Clip工具正好相反。Identity 字段值传递工具。输入要素类中的要素从对应的(与之叠置的)Identity要素中得到字段值。如果一个输入要素类对应多个Identity要素类,则先进行切割处理。 输入要素类可以是点、线或多边形, Identity要素类必须

33、是多边形或与输入要素类相一致的类型。 如水系图和行政区划图进行Identity处理后,水系将被行政界线切割,每个水系具有所在行政区域名称的字段值。通过Identity处理,每个水系具有所在行政区域字段值点数据(如企业分布)可通过Identity处理获得所在行政区域字段值Intersect 提取交集工具。提取输入要素类(可以是多个要素类)的重叠部分(几何交集),并作为新的要素类保存。针对输入和输出图层的类型,有不同情况。输入和输出均为多边形图层,则多边形重叠部分保存到新图层中 如输入为多边形图层,输出为线图层,则多边形的公共边保存到新图层中 如输入为多边形图层,输出为点图层,则交点(不包括交线上的端点)保存到新图层中 如输入和输出均为线图层,则重叠的线要素保存到新图层中 如输入为线图层,输出为点图层,则线的交点保存到新图层中 如输入和输出均为点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论