ArcGIS10中有关空间统计分析的数学公式原理及工具操作汇总资料(170多页)_第1页
ArcGIS10中有关空间统计分析的数学公式原理及工具操作汇总资料(170多页)_第2页
ArcGIS10中有关空间统计分析的数学公式原理及工具操作汇总资料(170多页)_第3页
ArcGIS10中有关空间统计分析的数学公式原理及工具操作汇总资料(170多页)_第4页
ArcGIS10中有关空间统计分析的数学公式原理及工具操作汇总资料(170多页)_第5页
已阅读5页,还剩167页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

“空间统计”工具箱概述ArcGIS 10 此空间统计工具箱包含用于分析空间分布、模式、过程和关系的统计工具。尽管空间统计和非空间统计(传统统计方法)在概念和目标方面可能存在某些相似性,但空间统计具有独特性,因为它们是专门为处理地理数据而开发的。与传统的非空间统计分析方法不同,空间统计方法是将空间(邻域、区域、连通性和/或其他空间关系)直接融入到数学中。可以使用“空间统计”工具箱中的工具对空间分布的显著特征进行汇总(例如,确定平均中心或总体方向趋势)、识别具有统计显著性的空间聚类(热点/冷点)或空间异常值、评估聚类或离散的总体模式以及建立空间关系模型。此外,对于使用 Python 编写的工具提供了源代码,以便于您学习、修改、扩展和/或与他人共享这些工具或其他分析工具。 注意:只要分析中涉及距离(对于空间统计总是如此),就应使用 投影坐标系(而不是基于度、分、秒的 地理坐标系)对数据进行 投影。工具集描述分析模式 这些工具可用于评估要素(或与要素关联的值)是形成一个聚类空间模式、离散空间模式还是随机空间模式。聚类分布制图 这些工具可用于识别具有统计显著性的热点、冷点或空间异常值。度量地理分布 这些工具可以解决以下问题:中心在哪里?形状和方向如何?这些要素的离散程度如何?空间关系建模 这些工具可利用回归分析来建立数据关系模型,也可以构建空间权重矩阵。渲染 这些工具可用于渲染分析结果。 工具 这些实用工具可执行多种杂项功能:计算面积、评估最小距离、导出变量和几何、转换空间权重文件和采集重合点。“空间统计”工具集其他资源: Mitchell, Andy.ESRI GIS 分析手册(第 2 卷)。ESRI 出版社,2005。 空间统计简介,免费的 ESRI 虚拟校园 Web 研讨会。 回归分析基本知识,免费的 ESRI 虚拟校园 Web 研讨会。 ArcUser Online 文章:犯罪、健康、房地产、回归分析。 教程:GIS 教程 II、热点分析、回归分析。 博客文章:空间模式分析的热点是什么?、回归分析基本知识。什么是投影坐标系?ArcGIS 10 投影坐标系在二维平面中进行定义。与地理坐标系不同,在二维空间范围内,投影坐标系的长度、角度和面积恒定。投影坐标系始终基于地理坐标系,而后者则是基于球体或旋转椭球体的。在投影坐标系中,通过格网上的 x,y 坐标来标识位置,其原点位于格网中心。每个位置均具有两个值,这两个值是相对于该中心位置的坐标。一个指定其水平位置,另一个指定其垂直位置。这两个值称为 x 坐标和 y 坐标。采用此标记法,原点坐标是 x = 0 和 y = 0。在等间隔水平线和垂直线的格网化网络中,中央水平线称为 x 轴,而中央垂直线称为 y 轴。在 x 和 y 的整个范围内,单位保持不变且间隔相等。原点上方的水平线和原点右侧的垂直线具有正值;下方或左侧的线具有负值。四个象限分别表示正负 X 坐标和 Y 坐标的四种可能组合。在地理坐标系中处理数据时,有时用 X 轴表示经度值并用 Y 轴表示纬度值很有用。ArcGIS 文档文件夹的 projected_coordinate_systems.pdf 文件中提供了受支持的投影坐标系列表。关于地图投影ArcGIS 10 无论将地球视为球体还是旋转椭球体,都必须变换其三维曲面以创建平面地图图幅。此数学变换通常称作地图投影。理解地图投影如何改变空间属性的一种简便方法就是观察光穿过地球投射到表面(称为投影曲面)上。想像一下,地球表面是透明的,其上绘有经纬网。用一张纸包裹地球。位于地心处的光会将经纬网投影到一张纸上。现在,可以展开这张纸并将其铺平。纸张上的经纬网形状与地球上的形状不同。地图投影使经纬网发生了变形。展平旋转椭球体并不比展平橙皮容易,因为它会破裂。用两种尺寸表示地球表面会导致数据的形状、面积、距离或方向发生变形。地图投影使用数学公式将地球上的球面坐标与平面坐标关联起来。不同投影会引起不同类型的变形。有些投影旨在最大限度地降低一种或两种数据特性的变形。投影可保持要素面积不变,但会改变其形状。在下图中,极点附近的数据已被拉伸。下图显示了如何压缩三维要素以拟合到平面上。地图投影具有特定用途。一种地图投影可能用于限定区域中的大比例尺数据,而另一种地图投影则用于小比例尺的世界地图。针对小比例尺数据的地图投影通常基于球体地理坐标系而不是椭球体地理坐标系。等角投影等角投影保留局部形状。要保留描述空间关系的各个角,等角投影必须在地图上显示以 90 度角相交的垂直经纬网线。地图投影通过保持所有角不变来加以实现。缺点是由一些弧线围起来的区域将在此过程中发生巨大变形。地图投影无法保留较大区域的形状。等积投影等积投影保留所显示要素的面积。为此,形状、角和比例等其他属性将发生变形。在等积投影中,经线和纬线可能不垂直相交。有些情况下,尤其是较小区域的地图,形状不会明显变形,且很难区分等积投影和等角投影,除非加以说明或进行测量。等距投影等距地图保留某些点间的距离。任何投影都无法在整幅地图中正确保持比例不变。不过,多数情况下,地图上总会存在一条或多条这样的线:比例沿着这些线将正确地保持不变。多数等距投影都具有一条或多条这样的线:在此类线中,地图上线的长度(按地图比例尺计算)与地球上同一条线的长度相同,无论它是大圆还是小圆,是直线还是曲线。此类距离被视为真实距离。例如,在正弦投影中,赤道和所有纬线就是其真实长度。在其他等距投影中,赤道和所有经线具有真实长度。而其他投影(例如,两点等距离)仍会显示地图上一点或两点与相隔点间的真实比例。请记住,任何投影都不能实现地图上的所有点是等距离的。了解有关正弦投影的详细信息了解有关两点等距投影的详细信息真方向投影曲面(例如,地球)上两点间的最短路径是沿平面上直线的球面等价线。即,两点所在的大圆。真方向(或方位)投影维持某些大圆圆弧不变,从而能够相对于中心正确地给出地图上所有点的方向或方位角。某些真方向投影也是等角、等积或等距投影。相关主题什么是投影坐标系?投影类型投影类型ArcGIS 10 由于地图是平的,因此,一些最简单的投影就是投影到几何形状上,该形状可被展平,而不会不拉伸其曲面。这些曲面被称为可展开曲面。圆锥曲面、圆柱曲面和平面即为一些常用的可展开曲面。地图投影使用数学算法系统地对位置进行投影,从旋转椭球体的曲面投影到平面上的对应位置。从一个曲面投影到另一个曲面的第一步是创建一个或多个接触点。每个接触均称为切点(或切线)。平面投影在某个点处与地球相切。相切圆锥和圆柱沿一条线接触地球。如果投影曲面与地球相交,而不只是接触其曲面,则产生的投影为相割情况,而不是相切情况。无论接触是相切形式还是相割形式,接触点或接触线都是很重要的,因为它们定义了零变形位置。真实比例的线包括中央子午线和标准纬线(有时称为标准线)。通常,变形会随距接触点距离的增加而增大。很多常用的地图投影都根据以下所用的投影曲面进行分类:圆锥曲面、圆柱曲面或平面。了解有关圆锥投影的详细信息。了解有关圆柱投影的详细信息。了解有关平面投影的详细信息。投影类型插图每个主要的投影类型 - 圆锥投影、圆柱投影和平面投影 - 如下面插图所示。圆锥投影(相切)圆锥被置于地球上。圆锥和地球沿一条纬线相交。该纬线就是标准纬线。沿中央子午线对面的经线切开圆锥,并将其展平为平面。圆锥投影(相割)圆锥被置于地球上,但穿过曲面。圆锥和地球沿两条纬线相交。这两条纬线就是标准纬线。沿中央子午线对面的经线切开圆锥,并将其展平为平面。圆柱方位投影圆柱被置于地球上。圆柱可沿一条纬线(正常情况)、一条经线(横轴情况)或其他线(斜轴情况)接触地球。平面方位投影平面被置于地球上。平面可在极点(两极情况)、赤道(赤道情况)或其他线(倾斜情况)处接触地?颉?极方位投影(不同透视点)方位投影或平面投影可具有不同的透视点。球心投影的透视点位于地球的中心。与接触点相对的地球另一侧用来进行立体投影。正射投影的透视点位于无限远处。相关主题关于地图投影其他投影圆柱投影圆锥投影平面投影支持的地图投影列表版权所有 1995-2010 Esri. 保留所有权利。什么是地理坐标系?ArcGIS 10 地理坐标系 (GCS) 使用三维球面来定义地球上的位置。GCS 往往被误称为基准面,而基准面仅是 GCS 的一部分。GCS 包括角度测量单位、本初子午线和基准面(基于旋转椭球体)。可通过其经度和纬度值对点进行引用。经度和纬度是从地心到地球表面上某点的测量角。通常以度或百分度为单位来测量该角度。下图将地球显示为具有经度和纬度值的地球。在球面系统中,水平线(或东西线)是等纬度线或纬线。垂直线(或南北线)是等经度线或经线。这些线包络着地球,构成了一个称为经纬网的格网化网络。位于两极点中间的纬线称为赤道。它定义的是零纬度线。零经度线称为本初子午线。对于绝大多数地理坐标系,本初子午线是指通过英国格林尼治的经线。其他国家/地区使用通过伯尔尼、波哥大和巴黎的经线作为本初子午线。经纬网的原点 (0,0) 定义在赤道和本初子午线的交点处。这样,地球就被分为了四个地理象限,它们均基于与原点所成的罗盘方位角。南和北分别位于赤道的下方和上方,而西和东分别位于本初子午线的左侧和右侧。此图显示了构成经纬网的经线和纬线。通常,经度和纬度值以十进制度为单位或以度、分和秒 (DMS) 为单位进行测量。维度值相对于赤道进行测量,其范围是 -90(南极点)到 +90(北极点)。经度值相对于本初子午线进行测量。其范围是 -180(向西行进时)到 180(向东行进时)。如果本初子午线是格林尼治子午线,则对于位于赤道南部和格林尼治东部的澳大利亚,其经度为正值,纬度为负值。用 X 表示经度值并用 Y 表示纬度值可能会有帮助。这样,显示在地理坐标系上定义的数据就如同度是线性测量单位一样。此方法与普通圆柱投影基本相同。了解有关普通圆柱投影的详细信息 尽管使用经度和纬度可在地球表面上定位确切位置,但二者的测量单位是不同的。只有在赤道上,一经度所表示的距离才约等于一纬度所表示的距离。这是因为,赤道是唯一一条长度与经线相同的纬线。(其半径与球面地球半径相同的圆称为大圆。赤道和所有经线都是大圆。)在赤道上方和下方,用来定义纬度线的圆将逐渐变小,直到最终在南极点和北极点处变为一个点,所有经线均在此处相交。由于经线沿极点方向逐渐集中,所以一经度所表示的距离最终将减小为零。在 Clarke 1866 旋转椭圆体上,赤道上的一经度等于 111.321 km,而在纬度为 60 度位置,只有 55.802 km。因为经度和纬度不具有标准长度,所以无法对距离或面积进行精确测量,或者无法很容易地在平面地图或计算机屏幕上显示数据。ArcGIS 文档文件夹的 geographic_coordinate_systems.pdf 文件中提供了受支持的地理坐标系和基准面等信息的表格。相关主题什么是投影坐标系?北美洲基准面垂直坐标系基础知识基准面旋转椭球体和球体版权所有 1995-2010 Esri. 保留所有权利。“分析模式”工具集概述ArcGIS 10 识别地理模式对于理解地理现象非常重要。尽管您可以通过对要素绘图来了解它们的总体模式及其关联值,但通过计算统计数据能够将模式量化。这样更便于比较不同分布方式或不同时段的模式。通常会先使用“分析模式”工具集中的工具进行初始分析,然后再进行更深入的分析。例如,可以使用空间自相关工具来确定在哪个距离处促进空间聚类的过程最明显,则可能有助于您选择一个适当的距离(分析规模)来深入研究热点(热点分析)。“分析模式”工具集中的工具都采用推论式统计,它们以零假设为起点,假设要素或与要素相关的值都表现成空间随机模式。然后它们再计算出一个 p 值用来表示零假设的正确概率(观测到的模式只不过是完整空间随机性的许多可能版本之一)。您在制定特定决策时可能需要高置信度的数据,这时,计算概率就可能很重要。例如,如果您的决策涉及公众安全或法律,则可能需要用统计证据来证明您的决策的合理性。“分析模式”工具可提供对宏观空间模式进行量化的统计数据。这些工具可以解答“数据集中的要素或与数据集中要素关联的值是否发生空间聚类?”之类的问题。下表列出了可用的工具,并对每个工具进行了简要描述。工具描述平均最近邻 根据每个要素与其最近邻要素之间的平均距离计算其最近邻指数。可从结果 窗口访问结果。高/低聚类 使用 Getis-Ord General G 统计可度量高值或低值的聚类程度。可从结果 窗口访问结果。空间自相关 根据要素位置和属性值使用 Global Morans I 统计量测量空间自相关性。可以从结果 窗口访问结果。多距离空间聚类分析(Ripleys K 函数) 确定要素(或与要素相关联的值)是否显示某一距离范围内统计意义显著的聚类或离散。 “分析模式”工具相关主题“空间统计”工具箱概述版权所有 1995-2010 Esri. 保留所有权利。空间自相关(Global Morans I) (空间统计) ArcGIS 10 汇总根据要素位置和属性值使用 Global Morans I 统计量测量空间自相关性。可以从结果 窗口访问结果。了解有关空间自相关 (Global Morans I) 工作原理的详细信息 图示用法 “空间自相关”工具将返回五个值:Morans I 指数、预期指数、方差、z 得分及 p 值。通过 结果窗口可访问这些值,也可以将这些值作为派生输出值传递,以满足模型或脚本中的潜在使用需要。或者,此工具会创建一个 HTML 文件,其中包含结果的图形汇总。双击结果 窗口中的 HTML 文件,将在默认的 Internet 浏览器中打开该 HTML 文件。右键单击结果 窗口中的 消息条目并选择查看后,将在消息对话框中显示结果。如果在 前景中执行此工具,还将在进度对话框中显示输出值。注意:o 当此工具是自定义模型工具的一部分时,如果在运行工具之前将 HTML 链接设置为 模型参数,则 HTML 链接将仅在结果 窗口中显示。 o 为了获得 HTML 图形的最佳显示效果,请确保已将监视器设置为 96 DPI。 在给定一组要素及相关属性的情况下,“空间自相关”工具将评估所表达的模式是聚类模式、离散模式还是随机模式。使用 z 得分或 p 值指示统计显著性时,如果 Morans I 指数值为正则指示聚类趋势,如果 Morans I 指数值为负则指示离散趋势。 Global Morans I 工具通过计算 z 得分和 p 值来指示您是否可以拒绝零假设。此种情况下,零假设表示要素值随机分布于研究区域中。 z 得分基于随机化零假设进行计算。有关 z 得分的详细信息,请参阅什么是 z 得分?什么是 p 值? 输入字段应包含多种值。计算该统计数据要求待分析的变量存在一定程度的变化;例如,如果所有输入都是 1 便无法求解。如果要使用此工具分析事件数据的空间模式,应考虑聚合事件数据。 基于欧氏距离或者曼哈顿距离的计算需要 投影数据来准确测量距离。 在 ArcGIS 10 中,将不再自动显示任选的图形输出。而是将创建 HTML 文件汇总结果。要查看结果,请在 结果窗口中双击 HTML 文件。在 ArcGIS 10 之前创建的使用此工具的自定义脚本或模型工具可能需要重新构建。要重新构建这些自定义工具,请打开这些工具,移除以图形方式显示结果参数,然后重新保存。 对于线和面要素,会在距离计算中使用要素质心。对于多点、折线 (polyline) 或由多部分组成的面,使用所有要素部分的加权平均中心来计算质心。点要素的加权项是 1,线要素的加权项是长度,而面要素的加权项是面积。 空间关系的概念化参数的选择应反映要分析的要素之间的固有关系。对要素在空间中以彼此交互方式构建的模型越逼真,结果就越准确。查看这些建议。以下是一些额外提示: o FIXED_DISTANCE_BAND 距离范围或距离阈值参数的默认值用于确保每个要素至少拥有一个相邻要素,这一点十分重要。但通常,此默认值并不是适用于分析的最合适的距离。要了解有关距离范围或距离阈值参数的详细信息,请单击此处。o INVERSE_DISTANCE 或者 INVERSE_DISTANCE_SQUARED 如果针对距离范围或距离阈值参数输入 0,则所有要素均将视为所有其他要素的相邻要素;如果将此参数留空,则将采用默认距离阈值。如果距离权重小于 1 将会变得不稳定。对于分隔距离小于一个单位的要素的权重(常见于 地理坐标系投影)为 1。警告:如果选择使用任何基于反距离的空间概念化方法(INVERSE_DISTANCE、INVERSE_DISTANCE_SQUARED 或者 ZONE_OF_INDIFFERENCE),则不建议对具有 地理坐标系投影的要素进行分析。对于这些“反距离”选项,为避免产生除数为零的情况,任何重合两点的权重值均将指定为 1。这样便可确保将要素包含在分析之内。 空间关系的概念化参数的附加选项在使用生成空间权重矩阵或者生成网络空间权重工具时可用。要利用这些附加选项,请使用上述工具之一构造空间权重矩阵文件,然后进行分析;为空间关系的概念化参数选择 GET_SPATIAL_WEIGHTS_FROM_FILE;为权重矩阵文件参数指定到您创建的空间权重文件的路径。 地图图层可用于定义输入要素类。在使用带有选择内容的图层时,分析只会包括所选的要素。注意:o 当此工具是自定义模型工具的一部分时,如果在运行工具之前将 HTML 链接设置为 模型参数,则 HTML 链接将仅在结果 窗口中显示。 o 为了获得 HTML 图形的最佳显示效果,请确保已将监视器设置为 96 DPI。如果为权重矩阵文件提供 .SWM 或 .swm 扩展名,则此工具将预期通过使用生成空间权重矩阵或生成网络空间权重工具创建的空间权重矩阵文件。否则,此工具将预期 ASCII 格式的空间权重矩阵文件。在某些情况下,工具行为将根据所使用的空间矩阵文件类型的不同而有所区别: o ASCII 格式的空间权重矩阵文件: 权重“按原样”使用。缺失的要素与要素之间的关系被视为零。 如果对权重进行了行标准化,则选择集的分析结果很有可能不正确。如果需要对选择集运行分析,则通过以下方法将 ASCII 空间权重文件转换为 .swm 文件:将 ASCII 数据读入表,然后将 CONVERT_TABLE 选项与生成空间权重矩阵工具结合使用。o .SWM 格式的空间权重矩阵文件 如果对权重进行了行标准化,则会将其选择集重新标准化。否则将“按原样”使用权重。 使用 ASCII 格式的空间权重矩阵文件运行您的分析会占用大量内存。如果要分析的要素超过 5000 个,则考虑将 ASCII 格式的空间权重矩阵文件转换为 .swm 格式的文件。首先,将 ASCII 权重置入一个带格式的表中(例如,使用 Excel)。接下来运行生成空间权重矩阵工具,并使用空间关系的概念化参数的 CONVERT_TABLE。输出将是 .swm 格式化的空间权重矩阵文件。 对于面要素,几乎总是需要为标准化参数选择行。如果每个要素所具有的邻域数目由聚合方案或者采样过程决定,而不是反映您所分析的变量的实际空间分布,则行标准化将减少偏移。 空间关系建模帮助主题提供了有关此工具的参数的附加信息。警告:在使用 shapefile 时,请注意 shapefile 无法存储空值。根据非 shapefile 输入创建 shapefile 的工具或其他过程可能会将空值存储(或解析)为零。这会产生意外的结果。另请参阅 shapefile 输出的地理处理注意事项。遗留问题:在 ArcGIS 9.2 版本中,“全局”标准化选项已被移除。全局标准化返回的结果与不执行标准化相同。通过使用全局标准化选项的 ArcGIS 较早版本构建的模型可能需要重新进行构建。语法SpatialAutocorrelation_stats (Input_Feature_Class, Input_Field, Generate_Report, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, Distance_Band_or_Threshold_Distance, Weights_Matrix_File)参数说明数据类型Input_Feature_Class要计算空间自相关的要素类。Feature LayerInput_Field用于评估空间自相关的数值字段。FieldGenerate_Report NO_REPORT 不会创建图形汇总(默认值)。 GENERATE_REPORT 图形汇总将以 HTML 文件形式创建。 BooleanConceptualization_of_Spatial_Relationships指定要素空间关系的概念化方式。 INVERSE_DISTANCE 与远处的要素相比,附近的邻近要素对目标要素的计算的影响要大一些。 INVERSE_DISTANCE_SQUARED 与 INVERSE_DISTANCE 类似,但它的坡度更明显,因此影响下降得更快,并且只有目标要素的最近邻域会对要素的计算产生重大影响。 FIXED_DISTANCE_BAND 将对邻近要素环境中的每个要素进行分析。在指定临界距离内的邻近要素将分配值为 1 的权重,并对目标要素的计算产生重大影响。在指定临界距离外的邻近要素将分配值为零的权重,并且不会对目标要素的计算产生任何影响。 ZONE_OF_INDIFFERENCE 在目标要素的指定临界距离内的要素将分配值为 1 的权重,并且会影响目标要素的计算。一旦超出该临界距离,权重(以及邻近要素对目标要素计算的影响)就会随距离的增加而减小。 POLYGON_CONTIGUITY_(FIRST_ORDER) 只有共用边界的邻近面要素会影响目标面要素的计算。(需要 ArcInfo 级别许可) GET_SPATIAL_WEIGHTS_FROM_FILE 将在空间权重文件中定义空间关系。指向空间权重文件的路径在“权重矩阵文件”参数中指定。 StringDistance_Method指定计算每个要素与邻近要素之间的距离的方式。 EUCLIDEAN_DISTANCE 两点间的直线距离 MANHATTAN_DISTANCE 沿垂直轴度量的两点间的距离(城市街区);计算方法是对两点的 x 和 y 坐标的差值(绝对值)求和。 StringStandardization当要素的分布由于采样设计或施加的聚合方案而可能偏离时,建议使用行标准化。 NONE 不对空间权重执行标准化。 ROW 对空间权重执行标准化;每个权重都会除以行的和(所有相邻要素的权重和)。 StringDistance_Band_or_Threshold_Distance为“反距离”和“固定距离”选项指定中断距离。将在对目标要素的分析中忽略为该要素指定的中断之外的要素。但是,对于“无差别的区域”,指定距离之外的要素的影响会随距离的减小而变弱,而在距离阈值之内的影响则被视为是等同的。输入的值应该与输出坐标系的值匹配。对于空间关系的“反距离”概念化,值为 0 表示未应用任何阈值距离;当将此参数留空时,将计算并应用默认阈值。此默认值为确保每个要素至少具有一个邻域的欧氏距离。如果选择了“面邻接”或者“通过文件获取空间权重”空间概念化,则此参数不会产生任何影响。DoubleWeights_Matrix_File(可选)指向包含空间权重(其定义要素间的空间关系)的文件的路径。File代码示例SpatialAutocorrelation 示例(Python 窗口) 以下 Python 窗口脚本演示了如何使用 SpatialAutocorrelation 工具。import arcpy arcpy.env.workspace = rc:data arcpy.SpatialAutocorrelation_stats(olsResults.shp, Residual,NO_REPORT, GET_SPATIAL_WEIGHTS_FROM_FILE,EUCLIDEAN DISTANCE, NONE, #,euclidean6Neighs.swm)SpatialAutocorrelation 示例(独立 Python 脚本) 以下独立 Python 脚本演示了如何使用 SpatialAutocorrelation 工具。# Analyze the growth of regional per capita incomes in US # Counties from 1969 - 2002 using Ordinary Least Squares Regression # Import system modules import arcpy # Set the geoprocessor object property to overwrite existing outputs arcpy.gp.overwriteOutput = True # Local variables. workspace = rC:Data try: # Set the current workspace (to avoid having to specify the full path to the feature classes each time) arcpy.workspace = workspace # Growth as a function of log of starting income, dummy for South # counties, interaction term for South counties, population density # Process: Ordinary Least Squares. ols = arcpy.OrdinaryLeastSquares_stats(USCounties.shp, MYID, olsResults.shp, GROWTH, LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69, olsCoefTab.dbf, olsDiagTab.dbf) # Create Spatial Weights Matrix (Can be based off input or output FC) # Process: Generate Spatial Weights Matrix. swm = arcpy.GenerateSpatialWeightsMatrix_stats(USCounties.shp, MYID, euclidean6Neighs.swm, K_NEAREST_NEIGHBORS, #, #, #, 6) # Calculate Morans I Index of Spatial Autocorrelation for # OLS Residuals using a SWM File. # Process: Spatial Autocorrelation (Morans I). moransI = arcpy.SpatialAutocorrelation_stats(olsResults.shp, Residual, NO_REPORT, GET_SPATIAL_WEIGHTS_FROM_FILE, EUCLIDEAN_DISTANCE, NONE, #, euclidean6Neighs.swm) except: # If an error occurred when running the tool, print out the error message. print arcpy.GetMessages()环境当前工作空间, 临时工作空间, 输出坐标系输出坐标系 进行分析之前,将要素几何投影到“输出坐标系”。所有数学计算都基于“输出坐标系”空间参考进行。相关主题“分析模式”工具集概述什么是 z 得分?什么是 p 值?使用结果窗口平均最近的相邻要素热点分析(Getis-Ord Gi*)空间关系建模空间权重空间自相关 (Global Morans I) 的工作原理聚类和异常值分析(Anselin Local Morans I)许可信息ArcView: 是ArcEditor: 是ArcInfo: 是版权所有 1995-2010 Esri. 保留所有权利。空间自相关 (Global Morans I) 的工作原理ArcGIS 10 空间自相关 (Global Morans I) 工具同时根据要素位置和要素值来度量空间自相关。在给定一组要素及相关属性的情况下,该工具评估所表达的模式是聚类模式、离散模式还是随机模式。该工具通过计算 Morans I 指数值、z 得分和 p 值来对该指数的显著性进行评估。p 值是根据已知分布的曲线得出的面积近似值(受检验统计量限制)。 计算Global Morans I 的其他数学公式Global Morans I 统计量所依据的数学公式如上所示。该工具计算所评估属性的均值和方差。然后,将每个要素值减去均值,从而得到与均值的偏差。将所有相邻要素(例如位于指定距离范围内的要素)的偏差值相乘,从而得到叉积。请注意,Global Morans I 统计量的分子是这些叉积的和。假定要素 A 和 B 是相邻要素,并且所有要素值的均值为 10。请注意可能的叉积结果的范围:要素值偏差叉积A=50B=4040301200A=8B=6-2-48A=20B=210-8-80如果相邻要素的值都大于或者都小于均值,则叉积将为正。如果一个要素值小于均值而另一个要素值大于均值,则叉积将为负。在所有情况下,与均值的偏差越大,叉积结果就越大。如果数据集中的值倾向于在空间上发生聚类(高值聚集在其他高值附近;低值聚集在其他低值附近),则 Morans I 指数将为正。如果高值排斥其他高值,而倾向于靠近低值,则该指数将为负。如果正叉积值与负叉积值相抵消,则指数将接近于零。由于分子是通过方差进行归一化,因此该指数的值将落在 -1.0 到 +1.0 的区间内(有关例外情况,请参阅下面的常见问题部分)。空间自相关 (Global Morans I) 工具计算了指数值后,将计算期望指数值。然后,将期望指数值与观察指数值进行比较。在给定数据集中的要素个数和全部数据值的方差的情况下,该工具将计算 z 得分和 p 值,用来指示此差异是否具有统计学上的显著性。指数值不能直接进行解释,只能在零假设的情况下进行解释。 什么是 z 得分?什么是 p 值?ArcGIS 10 大多数统计检验在开始时都首先确定一个零假设。模式分析工具(“分析模式”工具集和“聚类分布制图”工具集)的零假设是完全空间随机性 (CSR),它或者是要素本身的完全空间随机性,或者是与这些要素关联的值的完全空间随机性。模式分析工具所返回的 z 得分和 p 值可以让您判断出是否可以拒绝零假设。通常,您将运行其中一种模式分析工具,同时希望 z 得分和 p 值会指明可以 拒绝零假设,因为此工具将表明:您的要素(或与要素关联的值)会表现出具有统计显著性的聚类或分散,而不是随机模式。只要在地貌中(或在空间数据中)发现聚类这样的空间结构,就证明某些基础空间过程在发挥作用,而这通常是地理学者或 GIS 分析人员最关注的方面。p 值表示概率。对于模式分析工具来说,它是所观测到的空间模式由某一随机过程创建的概率。当 p 很小时,意味着所观测到的空间模式不太可能产生于随机过程(小概率),因此您可以拒绝零假设。您可能会问这样的问题:要小到什么程度才算足够小?这是一个非常好的问题。请参见下面的表和论述。Z 得分只不过是标准差的倍数。例如,如果工具返回的 z 得分为 +2.5,我们就会说,结果是 2.5 倍标准差。如下所示,z 得分和 p 值都与标准正态分布相关联。在正态分布的尾部出现非常高或非常低的 z 得分(负值),这些得分与非常小的 p 值相关。当您运行要素模式分析工具并由该工具得到很小的 p 值以及非常高或非常低的 z 得分时,就表明观测到的空间模式不太可能反映出零假设 (CSR) 所表示的理论上的随机模式。要拒绝零假设,必须对所愿承受的做出错误选择(错误地拒绝零假设)的风险程度做出主观判断。因此,请先选择置信度,然后再执行空间统计。典型的置信度为 90%、95% 或 99%。在这种情况下,99% 的置信度是最保守的,这表示您不愿意拒绝零假设,除非该模式是由随机过程创建的概率确实非常小(低于 1% 的概率)。下表显示了不同置信度下的临界 p 值和临界 z 得分。z 得分(标准差)p 值(概率)置信度 +1.65 0.1090% +1.96 0.0595% +2.58 0.0199%请考虑一个示例。置信度为 95% 时,z 得分的临界值为 -1.96 和 +1.96 倍标准差。与 95% 置信度关联的 p 值为 0.05。如果 z 值在 -1.96 和 +1.96 之间,则 p 值将大于 0.05,因而不能拒绝零假设;所表现出的模式很可能是随机空间过程产生的结果。如果 z 得分在该范围之外(例如,-2.5 或 +5.4 倍标准差),则所观测到的空间模式可能过于罕见,不可能是随机过程产生的结果,并且 p 值很小,也可以反映出这一点。在这种情况下,可以拒绝零假设,并着手找出什么可能导致您的数据中出现具有统计显著性的空间结构。这里的一个关键概念是,正态分布中间位置的值(例如,类似 0.19 或 -1.2 的 z 得分)代表了预期的结果。但在 z 得分的绝对值很大而概率很小时(出现在正态分布的尾部),就会显现出不寻常的现象并且通常非常令人关注。例如,对于热点分析工具,“不寻常”意味着出现了具有统计显著性的热点或冷点。零假设“空间统计”工具箱中的几种统计工具都是推断式空间模式分析方法,例如,空间自相关 (Global Morans I)、聚类和异常值分析 (Anselin Local Morans I) 和热点分析 (Getis-Ord Gi*)。推断统计建立在概率论的基础之上。概率是对评测可能性的一种量度,它的基本原则是,所有的统计检验(直接或间接)都是概率计算,用于评估可能性在分析结果中的作用。通常,对于传统的(非空间)统计,您处理的是随机样本,并设法确定样本数据能够很好地代表(反映出)整个总体的概率。例如,您可能会问:“从票站调查得出的结果(表明候选者 A 将以微弱优势打败候选者 B)反映出最终选举结果的几率有多大?”但是对于许多空间统计方法(包括以上列出的空间自相关类型统计),您通常处理的是研究区域的所有 的可用数据(所有犯罪案件、所有的疾病案例、所有人口普查区的属性等等)。在对整个 总体计算统计数据时,得出的不再是估算值。您所掌握的是事实。因此,探讨可能性或概率不再有任何意义。那么,通常适用于研究区域中所有数据的空间模式分析工具如何才能合理地报告概率呢?答案就是,它们可以通过假设数据事实上是某个更大总体中的一部分(通过零假设)来实现这一点。请更细致地考虑这一点。随机化零假设:在适当的情况下,“空间统计”工具箱中的工具会将随机化零假设用作统计显著性检验的基础。随机化零假设会假定对您的数据所观测到的空间模式表示的是多种 (n!) 可能的空间排列中的一种排列。如果您可以拾取数据值并将它们放置到研究区域中的各要素,则可能会得到这些值的某一种可能的空间排列。(请注意,拾取数据值并将它们任意放置是随机空间过程的一个示例)。随机化零假设表明的是,如果您可以无数次进行此练习(拾取数据,然后放置数据),则多数时候您所获得的模式与观测到的模式(真实数据)相比都没有明显差别。偶尔您可能会无意中将所有最高值放置到研究领域的同一角落中,但这样做的概率很小。随机化零假设表明的是,您的数据只是完全空间随机性的众多可能版本之一。数据值是固定不变的,只有它们的空间排列会发生变化。归一化零假设:归一化零假设是一种常见的备选零假设,并不是由“空间统计”工具箱来执行。归一化零假设假定所观测到的值是通过某一随机抽样过程从无限大的呈正态分布的值总体获得的。如果使用另一个样本,您会得到不同的值,但您仍期望这些值可以用来代表更大型的分布。归一化零假设表明的是,所获得的值代表了是众多可能的值样本之一。如果您能够将观测的数据与正态曲线拟合并从该分布中随机选择值来放置到研究区域,则多数时候您所获得的值模式和值分布与观测到的模板/分布(真实数据)相比都没有明显的差别。归一化零假设表明的是,您的数据及其排列是众多可能的随机样本之一。数据值及其空间排列都不是固定不变的。归一化零假设仅适用于数据值呈正态分布的情况。其他资源: Ebdon, David.Statistics in Geography, Blackwell,1985 Mitchell, Andy.ESRI GIS 分析手册(第 2 卷),ESRI 出版社,2005 Goodchild, M.F., Spatial Autocorrelation,Catmog 47,Geo Books, 1986相关主题普通最小二乘法(OLS)热点分析(Getis-Ord Gi*)空间自相关(Global Morans I)聚类和异常值分析(Anselin Local Morans I)高/低聚类(Getis-Ord General G)版权所有 1995-2010 Esri. 保留所有权利。解释空间自相关 (Global Morans I) 工具是一种推论统计,这意味着分析结果始终在零假设的情况下进行解释。对于 Global Morans I 统计量,零假设声明,所分析的属性在研究区域内的要素之间是随机分布的;换句话说,用于促进观察值模式的空间过程是随机的。假设您可以为所分析的属性选择值,然后使这些值随意落到要素上,从而让每个值落在可能的位置。此过程(选择并随意放置值)便是随机空间过程的示例。如果此工具返回的 p 值具有统计学上的显著性,则可拒绝零假设。下表对结果的解释进行了汇总:p 值不具有统计学上的显著性。不能拒绝零假设。要素值的空间分布很有可能是随机空间过程的结果。观测到的要素值空间模式可能只是完全空间随机性 (CSR) 的众多可能结果之一。p 值具有统计学上的显著性,且 z 得分为正值。可以拒绝零假设。如果基础空间过程是随机的,则数据集中高值和/或低值的空间分布在空间上聚类的程度要高于预期。p 值具有统计学上的显著性,且 z 得分为负值。可以拒绝零假设。如果基础空间过程是随机的,则数据集中高值和低值的空间分布在空间上离散的程度要高于预期。离散空间模式通常会反映某种类型的竞争过程 - 具有高值的要素排斥具有高值的其他要素;类似地,具有低值的要素排斥具有低值的其他要素。注意:高/低聚类 (General G) 工具和空间自相关 (Global Morans I) 工具的零假设都具有完全空间随机性。但是,高/低聚类 (General G) 工具的 z 得分解释有所不同。输出空间自相关 (Global Morans I) 工具将返回五个值:Morans I 指数、预期指数、方差、z 得分和 p 值。通过 结果窗口可访问这些值,也可将这些值作为派生输出值传递,以满足模型或脚本中的可能应用需要。或者,此工具会创建一个 HTML 文件,其中包含结果的图形汇总。双击结果 窗口中的 HTML 文件,将在默认的 Internet 浏览器中打开该 HTML 文件。可通过“结果”窗口访问工具输出。右键单击结果 窗口中的 消息条目并选择查看后,这些结果还将显示在消息对话框中。最佳做法准则 输入要素类是否至少包含 30 个要素?如果少于 30 个要素,则结果不可靠。 您选择的空间关系的概念化是否合适?请参阅选择空间关系的概念化。 距离范围或距离阈值是否合适?请参阅选择固定距离。 o 所有要素都应至少具有一个相邻要素。 o 任何要素都不应将其余所有要素作为相邻要素。 o 尤其是在输入字段的值偏斜时,您希望每个要素具有大约八个相邻要素。 是否进行行标准化?对于面要素,几乎总是需要进行行标准化。请参阅标准化。常见问题问题: 热点分析 (Getis-Ord Gi*) 工具的输出结果用于指示统计学上显著的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论