




已阅读5页,还剩34页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.分析模式工具集概述:工具描述平均最近邻根据每个要素与其最近邻要素之间的平均距离计算其最近邻指数。高/低聚类使用 Getis-Ord General G 统计可度量高值或低值的聚类程度。增量空间自相关测量一系列距离的空间自相关,并选择性创建这些距离及其相应 z 得分的折线图。z 得分反映空间聚类的程度,具有统计显著性的峰值 z 得分表示促进空间过程聚类最明显的距离。这些峰值距离通常为具有“距离范围”或“距离半径”参数的工具所使用的合适值。空间自相关根据要素位置和属性值使用 Global Morans I 统计量测量空间自相关性。多距离空间聚类分析(Ripleys K 函数)确定要素(或与要素相关联的值)是否显示某一距离范围内统计意义显著的聚类或离散。1.1 平均最近邻1.1.1 简介根据每个要素与其最近邻要素之间的平均距离计算其最近邻指数。平均最近邻工具可测量每个要素的质心与其最近邻要素的质心位置之间的距离,然后计算所有这些最近邻距离的平均值。如果该平均距离小于假设随机分布中的平均距离,则会将所分析的要素分布视为聚类要素。如果该平均距离大于假设随机分布中的平均距离,则会将要素视为分散要素。平均最近邻比率通过观测的平均距离除以期望的平均距离计算得出(使用基于假设随机分布的期望平均距离,该分布使用相同数量的要素覆盖相同的总面积)。1.1.2 适用范围评估竞争或领地:量化并比较固定研究区域中的多种植物种类或动物种类的空间分布;比较城市中不同类型的企业的平均最近邻距离。监视随时间变化的更改:评估固定研究区域中一种类型的企业的空间聚类中随时间变化的更改。将观测分布与控制分布进行比较:在木材分析中,如果给定全部可收获木材的分布,则您最好将已收获面积图案与可收获面积图案进行比较,以确定砍伐面积是否比期望面积更为聚类。1.1.3用法“平均最近邻”工具将返回五个值:平均观测距离、预期平均距离、最近邻指数、z 得分和 p 值。您可通过结果窗口访问这些值,也可以将这些值作为派生输出值进行传递,以满足模型或脚本中的潜在使用需要。z 得分和 p 值结果是统计显著性的量度,用来判断是否拒绝零假设。但是应注意,此方法的统计意义受研究区域大小的强烈影响(请参阅下文)。对于“平均最近邻”统计,零假设表明要素是随机分布的。“最近邻指数”的表示方式是“平均观测距离”与“预期平均距离”的比率。预期平均距离是假设随机分布中的邻域间的平均距离。如果指数小于 1,所表现的模式为聚类;如果指数大于 1,则所表现的模式趋向于离散或竞争。平均最近邻方法对“面积”值非常敏感(面积参数值的细微变化都能导致 z 得分和 p 值结果产生巨大变化)。因此,平均最近邻工具最适用于对固定研究区域中不同的要素进行比较。下图是关于相同要素分布如何根据指定的研究区域进行分散或聚类的一个典型示例。此工具将用于处理面或线数据,但它最适用于事件、事件点或其他定点要素数据。对于线要素和面要素,会在计算中使用每个要素真正的几何质心。对于多点、折线 (polyline) 或由多部分组成的面,使用所有要素部分的加权平均中心来计算质心。点要素的加权项是 1,线要素的加权项是长度,而面要素的加权项是面积。1.1.4 语法参数说明数据类型Input_Feature_Class要对平均最近邻距离进行计算的要素类(通常是点要素类)。Feature LayerDistance_Method指定计算每个要素与邻近要素之间的距离的方式。 EUCLIDEAN_DISTANCE 两点间的直线距离(笔直地) MANHATTAN_DISTANCE 沿垂直轴度量的两点间的距离(城市街区);计算方法是对两点的 x 和 y 坐标的差值(绝对值)求和。StringGenerate_Report(可选) NO_REPORT 不会创建图形汇总。这是默认设置。 GENERATE_REPORT 图形汇总将以 HTML 文件形式创建。BooleanArea(可选)表示研究区域大小的数值。默认值是包含所有要素(或所有选定要素)的最小外接矩形的面积。单位应与“输出坐标系”的单位一致。Double1.2 高/低聚类1.2.1 简介使用 Getis-Ord General G 统计可度量高值或低值的聚类程度。高/低聚类 (Getis-Ord General G) 工具是一种推论统计,这意味着分析结果将在零假设的情况下进行解释。高/低聚类 (General G) 统计的零假设规定不存在要素值的空间聚类。此工具返回的 p 值较小且在统计学上显著,则可以拒绝零假设。如果零假设被拒绝,则 z 得分的符号将变得十分重要。如果 z 得分值为正数,则观测的 General G 指数会比期望的 General G 指数要大一些,表明属性的高值将在研究区域中聚类。如果 z 得分值为负数,则观测的 General G 指数会比期望的 General G 指数要小一些,表明属性的低值将在研究区域中聚类。当存在完全均匀分布的值并且要查找高值的异常空间峰值时,首选高/低聚类 (Getis-Ord General G) 工具。高值和低值同时聚类时,它们倾向于彼此相互抵消。如果在高值和低值同时聚类时测量空间聚类,则使用空间自相关工具。高/低聚类 (Getis-Ord General G) 和空间自相关 (Global Morans I) 工具的零假设都具有完全空间随机性 (CSR);在数据集的要素中值是随机分布的,将在运行时反映随机空间过程。不过,“高/低聚类 (Getis-Ord General G)”工具的 z 得分的解释与“空间自相关 (Global Morans I)”工具的 z 得分的解释有很大的差别:结果高/低聚类空间自相关p 值不具有统计学上的显著性。不能拒绝零假设。要素属性值的空间分布很有可能是随机空间过程的结果。也就是说,所观测到的值的空间模式很可能是完全空间随机性的众多可能结果之一。p 值具有统计学上的显著性,且 z 得分为正值。可以拒绝零假设。如果基础空间过程是完全随机的,则数据集中高值的空间分布与预期的空间分布相比在空间上的聚类程度更高。可以拒绝零假设。如果基础空间过程是完全随机的,则数据集中高值和/或低值的空间分布在空间上聚类的程度要高于预期。p 值具有统计学上的显著性,且 z 得分为负值。可以拒绝零假设。如果基础空间过程是完全随机的,则数据集中低值的空间分布与预期的空间分布相比在空间上的聚类程度更高。可以拒绝零假设。如果基础空间过程是完全随机的,则数据集中高值和低值的空间分布在空间上离散的程度要高于预期。离散的空间模式通常反映某种类型的竞争过程:具有高值的要素排斥具有高值的其他要素;类似地,具有低值的要素排斥具有低值的其他要素。1.2.2可能的应用在访问急症室的次数中查找出现的异常峰值,可能表明在局部或区域的健康问题的爆发。比较在城市中不同种类零售业的空间模式,利用比较购物的方式来了解哪类行业充满竞争性(如汽车经销商)以及哪类行业拒绝竞争(如健康中心/健身房)。汇总空间现象聚类的程度以检查不同时期或不同位置的变化。例如,众所周知的城市及其人口聚类。使用高/低聚类分析时,可以随时间来比较某个城市的人口聚类的程度(城镇发展以及密集度的分析)。1.2.3 用法“高/低聚类”工具可返回四个值:General G 观测值、General G 期望值、z 得分及 p 值。输入字段应包含多种非负值。如果输入字段包含负值,将显示错误消息。此外,此统计数学方法要求待分析的变量存在一定程度的变化;例如,如果所有输入都是 1 便无法求解。如果要使用此工具分析事件数据的空间模式,应考虑聚合事件数据。优化的热点分析工具也可以用于分析事件数据的空间模式。z 得分越高(或越低),聚类程度就越高。如果 z 得分接近零,则表示研究区域内不存在明显的聚类。z 得分为正表示高值的聚类。z 得分为负表示低值的聚类。空间关系的概念化参数的选择应反映要分析的要素之间的固有关系。对要素在空间中彼此交互方式构建的模型越逼真,结果就越准确。这些建议在选择空间关系的概念化:最佳做法中进行了概述。以下是一些额外提示:建议针对此统计使用二进制权重方案:固定距离、面邻接、K 最近邻或 Delaunay 三角测量。为标准化参数选择 NONE。FIXED_DISTANCE_BAND默认的距离范围或距离阈值将确保每个要素至少拥有一个相邻要素,这一点十分重要。但通常,此默认值并不是适用于分析的最合适的距离。为分析选择适合的比例(距离范围)的其他策略在选择固定距离范围值中进行了概括介绍。INVERSE_DISTANCE 或 INVERSE_DISTANCE_SQUARED(不建议使用)如果为距离范围或阈值距离参数输入 0,则所有要素均被视为所有其他要素的相邻要素;如果将此参数留空,则将采用默认距离。如果距离权重小于 1,则对其取倒数时将变得不稳定。因此,对于分隔距离小于 1 单位的要素权重,权重值将指定为 1。对于反距离选项(不建议对此工具使用),为避免产生除数为零的情况,任何重合两点的权重值均将指定为 1。这样便可确保将要素包含在分析之内。空间关系的概念化参数的附加选项(包括空间-时间关系)在使用生成空间权重矩阵或者生成网络空间权重工具时可用。要利用这些附加选项,请使用上述任一工具构造空间的权重矩阵文件,然后进行分析;为空间关系的概念化参数选择 GET_SPATIAL_WEIGHTS_FROM_FILE,为权重矩阵文件参数指定您所创建的空间权重文件的路径。地图图层可用于定义输入要素类。在使用带有选择内容的图层时,分析只会包括所选的要素。如果提供的是一个带 .swm 扩展名的权重矩阵文件,则此工具需要输入的是一个使用生成空间权重矩阵或生成网络空间权重工具创建的空间权重矩阵文件;否则,此工具需要输入一个 ASCII 格式的空间权重矩阵文件。在某些情况下,工具行为将根据所使用的空间矩阵文件类型的不同而有所区别:ASCII 格式的空间权重矩阵文件:权重“按原样”使用。所缺失的要素与要素之间的关系被视为零。如果对权重进行了行标准化,则选择集的分析结果很有可能不正确。如果需要对选择集运行分析,则通过以下方法将 ASCII 空间权重文件转换为 SWM 文件:将 ASCII 数据读入表,然后将 CONVERT_TABLE 选项与生成空间权重矩阵工具结合使用。SWM 格式的空间权重矩阵文件:如果对权重进行了行标准化,则会将其选择集重新标准化;否则,权重将“按原样”使用。使用 ASCII 格式的空间权重矩阵文件运行您的分析会占用大量内存。如果要分析的要素超过 5,000 个,则考虑将 ASCII 格式的空间权重矩阵文件转换为 SWM 格式的文件。首先,将 ASCII 权重置入一个带格式的表中(例如,使用 Excel)。接下来运行生成空间权重矩阵工具,并使用空间关系的概念化参数的 CONVERT_TABLE。输出将是 SWM 格式的空间权重矩阵文件。1.2.4语法参数说明数据类型Input_Feature_Class将计算 General G 统计的要素类。Feature LayerInput_Field要评估的数值字段。FieldGenerate_Report(可选) NO_REPORT 不会创建图形汇总。这是默认设置。 GENERATE_REPORT 图形汇总将以 HTML 文件形式创建。BooleanConceptualization_of_Spatial_Relationships指定要素空间关系的定义方式。 INVERSE_DISTANCE 与远处的要素相比,附近的邻近要素对目标要素的计算的影响要大一些。 INVERSE_DISTANCE_SQUARED 与INVERSE_DISTANCE类似,但它的坡度更明显,因此影响下降得更快,并且只有目标要素的最近邻域会对要素的计算产生重大影响。 FIXED_DISTANCE_BAND 将对邻近要素环境中的每个要素进行分析。在指定临界距离 (Distance_Band_or_Threshold) 内的邻近要素将分配有值为 1 的权重,并对目标要素的计算产生重大影响。在指定临界距离外的邻近要素将分配值为零的权重,并且不会对目标要素的计算产生任何影响。 ZONE_OF_INDIFFERENCE 在目标要素的指定临界距离 (Distance_Band_or_Threshold) 内的要素将分配有值为 1 的权重,并且会影响目标要素的计算。一旦超出该临界距离,权重(以及邻近要素对目标要素计算的影响)就会随距离的增加而减小。 CONTIGUITY_EDGES_ONLY 只有共用边界或重叠的相邻面要素会影响目标面要素的计算。 CONTIGUITY_EDGES_CORNERS 共享边界、结点或重叠的面要素会影响目标面要素的计算。 GET_SPATIAL_WEIGHTS_FROM_FILE 将由指定空间权重文件定义空间关系。指向空间权重文件的路径由Weights_Matrix_File参数指定。StringDistance_Method指定计算每个要素与邻近要素之间的距离的方式。 EUCLIDEAN_DISTANCE 两点间的直线距离(笔直地) MANHATTAN_DISTANCE 沿垂直轴度量的两点间的距离(城市街区);计算方法是对两点的 x 和 y 坐标的差值(绝对值)求和。StringStandardization当要素的分布由于采样设计或施加的聚合方案而可能偏离时,建议使用行标准化。 NONE 不对空间权重执行标准化。 ROW 对空间权重执行标准化;每个权重都会除以行的和(所有相邻要素的权重和)。StringDistance_Band_or_Threshold_Distance(可选)为“反距离”和“固定距离”选项指定中断距离。将在对目标要素的分析中忽略为该要素指定的中断之外的要素。但是,对于ZONE_OF_INDIFFERENCE,指定距离之外的要素的影响会随距离的减小而变弱,而在距离阈值之内的影响则被视为是等同的。输入的距离值应该与输出坐标系的值匹配。对于空间关系的反距离概念化,值为0表示未应用任何阈值距离;当将此参数留空时,将计算并应用默认阈值。此默认值为确保每个要素至少具有一个邻域的欧氏距离。当选择了面邻接(CONTIGUITY_EDGES_ONLY或CONTIGUITY_EDGES_CORNERS)或GET_SPATIAL_WEIGHTS_FROM_FILE的空间概念化时,该参数无效。DoubleWeights_Matrix_File(可选)包含权重(其定义要素间的空间关系以及可能的时态关系)的文件的路径。File1.3 增量空间自相关1.3.1简介测量一系列距离的空间自相关,并选择性创建这些距离及其相应 z 得分的折线图。z 得分反映空间聚类的程度,具有统计显著性的峰值 z 得分表示促进空间过程聚类最明显的距离。这些峰值距离通常为具有“距离范围”或“距离半径”参数的工具所使用的合适值。当看到地表上的空间聚类时,您将看到正在进行的基础空间过程。了解基础过程运行的空间比例有助于选择适当的分析距离。增量空间自相关工具为一系列增大的距离运行空间自相关 (Global Morans I) 工具,同时测量各距离空间聚类的程度。聚类的程度由返回的 z 得分确定。通常情况下,距离的增大(z 得分也增大)表示聚类增强。但是,对于某些特定距离,z 得分通常为峰值。有时您会看到多个峰值。 1.3.2 用法此工具有助于为具有这些参数(如热点分析或点密度)的工具选择合适的距离阈值或半径。此增量空间自相关工具可测量一系列距离增量的空间自相关,并为每项距离增量报告相关的 Moran 指数、预期指数、方差、z 得分和 p 值。右键单击消息条目并选择视图,在结果 窗口中访问这些值。作为派生输出值,此工具也可传递可能会在模型或脚本中使用的第一个峰值 z 得分和最大峰值 z 得分。当显示多个具有统计显著性的峰值时,聚类在这些距离处均很明显。选择与您感兴趣的分析比例对应的峰值距离;通常为遇到的第一个具有统计显著性的峰值。输入字段应包含多种值。此统计数学方法要求待分析的变量存在一定程度的变化;例如,如果所有输入都是 1 便无法求解。如果要使用此工具分析事件数据的空间模式,应考虑聚合事件数据。对于线和面要素,距离计算中会使用要素的质心。对于多点、折线或由多部件组成的面,将会使用所有要素部件的加权平均中心来计算质心。点要素的加权项是 1,线要素的加权项是长度,而面要素的加权项是面积。地图图层可用于定义输入要素类。在使用带有选择内容的图层时,分析只会包括所选的要素。对于面要素,几乎始终需要为行标准化参数选择 ROW。如果每个要素所具有的邻域数目由聚合方案或者采样过程决定,而不是反映您所分析的变量的实际空间分布,则行标准化将减少偏移。如果未给定开始距离,则默认值为最小距离,在该距离处,数据集中的每个要素至少具有一个相邻要素。如果您的数据集中存在位置异常值,那么此距离可能不是最合适的开始距离。如果未给定增量距离,则使用平均最近邻距离或 (Td - B) / I(其中 Td 为最大阈值距离,B 为开始距离,I 为距离段数量)二者当中的较小者。该算法可确保始终根据指定的距离段数量来执行计算,确保最大距离段不会过大以致一些要素以所有其它要素或几乎所有其它要素作为其相邻要素。如果指定的开始距离和/或增量距离所生成的距离段大于最大阈值距离,增量距离将自动减小。为避免该调整,可以减小指定的增量距离和/或距离段数量。运行此工具时,可能会发生内存不足的情况。这种情况通常发生在开始距离和/或增量距离导致要素具有很多相邻点时。您通常不会希望在具有上千个相邻要素的要素处创建空间关系。增量距离使用更小的值并临时移除位置异常值,以便以更小的开始距离值启动。即使您用工具计算开始距离与增量距离,大数据集的处理时间也可能比较长。您可以通过以下方式提高性能:临时移除位置异常值。不运行所有要素的分析,而是选择研究区的典型部分中的要素,然后只分析这些要素。从数据集中随机选择要素的样本,只分析这些样本要素。距离通常基于输出坐标系环境设置。输出坐标系环境的默认设置为“与输入相同”。进行分析之前将输入要素投影到输出坐标系。可选输出表将包含各迭代处的距离值、Moran I 指数值、预期 Moran I 指数值、方差、z 得分和 p 值。峰值为 z 得分值升高、然后降低处的值。例如,如果此工具查找到 50、100 和 150 米距离的 z 得分分别为:2.95、3.68 和 3.12,则峰值应为 100 米。可选输出报表文件以 PDF 文件格式创建,通过双击文件名可从结果窗口访问此文件。此工具将选择性地创建汇总结果的 PDF 报表。PDF 文件不会自动显示在目录窗口中。如果要在“目录”中显示 PDF 文件,可打开 ArcCatalog 应用程序,选择自定义菜单选项,单击 ArcCatalog 选项,然后选择文件类型选项卡。单击新建类型按钮,并指定 PDF 作为文件扩展名,如下图所示。1.3.3语法参数说明数据类型Input_Features要对一系列距离进行测量的空间自相关的要素类。Feature LayerInput_Field用于评估空间自相关的数值字段。FieldNumber_of_Distance_Bands针对空间自相关而递增邻域大小和分析数据集的次数。分别在Beginning_Distance和Distance_Increment参数中指定的增量的起点和大小。LongBeginning_Distance(可选)开始空间自相关分析的距离和开始增量的距离。为此参数输入的值应使用“输出坐标系”环境设置的单位。DoubleDistance_Increment(可选)每次迭代后要增加的距离。分析中使用的距离于Beginning_Distance处开始,以Distance_Increment中指定的数量增加。为此参数输入的值应使用“输出坐标系”环境设置的单位。DoubleDistance_Method(可选)指定计算每个要素与邻近要素之间的距离的方式。 EUCLIDEAN 两点间的直线距离(笔直地) MANHATTAN 沿垂直轴度量的两点间的距离(城市街区);计算方法是对两点的 x 和 y 坐标的差值(绝对值)求和。StringRow_Standardization(可选) NONE 不对空间权重执行标准化。 ROW 对空间权重执行标准化;每个权重都会除以行的和(所有相邻要素的权重和)。BooleanOutput_Table(可选)要创建的表格包含各距离范围和相关 z 得分结果。TableOutput_Report_File(可选)要创建的 PDF 文件包含汇总结果的折线图。File1.4 多距离空间聚类分析(Ripleys K函数)1.4.1 简介确定要素(或与要素相关联的值)是否显示某一距离范围内统计意义显著的聚类或离散。基于 Ripleys K 函数的多距离空间聚类分析工具是另外一种分析事件点数据的空间模式的方法。该方法不同于此工具集中其他方法(空间自相关和热点分析)的特征是可对一定距离范围内的空间相关性(要素聚类或要素扩散)进行汇总。在许多要素模式分析研究中,都需要选择适当的分析比例。例如,该分析通常需要距离范围或距离阈值。在多个距离和空间比例下研究空间模式时,模式会发生变化,而这通常可反映对运行中的特定空间过程的控制。Ripleys K 函数可表明要素质心的空间聚集或空间扩散在邻域大小发生变化时是如何变化的。使用此工具时,需要指定要计算的距离个数,同时也可选择指定起始距离和/或距离增量。该工具可利用此信息计算与每个要素关联的相邻要素的平均数量;相邻要素是指小于计算距离的要素。随着计算距离的增大,各要素所具有的相邻要素数通常会越多。如果某个特定计算距离的平均相邻要素数高于/大于整个研究区域内要素的平均密度,该距离的分布方式将被视为聚类分布。如果有兴趣研究要素的聚类/扩散如何相对于不同距离(不同的分析规模)进行变化,您可以使用此工具。Measure of spatial clustering/dispersion over a range of distances.1.4.2用法此工具需要投影数据来准确测量距离。工具输出是一个包含以下字段的表:ExpectedK和ObservedK分别包含 K 预期值和 K 观测值。由于应用了L(d) 变换,因此ExpectedK值始终与距离值相匹配。DiffK字段包含 K 观测值与 K 预期值的差值。如果指定了置信区间选项,则附加字段LwConfEnv和HiConfEnv也将包含在输出表中。这些字段包含工具的每个迭代(由距离段数量参数指定)的置信区间信息。K 函数还可以创建图层汇总结果。如果特定距离的 K 观测值大于 K 预期值,则与该距离(分析尺度)的随机分布相比,该分布的聚类程度更高。如果 K 观测值小于 K 预期值,则与该距离的随机分布相比,该分布的离散程度更高。如果 K 观测值大于HiConfEnv值,则该距离的空间聚类具有统计显著性。如果 K 观测值小于LwConfEnv值,则该距离的空间离散具有统计显著性。有关解释的其他信息,请参考多距离空间聚类分析(Ripleys K 函数)的工作原理。启用以图形方式显示结果参数可以创建汇总工具结果的折线图。预期结果以蓝线表示,而观测结果则以红线表示。观测线在预期线之上表明数据集在该距离内表现为聚类。观测线在预期线之下表明数据集在该距离内表现为离散。折线图以图层方式创建。这些图层是临时图层,会在关闭 ArcMap 时被删除。如果您右键单击该图层并选择保存,则该图表会被写入到“图表文件”。如果在保存图表后保存地图文档,则此图表文件的链接会通过 .mxd 保存。有关图表文件的详细信息,请参阅浏览和显示包含图表的数据。对于线和面要素,距离计算中会使用要素的质心。对于多点、折线或由多部件组成的面,将会使用所有要素部件的加权平均中心来计算质心。点要素的加权项是 1,线要素的加权项是长度,而面要素的加权项是面积。权重字段在表示事故点数或计数时最为适用。如果未指定权重字段,则最大DiffK值将告诉您促进空间聚类的过程最明显的距离。下面将介绍如何计算置信区间:无权重字段如果未指定权重字段,则可通过在研究区域中随机分布点并计算该分布的L(d)来构建置信区间。点的每个随机分布称为一个“排列”。例如,如果选择了99_PERMUTATIONS,则在每次迭代时,该工具均会将一组点随机分布 99 次。将这些点分布 99 次之后,该工具会对每个距离选择相对 k 观察值向上和向下偏离最大的 k 值;这些值将成为置信区间。包含一个权重字段指定权重字段时,仅会对权重值进行随机重新分配来计算置信区间。点位置则保持固定。其实,指定“权重字段”时,位置会保持固定,并且该工具会评估空间中要素值的聚类。但如果未指定“权重字段”,则工具将分析要素位置的聚类/离散。因为置信区间通过随机排列构建,所以定义置信区间的值将随着不同的随机排列而改变,甚至当参数相同时也是如此。但是,对于随机数生成器地理处理环境来说,如果设置一个种子值,重复分析将产生一致的结果。为计算置信区间参数选择的排列数可以不受限制地转换为置信度:9 表示 90%,99 表示 99%,999 表示 99.9%。如果未指定研究区域,此工具会使用最小外接矩形作为研究区域面。与范围不同,最小外接矩形不一定必须与 x 轴和 y 轴对齐。K 函数统计对研究区域的大小非常敏感。根据点所在研究区域大小的不同,相同的点排列可以表现为聚类或离散。因此,认真考虑研究区域的边界非常有必要。下图是关于相同要素分布如何根据指定的研究区域进行分散或聚类的一个典型示例。如果研究区域方法参数选择了USER_PROVIDED_STUDY_AREA_FEATURE_CLASS,则研究区域要素类为必填项。如果指定了研究区域要素类,则应只具有一个单部分要素(研究区域面)。如果未指定开始距离或距离增量,则将基于输入要素类的范围计算默认值。K 函数对位于研究区域边界附近的要素具有统计缺漏偏差。边界校正方法参数提供了解决这一偏差的方法。NONE不应用任何特定的边界校正。但是,落在用户指定的研究区域外的输入要素类中的点在相邻点计数中使用。如果您已从超大研究区域中收集数据但仅需分析数据集合边界内更小的区域,则此方法很适用。SIMULATE_OUTER_BOUNDARY_VALUES此方法在研究区域边界外创建边界内所发现点的镜像点,以便校正边附近的低估现象。将镜像与研究区域的边的最大距离范围相等的距离内的点。使用已镜像的点会使边点的相邻点估计更加精确。下图说明哪些点用于计算以及哪些点仅用于边校正。REDUCE_ANALYSIS_AREA此边校正技术将分析区域的大小收缩一定的距离,此距离与将在分析中使用的最大距离范围相等。收缩研究区域后,仅在为仍处于研究区域内的点评估相邻点数目时,才会考虑新研究区域外发现的点。K 函数计算期间,不会以任何其他方式使用这些点。下图说明哪些点用于计算以及哪些点仅用于边校正。RIPLEYS_EDGE_CORRECTION_FORMULA此方法检查每个点与研究区域的边的距离以及这个点到其各相邻点的距离。如果有的相邻点与所涉及点的距离比与研究区域的边的距离更远,则所有这类相邻点都将被指定额外权重。此边校正方法仅适用于形状为正方形或矩形的研究区域,或者当为研究区域方法参数选择MINIMUM_ENCLOSING_RECTANGLE时才适用。如果未应用边界校正,则统计缺漏偏差会随分析距离的增加而增加。如果启用以图形方式显示结果参数,您将注意到 ObservedK 线会在距离较大时下降。从数学上说,“多距离空间聚类分析”工具使用 Ripleys k 函数的常用变换,其中带有随机点集的预期结果与输入距离相等。变换 L(d) 显示如下。其中 A 表示区域,N 表示点数,d 表示距离而 k(i, j) 表示权重,当 i 和 j 之间的距离小于或等于 d 时,权重为(如果无边界校正)1,当 i 和 j 之间的距离大于 d 时,权重为 0。应用边校正后,k(i, j) 的权重略有变化。地图图层可用于定义输入要素类。在使用带有选择内容的图层时,分析只会包括所选的要素。1.4.3语法参数说明数据类型Input_Feature_Class要对其执行分析的要素类。Feature LayerOutput_Table将要写入分析结果的表。TableNumber_of_Distance_Bands针对聚类而递增邻域大小和分析数据集的次数。分别在Beginning_Distance和Distance_Increment参数中指定的增量的起点和大小。LongCompute_Confidence_Envelope(可选)置信区间通过将要素点(或要素值)随机放在研究区域中计算。随机放置的点/值的数量与要素类中的点的数量相同。每组随机放置都称为“排列”,置信区间就通过这些排列创建。此参数用于选择要使用多少排列来创建置信区间。 0_PERMUTATIONS_-_NO_CONFIDENCE_ENVELOPE 不创建置信区间。 9_PERMUTATIONS 随机放置了 9 组点/值。 99_PERMUTATIONS 随机放置了 99 组点/值。 999_PERMUTATIONS 随机放置了 999 组点/值。StringDisplay_Results_Graphically(可选)指定工具是否将创建图层汇总结果。 NO_DISPLAY 不会创建图形汇总(默认值)。 DISPLAY_IT 图形汇总将以图层形式创建。BooleanWeight_Field(可选)数字字段,包含代表每个位置的要素/事件数量的权重。FieldBeginning_Distance(可选)开始聚类分析的距离及开始增量的距离。为此参数输入的值应使用“输出坐标系”的单位。DoubleDistance_Increment(可选)每次迭代过程中要递增的距离。分析中使用的距离于Beginning_Distance处开始,以Distance_Increment中指定的数量增加。为此参数输入的值应使用“输出坐标系”环境设置的单位。DoubleBoundary_Correction_Method(可选)对于研究区域的边附近要素的相邻点数低估情况进行校正所采用的方法。 NONE 不应用边校正。但是,如果输入要素类已有点落在研究区域边界之外,则这些点将用于边界附近要素的邻域计数。 SIMULATE_OUTER_BOUNDARY_VALUES 此方法模拟研究区域外的点,以便边附近的相邻点数不被低估。所模拟点是研究区域边界内边附近的点“镜像”。 REDUCE_ANALYSIS_AREA 此方法收缩研究区域,以便某些点可在研究区域边界外被发现。在研究区域外发现的点用于计算相邻点数目,但不可用于聚类分析自身。 RIPLEY_EDGE_CORRECTION_FORMULA 对于点 i 的邻域中的所有点 (j),此方法通过检查来了解是否研究区域的边离 i 更近,或者是否 j 离 i 更近。如果 j 更近,则将额外权重提供给点 j。此边校正方法仅适用于形状为方形或矩形的研究区域。StringStudy_Area_Method(可选)指定要用于研究区域的区域。K 函数对研究区域大小的变化很敏感,因此认真选择此值很重要。 MINIMUM_ENCLOSING_RECTANGLE 指示将使用封闭所有点的最小矩形。 USER_PROVIDED_STUDY_AREA_FEATURE_CLASS 指示定义研究区域的要素类将在“研究区域要素类”参数中提供。StringStudy_Area_Feature_Class(可选)描绘应在其中分析输入要素类的区域的要素类。仅在Study_Area_Method = USER_PROVIDED_STUDY_AREA_FEATURE_CLASS时指定。Featur1.5空间自相关(global morans I)1.5.1 简介根据要素位置和属性值使用 Global Morans I 统计量测量空间自相关性。空间自相关 (Global Morans I) 工具同时根据要素位置和要素值来度量空间自相关。在给定一组要素及相关属性的情况下,该工具评估所表达的模式是聚类模式、离散模式还是随机模式。该工具通过计算 Morans I 指数值、z 得分和 p 值来对该指数的显著性进行评估。p 值是根据已知分布的曲线得出的面积近似值(受检验统计量限制)。空间自相关 (Global Morans I)工具是一种推论统计,这意味着分析结果始终在零假设的情况下进行解释。对于 Global Morans I 统计量,零假设声明,所分析的属性在研究区域内的要素之间是随机分布的;换句话说,用于促进观察值模式的空间过程是随机的。假设您可以为所分析的属性选择值,然后使这些值随意落到要素上,从而让每个值落在可能的位置。此过程(选择并随意放置值)便是随机空间过程的示例。如果此工具返回的p 值具有统计学上的显著性,则可拒绝零假设。下表对结果的解释进行了汇总:p 值不具有统计学上的显著性。不能拒绝零假设。要素值的空间分布很有可能是随机空间过程的结果。观测到的要素值空间模式可能只是完全空间随机性 (CSR) 的众多可能结果之一。p 值具有统计学上的显著性,且 z 得分为正值。可以拒绝零假设。如果基础空间过程是随机的,则数据集中高值和/或低值的空间分布在空间上聚类的程度要高于预期。p 值具有统计学上的显著性,且 z 得分为负值。可以拒绝零假设。如果基础空间过程是随机的,则数据集中高值和低值的空间分布在空间上离散的程度要高于预期。离散空间模式通常会反映某种类型的竞争过程 - 具有高值的要素排斥具有高值的其他要素;类似地,具有低值的要素排斥具有低值的其他要素。1.5.2 用法空间自相关工具将返回五个值:Morans I 指数、预期指数、方差、z 得分及 p 值。您可通过结果窗口访问这些值,也可以将这些值作为派生输出值进行传递,以满足模型或脚本中的潜在使用需要。在给定一组要素及相关属性的情况下,该工具评估所表达的模式是聚类模式、离散模式还是随机模式。使用 z 得分或 p 值指示统计显著性时,如果 Morans I 指数值为正则指示聚类趋势,如果 Morans I 指数值为负则指示离散趋势。z 得分和 p 值是统计显著性的量度,用来判断是否拒绝零假设。对于此工具,零假设表示与要素相关的值随机分布。输入字段应包含多种值。此统计数学方法要求待分析的变量存在一定程度的变化;例如,如果所有输入都是 1 便无法求解。如果要使用此工具分析事件数据的空间模式,应考虑聚合事件数据。优化的热点分析还可以用来分析事件数据的空间模式。空间关系的概念化参数的选择应反映要分析的要素之间的固有关系。对要素在空间中彼此交互方式构建的模型越逼真,结果就越准确。这些建议在选择空间关系的概念化:最佳做法中进行了概述。以下是一些额外提示:FIXED_DISTANCE_BAND默认的距离范围或距离阈值将确保每个要素至少拥有一个相邻要素,这一点十分重要。但通常,此默认值并不是适用于分析的最合适的距离。为分析选择适合的比例(距离范围)的其他策略在选择固定距离范围值中进行了概括介绍。INVERSE_DISTANCE 或者INVERSE_DISTANCE_SQUARED如果为距离范围或阈值距离参数输入 0,则所有要素均被视为所有其他要素的相邻要素;如果将此参数留空,则将采用默认距离。如果距离权重小于 1,则对其取倒数时将变得不稳定。因此,对于分隔距离小于 1 单位的要素权重,权重值将指定为 1。对于反距离选项(INVERSE_DISTANCE、INVERSE_DISTANCE_SQUARED 或 ZONE_OF_INDIFFERENCE),为避免产生除数为零的情况,任何重合两点的权重值均将指定为 1。这样便可确保将要素包含在分析之内。空间关系的概念化参数的附加选项(包括空间-时间关系)在使用生成空间权重矩阵或者生成网络空间权重工具时可用。要利用这些附加选项,请使用上述任一工具构造空间的权重矩阵文件,然后进行分析;为空间关系的概念化参数选择 GET_SPATIAL_WEIGHTS_FROM_FILE,为权重矩阵文件参数指定您所创建的空间权重文件的路径。地图图层可用于定义输入要素类。在使用带有选择内容的图层时,分析只会包括所选的要素。如果提供的是一个带 .swm 扩展名的权重矩阵文件,则此工具需要输入的是一个使用生成空间权重矩阵或生成网络空间权重工具创建的空间权重矩阵文件;否则,此工具需要输入一个 ASCII 格式的空间权重矩阵文件。在某些情况下,工具行为将根据所使用的空间矩阵文件类型的不同而有所区别:ASCII 格式的空间权重矩阵文件:权重“按原样”使用。所缺失的要素与要素之间的关系被视为零。如果对权重进行了行标准化,则选择集的分析结果很可能不正确。如果需要对选择集运行分析,则通过以下方法将 ASCII 空间权重文件转换为 SWM 文件:将 ASCII 数据读入表,然后将 CONVERT_TABLE 选项与生成空间权重矩阵工具结合使用。SWM 格式的空间权重矩阵文件:如果对权重进行了行标准化,则会将其选择集重新标准化;否则,权重将“按原样”使用。1.5.4 语法参数说明数据类型Input_Feature_Class要计算空间自相关的要素类。Feature LayerInput_Field用于评估空间自相关的数值字段。FieldGenerate_Report(可选) NO_REPORT 不会创建图形汇总。这是默认设置。 GENERATE_REPORT 图形汇总将以 HTML 文件形式创建。BooleanConceptualization_of_Spatial_Relationships指定要素空间关系的定义方式。 INVERSE_DISTANCE 与远处的要素相比,附近的邻近要素对目标要素的计算的影响要大一些。 INVERSE_DISTANCE_SQUARED 与INVERSE_DISTANCE类似,但它的坡度更明显,因此影响下降得更快,并且只有目标要素的最近邻域会对要素的计算产生重大影响。 FIXED_DISTANCE_BAND 将对邻近要素环境中的每个要素进行分析。在指定临界距离 (Distance_Band_or_Threshold) 内的邻近要素将分配值为 1 的权重,并对目标要素的计算产生重大影响。在指定临界距离外的邻近要素将分配值为零的权重,并且不会对目标要素的计算产生任何影响。 ZONE_OF_INDIFFERENCE 在目标要素的指定临界距离 (Distance_Band_or_Threshold) 内的要素将分配值为 1 的权重,并且会影响目标要素的计算。一旦超出该临界距离,权重(以及邻近要素对目标要素计算的影响)就会随距离的增加而减小。 CONTIGUITY_EDGES_ONLY 只有共用边界或重叠的相邻面要素会影响目标面要素的计算。 CONTIGUITY_EDGES_CORNERS 共享边界、结点或重叠的面要素会影响目标面要素的计算。 GET_SPATIAL_WEIGHTS_FROM_FILE 将由指定空间权重文件定义空间关系。指向空间权重文件的路径由Weights_Matrix_File参数指定。StringDistance_Method指定计算每个要素与邻近要素之间的距离的方式。 EUCLIDEAN_DISTANCE 两点间的直线距离(笔直地) MANHATTAN_DISTANCE 沿垂直轴度量的两点间的距离(城市街区);计算方法是对两点的 x 和 y 坐标的差值(绝对值)求和。StringStandardization当要素的分布由于采样设计或施加的聚合方案而可能偏离时,建议使用行标准化。 NONE 不对空间权重执行标准化。 ROW 对空间权重执行标准化;每个权重都会除以行的和(所有相邻要素的权重和)。StringDistance_Band_or_Threshold_Distance(可选)为“反距离”和“固定距离”选项指定中断距离。将在对目标要素的分析中忽略为该要素指定的中断之外的要素。但是,对于ZONE_OF_INDIFFERENCE,指定距离之外的要素的影响会随距离的减小而变弱,而在距离阈值之内的影响则被视为是等同的。输入的距离值应该与输出坐标系的值匹配。对于空间关系的反距离概念化,值为0表示未应用任何阈值距离;当将此参数留空时,将计算并应用默认阈值。此默认值为确保每个要素至少具有一个邻域的欧氏距离。当选择了面邻接(CONTIGUITY_EDGES_ONLY或CONTIGUITY_EDGES_CORNERS)或GET_SPATIAL_WEIGHTS_FROM_FILE的空间概念化时,该参数无效。DoubleWeights_Matrix_File(可选)包含权重(其定义要素间的空间关系以及可能的时态关系)的文件的路径。Fil2 “聚类分布制图”工具集
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 浙江农林大学《中国文化英文》2023-2024学年第一学期期末试卷
- 广东科技学院《视频设计》2023-2024学年第一学期期末试卷
- 北京网络职业学院《科技英语写作》2023-2024学年第一学期期末试卷
- 山东中医药大学《力学1》2023-2024学年第一学期期末试卷
- 世界计划半周年活动方案
- 丘野烤肉公司优惠活动方案
- 业主落地活动方案
- 业务招待活动方案
- 大学团员活动方案
- 大学环境活动方案
- 2009-2022历年河北省公安厅高速交警总队招聘考试真题含答案2022-2023上岸必备带详解版4
- 六年级信息技术下册《走进人工智能》优质课获奖课件
- 工程开工报告表
- 劳动法课件(完整版)
- 营运车辆智能视频监控系统管理制度范本及动态监控管理制度
- 完整版:美制螺纹尺寸对照表(牙数、牙高、螺距、小径、中径外径、钻孔)
- 偏头痛PPT课件(PPT 43页)
- (完整版)入河排污口设置论证基本要求
- 10kV架空线路施工方案
- 2022年人教版小学数学一年级下册期中测试卷二(含答案)
- 关于恒温恒湿项目装修方案及装修细部做法
评论
0/150
提交评论