10空间统计分析(1)_第1页
10空间统计分析(1)_第2页
10空间统计分析(1)_第3页
10空间统计分析(1)_第4页
10空间统计分析(1)_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第10章 空间统计分析,城乡规划与园林学院,空间统计分析,即空间数据的统计分析,通过空间位置建立数据间的统计关系。,空间统计分析含义:“空间数据的统计分析”“数据的空间统计分析”,着重于空间物体和现象的非空间特性的统计分析,研究如何以数学统计模型来描述和模拟空间现象和过程。,直接从空间物体的空间位置、联系等方面出发,研究既具有随机性和结构性,或具有空间相关性和依赖性的自然现象。,1. 空间统计学产生的原因?,大多数经典统计学分析要求样本相互独立,而空间数据间并非完全独立,而是存在依赖性。,2 空间统计分析的目的?,描述事物在空间上的分布特征(随机的、聚集的或规则的)。 分析数据的空间自相关性,

2、空间自相关性对空间格局的影响,如何利用这种关系构建模型,本章主要内容:,一 基本统计量 二 探索性数据分析 三 分级统计分析 四 空间插值 五 空间回归分析,一 基本统计量,基 本 统 计 量,本章主要内容:,一 基本统计量 二 探索性数据分析 三 分级统计分析 四 空间插值 五 空间回归分析,二 探索性数据分析,对样本数据性质的研究,没有先验的理论假设,通过对数据全面深入分析来了解其在空间分布、空间结构以及空间相互影响方面的特征。,Exploratory Data AnalysisEDA,(一)基本分析工具 (二)检验数据分布 (三)寻找数据离群值 (四)全局趋势分析 (五)空间自相关分析,

3、二 探索性数据分析,(一)基本分析工具,1 直方图 2 QQplot分布图 3 变异函数 4 Voronoi图,1 直方图,对采样数据按一定的分级方案进行分级,统计采样点落入各个级别中的个数,并通过条带图或柱状图表现出来。,2 QQplot分布图,(1) 正态QQPlot分布图,用来评估单变量样本数据是否服从正态分布。特点:如果采样数据服从正态分布,其正态QQplot分布图中采样点分布应该是一条直线。如果有个别采样点偏离直线太多,那么这些采样点可能是一些异常点,应对其进行检验。,河南省18个地级市2010年人均GDP Q-Q图,(2)普通QQPlot 分布图 (General QQPlot),

4、用来评估两个数据集的分布的相似性。它揭示了两个物体的相关关系,如果在普通QQplot分布图中呈直线,说明两物体呈一种线性关系,可以用一元一次方程来拟合。如果在普通QQplot分布图中呈抛物线,说明两物体的关系可以用二次多项式来拟合。,河南省18个地级市2010年人均GDP与第三产业比值 普通Q-Q图,3 变异函数,方差变异分析工具:半变异函数曲线图和协方差函数曲线反映了一个采样点与其相邻采样点的空间关系。他们对异常采样点具有很好的探测作用。,3 变异函数,h,r(h),基台C0+C,0,块金C0,变程,变异函数图,4 Voronoi图,由俄国数学家M.G.Voronoi 于1908年发现并以他

5、的名字命名的。 又称泰森多边形。,思考题:,中央电视台天气预报,那个省会城市的天气情况与你家乡最接近?,Voronoi图的定义:,平面n个离散点,把平面分成n个区,每个区包括一个点,该点所在的区是到该点距离最近的点的集合。,Voronoi图的特点:,1 组成多边形的边总是与两相邻样点的连线垂直; 2 多边形内的任意位置总是离该多边形内样点的距 离最近,离相邻多边形内样点距离远; 3 每个多边形内包含且仅包含一个样点。,(二)检验数据分布,在地统计分析中,克里格方法是建立在平稳假设的基础上,这种假设在一定程度上要求所有数据值具有相同的变异性。另外,一些克里格插值都假设数据服从正态分布。如果数据不

6、服从正态分布,需要进行一定的数据变换,从而使其服从正态分布。因此,检验数据分布特征,了解和认识数据具有非常重要的意义。,(三)寻找数据离群值,数据离群值分为全局离群值和局部离群值两大类。全局离群值是指对于数据集中所有点来讲,具有很高或很低的值的观测样点。局部离群值值对于整个数据集来讲,观测样点的值处于正常范围,但与其相邻测量点比较,它又偏高或偏低。,用直方图查找离群值,离群值在直方图上表现为孤立存在或被一群显著不同的值包围。,用半变异函数云图识别离群值,如果数据集中有一个异常高值的离群值,则与这个离群值形成的样点对,无论距离远近,在半变异/协方差函数云图中都具有很高的值。,用Voronoi图查

7、找局部离群值,熵(entropy) Voronoi图,聚类(cluster) Voronoi图,(四)全局趋势分析,空间趋势反映了空间物体在空间区域上变化的主体特征,它主要揭示了空间物体的总体规律,而忽略局部的变异。 趋势面分析是根据空间抽样数据,拟合一个数学曲面,用该数学曲面来反映空间分布的变化情况。,趋势分析透视图,(五)空间自相关分析,1 空间分布模式 2 空间权重矩阵 3 空间自相关系数,可以划分为聚集模式(clustered pattern)、分散模式(dispersed pattern)和随机模式(random pattern)三类。,聚集模式,分散模式,随机模式,1 空间分布模式

8、,真实世界中的大部分模式都介于随机与分散模式或随机与聚集模式之间,极少能遇到极端聚集、极端分散或极端随机的模式。,既然现实模式很难轻易归入聚集、分散或随机型,那么我们就要考虑某一给定的空间模式与这三种模式中的某一种到底有多接近?如果它接近其中的一种模式,那么这种接近到底是有偶然因素还是系统过程造成的?,我们在分析某变量的空间分布模式时,实际上是在测度空间自相关程度或者说空间依赖程度。,空间自相关是指属性值在空间上相关是由要素的地理位置造成的。,空间自相关是根据位置相似性和属性相似性的匹配情况来测度的。,位置的相似性可以通过空间接近性矩阵(或权重矩阵)W来描述; 属性的相似性一般通过交叉乘积xi

9、xj,或平方差异(xi-xj)2,或绝对差异xi-xj来描述。,基于“距离”的空间接近性测度就是使用面积单元之间的距离定义接进行。 如何测度任意两个面积单元之间的距离呢? 按照面积单元之间是否有邻接关系的邻接法; 基于面积单元中心距离的重心距离法。,2 空间权重矩阵(空间接近性矩阵),式中:Wij表示区域i与j的临近关系,它可以根据邻接标准或距离标准来度量。,假设研究区有n个多边形,任何两个多边形都存在一个空间关系,这样就有nn对关系,需要nn的矩阵存储这n个单元之间的空间关系。,(1) 简单的二进制邻接矩阵,车的行走方式,王、后的行走方式,(2) 基于距离的二进制空间权重矩阵,(1) Mor

10、ans I,设研究区域中存在n个面积单元,第i个单元上的观测值记为xi,观测变量在n个单元中的均值记为 ,Morans I定义为:,3 空间自相关系数,-1 I 1 1表示极强的正空间自相关,-1表示极强的负空间自相关。,对于Moran指数,可以用标准化统计量Z来检验n个区域是否存在空间自相关关系,Z的计算公式为: 当Z值为正且显著时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚; 当Z值为负且显著时,表明存在负的空间自相关,相似的观测值趋于分散分布; 当Z值为零时,观测值呈独立随机分布。,(2) Geary 系数C,基于相关位置间的数字差分:,0 C 2 C1表示负

11、相关, C=1表示不相关, C1表示正相关。,本章主要内容:,一 基本统计量 二 探索性数据分析 三 分级统计分析 四 空间插值 五 空间回归分析,三 分级统计分析,把数据划分成不同的级别,体现数据自身的特征,为应用研究及专题制图提供基础。,(一)分级的概念与目的 (二)分级的原则 (三)分级统计的方法,三 分级统计分析,(一) 分级的概念与目的,概念: 根据一定的方法或标准把数据分成不同的级别。 目的: 区分数据集中个体的差别。,(二) 分级的原则,科学性原则 完整性原则 适用性原则 美观性原则,(三)分级统计的方法,单一分级法和复合分级法 等值分级法和不等值分级法 自定义分级法和模式分级法

12、,1 自定义分级根据自己的应用目的设定各个级别的数值范围来实现分级的方法。,不同分级体系下坡度的分级结果,2 模式分级,(1)等间距分级 (2)分位数分级 (3)等面积分级 (4)标准差分级 (5)自然裂点法分级 (6)其他分级方法,按固定模式进行分级,级差由特定的算法自动设定。,(1)等间距分级,按某个恒定间隔来对数据进行分级。 间距D=(最大值-最小值)分级数,等间距分级结果,(2)分位数分级,把数列划分为相等个数的分段。 先将数列按大小排列,从一端开始计算其分位数,把处于分位数上的那个值作为分级值。 分位数分级可以使每一级别的数据个数接近一致,往往能产生较好的制图效果。,分位数分级结果,

13、(3)等面积分级,等面积分级结果,(4)标准差分级,标准差可以反映各数据间的离散程度。 首先要保证数据的分布具有正态分布的规律,才可计算平均值和标准差,然后根据数据波动情况划分等级。,1倍标准差分级结果,1/2倍标准差分级结果,(5)自然裂点法分级,基于让各级别中的变异总和达到最小的原则来选择分级断点的。 任何统计数列都存在一些自然转折点、特征点,用这些点可以把研究的对象分成性质相似的群组。,自然裂点法分级结果,(6)其他分级方法,有规律的不等间距分级 按嵌套平均值分级 按面积正态分布分级,本章主要内容:,一 基本统计量 二 探索性数据分析 三 分级统计分析 四 空间插值 五 空间回归分析,四

14、 空间插值,由点面,涉及到3方面问题:, 内插点邻域范围的确定 权值确定方法 内插函数的选择,四 空间插值,(一)整体内插 (二)局部分块内插 (三)逐点内插法,(一)整体内插,整个区域用一个数学函数来表达变量的空间变化特征。,河南省人均GDP分布1-4次趋势面,整体内插法,若选取采样点个数较少时,不足以描述整个变量变化特征,若选用较多的采样点则内插函数易出现振荡现象,很难获得稳定解。,(二)局部分块内插,基于的思想:分而治之,分块单元常用的内插数函数,1 线性内插 2 双线性内插 3 样条函数 4 克里格插值法,分块内插,能够较好地保留变量变化细节,并通过块间一定重叠范围保持内插曲面的连续性。分块内插方法的一个主要问题是分块大小的确定。,(三)逐点内插法,逐点内插法:以内插点为中心,确定一个邻域范围,用落在邻域范围内的采样点计算内插点的; 逐点内插本质上是局部内插,但与局部分块内插有所不同; 逐点内插法的邻域范围大小、形状、位置乃至采样点个数随内插点的位置而变动,又称为移动曲面法。,逐点内插法的基本步骤为:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论