版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章空间数据分析E_mail:dr_zheng76213@163.com郑泽忠Ph.D空间对象的特征值空间关系分析空间查询空间统计分析空间插值空间数据挖掘本章提要第七章空间数据分析作业几何形态空间分布空间对象的特征值返回长度曲率面积形状坡度和坡向剖面积几何形态back长度矢量数据:长度栅格数据:back2反映的是曲线局部的弯曲特征,其含义是曲线切线方向角相对于弧长的转动率。曲率曲率的含义:曲率曲率的计算公式:曲率事故多发路段,请谨慎驾驶!back2在矢量结构下,面状地物是以其轮廓边界弧段构成的多边形表示的。面积(0,0)xy面积(0,0)xyback2形状面状地物的形状量测主要是从空间完整性和外观描述两个方面进行。Eu=4-(1-1)=4Eu=4-(2-1)=3Eu=5-(3-1)=3形状不规则面状地物外观描述从多个角度运用多种指标进行。大多数指标是基于面积和周长的,常用的指标包括形状系数(r)等。形状back2坡度和坡向坡度的含义:坡面的垂直高度(h)和水平宽度(l)的比叫做坡度。hl坡度和坡向坡向的含义:坡面法线在水平面上的投影的方向。
hlback2剖面积剖面积的计算公式:根据工程设计的线路,计算地形剖面与DEM各格网边交点pi(xi,yi,zi)。back2空间分布空间分布类型分布密度质心点模式网络测度指标空间分布类型分布区域点线面离散连续离散连续离散连续线江河里的船只,公路上的汽车,路旁分布的加油站街道两旁的林荫树河流上的防护堤坝,城市街道的林荫道
面城镇的分布,火山的分布降水河网,交通网,地图上的边界线污染的扩散大气运动湖泊的分布,居民区中楼房的分布人口普查区域,行政区划空间分布分布密度的含义:指单位分布区域内的分布对象的数量。例:1.某地区汽车加油站的密度=加油站数/总公里路程2.某地区森林覆盖率=森林面积/地区总面积3.某省人口密度=人口数/该省总面积空间分布质心的含义:质心可概略表示分布总体的位置,是目标保持均匀分布的平衡点,可通过对目标坐标值加权平均求得。计算公式:空间分布其中:xi,yi为i个离散点的坐标
n为目标个数点模式:点模式的空间分布是一种比较常见的状态,如不同区域内的人口、房屋、城市分布,油田区的油井分布等。通常,点模式的描述参数有分布密度、分布中心、分布轴线、离散度等。
均匀分布随机分布聚集分布三种点模式空间分布点群类型指标:样方的统计量x2均一点模式是根据均一的子区域之间的关系定义的,这种子区域称为较大区域的样方。如果每个均一的样方包含相同数量的点对象,则整个研究区分布具有均一性,这种检验分布性的标准型方法称为样方分析,其公式表示为空间分布Q——每个样方中实际观测到的点数;E——每个样方中期望的分布值。最近邻指数R含义:点群类型指标:空间分布R为点群的平均最邻近距离与随机分布平均距离之比。n为样方数,A为研究区的面积。如果R=l,则点群的分布是标准的泊松分布;如果R<l,R越小,则点群越趋近聚集分布;如果R=0,所有点集中在一个位置上,点之间的距离为零;如果R>l,R越大,则点群越趋近均匀分布。网络测度指标:对于任何一个网络图,都存在着三种共同的基础指标:①连线(边或弧)数目m;
②结点(顶点)数目n;
③网络中,亚网图的数目p。由它们可以产生如下几个更为一般性的测度指标:空间分布β指数α指数γ指数(1)β指数含义:β指数——线点率,是网络内每一个节点的平均连线数目。网络测度指标:空间分布
β=0,表示无网络存在;网络的复杂性增加,则β值也增大。(2)a
指数含义:空间分布网络测度指标:实际回路数与网络内可能存在的最大回路数之间的比率。网络内可能存在的最大回路数目为连线的最大可能数目减去最低限度连接的连线数目,即所以,
a
指数为a指数的变化范围,一般介于[0,1]区间,a=0意味着网络中不存在回路;
a=1,说明网络中已达到最大限度的回路数目.(3)γ指数含义:空间分布网络测度指标:γ=m/3(n-2p)γ指数是测度网络连通性的一种度量指标,其数值变化范围为0≤γ≤1。γ=0表示网络内无连线,只有孤立点存在;γ=1表示网络内每一个结点都存在与其他所有结点相连的连线。γ指数及其倒数也被称为连通度指数。γ指数是网络内连线的实际观察数与连线可能存在的最大数目之间的比率,即back1邻近度分析
2网络分析
3叠置分析空间关系返回邻近度(Proximity)描述了地理空间中两个地物距离相近的程度,其确定是空间分析的一个重要手段。邻近度分析邻近度(Proximity)含义:交通沿线或河流沿线的地物有其独特的重要性,公共设施的服务半径,大型水库建设引起的搬迁,铁路、公路以及航运河道对其所穿过区域经济的发展的重要性等,均是一个邻近度问题。距离缓冲区分析泰森多边形分析邻近度分析邻近度(Proximity)包括:距离“距离”含义:人们日常生活中经常涉及到的概念,它描述了两个事物或实体之间的远近程度。当k=2时,就是欧氏距离计算公式。当k=1时,得到的距离称为曼哈顿距离。“距离”:距离是指为了识别某一地理实体或空间物体对其周围地物的影响度而在其周围建立的具有一定宽度的带状区域。所谓缓冲区(buffer)就是在点、线、面等空间实体周围建立的一定宽度的多边形,可以用来分析地理空间目标的影响范围或服务范围。缓冲区(buffer)含义:缓冲区分析是对一组或一类地物按缓冲的距离条件,建立缓冲区多边形,然后将这一图层与需要进行缓冲区分析的图层进行叠加分析,得到所需结果的一种空间分析方法。缓冲区分析含义:缓冲区分析道路中心线按道路中心线100米生成缓冲区缓冲区分析缓冲区分析缓冲区分析的基本思想:从数学的角度看,缓冲区分析的基本思想是给定一个空间对象或集合,确定它们的邻域,邻域的大小由邻域半径R决定。因此对象Oi的缓冲区定义为:对象集合:缓冲区分析(*)缓冲区计算的基本问题是双线问题。双线问题有很多另外的名称,如图形加粗,加宽线,中心线扩张等,它们指的都是相同的操作。1)角分线法(*)双线问题最简单的方法是角分线法(简单平行线法)。
缓冲区分析2)凸角圆弧法(*)在轴线首尾点处,作轴线的垂线并按双线和缓冲区半径截出左右边线起止点;在轴线其它转折点处,首先判断该点的凸凹性,在凸侧用圆弧弥合,在凹侧则用前后两邻边平行线的交点生成对应顶点。这样外角以圆弧连接,内角直接连接,线段端点以半圆封闭。邻域半径R即缓冲距离(宽度),是缓冲区分析的主要数量指标,可以是常数或变量。(b)环状缓冲区干流支流(a)不同宽度缓冲区缓冲区分析栅格数据缓冲区的建立方法(*)缓冲区分析栅格数据的缓冲区分析通常称为推移或扩散(Spread),推移或扩散实际上是模拟主体对邻近对象的作用过程,物体在主体的作用下沿着一定的阻力表面移动或扩散,距离主体越远所受到的作用力越弱。back网络分析含义(*):网络分析通过研究网络的状态以及模拟和分析资源在网络上的流动和分配情况,对网络结构及其资源等的优化问题进行研究的一种空间分析方法。网络分析的理论基础是图论和运筹学。是指由点集合V和V中点与点之间的连线的集合E构成的二元组(V,E)。V中的元素称为结点,E
中的元素称为边。网络分析图论中的“图”含义:图论中所研究的图是由实际问题抽象出来的逻辑关系图,图中点和线的位置与曲直无关紧要,点的多少和每条线是连接哪些点才是关键。图的结构ABCDe3e4e5e1e2e6e7网络分析图论中的“图”
:两个端点重合的边称为环。如果有两条边的端点是同一对顶点,则称这两条边为(多)重边。既没有环也没有重边的图,称为简单图。如果图中的边是有向的,则称为有向图,其中的边叫做弧。在无向图中,首尾相接的一串边的集合叫做路。如果一个图中,任意两个结点之间都存在一个路,则称之为连通图。起点和终点为同一个结点的路称为回路(或圈)。如果一个连通图中不存在任何回路,则称为树。任意一个连通图,去掉一些边后形成的树叫做连通图的生成树。网络分析图论中的“图”
:给定一个图,图中的每一条边赋以一个实数,称这种数为边的权数,称这种图为赋权图。赋以权数的有向图称为赋权有向图,也可称之为网络。V2V0V1100V3V5V46020301010505带权的有向图网络分析图论中的“图”:关联矩阵中,每行对应图的一个节点,每列对应图的一条弧。如果一个节点是一条弧的起点,则关联矩阵中对应的元素为1;如果一个节点是一条弧的终点,则关联矩阵中对应的元素为–1;如果一个节点与一条弧不关联,则关联矩阵中对应的元素为0。网络分析关联矩阵与邻接矩阵:24(a)有向图153有向图及其关联矩阵1-100010-100010-100-110000-1100001-100-101000-11(b)关联矩阵abcdefghbdchefga邻接矩阵用来表示图中任意两点间的邻接关系及其权值。如果两点间有一条弧,则邻接矩阵中对应的元素为1;否则为0(也可用∞表示两点间无任何连接关系),邻接矩阵为对称矩阵。对于加权图的邻接矩阵表示,一条弧所对应的元素不再是1,而是相应的权值。24(a)有向图153(b)邻接矩阵0110010110110110110100110有向图及其邻接矩阵网络分析关联矩阵与邻接矩阵:最佳路径分析也称最优路径分析,以最短路径分析为主。这里“最佳”包含很多含义,不仅指一般地理意义上的距离最短,还可以是成本最少、耗费时间最短、资源流量(容量)最大、线路利用率最高等标准。无论判断标准和实际问题中的约束条件如何变化,其核心实现方法都是最短路径算法。网络分析最短路径分析:Dijkstra算法:网络分析最短路径分析:Dijkstra算法是比较经典和有效的求解最短路径问题的方法。这个方法的一个突出优点是,它不仅求出了起点到终点的最短路径及其长度,而且求出了起点到图中其他各个顶点的最短路径及其长度。网络分析最短路径分析:1)用带权的邻接矩阵cost来表示带权的n个结点的有向图,cost[i,j]表示弧<vi,vj>的权值,如果从vi到vj不连通,则cost[i,j]=∞。Dijkstra算法描述:网络分析最短路径分析:Dijkstra算法描述:然后,引进一个辅助向量Dist,每个分量Dist[i]表示从起始点到每个终点vi的最短路径长度。假定起始点在有向图中的序号为i0,并设定该向量的初始值为:Dist[i]=Cost[i0,i] vi∈V。网络分析最短路径分析:Dijkstra算法描述:令S为已经找到的从起点出发的最短路径的终点的集合。2)选择Vj,使得Dist[j]=Min{Dist[i]|Vi∈V-S}vi∈Vvj就是当前求得的一条从vi0出发的最短路径的终点,令S=S∪{vj}3)修改从vi0出发到集合V-S中任意一顶点vk的最短路径长度。如果Dist[j]+Cost[j,k]<Dist[k]则修改Dist[k]为:
Dist[k]=Dist[j]+Cost[j,k]网络分析最短路径分析:Dijkstra算法描述:4)重复第2、3步操作共n-1次,由此求得从vi0出发的到图上各个顶点的最短路径是依路径长度递增的序列。网络分析最短路径分析:Dijkstra算法描述:终点从源点V0到各终点的距离值和最短路径的求解过程V1∞∞∞∞∞V210(V0,V2)V3∞60(V0,V2,V3)50(V0,V4,V3)V430(V0,V4)30(v0,v4)V5100(V0,V5)100(v0,v5)90(V0,V4,V5)60(V0,V4,V3,V5)VjV2V4V3V5S﹛V0,V2﹜﹛V0,V2,V4﹜﹛V0,V2,V4,V3﹜﹛V0,V2,V4,V3,V5﹜V2V0V1100V3V5V46020301010505带权的有向图网络分析选址问题:中心点选址问题含义:中心点选址问题是使最佳选址位置所在的顶点与图中其他顶点之间的最大距离达到最小。网络分析选址问题:中位点选址问题含义:是使最佳选址位置所在的顶点到网络图中其他顶点的距离(亦可以是加权距离)总和达到最小。back叠置分析叠置分析含义:将同一地区、同一比例尺、同一数学基础、不同信息表达的两组或多组专题要素图层,进行叠置产生一个新数据层面的操作,其结果综合了原来两层或多层要素所具有的属性。叠置分析是非常有效的提取隐含信息的工具。按叠置分析中输入数据层的不同,矢量图层叠置又可以分为三种类型:叠置分析1)多边形叠置这个过程是将两层中的多边形要素叠置,产生输出层中的新多边形要素,同时它们的属性也将联系起来,以满足建立分析模型的需要。多边形叠置可以按Union、Intersect、Identity等不同运算方式进行。UNION(并集)INTERSECT(交集)IDENTITY
(叠和,并集被第一个输入层边界裁切后剩余部分)按叠置分析中输入数据层的不同,矢量图层叠置又可以分为三种类型:叠置分析1)多边形叠置叠置过程可分为几何求交和属性分配两步。几何求交的过程中间可能产生碎屑多边形(SliverPolygon),可以设定一定的模糊容限消除它;属性分配就是将输入的不同层属性传递给输出层。空间多边形叠置(UNION
并集)叠置分析空间多边形叠置(INTERSECT交集)叠置分析空间多边形叠置(IDENTITY交补集)叠置分析2)点与多边形叠置叠置分析点与多边形的叠加分析,实质是计算包含关系(包含分析),判断各个点的归属(落在哪个多边形内)。叠置的结果是为每点产生一个新的属性。例如,井位与规划区叠加,可找到包含每个井的区域。3)线与多边形叠置叠置分析线与多边形的叠置,是比较线上坐标与多边形坐标的关系,判断线是否落在多边形内。根据叠置的结果可以确定每条弧段落在哪个多边形内,可以查询指定多边形内指定线穿过的长度。4)栅格图层叠置叠置分析栅格数据的叠置分析主要是通过栅格数据之间的各种计算来进行的。这种基于数学运算的数据的叠置运算,在地理信息系统中称为地图代数。地图代数含义:4)栅格图层叠置叠置分析(1)基于常数对数据层面进行的代数运算;(2)基于数学变换对数据层面进行的数学变换(指数、对数、三角变换等);(3)多个数据层面的代数运算(加、减、乘、除、乘方等)和逻辑运算(与、或、非、异或等)。地图代数可分为3种不同的类型:4)栅格图层叠置叠置分析backABCD=A+B+CE=|A-B|F=D-E空间查询主要包括:图形查属性、属性查图形、图形与属性混合查询等。空间查询百度地图上查询电子科技大学清水河校区空间查询点查询含义:空间查询范围查询(区域查询,RegionalQuery)含义:是给定一个查询点,查询所有包含该点的空间对象。是给定一个查询多边形,查询所有与之相交的空间对象。当查询多边形是一个矩形时,也称为窗口查询(WindowQuery)。属性查询SQL查询GIS软件通常支持标准的SQL查询语言。标准SQL查询语言是Select需显示的属性项From属性表Where条件or条件and条件空间查询属性查询SQL查询空间查询返回空间统计分析,即空间数据(SpatialData)的统计分析,其核心就是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关,通过空间位置建立数据间的统计关系。空间统计分析空间统计分析含义:1相关分析2回归分析3主成分分析4判别分析5空间统计学1相关分析
空间要素之间的相关性分析的任务是揭示空间要素之间相互关系的密切程度。空间要素之间相互关系的密切程度的测定,主要是通过对各种相关系数的计算和检验来完成。空间统计分析
线性相关分析:研究两个变量间线性关系的程度。用相关系数r来描述。正相关:如果x,y变化的方向一致,如身高与体重的关系,r>0;一般地,·|r|>0.95存在显著性相关;·|r|≥0.8高度相关;·|r|<0.3关系极弱,认为不相关。
空间统计分析1相关分析
偏相关分析偏相关分析:研究两个变量之间的线性相关关系时,控制可能对其产生影响的变量。如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系。相关分析能够检验两个变量的相关程度,并通过相关系数的正负号判断相关的方向。空间统计分析2回归分析含义:回归分析(regressionanalysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。空间统计分析主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的地理数据矩阵:3主成分分析的基本原理:空间统计分析如何从这么多变量的数据中抓住地理事物的内在规律性呢?最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。如果记原来的变量指标为x1,x2,…,xp,它们的综合指标——新变量指标为z1,z2,…,zm(m≤p)。则空间统计分析3主成分分析的基本原理:这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xp的第一,第二,…,第m主成分。其中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。空间统计分析3主成分分析的基本原理:返回空间插值1边界内插方法2趋势面分析3泰森多边形方法4加权移动平均法5样条函数插值方法6克里金插值空间插值4加权移动平均法加权移动平均方法利用插值点周围样点的数值来计算插值点的数值。空间插值5样条函数插值方法样条函数是一类分段(片)光滑、并且在各段交接处也有一定光滑性的函数。空间插值前面介绍的几个插值方法对影响插值效果的一些敏感性问题仍没有得到很好的解决,例如趋势面分析的控制参数和距离倒数插值方法的权重对结果影响很大,这些问题包括:6克里金插值(1)需要计算平均值数据点的数目;(2)搜索数据点的邻域大小、方向和形状如何确定;(3)有没有比计算简单距离函数更好的估计权重系数的方法;(4)与插值有关的误差问题。空间插值普通克里金包括点克里金和块克里金方法。6克里金插值点克里金插值的公式与加权移动插值方法类似:与加权移动插值方法不同,它不是按一种固定的函数计算权重λi,而是按采样点数据的半方差图的统计分析原理计算λi。空间插值克里金点模型的插值与原始样本的容量有关,当样本少的情况下,采用简单的点常规克里金插值的内插结果图会出现明显的凹凸现象。6克里金插值点克里金插值缺点:块克里金插值优点:块克里金插值估算的方差结果常常小于点克里金插值,生成的平滑插值表面不会发生点模型的凹凸现象,最常用的用途是绘制等值线图。返回为什么要有空间数据仓库?空间数据挖掘面对空间数据堆积越来越庞大的环境,各级管理者和指挥人员需要从大量复杂的空间数据中获取各自权限内的决策信息,从而作出正确有效的判断和决策。从各级决策者的角度讲,空间数据处理的重点应该从传统的操作型扩展到空间数据的联机分析处理(On-LineAnalyticalProcessing,OLAP)或分析型(信息型)。什么是空间数据仓库?空间数据挖掘数据仓库的创始人W·H·Inmon曾经给数据仓库(DW)下过一个定义。空间数据仓库是面向主题的、集成的、随时间变化的、并且是非易失性的空间和非空间数据的集合,用于支持空间数据挖掘和空间数据有关的决策过程。空间数据仓库与空间数据库数据仓库(DW)数据库(DB)分析型数据环境操作型数据环境面向空间分析(主题),支持SDSS面向业务,日常事务处理集成的综合数据非集成或者集成程度很低,主要是明细数据历史数据(5-10年)主要关心当前数据定期加载,加载后极少更新实时更新数据驱动的开发周期需求驱动的开发周期空间数据挖掘什么是空间数据挖掘?或者称为“从空间数据库中发现知识”(knowledgediscoveryfromSpatialDatabase),是指从空间数据库中提取隐含的、用户感兴趣的空间或非空间的模式和普遍特征的过程。空间数据挖掘空间数据挖掘与知识发现的关系DataCleaningDataIntegrationDatabasesDataWarehouseKnowledgeTask-relevantDataSelectionDataMiningPatternEvaluation空间数据挖掘空间数据挖掘与OLAP的关系一种观点,认为OLAP和数据挖掘是不交的。OLAP是数据汇总/聚集工具,它帮助简化数据分析;而数据挖掘自动发现隐藏在大量数据中的隐含模式和有趣知识。OLAP工具的目标是简化和支持交互数据分析,而数据挖掘的目标是尽可能自动处理,尽管允许用户指导这一过程。空间数据挖掘空间数据挖掘与OLAP的关系另一种更广泛的观点可能被接受:数据挖掘包含数据描述和数据建模。由于OLAP系统可以提供数据仓库中数据的一般描述,OLAP的功能基本上是用户指挥的汇总和比较。这些尽管有限,但都是数据挖掘功能。同样根据这种观点,数据挖掘要比简单的OLAP操作宽得多,因为它不仅执行数据汇总和比较,而且执行关联,分类,预测,聚类,时间序列分析和其他数据分析任务。空间数据挖掘空间数据挖掘的方法具体方法:1.空间分析方法2.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026福建船政交通职业学院招聘总量控制高层次人才16人笔试参考题库及答案解析
- 2026年体育设施行业分析报告及未来发展趋势报告
- 2026广东中山市博爱小学教师招聘1人备考题库及答案详解(夺冠系列)
- 2026江苏盐城市大丰兴丰工程建设有限公司招聘劳务派遣人员1人备考题库附答案详解(培优b卷)
- 2026年亳州市利辛县县直公立医院公开招聘硕士研究生22名考试参考题库及答案解析
- 2026四川眉山心脑血管病医院护理人员招聘8人备考题库含答案详解(突破训练)
- 2026年浙医健衢州医院招聘康复治疗师1人考试模拟试题及答案解析
- 2026年晶体管行业分析报告及未来发展趋势报告
- 2026中国海峡人才市场漳州工作部实习生招聘考试备考试题及答案解析
- 2026年5月重庆市万州区就业和人才中心公益性岗位招聘1人笔试参考题库及答案解析
- JJF 2384-2026机动车GNSS测速仪校准规范
- 2026年机关行政处罚法应知应会知识题库
- 2026年体育类教师招聘考试冲刺试卷
- 市委办文稿工作制度
- 基层应急管理制度上墙(3篇)
- 基金从业资格考试科目一基金法律法规、职业道德与业务规范完美无错字修订版
- 2026年广东广州市高三一模高考政治试卷试题(含答案详解)
- 火电行业环境保护培训课件
- 宁波银行人才库题库
- 《化工单元操作技术》课件-换热器结构与组成
- 北森测评题库及答案2026
评论
0/150
提交评论