




已阅读5页,还剩180页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章空间数据分析 空间数据分析 也称空间分析 是分析空间数据的技术的通称空间数据的空间特征分析 从空间对象的形态 位置 关系等角度去分析空间数据 从中获取空间信息和规律属性特征分析 着重研究空间对象的属性特征 点线面 一 空间对象的特征值 一 几何形态 点 线 面 体4类空间对象各自具有不同的几何形态 可以用评价指标来衡量 点 坐标 高程 或其他要素值 线 长度 方向 曲率面 面积 形状 边界长度 朝向体 体积 坡度 坡向 剖面 1 长度 矢量数据 点对坐标 x y 或 x y z 的序列在不考虑比例尺的情况下 线长度的计算公式为 栅格数据 线状地物的长度就是累加地物骨架线通过的格网数目 骨架线采用8方向连接 当连接方向为对角线方向时 还要乘以 2 曲率 曲率 就是针对曲线上某个点的切线方向角对弧长的转动率 通过微分来定义 表明曲线偏离直线的程度 数学上表明曲线在某一点的弯曲程度的数值 曲率越大 表示曲线的弯曲程度越大 曲率的倒数就是曲率半径 3 面积 矢量数据 面状地物是以其轮毂边界弧段构成的多边形表示的 对于没有空洞的简单多边形 设面状物体的轮廓边界由一个点的序列P1 x1 y1 P2 x2 y2 Pn xn yn 表示 其面积为 S S1 S2 有环岛的面状地物面积计算 面积 4 形状 目标物的外观是多变的 很难找到一个准确的量对其进行描述 基本考虑 空间完整性 多边形形状特征 当把城市作为单个面状目标看待时 可以直接使用面状目标的形状系数 如形状率 圆形率 紧凑度等 这些指标计算较简单 但只反映一个抽象的形状 当把城市作为面状目标的集合看待时 可以使用放射状指数 标准面积指数等形状系数 这些指标计算较复杂 但反映了城市内部的具体联系 在多数指标中 都以圆形作为城市的标准形状 形状比 A L2其中 A为区域面积 L为区域最长轴的长度 该指标能反映城市的带状特征 城市的带状特征越明显则形状比越小 显然 如果城市为狭长带状分布 其长轴两端的联系是不便捷的 1 形状比 FORMRATIO 伸延率 L L 式中 L为区域最长轴长度 L 为区域最短轴长度 该指标反映城市的带状延伸程度 带状延伸越明显则延伸率越大 反映城市的离散程度越大 2 伸延率 ELONGATIONRATIO 紧凑度有三个不同的计算公式 公式1 紧凑度 其中 A为面积 P为周长 该指标反映城市的紧凑程度 其中圆形区域被认为最紧凑 紧凑度为1 其它形状的区域 其离散程度越大则紧凑度越低 3 紧凑度 COMPACTNESSRATIO 圆U 1 U 1膨胀型 U 1紧缩型 其中 A为区域面积 A 为该区域最小外接圆面积 该指标同样认为圆形区域最紧凑 其紧凑度为1 在计算中采用最小外接圆面积作为衡量城市形状的标准 公式2 紧凑度指数 A A 其中 L为最长轴长度 A为区域面积 该指标也认为圆形为标准形状 但它只考虑最长轴长度 只能概略地反映城市形状 公式3 紧凑度 1 273A L2 放射状指数有两个不同的计算公式 较常使用的计算公式为 放射状指数 式中 di是城市中心到第i地段或小区中心的距离 n为地段或小区数量 这一指标不单纯是从抽象的形状入手 而是综合了城市内部各小区的位置特征 通过距离 可以结合时间 阻力等线路因素 反映城市中心与区内各部分之间的具体联系 4 放射状指数 RADIALSHAPEINDEX 式中 S为标准面积指数 A为区域面积 As为与区域面积相等的等边三角形面积 标准面积指数能反映城市形状的破碎程度 城市形状越破碎 则其与等边三角形的交集越小而并集越大 所以其比值越小 不过 通常认为圆才是真正的紧凑形状 而并不是等边三角形 5 标准面积指数 5 坡度和坡向 坡度 水平面与局部地表之间夹角的正切值 包含斜度 高度变化的最大值比率 常称为坡度 和坡向 变化比率最大值的方向 影响到地区的稳定度及水流速度 坡度的缓急可以从等高线的疏密程度判知 1 等高线较疏的地区 地势较平坦 2 等高线较密集的地区 则地势较陡峭 3 当许多等高线密集在一起时 则表示该地为悬崖峭壁 坡度的表示方法有百分比法 度数法 密位法和分数法四种 其中以百分比法和度数法较为常用 1 百分比法表示坡度最为常用的方法 即两点的高程差与其水平距离的百分比 其计算公式如下 坡度 高程差 水平距离 100 2 度数法用度数来表示坡度 利用反三角函数计算而得 其公式如下 tan 坡度 高程差 水平距离所以 坡度 tan 1 高程差 水平距离 6 剖面积 地形剖面图 可以以线带面概括研究区域的地势 地质和水文特征等 二 空间分布 1 空间分布类型 空间分布反映的是同类空间事物的群体定位信息 特定分布区域中的分布对象是单一性质的 空间对象按空间实体的几何形态划分为点 线 面 不同的空间分布对象具有不同的空间分布特征 并且具有各自相应的空间分布参数 下面分别对点 线 面的不同空间分布及其描述参数进行讨论 2 分布密度 指单位分布区域内的分布对象的数量 是两个比率尺度数据的比值 举例 1 某地区汽车加油站的密度 加油站数 总公里路程2 某地区森林覆盖率 森林面积 地区总面积3 某省人口密度 人口数 该省总面积4 某地区交通网密度 交通网总长度 区域总面积5 城市商业网点密度 商业网点数 城区总面积6 某河流沿岸防护堤建筑比率 防护堤总长度 河岸总长度 3 质心 质心可概略表示分布总体的位置 是目标保持均匀分布的平衡点 可通过对目标坐标值加权平均求得 计算公式 设pi i 1 2 n 的权重分别为W Pi 则 其中 xi yi为i个离散点的坐标n为目标个数 4 点模式 点模式的空间分布是一种比较常见的状态 如不同区域内的人口 房屋 城市分布 油田区的油井分布等 通常 点模式的描述参数有分布密度 分布中心 分布轴线 离散度等 均匀分布随机分布聚集分布三种点模式 点群类型指标 均一点模式是根据均一的子区域之间的关系定义的 这种子区域称为较大区域的样方 如果每个均一的样方包含相同数量的点对象 则整个研究区分布具有均一性 这种检验分布性的标准型方法称为样方分析 即假设每个子区域存在的对象数量大致相等 那么可以计算所有数据点个数与子区域个数的比值 得到每个子区域内平均对象的个数 只要它具备均一分布的特征 这个数值就是期望分布值 用简单的x2数学检验法对这些数据进行估计 其公式表示为Q 每个样方中实际观测到的点数 E 每个样方中期望的分布值 1 样方的统计量X2 最近邻分析是一种分析点位置关系的点模式分析法 通常分为顺序法和区域法两种方法 无论是哪种方法 它分析过程的中心思想都是先测出每点与其最近点间的距离 然后将量测值与所测距离的均值进行比较 这种统计方法仅涉及计算每对最近点间距离的平均值 平均最近邻距离提供了空间分布中点之间距离的量度或点之间的距离指数 由于点对象之间距离太近会发生冲突 因此 最近邻分析在动物个体与种群的活动习性研究中具有很高的利用价值 如猴子是一种群居动物 不同群组的猴子都有自己的活动范围 它们的空间绝不允许其他猴群的侵犯 老虎 狮子这些个体活动的猛兽 也都拥有自己的生活区域 它们在这一定的范围内猎食 休息 而不会去侵犯其他同类的活动范围 也绝不允许被别人干扰 2 最近邻指数R 5 网络测度指标 对于任何一个网络图 都存在着三种共同的基础指标 连线 边或弧 数目m 结点 顶点 数目n 网络中亚图的数目p 由它们可以产生如下几个更为一般性的测度指标 指数回路数k 指数 指数 指数 实际回路数与网络内可能存在的最大回路数之间的比率 网络内可能存在的最大回路数目为连线的最大可能数目减去最低限度连接的连线数目 即所以 指数为指数也可以用百分率表示 1 指数 指数的变化范围 一般介于 0 1 区间 0意味着网络中不存在回路 1 说明网络中已达到最大限度的回路数目 对于非平面网络 其指数为 指数 线点率 是网络内每一个节点的平均连线数目 0 表示无网络存在 网络的复杂性增加 则 值也增大 没有孤立点存在的网络 连线数目为n p 则 指数为如果地理网络不包含次级亚图 即P 1 则其最低限度连接的指数值为 2 指数 指数 网络内连线的实际数目与连线可能存在的最大数目之间的比率 对于平面网络 其计算公式为 指数是测度网络连通性的一种指标 其数值变化范围为 0 1 0 表示网络内无连线 只有孤立点存在 1 则表示网络内每一个节点都存在与其它所有节点相连的连线 指数也可以用百分比表示 3 指数 二 空间关系分析 邻近度分析网络分析叠置分析 1 邻近度分析 邻近度 Proximity 描述了地理空间中两个地物距离相近的程度度 其确定是空间分析的一个重要手段 交通沿线或河流沿线的地物有其独特的重要性 公共设施的服务半径 大型水库建设引起的搬迁 铁路 公路以及航运河道对其所穿过区域经济的发展的重要性等 军是一个邻近度问题 缓冲区分析是解决邻近度问题的空间分析工具之一 1 距离 2 缓冲区分析 缓冲区是指为了识别某一地理实体或空间物体对其周围地物的影响度而在其周围建立的具有一定宽度的带状区域 缓冲区分析则是对一组或一类地物按缓冲的距离条件 建立缓冲区多边形 然后将这一图层与需要进行缓冲区分析的图层进行叠置分析 得到所需结果的一种空间分析方法 缓冲区分析适用于点 线或面对象 如点状的居民点 线状的河流和面状的作物区等 邻域半径R即缓冲距离 宽度 是缓冲区分析的主要数量指标 可以是常数或变量 空间对象还可以生成多个缓冲带 a 不同宽度缓冲区 b 环状缓冲区 点要素的缓冲区 矢量数据缓冲区的建立方法 线要素的缓冲区 面要素的缓冲区 栅格数据的缓冲区分析通常称为推移或扩散 Spread 推移或扩散实际上是模拟主体对邻近对象的作用过程 物体在主体的作用下沿着一定的阻力表面移动或扩散 距离主体越远所受到的作用力越弱 栅格数据缓冲区的建立方法 缓冲区实现有两种基本算法 矢量方法和栅格方法 2 网络分析 网络分析是通过研究网络的状态以及模拟和分析资源在网络上的流动和分配情况 对网络结构及其资源等的优化问题进行研究的一种空间分析方法 网络分析的理论基础是图论和运筹学 在地理信息系统中 网络分析功能依据图论和运筹学原理 在计算机系统软硬件的支持下 将与网络有关的实际问题抽象化 模型化 可操作化 根据网络元素的拓扑关系 线性实体之间 线性实体与结点之间 结点与结点之间的连结 连通关系 通过考察网络元素的空间 属性数据 对网络的性能特征进行多方面的分析计算 从而为制定系统的优化途径和方案提供科学决策的依据 最终达到使系统运行最优的目标 网络模型 在城市之间建立通讯网络 使其中任意两个城市之间都有直接或间接的通讯联系 假设已知每两个城市之间通讯线路的成本 要求找出一个成本最低的通讯网络 a 通讯网络问题中的数据 b 一个最小成本通讯网络 用图形描述通讯网络问题 1 图 图论中的 图 是指由点集合V和V中点与点之间的连线的集合E构成的二元组 V E V中的元素称为结点 E中的元素称为边 图论中所研究的图是由实际问题抽象出来的逻辑关系图 图中点和线的位置与曲直无关紧要 点的多少和每条线是连接哪些点才是关键 两个端点重合的边称为环 如果有两条边的端点是同一对顶点 则称这两条边为重边既没有环也没有重边的图 称为简单图 如果图中的边是有向的 则称为有向图 其中的边叫做弧在无向图中 首尾相接的一串边的集合叫做路 在有向图中 顺向的首尾相接的一串边的集合叫做有向路如果一个图中 任意两个结点之间都存在一个路 则称之为连通图 起点和终点为同一个结点的路称为回路 或圈 如果一个连通图中不存在任何回路 则称为树 任意一个连通图 去掉一些边后形成的树叫做连通图的生成树 给定一个图 图中的每一条边赋以一个实数 称这种数为边的权数 称这种图为赋权图 赋以权数的有向图称为赋权有向图 也可称之为网络 根据需要赋权有向图中的一条边 必要时可以赋以多个权值 另外也可以给结点赋权 称为点权网络 相对于点权网络 给边赋权的网络称为边权网络 在机器实现中 邻接矩阵表示法 关联矩阵表示法 邻接表表示法是用来描述图与网络常用的方法 邻接矩阵用来表示图中任意两点间的邻接关系及其权值 如果两点间有一条弧 则邻接矩阵中对应的元素为1 否则为0 也可用 表示两点间无任何连接关系 邻接矩阵为对称矩阵 对于加权图的邻接矩阵表示 一条弧所对应的元素不再是1 而是相应的权值 2 邻接矩阵与关联矩阵 关联矩阵中 每行对应图的一个节点 每列对应图的一条弧 如果一个节点是一条弧的起点 则关联矩阵中对应的元素为1 如果一个节点是一条弧的终点 则关联矩阵中对应的元素为 1 如果一个节点与一条弧不关联 则关联矩阵中对应的元素为0 图的邻接表是图中所有节点邻接表的集合 网络数据结构的基本组成部分和属性1 链 Link 网络中流动的管线如街道 河流 水管 其状态属性包括阻力和需求 2 结点 Node 网络中链的结点 如港口 车站等 其状态属性包括阻力和需求等 障碍 Barrier 禁止网络上流动的点 拐点 Turn 出现在网络中的分割点上 其状态有属性和阻力 如拐弯的时间和限制 如在8点到18点不允许左拐 中心 Center 是接受或分配资源的位置 如水库 商业中心 电站等 其状态包括资源容量 如总量 阻力限额 中心到链的最大距离或时间 站点 Stop 在路径选择中资源增减的结点 如库房 车站等 其状态属性有资源需求 如产品数量 结点中的特殊类型 路径分析路径分析是GIS中最基本的功能 其核心是对最佳路径的求解 从网络模型的角度看 最佳路径的求解是在指定网络的两个结点之间找一条阻碍强度最小的路径 另一种路径分析功能是求解最佳游历方案 又分为弧段最佳游历方案求解和结点最佳游历方案求解两种 连通分析现实中常需要知道从某一结点或边出发能够到达的全部结点或边 这一类问题称为连通分量求解 另一类连通分析问题是求解最少费用连通方案 即在耗费最小的情况下使全部结点相互连通 网络分析功能 动态分段动态分段技术是GIS网络分析中一种基于网络线的动态分析 显示和绘图技术 通过建立一种比 弧段 结点 数据模型高级的 动态段 动态结点 模型 来实现根据不同的属性按照某种度量标准对线性要素进行相对位置的划分 地址匹配地址匹配实质是对地理位置的查询 涉及到地址的编码 地址匹配与其他网络分析功能结合起来 可以满足实际工作中复杂的分析要求 3 最短路径分析 最佳路径分析也称最优路径分析 以最短路径分析为主 这里 最佳 包含很多含义 不仅指一般地理意义上的距离最短 还可以是成本最少 耗费时间最短 资源流量 容量 最大 线路利用率最高等标准 很多网络相关问题 如最可靠路径问题 最大容量路径问题 易达性评价问题和各种路径分配问题均可纳入最佳路径问题的范畴之中 无论判断标准和实际问题中的约束条件如何变化 其核心实现方法都是最短路径算法 最短路径问题从算法研究的角度考虑最短路径问题通常可归纳为两大类 一类是所有点对之间的最短路径 另一类是单源点间的最短路径问题 不但求出起点到终点的最短路径及其长度 而且求出了起点到图中其他各个顶点的最短路径及长度 Dijkstra算法 S S 令S a b f 则S c d e 求d a S 4 中心选址问题 中心点选址问题中 最佳选址位置的判定标准 是使其所在的顶点与图中其它顶点之间的最大距离达到最小 或者使其所在的顶点到图中其它顶点之间的距离之和达到最小 这个选址问题实际上就是求网络图的中心点问题 这类选址问题适宜于医院 消防站等服务设施的布局问题 v6 v8 v1 v7 v5 v4 v2 v3 8 9 3 6 3 2 5 3 7 5 7 中心选址问题的实例 例如 某县要在其所辖的8个乡镇之一修建一个消防站 为8个乡镇服务 要求消防站至最远乡镇的距离达到最小 假设该8个乡镇之间的交通网络被抽象为无向赋权连通图 权值为乡镇之间的距离 下面求解消防站应设在哪个乡镇 即哪个顶点 首先 用Dijkstra算法计算出每一个顶点vi至其它各顶点vj的最短路径长度dij i j 1 2 6 写出距离矩阵 60 61 91 61 52 56 54 73 其次 求距离矩阵中每行的最大值 即各个顶点的最大服务距离 得e v1 14 e v2 15 e v3 20 e v4 12 e v5 15 e v6 17 e v7 12 e v8 20最后计算最大服务距离的最小值 显然 e v4 e v7 min e vi 所以 消防站应建在v4或v7点所在的乡镇 60 61 91 61 52 56 54 73 要求消防站至所有乡镇的距离达到最小 消防站应建在v5点所在的乡镇 3 叠置分析 大部分GIS软件以分层的方式组织地理景观 将地理景观按主题分层提取 同一地区的整个数据层集表达了该地区地理景观的内容 每个主题层可以用矢量结构的点线面图层文件表达 也可以用栅格结构的图层文件进行表达 叠置分析是GIS最常用的提取空间隐含信息的手段之一 该方法来源于传统的透明材料叠置 既将来自不同数据源的图纸绘于透明纸上 在透光桌上将其叠放在一起 然后用笔勾出感兴趣的部分 叠置分析是将两层或多层地图要素进行叠置产生一个新要素层的操作 其结果将原来要素分割成新的要素 新要素综合了原来两层或多层要素所具有的属性 也就是说 叠置分析不仅生成了新的空间关系 还将输入数据层的属性联系起来产生了新的属性关系 叠置分析是对新要素的属性按一定的数学模型进行计算分析 进而产生用户需要的结果或回答用户提出的问题 点与多边形的叠置分析 实质是计算包含关系 包含分析 判断各个点的归属 落在哪个多边形内 叠置的结果是为每点产生一个新的属性 例如 井位与规划区叠置 可找到包含每个井的区域 1 点与多边形叠置 在完成点与多边形几何关系计算后 还要进行属性信息处理 最简单的方式是将多边形属性信息叠置到其中的点上 或反之 如有多点分布在同一多边形 则要采取一些特殊的规则 点与多边形的叠置通常不产生新的数据层 只是把属性信息叠置到原图层中 然后通过属性查询间接获得点与多边形叠置的需要信息 自动取款机位置图 居民区分布图 叠置图层 2 线与多边形叠置 线与多边形的叠置 是比较线上坐标与多边形坐标的关系 判断线是否落在多边形内 叠置后每条线被它穿过的多边形打断成新弧段 要将原线和多边形的属性信息一起赋给新弧段 1 2 4 A B C 1 2 3 3 5 6 政区图 河流图 新弧段图层 居民区 叠置图 污染分级图 3 多边形的叠置 原来多边形要素分割成新要素 新要素综合了原来两层或多层的属性 并操作 Union 交操作 Intersect 擦除操作 Erase 裁剪操作 Clip 多边形的叠置 并操作 A B 保留两个图层的所有图形要素和属性数据 A B A B 交操作 A B 保留两个图层共同的部分 其余部分将被消除 A B A B 擦除操作 A A B 输出层保留以第二个图层为控制边界之外的所有多边形 A A B A B 裁剪操作输出层保留以第二个图层为边界 对输入图层的内容要素进行截取的结果 和擦除操作相反 A A B A B 4 栅格图层叠置 地图代数基于常数的代数运算基于指数 对数 三角函数等数学变换的运算多个数据层面的代数运算 加 减 乘 除等 二值逻辑叠加逻辑交逻辑并逻辑差的运算 A B C D 地图代数 D D A B C E 二值逻辑叠加 首先按是否满足规定条件 将各个输入数据层中的所有多边形赋值为1 真 或0 假 变成二值图 0 1 对各个输入数据层进行 逻辑交 逻辑并 逻辑补 等运算 输出数据层也是一个二值图 A B 二值逻辑叠加 C A B D A B B 叠加后属性的赋值方法点变换方式对单个栅格单元进行属性值运算而不受其邻近点的属性值的影响 区域变换方式对属性赋值要考虑栅格所在区域的特性 面积 长度等 邻域变换方式对属性赋值要考虑相邻栅格的影响 实例 汶川大地震相关损失估算 需解决的问题确定汶川地震的分级影响范围计算汶川地震所涉及人口数量估算汶川地震中道路的损失情况 地震等级及分布等相关数据 四川省的行政边界图 道路分布图 1 准备空间数据 四川地震等级分布图 4 5级以上 空间操作流程 2 进行空间操作 地震源 buffer分级 地震缓冲区 overlay 叠置层 行政边界 损失估算 属性数据 道路数据 四川地震等级分布图 4 5级以上 汶川 北川 青川 建立地震源缓冲区 地震缓冲区和行政边界叠加 地震缓冲区和道路叠加 统计地震所涉及的具体县和乡镇及它们的破坏程度 3 进行统计分析 统计地震所涉及的人口总数 结合一些经济指标可以进行地震损失估算 统计受地震影响的道路及破坏程度 三 空间查询 百度地图上查询电子科技大学清水河校区 空间查询 查询和定位空间对象 并对空间对象进行量算是地理信息系统的基本功能之一 它是地理信息系统进行高层次分析的基础 例如 在地理信息系统中 为进行高层次分析 往往需要查询定位空间对象 并用一些简单的量测值对地理分布或现象进行描述 如长度 面积 距离 形状等 实际上 空间分析首先始于空间查询和量算 它是空间分析的定量基础 空间查询主要有两类 第一类是按属性信息的要求来查询定位空间位置 称为 属性查图形 例如 在中国行政区划图上查询人口大于4000万且城市人口大于1000万的省有哪些 这和一般非空间的关系数据库的SQL查询没有区别 查询到结果后 再利用图形和属性的对应关系 进一步在图上用指定的显示方式将结果定位绘出 第二类是根据对象的空间位置查询有关属性信息 称为 图形查属性 例如 一般地理信息系统软件都提供一个 INFO 工具 让用户利用光标 用点选 画线 矩形 圆 不规则多边形等工具选中地物 并显示出所查询对象的属性列表 可进行有关统计分析 该查询通常分为两步 首先借助空间索引 在地理信息系统数据库中快速检索出被选空间实体 然后根据空间实体与属性的连接关系即可得到所查询空间实体的属性列表 图查文 几何查询 基于空间关系查询 空间实体间存在着多种空间关系 包括拓扑 顺序 距离 方位等关系 通过空间关系查询和定位空间实体是地理信息系统不同于一般数据库系统的功能之一 例如 查询成都火车北站附近的酒店 空间查询类别 简单的面 线 点相互关系的查询包括 面面查询 如与某个多边形相邻的多边形有哪些 面线查询 如某个多边形的边界有哪些线 面点查询 如某个多边形内有哪些点状地物 线面查询 如某条线经过 穿过 的多边形有哪些 某条链的左 右多边形是哪些 空间查询类别 线线查询 如与某条河流相连的支流有哪些 某条道路跨过哪些河流 线点查询 如某条道路上有哪些桥梁 某条输电线上有哪些变电站 点面查询 如某个点落在哪个多边形内 点线查询 如某个结点由哪些线相交而成 几何参数查询 一般的GIS软件都提供了查询空间对象几何参数的功能 包括点的位置坐标 两点间的距离 一个或一段线目标的长度 一个面状目标的周长或面积等 空间定位查询 空间定位查询是指给定一个点或一个几何图形 检索出该图形范围内的空间对象以及相应的属性按点查询 给定一个鼠标点位 检索出离它最近的空间对象 并显示它的属性 回答它是什么 它的属性是什么 按矩形查询 按圆查询 按多边形查询 空间关系查询 空间关系查询包括空间拓扑关系查询和缓冲区查询 空间关系查询有些是通过拓扑数据结构直接查询得到 有些是通过空间运算 特别是空间位置的关系运算得到 1 邻接查询 从多边形与弧段关系的表中 检索出该多边形关系的所有弧段从弧段关系的左右多边形的表中 检索出这些弧段所关联的多边形 2 包含关系查询 查询某一个面状所包含的某一类的空间对象 3 穿越查询 长江所经过的县市 4 落入查询 查询一个空间对象它落在哪个空间对象之内 可采用空间运算 使用点在多边形内 线在多边形内 或面在多边形内的差别方法 5 缓冲区查询 缓冲区查询根据用户需要给定一个点缓冲 线缓冲或面缓冲的距离 从而形成一个缓冲区的多边形 再根据多边形检索的原理 检索出该缓冲区多边形内的空间地物 距黄河150公里范围内的主要城市 6 地址匹配查询 根据街道地址来查询事物的空间位置和属性信息是地理信息系统特有的一种查询功能 这种查询利用地理编码 输入街道门牌号码 就可知道大致的位置和所在的街区 7 结构化查询语言 SQL查询 四 空间统计分析 空间统计分析 即空间数据 SpatialData 的统计分析 是现代计量地理学中一个快速发展的方向领域 空间统计分析 其核心就是认识与地理位置相关的数据间的空间依赖 空间关联或空间自相关 通过空间位置建立数据间的统计关系 1 相关分析 空间要素之间的相关性分析的任务是揭示空间要素之间相互关系的密切成都 空间要素之间相互关系的密切成都的测定 主要是通过对各种相关系数的计算和检验来完成 线性相关分析 研究两个变量间线性关系的程度 用相关系数r来描述 正相关 如果x y变化的方向一致 如身高与体重的关系 r 0 一般地 r 0 95存在显著性相关 r 0 8高度相关 0 5 r 0 8中度相关 0 3 r 0 5低度相关 r 0 3关系极弱 认为不相关 偏相关分析 偏相关分析 研究两个变量之间的线性相关关系时 控制可能对其产生影响的变量 如控制年龄和工作经验的影响 估计工资收入与受教育水平之间的相关关系 相关分析能够检验两个变量的相关程度 并通过相关系数的正负号判断相关的方向 但是在现实研究中 变量之间的相互影响往往涉及更深层次的因素 相关分析中往往因为第三变量的影响或作用 使得相关系数不能真实地反映两个变量之间的线性相关程度 这样也决定了二元变量的相关分析的不精确性 偏相关分析就是在研究两个变量之间的线性相关系时控制可能对其产生影响的变量 2 回归分析 回归分析 regressionanalysis 是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法 运用十分广泛 回归分析按照涉及的自变量的多少 可分为一元回归分析和多元回归分析 按照自变量和因变量之间的关系类型 可分为线性回归分析和非线性回归分析 如果在回归分析中 只包括一个自变量和一个因变量 且二者的关系可用一条直线近似表示 这种回归分析称为一元线性回归分析 如果回归分析中包括两个或两个以上的自变量 且因变量和自变量之间是线性关系 则称为多元线性回归分析 线性回归模型 城市用地面积与人口增速关系图 非线性回归模型 3 主成分分析 地理环境是多要素的复杂系统 在我们进行地理系统分析时 多变量问题是经常会遇到的 变量太多 无疑会增加分析问题的难度与复杂性 而且在许多实际问题中 多个变量之间是具有一定的相关关系的 因此 我们就会很自然地想到 能否在各个变量之间相关关系研究的基础上 用较少的新变量代替原来较多的变量 而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息 事实上 这种想法是可以实现的 本节拟介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法 主成分分析的基本原理 主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法 从数学角度来看 这是一种降维处理技术 假定有n个地理样本 每个样本共有p个变量描述 这样就构成了一个n p阶的地理数据矩阵 如何从这么多变量的数据中抓住地理事物的内在规律性呢 要解决这一问题 自然要在p维空间中加以考察 这是比较麻烦的 为了克服这一困难 就需要进行降维处理 即用较少的几个综合指标来代替原来较多的变量指标 而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息 同时它们之间又是彼此独立的 那么 这些综合指标 即新变量 应如何选取呢 显然 其最简单的形式就是取原来变量指标的线性组合 适当调整组合系数 使新的变量指标之间相互独立且代表性最好 如果记原来的变量指标为x1 x2 xp 它们的综合指标 新变量指标为x1 x2 zm m p 则 在 2 式中 系数lij由下列原则来决定 1 zi与zj i j i j 1 2 m 相互无关 2 z1是x1 x2 xp的一切线性组合中方差最大者 z2是与z1不相关的x1 x2 xp的所有线性组合中方差最大者 zm是与z1 z2 zm 1都不相关的x1 x2 xp的所有线性组合中方差最大者 这样决定的新变量指标z1 z2 zm分别称为原变量指标x1 x2 xp的第一 第二 第m主成分 其中 z1在总方差中占的比例最大 z2 z3 zm的方差依次递减 在实际问题的分析中 常挑选前几个最大的主成分 这样既减少了变量的数目 又抓住了主要矛盾 简化了变量之间的关系 从以上分析可以看出 找主成分就是确定原来变量xj j 1 2 p 在诸主成分zi i 1 2 m 上的载荷lij i 1 2 m j 1 2 p 从数学上容易知道 它们分别是x1 x2 xp的相关矩阵的m个较大的特征值所对应的特征向量 实例 对于某区域地貌 水文系统 其57个流域盆地的九项地理要素 x1为流域盆地总高度 m x2为流域盆地山口的海拔高度 m x3为流域盆地周长 m x4为河道总长度 km x5为河道总数 x6为平均分叉率 x7为河谷最大坡度 度 x8为河源数及x9为流域盆地面积 km2 的原始数据如表2 14所示 张超先生 1984 曾用这些地理要素的原始数据对该区域地貌 水文系统作了主成分分析 下面 我们将其作为主成分分析方法在地理学研究中的一个应用实例介绍给读者 以供参考 某57个流域盆地地理要素数据 相关系数矩阵 1 首先将原始数据作标准化处理 计算相关系数矩阵 特征值及主成分贡献率 2 由相关系数矩阵计算特征值 以及各个主成分的贡献率与累计贡献率 第一 第二 第三主成分的累计贡献率已高达86 5 故只需求出第一 第二 第三主成分z1 z2 z3即可 3 对于特征值 1 5 043 2 1 746 3 0 997分别求出其特征向量e1 e2 e3 并计算各变量x1 x2 x9在各主成分上的载荷得到主成分载荷矩阵 主成分载荷矩阵 从表可以看出 第一主成分z1与x1 x3 x4 x5 x8 x9有较大的正相关 这是由于这六个地理要素与流域盆地的规模有关 因此第一主成分可以被认为是流域盆地规模的代表 第二主成分z2与x2有较大的正相关 与x7有较大的负相关 而这两个地理要素是与流域切割程度有关的 因此第二主成分可以被认为是流域侵蚀状况的代表 第三主成分z3与x6有较大的正相关 而地理要素x6是流域比较独立的特性 河系形态的表征 因此 第三主成成可以被认为是代表河系形态的主成分 以上分析结果表明 根据主成分载荷 该区域地貌 水文系统的九项地理要素可以被归为三类 即流域盆地的规模 流域侵蚀状况和流域河系形态 如果选取其中相关系数绝对值最大者作为代表 则流域面积 流域盆地出口的海拔高度和分叉率可作为这三类地理要素的代表 利用这三个要素代替原来九个要素进行区域地貌 水文系统分析 可以使问题大大地简化 4 判别分析 根据预先确定的等级序列因子标准和判别临界值 将要分析的对象进行分析判别 并将其划归到序列的合适位置 主要应用领域具有一定理论依据的分类定级问题如水土流失评价 土地适宜性评价等原则类间差别较较大 类内差别较小 步骤建立判别函数建立分类临界值对变量进行分类 动态调整 5 空间统计学 空间统计学是以区域化变量理论为基础 以变异函数为主要工具 研究具有地理空间信息特性的事物或现象的空间相互作用及变化规律的学科 地统计学与空间经济计量学被看作空间统计学在不同领域中的别称 五 空间插值 所谓空间数据插值 即通过探寻收集到的样点 样方数据的规律 外推 内插到整个研究区域为面数据的方法 即根据已知区域的数据求算待估区域值 影响插值精度的主要因素就是插值法的选取 1 边界内插方法 思路 假设任何重要的变化发生在边界上 边界内的变化是均匀的 同质的 即在各方向都是相同的 这种概念模型经常用于土壤和景观制图 边界内插方法最简单的统计模型是标准方差分析 ANOVAR 模型 式中 z是在x0位置的属性值 是总体平均值 k是k类平均值与 的差 为类间平均误差 噪声 2 趋势面分析 某种地理属性在空间的连续变化 可以用一个平滑的数学平面加以描述 即先用已知采样点数据拟合出一个平滑的数学平面方程 再根据该方程计算无测量值的点上的数据它的理论假设是地理坐标 x y 是独立变量 属性值Z也是独立变量且是正态分布的 同样回归误差也是与位置无关的独立变量 曲面拟合Z f x y 内插格网点高程 趋势面分析是一种多项式回归分析技术 多项式回归的基本思想是用多项式表示线或面 按最小二乘法原理对数据点进行拟合 拟合时假定数据点的空间坐标X Y为独立变量 而表示特征值的Z坐标为因变量 当数据为一维时 数据是二维时 二元二次或高次多项式 趋势面是个平滑函数 很难正好通过原始数据点 所以趋势面分析是一个近似插值方法趋势面最有效的应用是揭示区域中不同于总趋势的最大偏离部分 所以趋势面最主要的用途是 在使用某种局部插值方法之前 可用趋势面从数据中去掉一些宏观特征 不直接用它进行空间插值 趋势面拟合程度的显著性F检验 检验的办法是在显著性水平下 查F分布表得Fa 若计算的F值大于临界值Fa 则认为趋势面方程显著 否则 不显著 p为多项式项数 不包括常数项 趋势面分析应用实例 上表为某流域1月份降水量与各观测点的坐标位置数据 趋势面分析应用实例 续 1 建立趋势面模型运用上述介绍的趋势面分析原理 首先采用二次多项式进行趋势面拟合 用最小二乘法求得拟合方程为z 5 998 17 438x 29 787y 3 558x2 0 375xy 8 070y2 R2 0 839 F 6 236 再采用三次趋势面进行拟合 用最小二乘法求得拟合方程为z 48 810 37 557x 130 130y 8 389x2 33 166xy 62 740y2 4 133x3 6 138x2y 2 566xy2 9 785y3 R2 0 965 F 6 054 2 模型检验 1 趋势面拟合适度的R2检验 结果表明 二次趋势面回归模型和三次趋势面回归模型的显著性都较高 而且三次趋势面较二次趋势面具有更高的拟合程度 2 趋势面适度的显著性F检验 在置信水平a 0 05下 查F分布表得F2a F0 05 5 6 4 53 F3a F0 05 9 2 19 4 显然 F2 F2a 而F3 F3a 故二次趋势面的回归方程显著而三次趋势面不显著 因此 F检验的结果表明 用二次趋势面进行拟合比较合理 趋势面分析应用实例 续 优点和缺点 优点产生平滑的曲面 结果点很少通过原始数据点 只是对整个研究曲产生最佳拟合面 缺点高次多项式在数据区外围产生异常高值或低值 3 泰森多边形法 泰森多边形 Thiessen 又叫Dirichlet或Voronoi多边形 一种极端的边界内插方法 只用最近的单个点进行区域插值 泰森多边形按数据点位置将区域分割成子区域 每个子区域包含一个数据点 各子区域到其内数据点的距离小于任何到其它数据点的距离 并用其内数据点进行赋值 连接所有数据点的连线形成Delaunay三角形 与不规则三角网TIN具有相同的拓扑结构 在一个多边形内 每个未知点与该多边形内的已知点最接近 而与其他已知点更远 泰森多边形法的建立步骤 离散点自动构建三角网 即构建Delaunay三角网 对离散点和形成的三角形编号 记录每个三角形是由哪三个离散点构成的 找出与每个离散点相邻的所有三角形的编号 并记录下来 这只要在已构建的三角网中找出具有一个相同顶点的所有三角形即可 对与每个离散点相邻的三角形按顺时针或逆时针方向排序 以便下一步连接生成泰森多边形 设离散点为o 找出以o为顶点的一个三角形 设为A 取三角形A除o以外的另一顶点 设为a 则另一个顶点也可找出 即为f 则下一个三角形必然是以of为边的 即为三角形F 三角形F的另一顶点为e 则下一三角形是以oe为边的 如此重复进行 直到回到oa边 计算每个三角形的外接圆圆心 并记录之 根据每个离散点的相邻三角形 连接这些相邻三角形的外接圆圆心 即得到泰森多边形 对于三角网边缘的泰森多边形 可作垂直平分线与图廓相交 与图廓一起构成泰森多边形 4 加权移动平均法 加权移动平均法 利用插值点周围样点的数值来计算插值点的数值加权平均内插的结果随使用的函数及其参数 采样点的分布 窗口的大小等的不同而变化 通常使用的采样点数为6 8点 对于不规则分布的采样点需要不断地改变窗口的大小 形状和方向 以获取一定数量的采样点 距离倒数插值 反距离权重插值法 InverseDistanceWeighting IDW IDW综合了泰森多边形的自然邻近法和趋势面分析渐变方法的长处 在插值时为待估点Z值为邻近区域内所有数据点的距离加权平均值 当有各向异性时 还要考虑方向权重 权重函数与待估点到样点间的距离的U次幂成反比 即随着距离增大 权重呈幂函数递减 且对某待估点而言 其所有邻域的样点数的权重和为1 IDW插值方法假定每个输入点都有着局部影响 这种影响随着距离的增加而减弱 步骤 计算未知点到所有点的距离 计算每个点的权重 权重是距离倒数的函数 计算结果 1 4最大 6最小 示例 IDW插值 求图中0点的值 IDW基本公式 幂次 K 1 2 3 IDW插值的缺点 IDW不能得到大于样本最大值或小于样本最小值的估计 对于高程表面 这 抹平 了峰和谷 除非它们的高点和低点是样本的一部分 因为估计值为均值 得到的表面将不通过样本点 5 样条函数插值法 样条插值的目标就是寻找一表面s t 使它满足最优平滑原则 也就是说 利用样本点拟合光滑曲线 使其表面曲率最小 相当于扭曲一个橡皮 使它通过所有样点 同时曲率最小 样条函数是灵活曲线规的数学等式 为分段函数 一次拟合只有少数数据点配准 同时保证曲线段的连接处为平滑连续曲线 这就意味着样条函数可以修改曲线的某一段而不必重新计算整条曲线 插值速度快 保留了微地物特征 视觉上的满意效果 样条函数插值法评价 不适用于在短距离内属性有较大变化的地区 否则估计结果偏大 样条内插的误差不能直接估算 同时在实践中要解决的问题是样条块的定义以及如何在三维空间中将这些块拼成复杂曲面而又不至于引入原始曲面中所没有的异常现象等问题 6 克里金 Kriging 插值 克里金插值由南非采矿工程师D G 克里格 D G Krige 于1951年首次提出 故命名为 克里金 法 后经法国著名地理数学学家G Matheron发展深化 假设 所有的随机误差都具有二阶平稳性 即 随机误差的均值为零 并且任意两个随机误差之间的协方差只与两者之间的距离和方向有关 而与它们的具体位置无关 克里金方法 定义 利用原始数据和半方差函数的结构性 对未采样点的区域化变量进行无偏最佳估计 并能够计算出每个估计值的误差大小 半方差 定量描述区域性变化的第一步 它为空间插值 优化采样方案提供了有益信息 半方差的估算公式 半方差图 拟合后半方差图的用途是确定局部内插需要的参数 半方差 克里金方法的基本形式 确定趋势项 空间相关随机误差项 理解不同的克里金模型 对误差项的假设 期望值为0 并且和之间的自相关不取决于s点的位置 而取决于位移量h 为确保自相关方差有解 必须允许某两点间的自相关可以相等 如 下面有箭头相连的两对位置点假设具有相同的自相关性 趋势值可以被简单地赋予一个常量 即 在任何位置处 如果在任何时候趋势已知 无论趋势是否是常量 都形成简单克里金模型 趋势也可以表示为 若趋势中的系数未知 就是泛克里金模型 如果未知 就是普通克里金模型 可以对Z s 进行一下变换 例如 可以把它换为一个指示变量 若Z s 低于一定的阈值 如空气中的溴氧浓度值0 12ppm 则变为0 若Z s 高于一定的阈值 则变为1 然后对高于阈值的情况进行预测 便形成了指示克里金模型 现在看一下方程的左边 普通克里金 OrdinaryKriging OK 简单克里金 SimpleKriging SK 泛克里金 UniversalKriging UK 指示克里金 IndicatorKriging IK 1 计算样点对之间的距离和方差 半变异值 0 5 方差 示例 普通克里金方法 如果数据很大 样点对的数目将迅速增加并且变得难以操作 因此 可以将样点对分组 也就是将步长 h 分组 在该例中 首先将距离在1 2之间的作为第一组 h在2 3之间的作为第二组 依此类推 下表 2 拟合模型 为了预测 需要用理论半方差模型拟合经验半方差 以描述其变程 基台值和块金 range sill nugget 四个常用模型 Linear Exponential Assumesnosillorrange Gaussian Spherical Where c0 nuggetb regressionslopea rangec0 c sill 拟合模型 用平均半变异值为纵坐标 步长 抽样间距 为横坐标 做理论半变异图 半变异值 斜率 距离 13 5 h 生成伽玛矩阵 如 样点 1 5 与样点 3 4 的半变异值为 13 5 2 236 30 19 伽玛矩阵 最后一行的1和0根据无偏估计的限制条件求得 伽玛矩阵的逆矩阵 3 计算权系数与预测普通克里金的权系数矩阵为 向量g由未知点生成 如用点 1 4 来计算 计算该点与每个观测点的距离 如 1 4 与 1 5 3 4 1 3 4 5 5 1 的距离 预测点 1 4 的g向量计算结果如下表 半变异值 13 5 h 计算权系数 正如预期 权系数随距离的增加而减小 但由于将各点的空间分布也考虑进去 其结果比直接的距离权重要好 克里格方差 为了估计预测结果的不确定性 将权系数向量的每一行和g向量的每一行相乘 然后将结果相加 得到预测克里格方差 其平方根就是克里格标准差 如果假设误差是正态分布的 则95 的置信区间为 克里格预测值 1 96 克里格标准差 95 49 109 75 这仅是一个小例子 但从中可以看出几个重要特点 Kriging是计算密集型的方法 需要一个合适的软件 虽然一些GIS软件提供半方差估计 建模和Kriging 该邻域大多严肃的工作者使用特殊软件如GSLIB Variowin 或GS 所有的结果依赖于为从样点数据估计的半方差所拟合的模型 以及相关假设 其中包含一些主观决定 多少个距离组合 拟合的模型是什么 基台值和块金值取多少 除了所讨论的普通克里金 还有其他不同类型的克里金方法 比如 当存在均值漂移 drift 时采用UniversalKriging CoKriging扩展到同时考虑两个或更多变量 六 空间数据挖掘 空间数据挖掘 SpatialDataMining SDM 是从空间数据库中提取隐含的 用户感兴趣的空间或非空间的模式和普遍特征的过程 1 数据概化 数据概化就是一个从相对低层概念到更高层概念并对数据库中与任务相关的大量数据进行抽象概述的一个分析过程 数据细化则相反将概化和特殊化技术应用于空间分析 可以生成不同概念层面之间的规则和联系空间数据概化可分为两类 空间数据主导的概化和非空间数据主导的概化 数据概化方法主要有两种 数据立方体方法和基于属性的归纳方法数据立方体方法可以认为是基于数据仓库的 面向预计算的 物化视图的方法在数据立方体上进行计算和存储结果 可以使用roll down和roll up操作完成数据概化和数据细化工作限制 只能处理非数值化数据和数值数据的简单汇总 只能分析 不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 气球使用协议书
- 物品转让协议书
- 商业场所租赁扩展协议
- 通风安装维修合同协议
- 公司财务人员保密协议
- 水电班组协议书
- 三方运输合作协议
- 乡村集体土地承包经营补充协议
- 车载产品铺货合同协议
- 车内配件购买合同协议
- 计划生育选择试题及答案
- 法律文化-形考作业3-国开(ZJ)-参考资料
- 2025届东北三省四市高三第二次联考英语试卷含答案
- 2025-2030中国振动监测系统行业市场发展趋势与前景展望战略研究报告
- 《中华茶艺文化》课件
- 合肥高新美城物业有限公司招聘笔试题库2025
- 《词汇构建法:课件中的词根词缀解析》
- 华为系统面试题及答案
- 主题班会:高中男女生正常交往课件
- 2024年江苏省南京市中考物理试卷真题(含答案)
- DL-T 1476-2023 电力安全工器具预防性试验规程
评论
0/150
提交评论