空间数据库学习报告_第1页
空间数据库学习报告_第2页
空间数据库学习报告_第3页
空间数据库学习报告_第4页
空间数据库学习报告_第5页
免费预览已结束,剩余4页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

精选文档国内外空间数据库技术现状、存在问题与发展趋势学号:20151389012 姓名:苏逸摘要:随着计算机技术日益成熟,以及“数字城市”理念逐步深入人心,空间数据库技术在20世纪60年代后迅速发展。本文论述了国内外空间数据库技术的发展现状,罗列了一些尚存问题,展望了空间数据库的发展方向,希望能对笔者的空间数据库课程的学习打下认知基石。关键词:空间数据库技术 一、 国内外空间数据库现状1.1空间数据库管理模式发展历程管理模式经历了纯文件模式、文件结合关系型数据库的管理模式、全关系型数据库管理模式和面向对象的数据库管理模式四个阶段。1.2当下空间数据库主流类型1.2.1混合模型数据库所谓混合模型数据库其基本思想是将地理空间信息按照专题特性进行分层,每个图层由一类相同或相似的空间实体构成,如在一个城市中,道路、旅游景点、大专院校等不同特性的空间实体构成不同专题的图层,然后对这些图层进行分层存储和处理。对于图层中的每个空间实体,其属性数据被分为两部分: 空间属性和非空间属性,空间属性存储在文件系统中,非空间属性则存储在关系数据库中,两者通过一个全局唯一的标识符进行关联。其示意图如下图所示。图11.2.2 对象-关系型数据库近年来,结合关系数据库和面向对象思想的对象关系数据模型渐渐成为GIS应用中构建数据库系统的主流技术。由于这种技术更为逼真地模拟了现实世界中空间实体的结构和相互关系,并且采用单一系统进行存储, 因而消除了传统混合模型的缺点, 更有利于对空间数据进行管理和维护。该类型数据库有如下优点:采用对象-关系数据模型的商业化数据库产品技术上已经比较成熟,这就使得采用对象-关系模型构造的数据模型可以直接在一个对象-关系数据库中进行存储、管理,并且由于采用了符合行业标准的开放式数据接口,使得数据的共享更加方便有效;由于采用了单独的数据库进行数据管理, 使得对空间数据进行操作更加简单和方便,效率也大大提高;通过采用开放式的SQL平台以及大量空间操作函数的使用,能够开发出功能更加强大的应用系统,扩展了GIS 应用的范围1。1.2 空间数据库技术现状近些年,空间数据库技术在索引、数据更新、多源数据获取方面获得了一些进展,以下举出例子。1.2.1空间数据库索引技术2(1)空间数据库索引技术的定义数据索引是指在磁盘上组织数据记录的一种数据结构,是对存储在存储介质上的数据位置信息的描述。它用于优化某类数据检索的操作,是提高系统对数据获取效率的一种重要手段。(2)空间数据库索引技术分类2简单格网空间索引格网空间索引的原理简单,即把目标空间实体集合所在的空间范围划分成一系列大小相同的格。基于格网索引的查找思路也较简单,在数据分布较均匀的情况下,查询效率较高。但格网的大小直接影响了索引表的大小,格网太小,索引表会急剧膨胀,维护索引表本身的花费增加,查询效率随之下降;反之,落在一个格内的空间实体可能会过多;因此格的大小严重制约着查询效率的提高。K-D 树空间索引K-D 树是早期用于索引多维空间数据的数据结构之一。 K-D 树的每层都把空间划分为两个部分,沿着树的根结点进行一维划分;依次划分下一层结点,尽量保证左右子树中的结点数目均衡,当结点中包含的点数少于叶子结点中包含的最大点数时停止划分。为了平衡 K-D 树的深度,可结合 B 树来得到K-D-B树索引结构,但此类索引树对于占据一定空间范围的空间实体而言(如线和多边形),构造空间索引仍然不方便。因为当使用数据库表构造K-D 树的索引表时,树型结构的递归层次深,导致查询效率降低。R 树空间索引R树是B树在多维空间上的自然扩展,是由Guttman提出的最早支持多维空间存取的方法之一。R树是一种高度平衡树,可控制树的深度,采用对象的最小外包矩形(MBR)来近似表示空间实体。R 树有如下几条特性:(1) 叶结点中存储该结点对应的空间要素的MBR 和空间要素标识;(2)MBR 二维上是矩形,三维上是长方体,以此类推到高维空间;(3)非叶结点存放其子女结点集合的整体外包络矩形和指向其子女结点的指针。 R 树是一种动态索引结构,其查询、插入、删除可同时进行,而且不需要定期的对树结构重新组织。 R 树适合于多维空间查询,不过由于空间数据分布的偶然性,使得各层节点 MBR 容易重叠,导致实际执行空间查询时,会产生多个查询分支,很大程度上降低了空间查询的效率。在最坏的情形下,一个空间查询会退化成线性搜索。若使用外部数据库来描述 R 树,在缺乏特定的快速物理数据块访问接口情况下,效率也会大打折扣。四叉树空间索引在基于固定网格划分的四叉树空间索引机制中,工作空间在 X、Y 方向上进行 2N 等分,形成 2N2N 的网格,并以此建立 N 级四叉树。在四叉树中,空间要素标识记录在其外包络矩形所覆盖的每一个叶结点中。但当同一父亲的四个兄弟结点都要记录该空间要素标识时,则只将该空间要素标识记录在该父亲结点上,并按这一规则向上层推进。层次型的树状结构并不适合使用数据库表来直接描述,可通过对四叉树的各层节点进行编码,来反映四叉树的层次结构。四叉树索引在内存中的层次型树状结构,其查询效率较高。(3)空间数据库索引技术的应用3Oracle Spatial的空间数据索引可以通过用户定义的功能和索引方式,对用户定义的数据类型进行存储、恢复和操作,弥补了以往关系数据库管理的不足;IBM空间数据刀片(Spatial DataBlade):IBM DB2 Spatial Extender提供基于网格的三层空间索引,该索引技术是基于传统的分层B树索引形成的;MySQL空间数据扩展:MySQL Spatial Extensions用自己的Geometry数据类型存储空间数据,符合和遵循OpenGIS中的Geometry模型;ERSI空间数据引擎:这是一种处于应用程序和数据库管理系统之间的中间件技术,在用户和异构空间数据库之间提供了一个开放接口。1.2.2数据更新技术4(1)国内外空间数据库更新技术发展动态国外美国地质调查局测绘部从 2001年开始计划建立近实时数据更新机制,将数据的现势性保持在几天或数月之内。英国军械测量局根据其实际情况,建立了推扫式和散点式相结合的更新机制。日本采用基于栅格的更新方法,先更新1:2. 5万地形图,再用1:2. 5万图更新1 5 万图,城市地区每3年更新一次,郊区每5 年更新一次,山区每10年更新一次。加拿大测绘署地形信息中心2001年启动了一项利用Landsat7 影像更新 1 5 万地形数据的计划,每年使用Landsat7影像更新1 000幅以上地形数据。国内我国一些经济发展较快的省、市在建立更新机制、利用遥感影像获取变化信息、历史数据存取、增量更新、多尺度级联更新等方面进行了许多有益的尝试,并取得一定成效。浙江省测绘局在2006 年2007年已完成1:10 000地形图快速更新试验,并已开始规模性试生产。北京市、广州市、上海市从2007年开始1:500城市空间数据库增量更新试验,目前已逐步形成了各自地方特色的更新模式。2008 年北京清华山维公司推出了基于时态的动态更新软件 EPSW 2008,上海市、重庆市、福州市、宜昌等城市正在使用中。由于现实世界空间实体及其相互关系随时间不断发生变化,使地理空间数据库的持续更新既是一项长期艰巨任务,又是一个复杂的系统工程。本文以下仅对空间数据库数据更新的相关技术进行探讨,而对与更新有关的政策层面问题不予论述。(2)空间数据库更新关键技术与方法5区域整体更新区域整体更新按规模可分为两种:a.大规模区域整体更新。三到五年一个周期,进行大面积的修测和补测。更新区域通常是行政区单元(权属单位)。区域整体更新成本较高,更新投入由地方财政安排,一般用在区域空间要素变更很大、数据现势性很差的情况下;b.小范围区域整体更新。利用竣工测量或其他方法对区域内发生变化的某组织单元(图幅或网格)进行的更新,这种方法适用于区域空间要素变更较小的情况。增量更新地理空间数据更新的实质是空间实体状态改变的过程,即实现由现实世界中的现状实体转变为数据库中的现状实体,及由数据库现状实体转变为数据库历史实体两个状态的转变。因此地理空间数据更新不是简单删除替换。而增量更新采用面向对象数据模型存储空间要素,空间实体相互独立而完整(实体之间拓扑关系是隐含存在的,一般在分析时临时建立),原则上对单个实体增加、删除、修改不影响其他要素实体,因此,历史数据只需要保留发生变化的要素(即增量信息)。“增量更新”是今后的发展方向。但技术上比较复杂,存在一定的技术风险。1.2.3异构、多源空间数据库的互操作技术6(1)名词解释异构是指不同历史时期、不同格式、不同存在形式的空间数据,如矢量数据和栅格数据;多源是指来源不同,如同为栅格形式,遥感影像与DEM数据来源不同。互操作:异构多源空间数据的共享和GIS应用系统的无缝集成。(2)异构、多源空间数据库的互操作技术分析目前,空间信息领域常用的空间数据格式已超过100种,而综合信息系统应用中的各部门由于需求差异和历史等原因,往往会采用不同厂商的不同格式数据,部门之间的通信(互联互访)成为一个棘手的问题。面对诸多不同格式的数据,如何使已有的数据得到更充分的利用,成为当前GIS发展中亟待解决的问题。异构、多源空间数据共享与互操作技术方案,主要有数据格式转换模式、直接数据访问模式、关系数据库空间扩展模式,以及Web Service的数据集成技术。这些方法在一定程度上解决了空间数据共享与互操作的问题,但也存在一定的局限性。数据格式转换模式可以美国国家空间数据协会(NSDI)制定的统一空间数据格式规范SDTS(Spatial Data Transformation Standard)来实现,在一定程度上提供了不同数据格式之间统一空间对象描述方案,但难以为数据的集中和分布式处理提供解决方案,也难以实现自动同步更新。直接数据访问模式可以在一个GIS系统中直接访问不同格式的空间数据,避免了繁琐的数据转换步骤,也避免了数据存储两份而导致的数据不一致的问题。但这种模式依赖于GIS平台对不同格式空间数据的解析与支持能力,同时,由于一些数据格式没有公开格式文档,格式升级变化难以保障。关系数据库空间扩展模式以包含空间位置的矢量栅格数据查询检索定义和结构化查询语言 SQL的拓展规范SQL Multimedia (SQL/MM),提供了面向空间数据及多媒体数据的查询描述,支持数据库后端定义的空间函数算子调用,以及在查询操作中实现空间分析功能。这种模式为不同GIS软件的互访与互操作提供了统一的数据存储与访问机制,但由于其是以面向对象的思路在关系数据库中实现,在性能上有比较大的损失。基于WebService的数据共享与互操作模式,以美国开放地理信息系统协会(Open GIS Consortium, OGC)制定的数据共享规范,用统一协议的方式使数据客户能够读取任意数据服务器提供的空间数据。目前,统一协议对空间数据的支持尚不全面,还存在大量非标准空间数据难以用统一协议高效表达。鉴于此,GIS软件厂商提出了多源空间数据无缝集成框 架(Seamless Integration of Multi-source Spatial Data, SIMS)和虚拟空间数据引擎、通用空 间数据引擎(Universal Spatial Data Engine, USDE)、异构空间数据库集成技术(Open Grid ServicesArchitecture-data Access and Integration, OGSA-DAI),以及数据中间件模式等特定协议的方案。这些 模式的基本思路也都是趋向于由一家厂商来实现对其他数据的访问,或者也试图定义一些标准,但接口标准与平台相关性比较大,缺乏比较明确可扩展的架构,成为比较专用的接口标准,无法从根本上解决问题。二、 当前空间数据库存在的问题2.1 数据文件共享问题2.1.1数据文件格式不统一不同的空间数据库系统具有不同的数据文件格式。目前,业内尚缺乏一个统一的标准来保证不同格式的数据文件相互转换时不受损失。2.1.2数据共享政策我国现阶段在数据共享方面存在着服务性与商业性之间的矛盾。虽则我国对地理信息共享政策的制定是从全国大多数用户利益出发,但其中仍然存在多数用户利益与少数用户利益、长远利益与眼前利益的冲突。反观国外,在欧美地区数据共享政策是服务性与商业性结合的,一般有偿使用,按照商业活动方式运作。2.2 数据“瓶颈”问题数据模型本身的限制:优势劣势矢量数据空间拓扑关系表达空间查询数字化工作繁琐栅格数据与遥感影像密切关联数据输入方便易产生冗余,存储量大网络传输能力落后所需传输的数据量对网络带宽、速度等要求较高,这一点严重影响了WebGIS在实际生活中的应用与发展。2.3数据安全问题早期的GIS应用中,客户端一般采用文件共享的方式访问服务器上的空间数据文件,但是从客户端极易盗取和修改数据文件,带来了重大安全隐患。2.4数据更新问题地理信息数据一般时效性非常强,因此就要求人们不断更新空间数据库。空间数据更新是通过空间信息服务平台用现势性强的现状数据或变更数据、更新数据中非现势性的数据,达到保持现状数据库中空间信息的现势性和准确性或提高数据精度;同时将被更新的数据存入历史数据库供查询检索、时间分析、历史状态恢复等。因此,空间数据的更新并不是简单的删除替换。这其中又涉及数据的整体更新、局部更新、数据采集的途径、时效性、保持原有数据的不变、更新数据与原有数据正确连接等多方面问题,是空间数据库发展中亟待解决的问题之一。2.5数据模型问题当下空间数据库软件多数依旧采用混合存储模型, 它们都不同程度地存在着一些缺陷或不足之处,如有些索引方法只采用格网模型,索引效率较低;有些空间数据中不包含拓扑逻辑,虽然减轻了空间数据存储的复杂度,但降低了空间查询和空间分析的性能; 有些空间数据类型中尽管提供了三维数据类型的支持,但空间操作函数中针对三维对象的操作很少,对三维GIS的支持有限; 有些采用了基于对象的数据模型, 但对基于域的模型的支持有限。可见,尽管这些已经商品化的空间数据库系统具有很强的功能和适应性, 但其应用范围仍有一定的局限性,无法满足特定的需求,而需要开发自己的空间数据库系统,并可以与其它类型的空间数据库进行集成管理。三、 国内外空间数据库发展趋势3.1 时态空间数据库技术内容表现为以下三个主要方面:(1)空间时态数据的表达。空间时态数据表达的目的在于建立空间时态一体化数据模型。它涉及到时间标志、空间时态版本的标识、空间变化类型的定义、空间拓扑与时态拓扑、空间时态数据的存储结构,以及存取策略等内容;(2)空间时态数据的更新。空间时态数据的更新研究空间数据更新的类型、操作方法,更新对时空数据库中空间和时态拓扑的影响,以及拓扑重建等问题;(3)空间时态数据的查询。空间时态数据的查询探讨空间时态数据的各种跟踪算法,多维信息的复合、分析、可视化等。3.2 分布式空间数据库技术分布式空间数据库能够将已经存在的空间数据库集成,形成一个虚拟的数据库,被所有用户(全局用户)共享,即满足空间数据共享的要求。全局用户不需要知道数据的物理存储位置,也能够访问到数据,好像数据就存储在本场地上似的。所有“真实”的数据都是属于本地参与空间数据库的,即本地数据由本地拥有,既使他们可以被其他的场地访问;同时参与空间数据库对本地数据的所有操作,不受其他场地的控制,即使是全局的空间数据库系统。支持分布式查询处理,全局用户的一次查询可以涉及到两个或两个以上场地的数据。分布式空间数据库系统对用户屏蔽了各个参与空间数据库系统的异构性,即支持异构空间数据库的集成。分布式空间数据库系统也对用户屏蔽了各个参与空间数据库系统异构的操作环境,包括计算机、操作系统与网络协议。3.3 空间数据仓库技术该技术具有以下特点:面向主题的。传统的GIS数据库是面向应用的,GIS空间数据仓库是面向主题的,它以主题为基础进行分类、加工、变换,从更高层次上进行综合利用;面向集成的。空间数据仓库的数据应该是尽可能全面、及时、准确。传统的GIS应用是其重要的数据源,为此空间数据仓库的数据应以各种面向应用的GIS系统为基础,通过元数据将它们集成起来,从中得到各种有用的数据;数据的变换和增值。空间数据仓库的数据来源于不同的面向应用GIS系统的数据,由于数据冗余及其标准和格式存在差异等一系列原因,不能把数据原封不动地存入数据仓库,应该按照主题对空间数据进行变换和增值,提高数据的可用性;空间序列的方位数据。自然界是一个立体的空间,任何事物都有自己的空间位置,彼此之间有相互的空间联系,因此任何信息也都应该具有空间标志。一般的数据仓库是没有空间维数的,不能做空间分析,不能反映自然界的空间变化趋势。进入GIS空间数据仓库的空间数据必须具有统一的坐标系和相同的比例尺;时间序列的历史数据。自然界是随时间变化的,地理数据库需要随环境的变化而不断更新,在研究、分析问题时可能需要了解过去的数据。数据仓库中的数据包含了数据的时间属性,因而GIS能管理不同时间的数据,满足用户数据版本管理的要求;基于空间数据仓库的GIS能将数据仓库中的数据以多种形式直观地呈现给用户,为决策人员提供面向主题的分析工具。3.4 空间数据引擎的发展趋势高维空间索引 三维 GIS、多媒体数据库和时空数据库等对多维空间目标的搜索与更新效率的要求日益迫切,有必要研究一种可扩展的高维索引技术,能同时高效地检索一维、二维或高维的空间数据。基于空间关系的动态索引当前空间索引技术的劣势在于基于空间目标的位置信息建立索引结构,来提高空间数据库系统中的区域查询效率,难以根据目标间的空间关系建立有效的索引机制

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论