(计算机科学与技术专业论文)基于arcsde的空间数据库技术研究与工程实现.pdf_第1页
(计算机科学与技术专业论文)基于arcsde的空间数据库技术研究与工程实现.pdf_第2页
(计算机科学与技术专业论文)基于arcsde的空间数据库技术研究与工程实现.pdf_第3页
(计算机科学与技术专业论文)基于arcsde的空间数据库技术研究与工程实现.pdf_第4页
(计算机科学与技术专业论文)基于arcsde的空间数据库技术研究与工程实现.pdf_第5页
已阅读5页,还剩82页未读 继续免费阅读

(计算机科学与技术专业论文)基于arcsde的空间数据库技术研究与工程实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 数据是地理信息系统中最基础的部分,分为两类:一类主要是和空间位置、 空间关系有关的数据,称为空间数据;另一类是地理元素中非空间的属性信息, 称为属性数据。在以往的应用系统中,通常的做法是将两类数据分别存储,利 用关系型数据库来存储属性数据,而由于空间数据的特殊性,则保持原有文件 结构不变,以文件形式存储空间数据。通过在空间数据文件和关系型数据库中 的属性数据之间建立关联为基础来构建应用系统。 然而,这种两类数据分别存储的方式适用于单机的地学领域应用。随着应 用向分布式的管理系统领域的转移,地理信息系统空间数据的文件管理模式在 实现数据共享、网络通信、并发控制及数据的安全恢复机制等方面出现了难以 解决的问题。 本课题以深圳城市交通仿真系统为例,首先对空间数据研究的意义、可行 性和国内外研究现状进行了较为深入的分析,明确了空间数据研究的主要内容 和地理信息系统设计、开发要解决的关键技术问题,包括多维数据的存储和处 理,以及分析这种数据处理方式给分布式应用系统开发带来的利弊,继而介绍 以数据中间件的方式来处理和存储地理信息系统( g i s ) 中空间数据,并对e s r i a r c s d e 技术进行详细分析,详细阐述了这种先进的解决方案如何实现管理空间 数据的理论细节和以a r c s d e 作为数据网关开发地理信息系统应用系统的途径。 进而提出了基于该项技术的地理信息系统的开发方法,最后,对现阶段的研究 设计成果和需要进一步完善的地方进行了总结,展望了下一步需要继续深入进 行的研究和探索工作。 关键词:空间数据,地理信息系统,a r c s d e a b s t r a c t a b s t r a c t a st h em o s tf u n d a m e n t a le l e m e n to fg e o g r a p h i ci n f o r m a t i o ns y s t e m ,d a t ac a nb e c l a s s i f i e di n t ot w ot y p e s o n ei sr e l a t e dw i t hs p a t i a la t t i t u d ew h i c hi sc a l l e ds p a t i a l d a t aw h i l et h eo t h e ri st h ep r o p e r t yi n f o r m a t i o na b o u tt h es p a t i a le l e m e n t i nt h eo l d a p p l i c a t i o ns y s t e m ,t h ef o r m e ro n ei ss t o r e di nd o c u m e n tw i t hs p e c i f i e df o r m a tw h i l e t h el a t t e ro n e s t a y sa tr d b m s t h a t i st h et y p i c a ls o l u t i o nf o rt h es t a n d a l o n es y s t e m w h i c hc a u s e sal o to fi s s u e si nd i s t r i b u t e ds y s t e m t h i sp a p e rw i l lt a k es h e n z h e nu r b a nt r a n s p o r t a t i o ns i m u l a t i o ns y s t e ma sa n e x a m p l ea n dg i v e sa n a l y s e so ft h es i g n i f i c a n c e ,r e a l i z i n gp o s s i b i l i t ya n dt h es t u d y s t a t u sa b o u tm a n a g e m e n ta n ds t o r a g eo fs p a t i a ld a t af i r s t l y t h er e s e a r c hc o n t e n t , s y s t e md e s i g n i n ga n dt h ee s s e n t i a lt e c h n i q u et os o l v ea r ec o n f i r m e dt h e n t h e m i d d l e w a r ea r c s d e ,a sa k e yf o rs o l u t i o n ,w i l lb ei n t r o d u c e di nd e t a i l s b ya n a l y z i n gt h em e c h a n i s mo fa r c s d e ,t h ea r t i c l ew i l lt e l lt h ed e t a i l sa b o u t h o wa r c s d ec a na c c e s sa n dm a n a g et h es p a t i a ld a t a ad e v e l o p m e n tt e c h n o l o g y b a s e do ns u c hs o l u t i o ni sa l s op r o v i d e d t h ec u r r e n tr e s e a r c hr e s u l ta n dt h ef u r t h e r s t e pt oi m p r o v et h es y s t e mf u n c t i o na l ec o n c l u d e d ,a n dt h en e x tr e s e a r c ha n dw o r k a l ea l s oe x p e c t e di nt h ep a p e rf i n a l l y k e yw o r d s :s p a t i a ld a t a ,g e o g r a p h i ci n f o r m a t i o ns y s t e m ,a r c s d e 同济大学硕士学位论文 学位论文版权使用授权书 本人完全了解同济大学关于收集、保存、使用学位论文的规定, 同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、 扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供 本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前 提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名:槲 如g 年2 月) 7 日 经指导教师同意,本学位论文属于保密,在年解密后适用 本授权书。 指导教师签名:学位论文作者签名: 年月 日年 月日 同济大学硕士学位论文 同济大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行 研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文 的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 签名:鹄柚 扣起年入自) 日 第1 章引言 第1 章引言 1 1 系统研究的意义 地理信息系统( g e o g r a p h i ci n f o r m a t i o ns y s t e m ,g i s ) 是能够收集、管理、 查询、分析、操作以及表现与地理相关的数据信息的计算机信息系统,能够为 分析、决策提供重要的支持平台。 业界几乎所有的专业人士都不同程度依赖空间信息进行决策支持,他们采 用空间数据库系统捕捉、存储空间数据,并推广应用到数据仓库和数据集市, 用户在使用过程中能够非常方便地利用这些数据进行数据分析。 通常我们能够通过带有经纬度的坐标系统( x ,y ) 来描述一个汽车站,用 直线描述街道以及用一系列线段描述汽车线路,然后应用系统就能够很好地解 释带有地理属性的数据,例如点、线和路径。而在计算机的处理中,通常需要 采用系统软件引擎将对象模型化,使得它们能够很好地将人们所熟识的东西表 现出来,同时也就大大提高了系统的可维护性和易用性,通常我们会通过传统 的面向对象的技术来达到这个目的。因此,为了更好地理解商业上所需要的空 间数据,我们根据对某数据更新的频率和数据访问的次数对数据进行分类。x 坐 标代表数据的访问次数,y 坐标代表数据的更新频率。空间数据可以用来表示简 单对象,( 例如点的经纬度) ;也可以进一步表示地址或者复杂对象( 例如城市、 公园和高速公路) 。 可以看出数据访问频率的差距很大,慢的可以是几年甚至几十年访问一次, 例如档案数据( 物体自然属性、存储信息等) ;快的可以是一分钟上千次,例如 对于销售信息的处理。实时或者类实时数据( 销售变化、客户电话技术支持或 者突发性事件报告) 更新速度是非常迅速的。通过对这些数据的处理,为用户 揭示数据之间的关联,为决策人员提供一个良好的辅助进而制定行之有效的运 营政策。 如果想要合理地管理、存储与访问这些数据,就需要管理系统具有很强的 数据交互处理能力,并具有很好的安全保密性,同时帮助用户更直观揭示每一 个数据对象的含义。用户需要应用系统能够在最短的时间内以最简洁的方式提 供准确的信息。 6 第1 章引言 地理信息系统广泛地应用于地学、资源管理、土地规划、环境监测、防灾 减灾、电力行业、交通管理、城市规划、科研、教育和国防等领域,在我国国 民经济建设中发挥着越来越重要的作用。 1 2 系统研究的可行性 空间数据应用的关键在于这些空间数据是否能够在普通数据库中进行索 引。例如,经纬度坐标可以用来表示地球上任意一点所包含的许多相关数据, 如海拔、土地归属、人口分布、坡度以及其他相关文件信息。在这里,空间数 据就是地理空间数据。但是空间数据绝不仅仅限于地理空间数据。空间数据可 以被广泛应用在项目设计、汽车维修、石油化工以及生物工艺等,而这些空间 数据已经逐渐为i t 业务部门的经理们所熟悉。 目前,许多企业级的空间数据应用系统还只是停留在为大家所认识的阶段, 尽管在许多情况下其使用是十分必要的。大部分管理人员仍然认为空间数据应 用仅仅是类似“我所在的位置2 0 0 英里范围内客户分布情况如何? ”之类的广 义查询。管理人员也才刚开始学习如何将空间数据的应用与企业应用系统结合 在一起。实际上,空间数据包括任何在普通空间坐标系统中能够被索引到的数 据。 一个企业级的空间应用系统要求能够将任何数据移植到普通的坐标系中, 这个过程包括对数据的准确分类和注册,以及使所有的数据能够与一个空间坐 标系建立关联( 地理编码) 。而对于图形数据来说,则要求应用系统要对图形数 据进行重新定位,以便能够清晰地将图形数据在普通坐标系中定位。这一系列 工作,包括数据分类、注册以及重新定位的实现,就能够保证数据库中的每一 个对象被准确无误地叠加在地图上。这样也同时大大减少了数据的冗余,实现 数据挖掘以及数据的可视化分析。例如,任何一个企业都拥有自己的客户数据 库。地理编码过程可以对每一条客户记录叠加经纬度信息,这样经纬度客户信 息就可以被影射到图层上( 光栅图) 。 1 3 国内外研究现状 地理信息系统技术是一门综合性的技术,它的发展是与地理学、地图学、 摄影测量学、遥感技术、数学和统计科学、信息技术等有关学科的发展分不开 7 第1 章引言 的。g i s 的发展可分为四个阶段: 第一个阶段是初始发展阶段,2 0 世纪6 0 年代世界上第一个g i s 系统由加拿 大测量学家r f t o m l i s o n 提出并建立,主要用于自然资源的管理和规划; 第二个阶段是发展巩固阶段,2 0 世纪7 0 年代由于计算机硬件和软件技术的 飞速发展,尤其是大容量存储设备的使用,促进了g i s 朝实用的方向发展,不 同专题、不同规模、不同类型的各具特色的地理信息系统在世界各地纷纷付诸 研制,如美国、英国、德国、瑞典和日本等国对g i s 的研究都投入了大量的人 力、物力和财力; 第三个阶段是推广应用阶段,2 0 世纪8 0 年代,g i s 逐步走向成熟,并在全 世界范围内全面推广,应用领域不断扩大,并与卫星遥感技术结合,开始应用 于全球性的问题,这个阶段涌现出一大批g i s 软件,如a r c i n f o ,g e n a m a p ,s p a n s , i d a p i n f o ,e r d a s ,m i c r o s t a t i o n 等;第四个阶段是蓬勃发展阶段,2 0 世纪9 0 年代,随着地理信息产品的建立和数字化信息产品在全世界的普及,g i s 成为确 定性的产业,并逐渐渗透到各行各业,成为人们生活、学习和工作不可缺少的 工具和助手。 地理信息系统的研制与应用在我国起步较晚,虽然历史较短,但发展势头 迅猛。我国g i s 的发展可分为三个阶段。 第一阶段从1 9 7 0 年到1 9 8 0 年,为准备阶段,主要经历了提出倡议、组建 队伍、培训人才、组织个别实验研究等阶段。机械制图和遥感应用,为g i s 的 研制和应用做了技术和理论上的准备。 第二阶段从1 9 8 1 年到1 9 8 5 年,为起步阶段,完成了技术引进、数据规范 和标准的研究、空间数据库的建立、数据处理和分析算法及应用软件的开发等 环节,对g i s 进行了理论探索和区域性的实验研究。 第三个阶段从1 9 8 6 年到现在,为初步发展阶段,我国g i s 的研究和应用进 入有组织、有计划、有目标的阶段,逐步建立了不同层次、不同规模的组织机 构、研究中心和实验室。g i s 研究逐步与国民经济建设和社会生活需求相结合, 并取得了重要进展和实际应用效益。主要表现在四个方面: 1 ) 制定了国家地理信息系统规范,解决信息共享和系统兼容问题,为全国 地理信息系统的建立做准备。 2 ) 应用型g i s 发展迅速。 3 ) 在引进的基础上扩充和研制了一批软件。 8 第1 章引言 4 ) 开始出版有关地理信息系统理论、技术和应用等方面的书籍,设立了地 理信息系统专业,培养了大批人才,并积极开展国际合作,参与全球性 地理信息系统的讨论和实验。在科技部等国家有关部门的大力组织和支 持下,国产g i s 基础软件开发工作取得了重要进展,出现了一批g i s 高 技术企业,开发出了较为成熟的国产g i s 软件,如m a p g i s 、g e o s t a r 、 c i t y s t a r 、s u p e r m a p 、m a p e n g i n e 、g r o w 等,并形成了一定的产业规模。 这些国产g i s 软件以较高的性价比,打破了国外g i s 软件对我国市场的 垄断,有力促进了我国地理信息系统技术的发展。近年来,g i s 技术在 我国得到了广泛应用,其应用面从传统的城市规划、土地利用、测绘、 环境保护、电力、电信、减灾防灾等领域渗透到矿产资源调查、海洋资 源调查与管理等各方面,取得了丰硕的成果和巨大的经济效益。当前, 国家有关部门正逐步将g i s 嵌入到电子政务系统中。 随着计算机和信息技术的快速发展,近年来g i s 技术得到了迅猛的发展。 g i s 系统正朝着专业或大型化、社会化方向不断发展着。“大型化”体现在系统 和数据规模两个方面;“社会化”则要求g i s 要面向整个社会,满足社会各界 对有关地理信息的需求,简言之就是“开放数据 、“简化操作”,“面向服 务,通过网络实现从数据乃至系统之间的完全共享和互动。下面我们从地理 信息系统技术角度来讨论和分析当前g i s 的相关技术及其发展趋势。 1 3 1 空间信息的获取、处理与交换 地理空间数据是g i s 的血液,构建和维护空间数据库是一项复杂、工作量 巨大的工程,它包括:数据的获取、校验和规范化、结构化处理、数据维护等 过程。g i s 处理的数据对象是空间对象,有很强的时空特性,获取数据的手段及 数据的形式也复杂多样。获取数据的基本方式有:野外全站仪平板测量、g p s 测 量、室内地图扫描数字化、数字摄影测量、从遥感影像进行目标测量和数据转 换等。目前,这些获取技术已基本成熟。同时,空间数据也具有很强的时效性, 不同的空间数据必须进行周期不等的数据更新维护,空间数据库中数据的准确、 及时、完整是实现g i s 应用系统价值的前提基础。空间数据维护往往涉及跨部 门、跨行业的多种数据格式和多种数据类型的大量数据,提供有效的空间数据 编辑更新手段是当前亟待解决的一个重要课题。 基于上述信息获取技术,在过去的二十年间,国家有关部委和行业部门已 9 第1 章引言 经积累了大量原始数字化数据和相应资料,建立了11 0 0 多个大、中型数据库以 及大量的各类数字化地理基础图、专题图、城市地籍图等。国家测绘局已经完 成了全国1 :1 0 0 万、1 :2 5 万基础地理空间数据库以及全国七大江河数字地形 模型的建设,并启动了全国l :5 万,部分省份1 :1 万基础地理空间数据库的 建设。这些基础数据有力促进了g i s 技术的广泛应用,进而产生了大量的g i s 数据。但由于地理信息系统软件大多采用不同的空间数据模型,以及它们在地 理实体上的认识差异,使得所积累的数据难以转换和共享( 即使能够数据转换, 也会产生信息的丢失) ,从而形成一个个新的数据孤岛。制订数据交换的格式标 准已成为大家的共识。目前一些国家和组织已经在进行这方面的工作,并定义 了一些数据交换标准,如s d t s ,o p e n g i s 联盟制订的g m l ,另外一些公认的数据 格式如d x f ,s h a p e f i l e 和m i f 文件格式等正逐渐成为数据交换的事实标准。我 国也在“九五”期间制定了地球空间数据转换标准。但是由于目前人们对空间 信息认识和研究成果的制约,还没有一个统一的地理数据模型,因此建立实用 的数据交换格式和信息标准将是一个长期、复杂过程。 1 3 2g i s 软件体系结构与应用系统开发 地理信息系统与软件技术是密不可分的。特别是随着面向对象、组件技术、 分布式计算技术以及网络技术的发展,g i s 软件的体系结构出现了极大的变化, 出现了许多开发地理信息系统的新技术,如组件技术、中间件技术和分布对象 技术等。 组件是建立在面向对象开发之上的,它为用户提供多个接口,接口封装了 组件提供的服务,隐藏了实现细节的可见性。由于组件表示一个或多个较细粒 度类的逻辑集合,封装了一系列的服务,因此组件提供了更高级别的重用性, 从而极大提高了应用系统的开发效率。组件式g i s 是面向对象技术和组件式软 件在g i s 软件开发中的应用,为新一代g i s 应用提供了全新的开发工具。g i s 组 件封装了一系列空间信息处理相关的操作,并向用户提供了标准的接口。这样 用户可以使用通用的程序开发语言,通过接口调用g i s 组件中相应的空间操作 功能,实现g i s 应用系统的开发。 同传统g i s 比较,组件g i s 具有易于实现与其它信息系统的无缝集成、跨 语言使用、易于推广、成本低、扩展性强、开发效率高等特点。因此组件式g i s 是当前g i s 系统软件开发的主流技术。目前存在着多种组件技术标准,其中o m g l o 第1 章引言 的c o r b a ,m i c r o s o f t 的c o m d c o m 和j a v a 的b e a n s 是被广泛采用的标准。目前 商用的组件式g i s 产品主要基于m i c r o s o f t 的c o m d c o m ,包括i n t e r g r a p h 的 g e o m e d i a ,e s r i 的m a p o b j e c t s ,m a p l n f o 的m a p x ,我国的m a p e n g i n e 、s u p e r m a p 由蟹 专子。 随着网络技术的发展和广泛应用,计算机应用模式经历了主机模式、单机 桌面应用模式和多层企业应用模式三个阶段。相应地,应用系统的开发也经历 了从主机体系结构、两层c l i e n t s e r v e r 体系结构到三层( 多层) c 1 i e n t s e r v e r 体系结构的演变。传统的g i s 应用一般都采用两层c 1 i e n t s e r v e r 体系结构。 这种体系结构用户界面层和业务逻辑层没有分开,都位于客户端,而数据服务 层位于服务器端,由于应用主要都集中在客户端,每个客户端都要进行安装配 置,当用户数量多、分布广时就会给安装、维护带来相当大的困难,扩展性不 好。此外每个用户与中央数据库服务器相连时都要保留一个对话,当很多客户 同时使用相同资源时,容易产生网络堵塞。为了克服两层c 1 i e n t s e r v e r 结构 的不足,提出了三层c l i e n t s e r v e r 模型。三层客户服务器结构构建了一种分 割式的应用程序,系统对应用程序进行分割后,划分成不同的逻辑组件,即用 户服务层、业务处理层、数据服务层。与两层c 1 l e n t s e r v e r 结构相比,三层 c 1 i e n t s e r v e r 结构有很多优越性,如减轻了客户机的负担,如果要增加服务则 只需在中间层添加代码,这使得维护升级变得更加方便,系统扩展性也更好。 因此采用三层c 1 i e n t s e r v e r 机构是当前g i s 应用开发的主流模式。 随着g i s 应用由局域网发展到广域网,特别是涉及到多数据库系统、多平 台、多网络协议的异构环境,传统的将用户界面和业务逻辑、数据源以及通讯 协议绑定在一起的应用系统开发方式不再适合。而中间件技术的出现,为异构 环境下g i s 应用的开发提供了解决方案。中间件是位于操作系统和应用软件之 间的通用服务,它的主要作用是用来屏蔽网络硬件平台的差异性和操作系统与 网络协议的异构性,支持应用软件开发和运行的系统软件,使应用软件相对独 立于计算机硬件和操作系统平台,为大型分布式应用搭起了一个标准的平台, 以实现大型应用软件系统的集成。中间件具有标准的程序接口和协议,可以实 现不同硬件和操作系统平台上的数据共享和应用互操作。在具体实现上,中间 件是一个用a p i 定义的分布式软件管理框架,具有强大的通信能力和良好的可 扩展性。广义上说,e s r i 的空间数据库引擎s d e 可以看作是地理信息的一个中 间件,它屏蔽了底层不同空间数据库以及不同空间数据格式的差异,为用户提 第1 章引言 供了统一的操作和管理空间信息的接口。采用中间件技术,为异构环境下的g i s 应用的开发提供了一个解决方案,对当前g i s 重大行业应用系统的开发具有重 要的意义。目前,中间件技术尚处于发展阶段,采用中间件技术实现通用的g i s 应用还需要一段很长的路要走。 分布式对象技术是当今分布计算技术的主流方向,它能在分布式环境下跨 平台、跨语言地实现分布式计算,并使得用户在使用对象时可以访问网络上任 意有用的对象而不必知道该对象所处的位置。采用分布式对象技术开发g i s 应 用符合地理信息分布的特点,客户可以透明地访问远程的g i s 组件服务。这种 方式适合于空间信息服务的实现,可用于解决在分布式环境下的地理信息的互 操作( 包括数据和功能两方面) 。当前,基于对象的分布式计算的代表性技术是 o m g 的c o r b a 、m i c r o s o f t 的d c o m 和j a v a 的j 2 e e 。与此同时,为满足分布协同 工作的应用需求,人工智能领域中的a g e n t 技术被引入到分布式计算环境中, 对基于c 1i e n t s e r v e r 结构的传统分布式系统产生了极大的冲击,分布式系统 正朝着分散对等的协同计算的理想模式发展。注意到a g e n t 的自主性、交互性、 反应性和主动性等特征极大简化了分布协同问题的复杂性,因此将a g e n t 技术 引入g i s 领域,将极大降低分布式地理信息系统的复杂性和建设难度,并有效 地解决网络地理空间信息服务功能以及g i s 应用领域中的协作问题,同时也可 以改善分布式地理信息系统的服务能力和服务效率。因此研究a g e n t 技术与g i s 的集成,是g i s 技术发展的又一个重要研究方向。 1 3 3 空间信息的共享和互操作 信息共享已经成为现代信息社会发展的一个重要标志,而地理信息系统互 操作的产生则是信息共享的必然产物,地理信息系统的互操作将成为2 1 世纪地 理信息系统研究领域的一个重要组成部分。 互操作性强调将具有不同数据结构和数据格式的软件系统集成在一起共同 工作。实际上,地理信息系统互操作在不同的情况下具有不同的侧重点,强调 软件功能块之间相互调用的时候就称为软件的互操作;强调数据集之间相互透 明地访问的时候则称为数据的互操作;强调信息的共享,在一定语义约束下的 互操作则称为语义的互操作等等。一般地,地理信息系统互操作是指不同应用 ( 包括软件硬件) 之间能够动态实时地相互调用,并在不同数据集之间有一个稳 定的接口。 1 2 第l 章引言 在国际上,空间信息系统互操作研究经历了从数据互操作到中间件、分布 式对象和服务,再到应用系统乃至高层的信息互操作的发展历程。主要的互操 作方式有以下几种:直接转换方式、采用公共交换格式方式、公共访问接口方 式。这些方式都需要对数据的具体格式有详细的了解,随着数据格式越来越复 杂,运用面向对象的方法来解决互操作问题逐渐成为新的研究方向。 访问接口是指系统对外界环境和其它系统所提供的访问其内部数据的操作 接口。该接口可以通过请求应答方式来接受或者提供数据,因此互操作的程度 可通过接口功能的大小来体现,而与数据的内部结构无关。数据提供者通常会 随着数据提供相应的a p i ,数据使用者可以通过这些a p i 来访问系统内部的数据。 a p i 能够将数据结构的复杂性或者操作的复杂性掩藏起来,并且能够通过编程将 这些a p i 与数据服务器结合在一起,形成一个功能更加强大的数据服务器来响 应外界的数据服务请求。为了减少a p i 对具体应用环境的依赖,用户、数据提 供者和系统开发者迫切需要建立一个在业界广泛而通用的接口,这个需求和思 路导致了o o c 的产生。o o c 通过制定o p e n g i s 规范的方式来建立广泛的接口。 o p e n g i s 规范是一个关于对地理数据和地理处理资源进行分布式访问的软件框 架规范,它为所有的软件开发者提供了一个详细的公共准则,以便开发的软件 能够达到对地理数据和地理处理资源进行互操作的目的。o p e n g i s 规范的任务是 指导开发者开发与o p e n g i s 规范一致的中间件、组件和具有处理各种类型地理 数据的应用件,使系统用户能共享巨大网络数据空间上的数据。o p e n g i s 规范直 接涉及访问和使用不同类型的地理数据,它包括三个基本方面:获得在各种平 台之间的连接,获得对地理数据和对地理数据处理的服务,获得对地理数据的 正确理解。目前,世界上包括我国在内的许多g i s 相关研究单位和企业纷纷加 入o g c ,参与o p e n g i s 规范的制订,并着手实现和完善各种规范和接口,以满足 信息共享的需求。 1 4 本文的主要研究内容 本文结构如下: 第一章引言 主要介绍了本文的研究意义、背景和系统实现的可行性。阐述了空间数据 管理和开发在各行业的应用领域、应用价值和发展现状。 1 3 第1 章引言 第二章空间数据管理理论和技术。 主要描述了空间数据的特征、存储方式从文件系统道关系型数据的演变、 空间数据的检索、和网络传输中数据压缩与客户端缓存技术的应用。 第三章主流空间数据管理技术比较 从市场定位、空间数据模型和存储、存储效率、可用性等角度详细比较了 a r c s d e 和o r a c l es p a t i a l 两种主流空间数据管理技术。 第四章a r c s d e 工作机制 详细描述了a r c s d e 的工作机制,并对a r c s d e 的架构、空间数据模型、存 储方式、地理要素的管理、所采用的数据模式和a r c s d e 的长事务处理和版本管 理进行了详细讨论。 第五章基于a r c s d e 管理空间数据 主要介绍基于o r a c l e 的a r c s d e 如何配置和相关的数据备份以及恢复的操 作。 第六章基于a r c s d e 的地理信息系统的开发 以实际的软件项目作为实践,详细阐述基于a r c s d e 开发地理信息系统。 第七章总结与展望 总结本文的内容并对未来的空间数据库技术作出展望并进一步明确下一步 的研究方向和内容。 1 4 第2 章空间数据库技术与理论 第2 章空间数据库技术与理论 2 1 空间数据的特征 数据是信息系统的基础,一般认为数据是信息的载体,信息是数据的内涵。 利用计算机来处理数据,提取信息是信息系统的基本功能。g i s 处理的主要是和 空间位置、空间关系有关的数据。一般来说,数据具有以下基本特征: 1 ) 选择性。 数据从某一( 些) 侧面描述事物本身。 2 ) 可靠性。 有很多原因影响数据的可靠性,比如数据在获取,存储,管理,传播过 程中会出现差错,导致数据的失真。必须保证数据的可靠性。 3 ) 时间性。 事物是动态的,发展的,数据只能反映事物在某个时间态下的状态。关 于数据时间性的研究比较多,也有一些专著。 4 ) 完备性。 数据的不完备往往导致分析结果的不完善,甚至会造成决策失误。 5 ) 详细性和综合性。 空间数据除了具有一般数据的特征之外,还具有一些区别于其他数据的特 性。构成空间数据的特征主要有: 2 1 1 空间性 这是空间数据最主要的特性。空间数据描述了空间物体的位置、形态,甚 至需要描述物体的空间拓扑关系。例如描述一条河流,一般数据侧重于河流的 流域面积,水流量,枯水期等。而空间数据则侧重于河流的位置、长度、发源 地等和空间位置有关的信息。复杂一点的还要处理河流与流域内城市间的距离、 方位等空间关系。空间性是空间数据区别于其他数据的标志特征。 2 1 2 抽象性 空间数据描述的是现实世界中的地物和地貌特征,非常的复杂,必须经过 抽象处理。不同主题的空间数据库,人们所关心的内容也有差别。所以空间数 1 5 第2 章空间数据库技术与理论 据的抽象性还包括人为地取舍数据。抽象性还使数据产生多语义问题。在不同 的抽象中,同一自然地物表示可能会有不同的语义。如河流既可以被抽象为水 系要素,也可以被抽象为行政边界,如省界,县界等。 2 1 3 多尺度与多态性 不同的观察尺度具有不同的比例尺和不同的精度,同一地物在不同的情况 下就会有形态差异。最典型的例子有:就形态而言,任何城市在地理空间中都 占据一定范围的区域,因此可以认为其是面状地物,但在比例尺比较小的空间 数据库中,城市是作为点状地物来处理的。 2 1 4 多时空性 g i s 数据具有很强的时空特性。一个g i s 系统中的数据源既有同一时间不 同空间的数据系列;也有同一空间不同时间序列的数据。不仅如此,g i s 会根 据系统需要而采用不同尺度对地理空间进行表达。g i s 数据是包括不同时空和 不同尺度数据源的集成。 2 2 空间数据存储方式的演变 著名学者陈述彭先生曾经指出,地理信息系统脱胎于计算机制图。早期的 空间数据存储比较凌乱,往往以存储地图的形式来存储数据。在存储空间数据 的同时,还保存空间数据的拓扑关系。例如早期a r c i n f o 所采用的“节点一弧 段一多边形 的数据模型。这种数据模型处理单个对象的能力很弱,修改一个 的对象时候,会牵涉到其他的对象。由于需要维护拓扑关系,对空间数据的更 新修改比较麻烦。 需要指出的是,由于c a d 软件在制图方面的优势,部分g i s 的人员选用c a d 软件作为制图系统。大量的g i s 数据是存储在c a d 文件中的,如a u t o d e s k 的d w g 文件格式。但是c a d 系统所管理的数据文件一般情况下都比较小,( 如 m i c r o s t a t i o n 的d g n 格式,数据量最大不超过3 2 m ,d w g 文件很少超过1 0 0 m 的) , 无法满足g i s 系统的大数据量要求。 以空间数据表示的地物不仅具有空间信息,而且具有很多的非空间的附属 信息。如城市的人口,国民生产总值等,这些构成了地理元素的属性信息。在 早期的文件中,由于存储空间数据和属性数据所采用的格式不同,在g i s 系统 1 6 第2 章空间数据库技术与理论 中一般都将其分开存储。这样,维护两者的一致性并进行一体化管理便成为必 须解决问题。 随着面向对象思想的出现和面向对象方法学的应用,人们开始用面向对象 的思想来进行空间数据模型的设计。按照面向对象思想,每种地物都可以被抽 象为某一类具有公共属性的对象,如点,线,面等,具体的地物则是该对象的 一个实例,它还具有自己的属性。各种对象分层管理。这样就解决了空间数据 与属性数据的一体化管理。 早期的文件都是针对专门的软件的,各个g i s 软件厂商都有自己的文件格 式,无法共享数据。随着g i s 的发展,出现了一些数据格式标准化组织,提出 了统一空间数据编码的思想,以便在不同g i s 系统之间的进行数据交换。但各 种文件格式之间的数据转换依然费时费力,这就导致了g i s 系统的建设成本居 高不下。对于g i s 厂商来说,由于需要文件格式的升级和向下兼容,导致开发 负担大大加重。 在其他的信息系统建设中,人们也碰到了同样的问题,这就要求数据的存 储需要有统一的标准,以便于维护与升级并提供开放式的管理方法。于是,关 系数据库系统应时而生。借助于标准的s q l 语言与o d b c 和后来的a d o 等技术, 使人们获得了比较满意的解决方案。 由于空间数据的特殊性,它要处理的数据都具有空间特征和空间关系,难 以在关系模型中表达。利用关系数据库来存储空间数据在理论与技术上的遭遇 了暂时的困难。这个阶段,有些系统开始利用关系数据库来存储属性数据,而 空间数据保持原有文件结构不变,通过在空间数据和属性数据之间建立关联的 方法架起二者的桥梁。如在m i c o r s t a t i o n 中,可以通过设立m s l i n k 属性与外 部数据库连接。 纵观计算机的发展,最初的数据是适应特定的系统的,每一个系统都拥有 自己的数据格式。并有特定的数据结构来适应程序和算法,这时考虑的重点是 系统的专有性;随着数据量的增多,数据共享需求的提出,数据的重要地位越 来越突出,各个系统开始考虑数据的统一问题,并且提出了一些改良方案。最 后初步形成了目前集各种技术之大成的空间数据库系统,标志空间数据库技术 和空间数据库系统的初步成熟。而且,基于关系数据库或者对象关系数据库的 空间数据管理正在逐步成为g i s 发展的潮流。 1 7 第2 章空间数据库技术与理论 2 3 空间数据模型 空间数据模型刻画了现实世界中空间实体及其相互间的联系,它为空间数 据的组织和空间数据库的设计提供了基本的方法。因此,空间数据模型的研究 对设计空间数据库和发展新一代g i s 系统起着举足轻重的作用。在g i s 中与空 间信息有关的信息模型有三个,即基于对象( 要素) ( f e a t u r e ) 的模型、场( f i e l d ) 模型以及网络( n e t w o r k ) 模型。目前g i s 基础软件平台的研制和应用系统的设计 开发一直沿用这三种空间数据模型,但这些模型在空间实体间的相互关系及其 时空变化的描述与表达、数据组织、空间分析等方面均有较大的局限性,难以 满足新一代g i s 基础软件平台和应用系统发展的要求。主要表现为: 仅能表达空间点、线、面目标间极为有限的简单拓扑关系,且这些拓扑关 系的生成与维护耗时费力; 难以有效地表达现实三维空间实体及其相互关系; 适于记录和表达某一时刻空间实体性状及相互间关系静态分布,难以有效 地描述和表达空间实体及其相互间关系的时空变化; 没有考虑异地、异构、异质空间数据的互操作和分布式“对象处理等问 题。 针对上述不足,时空数据模型、三维数据模型、分布式空间数据管理、g i s 设计的c a s e 工具等研究已成为当前国际上g i s 空间数据模型研究的学术前沿。 关系理论的研究与应用都已经比较成熟,面向对象方法学更是在现代软件的设 计和开发中发挥了至关重要的作用。如何将两者结合来设计数据库系统也是当 前研究的热点。 考察一下关系模型和面向对象两种理论的特点,我们将会发现,关系模型 描述关系时,采用的是“实体关系”模型( e r 模型) ,使用s q l 语句进行 检索,侧重点是对象之间属性的聚集。也就是说,实体对象模型描述的是实体 的外在特征的关联,对于空间数据的属性查询,这是非常理想的解决方案。但 是,我们知道,空间数据的之间的空间关系是他们的内在联系,是由空间地物 的地理位置关系决定的,并且往往是多对多的、错综复杂的关系。在描述这种 关系时,目前的关系模型就不是很理想了,要完成空间关系的查询还相当的困 难。为此,许多的g i s 研究都提出了与s q l 相类似的“空间查询语言 ( s p a t i a l q u e r yl a n g u a g e ) ,但目前仍处于不成熟的阶段。 再看面向对象理论,以抽象性、封装性、多态性来描述对象。对象具有方 第2 章空间数据库技术与理论 法和属性,对象之间的关系是通过消息机制来沟通的。用面向对象的方法来处 理空间物体之间的关系是比较自然的。o p e n g i s 定义了一组空间关系算子,包括 了各种对象的空间关系。在对象中实现了这些算子,基本上就可以描述对象之 问的空间关系了。对象的空间位置判断已经有了一些比较成熟的算法和程序。 面向对象与关系模型对于空间关系的描述能力,是截然不同的。我们不难 看出,关系模型侧重于描述对象的外在联系,反映的是对象的聚集。面向对象 可以处理对象之间的关系,但处理对象的属性的能力又不如关系模型。基于以 上分析,当前的地理信息系统中,真正实现空间数据与属性数据一体化管理是 有一些不足的。使用s o l 语句难以做到空间关系和属性特征联合查询。这就涉 及到了空间索引的s q l 表达问题。 基于空间数据面向对象的特性,在利用r d b m s 存储空间数据时,我们显然 希望结合两者的优点,设计出符合要求的数据库系统。 2 4 空间数据的检索 空间数据的组织,关键是数据的索引与检索。空间索引的性能优劣直接影 响空间数据库和地理信息系统的整体性能,它是g i s 的一项关键技术。( 参见引 文 2 :空间信息查询) 对于空间索引,学者研究得较多,常见的有b s p 树、k - d - b 树、r 树、r + 树、 c e l l 树、四叉树等。除此之外,简单的网格型的空间索引也有着广泛的应用。 如e s r i 的软件a r c s d e 就使用了一种改进的网格索引。 网格索引是多对多的索引,即一个几何对象可能跨越穿越多个网格,而一 个网格往往包含多个几何对象。多对多的关系会导致冗余,因为一个对象的i d 号可能被多个网格重复地记录。不仅是存储上的冗余,在搜索算法上也要进行 额外的排重处理。网格划分的越细,搜索的精度就会越高,当然冗余也越大, 耗费的磁盘空间和搜索时间也越长。网格划分的精细程度取决于几何对象的大 小和数量。当被索引的对象大小差别很悬殊的时,网格索引会遇到另外一个难 题:网格划分小到什么程度合适? 过于精细,会导致冗余太大,索引数据的存 储量也可能成倍增加,甚至索引的存储量会超过数据本身,此时如果进行大范 围查询,也会影响速度;过于粗略,小对象不能精确定位,过多的几何对象落 在同一个网格上,降低了搜索的准确度。有些软件采用多重网格索引来避免这 1 9 第2 章空间数据库技术与理论 一问题,在一定程度上提高了搜索速度的同时,也导致了更多的数据冗余。 2 5 空间数据的管理 鉴于现实世界对象众多,空间关系复杂,需要大量的数据来描述它们的关 系,因此,我们必须对这些复杂的数据进行有效的管理。地理信息系统的空间 数据管理方式大体上可以分为以下几类: 1 ) 基于文件系统的方式: 这种方式直接采用文件系统来存储和管理空间数据,系统结构简单,便于 操作,但提供的功能非常有限。它适合小型g i s 系统,难以满足当前6 i s 对空 间数据管理的需求。 2 ) 基于文件系统与数据库的混合组织管理方式: 这种方式基于传统的关系数据库系统来存储地理空间对象的属性数据,而 以文件方式来存储空间数据。目前的大多数桌面g i s 系统均采用此种方式。这 种方法对于特定文件格式g i s 数据的处理效率较高,但它在数据的一致性维护、 并发控制以及海量空间数据的存储管理等方面能力较弱。 3 ) 扩展关系数据库的组织管理方式: 这种方式将空间数据和属性数据都存储于关系型数据库中,通过在关系型 数据库之上建立一层空间数据库功能扩展模块( 通常被称为空间数据引擎) 来 实现对空间数据的组织管理。目前主流的g i s 软件都采用这种方式同时管理图 形和属性数据。如国外的a r c i n f o 、g e o m e d i a ,国内的m a p g i s 、g e o s t a r 、s u p e r m a p 等。这种方法可以利用成熟的关系型数据库技术来方便地实现g i s 数据的一致 性维护、并发控制、属性数据的索引等。当然,数据库本身并不直接支持对空 间对象的操作和管理,而是通过空间数据引擎来实现。 4 ) 基于空间数据库的组织管理方式: 基于空间数据模型,直接构建用来存储和管理空间数据和属性数据的空间 数据库系统来管理数据。它包含结合几何和属性信息的框架,提供并支持空间 数据的类型、查询语言和接口、高效的空间索引和空间联合等。空间数据库直 接支持空间对象的存储和管理,为空间数据提供了高效的查询和检索机制,是 目前g i s 数据管理技术研究的热点。目前空间数据库的实现主要有两种方式: 面向对象数据库方式和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论