(地图学与地理信息系统专业论文)基于gml的arcgismapinfo数据转换技术研究及实现.pdf_第1页
(地图学与地理信息系统专业论文)基于gml的arcgismapinfo数据转换技术研究及实现.pdf_第2页
(地图学与地理信息系统专业论文)基于gml的arcgismapinfo数据转换技术研究及实现.pdf_第3页
(地图学与地理信息系统专业论文)基于gml的arcgismapinfo数据转换技术研究及实现.pdf_第4页
(地图学与地理信息系统专业论文)基于gml的arcgismapinfo数据转换技术研究及实现.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要地理信息系统的网络化为人们的生产和生活提供了很大的便利,但它同时也面临着诸多问题需要解决。如:空间数据具有地域分布性、存储格式多样性、多语义性、多时空性、多尺度性和获取手段的多源性等一系列复杂的难以简单分析处理的特点,给信息共享带来了极大的不便,造成了巨大的资源浪费,严重阻碍了空间数据的充分利用。为了更好的实现空间数据的共享和互操作,空间数据格式转换的研究就成为近年来g i s 应用系统开发中需要解决的重要问题。地理标记语言g m l ( g e o g r a p h ym a r k u pl a n g u a g e ) 是国际0 6 c ( o p e n g i sc o n s o r t i u m ) 组织提出的基于可扩展标记语言x m l 的地理空间数据编码标准,为地理信息的存储、传输、交换提供了标准的编码规范。g m l 不仅能够描述不同复杂程度的数据,而且分离了数据的内容与数据表现的形式,可以用一种统一的空间数据模型描述来自不同数据源的数据。本文以基于g m l 的a r c g i s 和m a p l n f o 空间数据转换为主线,主要从以下几个方面进行研究和探索:1 、研究多源空间数据的异构性,分析传统数据转换方案的不足,提出用g m l作为数据转换的中间标准,采用统一的空间数据模型来描述地理要素的方法。2 、利用c # 读取h r c g i s 数据,根据o g c 所支持的简单要素几何模型生成g m l文件和可视化的s v g 图形文件。3 、解析g m l 文件,生成m a p l n f o 数据文件,最终实现两种数据文件的转换。文章最后对研究的结果进行总结,并对未来的发展作了展望。关键词:x m l ;g m l ;c ;s v g ;数据共享;空间数据转换r e s e a r c ha n dr e a l i z a t i o no fa r c g i s m a p i n f od a t at r a n s i t i o nt e c h n i q u eb a s e do ng m lz h a n gy u a nm i n ( c a r t o g r a p h y & g e o g r a p h i c a li n f o r m a t i o ns y s t e m )d i r e c t e db yl u a nw e id o n ga n dl ij i a nm i n gt h er a p i da p p l i c a t i o no fn e t w o r k i n gg i sh a sp r o v i d e dag r e a tc o n v e n i e n c ef o rs o c i a lp r o d u c t i o na n dp e l o p l e sd a i l yl i f e h o w e v e r , i ta l s of a c e dm a n yp r o b l e m st or e s o l v e ,s u c ha st e r r i t o r yd i s t r i b u t i o n 、a l lk i n d so fo b t a i n a b l em e a n s 、v a r i o u ss t o r a g ef o r m a t s 、m u f t i s e m a n t i c s 、m u f t i s p a c e t i m e sa n dm u f t i - s c a l e s t h e s ea r ea l lc o m p l e xc h a r a c t e r i s t i c st h a tm a yn o te a s yt od e a lw i t h a l s o ,t h e yh a v ea l r e a d yb r o u g h tg r e a ti n c o n v e n i e n c et oi n f o r m a t i o ns h a r i n ga n dr e s u l t e di nah u g ew a s t eo fg i sr e s o u r c e t h e r e f o r e ,s u f f i c i e n tu t i l i z a t i o no ft h es p a t i a ld a t aw a sh a m p e r e ds e r i o u s l y i no r d e rt or e a l i z et h es p a t i a ld a t as h a r i n ga n di n t e r o p e r a t i o nb e t t e r , t h et r a n s i t i o no fs p a t i a ld a t ab e c o m e sa ni m p o r t a n tp r o b l e mn e e d i n gs o l v i n gi ng i s sa p p l i c a t i o ns y s t e md e v e l o p m e n ti nr e c e n ty e a r s t h eg e o g r a p h ym a r k u pl a n g u a g e - - g m l ( g e o g r a p h ym a r k u pl a n g u a g e ) i sag e o s p a t i a ld a t a - c o d i n gs t a n d a r db a s e do nx m lp r o p o s e db yo g c ( o p e ng i sc o n s o r t i u m ) ,i tp r o v i d e sat y p i c a lc o d i n gs t a n d a r df o rp r e s e r v a t i o n 、t r a n s m i s s i o na n de x c h a n g eo fg e o g r a p h yi n f o r m a t i o n g m lc a nd e s c r i b ev a r i e dc o m p l e xd a t aa n ds e p a r a t et h ed a t ac o n t e n tf r o mt h ed a t af o r m a t ,s oi ti sp o s s i b l et od e p i c td i f f e r e n td a t as o u r c eb yt h eu n i f o r ms p a t i a ld a t am o d e l t h et e x te n c i r c l e dt h em a s t e r s t r o k eo fa r c g i sa n dm a p l n f os p a t i a ld a t at r a n s i t i o nb a s e do ng m l t h ef o l l o w i n gc o n t e n t sa r es t u d i e d :1 、a f t e ra n a l y z i n gp a r t i c u l a r l yt h ed i v e r s i t yo fm a n yg e o g r a p h i cd a t as o u r c e sa n ds t u d y i n gt h es h o r t a g eo fs e v e r a lt r a d i t i o n a ls p a t i a ld a t am e t h o d s t h ep a p e rr e s e a r c h e dt h es p a t i a ld a t at r a n s i t i o nm e t h o db a s e do ng m l g m lw o r k e da st h em i d d l es t a n d a r di ns p a t i a ld a t at r a n s i t i o n ,d e p i c t i n gg e o g r a p h i cs p a t i a lf e a t u r eu s i n gau n i f o r ms p a t i a ld a t am o d e l 2 、f i r s t l y , t h ed a t at r a n s f o r m e rr e a dt h es p a t i a ld a t as o u r c eu s i n gc 撑l a n g u a g e s e c o n d l y , c r e a t e dg m lf i l ea n ds v gf i l ea c c o r d i n gt ot h es i m p l ef e a t u r eg e o g r a p h ym o d e ls u s t a i n e db yo g c 3 、t h ep a p e rp a r s e dt h eg m ld a t aw h i c hw o r k e da sam i d d l el i n ka n dc r e a t e dc o r r e s p o n d i n gm a p l n f os p a t i a ld a t a i nt h ee n dt h ep a p e rr e a l i z e dt h es p a t i a ld a t at r a n s i t i o no fa r c g i sa n dm a p l n f o a tl a s t ,t h er e s u l to ft h er e s e a r c h i n ga n ds t u d y i n gi ss u m m a r i z e da n dt h ef u t u r ed e v e l o p m e n tt e n d e n c yi sl o o k e df o r w a r dt oi nt h i sa r t i c l e k e y w o r d s :x m l ;g m l ;s v g ;c 舞;t h ed a t as h a r i n g ;t h es p a t i a ld a t at r a n s i t i o n ;i i i论文独创性声明本人声明:本人所呈交的学位论文是在导师的指导下,独立进行研究工作所取得的成果。除论文中已经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体已经公开发表的成果。本声明的法律责任由本人承担。论文作者签名:争元钗哆年弓月z 尹日论文知识产权权属声明本人在导师指导下所完成的论文及相关的职务作品,知识产权归属学校。学校享有以任何方式发表、复制、公开阅览、借阅以及申请专利等权利。本人离校后发表或使用学位论文或与该论文直接相关的学术论文或成果时,署名单位仍然为长安大学。( 保密的论文在解密后应遵守此规定)论文作者签名:劳记敛导师签名:名形叼年弓月尹日07 年弓月日长安大学硕士毕业论文第一章绪论2 1 世纪是信息的时代也是网络的时代,地理信息系统( g e o g r a p h yi n f o r m a t i o ns y s t e m ,简称g i s ) 作为专门用于采集、存储、管理、分析和表达地理空间数据的信息系统,正从为单用户提供特殊的空间数据访问转变为利用遍及全球的计算机网络为多用户提供并发的实时空间数据服务。不同部门、不同地区之间的信息交流不断增加,数据共享成为信息社会的一大潮流和趋势。而数据共享的程度也逐渐成为反映一个地区、一个国家信息发展水平的一种标准,数据共享程度越高,信息发展水平就随之越高。因此,各个不同的g i s 应用软件之间、部门之间、领域之间的异构数据共享提到了议事日程。1 1 论文选题的背景、目的和意义1 1 1 本论文选题的背景几十年来,g i s 在各行各业得到了广泛的应用,其使用范围涉及多学科和多部门,为经济和社会的发展起到了极大的推动作用。特别是网络技术的崛起和发展打破了传统g i s 数据的封闭体系,为g i s 的发展注入了新的活力,也为空间数据共享与交换提供了开放的平台,但它同时也面临着很多问题需要解决,主要表现在以下两大方面:9应用系统的开发方面:开发一个g i s 应用系统,往往要投入大量的人力、物力进行数据建设。据统计:国外的工程建设中,硬件、软件、应用开发( 包括数据采集录入) 的投资比例为1 :2 :1 0 ,国内硬件+ 软件与应用开发的投资比例为1 :2 2 5 t 1 1 。由此可见数据建设所耗费的成本在总成本中占相当大的比例,造成了财力的严重浪费。数据采集方式和数据格式方面:由于各个行业和部门的地理信息资源大多存在于特定的g i s 应用系统中,各个系统对地理信息的描述各不相同,地理信息数据库往往都是分不同的部门、不同的地理区域、不同的时段单独存储,相对封闭,形成了空间信息孤岛。与此同时,大批g i s 软件的涌现和各类应用系统的运行,形成多种数据存储模型。而这种数掘模型的差异所导致的问题也越来越突出,如不同格式的数据不能无损地共享,多源异构空间数据难以集成,二进制格式的数第一章绪论据需要专门的g i s 应用软件才能编辑、修改和应用,各g i s 应用软件的功能都是针对其自身的数据格式而设计的等等。这给信息共享带来了极大的不便。目前,g i s 界实现空间数据共享与集成的模式大致有四种,分别是:数据格式转换模式、直接数据访问模式、数据互操作模式和空间数据共享平台【2 】=1 、数据格式转换模式指其他数据格式经专门的数据转换程序进行格式转换变成本系统的格式后,复制到当前系统中的数据库或文件中。这是目前空间数据共享的主要办法。该模式主要存在的问题是:由于缺乏对空间对象统一的描述方法,转换后不能完全准确表达源数据的信息,导致数据丢失;需要将数据统一起来,违背了数据分布和独立性原则。2 、直接数据访问模式指单个g i s 应用软件存储多种数据格式,从而实现对其它应用软件数据格式的直接访问,不仅避免了繁琐的数据转换,而且在一个g i s 应用软件中访问其它应用软件的数据格式不要求用户拥有该数据格式的宿主软件,经济又实用。该模式的缺陷是:被访问的数据格式要公开,否则要破译,但破译还不一定正确;如果源数据格式发生变化,软件也必须随之升级,否则就滞后了。缺乏统一的空间数据模型。3 、数据互操作模式数据互操作模式是由国际o g c ( o p e n g i sc o n s o r t i u m ) 组织制定的,指在异构数据库和分布计算的情况下,g i s 用户在相互理解的基础上,能透明地获取所需的信息。o g c 为数据互操作制定了统一的规范,从而使得一个系统同时支持不同的空间数据格式成为可能。根据o g c 颁布的规范,可以把提供数据源的软件称为数据服务器( d a t as e r v e r s ) ,把使用数据的软件称为数据客户( d a t ac l i e n t s ) ,数据客户使用某种数据的过程就是发出数据请求,由数据服务器提供服务的过程,其最终目的是使数据客户能读取任意数据服务器提供的空间数据。该模式的主要局限在于:需要每种格式的宿主软件都按照统一的规范实现数据访问接口。一个软件访问其它软件的数据格式是通过数据服务器实现的,这个数据服务器实际上就是被访问数据格式的宿主软件,也就是说,用户必须同时拥有这两个软件,同时运行,才能完成数据互操作过程。o g c 标准更多考2长安大学硕士毕业论文虑采用了o p e n g i s 协议的空间数据服务软件和空间数据客户软件,对于那些历史存在的大量非o p e n g i s 标准的空间数据格式的处理方法还缺乏标准的规范,非o p e n g i s 标准的空间数据格式仍然占据己有数据的主体。各种g i s 应用软件之间虽然可以相互操纵数据,但一般各种软件所作的工程数据还是以它自己的系统进行管理,会出现数据的不一致性和影响现时性问题。4 、空间数据共享平台采用c l i e n t s e r v e r 体系结构,一个部门所有空间数据及应用软件模块都共享一个平台。所有数据都存在s e r v e r 上,各个应用软件都有一个c l i e n t 端的程序,通过这个平台向s e r v e r 上存取数据。这是一种比较好的数据共享方式,任何一个应用程序所作的数据更新都能及时地反应在数据库中,避免了数据的不一致问题。但实现起来比较困难,因为市场上g i s 系统软件很多,谁也不愿意失去自己的底层而采用一个平台。综上所述,尽管数据互操作模式代表了数据共享的发展方向,但目前实现起来还不现实;直接数据访问模式简单易用,但数据共享能力由它所能存储的数据格式多少来决定,限制了数据共享的程度;数据格式转换模式虽然有些难以应付日趋繁多的g i s 数据格式和格式的不公开性质,但对大多数普通用户而言,”在具体的工程应用中该模式更具有可操作性和现实性,与现实的技术条件和资金条件更相符,在数据共享方式中仍然占据着主流地位,并且一直是g i s 应用系统开发中急需要解决的重要问题和热点话题。为此,国内外已经有许多组织制定了各种地理信息系统标准,试图实现多源、异构空间数据格式的统一。其中,o g c 又提出了开放式地理空间数据互操作规范,制定了基于可扩展标记语言x m l 的地理标记语言g m l ( g e o g r a p h ym a r k u pl a n g u a g e ) ,为地理空间数据的存储、传输、交换提供了标准的编码规范【3 1 。1 1 2 本文研究的目的和意义由于g i s 数据格式众多,目前得到国际公认的几种重要数据格式有:e s r i公司的a r c i n f oc o v e r a g e 、a r c s h a p ef i l e s 、e 0 0 格式,m a p l n f o 的m i f 和m i d格式,a u t o d e s k 的d x f 和d w g 格式,i n t e r g r a p h 的d g n 格式等等【钔。成功实现它们相互间的转换,是一项比较复杂的工程。考虑到目前大多数g i s 用户实际技术条件、工程需要以及流通中数据格式的普遍性等现实情况,本课题选择了当3第一章绪论前g i s 数据中两种最具有代表性的数据c g i s 和m a p l n f o 数据,作为研究对象,实现两种数据的转换。本文研究的目的是以空间数据的数据格式交换为基础,按照国际通用的数据规范,用g m l 来描述a r c g i s 公开发表的s h a p e f i l e 数据,建立统一的空间数据模型,实现该种数据数据格式与国际标准数据格式的转换,从而达到转换成m a p l n f o 数据的目的,以提高数据的利用率。所以本研究不仅具有一定的实用价值,还具有一定的理论意义,推广应用到其它软件平台生产的空间数据,就可使得人们能够共享地理信息系统积累的大量的数据,改变g i s “信息孤岛”的状况,减少行业间不必要的重复采集,共同承担数据采集的开销,提高经济效益。使地理信息系统向着标准化、数据多维化、系统集成化、系统智能化、平台网络化、应用社会化的方向发展。1 2 空间数据转换的研究现状空间数据转换不仅对地理信息的共享和互操作,而且对国民经济建设和社会的发展都发挥着巨大的作用,因此,国、内外对这项技术的研究十分重视。为了更方便地进行空间数据转换,尽量减少数据转换过程中信息的损失,使之更加科学化和标准化,许多国家和国际组织制定了空间数据交换标准。此外,一些比较成熟的软件产品也提供了较好的数据转换功能和对外交换的数据格式,还有一些比较有实力的公司提供了通过第三方数据转换软件的方法,在数据转换方面也做了一些较为具体的工作。下面对一些主要的标准和产品等作一下简单的介绍。1 2 1 国外研究现状1 、美国空间数据交换标准s d t s ( s p a t i a ld a t at r a n s f e rs t a n d a r d )美国联邦空间数据委员会于1 9 9 2 年颁布的s d t s 经历了长达十四年的研究起草工作,是至今为止的一个比较完善的空间数据交换标准,包含对几何坐标、投影、拓扑关系、属性数据、数据字典的规定,也包括栅格格式和矢量格式等不同的空间数据格式的转换标准,在一定程度上解决了不同数据格式之间缺乏统一的空间对象描述基础的问题。目前该标准作为国际标准化的模式j 下被纳入国际标准组织中,但s d t s 目前还很不完善,还不能完全概括空间对象的不同描述方法,不能统一为各个层次以及从不同应用领域为空间数据转换提供统一的标准;并且4长安大学硕仁毕业论文s d t s 没有为数据的集中和分布式处理提供解决方案,所有的数据仍需要经过格式转换复制到系统中,不能自动同步更新。此外,s d t s 格式过于复杂,在推广中有一定的困难1 5 1 。2 、北美地区加拿大s a f e 公司采用的第三方数据转换软件f m e该软件能提供上百种不同数据格式之间的转换,思路是在数据格式的转换过程中,不产生新的公共的数据格式,而是两两转换。即利用f m e 的o b j e c t s 控件采用语义方式编程实现异构空问数据模型定义、转换规则映射、格式转换。通过语义方式、模型映射达到信息的全部转换,满足数据转换的需要。虽然f m e在数据转换方面可以做的相对好,但是软件本身的价格高,这对于个体来说,比较难以实现,但对于专业的数据转换公司来说,可以做的非常满意。而且转换过程中还会存在一些问题需要进行后期处理,所以这种方法也不是完美的【5 1 。3 、软件产品方面被普遍认为是世界头号g i s 软件的e s r i 公司的代表产品a r c 心f o ,它自带的数据转换工具的数据转换能力也非常强,其数据交换格式( e 0 0 格式) 已经被用作g i s 行业的实际标准格式,因为它支持大部分空间信息的功能属性,被大多数商业g i s 软件所支持,可以与之转换的数据格式有:a u t o d e s k 的d x f :d w g 格式;m a p i n f o 的m i f m i d 格式;i n t e r g r a p h 的d n g 格式;s t d s 格式等。同时a r c i n f o 还支持各种数据格式的输入和输出,它其中的a r ct o o l b o x 几乎包括所有现在流行的g i s 和c a d 软件包和通用数据标准的转换。另外,m a p i n f o 公司的m a p l n f o 软件,它自带的通用转换器也可以实现部分数据格式的转入和转出,如:a u t o d e s k 的d x f 、d w g 格式,e s r i 的e o o 、s h a p e 格式,i n t e r g r a p h 的d n g 格式,s t d s 格式,它的交换格式m i f m i d 也是一种常用的矢量数据格式1 5 1 。1 2 1 国内研究现状在国内,我们也有自己的国家数据转换标准,同时一些公司和科研单位对数据转换也展开了研究,并撰写了一些很有价值的论文。1 、中华人民共和国国家标准地球空间数据交换格式( c n s d t f ) 标准我国技术监督局于1 9 9 9 年8 月2 日发布了c n s d t f 标准,包含了对几何坐标、投影、拓扑关系、属性数据、数据词典的规定,适用于多种矢量数据、影像5第一章绪论数据和格网g i s 数据以及d e m ( 数字高程模型) 等的数据交换,为图形数据的标准化提供了基准。通过c n s d t f 转换数据的方法就是以c n s d t f 为转换中介格式。其他类型的空间数据均通过与它的交互,实现空间数据的互操作。具体过程如下:通过a p i 函数取出源数据格式中各相关要素的空间数据及其属性信息、标记信息。根据信息的不同属性、不同要素类型、不同的描述对象分别存入交换格式的不同部分,并与c n s d t f 保持语义上的一致。文件保存为“v c t ”格式。由于c n s d t f 在设计过程中参考了国外现有的多种空间数据交换标准,以及多种国内外商用g i s 软件的内部数据格式和外部数据交换格式,内容完备,包容性强,基本上包括了g t s 数据体系中的所有内容,因此从其它g 1 s 软件的数据转换到c n s d t f 时,可基本上做到无信息丢失。但毕竟c n s d t f 刚刚实施,还有很多不足之处:扩展性差,不能完全适应不断复杂的空间对象应用模型;对设备有要求,不能够在不同的终端之间交换数据;没有为空间数据的分布式处理提供解决方案,所有的数据仍需要经过格式转换复制到系统中,不能同步自动更新。从上面的问题看出,c n s d t f 的完善和普及还需要相当长的时间【6 1 。2 、北京方位捷讯科技有限公司研制的空间数据转换系统该系统基于国家空间数据转换标准,是能够实现多种矢量格式的空间数据间相互转换的软件系统,有两个版本,一是基于l i n u x 的空间数据服务系统,二是基于w i n d o w 9 x w i n d o wn t 的空间数据转换软件。该系统支持e s r ie 0 0 格式、e s r is h a p e 格式im a p l n f om i f 格式、m g ea s c i il o a d e r 格式、a u t o c a dd x f格式、地球空间数据交换格式( v c t ) 等格式间空间数据的相互转换。该系统方便、快捷,我们可以直接使用其研究成果,但如果没有源代码,就不能精确的控制转换成果,不能对系统进行扩展1 6 j 。3 、软件方面早在中国地理信息系统协会首届年会上,武汉测绘科技大学的李德仁先生就发表了题为“论发展我国地理信息产业的基础实施建设”一文。文中提出“建立统一的、法定的国土基础信息系统,制定我国的空间数据标准、规范和数据转换格式,以及发展国产g i s 基础软件乃是当务之急的三大基础建设”。当时,由于我国使用的g i s 软件多半为国外进口,而大型建库工作正处于起步阶段,所以制定6长安大学硕十毕业论文的多为g i s 地物分类和编码标准。并且国产g i s 软件之间能格式转换的少,不能转换的多,目前仅有少数g i s软件开始了直接数据访问的尝试,如i n t e r g r a p h 推出的g e o m e d i a 系列软件和中国科学院地理信息产业发展中心研制的s u p e r m a p 软件,通过存储多种数据格式,把不同格式的数据集成在一个坐标系中进行分析,从而实现对其它应用软件数据的直接访问,避免了繁琐的数据转换。其中g e o m e d i a 系列软件实现了对大多数g i s c a d 软件数据格式的直接访问,包括a r c i n f n o 、a r c v i e w 、m a p l n f o 、a u t o c a d 等,也可输出其它g i s 及c a d 格式。这种方案虽然无须进行数据转换,但它开发难度较大。另外,m a p g i s ,g e o s t a r 等软件也具备相应的数据模型的转换功能,通过自行开发的空间数据交换模块可以与当前流行的g i s 软件及我国空间数据交换格式交换数据。但这些,模块是在技术层面上使用数据转换的方法,与其所在的系统联系很紧密,给用户的使用带来了很大的不便【1 6 1 。1 3 本文的主要研究方法及组织结构1 3 1 本文的主要研究方法及创新点如前面所述,随着空间数据共享的发展和程度的不断提高,传统的数据转换模式越来越难以应付日趋增多的g i s 数据格式和格式的不公开性质。为了成功实现多源、异构空间数据的统一,国内外已经作出了大量的研究,但结果各有利弊。随着地理标记语言g m l 的出现,数据转换的研究又出现了新的契机。本文在总结传统方式不足的基础上,结合g m l 对空间数据描述的统一性及其优势,提出了基于g m l 的数据转换模式。文章主要采用理论和实际相结合的方法,以宁波市数字房产项目为依托,在理论研究和充分调研的实践基础上,以n e tf r a m e w o r k 作为开发平台,以该技术下的c 舞语言作为数据转换程序的开发语言,创建了一个数据转换器,实现了源数据的数据读取、源图形文件的显示、g m l 文档和可视化s v g 数据文件的生成、目标数据文件的生成等功能。由于该项目中的源数据为转化而来的a r c g i s数据,目标数据为m a p l n f o 格式的数据,所以本文以空间数据交换为主线,在详细分析了两种数据的数据格式基础上,按照国际通用的数据规范,以g m l 语言为中介,建立统一的数据模型,成功地实现了a r c g i s 数据到m a p l n f o 数据的转换,7第一章绪论为宁波市数字房产的顺利进行提供了保障。1 3 2 本文的组织结构本文的组织如下,论文共分五章。第一章绪论。首先介绍了论文选题的背景、研究的目的和意义,然后讨论了目前国内外对该课题研究的现状,最后给出了本文的设计思想。第二章空间数据转换的理论与技术基础。首先介绍了空间数据多源、异构性的特点,接着重点分析了几种传统的空间数据转换方式及其不足,在此基础上提出了g m l 模式下的数据转换方案。在技术基础方面首先简单介绍了在数据转换过程中所涉及到的x m l 及其相关技术x s l t ;接着重点阐述了g m l 的要素特征、对象模型、组成及扩展机制,并给出了g m l 比较具体的编码实例;最后简要介绍了矢量图形的可视化技术s v g 及本文的开发语言c 撑。第三章a r c g i s 和m a p l n f o 的通用数据格式分析。分别对两种常用的a r c g i s 和m a p l n f o 空间数据的数据格式进行分析,建立两者与g m l 的空间几何映射关系。第四章基于g m l 的a r c g i s - - * m a p l n f o 空间数据转换方法及应用。以宁波市鄞州区数字房产项目为依托,在对该项目进行现状描述、需求分析、目标设计等的基础上,首先给出数据转换器的功能设计框架:接着重点介绍了如何用c 挣语言分别读取两种数据,采用g m l 的统一简单要素几何模型来描述,生成g m l 文件;为了初步检验该转换的正确性,又利用x s l t 技术实现g m l文件到s v g 文件的转换,以方便用插件显示图形,并与源图形文件比照:最后用d o m 技术实现g m l 文件到相应的空间数据文件的转换,同时运行转换器界面。第五章结论。g m l 模式下的a r c g i s 和m a p l n f o 空白j 数据转换方法的研究结果作结论性分析,提出了有待进一步完善的工作与展望。8长安大学硕l 毕业论文第二章空间数据转换的理论与技术基础2 1 空间数据转换的理论基础2 1 1 空间数据的多源、异构性分析g i s 数据由于来源广,范围大,再加上日趋增多的g i s 软件平台采用不同的数据模型、地理表达方式、投影方式等,导致了地理数据多源、异构的特点,主要表现在以下几个方面【7 】:多时空性一个g i s 系统中的数据源既有同一时间不同空间的数据系列,也有同一空间不同时间序列的数据。多尺度性:g i s 会根据系统需要而采用不同尺度对地理空间进行表达,不同的观察尺度具有不同的比例尺和不同的精度。获取手段多源性随着新技术的发展,地理数据的获取方法趋向多样化,数据源包括现有系统、图表、遥感手段、g p s 手段、统计调查、实地勘测等。存储格式多样性g i s 数据不仅表达空间实体的位置和几何形状,同时也记录空间实体对应的属性,这就决定了g i s 数据源包含图形数据和属性数据部分。一般来说,地理信息系统都是以私有的数据模型和组织形式来满足最大的数据操作功能,因此不同g i s 软件采取不同文件存储格式。地域分布性地理信息系统技术与一些需要从地理空间获取数据和信息的专业领域结合,产生了许多基于空间信息分析和管理的信息系统,覆盖了工业、农业、交通运输、国防等许多领域,几乎涉及人类生活的各个方面。地理信息本身固有的地理分布性决定了在这些单个系统中存储的地理数据不可能遍及地球上所有的地理区域,只能是对自己感兴趣的局部区域的地理现象进行定义、编码结构化和模型化,以数据形式存入计算机内。9第二章空问数据转换的理论与技术基础异构性异构性主要表现在三个方面。平台异构性:各个数据源驻留在不同的硬件平台之上,使用不同的操作系统,用不同的通信协议进行通信;系统异构性:参加集成的数据源具有不同的d b m s ,如文件系统、关系数据库管理系统、面向对象的数据库管理系统等。它们可能使用不同的数据模型,提供不同的元数据,不同的数据模型可能支持不同的限制和不同的数据语言;语义异构性:不同的数据源中相同或相关数据在含义、解释和用途方面不同。由于不同的局部数据库是独立设计和开发的,在参加集成的异构数据库之间可能会产生各种语义冲突。2 1 2 空间数据转换的内容空间数据转换的内容主要包括三个方面的信剧9 】:空间定位信息即空间实体的坐标,一般情况下,空间目标的定位信息能够完整地进行转换。但是有些基于c a d 的系统,如a u t o c a d 和m i c r o s t a t i o n ,它们可能包含数学曲线,如三点圆、圆弧等,而g i s 中又没有这些图形元素,所以在转换时,一般将它们插成折线,这样难免会损失精度。空间关系如一条弧段的起始结点、终结点、左多边形,右多边形等,转换过程中最容易丢失的信息是拓扑关系的信息。数据模型基本一致,如果拓扑关系的信息在转换过程中丢失,可以在数据转换后的系统中重构拓扑关系。但是数据结构不一样时,如m a p l n f o 等软件没有拓扑关系,空间数据的转入和转出就不可能带有拓扑关系。属性数据对于属性数据,大部分g i s 系统都能够进行转换,但用户经常用到的a u t o c a d 的外部转换文件d x f 早期版本不含有属性数据,此时要得到属性数据要通过其他途径。2 1 3 现有空间数据转换的方法及优缺点空间数据由于对空i 铷对象的理解不同,对空间对象的定义、表达、存储方式亦各不相同,所以其转换问题比较复杂。目前实现数据转换的方式大致有四种【7 】:1 0长安大学硕十毕业论文1 、直接数据转换模式即将一个独立系统内的专用数据格式文件通过交换程序直接转换成另一个独立系统内的专用数据格式文件,如图2 1 所示:图2 - 1 直接数据交换这种模式虽然经济实用,交换程序开发起来也比较容易,但其缺点也是显而易见的:面对众多的数据格式,为每一种格式都提供直接的交换程序,其价格是昂贵的。有时系统间的逻辑规范和数据模型可能不兼容,易导致交换过程中的数据丢失。还必须知道每一个g i s 系统数据的内部数据结构,这对商用g i s 而言是很困难的。2 、间接数据转换模式在不太复杂的g i s 环境中,采用标准公共交换文件( 如v c t 格式) 或约定的a s c i i ,x m l 文件,通过程序将一个系统的数据文件转出并转入另一个系统中,通过转入转出该中介格式就完成了数据交换。这种方法被认为是一种可行的临时数据标准化方法。如图2 2 所示:图2 2 间接数据交换这种模式的优点是:可行并可立即实施。无须为其它系统开发单个数据交换程序,节省费用。使用标准有通用的软件包支持,市场已经成熟。但利用中介格式进行数据转换存在的问题是:由于受到初期开发者的经验及应用需求的限制,中介格式不可能涵盖目前系统和应用程序的所有方面,在交换过程中可能导致混乱和数据丢失。3 、基于国家空间数据交换格式标准为方便地进行空间数据交换以及尽量减少空间数据交换损失的信息,使之科学化和标准化,许多国家和组织制定了空间数据交换标准,如我国的空间数据交换格式( c n s d t f ) 标准。有了标准格式,每个系统都提供读写这一标准格式的程序,可避免大量编程工作。从系统a 的内部格式到标准的外部交换格式,再从第二章空间数据转换的理论与技术基础标准的外部交换格式到系统b 的内部格式仅需两次转换,省去为每种g i s 系统软件都编写数据交换程序的步骤。如图2 3 所示:图2 - 3 基于国家空间数据交换格式c n s d t f 在设计过程中参考了国外现有的多种空间数据交换标准,以及多国内外商用g i s 软件的内部数据格式和外部数据交换格式,内容完备,包容性强,基本上包括了g t s 数据体系中的内容,可做到无信息丢失。利用c n s d t f 标准,思路不错,但毕竟c n s d t f 刚刚实施,还是有很多不足之处:在普及之前还会产生大量的不同格式的数据需要转换;标准本身编码体系的制定不完善;文本的存储方式在读取时速度慢:用标准转换出的文本文件内容中,图形和属性数据是分开的,不利于读取和查找。4 、通用软件转换工具模式为克服上述各种数据转换方法的不足,达到快速实用化,第三方数据转换软件出现了。如北美地区s a f e 公司采用的f m ls u i t e 程序,m a p l n f o 、a r c l n f o 等软件也都提供了部分转换程序,在数据转换方面做的比较好。但由于软件本身价格高,对专业的数据转换公司来说,相对满意;而对个体来说,难以实现,而且转换过程中还是会存在一些问题需要进行后期处理。所以这种方法也不是完美的。综上所述,传统空间数据转换模式各有优缺点,显然无法满足数据共享和互操作的需要,必须要有一种新的数据转换模式来取代传统模式,解决多格式数据转换问题。为此,国际o g c 组织制定了地理标记语言g m l ,为g i s 数据的存储、传输以及数据的转换提供了一套地理信息的x m l 编码标准。g m l能够描述不同复杂程度的数据,而且分离了数据的内容与表现数据的形式,可以用一种统一的空间数据模型描述来自不同数据源的数据。g m l 基于被广泛采用的x m l 技术,已被很多g i s 软件商所支持。g m l 对空间数据进行了规范化、标准化的描述,弥补了传统的数据格式转换方案中没有一种完善的描述空间对象的标准这一不足1 1 0 】。本论文以g m l 为基础,探讨并实现了一种基于g m l 的空间数据转换方法。1 2长安大学硕士毕业论文2 2 空间数据转换的技术基础2 2 1x m l 及其相关技术x s l t一、x m l 概述x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 是w 3 c ( w o r dw i d ew 曲c o n s o r t i u n ,即万维网协会) 于1 9 9 8 年2 月1 0 日正式批准公布的应用于w e b 上的第二代可扩展标记语言【1 1 l 。相比当前更为大家所熟知的另一种在互联网上使用的标记语言h t m l ( 超文本标记语言) ,x m l 极大地强化了保存信息和处理信息的能力。同时,由于x m l 语法的灵活性和真正的“扩展”性,使其能适应各种不同的数据类型,小到简单的字符串,大到庞大的数据库,都是x m l 强大的信息描述能力可以一展身手的地方。x m l 的最大用途之一是作为网上不同数据存储系统的交流中介,x m l 通过可扩展性提供了一种通用的数据格式,不同的软件系统之间可以通过这种新的数据描述方式进行通信,从而实现完全的互操作。本质上,x m l 是一种元语言,一种用于描述其他语言的语言,可以让信息提供者根据需要,自行定义标记及属性名,也可以包含描述法,从而使x m l 文件的结构可以复杂到任意程度。它的目的是创建一种简单而又强有力的信息存储、处理和分发机制。x m l 具有以下特点【1 2 , 3 7 1良好的数据存储格式:x m l 定义了文档的逻辑结构、物理结构和语法规则,保证了x m l 文档必须满足良好的存储格式。结构性强:x m l 的文件结构可以嵌套到任意程度,能用来表示面向对象的等级层次。具有与平台无关性:x m l 文档是纯文本,独立于平台和应用,而且与厂商无关。所以x m l 可脱离具体应用而自行描述保存在异构环境中的各种数据,其他系统也能直接对这些自描述的x m l 文件中的数据进行操作,它可以和h t m l 一样使用现有的网络通讯协议进行传送,不需要对现有的网络通讯协议进行改变。因此,它将成为跨平台数据交换和操作的标准模式,实现多源异构数据的转换。能描述不同复杂程度的数据:x m l 提供了数据结构化表示,并且易于操作,可以用一种统一的数据模型描述来自不同数据源的数据,屏蔽数据源中应用环境和数据结构的异构性。1 3第二章空间数据转换的理论与技术基础具有开放性和可扩展性:x m l 允许用户自定义标签来描述文件中的任何数据元素,可以在不破坏现有结构和系统的情况下增加新的数据字段。集成不同来源的数据:x m l 能够使不同来源的结构化、非结构化的数据很容易的集成在一起。软件代理商可以在中间层的服务器上对从后端数据库和其他应用服务器传来的数据进行集成。本地计算和处理:x m l 格式的数据发送给客户后,客户可以用应用软件解析数据并对数据进行编辑和处理。使用者可以用不同的方法处理数据,数据计算不需要回到服务器就能进行。总之,x m l 在采用简单、柔性的标准化表达和应用程序间交换数据方面迈进了一大步。二、x s l t 简介x s l t ,全称可扩展的样式表语言转换( e x t e n s i b l es t y l e s h e e tl a n g u a g et r a n s f o r m a t i o n ) ,用于将某一个x m l 转换为其它结构的x m l 。最简单的应用情况涉及两个源文档:包含原始数据的x m l 文档和用来转换该文档的x s l t 风格表单。x s l t 处理器把x s l t 风格表单的规则应用到x m l 文档从而输出x h t m l ,w m l , s v g 或者几乎其他任何x m l 格式的文档【1 3 1 ,如图2 - 4 所示:图2 - 4x s l t 的工作方式对特定的一个x m l 源数据文件而言,应用不同的x s l t 风格表单将会生成不同的x m l 输出。2 2 2g b l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论