




已阅读5页,还剩59页未读, 继续免费阅读
(摄影测量与遥感专业论文)xml相关技术下地理空间数据的整合及发布.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 地理信息系统的迅速发展和广泛应用积累了大量的空间数据资源,通过网络 来共享这些分布异构的空间数据资源是必然的趋势。但是因为各商业g i s 系统 之间的空间数据模型不同,因此在不同g i s 系统下的空间数据很难真正共享。 x m l 技术的出现为互联网的发展带来了新的机遇,它以其结构化、可扩展 性及灵活性的特点引起了业界的普遍关注,有着广阔的发展前景。对于网络g i s 而言,x m l 的相关技术可以用于地理空间数据的建模、存储、共享、网络传输、 以及电子地图的显示等。 针对传统网络g i s 系统在网上地理数据发布、空间数据互操作等方面面临的 挑战,本文探讨了利用x m l 的相关技术来表达和处理空间数据、解决网络g i s 系统之间互操作的问题。研究的主要目标是基于g m l 整合空间数据以及s v g 的地图展示。 主要研究内容包括:地理空间数据的g m l 编码、存储与共享;常用的空间 数据格式与g m l 格式地理空间数据的转换整合;整合后g m l 空间数据的地图表达 一s v g ,s v g 格式地图中动态交互性问题。最后以江苏地图为空间数据源,在豆联 网上进行了地图发布的网络测试。 总之,x m l 的相关技术在网络g i s 的应用与开发中具有非常多的优越性, 是未来信息技术发展的基石,同时也是网络g i s 发展的基础。相信随着x m l 规 范的进一步发展以及x m l 处理工具的进一步改善,一个开放的共享的网络g i s 环境必将很快来到。 关键词:网络g i s 空间数据共享x m l g m ls v g a b s t r a c t w k ht h er a p i dd e v e l o p m e n ta n d w i d ea p p l i c a t i o no f g e o g r a p h i ci n f o r m a t i o n s y s t e m ( g i s ) ,ag r e a td e a lo fs p a t i a ld a t a r e s o u r c e sw e r e p r o d u c e d i ti si n e v i t a b l et o s h a r ed i s t r i b u t e dh e t e r o g e n e o u ss p a t i a ld a t ar e s o u r c e si n i n t e m e t h o w e v e r , i ti s d i f f i c u l tt os h a r es p a t i a ld a t ab e c a u s eo fd i f f e r e n ts p a t i a ld a t am o d e l sa m o n gv a r i o u s e n t e r p r i s eg i s t h e a p p e a r a n c eo f x m l t e c h n o l o g i e sb r i n g san e w c h a n c ef o rt h ed e v e l o p m e n t o fi n t e m e t , w h i c hh a sb e e np a i dm o r ea t t e n t i o nt ob yi te n t e r p r i s e sf o ri t ss t r u c t u r a l o r g a n i z a t i o n ,e x t e n s i b i l i t ya n df l e x i b i l i t y , a n d i t sd e v e l o p i n g p r o s p e c ti sp r o m i s i n g a s f a ra si n t e r n e tg i si sc o n c e r n e d ,x m lc a r lb eu s e di nm a n y a s p e c t s ,s u c ha sm o d e l i n g , s t o r a g e a n d s h a r i n gg e o g r a p h i c a ls p a t i a ld a t a , t r a n s m i t t i n g d a t ao n n e t w o r k , d i s p l a y i n ga ne l e c t r o m a p ,a n ds o o n i na l l u s i o nt ot h ec h a l l e n g e sw h i c ht h et r a d i t i o n a lg i sf a c e s ,s u c ha st h er e l e a s e o f g e o g r a p h i c a ld a t aa n dt h ei n t e r o p e r a b i l i t yo fs p a t i a ld a t ao n t h ei n t e r n e t ,t h i sp a p e r s t u d i e st h em e t h o dt o e x p r e s s a n dd e a lw i t h s p a t i a l d a t aa n dr e s o l v et h e i n t e r o p e r a b i l i t ya m o n g d i f f e r e n ti n t e m e tg i sm a k i n gu s eo fx m l t e c h n o l o g i e s t h e m a i nt a r g e to ft h ep a p e ri st of u s es p a t i a ld a t ab a s e d0 1 3 g m la n dd i s p l a ym a p si n s v g t h em a i nr e s e a r c ho ft h i sp a p e ri n c l u d e s :g e o g r a p h i cs p a t i a ld a t ag m l b a s e d e n c o d i n g 、c o n s e r v i n g a n ds h a r i n g ,t r a n s f o r m a t i o na n df u s i o nb e t w e e nc o m m o n g e o g r a p h i cs p a t i a ld a t aa n dg m l b a s e d ,t h ed i s p l a yo fg m ls p a t i a ld a t a i ns v g a f t e rb e i n gf u s e d ,t h ed y n a m i ci n t e r c o m m u n i o ni ns v g m a p i n t h ee n d ,at e s ti sd o n e t od i s p l a ym a po nt h ei n t e r n e tu s i n gt h ej i a n g s um a p a st h es p a t i a ld a t as o u r c e i naw o r d ,x m lt e c h n o l o g i e sh a v em a n ya d v a n t a g e si nt h e a p p l i c a t i o na n d d e v e l o p m e n t o ft h ei n t e r n e tg i s x m li st h ef o u n d a d o ns t o n eo ft h ef u t u r e d e v e l o p m e n to f t h ei n f o r m a t i o nt e c h n o l o g i e s a tt h es a t l et i m e ,i ti st h eb a s eo ft h e d e v e l o p m e n to f t h ei n t e r n e tg i s w i 血t h ef u r t h e rd e v e l o p i n go fx m l s p e c i f i c a t i o n a n dt h ei m p r o v e m e n to fx m l d i s p o s i n gt o o l s ,a no p e n i n ga n ds h a r i n ge n v i r o n m e n t o f g i si sc o m i n gs u r e l y k e y w o r d s :i n t e m e tg i s ,s p a t i a ld a t as h a r e ,x m l ,g m l ,s v g i i 第一章绪论 i n t e r n e t 的应用目前已经渗透到我们日常生活中的方方面面。大到跨越时 空障碍,将全球连为一体,d , n 个人主页的制作。w w w ( w o r l dw i d ew e b ,万维网) , 又称w e b ,是i n t e r n e t 下的一个信息查询服务。w e b 以w e b 页超链接的方式组织, 不断的超链接使w e b 聚合成一个庞大,易使用,松散的全球数据和信息资源库, 其中也包括数量可观,以地图形式表达为主的地理信息。经过几十年的发展,传 统的地理信息系统( g e o g r a p h i c a li n f o r m a t i o ns y s t e m ,简称g i s ) 技术已经 基本成熟,商业软件也日益完善并且已经应用到很多行业。i n t e r n e t 技术的不 断发展,特别是万维网的普及,促使网络和g i s 的结合越来越流行。 1 1 网络g i s 的概念和构建方式 网络g i s 是以现有的i n t e r n e t i n t r a n e t 为架构基础的网络互操作应用系 统,它利用i n t e r n e t 在w e b 上发布空间数据,为用户提供空间数据浏览、查询 和分析的功能。一方面,网络g i s 可为公众提供交通、旅游、餐饮、娱乐、房地 产、购物等与空间信息有关的在线信息服务:另一方面,网络g i s 可为基于 i n t r a n e t 的企业内部业务管理提供服务,如帮助企业进行设备管理、线路管理 以及安全监控管理,等等。从根本上而吉,网络g i s 的广泛应用,是g i s 发展的 必然趋势。因为分布的数据源是g i s 最基本的特征,而通过网络正好跨越数据分 布所带来的管理,维护和更新上的障碍。 网络g i s 可以看作是由多主机、多数据库与多台终端通过 i n t e r n e t i n t r a n e t 组成的网络,其网络客户端为g i s 功能展示层和数据管理界 面,用以获得信息和各种应用。网络服务器端为数据维护层,提供地理数据信息 和g i s 系统服务。 从发布到客户端的数据格式的角度而言,网络g i s 的构建方式可以分为两大 类:一类是基于栅格结构,地理信息的查询、分析、制图的主要工作在服务器端 进行,得到的结果生成图像文件传输到客户端显示,如c g i 模式、a s p 模式等: 另一类是基于矢量结构,客户端发出请求,从服务器端直接得到矢量数据,传输 到客户端,由客户端的软件负责查询分析、显示、制图,如p l u g i n 模式,j a v a a p p l e t 模式、a c t i v ex 控件模式等等。 1 2 网络g i s 的现状 n 络o z s 是当今g i s 的研究热点,己成为各大g i s 开发商激烈竞争的焦点,国 内夕b g i s 开发商争相发布各自的网络g i s 开发平台。为满足不同用户的需求,有的 开发商甚至同时或陆续推出多个网络g i s 平台,如m a p i n f o 公司推出了m a p i n f o p r o s e r v e r 、m a p x t r e m ef o rn t 和m a p x t r e m ef o rj a v a :e s r i 推出了m o i m s 、 a r c v i e wi m s 和i n t e r n e tm a ps e r v e r ( a r c i m s ) 。早期的网络g i s 系统都是依托开 发商已有的桌面系统或组件开发的,如m a p x t r e m e f o rn t 、m o i m s 和a r c v i e wi m s 分别基于m a p x 、m a p o b j e c t s 和a r c v i e w 来实现。随着网络技术的进一步发展, 新的更高性能的技术不断出现,如j a v a 、n e t 等,部分开发商开始推出建立在 这些新技术基础上的网络g i s 系统,女d m a p x t r e m ef o rj a v a 和a r c i m s 。因此,网 络g i s 开发平台非常丰富。 1 3 目前网络g i s 存在的问题 随着网络技术的进一步发展和各行各业对空间信息的广泛需求,信息共享成 为更高层次上的需要。但是就信息共享角度而言,目前的网络g i s 力不从心,原 因有以下两个: 1 ) 空间数据格式与网络g i s 平台严格绑定 因为常用的网络g i s 平台基本上都是从桌面平台扩展应用而来,因此, 在空间数据的发布上,通常都只支持本身桌面平台支持的数据格式或少量兼 容格式,功能处理模块严格与所支持的数据格式绑定,这样就直接造成了异 构系统下的空间数据难以共享。如图卜l 为常用的网络g i s 中空间数据与操 作模块绑定的“黑箱模型”“1 。 l 黑箱w e b g i s 系统 图1 - 1 黑箱模型 2 ) 空间数据自身的多源性造成的空间数据难以共享 这种空间数据的多源性主要表现在以下几个方面 a 、多语义性。1 : 同一个地理信息单元( f e a n m e ) ,在现实世界中其几何特征一致,但是 却对应着多种语义,如地理位置、海拔高度、气候、地貌、土壤等自然 地理特征;周时也包括经济社会信息,如行政区界限、人口、产量等。 一个g i s 研究的决不会是一个孤立的地理语义,但不同系统解决问题的 侧重点有所不同,因而存在语义分歧问题。 b 、多时空性和多尺度性0 1 :g i s 数据具有很强的时空特性。个g i s 系 统中的数据源既有同一时间不同空间的数据系列;也有同一空间不同时 间序列的数据。不仅如此,g i s 会根据系统需要而采用不同尺度对地理空 间进行表达,不同的观察尺度具有不同的比例尺和不同的精度。 c 、获取手段的多源性。1 :获取地理空间的数据的方法有多种多样,包 括来自现有系统、图表、遥感手段、g p s 手段、统计调查、实地勘测等。 这些不同手段获得的数据其存储格式及提取和处理手段都各不相同。 正是以上的两个原因直接造成了网络g i s 中空间数据难以真正的共享和异构 系统下互操作。为了在异构的系统下交换数据,目前几个比较大的g i s 软件公司 已经公布了它们g i s 软件的明码交换格式,如a u t o d e s k 的d x f 格式,m a p l n f o 的m i f 格式和e s r i 公司的s h a p ef i l e s 、e 0 0 格式。但是这些交换格式也存在一 些问题,比如说不同的数据交换格式基于不同的空间数据模型,因此在交换信息 的过程中可能产生不能完全准确表达源数据信息的情况,另外这种交换信息的过 程需要将数据统一起来,违背了数据分布和独立性的原则。 面对这样的状况,美国国家空间数据协调委员会制定了统一的空间数据格式 规范s d t s 0 3 ( s p a t i a ld a t at r a n s f o r s t a n d a r d ) ,包括几何坐标、投影、拓扑关 系、属性数据、数据字典,也包括栅格格式和矢量格式等不同的空间数据格式的 转换标准。许多软件利用了s d t s 提供的标准的空间数据交换格式,如e s r i 在 a r c i n f o 中提供了s d t s i m p o r t 以及s d t s e x p o r t 模块,i n t e r g r a p h 公司在m g e 产品系列中也支持s d t s 矢量格式。s d t s 在一定程度上解决了不同数据格式之间 缺乏统一的空间对象描述基础的问题。但s d t s 很难统一为各个层次及不同应用 的领域上空间数据的共享与互操作提供统一的标准。 空阔数据的真正共享与互操作需要种标准的、平台中立的、灵活的空间数 据交换格式,随着信息技术的进一步发展和x m l 的出现,网络上从属不同g i s 产品的空间信息能够被容易的互相使用的曙光已经出现。 x m l 因其自描述,可扩展,结构化,灵活性等特点可用于地理空间数据的规 范化存储、地理数据共享、网络传输、电子地图显示等。目前,已经出现了一些 可以用于地理信息系统的d i l 相关技术标准,如由o g c ( o p e n g i sc o n s o r t i u m ) 制 定的g m l 。3 ( g e o g r a p h ym a r k u pl a n g u a g e ) 规范,它是种用于存储和传输地理信 息的x m 乙编码。g m l 的出现将对地理信息共享和连接地理数据集产生深远的影响。 它完全基于x m l 技术规范制定,从语法上讲,它是瑚l 的标记语言,是x 札在地 理数据的一个应用,它定义了在g i s 行业中通用的标记语言。 g m l l 0 版在2 0 0 0 年5 月1 2 日由o g c 发布,立刻得到许多公司的大力支持, 如o r a c l e 、g a t d o s 、m a p i n f o 、c u b e w e r x ,成为业界广泛接受的空间信息格式。 随着x m l 技术的进一步发展,o g c 又于2 0 0 1 年2 月2 0 日发布了g m l 2 0 规范, 使用x m ls h e m a 取代了1 0 中使用的d t d 。2 0 0 2 年8 月1 9 日,o g c 发布了g m l 2 0 规范基础上的增强版g m l 2 1 2 。目前,g m l 的最高版本是6 m l 3 1 。 另外w 3 c 组织推荐了一种极具发展潜力的网络矢量格式s v g “1 ( s c a l e a b l e v e c t o rg r a p h i c s ) 。s v g 是标准的二维矢量图形描述语言。它也是一种基于x m l 的应用,在图形数据的描述表达方面具有许多独特的优点,可以方便的用这种格 式来在浏览器中展示电子地图。以改善传统网络g i s 栅格图象发布时矢量栅格频 繁转换和以矢量图发布时必须下载专业公司的插件的状况。 1 4x 儿相关技术在g i s 应用上的国内外相关进展 将瑚l 相关技术运用于g i s ,目前国内外相关部门都在开展这项研究;但是 与本文的着眼点不同。而且这些研究基本上还没有正式的产品上市,主要还停留 在理论研究阶段。 英国l e e d s 大学曾用j a v a 开发了一个工具g e o t o o l s ”1 ,基于w e b 对符合 g m l i 0 规范的空间数据做显示试验,它使用x e r c e s jp a r s e r 解析g m l 数据和相 应的d t d 元数据,再使用g e o t o o l s 对解析后的数据做处理,实现地图显示。 g e o t o o l s 在功能上支持对地图的浏览和放缩,实体的选取以及点击特定实体之 后产生新的链接网页。 另外,荷兰t o p l o v e c t o r 数据格式的供应商( t d n ) 也正在着手将t o p l o v e c t o r 这种数据格式转换为6 m l 2 o 规范所约定的6 m l 文档来进行空间数据的存储”。 国内,北京大学也开发了一个基于g m l 的网络g i s 系统。它采用g m l 编码空 间数据,以g m ls c h e m a 来约束g m l 的数据格式。g m l 数据的浏览通过开发的7 a v a a p p l e t 以文本流方式动态下载到客户端进行显示。在j a v aa p p l e t 中主要负责 对下载的g m l 数据进行解析,并将解析后的g m l 数据供7 a v aa p p l e t 编写的g i s 功能部件进行显示和其他功能使用。 在s v g 的使用上,因为它是作为一个通用的矢量图形标准,国内外很多领域 都有它的影子,但是将它与g m l 结合起来在网络g i s 中的运用,并不多觅。 i 5 本文的工作 本文正是从目前网络g i s 空间数据难以共享和互操作的局面入手,考虑到 ( m l 中x m l 实例文档和实例文档对应的应用s c h e m a 良好的一致性,拟采用g m l 4 编码来整合不同的数据源格式。以实现空间数据的真正共享和互操作。并且将整 合后的g 池文档转换为s v g 格式来进行w e b 发布。通过这种方式构建的网络g i s 应用系统能够克服传统网络6 i s 的一些弊端,如异构的空间数据难以共享,矢量 栅格数据频繁转换,客户交互查询不方便,服务器端负担过重等等。在平台选择 上考虑到j a v a 强大的跨平台能力和网络应用能力,因此本文采用了该技术来设 计服务器端空间数据的转换服务和查询服务。将j a v a 的平台无关性和x m l 的数 据无关性有机的结合起来,尽量做到整个实验系统的最大独立性。 本文研究的主要目标是基于g m l 来整合异构的网络地理空间数据,以实现网 络地理空间数据的高效管理和共享。并且在g m l 编码的空间数据的基础上,利用 s v g 技术来实现空间数据的w e b 发布。 研究的主要内容包括如下: 1 ) 基于地理要素的g m l 的编码、存储、共享机制。 2 ) 常用的空问数据格式与g m l 格式的转换整合。 0 ) 整合后g m l 空间数据的地图表达一s v g 。 4 ) 在s v g 图形格式下的w e b 发布中简单g i s 交互功能的开发。 第二章x m l 相关技术体系及在数据管理中的应用 x m l 的出现对计算机软件业而言无疑是一场翻天覆地的革命,正如微软总裁比 尔盖茨所形容的那样f 8 】“y d v i l 与八十年代末九十年代初的图形用户界面( g u i ) 和九 十年代末的h 3 x 4 l 相比具有同等重要的意义。”也正是因为此,微软基于网络应用 的n e t 平台完全以y d v l l 为核心来构建。 2 1 x 肌的来源及其定义 2 1 1x m l 的产生背景0 3 x m l 同h t m l 一样都来自标准通用标记语言( s t a n d a r dg e n e r a l i z e dm a r k u p l a n g u a g e ) ,简称s g m l 。早在w e b 出现之前,s g m l 就已经存在。正如其名称所言, s g m l 是一种用标记来描述文档资料的通用语言,它包含了一系列的文档类型定义 ( d o c u m e nct y p ed e f n i t i o n ) ,简称d t d 。d t d 中定义了标记的含义,因而s g m l 的语法是可以扩展的。s g m l 十分庞大,既不容易学,又不容易使用,在计算机上 实现也十分困难。因此作为s g m l 个子集的h t m l 成为流行的w e b 标记语言。然而 随着w e b 应用越来越广泛和深入,h t m l 逐渐不堪大任。开发一种新的w e b 标记语言 就显得十分必要。由于s g m l 过于庞大,不适于作为w e b 语言,w 3 c ( w wc o n s o r t i u m ) 建议使用一种精简的s g m l 版本,x m l 就这样诞生了。 2 1 2x m l 的定义 x m l 将s g m l 的丰富功能与h t m l 的易用性结合n w e b 的应用中,保留了s g m l 的可 扩展功能,这使x m l 从根本上有别于h t m l 。x m l 不再是固定的标记( t a g ) ,而是 允许定义数量不限的标记来描述文档中的资料,允许嵌套的信息结构。h t m l 只是 w e b 显示数据的通用方法,而x m l 提供了一个直接处理w e b 数据盼通用手段。h t m l 着重描述w e b 页面的显示格式,而x m l 着重描述的是w e b 页面的内容。x m l 是一种存 储结构化和半结构化信息的理想数据格式,这些被格式化的信息可以在不同的媒 体介质上发布或出版。本质上x m l 是一种元语言,是一种用于描述其它语言的语 言。它的目的是创建一种简单而又强有力的信息存储、处理和分发机制。 2 2x m l 的相关技术 x m l 技术在近几年获得了很大的发展,x m l 技术体系涵盖的内容也越来越多 这里仅介绍与本文相关的一些内容。x m l 技术的框架如下图: 6 臼定义的s c h e m a 图2 1x m l 技术框架 2 2 1d t d ,s c h e m a 和x m l 应用“ x m ls c h e m a 是w 3 c 的推荐标准,于2 0 0 1 年5 月正式发布,经过数年的大规模 讨论和开发,终于最终确定下来,使得x m l 文档描述有了一个国际标准。x m l s c h e m a 目前已经基本取代了d t d 在) ( m l 刚刚成为w 3 c 推荐标准时的地位。由于) ( m l 是s g m l 的一个子集,因此它也继承了s g m l 世界中用于文档描述的d t d ,然而由于 d t d 偏重信息的结构而不考虑信息的含义,因此d t d 有着不少缺陷: 1 ) d t d 基于正则表达式,描述能力有限。 2 ) d t d 没有数据类型的支持,在大多数应用环境下能力不足。 3 ) d t d 的约束( r e s t r i c t i o n ) 定义能力不足,无法对x m l 实例文档做出更细致 的语义限制。 4 ) d t d 不够结构化,重用的代价相对较高。 5 ) d t d 本身不是x m l 文档,而d t d 的构建和访问并没有标准的编程接口,无法使 用标准的编程方式进行d t d 维护。 x m ls c h e m a 正是针对d t d 的这些缺点而设计。总体上x m ls c h e m a 把符号流 的结构提高到对象的层次并且在一定程度上考虑了信息的含义,方便将以x m l 格 式存在的信息映射到计算机软件中的对象体系,以简化分布环境中对象迁移的存 储格式转换过程。首先) ( m ls c h e m a 本身就是一个x m l 文档,具有很强的描述能 力、扩展能力和处理维护能力。其次删ls c h e m a 中描述的结构是以对象类型为 导向,通过封装,引用,继承,关联等方式组织。再次x m ls c h e m a 的主要目的 是用来定义一类x m l 文档,每个( 或多个) 完整的s c h e m a 代表着一个x m l 应 用,后面提到的g m l ,s v g 等都是x m l 的应用。因此s c h e m a 的“实例文档”常常 用来表示一个与特定】( m ls c h e m a 相一致的y a i l 文档。 2 2 2n a m e s p a c e s 在x m l q u ,因为其强大的可扩展性,用户可以自己定义标记。但如果把多个 x m l 文件合并为一个时,就很可能出现冲突。n a m e s p a c e s ( 名称空间) 就是为了 解决这个问题而出现的。对x m ln a m e s p a c e s 严格的定义是:n a m e s p a c e 是用u r i 加以区别,在x m l 文件的元素和属性中出现的所有名称的集合。有了n a m e s p a c e , 用户就可以保证在他的文件中使用的名称是独一无二的。在没有n a m e s p a c e 的 】( m l 文件中,元素和属性中出现的名称无异于一组没有结构的字符。这样的字符 称为本地名称。本地名称在网络上是极不合适的,可以想象,网络上会有成千上 万的人使用同一个名称,而它们却代表了不同的含义,这势必引起混淆。而 n a m e s p a c e 通过u r i 就可以区别同名的标识。n a m e s p a c e 的声明要用到前缀x m l n s 。 声明的n a m e s p a c e 位于指定的u r i ,同样,它也有个名字,我们称这个名字为: n a m e s p a c e 名。n a m e s p a c e 名必须是独有的、一致的。由它修饰过的元素就被认为 它由指定u r i 处的n a m e s p a c e 来约束。 2 2 ,3x l i n k x l i n k 技术描述的是x m l 文件中的链接操作。在h t m l 中,常用标记 表示链 接,通过标记( a ,可以从一个h t m l 文件链接到另一个h t m l 文件,或者链接到文 件的某一部分。另外,标记 和 允许图形等对象直接嵌入文件。x m l 链接完全不同,它没有专门的链接元素,需要通过在元素中指定属性来表示链接, 只要元素包含x l i n k :t y p e 属性,且取值为“s i m p l e ”或“e x t e n d e d ”,该元素 就是链接元素。其中x l i n k 是代表x l i n kn a m e s p a c e s 的前缀,当前版本的x l i n k 是h t t p :w w w w 3 o r g t r 2 0 0 1 r e c x l i n k 一2 0 0 1 0 6 2 7 。根据x l i n k :t y p e 属性的 取值,可以将x m l 链接划分为简单) 【m l 链接和扩展x m l 链接。简单x m l 链接的 x l i n k :t y p e 固定取值为“s i m p l e ”,扩展x m l 链接的x l i n k :t y p e 固定取值为 “e x t e n d e d ”。简单x m l 链接与h t m l 链接非常相似,它在链接元素和目标资源间 建立链接。另外,x p o i n t e r 作为x l i n k 的一部分,类似于h t m l 中锚的概念,在l 中相当于一个指针,定义了) ( m l 文档的每个单独部分的寻址模式。 2 2 4g m l : 稍后将在g m l 的整合转换一章中详细阐述。 2 2 5s v g 5 1 s v g ,即s c a l a b l ev e c t o rg r a p h i c ,是w 3 c 推出用来描述二维矢量图形和矢 量点阵混合图形的置标语言,是一种全新的矢量图形格式标准,通过使用s v g 能够向i n t e r n e t 提供可任意伸缩的矢量图形。和其它许多基于打印的产品相比, 女h a d o b e 的e p s 格式,s v g 的不同之处在于它是基于 ( m l 的,是一个x m l 应用。s v g 的优点在于: 1 ) 任意缩放:用户可以自由地缩放s v g 格式的图形而不会破坏清晰度。 2 ) 文本独立:s v g 图形中的文字独立于图形,可以编辑和查询。同时,也不会 再有字体的限制,用户系统即使没有安装某一字体,同样可以看到这些字体。 3 ) 较小文件尺寸:一般而言,在图形元素较简单的情况下,s v g 图形的尺寸要 比其它图像格式如g i f ,j p e g 更小。 4 ) 超强色彩控制:s v g 图像具有一个1 6 0 0 万色彩的调色板,支持i c c 标准,r g b , 线性填充和遮罩。 5 ) s v g 支持动画:这如同m a c r o m e d i a 的f l a s h ,不过不同的是f l a s h 是封闭的二迸 制流格式,而s v g 是开放的文本格式。 6 ) s v g 完全支持d o m ( d o m c u m e n to b j e c tm o d e l ) ,因而s v g 以及s v g 中的对象( 元 素) 完全可以通过脚本语言接受外部事件的驱动,例如鼠标动作,实现自身或对 其它对象的控制。 7 ) s v g 图形可以很方便地动态生成,例如用j a v a s c r i p t ,x s l t ,j a v a 等。 为了能在普通的w e b 浏览器中观看s v g 图形,必须安装s v g 插件。由于s v g 的广 泛流行,支持s v g 的插件越来越多,最常用的插件是a d o b e 的s v g v i e w e r 3 0 “。可 以预见,在不久的将来,更高版本的浏览器将直接内嵌支持s v g 格式的功能。 2 3 ) 眦在数据管理上的应用 x m l 很重要的一个用途便是在数据管理上的应用。因为x m l 实际上是将结构 化的数据存贮在一个纯文本文件中,通过扩展x m l 即可提供一种通用的数据格式 不同的软件系统之间可以通过这种新的数据描述方式进行通信从而实现完全的 互操作。同时x m l 通过标记文本的方法。不但可以表达信息内容,还可以表达信息 的含义结构,将计算机软件之间交换的知识提升到有结构,有意义的符号流的水 平。总而言之,x m l 在数据管理上有很多良好的特性。 2 3 1x m l 的主要特性 1 ) 可扩展性 用户可以根据自己的需要定义标记。在定义标记时,根据一些通用的规则来 进行创建,比如描述学校的信息时,需要描述学校的名称、学校的建校日期、地 址、学校的邮政编码等等信息,就必须创建用于每一项的标记,而且是符合常规 理解的,x m l 编码示例如下所示。 x x 大学 1 9 1 5 南京市x x 路1 # 2 1 0 0 2 4 9 这样不同的领域就可以根据不同的需要来定义,如0 g c 基于x m l 标准制定的地 理标识语言g m l 。 2 ) 文档结构化 从文档结构化这一点来看,可以说x m l 是面向对象的。它把每个标记作为一 个对象来看待。) ( l i l 组织的数据文件可以被看作树的结构,通过程序即可遍历树 上所有的节点而得出需要的数据。由于) 口i l l 的结构化和可扩展性,舭文档的结构 是可以嵌套的,根据实际需要,可以复杂到任何程度。这样x m l 就可以描述各种 各样的结构,通过这些丰富的结构来对数据进行组织,为应用的开发和程序的处 理提供结构化的数据。通常情况下,不管用什么语言对需要的数据进行数据结构 的设计都是非常重要的,通过x m l 这一点是比较容易实现的。 3 ) 有效性验证 瑚l 文档中的结构是通过d t d 或x m ls c h e m a 来进行定义的,应用程序可以根据 定义的结构来对y 0 a l 文档进行验证,看该文档是否符合所定义的结构,这样应用 程序可以有效的分别处理各种情况,来保证处理的结果的正确性。x m l 文档中允 许进行检查数据结构有效性的语法描述,只要在) ( m l 文档的开头增加一句语法定 义即可。如下所示: 该旬就描述了对数据进行有效性检查的设置,指出了验证所要求的结构定义文 件。这样就可以根据定义文件对该x m l 文档进行数据结构有效性的验证。值得重 点指出的是,现在的x m l 文档基本上都配以x m ls c h e m a 来进行验证。) 【m ls c h e m a 可以对x d l 文档进行验证,但它的功能不仅限于验证,因为它是以一种面向对象 的思想来组织验证元素,所以比较适用于对需要韵数据结构进行建模,相应的l 实例文档需满足x m ls c h e m a 定义的结构,即具有x i l 】i ls c h e m a 建模后的数据结构。 4 ) 内容、表达和处理相分离 x l d l 文档本身说明了文档中包括哪些标记和内容,但并不说明文档以什么样 式来显示,从这方面来说x m l 和h t m l 是截然不同的。总的来说,x m l 是对内容的结 构和意义进行描述,而h t m l 是对内容如何显示进行描述。h t m l 是把内容与表达混 合起来的,而x m l 只负责内容的描述,至于如何表达,x m l 是不负责的。对于x m l 描述的数据如何表达是要靠其他方法进行描述和处理的,比如说:串接样式表 ( c s s ) 。这样x m l 就把内容和表达以及处理分离开来了。 2 3 2x m l 管理数据与传统数据库管理数据的对比 从对数据的管理角度而言,x m l 和传统的关系数据库各有特色,现比较如下: 1 ) 存储的信息形式上: 用x m l 来管理数据,信息形式可以复杂多样,个别字段可以非常非常大。同 时元素单元以祖先、兄弟、子孙来建立层次关系,使用链接引用即可实现网络联 系,并且每个元素单元都有自己的属性,不需相同。 而在数据库存储中,通常存储单元具有相同大小,且只含一种信息类型( 二 进制大对象虽然对字段大小没有固定要求,但其内部信息的表达近乎为零,必须 借助其他的说明数据加以使用) 。每个单元也只有两种关系:与记录的关系和与 字段的关系。 在存储的信息形式上,相比较于传统的关系数据库,x m l 更灵活、更机动。 2 ) 数据的查询效率上: 目前,x m l 文档中元素或属性的查询通过遍历树的方式来进行,并且也只限 于在d o m 和x s l t 中。例如:通过使用d 0 h t 和j a v a 语言,首先必须检索所有的记录, 作为列表将记录一个个单独找出,然后装配成记录集,这种方式对于复杂的查询 来说,工作量还是比较大的。使用d o m 可以很方便的完成更新,插入,删除等操 作,但是对于分组,排序,统计等操作则需额外写代码实现。 在传统关系型数据库中,不管是对于查询,还是数据更新、插入、删除或者 数据的分组,排序,统计等操作都有相应的s o l 语言可用,可以说相当方便,而 且操作速度也非常快。 在这个方面来说,应该说x m l 是不如传统的关系数据库的。不过从发展的观 点来看,x m l 软件的速度提升很快,比如说微软的m s x m l 3 的d l l 对象就比最初的d l l 快了将近1 0 0 倍。 3 ) 信息存储格式上: x m l 中存储的信息基于文本,可以用任何文本编辑器进行处理。 传统关系数据库中信息是二进制流的,必须借助相应的数据库管理系统进行 编辑。 这也正是x m l 文档持久性的一个优势,即使多年以后,软件不能再读取现在 数据库的格式,但是读取x m l 文档仍然是毫无问蹶的。 4 ) 面向对象的模型映射上: x m l 能够以基于面向对象的思想来进行建模,而且能方便的映射到) ( m l 文档的 数据结构中,这一点可以通过x m ls c h e m a 来实现。 而现在面向对象的数据库尚处在发展之中。如果将面向对象的数据模型映射 到关系数据库中,需要建立中间过度的e r 模型,然后通过范式规范化等过程, 将逻辑上的对象在数据库中物理的用关系表来表达。 因此在数据建模上,可以说捌l 是简单高效且容易实现的。 5 ) 文档管理上: ) ( m l 内部组织可以很严密,但是x m l 文档之间的管理却比较松散,主要基于操 作系统的文件管理系统。 在传统关系数据库中,不仅表内部的组织有很多约束和规则,而且在表与表 之间的管理上,通过数据库管理系统,这些表也被有机的串联在一起。 在文档与文档的管理上,数据库的管理更加紧密。而l 毕竟还只是一种辅 之以s c h e m a 约束的文本文件而已。 6 ) 管理信息的数量上: x m l l p , 较适合于小型的应用,在大量数据的管理上明显是力不从心的。 而对于海量数据的管理,目前,数据库是最好的选择。 总而言之,两者各有所长。至于具体采用何种格式存储数据,一方面取决于 数据本身的特性,另一方面取决于使用数据的方式。一般情况下,如果数据形式 很复杂,或者数据在位置、顺序上与其他数据相关,则删l 存储是一个明智的选 择。因为x m l 可以灵活机动的表达数据间的各种关系。如果存储数据是为了向用 户提供大量的信息子集,并且常常需要对数据进行复杂的查询、分类、统计,而 且要求在这些操作上有较快的速度时,数据库仍然是首选。在这儿需要指出的是, x m l 与数据库,并不是两种对立的管理数据的方式,事实上很多数据库管理系统 中已经融入了x m l 的方式,比如说o r a c l e ,s q ls e r v e r 等等。 考虑到现今x m l 技术无与伦比的开放性和众多知名软件厂商广泛支持下的迅 猛发展性,应该说x m l 在数据管理上相对于传统的各种文件管理方式和现阶段的 数据库管理系统管理方式上还是具有一定的独特优势的。 2 3 ,3x m l 在w e b 数据管理方面的应用: 对w e b 上的数据管理来说,微观上,每个站点通常都是后台的数据库进行管 理。但宏观上基本都是以h t m l 链接来展开。通过h t b i l 有限的标记集来进行w e b 文 档的编码,一方面在内容的表达上不够完善,另外一方面,它将内容的表达和内 容样式的展示混淆在一起,这不利于内容的检索和集成。 w e b 的本质在于提供了一个开放的平台以利于信息的“共享”,而共享必须 大力加强元数据的管理。h t m l 在元数据的管理上可以说是相当微弱的。 正因为这些原因,x d l 推出以来后就倍受许多人的青睐,得到了广大知名厂 商的广泛关注。原因如下: 首先,x m l 本身可视为一种元语言,它为数据的共享提供了一种很好的机制。 通过得到来自其他站点的x m l 实例文档和规范实例文档数据结构的x m ls c h e m a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年乡村手工艺合作社法务岗位面试要点及模拟题解析
- 2025年中国电力建设集团招聘考试题库
- 2025年农村金融专业招聘考试模拟题集萃
- 抹灰工人安全培训内容课件
- 2025年临床医疗管理信息系统项目发展计划
- 2025年医用气体系统项目发展计划
- 福建省福州市2025-2026学年高三第一次质量检测数学试卷(含答案)
- 抗焦虑抑郁药物分类课件
- 2025年1月吕梁市贺昌中学第一学期高一期末学业水平测试必修一人教版2019
- 2024-2025学年广西柳州市三江侗族自治县人教版三年级下册期末考试数学试卷(含答案)
- 2025年中国物流集团国际物流事业部招聘面试经验及模拟题集
- 乡镇安全培训课件
- 2025四川省公安厅招聘辅警(448人)笔试参考题库附答案解析
- 中望CAD机械版使用手册
- 定额〔2025〕1号文-关于发布2018版电力建设工程概预算定额2024年度价格水平调整的通知
- 2024年9月28日安徽省地市级遴选笔试真题及解析
- 五运六气方剂
- 精益生产之自働化培训课件
- 施工现场岗位安全风险告知卡
- 腰椎穿刺术3PPT优秀课件
- 广州市小升初语文分析PPT学习教案
评论
0/150
提交评论