




已阅读5页,还剩48页未读, 继续免费阅读
(通信与信息系统专业论文)基于xml酒店信息系统数据的动态融合.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着海南省旅游的发展,酒店的发展也就随着旅游的发展而飞快地发展起来,然而 各个酒店的数据结构、数据库管理系统的不同,不能有效利用数据信息和实现异构数据 的共享,这对数据的统计和传输有很大阻碍,也对一个旅游大省的发展极其不利,可见 异构数据的处理在整个酒店和旅游行业来说是极其需要的。 本文提出了x m l 中间件技术,为异构数据库转换用户提供一个统一的接口。对 x m l 解决问题有两种方法,一是行业标准化,这是x m l 技术发展的主要方向,二是结 构化的x m l 文档转换。 本文描述了用s c h e m a 建立了酒店的部分x m l 文档与在c s 酒店系统中采用结构 化的x m l 文档作为套接字来传输数据,以及利用j a v a 技术、中间件技术来实现酒店数 据的转换与融合;把数据库数据、平面文档数据动态地转换成x m l 文档数据,利用x m l 文档的特点,在用户之间传输,最后再动态地转换存储到数据库中,解决了异构数据的 共享与传输问题,用户也可以利用x s l t 等技术来把x m l 文档转换成h t m l 网页发布。 本文的创新之处是建立了酒店的部分x m l 标准以及实现了异构数据与结构化 x i v i l 文档的相互转换。系统不仅仅可以处理酒店异构数据,而且也可以处理其它的企 业异构数据,充分体显了j a v a 、x m l 的可移植性具有一定的实用价值。 关键词:x m lj a v a 转换数据 a b s t r a c t w i t ht h ed e v e l o p m e n to ft h et o u r i s mo fh a i n a np r o v i n c e ,t h eh o t e ld e v e l o p sv e r y q u i c k l y b u tb e c a u s eo ft h ed i f f e r e n c eo ft h ed a t as t r u c t u r ea n dd b m so fe v e r yh o t e l ,i ti s h a r dt os h a r e ,t r a n s m i ta n da n a l y z et h ed i f f e r e n td a t a , i ti sa l s o n o tp r o p i t i o u st ot h e d e v e l o p m e n t f o rat o u r i s mp r o v i n c e i ns u m ,i ti sv e r yi m p o r t a n tt od e a lw i t ht h ed i f f e r e n td a t a f o rh o t e la n dt o u r i s mi n d u s t r y ht h ep a p e r ,x m li su s e da sm i d d l e w a r et ot r a n s m i td a t aa n dp r o v i d e sai n t e r f a c et o d i f f e r e n td a t a t h e r ea r et w ow a y st os o l v et h ex m lp r o b l e m :o n ei st h es t a n d a r d i z a t i o no f t h ex m li n d u s t r y , w h i c hi st h em a i no f i e n t a t i o uo fx l v l ld o c u m e n t ,t h eo t h e ri st h e c o n v e r s i o no f s t r u c t u r ex m l t h ep a p e rd e p i c t st h a th o wt ou s es c h e m at ob u i l dx m ld o c u m e n to fh o t e la n dh o w t o u s et h es t r u c t u r ex m la ss o c k e tt ot r a n s m i td a t a i ta l s od e p i c t sh o wt ou s et h ej a v aa n d m i d d l e w a r et e c h n o l o g yt of i n i s ht h et r a n s m i s s i o na n dt h em e r g e n e eo fh o t e ld a t a , u s et h e s p e c i a l t yo f x m l d o c u m e n t t oc o n v e r tt h ed a t ai n t od a t a b a s ea n dc o n v e r tf l a td o c u m e n tt ot h e x m ld o c u m e n td a t a hs u n 3 i tc a ns o l v et h ep r o b l e mo fs h a r i n ga n dc o n v e r t i n gt h ed i f f e r e n t d a t a ,o f c o a r s e ,t h e n s e r a l s o c a n c o n v c r t t h e x l v i l d o c u m e n t t o w e b p a g e b y x s l t t h ei n n o v a t i v ea s p e c t so f t h i sp a p e ra r et h a te s t a b l i s h m e n to f t h ex m ls t a n d a r do f h o t e l a n dt h ec o n v e r s i o nb e t w e e nt h ed i f f e r e n td a t aa n dt h ex m ld a t a t h i ss y s t e mn o to n l yc a n d e a lw i l l lt h ed i f f e r e n td a t ao fh o t e l ,b u ta l s oc a nd e a lw i t ht h ed i f f e r e n td a t ao fo t h e r e n t e r p r i s ed y n a m i c a l l y i tw e l ld i s p l a y st h et r a n s p l a n t a t i o na n dt h ed i f f e r e n tp l a t f o r mo f t h e x m la n dj a v a i naw o r d ,t h es y s t e mi sv e r yu s e f u lt os t a n d a r dx m la n ds t r u c t u r es t a n d a r d x m l , s oi th a sc e r t a i na v a i l a b i l i t y k e y w o r d s :x m lj a v ac o n v e r td i f f e r e n td a t a 原创性声明 本人声明所呈交的学位论文是在导师的指导下独立完成的。论文 中取得的研究成果除加以标注的地方外,不包含其他人已经发表的研 究成果,也不包含本人为获得其他学位而使用过的成果。与我一同工 作的同志对本研究所做的任何贡献均已在论文中进行了说明并表示谢 意。本声明的法律后果由本人承担。 本人签字三毒盖多 即兰垒 占, e l | 善e l 使用授权说明 为保障学位论文的著作权,授权学校“有权保留送交学位论文 的原件,允许学位论文被查阅和借阅,学校可以公布学位论文的全部 或部分内容,可以影印、缩印或其他复制手段保存学位论文”,学校必 须严格按照授权对论文进行处理,不得超越授权对毕业论文进行任意 处置。 授权螂益知 。叫障玛1 8 日 第l 章绪论 引言 随着计算机技术的不断发展,旅游信息化进程的r 趋加快,其管理信息系统与以往 相比有了巨大的进步。在旅游信息化发展过程中,酒店信息化也得到很大的发展,嗣时 其管理信息系统也积累了大量数据,并且为存储和管理这些数据不断加大投资。另外 随着计算机网络的发展,酒店信息逐渐从一个孤立节点发展成为不断与网络交换信息和 进行商务事务的实体,酒店数据集成也从酒店内部集成走向了酒店间集成,这必然导致 越来越多的酒店应用需要访问各种数据源,再加之其它经济和人为因素的影响,使得各 个酒店采用的信息管理系统也大不相同,从简单的文档系统到复杂的网络数据库,它们 构成了酒店系统的异构数据源。 l _ l 、目前国内外异构数据处理的研究状况与项目 异构数据库集成并不是一个新的研究领域,在商业领域,数据集成系统已经成功应 用在企业、电子商务和生命科学领域。目前已经研制出来的异构数据集成系统有很多。 如: g a r h c 叫 g a r li c 是美国i b m 公司a l m a d e n 研究中心数据库组的一个开发项目,是一个对大规 模异构多媒体信息进行管理的集成系统。该系统把传统的多媒体数据存储在不同的数据 仓库中,比如说数据库、文档、文本管理器等:g a r l i c 支持新的数据仓库的添加,并通 过“中间件”查询处理器提高查询效率。 l o r e ( l i g h tw e i g h to b j e c tr e p o s i t o r y ) 是美国s t a n d f o r d 大学设计的一个专门用 于管理半结构化信息的数据库管理信息系统,可以对半结构化数据o e m 和x m l 数据进行 存储和管理。 v e r s a t i t l e ”1 v e r s a t i t l e 是由东南大学开发的一个基于c o r b a 的可扩展的异构数据源集成系统 原型。该模型在i o n a 公司的o r b i x 产品上,对s q ls e r v e r 、v e r s a n t 等进行包装和集 成。 1 2 、目前我省旅游酒店信息系统发展状况 海南是一个旅游大省旅游收入在全省经济中占了很大的比历。旅游的发展对海南 来况十分重要,酒店的发展也就随着旅游的发展而飞快地发展起来,然而各个酒店的数 据结构、数据库管理系统的不同不能有效利用数据信息,实现异地异构数据的共享 这对数据的统计和传输有很大阻碍,也对一个旅游大省的发展极其不利,可见必须有一 个系统能够支持异构数据的集成。 1 3 、提出问题以及解决技术 如何使异构数据库间的信息有效地集成与共享,已成为越来越多酒店与旅游局所面 临的问题,也是海南实现电子政务化和信息智能岛必需解决的问题。首先,关键的一个 问题是必须研究它们之间异构数据的集成问题,将孤立的数据集成,给用户提供一个统 一的视图,其次是选用合适的技术进行数据分析和处理。正是基于这样的一个背景,本 课题提出了采用x m l 中间件来实现异构数据库间的数据转换和共享的思想,在此基础 上利用i a v a 技术、d o m 技术和x m l 描述数据的优越性,设计了基于数据库转换为x m l 的查询模式和把x m l 数据转换存储到不同的关系数据库中,还包括了把以前用来数据 统计与共享的平面文档转换成为x m l 文档,达到了异构数据库之间的数据转换和共享。 1 4 、本文主要工作 随着x m l 技术的采用,异构数据集成领域又重新成为了研究的热点,将数据集成 的研究推向了一个新的台阶。尽管大多数的商业数据仍然存储在关系数据库中,但是人 们对把传统系统中的数据转换为x m l 表现出了极大的兴趣,如i b m 、o r a c l e 和m i c r o s o f t 在它们的数据库产品中增加了x m l 视图功能。 本论文的主要工作归纳如下: 简单分析了异构数据处理的相关基础知识,根据提出了异构数据集成中间件的 概念,引入了x m l 做异构数据处理中间件。 根据数据集成的特点,在研究了相关领域技术发展情况下,设计了一种基于 x m l 和j a v a 技术的异构数据转换与共享的系统。 实现了一个基于x m l 数据的酒店数据动态融含系统。 本文的创新之处是:动态地处理了关系数据库数据与x m l 文档数据的相互转 换。 1 5 、文章的组织结构 第一章诸论,简介了目前国内外异构数据集成状况,我省旅游酒店业的发展状况 以及提出问题的解决方案。 第二章x m l 概述,详细介绍了x m l 技术的特点、发展背景与语法技术,特别强 泉漉十分重要,酒店的发展也就随着旅游的发展而飞快地蔹展起柬然而各个酒店的数 据结构、数据库管理系统的不同,不能有效利用数据信息,实现异地异构数据的共享, 这对数据的统计和传输有很大阻碍,也对一个旅游大省的发展极其不利,可见必须有。 个系统能够支持异构数据的集成。 13 、提出问题以及解决技术 如何使异构数据库间的信息有效地集成与共享,已成为越来越多酒店与旅游局所面 临的问题,也是海南实现电子政务化和信息智能岛必需解决的问题。首先,关键的个 问题是必须研究它们之间异构数据的集成问题,将孤立的数据集成,给用户提供一个统 一的视图,其次是选用合适的技术进行数据分析和处理。正是基于这样的个背景,本 课题提出了采用x m l 中间件来实现异构数据库间的数据转换和共享的思想,在此基础 e 利用i a v a 技术、d o m 技术和x m l 描述数据的优越性,设计了基于数据库转换为x m l 的壹询模式和把x a m l 数据转换存储到不同的关系数据库中,还包括了把以前用来数据 统计与共享的平面文档转换成为x m l 文档,达到了异构数据库之间的数据转换和共享, 1 4 、本文主要工作 随着x m i 技术的采用,异构数据集成领域又重新成为了研究的热点,将数据集成 的研究推向了一个新的台阶。尽管大多数的商业数据仍然存储在关系数据库中,但是人 们对把传统系统中的数据转换为l 表现出了极大的兴趣,如i b m 、o r a c i e 和m i c r o s o f t 在它们的数据库产品中增加了蹦l 视图功能。 本论文的主要工作归纳如下: 简单分析了异构数据处理的相关基础知识,根据提出丁异构数据集成中间件的 概念,引入了x m l 做异构数据处理中间件。 根据数据集成的特点,在研究了相关领域技术发展情况下,设计了一种基于 x m l 和j a v a 技术的异构数据转换与共享的系统。 实现了个基于x m l 数据的酒店数据动态融合系统。 本文的创新之处是:动态地处理了关系数据库数据与x m l 文档数据的相互转 换。 1 5 、文章的组织结构 第一章诸论,简介了目前舀内外异构数据集成状况,我省旅游酒店业的发展状况 以及提出问题的解决方案。 第二章x m l 概述,详细介绍了x m l 技术的特点、发展背景与语法技术,特别强 第二章x m l 概述,详细介绍了x m l 技术的特点、发展背景与语法技术,特别强 调介绍了d t d 与s c h e m a ,这是建立x m l 标准的核心技术。在全章中用了一个实例来 连贯各种x m l 技术。最后展望了x m l 将来发展。 第三章j a v ax m l 数据库与中间件,介绍了数据系统目标与目前异构数据处理的 主要技术;简单介绍了j a v a 技术的特点和其主要技术j d b c 、s o c k e t 、d o m 技术概念; 描述了中间件技术作用以及引入x m l 做中间件的原因;最后系统地概括了x m l 、j a v a 、 中间件、数据库之间的相互渗透应用以及将来的发展状况。 第四章基于x m l 酒店信息系统的设计,详细阐述了课题设计的过程与需求分析, 包括了可行性分析与实现系统数据转换的原理,并且设计了系统框架模型,定义了酒 店部分x m l 标准,建立了数据库表。 第五章系统的实现与测试,先把系统实现开发环境描述了一下,再简述了关键技 术的细节步骤,最后描述对系统的测试以及相关数据,检验了系统的功能与可行性。 第六章结束语,阐述了本系统的取得的成绩与不足之处。 第2 章x m l 概述 引言 x m l ( e x t e n s i b l em a r k u pl a n d a u ) 可扩展标记性语言是由w 3 c ( w o r l dw i d ew e b c o n s o r t i u m ) 互联网联合组织于1 9 9 8 年2 月发布的一种标准,同h t m l 一样是特别为 w e b 应用服务的,也可以用来做数据融合标准,是s g m l ( s t a n d a r dg e n e r a l i z e dm a r k u p l a n g u a g e ) 标准通用标记性语言的一个简化子集【3 l 。总的来说,x m l 是一种中介标记语 言( m e t a m a r k u pl a n g u a g e ) ,可提供描述结构化资料的格式,详细来说,x m l 是一种 类似于h t m l 被设计用来描述数据的语言。 本章主要讲述x m l 的基础概念与术语,包括x m l 产生的背景、x m l 文档格式、 x m l 的语法与结构、文档对象模型、名字空间、c s s 与x m l 的x s l ,以及为什么使 用x m l 及展望x m l 的前景。这些基础概念与知识是本课题研究工作的理论与技术基 础。 2 1 、x m l 简述 2 1 1 、) 【m l 的产生背景 h t m l 超文本标记语言是s g m l 的一个实例化的子集,是一种简单的表示性语言, 使得w e b 的发布变得非常简单。它以自己的方式开创了w e b ,但是随着新型领域的兴 起及w e b 的日渐成熟,用户发现h t m l 在简化s g m i 上走得太远,它只能显示内容而 无法表达数据内容,也就是说不能定义标记内容,可读性差,另外最重要的是它是一个 实例化的子集,可扩展性差,用户根本不能自定义有意义的标签。w e b 需要一种交换具 有更广泛结构形式内容的手段,需要种新标记语言,即可以做w e b 用,也可以做数 据来用。x m l 正是为解决这些需求应运而生的。 x m l 也是s g m l 的子集,将s g m l 的丰富功能与h t m l 的易用性结合到了w e b 的应用中,以一种开放的自我描述方式定义了数据结构,在描述数据内容的同时能突出 对结构的描述,从而体现出数据之间的关系。x m l 是i n t e m e t 环境中跨平台的、依赖于 内容的技术,是处理分布式结构信息的最佳工具,也是异构数据解决的有效数据语言。 x m l 解决了h t m l 不能解决的一些w e b 问题。比如说可利用的信息较多,但难以找 到自己需要的那部分信息的问题。s g m l 、h t m l 和x m l 的进化关系如图l 3 i 所示 通用标记语矗( g m l ) 一1 9 6 9 年 标准标记语斋( s g m l ) 一1 9 8 5 年 h t m l 一1 9 9 3 年llx m l 一1 9 9 8 年 嚣障 文本标记l 量图像 语言ls v g x h t m ll 同步多 媒体集 成语言 s m l l 手持设 各标识 语言 h d m l 在线电 子书 o e b 图1 标记语言发展过程 2 1 t2 、x m l 的优越性 ( i ) 半结构化的数据模型 传统数据库中的数据是结构化的,实体及实体间的关系用二维表来表示实体间多 对多的关系要引进中间表来表示,这种表示方法有大量的数据冗余,而x m l 是一种半 结构化的数据模型,它的自我描述性质能够很好地表现许多复杂的数据关系,结构简单 明了。 ( 2 ) 数据与格式无关性 x i v i l 的数据存储格式不受显示格式的制约,一般来说,一篇文档包括三个要素: 数据、结构以及显示方式【4 l 。x m l 把文档的三要素独立开来分别处理。首先把显示格式 从数据内容中独立出来,保存在样式单文档s t y l e s h e e t 中,这样如果需要改变文档的显 示方式,只要修改样式单文档就行了。数据显示与内容分丌,允许指定不同的显示方式 ( 如h t m l ) ,并且数据结构化,使得数据可快速更新。 ( 3 ) 便于数据查询 x m l 的文档描述的语义非常清楚,而且很容易就可以将它和关系数据库中的属性 一对应起来,所以不论是数据库查询还是基于w e b 上的内容查询都能够支持实施十 分精确的查询。 6 ( 4 ) 便于传输和保值 x m l 文档具有跨平台的特性便于在各种不同的系统之间传输,并且可以以固定 统一的格式保存和传输。 ( 5 ) 可扩展性 h t m l 是一种用于构建在w e b 上传输文档的标记语言,只允许文档制作人员使用 固定的标记符集,而x m l 可以创建标记语言,以半结构化的方式描述各种类型的数据。 这是x m l 最突出的优势。 ( 6 ) 可维护性 x m l 使用标准的工具处理,如x m l 解析器、x s l 、x s l t 、x p a t h 等,使x m l 具 有很强的可维护性。 2 1 _ 3 、x m l 相关组件 x m l 作为一个国际通用标准,一开始就得到了如m i c r o s o f t 等大公司广泛支持,并 由w 3 c 公司认证。x m l 不单单是一种技术,而是一组技术,这里将这些技术称为一个 标准家族。x m l 的核心部分为x m l l 0 语法,包括文档类型定义、x m l 的命名空间、 x m l 模式、x m l 数据结构、导航和链接、转换和表示等功能和内容。 。2 2 、x m l 语法与技术 藏 掌2 1 、x m l 语法特点 一个x v i l 文档首先应当是“格式良好的”( w e l l - f o r m e d ) 5 1 ,“格式良好的”垤l 文档包括: ( 1 ) 每个元素必须有起始和结束标签,起始标签和结束标签应当匹配,结束标签 是必不可少的。 ( 2 ) ) o v i l 有严格的大小写要求,大小写要一致,x m l 对字母的大小写是敏感的。 ( 3 ) 元素应当正确嵌套,子元素应当完全包括在父辈元素中。 ( 4 ) x m l 文档要满足根元素唯一的特性。 2 2 2 、x m l 文档格式 x m l 文档的基本结构由序言部分和一个根元素组成,序言包括了x m l 声明或d t d 或者是x m ls c h e m a 。d t d ( d o c u m e n tt y p ed e f i n e ) 文档类型定义和x m ls c h e m a 都 是用来描述x m l 文档结构的,也就是描述元素和属性是如何联系在一起的,用来检验 7 x m l 文档的有效性的。首先看一下下面的例l ,它就是一个简单的x m l 文档,辟id t d 柬检验x m l 文档的有效性。 例1 2 3 1 2 2 3 3 3 1 2 3 1 5 0 1 一个x m l 文档中有且仅有一个根元素,其他所有的元素都是它的子元素,根元素 出现在序言之后,它包括在x m l 文档的正文部分,这一部分由处理指令、注释、根元 素、元素、子元素、属性及内容等组成。 2 3 、x m l 文档类型定义d t d 文档类型定义( d t d d o c u m e n t t y p e d e f i n e ) 的作用是定义x m l 文档结构( 如文档中 的元素、属性等) 的语法,它规定了文档的结构以及如何嵌套文档,使用的是 e b n f ( e x t e n d e db a c k u s - n a u rf o 髓) 语法定义【3 1 。d t d 实际上可以看作是一个或多个x m l 文档的模板,包括了x m l 文档中的元素、元素的属性、元素的排列方式、顺序、元素 能够包含的内容等。x 2 v i l 文档都必须符合d t d 中的定义,以确保x m l 的致性与有 效性。x m l 文档中的元素,即我们所创建的标记,是根据我们应用的实际情况来创建 的,想要创建一份完整性高,适应性广的d t d 是非常困难的,因为各行各业都有他们 自己的行业特点,所以d t d 通常是以某种应用领域为定义的范围,范围越广就越复杂。 d t d 是由文档类型声明的内部子集加上外部子集所构成的,可以是一个完全独立 的文档,也可以在x m l 文档中直接设定。外部d t d ,就是在x m l 文档中调用另外已 经编辑好的d t d 文档。内部d t d ,就是在x m l 文档中直接设定d t d 格式。 内部d t d 是在x m l 文档的文档序言区域中定义的,语法 。 结束d t d 的定义。外部d t d 在物理上是一个独立于x m l 文档的文档,实 际上也是一个文本文档,只是使用d t d 为文档扩展名。在x m l 文档中,外部子集可以 通过关键字s y s t e m 或p u b l i c 指定,例l 中x m l 文档中的 就是用s y s t e m 来指定。 例2 外部d t d 子集 每! e l e m e n t 境外总金额( # p c d a t a ) 盛 ! e l e m e n t 境外开房数( # p c d a t a ) ) 外部d t d 独立于x m l 文档,它可以供多个x m l 文档使用,就像用同一个模板可 以写出多个不同内容的文档一样,这多个x m l 文档因为是引用同一个外部d t d ,所以 它们的结构大致相同。 也可以同时指定内部子集和外部子集,如: 但是在同时指定使用内部子集和外部子集时,以内部子集为主。外部d t d 的创建 方式、语法和内部d t d 是一样的,d t d 的语法比较简单。 9 由于d t d 遵循的是e b n f 定义,不符合x m l 语法的标准,自成一个体系,与x m l 棚比,存在一定的限制,如不具有可扩展性、弱数据类型、不支持x m l 命名空间、没 有面向对象的继承性等,限制了d t d 在x m l 中的发展。越来越多的用户发现了d t d 缺陷,因此需要一个代替d t d 并且能够解决d t d 缺陷的新的文档定义。就出现了x m l s c h e m a 。s c h e m a 相对于d t d 的明显好处是x m l s c h e m a 文档本身也是x m l 文档 而不是像d t d 一样使用自成一体的语法,这就方便了用户和开发者,因为可以使用相 同的工具来处理x m ls c h e m a 和其他x m l 信息,而不必专门为s c h e m a 使用特殊工 具,因此,x m ls c h e m a 将会逐渐替代d t d 。 2 4 、x m ls c h e m a x m l s c h e m a 是一种控制文档结构的方法,使用x m l 语法,具有x m l 的特点, 是一种遵循d t d 规则的x m l 文档,可以使用x m l 工具进行处理,这使得x m l s c h e m a 功能更强大,更灵活,主要表现在: ( 1 ) 在另一个模式中复用模式部分功能的能力。 ( 2 ) 定义在不同模式中复用复杂结构的能力。 ( 3 ) 从已有数据类型出发定制自己的新数据类型的能力。 ( 4 ) 在一个文档中引用多个模式的能力【4 】o 同时对文档提供了比d t d 更有力更松散的约束机制,并且引进了数据类型概念和 对内容模型的支持。万丈高楼平地起,标准化是一个工程项目的基石。作为x m l 语言 的主要模块,s c h e m a 对标识的标准化模式起着极其重要的作用。因为模式在发送者和 接收者之间规定了强制性的协议,有利于文档之闯的信息交流,而且可以在不同的群体 之间共享,使得在不同的应用程序间创建、管理和处理相同的文件变得容易,共享数据 模式极大地简化了x m l 词汇的创建和维护,提高了数据的可靠性。在定义s c h e m a 模 式时,关键在于每个定义标识的细节问题,如哪个元素必须要出现,哪个元素内容的数 据类型( 因为每个标识的数据类型最好与数据库的数据类型相统一,有利于数据的存 储) 。元素出现的理由即为什么会出现这个元素这是定做模式时首先要考虑的问题。 这些问题不是一个人就可能解决的,而必须是几个或更多人一起对实际情况进行调研、 分析和讨论得来的,得出的模式标准要符合行业标准、并被用户所能理解和接受。这些 问题的标准化有利于信息数据的共享和网络传送。 v i ls c h e m a 包括两类:m i c r o s o f tx m ls c h e m a 和w 3 cx m ls c h e m a 。m i c r o s o f t x m l s c h e m a 是由m i c r o s o f t 公司推出的一种发展比较成熟的技术,而w 3 c v l l s c h e m a 由w 3 c 公司推出,现在正逐步完善标准。 o 在m i c r o s o f t x m l s c h e m a 中,名称空间为: 。 定义个元素, 包含描述元素的内容、数据类型、名称等的属性,其作用域总是全局: 定义一个属性,其作用域是在一个元素类型声明中,是局部的。当然,它也可以是全局 的,但必须在所有元素声明的外部。用d t :t y p e 声明一个数据类型,通过名称空间: 引入定义好的数据类型。要使用 m i c r o s o f tx m ls c h e m a ,需要m i c r o s o f t 的) a m l 分析程序( m s x m l ) 。m i c r o s o f tx m l s c h e m a 的元素定义是建立在d t d 的基础上,总的看来元素、属性等声明大致相同。一 旦定义好了s c h e m a 后就可以通过名称空间:x m l n s = x 。s c h e m a :s c h e m a 文档名”引入到 x m l 文档中。x m ls c h e m a 定义如例3 : 侧3m i c r o s o rx m ls c h e m a 定义 e l e m e n t 帅e = ”境外开房数”伶 e l e m e n t t y p en a m e = ”境内总人数”t i t :t y p e = ”i n t “胁 e l e m e n t t y p en a i n c - - - t 境内开房数”d t :t y p e = ”i n t ”胁 e l e m e n t t y p en a m e = ”境外开房数”d r :t y p e = ”i n t ”胁 e l e m e n t t y p en a m e = ”境外总金额”d t :t y p e = “f l o a t ”胁 l l 在w 3 cx m l s c h e m a 中名称空问是: w 3 cx m ls c h e m a 的声明可以分为两类: 性的声明分别为: x m l n s :x s d = h t t p :w w w w 3 o r g 2 0 0 1 x m l s c h e m a 简单类型和复杂类型。简单类型中的元素和属 复杂类型是为了生成元素内容模型和允许元素使用属性这个特性。其元素和属性声 明为: x s d :e o m p l e x t y p en a n l e = ” ” 同样用上面的例子来写出w 3 cx m l s c h e m a 定义,如例文瓶x s d : 例4w 3 cx m l s c h e m a 定义 x s d :e l e m e n tn a m e = ”境内总人数”t y p e = ”x s d :i n t ”肛 12 2 5 、c s s 与x m l 中的x s l x m l 有一项非常强大的技术就是转换功能,用一种描述性的编程语言来实现,并 存储在样式表中,把x m l 数据从一种形式转换成为另一种形式,x m l 数据可以用c s s ( 层叠式样表) 转换成h t m l ,也可以用x s l ( 可扩展样式表语言) 来转换。 c s s 被大多数的w e b 浏览器支持,它可以用于指定与数据有关的细节,包括字体、 大小、颜色、样式、页边距等等,允许文档制作人员指定元素的样式,与文档的结构无 关,结构和内容的分离提高了文档的灵活性。c s s 是一种严格的样式语法,它可以帮助 建立h t m l 的表示形式,但不能提供结构上的转换和重新排序,这给c s s 带来了局限。 x s l 用于处理x m l 文档中的丰富而复杂的数据,包括两个部分:用于格式化的 x m l 文档的x s l ( 扩展样式表语言格式化对象) 和把x m l 文档转化为其它数据格式 的x s l t ( 扩展样式表语言转换) 。x s l 具有c s s 所有功能,甚至更强大,但由于其未 成熟,本文不作介绍。x s l t 使用) ( p a t h 匹配节点把x m l 文档从一种格式转换为另 一种格式。是x m l 的主要技术,对x m l 的发展起着关键作用。其名称空间x s l t 为: h t t p :w w w w 3 o 吲1 9 9 9 x s l t r a n s f o r m 。样式表包含元素和属性都可以匹配的模板,可以 创建元素和属性,允许在节点集内进行迭代和排序,满足转换的需要。在转换过程中, 有两个节点的树结构:源树和结果树。源树上的节点对应于要应用该转换结果的源x m l 文档;结果树显示所产生的文档。 2 6 、x m l 的名称空间 x m l 允许文档制作人员创建自己的标记符,这样x m l 文档中很可能会定义许多 名字相同而意义不同的元素或属性,尤其在把不同的x m l 文档合而为一时,更容易产 生冲突,名称空间就是为了解决这个问题而提出的。它用u r j ( u n i f o l - mr e s o u r c e i n d i c a t o r ) 统一资源标识符r f c2 3 8 6 加以区别,是在x m l 文档的元素和属性中出现的 所有名称的集合,x m l 名称空间声明格式如下: ,上面格式中对元素的属性x m l n s 进行定义就表示对该元素指定了一个名 称空闻。有了名称空间,用户就可以保证在文档中使用的名称是难一的,各元素,属性 便可跨越文档的疆界,而不再是单纯寄居在某套语汇的文档格式中同时语汇也成为了 全球性的模块,可以与其他语汇模块任意组合、搭配,供各种各样的应用程序调用。如 果对一个元素定义了缺省名称空问,那么浚元素及其子元素,包括它们的属性都会自动 地成为该名称空间的一部分,不用再在每,一个元素和属性丽面标明了。 2 7 、x m l 的应用与发展前景 出于x m l 具有易于阅读和理解的词汇表,可用于数据库与服务器的中间层,直接 调用x m l 文档,使得数据不必每次都要通过数据库的调用来阅读,有很高的可读性, 大大缩短了开发时间。x m l 的优点备受瞩目,目前数据库领域的三大巨头一m m 、 o r a c l e 和m i c r o s o f = t 都在应用x m l ,使数据库运行得更快并适宜于提供w e b 服务。 电子商务是现代网络发展的主要趋势,是各国商业、政府所迫切关注的问题,在 过去3 0 年里,电子商务使用主要语言是e d i ( 电子数据交换) 1 6 】,由于e d i 提取有效 信息需消耗较多时间,可读性较差,满足不了现代网络发展的需要,微软公司已把x m l 看作为未来核心战略,提出了b i z t a l k 解决方案,作为一个电子商务通用标准【6 1 。w e b s e r v i c e 是将来网络发展的主要方向,而x m l 是w e bs e r v i c e 实现的核心技术。x m l 在这些领域的应用是极其广阔,人们可以通过x m l 中的x s l t 或d o m 或x q u e r y 把 不同的数据类型转换成为p d t 、h t m l 等通用格式,实现数据的共享。 b 2 b 、b 2 c 等电子商务的应用和现代新的网络形式一一网格( 需要把全世界的网 络数据进行整合) 的发展给x m l 带来了一次新的机遇。x m l 的发展方兴未艾,随着 x m l 技术的成熟,应用会越来越广泛。 4 第3 章j a v ax m l 数据库与中间件 引言 j a v a 、x m l 、数据库与中间件技术是现今软伟技术发展的主要方向,把这几种技 术有效的结合在一起来应用,对软件行业有着非常积极的意义,本章分析这几种技术的 特性。 3 ,1 、异构数据 异构数据库的异构性主要表现在计算机体系结构的异构、基础操作系统的异构、 d b m s 本身的异构。本文中主要是指d b m s 本身的异构。 3 1 1 、异构数据库系统的目标 异构数据库系统的目标在于实现不同数据库之间的数据信息资源、硬件设备资源和 人力资源的合并和共享,其中关键的一点就是以局部数据库模式为基础,建立全局的数 据模式或全局外视图7 1 。 异构数据集成时关键问题是异构性、完接性、性能与语义冲突8 1 。异构性主要表现 为系统异构与模式异构。完整性表现为数据完整性与约束完整性,性能是指快速适应数 据源的改变与低投入的特性,语义冲突为数据信息之间的语义定义差别。 对于异构数据库系统,实现数据共享应当达到两点:一是实现数据库转换,二是实 现数据的透明访问。数据库转换可以将一种数据库系统中定义的模型转化为另一种数据 库中的模型。然后根据需要再装入数据,这时用户就可以利用自己熟悉的数据库系统和 熟悉的查询语言实现数据共享的目标i s 。数据库转换工具首先进行类型转换,访问源数 据库系统,将源数据库的数据定义模型转换为目标数据库的数据定义模型,然后进行数 据重组,即将源数据库系统中的数据装入到目的数据库中。 异构数据库系统实现数据共享的另外一个目的就是数据的透明访问。在异构数据系 统中实现了数据的透明访问,用户就可以将异构分布式数据库系统看成普通的分布式数 据库系统。用自己熟悉的数据处理语言去访问数据库,如同访问一个数据库系统一样, 但目前还没有一种广泛使用的数据定义模型和数据查询语言实现数据的透明访问,但可 以采用多对一转换、双向的中间件等技术。 3 。1 2 、目前异构数据库集成的主要技术 1 、数据的迁移和转换 就是将原有的数据移植到新的数据管理系统中来。为了集成不同类型的数据,必须 将一些非传统的数据类型转化成新的数据类型。这种方法处理简单,已为大多数用户理 解和接受,缺点是随着数掘锊理系统的升级,原来数据的相关应用软件,或是被废_ 萍或 是重新开发,以适应新的数据管理系统。 2 、多数据库系统 多数据库系统就是一种能够接受和容纳多个异构数据库的系统,对外呈现出种集 成结构,| 面对内又允许各个异构数拚:库的自治性。 3 、使用中间件技术 中间件位于异构数据库系统、数据层和应用程序应用层之间,向下协调各数据库系 统,向上为访问集成数据的应用提供统一数据模式,和数据访问的通用接口。中间件系 统则主要集中为异构数据源提供一个高层次检索服务,相比数据的迁移和转换方法,中 间件系统模式是实现异构数据集成较理想的解决方案。 3 2 、中间件 中间件( m i d d l e w a r e ) 是基础软件的一大类,属于可复用软件的范畴。中间件处于 操作系统、网络和数据库之上层,应用软件的下层,总的作用是为处于自己上层的应用 软件提供运行与开发的环境,帮助用户灵活、高效地开发和集成复杂的应用软俐外。中 i 司件是一种独立的系统软件或服务程序,是分布式应用软件,借助这种软件在不同的技 术之间共享资源。中间件位于客户机服务器的操作系统之上,管理计算资源和网络通信。 定义表明:中间件是一类软件,而非一种软件,中间件不仅仅实现互连,还要实现应用 之间的互操作,中间件是基于分布式处理的软件,最突出的特点是其网络通信功能。 3 2 1 、中问件的作用 中间件屏蔽了底层操作系统的复杂性,使程序开发人员对一个简单面统一的开发环 境减少了程序设计的复杂性。 中间件的作用不仅仅简便了开发、缩短了开发周期、减少了资金的投入,同时也减 少了系统的维护、运行和管理,关键是中间件作为新层次的基础软件,将不同时期、不 同操作系统上开发的应用软件集成,整体协调工作。 3 2 2 、引入) ( m l 技术的原因 选用中间件作为酒店系统异构数据源集成的解决案后,必须为中间件系统选择一种 全局的数据模式,负责集成的中间件系统必须提供一种全局数据模式来统一异构的源数 据模式。过去,异构数据源的集成系统,例如多数据库系统或联合数据库系统通常采用 关系或对象的数据模式作为全局模式。然而,它们并不能满足网络时代的i n t r a n e t i n t e m e t 应用所提出的高标准。般来说,异构数据集成的全局数据模式必须满足: ( 1 ) 能够描述各种数据格式,无论其是结构化的还是半结构化的,无论其支持所 有的查询语言还是简单的文本查询。 ( 2 ) 易于发布和进行数据交换集成后的数据可以方便地以多种格式发布和便于 应用交换数据。 x m l 的特点正符合以上的要求,所以随着x m l 及其相关技术和应用的发展,x m l 不仅成为了应用间交换数据的一种标准,也是万维网重要的信息交换标准和表示的技术 之一。 现在x m l 已有多方支持。并且x m l 的强适应性使其可以实现对资源的快速包装 和集成发布,所以,通过引入了x m l 技术,将x m l 技术与全局数据模式相结合可以 使异构数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 部队住房保障体系课件
- 河南省安阳市林州市2024-2025学年八年级上学期第三次阶段自评生物试题(含答案)
- 2025年三年级下册数学期中试卷
- 部室人员安全培训课件
- 基于区块链的分布式制播版权存证体系如何解决二次剪辑内容确权难题
- 基于人工智能的分光密度仪异常光谱预警系统开发中的特征工程瓶颈
- 城市更新中转角地块复合功能开发的法律权属界定难题
- 双碳目标下的环保材料重构与成本控制两难抉择
- 医药级1-苯酚-4-磺酸晶型调控技术对制剂稳定性的影响分析
- 医疗废弃物智能分类系统与一次性塑柄采血针回收效率优化路径
- 市场营销策划(第五版)第08章 促销策划
- 管理层财务基础知识培训
- 整理词根词缀法初中英语学习
- 立式储罐重量表
- (高清版)建筑楼盖结构振动舒适度技术标准JGJ_T 441-2019
- 电气系统调试方案
- 呋喃树脂msds
- 福建省机关事业单位工勤人员技术等级岗位考核公共课
- 落实乡村振兴战略山核桃产业振兴五年行动方案
- 中国五矿集团供应商准入承诺书
- 2021年《红高梁模特队》台词(赵本山1997年春晚表演的小品剧本台词)
评论
0/150
提交评论