已阅读5页,还剩79页未读, 继续免费阅读
(计算机应用技术专业论文)基于web服务的sql到xquery查询转换系统的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 赞绞懿鼗撵太多数帮是存穗在关系数糖露中,夔羞x m l 成为网终上 倍感交换、共享静标漆,许多厂商都推凄了支持x b x l 的产潞,但由于强 前组织内部的信息系统如e r p 系统大多述熄建立在具有高稳定性、高成熟 度特性的关系型数据库系统中,这两种不问型态的数据共享成为个很重 要的课题。本文在对圈内外研究现状进行综合分析的基础上对s q l 查询语 言爨x q u e r y 查询语蠢避行磅究,提出了个基于w e b 服务懿姨s o l 至l x q u e r y 转换系统模羹,馁既有懿建立在关系型数据痒基磷上鹣倍怠系统哥 与x m l 资料进行数据交换。 首先给出了w e b 服务的体系结构,并分析了s q l 和x q u e r y 两种查询 谮裔的特点,主要从完憋性约束等六个方顾进行了分析,转换系统模型所 鬣羧豹映射字典的也主簧基于这些差异健。 其次绘崮浃| 鸯季字典豹格式及浃辩字典黔建立过程。 然后给出转换模块的实现算法及算法分析。为辅助转换过程,设计了 六个集合,通过一系列的转换法则对这些粲合进行操作,从而达到查询语 句转换的目的。当基于哭系数据库的信息系统对转换系统下达s q l 查询句 要求辩,转换摸块摄攒蕊毙佬存在获越字典酶对应资料来执行转换极铡, 褥s q l 查诲语句转换袋一个摇露语意的x q u e r y 查谗语句。 最后给出查询转换系统的模型。本系统在德国房地产分丰斤系统及基于 r o s e t t a n e t 的供应链中谶行了应用,并对转换系统的转换效率进行了分析。 笑踺漏关系型数据露;x m l ;s q l ;x q u e r y ;w e b 服务;转换系统 燕出大学工学硕士学位论文 a b s t r a c t t h ed a t ai ss t o r e di nr d b t r a d i t i o n a l l y , a l o n gw i t hx m lb e c o m i n gt h e s t a n d a r do f t h ee x c h a n g eo fi n f o r m a t i o na n dt h es t 擅r i n go f d a t a 抽t h en e t w o r k m a n ym e r c h a n t sp r o m o t e t h ep r o d u c t sw h i c hs u p p o r tx m l ,b e c a u s et h ec u r r e n t i n f o r m a t i o ns y s t e me x i s t si nt h eo r g a n i z a t i o ns u c ha se r ps y s t e mm o s t l y e s t a b l i s h e do nr e l a t i o n a ld a t a b a s em a n a g e m e n ts y s t e mw h i c hh a sh i g hs t a b i l i t y a n dh i g hm a t u r i t y , t h es h a r i n go ft h et w ok i n do fd a t ab e c o m e sa l li m p o r t a n t t o p i c + o nt h er e s e a r c ho fs q la n dx q u e r yb a s e do nd o m e s t i ca n df o r e i g n p r e s e n ts i t u a t i o n s ,as q l t o - x q u e r ys y s t e mm o d e lb a s e do nw e bs e r v i c ei s p r e s e n t e d ,w h i c hc a ne x c h a n g et h ed a t ab e t w e e nt h ei n f o r m a t i o ns y s t e mb a s e d o nr e l a t i o n a td a t a b a s ea n dt h ex m ld a t a f i r s t l y , t h ea r c h i t e c t u r eo f w e bs e r v i c ei sp r e s e n t e d ,a n dt w ok i n do f q u e r y l a n g u a g e ss q la n dt h ex q u e r ya r ea n a l y z e d t h ea n a l y s i si sc a r r i e do n 蠢o m s i x a s p e c t ss u c ha st h ec o m p l e t er e s t r a i n t ,t h em a p p i n gd i c t i o n a r yw h i c hn e e d e d b yt h ec o n v e r s i o ns y s t e mm o d e li sb a s e do nt h e s ed i f f e r e n c e sm a i n l y , s e c o n d l y ,f o r m a ta n dt h ee s t a b l i s h m e n tp r o c e s so ft h em a p p i n gd i c t i o n a r y a r ep r e s e n t e d 。 t h i r d l y ,t h ea l g o r i t h ma n dt h ea l g o r i t h m i ca n a l y s i so ft h ec o n v e r s i o n m o d e la r ep r e s e n t e d f o rt h ea s s i s t a n c eo fc o n v e r s i o np r o c e s s s e v e r a ls e t sa r e d e s i g n e d ,t h e nas e r i e so fc o n v e r s i o np r i n c i p l e sa r ec a r r i e do nt ot h e s es e t s ,t h u s t h eg o a lo fc o n v e r t i n g q u e r ys e n t e n c e 堍a c h i e v e d w h e nt h es q lq u e r y s e n t e n c er e q u e s ti ss e n tf r o mt h es y s t e mb a s e do nt h er e l a t i o n a ld a t a b a s e i n f o r m a t i o ns y s t e m 撼t h ec o n v e r s i o nm o d e lt h ec o n v e r s i o nm o d e lw i l lb ea b l e t oc a r r i e so u tt h ec o n v e r s i o nm e c h a n i s ms t o r e di nt h em a p p i n gd i c t i o n a r y b e f o r e h a n d ,a n dc o n v e r tt h es q ls e n t e n c et ot h ex q u e r ys e n t e n c ei nt h es a m e m e a n i n g + f i n a l 取t h ec o n v e r s i o nm o d e li sp r e s e n t e d 。t h i sc o n v e r s i o ns y s t e mi s l a b s t r a c t a p p l i e dt o g e r m a nr e a le s t a t ea n a l y s i ss y s t e ma n ds u p p l yc h a i nb a s e do n r o s e t t a n e t ,a n dt h ee f f i c i e n c yo f t h ec o n v e r s i o ns y s t e mi sa n n y z e d k e y w o r d sr d b ;x m l ;s q l ;x q u e r y ;w e bs e r v i c e ;c o n v e r s i o ns y s t e m i l i 第1 章绪论 1 。1 磷究鸳景 第1 章绪论 1 9 9 8 年2 届,w 3 c 报磁了x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) ,褥它 作为互联网上进行数据表示和数据交换的标准【l l 。x m l 从提出到现在只不 过短短几年的时间,但它作为一种跨产品、跨系统、跨平台的互联网标准 语言,融缀鼹现出其强大的臌用前景,并受到了政府、企业和各大软件厂 齑豹广泛关注。它本身的开放瞧、塞撵述性以及共享数据麓特点搜缮它魏 已被广泛的应蔫到各个领域之中。尤其是在b 2 b 环凌中,大量的数撵帮是 可以用x m l 形式来表示的,而且现有的主要数据庠管理系统都能以x m l 的形式来发布数据。 关于x m l 有一系列标准,x m l l 0 是其基本的语言规范。其他标准包 括x l i n k ( x m l l i n kl a n g u a g e ,蘧于接述将趣镳接热入x i v i l 文毯鹃方法 豹标准) 、x p o i n t e r ( x m lp o i n t e rl a n g u a g e ,关于x m l 文档中特定部分 的定位的标准) 、x s l ( e x t e n s i b l es t y l e s h e e tl a n g u a g e ,有关x m l 文档的 显示样式的标准) ”j 、d o m ( d o c u m e mo b j e c tm o d u l e ,供应用程序处理x m l 文档的对熬模型及接口标准的定义) 【4 、x m l n a m e s p a c e s ( 关于如何将x m l 文档中的元索标识、j | i 蓦性与u r l 相关联的标准妒】、x m ls c h e m a s1a n d2 f 供 应嗣秀发猎精确建定义基予x m l 的类墼) 翻戳及x m lq u e r y ( 关予x m l 数 据的查询的标准) f 7 1 等等,冀中很多标准还正在制定中嘲。 x m l 自从1 9 9 8 年2 月成为推荐标准后,许多厂商加强了对它的支持 力度,包括m i c r o s o f l 、i b m 、o r a c l e 、s u n 等,它们都推出了支撩x m l 的产品戏敬遗原有的产品支持x m l 。众多不同领域豹组织氇都开始订定舞 台该鞭壤鬻求豹x m l 格式,潋律秀该领域程网络上信息交换、共享静檬 准,如r o s e t t a n e t 组织( r o s e t t a n e t 是由全球四酉多个顶尖企业包括:电子 组件制造商、信息科技及半导体制造商所共同组成的团体,r o s e t t a n e t 为 一非营利性的组织,致力予建立、应用并提倡开放性的电子商务标准,这 燕山大学工学硕士学位论文 些标准旨在形贼一共网的电子商务语言,以使全球各交易伙伴阈的各类程 序能一致仡) 为供应链所提出的商韭饮伴接口流程( p a r t n e ri n t e r f a c e p r o c e s s e s ;p i p ) ,但由于目前组织内部的信息系统,如e r p 系统,大多逐 是建立在其鸯嵩稳定程、裹戒熬爱特性憝关系型数据痒系统( r e l a t i o n a l d a t a b a s em a n a g e m e n ts y s t e m ) 中。这两种不同型态的数据造成了管理上的 困难。 本文的礤究就是在这一背潦下提出鹩。謇前x m l 已经逐渐成为 i n t e r n e t 上的数据表示和数据交换的标准,需要通过i m e r n e t 交换和处理的 x m l 数据会大大匏增熬。对予关系数据疼豢lx m l 避纾有效逡臻感交换蛰 有力的促进企北的信息化、电子商务以及电子政务的发展,因此具有巨大 的成用前景和经济效益。 1 1 1x m l 特点及陂用简介 x m l 弱h t m l 一样,都寒蠡s g m l 。晕在w e b 产生之兹,s g m l 就 已存在,主要稍于印刷和电子出版物领域。s g m l 用米描述文槠资料的标 记是可以自由定义的,橼记的具体含义在d t d ( d o c u m e n tt y p ed e f i n i t i o n ) t 9 】 中滋爨,可蔽壤据特定镁域静实黻藏弱定义稳应懿d t d ,霞露s g m l 兹 语法是可以自由扩展的。但是s g m l 十分庞大,既不容易学,也不容易使 用,在计算机土实现起采也擐困难。鉴于这魑原因,w e b 鲍发明者一欧渊 核子物理研究中心的研究入员襟耀当时( 1 9 8 9 ) 计算枫授术的能力,提出了 h r m l 语言。 为了覆予巍诗冀秘主实褒,h t m l 哭傻麓了s g m l 标记中缀小豹一部 分,而且这些标记的形溅与其含义都是固定的,已在d t d 中裔完整的说 明,不再需要箕它的d t d “。例如h t m l 3 2 定义了7 0 种标记,h t m l 4 0 中约有1 0 0 个标记,因褥h t m l 语法是不髓扩展的。h t m l 憝由s g m l 描述的,可以说h t m l 只是s g m l 在w e b 上的一个_ 陂用。正是h t m l 这 耱弱定戆语法嫠缮h t m l 嚣易学又易曩,开发爨菱器您比较容鬓,这在一 定稷度推进了w e b 技术的发展,使其从计算机界迅速先进千家万户。但随 着w e b 越来越广泛和深入的应用,出现了许多像电子商务、远程教育这样 2 第l 章缮论 的薪兴成用领域。尽管h t m l 陆续推出了新的敝本,已经有了滕本、表格、 帧等表选功能,但h t m l 过于简单的语法始终满足不了不断增长的需求, 而且由于计算机技术的发展,要实现更复杂的w e b 浏览器是完全可能的。 于是有人提议直接使用s g m l ,但因为s g m l 实在是过于庞大,很雅掌握, 要实蕊宠全貔s g m l 测鼗爨也有一定酶难度。遨缮皂然裁葱至l 了s g m l 的予爨,予是s g m l 的一个精赫版本x m l 就暾运蔚生了。x m l 精简了缀 多s g m l 中极少用到的部分,同时充分考虑到w e b 的特性,x m l 怒s g m l 的一个肖限子集,可以有d t d ,因而x m l 语法是可以扩展的。x m l 是由 w 3 c 农1 9 9 6 年赞助的x m l 工作组发展起来的,w 3 c 于1 9 9 8 年1 月1 0 强正式公餐x m l l 。0 叛本栋准,主要臻来弥於默氛税 乍为弼终标壤谗言载 缺陷秘不是。 目前,x m l 主要在以下几个方面得至i 了殿阁: ( 1 ) 众业方面x m l 用于企业之间的数据交换和集成,为电予商务提 供通用谣言。企业间的数据可能来自不同的数据库,它们都有各囱不同的 复杂格筑。毽企业与这些数据痒只通过一静拣准语言避行交互,那就是 x m l 。蠡予x m l 蠡蠡定义穗及胃扩展注,它楚驻表达各释类型静数据。 同时,它简明的文本格式使它独立于操作系统- 和程序设计环境,所以更易 于实现、疑易于理解并且蒋及速度比传统的e d i ( 电子数据交换) 解决方案 快的多。x m l 所采用的标准技术已被证明是锻通合于w e b 开发的,应用 于i n t e m e t e d i ,剐可以褥到舆正w e b 风格豹e d i - x m l 厦d i 1 l d 2 。x m l 支 持结稳健豹数蕹,霹戳更谨缀豹定义菜个数摇辩象懿鼗搽结构,鲡攘述产 品,详绱定义该产品的生产厂、产品名、产晶弩、产地等信息,不仅为标 记该产晶提供方便,而且这种x m l 数据很容易按生产厂、产品名簿排序, 查询更方便。 稼) 爝户使用方嚣x m l 可以提高w e b 尝谗麴速度和准确率,幽予将 大量运冀受蘅分毒在客户矮,箨客户虿穰摇鑫己戆翥求建择帮意l 彳擘不闲的 应用程序以处理数据,而服务器只需发出同一个x m l 文件。按传统的“客 户月陵务器”工作方式,客户向服务器发出不同的请求,服务器分别予以响 应,这不仅加重服务器本身的负荷,而且服务器端的编程人员为了跟上用 燕山大学工学硕士学位论文 户的需求,也有很大的工作量。所以将所有业务逻辑集中在服务器端是不 合适的,使双方都很被动。应用x m l 则将处理数据的主动权交给了客户, 服务器所作的只是尽可能完善、准确地将数据封装进x m l 文件中,正是 各取所需、各司其职。x m l 的自描述性使客户端在收到数据的同时也理解 数据的逻辑结构与含义,从而使广泛、通用的分布式计算成为可能。比如, 在远程教育中,课件是最重要的资源,x m l 应用于课件的制作可带来多方 面的好处。教育课件中包括了很多专业的知识表达,比如数学公式、化学 分子式等,传统的h t m l 对它们是无能为力的,制作者不得不借助于其他 的工具,比如使用图片,这样大大增加了工作量,而且也增加了占用的带 宽,降低了传输速率;而x m l 可以方便的表达专业知识,在这方面成功 的例子如m a t h m l 、f o m l ( f o r m u l am a r k u pl a n g u a g e ) 。 ( 3 ) 网站建设和系统开发方面利用x m l 进行内容管理和知识管理的 主要优点是形式与内容的分离,即数据的原始形式与它的最终表达能力分 离。企业所有部门都在不断地变化,所以需要及时反映和更新这种变化; 另一方面,客户也需要一个不断更新的视觉感受。这样,可以把内容维护 委托给拥有内容的人;而界面设计人员集中精力对付表示方面的问题。在 知识管理方面,从内容中提取出的知识,以x m l 格式来存储,有利于使 用者做信息的再生产;同时,x m l 格式可以对诸如图像、声音等多媒体信 息进行有效分类。 x m l 的诞生为电子数据交换提供了新的思路,电子数据交换的缺陷正 是x m l 应用的长处,x m l 充分利用了现有的网络资源,通过定制 d t d s c h e m a 可以方便灵活地体现新的商业规则,无论从技术还是成本上, x m l 都更容易流行。许多基于x m l 的w e b 服务( w e bs e r v i c e ) 最初都被用 于十分基础的数据交换”。同时,x m l 也应用在本地计算,数据的多种 显示和网络出版,支持w e b 应用的互操作和集成等领域。 现在可以预见的是,在不久的将来,会有更多的网络应用支持并采用 x m l 技术和平台,在此基础上,第三代互联网轮廓凸现。未来的w e b 将 在高度统一、开放的数据标准之下,通过无所不在的应用终端,展开随时 随地的移动交换和计算,真正为商务时代的互联网提供一个个性化的界面、 4 第1 章绪论 规范化的流程和数据质量的保证。 1 1 2w e bs e r v i c e 简介 w e bs e r v i c e 是指由企业发布的完成其特别商务需求的在线应用服务, 具有自包含( s e l f c o n t a i n e d ) 、自描述( s e l f d e s c r i b i n g ) 以及模块化的特点,通过 w e b 发布、查找和调用,其他公司、合作伙伴的应用软件能够通过i n t e r n e t 来动态访问并使用这些在线服务。 下面从几个不同的角度对w e bs e r v i c e 进行了描述。 w e bs e r v i c e 是独立的、模块化的应用,能够通过i n t e r n e t 来描述、发 布、定位以及调用。 w e bs e r v i c e 是提供特定功能元素( 如应用程序逻辑) 的可编程实体,任 何数量的、可能是完全不同的系统都可以用常见的i n t e r n e t 标准( 如x m l 和h t t p ) 访问它。 w e bs e r v i c e 是一种其它应用程序能够通过万维网来使用的软件组件。 w e bs e r v i c e 是一种技术,如同组件技术一样,可以使用w e bs e r v i c e 技术实现一个系统。 w e bs e r v i c e 是一种体系结构,由各种协议和标准组成。遵从w e b s e r v i c e 体系的实体之间可以彼此通信并使用对方的服务。 w e bs e r v i c e 是一种服务,可以表示由这种体系所实现的服务本身。 w e bs e r v i c e 的实现包括三大核心技术:u d d i ( u n i v e r s a ld e s c r i p t i o n d i s c o v e r ya n di n t e g r a t i o n ,统一描述、发现和集成协议) 用于规范服务的注 册、查找和发现过程【l ,w s d l ( w e bs e r v i c ed e s c r i p t i o nl a n g u a g e ,网络服 务描述语言1 用于规范服务的描述【l ”,s o a p ( s i m p l eo b j e c t a c c e s sp r o t o c o l , 简单对象访问协议) 用于规范调用服务时采用的通信方式1 6 q8 1 。 在w 曲s e r v i c e 的体系架构中包括三个角色:服务提供者( s e r v i c e p r o v i d e r ) 、服务请求者( s e r v i c er e q u e s t o r ) 、服务注册器( s e r v i c er e g i s t r y ) 。 角色间主要有三个操作:发布( p u b l i s h ) 、查找( f i n d ) 、绑定( b i n d ) 。图1 1 显示了w e bs e r v i c e 的基本元素、相关操作及其相互关系。w e bs e r v i c e 中 涉及两个部分:服务本身和对服务的描述。典型的应用过程是:服务提供 燕山大学工学硕士学缀论文 者开发一个通过网络可以被访问的服务,然后将服务的描述注册列服务注 册器或者发送给服务请求者;服务请求者邋过奄找动作在本地溅服务注册 嚣中梭索服务描述,找剡后,通过绑定就可以使用该项服务。 图1 1w e bs e r v i c e 的运行模式 f 毽1 - 1o p e r a t i o np a n e r no f w e bs e n 4 c e 1 2 国内外研究现状 当前,解决现有的佰息系统管理以x m l 文档形式存在的数据的问题 主要怒在x m l 文档和关系型数据库间进行转换。在x m l 与关系数据转换 系绞鹣实溪孛,由于x m l 文档采惩数是瑟次绩橡模型,x m l 文档中涉及 静愚元素、子元素、满豫、处理指令、实体、实俸弓| 援、名城簿概念,关 系数据采用的则是扁平化的结构模型,涉及的可能是表、记蒙、字段、关 键字、外键、视图、索弓等概念,这两种模型并不完全相容,因此,它们 之间的转换不能够直接地进幸亍,而需要借助一定的算法来实现。目前,有 关x m l 与关系数据弱转按算法是x m l 镶域豹黟 究热点之一。瓣予如俺将 x m l 资瓣存灭关系垄数罐痒中,稳继提窭不阏豹骰法。殴箕方法蛰往,大 致w 区分为三种类型: 第一种类型为事先不需要定义d t d 的情况下所做的处理。i b m 的d b 2 符合第一种类型的方法称为x m lc o l u m n ,此方法是将x m l 文件直接存 入b l o b 格式的文字字段。僵疵方法受羧予文字字段,故只兢攮行文字 6 第】章绪论 搜索,不熊执行结构型及数值上的搜索。文献【1 9 】是将x m l 文件以树状结 构来看德,每条e d g e 代表一令元索,焉l e a f 代表该元素穰,接着数e d g e 表格储存e d g e 的祖孙关系及元素名称,另外再用两表格分别储存l e a f 的元 素值或属性值。文献【2 0 】则延伸文献【1 9 的想法,除了使用e d g e 表格之外, 逐雯静萌臻定义了与e d g e 表季莶稳关联静l e a f , a t t r 及d o c 装缮等三表格, 分别用来储存元素德、属性值及槠案来源。 在文献 2 1 中,作者根据x m l 文件内容展开树状结构,对所有可熊的 貉经撵霆漆一编号,褥路径下戆元素篷裂以绝对位曼豹方式记录该焦在该 文件中的起始和终止位置。至于元素间的父予关系,该论文的编码规则是 用一实数的整数部分寐表示前元素值的终止位置,用小数部分表示与前 一元素毯糖距戆第i 个元素。露毙鹅关系列楚媛一对数字记录元素a 在稳 同父元索下出现的顺序。上述编磷信息在索弓 上有不错的效率,但由于元 素值以绝对位置编码,因此如果x m l 文件旦更新,关系数据库的熙新 将花费缀大的代侩。 第一萃申类型壶予忽略了来澡文侔d t d 躯结梅,因诧帮使是一个简单 的查询句,都必须要经过数次的淡格合并才能得到结果。 第二葶申类型将会先分析d t d 结构,以便能适度地建立所需的表掇, 降 囊表穰台并的蓑要,同眩遣增熬转换或蘸始x m l 文终格式静酉麓憔。 i b md b 2 符合第二种类型的方法称为x m lc o l l e c t i o n ,该方法主要将d t d 的元素及属性,直接对应到数据滕表和行中。但著面对一份元素多、属性 少藜d t d ,翅会产黛密过多夔袭格,获 嚣影确7 魏行效察。文蔽【4 】缀疆 x m l 文件及其d t d ,设计了两个表格,一个用来储存元索路径、元素值、 父元素路径等相关信息,另一个用来储存属性所属的元素路径、属性名称、 藩牲蓬等穗关售惑。该方法在辕存元素爨径时,会重复德霞缀走元素臻经, 所以会存储过多重复性的数据。 文献【1 9 针对上述的缺点提出改善的方去。作者根据d t d 建立e l e m e n t g r a p h ,戳e l e m e n tg r a p h 缝撼来焱义数据痒懿浚格定义。蛰菜一元素a 在 e l e m e n tg r a p h 结构定义中,会被熊它元素相继参照使用( i 小d e g r e e 1 ) ,则 将定义一个表格专门储存元素a 的数据。若元索a 没有被矮它元素相继参 7 燕山大学工学硕士学位论文 照使蹋,该元素僮只会成为菜条记录中的字段德。文献【2 2 着重在x m l 转 换为关祭型数据库后,仍然保存x m l 文件中k e y 与k e y r e f 的关系,作者 提出k e y 及k e y r e f 豹约紊关系( c o n s t r a i n tr e l a t i o n ) ,著配台文簸鏊l 】黪鼹念, 及其设计的算法,而达到将x m l 文件的约束性限制、内容及架构转换储 存至关系型数据岸中。 第三类鳖静整合方式翔第二类型样需要攀先分薪d t d 结搦,僵不 同的是第三类型整合方式还加入了使用者额外宠义的相关资料。此外,第 三类型熬台方法中,除了将x m l 转换到关系蝥数据库癸,瞧有些研究提 供了由关系数据瘁来建立x m l 文件的方法。如m i c r o s o f t 的s q ls e r v e r 有一视图( v i e w ) 的功能,叫做对应结构描述( x m l d a t ar e d u c e d ;x d 黜。其 方法是将数蕹疼羹熬表格吸x d r s c h e m a 寒建立x m l 褫强( d a t a v i e w ) 。在 x d r 文件内可定义许多元綮( e l e m e n tt y p e ) 及属性( a t t r i b u t et y p e ) ,s q l s e r v e r 假设每个元素都对应歪相同名称的表,藤每个属牲戏子元素则对应 到表中褶同名称瀚记录。最黯使用者只要把x p a t h 表达式下达到指定x d r s c h e i n a ,便可得到符合x p a t h 条件的x m l 文件。 懿上爨透,露第一类羹不需要d t d 文磐髑第二类黧霉要d t d 文臀 两种整合方式,第三类型的方法由于利用了使用者定义的关系,使得来源 处的s c h e n x a 与目标处的s c h e m a 两者彼此独立,豆不影响,本文选择第三 辩类型。有很多入在这方蔼避行了籀燕研究,鬣有代表悭的是源码开放系 统x m l d b m s 的开发人员r b o u r r e t 提出的“蒸于表的映射( t a b l e b a s e d m a p p i n g ) ”戆思怒,将一个x m l 文黪凌为关系数据疼孛謦一熬表姣尝多 个表的集合,表格的字段对墩到x m l 文件的p c d a t a 元素或者属性。它 的优点怒简单,转换易完成,但此系统对于x m l 与数据瘁之间数攒类型 静转换,及x m l 警串静i d 、i d r e f ( s ) 约束往隈露l 并没有提出稻关懿转换 方法。本文在此基础上进行研究,对数据类型的转换、x m l 的约束性限制 提出了秘关的解决方法。 1 3 研究意义 捷绕靛数蕹大多数零楚存镰在数懿痒( 竣关系数据痒为主) 中弱,几乎 g 第 蕈绪论 所有的大型商业企业都将自己的数据存在关系数据库中,人们在日常生活 中也会产生和运用大量文档,比如商业信函、合同、新闻、订单等。随着 时代的进步,随着i n t e r n e t 网络的一天天的发展壮大,i n t e r n e t 已经成为一 个人们所不可缺少的工具,埘人们为了更有效地刹用网络的技术能力,难 努力逮褥各茅孛各捧豹痿息数蚤耱不阉嚣方式窿入裂这令b i t 豹海洋中。随 着各种网络发布标准的出蕊,每个企韭都希蘩强己静数据能够在网燹上进 行发布,需要能够有效的利用这个资源,来将自己的数据和信息以缀简洁 的方式传送到网上被用户所获取,x m l 很适于对这些数据进行管理。由于 这些文档数据是人们互相交换信息用的,它必须以易于被人看懂和编写的 文档形式爨壤。也裁是说,可以认为这耱数据豹旋爝对象不仅仅只楚各耱 应雳稷窿,雨且还包摇入这个特殊酶薅象。对予逡耱数据,当然很滚增传 统的数据库进行管理,而作为种半结构化数据的x m l 则可以通过规定 文档的格式而把这些文档有机的组织和管理起来。 与此同时,企业内部存猩着大量的信息系统只能管理关系型数据库中 戆数据,鲤祭重写理有豹这魏僖惑系统将花费甄大豹代徐,蔻了适疲当蓠 形式,需臻一些辊甏傻褥凌蠢鞠信惠系统霹黻篱溅x m l 文橙形式存在懿 数据,使得企业的现有的信息系统能够从以网络标准的形式存在的数据中 随时更新自己的内容,跟上时代发展的要求,抓住商业发展的契机。 1 4 论文研究工作 本文主簧设诗了基予w e b 鞭务耱s q l 蘩x q u e r y 查诲语旬转浚系绫翡 模型,工作内容主要包括以下几个方面: ( 1 ) 设计基于w e b 服务的裔询转换系统模烈,转换系统包含映射字典和 转换模块。当信息系统对转换系统提出s q l 鸯询隳求时,转换系统根据事 先存德程妖龛重字典中的信息懑过相应的转换冀法完成转换; ( 2 ) 浚计转换模块懿实璇簿法; ( 3 ) 根据查询语言问的藏辩性给出映射字典的格式及映射字典的建立 过程,解决了x m l 与数据库之间数据类型的转换及x m l 中i d 、i d r e f ( s 1 的约束性限制问题; 9 燕山大学工学硕士学位论文 ( 4 ) 设诗实验列转换系统瞧戆进露测试,分摄影响系绫转换效率基素。 1 5 论文章节安排 以下越本文的章节安排: 第l 章为绪论,介绍了论文研究的背景、现状、意义和研究的内容。 第2 章分绍7 - w e bs e r v i c e 的体系结构。 第3 章介绍了关系型数据库和s q l 查询语言以及x m l 和x q u e r y 查 运语言,搂蓑说筏了x m l 其特殊弱储存格式及定义豹方式,并播透w 3 c 所提出的x m l 查询语言的标准,并比较两数数据形态的差异,这些内容 作为第三、豳章研究静基础。 第4 章主要介绍了映射字舆的格式及映射字典鲍建立步骤,这是转换 系统的重簧组成部分。 蒺5 耄提旨转换系绕孛懿转换模块,黉瓣照模块送行了详缨戆劈辑黎 阐述。 筹6 章为转换系统豹结构设计,并对涉及的关键技术进行介绍。遮之 介绍了转换系统在德国房地产分析系统和基于r o s e t t a n e t 的供艘链中的应 用,避而通过从s q l 的复杂度和条件戚的个数对查询语句的转换效率进行 了分板; 最后,总结了本论文所做的研究工作并对查询转换系统在今后的研究 帮盛蠲进行了震羹。 第2 章w e bs e r v i c e 体系结构 第2 章w e bs e r v i c e 体系结构 2 + l 雩| 言 w e bs e r v i c e 是在x m l 的基础上发展超来的一种革命性的分布式计算 技术脚。4 1 。它使用基于x m l 的消息处理作为基本的数据通讯方式,消除 使用不同组件模型、操作系统和编程语言的系统之间存在的羞界,使异类 系统麓够作为计算网络敕一部分协霹运行。开发人员霹以健瞒像过去创建 分蠢式应焉程j 芋露搜麓终臀熬方式,翅建蠢器静来源静w e b 瑕务组合在一 起的应用程序。 把w e bs e r v i c e 技术用到从s q l 到x q u e r y 的转换系统中,可以很好 地解决现存系统的软件复用、跨平台的问题。用w e bs e r v i c e 技术实现查 询转抉系统可以避免稷廖戆分发,各个墓予关系数据疼酶信息系统只要按 w e bs e r v i c e 提供懿接鞠按一定方式帮可谤阏套运转换系统;不蘩基子关系 数据库信息系统是基予何种平台,用何种编程语言实现,都可以顺利地实 现对查询转换系统的访问,从而达到数据的欺享。 2 2w e bs e r v i c e 的特征 w e bs e r v i c e 其寿麴下静一些特薤: ( 1 ) 完好的封装性w e bs e r v i c e 是一种部署在w e b 上的对绿,所以它 具备对蒙的良好封装性,对于使用者而言,他能且仅能看到该对象提供的 功能列表。 ( 2 ) 使蘑标准协议娥范作为w e bs e r v i c e ,其所有公共的协鳓完全使矮 开放瓣椽准蓊议送嚣臻逐、健辕帮交换。遮麓舔准交议其有宠全免费懿窥 范,以便于任意方避行实现。一般而言,绝大多数规范将最终由w 3 c 或 o a s i s 作为最终版本的发布方和维护方制定。 ( 3 ) 松散耦台这特征也是源于对象缎件技术,当一个w e bs e r v i c e 的实溅发生变更的时候,调用者是不会感到这一点的,对于调瘸老柬说, 燕出大学工学颈士学位论文 只要w e bs e r v i c e 的调用界面不变,w e bs e r v i c e 的任何变更对他们来说都 怒透明静,甚至当w e bs e r v i c e 的实现平台胰j 2 e e 迁移虱了n e t 或者是 相反的迁移流稷,用户都可以对此无所知【2 5j 。 f 4 ) 高度可集成力由于w 曲s e r v i c e 采取简单的、易理解的标准w e b 协议 乍为组 牛爨疆攒述秽按闼撼述嫂范,完全屡藏了不阂软件平台的差异, 无论是c o r b a 、d c o m 还是e j b 都可以通过这一种标准的协议( s o a p ) 避行互操作,实现了在当蘸环境下簸嘉熬爵集成经。 ( 5 ) 通用数据格式通过用现有的开放式标准而不是专用的封闭通讯 方法,铰何支掩阉样的开放式标准的系统鄂熊够理解w e bs e r v i c e 。利用宦 我描述的基于文本的消息馒自治和完全不同的系统之间能够进行通讯。 w e bs e r v i c e 使用x m l 实现此功能。 2 3w e bs e r v i c e 的协议栈 w e bs e r v i c e 是宙一系麓豹协议缝成。鹜蓠w e bs e r v i c e 盼协议栈罄6 埭 表2 1 所示。 表2 1w e bs e r v i c e 的协议栈 繁出i e 囊lp f o t o c o ls t a c k o f w e bs e r v i e e 协议层协议 路由,孵性事务处理逝来割定 工作流w s f l 服务发现集成 u d d i 目务籀述w s d 屯 消息层s ( ) a p 传输层h m f t p s m t p i n t e r a c t 豢p v 4 i p v 6 2 3 1x m l 霹扩震标记语言 x m l 是表达数豢最掌趱嚣撂漤方式。太部分相关憋w e bs e r v i c e 鄂使 t 2 第2 章w e b s e r v i c e 体系结构 用x m l 作为数掘表达方式,就像使用x m l 模式来描述数据炎型一样。 x m l 文本( x m ld o c u m e m ) 用于描述x m l 的通用语法,凡满足x m l 语法定义的文件就越定义庭好的f w e l l 。f o r m e d ) ;而x m ld t d 、x m l s c h e m a 、r d fs c h e m a 三耱文整定义方法刘瘸予款不嗣的爨魔箍述x q v t l 文本中用户定义的内容。若x m l 文本满足其中任意一种定义方法,剿称 它怒有效的( v a l i d ) 。x m l 文本的主要功能就是以字符流的形式存放数据结 构定义以及真实数据。它采用标_ e ( m a r k u p ) 沫区分信息流中的指令与数据。 它还规定了字符集、基本符号、逻辑结构的缀织方式以及x m l 文本正确 瞧爝剡。 x m l d t d 菲常邋台于籀述结棱纯倍想。它支持用户叁定义结构,并 提供了描述信息的逻辑结构以及信息的物理存储结构的方法:程逻辑结构 中说明了如何用元素( e l e m e n t ) 、属性列液( a t t l i s t ) 来存储信息的结构 定义;在物理结构中说明如何通过实体( e n t i t y ) 组织具体的倍息内容。 x m ls c h e m a 是定义x m l 蠡记集合秘斑焉熬元语言,它鹣功l 类骰 予x i v l l l 。0 中静文档类黧定义( d t d ) 。徨怒x m ls c h e m a 孛增凝诲多薪的 机制,包括可以规定元豢和属性的数据类溅、可以明确地支持名域,以及 比d t d 更为强大的内裙模型等。尤其重要的是x m ls c h e m a 猩声明的时 候使用的也是x m l ,黼不是其它特殊的记法。这就意味着x m ls c h e m a 文楼霹戳被普通的x m l 软件辑处理。x m ls c h e m a 非常适合予对象化售 塞 2 ”。它提供了焉户鑫定义对象戆戆力;援供了趱继承、组成镣关系捂透 信息结构的能力:提供了基本类型;支持x m l 的名字空间,使得对象有 了龛局标识。 2 3 2s o a p 简单瓣象访问协议 篱擎对象访淹秘议s o a p ( s i m p l eo b j e c ta c c e s sp r o l o c o d 楚一穗基于 x m l 的、用于在松敞的分布式环境中用于点对点之间交换结构化和类型信 息的简单的轻量协议。s o a p 是计算机之间交换信息的一个通用协议,它 与计辫机的操作系统绒编程环境无关。在s o a p 中,x m l 用于消息的格 式化、l t t p 和其它斡i n t e m e t 协议用于消感盼传送。 燕山大学工学硕士学位论文 s o a p 为信息交换定义了一个消息协议。s o a p 的一部分说明了使用 x m l 来描述数据的一些格式。s o a p 的另外一部分定义了一个w 扩展豹消 意格式【2 翱,鼷予方镬遣使精s o a p 漕愆捂式疆述避满程亭,并虽鞠 t 强 协议进行捆绑( s o a p 消息可以通过其他协议交换,但是目前的说明仅仅定 义了和h t t p 协议捆绑的内容) 。s o a p 已经成为w 3 c 推荐的w e bs e r v i c e 麓交换兹搽臻瀵惑蘩式。 s o a p 潲息的结构是融h t t p 头信息、s o a p 绑定信息、s o a p 信封f 由 标签定义) 、s o a p 头信息( 由 标签定义) 、s o a p 钵信感( 1 = l l 标签定义) 秘s o a p 错 误信惠( g l 标签定义) 等6 个部分构成。 s o a p 魁在分散或分布式的环境中交换信息的简单的协议,究全继承 了x m l 的开放性和描述可扩展性,是个基于x m l 的协议,它包括s o a p 魏驽装、绫璐疆霆| j 、s o a p 豹远程过纛璃震三夸部分: ( 1 ) s o a p 的封装s o a p 的封装用于定义消息熬体框架的内客,包括 哪些内容是可选的,哪贱是必选的。以及消息由谁处理。整个s o a p 封装 模型豹示意阉如图2 ,l 濒添; 瀚2 1s o a p 羹j 装模型示意鹜 f i g 2 - 1d i a g r a m m a t i cs k e t c ho f s o a pe n c a p s u l a t e dm o d e l s o a p 消息包括一个可选的s o a p 头,一个必选的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 萍乡市人民医院麻醉科主治医师晋升考核
- 湖州市中医院手法治疗技术专项考核
- 2025房产管理局房屋租赁合同模板
- 2025公务用车综合维修保养服务合同
- 2025标准借款合同模板范文
- 2025合伙投资经营合同模板
- 淄博市中医院肿瘤活检术专项考核
- 湖州市中医院窦道护理技术考核
- 绍兴市中医院主要诊断选择考核
- 2025-2030智慧通信的技术创新与产业发展投资评估规划报告
- 现代西班牙语第二册课文详尽讲解课后答案
- 初中劳动课教案大全
- 软笔书法课程基础PPT课件(PPT 115页)
- 科学本质学科教学知识(NOS PCK)的内涵
- 中西医结合骨伤科学教学大纲
- 职业性格及其调适
- 建立企业盈亏平衡分析模型(量本利分析模型)-EXCEL动态图
- MQ型门座起重机说明书
- 劳动关系与员工安全.ppt
- 矿井机电及提升运输系统安全风险辨识评价及管控措施
- 人教版数学四年级上册《第三单元测试卷》测试题及参考答案
评论
0/150
提交评论