




已阅读5页,还剩58页未读, 继续免费阅读
(控制理论与控制工程专业论文)基于xml的关系数据发布中完整性约束的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 当前x m l 已经成了i n t e m e t 上各类应用系统之间数据表示和交换的标准, 越来越多的关系数据库应用系统采用x m l 作为标准格式来发布和交换数据,研 究关系数据和x m l 数据之间的转换方法,实现各类异构关系数据源基于x m l 的发布已成为当前数据管理领域一个重要的研究方向。 数据的完整性约束是数据模型中数据及其联系所具有的制约和依存规则, 在数据发布和交换中保持语义信息等方面发挥着重要作用。基于x m l 的关系数 据发布,是在两种不同数据模型上进行的数据转换。已有的数据发布工具主要 针对两个数据模型的结构层面来设计,缺少对数据语义,尤其是完整性约束的 分析,使得基于x m l 的数据发布过程丢失了原有数据及其联系所具有的制约和 依存规则,不能保证满足预定义模式中的约束。因此,研究基于x m l 的关系数 据发布过程中保持完整性约束的问题,无论在理论上还是应用中都具有重要的 意义,并且成为当前x m l 数据管理领域的一个研究热点。 针对上述问题,本论文深入研究了基于x m l 的关系数据发布中涉及的数据 完整性约束的问题,提出了数据发布过程中关于数据完整性约束的保持方法, 设计了一个保持完整性约束的数据发布系统。论文中首先将源模式与目标模式 统一变换为x m l 模式树,将两个不同数据模型上的数据转换,变换为异构的 x m l 模式树上的数据转换问题;然后将关系视图、包含约束、嵌套结构等统一 转换为约束规则,并给出了约束规则图的构造算法;最后设计了一个基于x m l 的关系数据发布系统,将关系数据库中数据发布为x m l 文档过程中加载约束规 则,解决发布过程中的数据冗余问题。 论文通过有效的规则变换使得基于x m l 的数据发布过程保持了数据源数据 及其联系所具有的制约和依存规则,也提供了一种必要的机制来保证关系数据 发布的x m l 文档遵从预定义模式中的完整性约束。 关键词:可扩展标识语言关系数据 数据发布完整性约束 a b s t r a c t a b s t r a c t n o w a d a y s ,x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) h a sb e c o m eas t a n d a r df o rd a t a r e p r e s e n t a t i o na n de x c h a n g eb e t w e e nv a r i o u sa p p l i c a t i o ns y s t e m so nt h ei n t e r n e t m o r ea n dm o r er e l a t i o n a ld a t a b a s ea p p l i c a t i o ns y s t e m sa d o p tx m la st h es t a n d a r d f o r m a tt op u b l i s ha n de x c h a n g et h ed a t a s o ,s t u d y i n gt h et r a n s f o r m a t i o nm e t h o d b e t w e e nt h er e l a t i o n a ld a t aa n dt h ex m ld a t a , a n dr e a l i z i n gt h ex m l b a s e d p u b l i s h i n go fv a r i o u si s o m e r o u sr e l a t i o n a ld a t as o u r c e sh a v eb e c o m ea l li m p o r t a n t r e s e a r c hd i r e c t i o ni nc u r r e n td a t am a n a g e m e n tf i e l d i n t e g r i t yd a t ac o n s t r a i n ti st h er e s t r i c t i o na n dd e p e n d e n c er u l et h a tt h ed a t aa n d t h e i rc o r r e l a t i o n sp o s s e s si nt h ed a t am o d e l i tp l a y sa ni m p o r t a n tr o l ei nm a i n t a i n i n g t h es e m a n t i ci n f o r m a t i o ni nt h ep r o c e d u r eo fd a t ap u b l i s h i n ga n de x c h a n g i n g t h e r e l a t i o n a ld a t ap u b l i s h i n gb a s e do nt h ex m li st h ed a t ae x c h a n g et h a ti s o n g o i n g u n d e rt w od i f f e r e n td a t am o d e l s 。t h ea l r e a d ye x i s t e dp u b l i s h i n gt o o l so n l ya i ma tt h e d a t as t r u c t u r et oc a r r yo u tad e s i g n , w h i l el a c kt h ea n a l y s i so ft h ed a t as e m a n t i c i n f o r m a t i o ne s p e c i a l l yt h ei n t e g r i 锣c o n s t r a i n t i nt h ep r o c e d u r eo fx m l 。b a s e dd a t a p u b l i s h i n g ,t h i sr e s u l t si nt h el o s to ft h er e s t r i c t i o na n dd e p e n d e n c er u l et h a tt h e o r i g i n a ld a t aa n dt h e i rc o r r e l a t i o n sp o s s e s s ,a n dh e n c ec a n n o tg u a r a n t e et h a tt h e c o n s t r a i n ti nt h ep r e d e f m e dm o d ei ss a t i s f i e d i ti st h e r e f o r eo fi m p o r t a n ts i g n i f i c a n c e w h e t h e rt h e o r e t i c a l l yo rp r a c t i c a l l yt os t u d yt h ep r o b l e mo fm a i n t a i n i n gt h ei n t e g r i 锣 c o n s t r a i n ti nt h ep r o c e d u r eo ft h ep u b l i s h i n go ft h ex m lr e l a t i o n a ld a t a , w h i c hh a s d r a w nm o r ea n dm o r ea t t e n t i o ni nt h ec u r r e n tx m ld a t am a n a g e m e n tf i e l d a i m i n ga tt h ep r o b l e m sm e n t i o n e da b o v e ,p r e s e n td i s s e r t a t i o ns t u d i e di n d e p t h t h ei n t e g r i t yc o n s t r a i n tp r o b l e mi n v o l v e di nt h ex m l b a s e dp u b l i s h i n go fr e l a t i o n a l d a t a am e t h o df o rm a i n t a i n i n gt h ei n t e g r i t yc o n s t r a i n tt ot h ed a t ai nt h ep r o c e d u r eo f d a t ap u b l i s h i n gi s p r o p o s e d ap u b l i s h i n gs y s t e mf o rm a i n t a i n i n gt h ei n t e g r i t y c o n s t r a i n tt ot h ed a t ai sd e s i g n e d t h em a i n t a i n i n gm e t h o di so u t l i n e da sf o l l o w s f i r s to fa l l ,w eu n i f o r m l yt r a n s f o r m e dt h es o u r c em o d ea n dt h et a r g e tm o d ei n t oa l l x m lm o d et r e e t h e n , w ec o n v e r t e de a c ho t h e rt h ed a t ai nt w od i f f e r e n td a t am o d e l s , a l l o w i n gu st ot r a n s f o r i l lt h ep r o b l e mi n t ot h ed a t ac o n v e r s i o ni s s u eu n d e rt h e i i a b s t r a c t l s o m e r o u sx m lm o d et r e e s e c o n d ,w et r a n s f o r m e dt h er e l a t i o n a lv i e w s ,i n c l u s i v e c o n s t r a i n t sa n de m b e d d e ds t r u c t m ei n t ot h ec o n s t r a i n tr u l e su n i f o r m l y ,a n df u r t h e r p r o p o s et h eg e n e r a t i o na l g o r i t h mf o r t h ec o n s t r a i n tr u l ev i e w s f i n a l l y , w ed e s i g n e da p u b l i s h i n gs y s t e mb a s e do nx m l a n da d d e dt h ec o n s t r a i n tr u l e si nt h ep r o c e d u r eo f p u b l i s h i n gt h ed a t ai nt h er e l a t i o n a ld a t a b a s ea st h ex m lf i l e ,a l l o w i n gt os o l v et h e p r o b l e mo ft h ed a t ar e d u n d a n c ei nt h ep u b l i s h i n gp r o c e d u r e 霸1 es i g n i f i c a n tf e a t u r eo ft h ep r e s e n td i s s e r t a t i o ni st h a tt h er e s t r i c t i o na n d d e p e n d e n c er u l e so ft h eo r i g i n a ld a t ai nt h ep r o c e d u r eo ft h ex m l b a s e dd a t a p u b l i s h i n gc a l lb ec o m p l e t e l ym a i n t a i n e dt h r o u g ht h ee f f e c t i v er u l et r a n s f o r m a t i o n s 殂搀d a t ap u b l i s h i n gs y s t e md e v e l o p e dp r o v i d e sa l s oan e c e s s a r ym e c h a n i s mt o g u a r a n t e et h a tt h ex m lf i l eu s e df o r t h ep u b l i s h i n go ft h er e l a t i o n a ld a t ac o m p l i e s 晰t ht h ei n t e g r i t yc o n s t r a i n t si np r e d e f m e dm o d e k e y w o r d s :e x t e n s i b l em a r k u pl a n g u a g e ( x m l ) ,r e l a t i o n a ld a t a , d a t a p u b l i s h i n g , i n t e g r i t yc o n s t r a i n t i i i 南开大学学位论文版权使用授权书 本人完全了解南开大学关于收集、保存、使用学位论文的规定, 同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、 扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供 本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前 提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名: 年月日 经指导教师同意,本学位论文属于保密,在年解密后适用 本授权书。 指导教师签名:学位论文作者签名: 解密时间:年 月日 各密级的最长保密年限及书写格式规定如下: 南开大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行 研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文 的研究成果不包含任何他人创作的、已经公开发表或者没有公开发表 的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 学位论文作者签名: 年月 第一章引言 第一章引言 第一节研究背景 随着互联网时代的到来,数据越来越多地开始以网络在线的方式进行着发 布、交换和集成。由于x m l 具有跨平台,简单易用等特性,在很短的时间内 就获得了广泛认同,其应用领域不断地得到拓展,已成为一种被大量使用的通 用数据格式。一方面,x m l 文档作为半结构化数据的特例,虽然它很容易表达 来自不同源的数据,但是其所能表示的语义信息却相对有限。另一方面,目前 已有的大部分数据仍然存放在数据库系统中,而数据库系统对于数据的完整性 约束有很强的定义能力,并将其作为数据语义的重要组成部分。显然,无论是 在以x m l 的形式进行数据库数据的发布,还是在以数据库进行x m l 文档的存 储时,它们对于完整性约束定义的失配都是一个急需解决的问题。 目前常见的x m l 文档的模式定义规范主要包括d t d 和x m ls c h e m a 等, 在这些模式定义方法中,受到其表达能力的限制,有关约束的部分通常不能被 充分地表述。这是因为,无论是d t d ,还是x m ls c h e m a ,它们对于完整性约 束的定义能力都是有限的,其所能表述的内容主要集中在键上。对于在关系数 据库中广泛存在,并在模式设计中极为重要的函数依赖( f u n c t i o n a ld e p e n d e n c i e s ) 概念,它们就没有提供任何支持。此外即使是对于键,它们的定义方法也是有 缺陷而不够完善的。 当前x m l 已经成为i n t e m e t 上数据表示和交换的标准。国内外的电信、金 融、医疗、电子商务、新闻出版等重要应用领域已经制订了各自的基于x m l 的 数据发布规范,因此越来越多的应用系统将采用x m l 作为标准格式来发布和交 换数据。下面列举出当前若干重要应用领域的x m l 数据发布规范。 e x t e n s i b l ef i n a n c i a lr e p o r t i n gm a r k u pl a n g u a g e ( x f r m l ) e x t e n s i b l eb u s i n e s sr e p o r t i n gl a n g u a g e ( x b r l ) n e w s m l s p a c e c r a f tm a r k u pl a n g u a g e ( s m l ) b i o i n f o r m a t i cs e q u e n c em a r k u pl a n g u a g e0 3 s m l ) b i o p o l y m e rm a r k u pl a n g u a g e ( b i o m l ) c h e m i c a lm a r k u pl a n g u a g e ( c m l ) e l e c t r o n i cb u s i n e s sx m li n i t i a t i v e ( e b x m l ) o p e nt r a d i n gp r o t o c o l ( o t p ) f i n a n c i a lp r o d u c t sm a r k u pl a n g u a g e ( f p m l ) x m lb o o k m a r ke x c h a n g el a n g u a g e ( x b e l ) 1 第一章引言 r e a le s t a t el i s t i n gm a r k u pl a n g u a g e ( r e l m l ) 根据i b ma l m a d e n 研究中心的分析,未来大多数商业数据仍将存储在关系 数据库管理系统中。因此研究关系数据和x m l 数据之间的转换方法,实现各类 异构关系数据源基于x m l 的发布已成为当前国际数据管理领域重要的研究方 向。近年来在数据管理领域顶级的学术会议上( 如a c ms i g m o d , v l d b , i c d e 等) 发表了一系列以x m l 数据发布为核心的重要学术文献。国际著名的 软件企业如i b m 、m i c r o s o f t 、l u c e n tb e l l 等都已经研制基于x m l 的数据发布系 统。 在w w w 2 0 0 2 国际会议上,a t & t 研究中心的m a r yf e m a n d e z 、b e l l 实验室 的m i c h a e lb e n e d i k t 、j u l i a n af r e i r e 和a m a u ds a h u g u e t 将未来的x m l 数据管理 应用和研究方向划分为三个部分,即x m l 数据发布、x m l 数据存储和x m l 查 询,其中x m l 发布将是未来i n t e m e t 上数据交换过程的核心。 数据的完整性约束是数据模型中数据及其联系所具有的制约和依存规则, 用以保证数据的正确、有效和相容。数据的完整性问题是保证数据库数据的正 确性和相容性的问题,完整性约束对于说明语义、查询优化、防止修改异常及 在数据发布和交换过程中保持语义信息等方面发挥着重要作用。 数据完整性约束在基于x m l 的关系数据发布过程中发挥着重要作用。一方 面,由于x m ls c h e m a 规范中已经支持了x m l 键约束和外键约束,所以许多行 业标准采用这些约束描述数据模式中数据的联系与依存规则;另一方面,数据 发布过程除了需要建立数据源模式和目标模式在结构上的映射关系之外,还必 须考虑发布的文档要反映数据源的完整性约束,并且满足目标模式中的完整性 约束。 目前已有的关系数据转换工具主要考虑了x m l 数据的结构层面,缺少对数 据语义,尤其是完整性约束的分析。关系数据库中的键约束、函数依赖、包含 依赖等完整性约束无法转换到x m l 数据中,使得基于x m l 的数据发布过程丢 失了原有数据及其联系所具有的制约和依存规则。而大量应用环境都要求关系 数据发布的x m l 文档遵从预定义的模式( s c h e m a ) ,既符合给定的结构又满足一 系列的完整性约束n 1 。 研究基于x m l 的关系数据发布过程的完整性约束的保持,无论在理论上还 是应用中都具有重要的意义,并且成为当前国际上x m l 数据管理领域的一个研 2 第一章引言 究热点。 第二节x m l 数据发布中完整性约束的研究内容 基于x m l 的关系数据发布,是在两种不同数据模型上进行的数据转换,对 于发布过程涉及的完整性约束研究,包括完整性约束的转换、保持和验证等方 面,产生了很多重要的研究成果,但是在理论上尚有许多未能解决的问题,需 要深入地研究和探讨。本文主要讨论的是基于x m l 的关系数据发布中完整性约 束保持问题。 x m l 数据发布中完整性约束保持问题的难点在于其本质是类型检查 ( t y p e c h e c k i n g ) 问题的一个具体应用,即:对于一个数据库模式d ,一个x m l 模式x 和一个映射p :d x ,判定v x i n s t a n c e ( d ) ,p ( x ) ei n s t a n c e ( x ) 是否都成 立。由于该问题已经在理论上被证明是不可判定的,所以使得保持完整性约束 的x m l 数据发布只能在受限情况下和动态执行状态中来完成。在受限情况或者 动态执行过程中如何统一描述关系模型和x m l 模型的完整性约束,如何统一处 理复杂结构和约束规则,如何将约束规则自动加载到发布规则等问题都是完整 性约束保持问题研究的重点。 第三节主要内容及结构 本文共包括五部分。第一章引言介绍了本文的研究意义、背景和面临的主 要问题;第二章论述了国外相关理论方法的研究进展和原型系统研制情况;第 三章详细阐述了本文提出的保持完整性约束的数据发布规则生成方法;第四章 给出约束视图及发布规则生成算法设计;第五章基于约束的数据发布算法设计 与实现;第六章总结全文并对未来工作进行了展望。 3 第二章相关理论方法与原型系统概述 第二章相关理论方法与原型系统概述 基于x m l 的关系数据发布方法,无论是在学术界还是工业界都得到了广泛 关注并且成为当前x m l 数据管理领域一个重要的研究方向。目前该领域的许多 理论研究工作都是结合原型系统的研制进行的。本章以国外最具代表性的几个 原型系统为例分析基于x m l 的关系数据发布的理论方法研究,概括了典型 d b m s 对x m l 数据发布与交换的支持情况,并且在理论与方法层面对已有的原 型系统和工具进行汇总分析。 因为x m l 数据是不同于关系数据的树状结构,其元素可以任意嵌套和递归 等特点,x m l 数据完整性约束问题比关系数据库中的相关理论要复杂得多。又 因为基于x m l 的关系数据发布是两个不同数据模型上进行的数据交换,还有许 多理论上尚未解决的问题,需要深入地研究和探讨。本章分析了x m l 数据模型 中完整性约束的概念和相关研究问题,讨论了x m ls c h e m a 标准中对完整性约 束的支持,综述了基于x m l 的关系数据发布中完整性约束的相关研究和面临的 问题。 第一节基于x m l 的关系数据发布原型系统研制概述 目前在数据库管理领域的重要国际会议上( 如v l d b 、s i g m o d 和i c d e 等) ,涌现出许多基于x m l 的关系数据发布相关的研究论文,其中很多研究成 果都是结合原型系统的研制进行的。重点分析三个有影响的原型系统s i l k r o u t e 、 x t a b l e s 和c l i o 系统。 2 1 1s i l k r o u t e s i l k r o u t e 乜m 是a t & t 实验室和p e n n s y l v a n i a 大学研制的基于x m l 的数据发 布原型系统。数据发布过程包括两步:首先,用查询语言r x l ( r e l a t i o n a lt ox m l t r a n s f o r m a t i o nl a n g u a g e ) 定义关系数据库的x m l 视图;其次,用户在视图上可 以用x m l q l 语言建立面向应用的查询,系统通过查询重写和查询执行抽取出 所需要的x m l 数据。初期s i l k r o u t e 系统的用户需要的使用不同的语言创建和 查询视图,并且需要在关系模型和x m l 模型上交互操作“】。 s i l k r o u t e 系统的核心技术可以概括为三个层面,首先是强调通用性,即可以 4 第二章相关理论方法与原型系统概述 针对不同应用的需求将关系数据映射至遵循不同d t d 的x m l 文档;其次是考 虑动态性,即允许针对应用需要,物化x m l 视图中的部分数据片断;最后, s i l k r o u t e 系统还强调它的有效性,即有效利用r d b m s 的查询引擎来实现x m l 视图的计算和物化过程。 针对早期s i l k r o u t e 系统创建视图和查询视图语言不能通用的问题,研究统 一采用x q u e r y 定义视图和查询视图的方法。 2 1 2x t a b l e s x t a b l e s 系统是由i b ma l m a d e n 研究中心和c o r n e l l 大学联合研制的基于 x m l 的关系数据发布系统,其目标是建立关系数据和x m l 文档之间的桥梁。 与s i l k r o u t e 相比,x t a b l e s 的特点在于用x q u e r y 统一描述x m l 视图的 定义和用户对视图的查询。该系统描述了x t a b l e s 中间件系统的设计和实现, 系统向用户提供了创建关系数据的x m l 视图、查询x m l 视图使用关系数据库 系统存储和查询x m l 文档的功能h 1 。x t a b l e s 结构新的特征如下: ( 1 ) 提供用户一种单一的查询语言创建和查询关系数据的x m l 视图; ( 2 ) 通过下推大部分的计算到关系数据库引擎,有效地执行查询; ( 3 ) 允许用户关系数据和元数据之间无缝地进行查询; ( 4 ) 允许用户跨越x m l 文档和关系数据的x m l 视图书写查询。 2 1 3c l i o x m l 在i n t e n e t 上进行数据交换时不仅携带数据的结构信息,还包括语义信 息。因为x m l 数据经常是从关系数据库已有的数据产生的,那么在数据发布时 就应该能够表达原始数据的语义。i b ma l m a d e n 研究中心和t o r o n t o 大学提出了 一种保持包含约束的数据发布方法,并根据这种方法研制了c l i o 系统。c l i o 【5 】【6 】【7 】 系统的目标是将用户指定的高层的模式之间的映射转换成语义等价的查询,使 得查询结果满足目标模式,并且保持源模式的语义关系,从而将源数据转化成 目标模式要求的表达形式。 c l i o 系统提出了基于两阶段的发布方法:第一个阶段将高层映射转化成一组 体现源模式和目标模式之间关系的映射集,第二个阶段将映射集转化成源模式 上的查询,生成满足目标模式结构和语义约束的数据,并保持源数据之间的语 义关系5 1 。 c l i o 系统主要提供了对源模式和目标模式中包含约束的分析,但是缺少对 5 第二章相关理论方法与原型系统概述 键约束的分析、保持和验证机制。另外,c l i o 系统的一个重要缺憾是不能支持用 户在视图上查询。 第二节典型d b m s 对x m l 数据发布和交换的支持 为了实现x v i l 数据和关系数据库数据之间进行有效的转换,典型d b m s 系统如i b md b 2 、m i c r o s o f ts q l s e r v e r 、o r a c l e 等均提供了相关工具来实现 x m l 文档和关系数据的转换。但是对于异构关系数据的发布,目前的工具支持 还很不够,例如各开发商提供的语言通常缺少灵活性,支持查询的能力很有刚引。 以下是各个数据库管理系统对基于x m l 的关系数据发布的支持情况: 表2 1 商业数据库对x m l 发布的支持 o r a c l e9 im ss q ls e r v e ri b m d b 2 映射 否 是是 输出视图是是 是 查询视图否 x p a t h 否 当前典型数据库管理系统对基于x m l 的关系数据发布支持技术存在着一些 不足【4 】: o r a c l e 的x s q l 能够用于建立关系数据的x m l 视图,但是不能有效支持在 视图上的查询,也不能在视图上建立视图;o r a c l e 使用对象一关系技术实现关系 上的x m l 视图,嵌套的结构可以采用对象来说明,并且可以将对象转换为x m l , 但是这些方法都与x s q l 具有同样的局限性。o r a c l e 同样允许l 文档存储到 关系表,用户可以使用具有x m l 延伸功能的s q l 来查询,但是总的说来,这 些延伸都不如x m l 查询语言,如x q u e r y 的表达能力,而且需要应用开发人员 穿梭于关系和x m l 两种数据模型来完成开发任务。 m i c r o s o f ts q ls e r v e r 允许用户使用一个x d r ( x m ld a t ar e d u c e d ) s c h e m a 来建立关系数据的x m l 视图。x d rs c h e m a 本质上是一种“a n n o t a t e ds c h e m a ”。 s q ls e r v e r 限制用户只能使用x p a t h 来查询由x d r 产生的视图,而且不能支持 在视图上定义新的视图。这些限制致使没有办法使用x m l 查询语言来完成复杂 的查询,甚至连“j o i n ”这样的操作都无法实现。 i b md b 2 允许用户采用一种结构映射d a d ( d o c u m e n ta c c e s sd e f i n i t i o n ) 来 定义关系数据的x m l 视图。用户可以通过d a d 的参数调用来物化一个x m l 视图。但是与s q ls e r v e r 类似,d b 2 不支持对d a d 的查询,也不能建立d a d 6 第二章相关理论方法与原型系统概述 上的视图。虽然d b 2 支持类似b l o b 方式来存储x m l 文档,但是对它的查询 方式也仅限制于x p a t h 表达式【4 】【8 】。 第三节基于x m l 的关系数据发布方法汇总分析 从l 查询语言与s q l 转换的角度对基于x m l 的关系数据发布系统进 行对比分析。下面从x m l 视图定义方法、x m l 视图物化方法和x m l 视图计算 方法三方面对已有的理论方法和系统与研制做进一步分析: 2 3 1x m l 视图的定义方法 o r a c l ex m l d b 和s q ls e r v e rs q lx m l 都使用了一种标注的x s d x m l s c h e m a 定义x m l 视图,x m ld b 支持递归的x m l 视图,而s q l x m l 通过使 用m a x d e p t h 标注可以支持深度有限的递归。i b md b 2x m l e x t e n d e r 使用d a d 文件定义非递归的x m l 视图。i b mx m lf o rt a b l e s 以x t a b l e s 为基础提供关 系表之上的x m l 视图。 在以上的方法中,x m l 视图是定义在关系模式之上的视图。在数据集成系 统a g o r a 9 】中,使用l o c a l a s v i e w 方法( l a v ) ,即局部数据源的模式定义为全局 模式之上的视图。相应地,另一种方法称为g l o b a l a s v i e w 方法( g a v ) ,即x m l 视图( 全局模式) 是定义在关系模式( 局部模式) 之上的视图。m a r s 1 0 】综合了 g a v - s t y l e 和l a v - s t y l e 两种方案,形成了一种综合方式的数据发布方法。 2 3 2x m l 视图的物化方法 x t a b l e s 中x m l 视图的物化是通过下推一个“o u t e rt m i o n 查询到关系引 擎实现的,而在s i l k r o u t e 中,中间件系统发出若干s q l 查询实现视图的物化。 文纠1 1 】讨论了对递归形式的x m l 视图进行物化的技术,提出由于s q l 仅支持 线性递归,而这种功能不足以实现上述的目标,递归的视图物化通过反复的展 开一定数量层次的方法由中间件系统处理,在这个领域仍然存在一些尚未解决 的问题。 2 3 3x m l 视图的计算方法 x t a b l e s 展示了一个能够处理在x m l 视图之上的、任意复杂的x q u e r y 查询系统。文章【4 1 中将关系数据查询语言s q l 的内部表达模型q g m ( q u e d ,g r a p h 7 第二章相关理论方法与原型系统概述 m o d e l ) 扩展为支持x m l 查询的x q g m ( x m lq u e r yg r a p hm o d e l ) ,使得x q u e r y 和s q l 两种操作语言的转换可以在这个统一的x q g m 模型上完成。x q u e r y 查 询转化成x q g m 形式并且与视图定义进行组装,通过重写优化处理以消除x m l 中间结果的创建,并且下推谓词到关系数据库引擎。修改以后的x q g m 被翻译 成一个s q l 查询在关系引擎内部执行。 近年来由w o r c e s t e rp o l y t e c h n i ci n s t i t u t e 研制的r a i n b o w 系统【1 2 j 实现了一种 利用x a t ( x m la l g e b r at r e e ) 代数进行x q u e r y 表达式建模的方法,系统讨论了 处理和优化x q u e r y 查询的方法,提出了优化x q u e r y 查询的重写规则,并提出 了c u t t i n g 算法消除x a t 上冗余的操作符和关系列。然而,没有讨论x m l 到s q l 查询生成的问题。 s i l k r o u t e 提出了一种有效并且完备的查询组装算法计算在x m l 视图上的 x m l q l 查询。s i l k r o u t e 强调动态性,即允许针对应用的需要,物化x m l 视 图中的部分数据片断。s i l k r o u t e 系统还强调有效利用r d b m s 的查询引擎来实 现x m l 视图的计算和物化过程。 由i n r i a 研制的a g o r a 系统一j 使用l a v 方法进行关系数据的x m l 发布。 它提供了一种转换x q u e r yf l w r 表达式为s q l 的算法,算法主要分为两步: 在设计的虚的关系模式上转化x q u e r y 查询成为s q l 查询;并且重写这些s q l 生成在真正的关系模式之上的s q l 查询。第一步跨越了x q u e r y 和s q l 语言之 间的障碍,第二步中使用视图回答查询。 同b e l l 实验室研制的r o l e x 1 3 】系统强调实现在线地关系数据和x m l 数据的 交换。系统改变视图以使得关系系统向应用提供虚的d o m 接口。其输入不是单 个的x m l 查询,而是一系列d o m 树之上的n a v i g a t i o n 运算,需要在底层的关 系数据上进行计算。 由u c s d 和p e n n s y l v a n i a 大学研制的数据发布系统m a r s 0 0 】综合了a v - s t y l e 和l a y - s t y l e 视图的方法,给出了转换x q u e r y 查询为s q l 的技术,其基本思想 是:将x m l 查询、视图和约束进行编译,生成关系上的查询和约束,并且给出 了c h 2 l s e 和b a c k c h a s e ( c & b ) 算法,在关系完整性约束条件下,找到关系查询 最小的重组( r e f o r m u l a t i o n ) 形式。m a r s 考虑了关系和x m l 数据之上的完整性 约束,综合了利用视图重写、视图组装和查询最小化的效果。 o r a c l ex m ld b l l 4 实现了即将推出的s q l x m l 标准中的大部分操作符。 s q l x m l 是s q l 的扩展,使用函数和操作符在关系存储中包含x m l 数据的处 8 第二章相关理论方法与原型系统概述 理。s q l x m l 操作符使得查询和访问x m l 内容作为标准s q l 操作的一部分成 为可能,并且提供了从s q l 查询语句的结果中生成x m l 的方法。s q l x m l 操 作符允许使用x p a t h 表达式访问x m l 视图的子节点。x m ld b 通过查询重写使 用x m l 视图定义转化x p a t h 表达式成为等价的s q l 查询。在当前的o r a c l e9 i r e l e a s e2 中,不包含w i l dc a r d s 和d e s c e n d a n ta x e s ( ) 的简单路径表达式可以进行 重写,支持谓词重写为s q l 的谓词,x p a t h 轴仅支持c h i l d 和a t t r i b u t e 轴。 s q ls e r v e r2 0 0 0s q l x m l 1 5 】支持在标注的x m ls c h e m a 之上的x p a t h 查询 计算,x p a t h 查询和标注的s c h e m a 一起被转换成f o rx m l 查询,仅返回查询 所需要的x m l 数据,这里的f o rx m l 是s q ls e r v e r 提供的s q l 语句的扩展。 在当前的s q l x m l3 0 中,除了谓词和x p a t h 变量,还支持a t t r i b u t e ,c h i l d ,p a r e n t 和s e l f 轴。 i b md b 2x m le x t e n d e r 1 6 j 提供了u s e r - d e f i n e df u n c t i o n s ( u d f s ) 存储和检索 x m l 列中的x m l 文档,并可以提取x m l 元素或者属性,但是并不支持任何的 x m l 查询语言。 第四节x m l 数据模型中的完整性约束 b e l l 实验室、p e n n s y l v a n i a 大学和t o r o n t o 大学等较早开展了x m l 模型中的 完整性约束问题研究。x m l 模型中完整性约束的范围涉及到键约束、外键约束、 包含约束和i d 约束等,因为x m l 数据是不同于关系数据的树状结构,d t d 的 元素可以任意嵌套和递归等特点,x m l 数据完整性约束问题比关系数据库中的 相关理论要复杂【l 】【1 刀。 2 4 1x m l 数据模型 一个x m l 树定义成六元组t = ( v , l a b ,e l e ,a t t ,v a l ,r ) ,其中 ( 1 ) v 是节点集,用标识符o i d 表示; ( 2 ) l a b 是v 到e u 彳u ( s ) 的映射,对v 中每一个节点进行标记;如 果v v 称为元素( e 节点) ,如果l a b ( v ) e a 称为一个属性( a 节点) , 如果l a b ( v ) = s 则称为文本节点( s 节点) ; ( 3 ) e l e 和a n 是节点到其子元素或属性的映射函数:对任意节点v 矿, 如果v 是一个元素,那么e l e ( v ) ( a t t ( v ) ) 是v 中的元素( 属性) 集;v 称为所有节点v e l e 纠ua r t ( v ) 的父节点,标记为p a r e n t ( v ) = v ,并 o 第二章相关理论方法与原型系统概述 且从v 到v 有个有向边;如果v 是一个属性或文本节点,那么e l e ( v ) t a r t ( v ) 未定义; ( 4 ) v a l 是属性或文本节点到其值的映射函数,给每一个属性和文本节点 赋上字符串值:对任
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年三明永安市事业单位专门面向驻军随军家属公开招聘考前自测高频考点模拟试题及完整答案详解1套
- 2025江苏苏州工业园区青剑湖小学后勤辅助人员招聘1人考前自测高频考点模拟试题及答案详解(夺冠)
- 2025甘肃省地矿局测绘院注册城乡规划师预招聘3人考前自测高频考点模拟试题及答案详解(考点梳理)
- 2025内蒙古鸿德文理学院招聘24人模拟试卷附答案详解(考试直接用)
- 2025黑龙江哈尔滨市五常市万宝学校9大岗位招聘28人模拟试卷参考答案详解
- 2025年湖北城市建设职业技术学院专项公开招聘19名工作人员模拟试卷及答案详解(考点梳理)
- 2025湖南娄底市残疾人联合会所属事业单位引进高层次和急需紧缺人才组考考前自测高频考点模拟试题及答案详解参考
- 2025年杭州拱墅区拱宸桥街道社区卫生服务中心招聘编外聘用人员5人模拟试卷及答案详解参考
- 2025黑龙江伊春市伊美区社区工作者招聘计划调整及笔试考前自测高频考点模拟试题及一套完整答案详解
- 2025福建南平市山点水园林有限公司招聘及拟进入模拟试卷及一套完整答案详解
- 2025年华侨港澳台生联招考试高考地理试卷试题(含答案详解)
- 一口气看遍中国的地理之美中国地理介绍P
- 生猪屠宰兽医卫生检疫人员考试题库答案
- 鼓膜置管护理常规
- 施工现场实施信息化监控和数据处理方案
- 《公路限速标志设计规范》(3381-02-2020)
- DB11T 1493-2017 城镇道路雨水口技术规范
- 2024-2025学年七年级上学期期中考试道德与法治试题
- GB/T 44563-2024航空用钛合金凸头大底脚螺纹抽芯铆钉
- 山东省济宁市邹城市第十中学2024-2025学年上学期八年级第一次月考数学试题
- 高中化学全套思维导图(高清版)
评论
0/150
提交评论