(通信与信息系统专业论文)基于xml的制造信息格式转换技术研究.pdf_第1页
(通信与信息系统专业论文)基于xml的制造信息格式转换技术研究.pdf_第2页
(通信与信息系统专业论文)基于xml的制造信息格式转换技术研究.pdf_第3页
(通信与信息系统专业论文)基于xml的制造信息格式转换技术研究.pdf_第4页
(通信与信息系统专业论文)基于xml的制造信息格式转换技术研究.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(通信与信息系统专业论文)基于xml的制造信息格式转换技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

武汉理工大学硕士学位论文 摘要 x m l ( e x t e n s i b l em a r k u pl a n g u a g e ,可扩展标记语言) 经过几年的发展已成为 w e b 数据交换的标准,并在许多领域都得到广泛的应用。而在企业的信息化进 程中,关系数据库由于技术成熟、数据管理能力强、稳定可靠的并发控制得到 了广泛应用,并且在企业的各类数据管理中占据着重要地位,在制造企业中大 量的制造信息也是存储于关系数据库中。以关系数据为存贮手段,以x m l 为交 换载体的数据管理方式成为一种趋势,而关系数据向x m l 数据的转换是制造信 息格式转换的关键。 本文对含语义键的关系树模型、关系模式向x m l 模式的映射、关系数据转 换成x m l 数据且在转换的过程中保持关系数据的语义等方面进行了深入的研 究,提出了有效的方法与实现技术。 ( 1 ) 论文提出了一种含语义键的关系树模型,设计了一个依据关系模式生 成对应关系树的算法。该算法不仅可以把关系模式转换为含有语义键关系树, 且能保证转换后的语义键集的有效性和完备性。在此基础上,将基于语义键的 关系树转换为x m l 模式,生成相应关系模式所对应的x m l s c h e m a ,该方法对 于保留关系模式的语义约束,加强数据耦合是可行有效的。 ( 2 ) 在w e b 上进行数据交换时,往往要考虑进行数据交换的双方所要满足 的x m l 模式约束。而如果在要交换的一方源数据是以关系数据的方式存储,就 需要把关系数据发布成x m l 数据。为此,基于前面研究生成的用x m l s c h e m a 描述的x m l 模式约束,研究了一种将这种x m l 模式约束转换为嵌套的数据映 射结构的方法。通过在数据映射结构中嵌入构造的s q l 语句获取相应关系数据, 然后放入x m l 文档的正确位置,最终完成关系数据到x m l 数据的转换。 ( 3 ) 用j a v a 开发了一个b s ( b r o w s e r s e r v e r ) 架构的r e d 2 x m l 系统来实现 上述思想,并可以作为w e b 上数据交换的中间件为实际应用提供支持。 本文以关系数据库作为底层数据载体,研究了关系模式数据转换为x m l 模 式数据方面的相关技术,有机地将关系模式同x m l 模式的模式映射与数据库动 态查询技术结合,实现了关系数据库数据的x m l 格式数据的无损发布。 关键词:语义键;x m l 模式;模式映射;数据转换 武汉理工大学硕士学位论文 a b s t r a c t i nt h ep a s ty e a r s ,x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) h a sb e e no n eo ft h e s t a n d a r d sf o rd a t ae x c h a n g eo nt h ew e b i ti sw i d e l ya p p l i e di nm a n yf i e l d s b u t d u r i n gt h ep r o c e s so fe n t e r p r i s ei n f o r m a t i o n i z a t i o n ,r e l a t i o n a ld a t a b a s es y s t e m sa r e w i d e l yu s e da n da r ep l a y i n gs o m es i g n i f i c a n tr o l e si nt h ed a t am a n a g e m e n to f e n t e r p r i s e sw i t ht h e i rm a t u r et e c h n o l o g y ,p o w e r f u ld a t am a n a g e m e n t ,t h er e l i a b l ea n d s t a b l ec o n c u r r e n tc o n t r 0 1 a n dal o to fm a n u f a c t u r i n gi n f o r m a t i o ni ss t o r e di n r e l a t i o n a ld a t a b a s es y s t e m s o f t e nr e l a t i o n a ld a t a b a s ea r eu s e dt os t o r ea n dm a n a g e d a t aa n dx m ld a t aa r eu s e da si n f o r m a t i o ne x c h a n g em e d i u m t r a n s f o r md a t af r o m e x i s t i n gr e l a t i o n a ld a t a b a s ei n t od a t at y p eo fx m l h a sb e c o m et h ep i v o t a lp r o b l e m f o rd a t af o r m a te x c h a n g e 研mm a n u f a c t u r ei n f o r m a t i o n w er e s e a r c ht h ef o l l o w i n gt o p i c s :r e l a t i o n - t r e em o d e lw i t hs e m a n t i ck e y s , m a p p i n gr e l a t i o ns c h e m at ox m ls c h e m a , t r a n s l a t i n gr e l a t i o n a ld a t ai n t ox m l d a t a w h i l ep r e s e r v i n gi n t r i n s i cs e m a n t i cr e l a t i o n s h i p sa m o n gt h er e l a t i o nd a t a a sar e s u l t , w ep r o p o s ee f f e c t i v em e t h o da n dr e a l i z a b l et e c h n o l o g y ( 1 ) t h i sp a p e rp r e s e n t sar e l a t i o n - t r e em o d e lw h i c hi n c l u d e ss e m a n t i ck e y s a n d a na l g o r i t h mi sd e s i g n e dt om a pr e l a t i o n a ls c h e m at ot h i sr e l a t i o n - t r e e t h i sm a p p i n g a l g o r i t h mn o to n l ym a pr e l a t i o n a ls c h e m at or e l a t i o n - t r e ew i t hs e m a n t i ck e y sb u ta l s o g u a r a n t e et h ec o m p l e t e n e s sa n dv a l i d i t yo ft h es e to fs e m a n t i ck e y sa f t e rt r a n s f o r m t h e n , t h ex i v l ls c h e m ai sm a p p e db a s e do nt h i sr e l a t i o n - t r e ea n dax m l - s c h e m ai s d e s i g n e dw h i c hd e s c r i b et h ex m l s c h e m aa n dc o r r e s p o n dt ot h er e l a t i o n a ls c h e m a i t i sp r o v e dt h a tt h i sm e t h o di sv a l i da n de f f i c i e n tf o rk e e p i n gs e m a n t i cr e s t r i c t i o na n d s t r e n g t h e n i n gd a t ac o u p l i n g ( 2 ) w h e nd a t ai se x c h a n g e do nt h ew e b ,t h ex m ls c h e m a so ft h et w oe n t i t i e s ( t h e i rs t a n d a r d s ) m u s tb ec o n s i d e r e d i ft h es o u r c ed a t ai sr e l a t i o n a ld a t a , i tn e e d st o b ep u b l i s h e di n t ox m ld a t ac o n f o r m i n gt ot h es c h e m ao ft h et a r g e te n t i t y s o ,a t r a n s f o r mm e t h o da b o u th o wt om a pt h ex m ls c h e m at oan e s t e dd a t am a p p i n g s t r u c t u r ei ss t u d i e db a s e do nt h ex m ls c h e m ar e s t r i c t i o nw h i c hh a sb e e ns t u d i e d 武汉理工大学硕士学位论文 b e f o r ea n dd e s c r i b e db yx m l s c h e m a t h r o u g hc o n s t r u c tc o r r e s p o n d i n gs q lq u e r y s e n t e n c ei nt h en e s t e dd a t am a p p i n gs 仃1 l c t u r e ,r e l a t i o n a ld a t ac o u l db ea c q u i r e d t h e n p u tt h o s ea c q u i r e dr e l a t i o n a l d a t at ot h er i g h t p l a c e so fx m ld o c u m e n t ,t h e t r a n s l a t i o nf r o mr e l a t i o n a ld a t at ox m ld a t ai sf m i s h e d ( 3 ) ap r o t o t y p es y s t e mn a m e d 鹤r d b 2 x m li sd e s i g n e db yj a v aa n db s ( b r o w s e r s e r v e r ) f r a m ea saf a c i l i t yf o rp r a c t i c a la p p l i c a t i o n sa sw e l lt oi m p l e m e n t t h ea b o v ei d e a sa n dm e t h o d s n l ei n t e r r e l a t e dt e c h n i q u et h a tt r a n s f o r m i n gr e l a t i o n a ls c h e m ad a t at ox m l s c h e m ad a t ai ss t u d i e di nw h i c ht h er e l a t i o n a ld a t a b a s es y s t e m si st a k e na st h eb o t t o m s t o r i n gm e d i u m 啊1 et h e s i se s t a b l i s ht w os t r a t e g i e so fp u b l i s h i n gr e l a t i o n a ld a t at o x m ld a t ac o m b i n i n gm a p p i n gr e l a t i o n a ls c h e m at ox m ls c h e m av 以t l l d y n a m i c d a t a b a s eq u e r i e s k e yw o r d :s e m a n t i ck e y s ,x m ls c h e m a , s c h e m am a p p i n g ,d a t at r a n s l a t i o n i i i 独创性声明 本人声明,所呈交的论文是本人在导师指导下进行的研究工作及 取得的研究成果。尽我所知,除了文中特 l , j j n 以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得 武汉理工大学或其它教育机构的学位或证书而使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示了谢意。 学位论文使用授权书 本人完全了解武汉理工大学有关保留、使用学位论文的规定,即: 学校有权保留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅和借阅。本人授权武汉理工大学可以将本学位论文的 全部内容编入有关数据库进行检索,可以采用影印、缩印或其他复制 手段保存或汇编本学位论文。同时授权经武汉理工大学认可的国家有 关机构或论文数据库使用或收录本学位论文,并向社会公众提供信息 服务。 ( 保密的论文在解密后应遵守此规定) 研糊:崩签鸪弋加期弩 武汉理工大学硕士学位论文 第1 章绪论 1 1 课题研究背景及其意义 制造信息是指制造企业经营过程中产生的各种数据的总和,涉及到等生产、 管理、销售等方方面面,同时这些信息是以不同的格式储存不同的数据源中, 这些数据源包括人工管理方法、文件系统、各种数据库系统,在这些数据源中, r d b ( r e l a t i o n a ld a t a b a s e ,关系数据库) 凭借其多级的安全机制、稳健的并发访问 控制、高速的处理效率、较高技术成熟度,在制造信息管理中占据主导地位。 以关系数据库格式储存的企业制造信息,由于关系数据库技术本身或人为 因素产生了一些不适应信息化进一步发展的问题;不利于系统间的数据交换及 直接的i n t e m e t 应用。国内众多的制造企业广泛应用各种c a x ( 指 c a d c a p p c a m 等计算机辅助系统) 和m i s ( m a n a g e m e n ti n f o r m a t i o ns y s t e m ,管 理信息系统) ,一些技术基础好的企业,通过实施c i m s ( c o m p u t e ri n t e g r a t e d m a n u f a c t u r es y s t e m ,计算机集成制造系统) 7 - 程、并行工程等先进制造技术,已 在局部应用了p d m ( p r o d u e td a t am a n a g e m e n t 产品数据管理) 、e r p ( e n t e r p r i s e s r e s o u r c ep l a n n i n g ,企业资源规划) 技术或系统,为进一步实施基于i n t e m e t i n t r a n e t 的制造业信息化奠定了良好基础。但是,早期在构建企业制造信息管理的某项 应用系统时,大多基于某种d b m s ( d a t a b a s em a n a g e m e n ts y s t e m ,数据库管理系 统) 、采用“独立解决方案”,程序开发者和企业逻辑相结合,在特定的操作系统 平台和开发环境下,基于特定的数据格式、开发模式和系统框架进行特定应用 程序的开发,很少考虑应用系统的可集成性可重用性、可扩充性、可移植性; 因此,当众多基于关系数据库的应用系统需要信息共享时,必须在它们之间开 发复杂的专用数据访问接口,每一次应用系统的升级要涉及众多复杂接口的升 级,新的应用又需考虑新的接口开发。于是,企业不得不为每套应用配置特有 的专业技术人员,并保持与不同技术供应商的密切联系,结果形成了众多的关 系数据孤岛和小规模的紧密集成并存的局面。另外,存储在关系数据库中的数 据不能直接应用到i n t e m e t 环境,需要开发特定应用程序,才能将的关系数据发 布到i n t e m e t 环境。 武汉理工大学硕士学位论文 随着i n t e m e t 技术高速发展,x m l i ( e x t e n s i b l em a r k u pl a n g u a g e ,可扩展标 记语言) 作为一种支持i n t e m e t 环境的数据表示标准,正在引起人们的极大关注。 x m l 是w 3 c ( w o r l dw i l dw e bc o n s o r t i u m ,世界万维网联盟) 提出的一种定义其 它语言的元语言,是s o m l ( s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ) 的一个精简子 集,用于支持i n t e m e t 上的结构文档交换。广义的x m l 除了指一种语言和采用 该语言所描述的x m l 文档外,还包括x m l 语言以及所有与x m l 相关的工具 和技术,例如,x m l 解析器及解析技术、x m l 转换技术、x m l 检索技术等。 舭具有如下特点 ( 1 ) x m l 具有可扩展性。x m l 的最大特点是允许用户根据其需要创建自 己的标记,创建标记的范围涉及数据的结构、数据的语义约束条件、数据的内 容、数据显示样式、甚至数据的操作等方面,这个特点使得x m l 突破了h t m l 仅能描述数据显示样式的局限,具有良好的结构和约束。 ( 2 ) x m l 提供了一种灵活的数据描述方式。x m l 支持数据模式、数据内 容、数据显示方式三者的分离,符合内容与形式分离这一规律,从而使得依赖 于数据显示方法的用户界面、数据的使用、数据的定义相分离,使得同一数据 内容在不同终端设备上个性化表现数据成为可能,在数据描述方式上更加灵活。 ( 3 ) x m l 具有自描述性。x m l 文档通常由文档模式描述文件和实例文件 组成,前者用于描述x m l 实例文件所能使用的标记、标记的结构、标记的含义 等,而x m l 实例文件则使用这些预定义的标记描述数据,所以x m l 具有自描 述性。 ( 4 ) 多样的样式表支持:x m l 把数据内容与他们的表现形式分开。这样既 可以只关心数据的逻辑结构,也可以通过样式表来格式化数据的表现。你甚至 可以定义自己的个人样式表来显示各种不同的x m l 数据 ( 5 ) x m l 简单易于处理。从数据处理的角度看,x m l 足够简单易于阅读, 又易于被应用程序处理。 上述优点和特点,使得x m l 可以为结构化数据、半结构化数据、关系数据 库、对象数据库等多种数据源的数据内容加入标记,适于作为一种统一的数据 描述工具,扮演异构应用间的数据交换载体或多源异构数据集成的全局模式角 色。事实上,诸如w e bs e r v i c e s ( w e b 服务) 、s e m a n t i cw 曲( 语义网络) 等多种新 的i n t e m e t 协议都是基于x m l 建立的,x m l 己经成为i n t e m e t i n t r a n e t 环境下数 据表示的事实标准。 2 武汉理工大学硕士学位论文 从上述分析不难看出,x m l 在数据交换方面的自描述、可扩展等优势使其 适于充当i n t e m e t 环境下数据描述标准与异构应用间数据交换载体的角色。另一 方面,迄今为止,用户仍习惯于将制造信息储存于用关系数据库中绝非偶然, 更深层的原因是x m l 缺乏关系数据库那样有效的数据管理手段,存在着数据管 理困难、操作效率低、安全性差的隐患,从而制约了基于x m l 的数据管理技术 的发展和应用。而关系数据库在数据管理方面具有数据操作速度快、效率高、 安全性好,并发访问控制好、技术成熟、应用广泛等优点,使其作为底层数据 管理方式具有一定的潜在优势,但是它也需要提出一种灵活的数据应用方式, 以便将数据有效地发布到i n t e m e t 环境,消除平台差异、实现更大范围的数据交 换与信息共享,x m l 具有上述优势,正可弥补关系数据库技术的不足。综上所 述,x m l 和关系数据库在数据应用和数据管理方面各有优势,它们之间不能相 互代替,应是一种相辅相成、优势互补的关系。因此以关系数据为企业制造信 息的存贮手段,以x m l 为交换载体的制造信息的数据管理方式就成为一种趋势, 而这两种数据格式间的集成和信息共享就成了研究的热点。 在此基础之上,本文探讨的是如何将以关系数据格式储存的制造信息自动 化地转换为x m l 格式的数据,并且转换后的数据必须符合原来数据之间的语义 约束,实现关系格式数据到x m l 格式数据的无损转换。这样就可以充分利用关 系数据库中的数据,有利于数据的共享和交换,并尽量减少手工操作的负担。 现实中x m l 数据的来源往往是关系数据,使得这种转换具有重要的实用价值。 一般来说,以关系数据格式储存的制造信息并不是专门为x m l 应用设计的,它 们要满足其它的业务处理需求,同时这种数据的结构也比较固定,不会作经常 性的调整,而x m l 作为数据发布的手段,其扩展性很强,数据组织的变化也相 对频繁,因此这种转换也存在一定的复杂性。所以如果能够有一种自动或半自 动的方法来完成这种数据转换工作,将为人们提供不少便利。 1 2 相关领域研究发展现状 在国外,x m l 与r d b 的相关技术己经引起了从高校科研院所到商业数据 库公司的广泛关注,其具有代表性的项目或计划如下: 美国u c l a 大学的x p r e s s 项目。x p r e s s 的全称是x m lp r o c e s s i n ga n d r e l a x a t i o ni nr e l a t i o n a ls t o r a g es y s t e m 该项目重点开展基于关系数据库的x m l 存储与查询技术,该项目组的d o n g w o nl e e 博士提出了在关系模式与 3 武汉理工大学硕士学位论文 d t d ( d o c u m e n tt y p ed e f i n i t i o n ,文档类型定义) 双向映射过程中的语义约束保留 问题口 3 ,4 1 。该项目的主要贡献如下:提出了基于x s c h e m a 5 】的语义建模理论;基于 形式语言理论对六种x m l 模式描述语言进行了综合分析;提出了d t d 与关系模 式双向映射的语义约束保留问题【6 j 。 美国c o m e l l 大学的i n t e r n e td a t am a n a g e m e n t ,项目组的 j s h a n m u g a s u n d a r a m 博士最早在d t d 到关系模式映射方面取得突破。该项目的 贡献是:提出基本内嵌、共享内嵌、混合内嵌三种d t d 到关系模式的映射算 法【7 ,8 】;提出面向x m l 的关系数据发布算法及技术1 9 1 ; 法国国家信息与自动化研究所( i n r t a ) 的a g o r a 项目,该项目着重研究基于 x m l 的异源数据库集成技术。其主要贡献有:建立了基于x m l 的多数据库 集成理论【l o 】;对现有的关系模式与x m l s c h e m a 的映射算法进行了分析、比 较;研究了q u i l t 到s q l 的转换算法【l 。 奥地利维也纳科技大学的x r a y 项目,该项目受欧盟教科文基金的资助, 开展x m l 与数据库的集成技术的研究。主要贡献有:对关系数据、对象数据、 x m l 进行了深入的比较【1 2 】;研究了基于x m l s c h e m a 的建模理论【1 3 1 。 近年来,随着x m l s c h e m a 标准的成熟,基于x m l s c h e m a 的x m l 数据 转换研究逐渐深入,在基于x m l s c h e m a 的x m l 模式研究【1 4 , 1 5 , 1 6 , 1 7 1 、关系模式 同x m l s c h e m a 模式映射 1 8 , 9 , 2 0 , 2 1 】等领域开展研究。 在语义约束方面,研究人员提出了一些专门的x m l 的语义约束【2 2 ,2 3 ,2 4 ,2 5 1 ,并 成为研究的热点之一。在这些语义约束中,b u n e m a n 等人中提出的x m l 键【2 6 】 就是一类十分重要的语义约束。b u n e m a n 等人在定义了如何描述x m l 键之后, 还定义了如何判断一个x m l 文档是否符合一些x m l 键,以及如何在x m l 键 之间进行推导的规则f 7 1 ,本文就是借助x m l 键的概念提出了关系树上的语义键 概念。 在关系数据的x m l 发布方面,大量中间件( 如s i l k r o u t e z s ) 支持以标准 的x m l 方式( 如通过x q u e r y 【2 叼o 】) 对关系数据源进行查询;在结构化数据到 x m l 数据的语义映射方面也取得了一定的成果【3 l 】。这些技术在一定程度上实 现了关系数据到x m l 数据的映射或转换。 国内的大多数相关研究工作集中于院校等研究小组进行。北方交通大学的 “关系模式到x m l 模式的影射【3 2 】,中国科学院计算所的 x m l 结构和关系数据 库的一种形式化映射【3 3 】”,东南大学结构化数据到x m l 数据的语义映射【3 4 】 , 4 武汉理工大学硕士学位论文 西安交通大学的“用x m l 表示关系数据【3 5 】”,上海交通大学的“基于x m l 实现数 据库间信息交换的方法【3 6 】,武汉理工大学的“表达关系模型中m :i i 联系的方法 【3 7 】”等都对关系数据库与x m l 之间的转换开展了研究,这些转换大部分都是基 于x m ld t d 的转换。西北工业大学c a d c a m 国家专业实验室在关系模式到 x m l s c h e m a 的约束保留映射【3 5 , 3 9 】等研究方面也进行了大量的探讨工作。 目前,一些商业产品实现了关系数据到x m l 数据的转化,例如 o d b c 2 x m l 、o r a c l e sx s q l 、x m ls p y l 4 、m a p f o r c e l 4 1 】工具。除o d b c 2 x m l 、 x m ls p y 、m a p f o r c e 外,大部分的工具都是为相关的数据库产品服务,不支持 多种异构关系数据库。而o d b c 2 x m l 、x m ls p y 和m a p f o r c e 支持多种数据库 系统但没有考虑数据库中数据本身的联系,没有考虑到数据的实体完整性和参 照完整性,例如一些主外键约束等均未转化。 以上的研究成果为我们进行相关工作提供了一些思路和启发,然而早期的 研究多集中在d t d 与关系模式之间的转换技术【4 2 】方面。w 3 c 于2 0 0 1 年5 月推 出了x m l s c h e m a 作为x m l 的模式描述语言,为深化x m l 技术的讨论和研究 提供了标准规范。因此,随着x m l s c h e m a 标准的逐步成熟,关系数据库数据 与基于x m l s c h e m a 的x m l 数据的转换工作仍然有必要继续深入下去。并且, 目前很多技术在实现关系数据向x m l 数据转换时大多数也只注重数据间的对应 转换,而忽略了数据间语义的完整保留,而数据语义中包括数据的完整性、数 据之间的依赖性等重要信息,这在数据集成、数据语义完整性等方面具有重要 的意义。 1 3 本文主要工作及结构安排 本文针对怎样将数据库中储存的制造格式信息转换为x m l 格式数据展开原 理性研究、分析及简单应用。 ( 1 ) 通用性。现有r d b m s ( r e l a t i o n a ld a t a b a s em a n a g e m e n ts y s t e m ,关系数 据库管理系统) 都是基于关系理论的,但在模式表示、操作、访问接口等方面是 不尽相同的,本文不针对特定r d b m s 进行研究,而是通过一般关系模式、基 本s q l 、r d b m s 标准接口,j d b c 等通用技术确保本文算法不依赖于特定的 r d b m s ,具有通用性。 ( 2 ) 关系模式到x m l 模式转换算法的设计。该转换是本研究的核心。为此 本文提出了一种基于语义键的关系树模型来表示表与表、列与列之间的语义关 5 武汉理工大学硕士学位论文 联,然后将关系树转换为x m l 模式的结构,在己有的算法中,关系模式转换为 x m l 模式的结构通常是一种扁平的结构,这种结构非常简单,却不能直接的表 示出一些表之间的参照关系,为此本文用x m l s c h e m a 元素间的嵌套关系来反 映关系表间的参照。使关系模式转换为x m l 模式更为灵活。因为一个关系模式 所要表达的不仅是数据结构,更重要是数据之间的约束依赖关系,所以算法的 设计将在数据的基础上注重数据结构,在数据结构的基础上更注重数据之间的 语义约束条件。同时本文用x m l s c h e m a 来描述x m l 模式,将使得关系数据库 与x m l 之间的数据转换与国际标准一致,以满足大量基于x m l s c h e m a 应用的 需求。 ( 3 ) 数据间的无损转换。在关系模式到x m l 模式转换的基础上,基于生成 的x m l s c h e m a 模式构建一种嵌套结构的数据映射结构文档,通过构造相应s q l 语句从关系数据库中提取相应数据,实现了关系数据的x m l 发布。 ( 4 ) 开发相应的原型系统验证本文算法的有效性。根据算法的特点开发出 一个b s 架构的系统实现关系数据的无损发布。 本文共分五章,各章的内容和组织如下: 第一章论文的研究背景、研究现状、论文研究的主要内容以及论文的组织 结构。 第二章关系模式到x m l 模式的语义映射。提出了一种基于语义键的关系树 模型,并将从数据库中提取的关系模式生成的上述的关系树;然后依据关系树 及其语义键构建对应的基于x m l s c h e m a 的x m l 模式。 第三章关系数据到x m l 数据的转换。在第二章生成x m l s c h e m a 模式的基 础上创建了嵌套的数据映射结构和相应的s q l 语句从关系数据库中提取数据完成 关系数据向x m l 数据的无损转换。 第四章数据转换原型系统。介绍依据上文算法开发的b s 架构原型系统, 实现了关系数据发布为x m l 数据。 第五章全文工作的总结和对未来工作进行展望。 6 武汉理工大学硕士学位论文 第2 章关系模式到x m l 模式的语义映射研究 本章中关系模式到x m l 模式的语义映射由以下步骤组成,首先需要从具体 的关系数据库中抽取关系模式,然后根据关系模式生成关系树模型,再根据关 系树生成x m l s c h e m a 描述的x m l 模式,如图2 - 1 所示: 2 1 相关技术简介 图2 1 语义映射流程图 2 1 1x m l 模式描述语言 x m l 具有很多种模式,包括x m ld t d 、x m l s c h e m a 、x d r 、s o x 、 s c h e m a t r o n 、d s d 、d c d 、d d m l 等,本文统称这些模式为x m l 模式。其中 d t d 、x m l s c h e m a 、x d r 和s o x 属于语法模式而s c h e m a t r o n 属于类型模式, d s d 则介于二者之间。w 3 c 的d t d 和x m l s c h e m a 是目前使用最广的两种模 式,也是w 3 c 的推荐标准。 d t d 缺乏对x m l 文档的内客及其语义的约束机制,这将限制x m l 处理器 进行有效的类型检验,应用软件开发者将不得不专门编写有关类型检验的代码。 因此有必要为x m l 建立一个更全面的有效性约束机制。使x m l 处理器更好地 进行有效性检验,这样就产生了x m l s c h e m a 。自2 0 0 1 年5 月2 日起, x m l s c h e m a 规范成为了w 3 c 的正式推荐标准。 d t d 作为x m l l 0 规范的重要组成部分,对于x m l 文档的结构起到了很 好的描述作用。但它也有一些缺点,比如它采用了非x m l 的语法规则、不支 持数据类型、扩展性较差等等。x m l s c h e m a 正好解决了这些问题。它具有 以下优点: 7 武汉理工大学硕士学位论文 ( 1 ) 一致性。x m l s c h e m a 使得对x m l 的定义不必再利用一种特定的形 式化的语言,而是直接借助x m l 自身的特性,利用x m l 的基本语法规则来定 义x m l 文档的结构,使x m l 达到了从内到外的完美统一,也为x m l 的进一 步发展奠定了坚实的基础。 ( 2 ) 扩展性。x m l s c h e m a 对d t d 进行了扩充,引入了数据类型、命名 空间、一致性约束,从而使其具备较强的可扩展性。 ( 3 ) 互换性。利用x m l s c h e m a ,我们能够书写x m l 文档以及验证文档 的合法性。另外,通过特定的映射机制,还可以将不同的x m l s c h e m a 进行转 换,以实现更高层次的数据交换。 ( 4 ) 规范性。同d t d 一样,s c h e m a 也提供了一套完整的机制以约束x m l 文档中置标的使用。但相比之下,后者基于x m l ,更具有规范性。x m l s c h e m a 利用元素的内容和属性来定义x m l 文档的整体结构,如哪些元素可以出现在文 档中、元素间的关系是什么、每个元素有哪些内容和属性、以及元素出现的顺 序和次数等等。 由x m l s c h e m a 书写的模式文档定义了相应的x m l 文档的规则,以约束 其数据元素及其关系。首先,s c h e m a 文档从数据结构、数据类型、一致性约束 三方面更严格地约束相应的x m l 文档,它可以定义d t d 所无法定义的规则。 而d t d 仅从结构上对x m l 文档进行有限的约束。其次,d t d 语言有其独立 的语法形式,x m l s c h e m a 文档本身就是一个x m l 文档,可以用x m l 工具进 行分析。 尽管x m l s c h e m a 的语法结构远d t d 复杂,但其比d t d 更具有表现力、 更适应于各领域应用的使用,所以x m l s c h e m a 取代d t d 已成为一种趋势。鉴 于以上原因,本文采用x m l s c h e m a 来描述由关系模式映射而成的x m l 模式。 x m l s c h e m a 主要由以下组件构成: ( 1 ) 全局组件与局部组件 组件可以被声明( 或定义) 为全局的或者局部的。全局组件出现在模式文档的 最高层中,而且总是命名组件;在整个模式中,它们的名称在其组件类型中必 须是唯二的。例如,在同一模式文档中具有相同名称的全局元素声明是不合法 的。然而,同一模式文档中具有同名的元素声明和复杂类型定义则是合法的。 相反,局部组件则局限在包含它们的定义和声明作用域内。元素和属性声明可 以是局部的,这意味着它们的作用域只在声明它们的复杂类型范围内。简单类 8 武汉理工大学硕士学位论文 型和复杂类型也可以定义局部的,在这种情况下它们是匿名的,不能被定义他 们的元素和属性声明之外的其他任何元素和属性声明使用。因此为了避免不必 要的命名冲突,应尽可能将组件声明或定义成局部的。 ( 2 ) 命名模型组 x m l s c h e m a 支持命名空间及其引入与包含。x m l 用命名空间标识名字的 来源,利用i m p o r t 与i n c l u d e 机制,应用者可以引入或包含其它命名空间,这样 有利于x m l s c h e m a 的模块化设计,增强其可读性、可维护性、集成性。命名 空间( n a r n e s p a c e ) 是x m l 通过u r i ( u n i v e r s a lr e s o u r c ei d e n t i f i e r ,统一资源定位l 描述名字空间,避免了重复,一个x m l s c h e m a 文件可以引用一个或多个命名 空间的名字来定义目标命名空间的名字。一般的,h t t p :w w w w 3 o r g 2 0 0 1 x m l s c h e m a 被作为根部模式描述来定义新模式,在定义目标命名空间时, 也可以引用已定义的多个命名空间,但是目标命名空间只能有一个。 ( 3 ) 元素与属性 元素和属性的标签分别为e l e m e n t 、a t t r i b u t e 。元素和属性是x m l 文档的基 本构件,每个元素和属性都与某个数据类型相关联,这个数据类型可以是基本 数据类型,也可以是由基本类型扩展的简单类型。元素的类型还可以是复杂类 型。元素和属性还可以通过d e f a u l t 属性设置默认值,通过m a x o c c u r s ,m i n o c c u r s 约定出现次数。 ( 4 ) 简单类型和复杂类型 简单类型和复杂类型的标签分别是s i m p l e t y p e 、c o m p l e x t y p e 。简单类型包括 x m l 内置的基本类型和由这些类型扩展而来的类型,它不能有子元素和属性。 复杂类型是由简单类型、元素类型、混合类型和空类型其中的一个或几个组合 而成,它可以有子元素、属性等。 x m l s c h e m a 通过简单类型和复杂类型实现对用户自定义类型的支持。简单 类型可以在界限、长度、精度、枚举值、模式匹配、空白处理等六方面实现对 元素和属性的域值约束。而复杂类型实现了x m l 文档所要表达的数据结构,同 时在复杂类型中通过s e q u e n c e ,c h o i c e ,a l l 这三个标签来约定元素出现的顺序。 ( 5 ) 一致性约束 一致性约束可以唯一识别文档中的节点,并确保它们之间引用的完整性。 一致性约束可分三类:唯一性约束、关键字约束、关键字引用。这三种约束定 9 武汉理工大学硕士学位论文 义的语法比较类似。它们的定义包括三部分;范围( s c o p e ) 、选择器( s e l e c t o r ) 、限 制域( f i e l d ) 。唯一性约束和关键字约束的主要区别在于唯一性约束约束的字段可 以为空,而关键字约束限定的字段却不可以为空。在关键字引用和关键字约束 的范围上,还有一个附加约束。被k e y r e f 引用的k e y 必须在同一个元素声明中 定义,或者在它的某个子元素中定义。 x m l s c h e m a 能够提供的约束可以归为八类约束: 数据类型:x m l s c h e m a 具有丰富的数据类型( d t d 不支持数据类型) , 它提供了s t r i n g 、i n t e g e r 等4 5 个内部类型。 域值约束:域值约束主要指在数据类型基础上的取值合法性问题。 x m l s c h e m a 支持数据类型多个方面的域值约束,以及正则表达式的域值约束。 o 属性默认值:在x m l s c h e m a 属性定义时关键词d e f a t f l t 表示属性的默 认值。 元素默认值:x m l s c h e m a 简单元素支持默认值约束。 o 元素出现次数:x m l s c h e m a 用关键字m i n o c c u r s 表示元素的最少出现 次数,用m a x o c c u r s 表示元素的最多出现次数。 子元素的有序与无序x m l s c h e m a 用关键字s e q u e n c e 支持子元素的有 序;用关键字a 1 1 支持子元素的无序;用c h o i c e 表示子元素任意出现其中之一。 唯一性:x m l 支持属性、元素的唯一性。 关键字与关键字引用:x m l 支持属性、元素、复杂对象的关键字约束, 同时支持属性、元素、复杂对象的关键字引用约束。 2 1 2 关系数据库简述 关系数据库系统采用关系模型作为数据的组织方式,关系模型是目前最重 要的一种数据模型。关系模型与以往的数据模型不同,它是建立在严格的数学 概念的基础上的。关系模型是由美国i b m 公司s a nj o s e 研究室的研究员e e c o d d 在1 9 7 0 年首次提出的,它开创了数据库关系方法和关系数据理论的研究。3 0 年 来关系数据库系统取得了辉煌的成就,涌现出如o r a c l e ,d b 2 ,s q ls e r v e r ,s y b

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论