




已阅读5页,还剩64页未读, 继续免费阅读
(计算机应用技术专业论文)xml模式到概念模型的转换方法与工具研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理工大学硕士学位论文 摘要 x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 是一种进行数据表示和交换的通用格式, 它已在i n t e r n e t 上和企业内部得到了广泛应用。x m l 模式是x m l 应用的基础, 为了描述x m l 文档的语法和结构,当前普遍采用w 3 cx m l 模式定义语言。然 而,这样的x m l 模式表示的是文档的逻辑结构,其格式复杂、难以表示语义, 因此不便于人们的理解和交流。图形化的概念模型是便于理解和交流的有效表 达方式,所以,将逻辑层的x m l 模式转换成概念层的图形化模型,这是一个值 得深入研究的课题。 本文主要研究从x m l 逻辑模式到x m l 概念模型的转换方法以及相关的转 换工具。x m l 逻辑模式采用x m l s c h e m a ,而概念模型则采用了种新型的x m l 概念模型x u m l 。论文介绍并分析了x u m l 的主要特点;在此基础上,对 x u m l 进行了扩展,扩展是通过定义p r o f i l e 实现的。p r o f i l e 针对x m ls c h e m a 主要特性,定义了相关的构造型、标记值和约束,强化了语义。 为了进行两种模式( 型) 之间的转换,映射规则是基础。论文从元素、属 性、数据类型、约束等方面,定义了x m l s c h e m a 到扩展x u m l 模型的映射规 则。在此基础上,论文提出了一个模型转换算法x s d 2 x u m l ,并分析了该算法 的时间复杂度。 为了让x s d 2 x u m l 实用化,需要有工具的支持。本文分析了与工具实现相 关的一系列关键技术问题,提出了实现该工具的完整技术方案。该方案以 p o w e r d e s i g u e r 为基础,采用其中的x m lm o d e l 作为x m l 编辑器:采用x m i 作为x u m l 的内部表示格式;采用x s di n f o s e t 作为x m l s c h e m a 处理的接口; 采用e c l i p s e 作为工具集成平台。通过扩展p o w e r d e s i g n e r 中的类图模型,初步 实现了x u m l 编辑器。 本文得到了湖北省自然科学基金项目( 编号:2 0 0 4 a b a 0 4 0 ) 的资助。 关键词:x m l ,x m ls c h e m a ,模型转换,x u m l ,算法 武汉理工大学硕士学位论文 a b s t r a c t x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) i sau n i v e r s a lf o r m a tt or e p r e s e n ta n d e x c h a n g ed a t a i ti sw i d e l yu s e do ni n t e r n e ta n di ne n t e r p r i s e x m ls c h e m ai st h e b a s eo fx m l a p p l i c a t i o n w 3 cx m l s c h e m ad e f i n i t i o nl a n g u a g ei sa l l - p e r v a d i n g u s e dt od e s c r i b et h es y n t a xa n ds t r u c t u r eo fx m ld o c u m e n t x m ls c h e m ac a nd e n o t e t h el o g i s t i cs t r u c t u r e ,b u ti ti sd i f f c u l tt od e n o t et h es e m a n t i c s ,a n di t sf o r m a ti s c o m p l i c a t e dt o o t h er e a s o n sa b o v er e s u l t i nt h ei n c o n v e n i e n c ef o rp e o p l et o u n d e r s t a n d i n ga n dc o m m u n i c a t e w h i l et h e g r a p h i c a lc o n c e p t u a lm o d e l i sa l l e f f e c t i v ew a yo fe x p r e s s i o nf o ru n d e r s t a n d i n ga n dc o m m u n i c a t i o n s oi ti sa d e s e r v i n gs t u d yt oc o n v e r tt h ex m l s c h e m ao fl o g i c a ll a y e ri n t og r a p h i c a lm o d e lo f c o n c e p t u a ll a y e r t h i st h e s i sr e s e a r c h e st h et r a n s f o r m a t i o nf r o mx m l l o g i c a lm o d e lt ox m l c o n c e p t u a lm o d e l ,a n ds o m et o o l st h a tc o n c e r n e d x m ll o g i c a lm o d e la d o p t sx m l s c h e m aw h i l ex m lc o n c e p t u a lm o d e la d o p t sx u m l , w h i c hi san e wx m l c o n c e p t u a lm o d e l t h et h e s i si n t r o d u c e sa n da n a l y s e st h ec h a r a c t e r i s t i c so fx u m l , a n dx u m lm o d e li se x t e n d e db a s e do nt h e s ew o r k s m a p p i n gr u l e si st h ef o u n d a t i o n o ft h et r a n s f o r m a t i o nb e t w e e nt w om o d e l s t h i s t h e s i sd e f i n e ss o m em a p p i n gr u l e sf r o mx m ls c h e m at oe x t e n d e dx u m lb a s e do n t h ea s p e c t so fe l e m e n t ,a t t r i b u t e ,d a t at y p ea n dr e s t r i c t i o n a n dt h e nac o n v e r s i o n a l g o r i t h mx s d 2 x u m l i sb r i n gf o r w a r db a s e do nt h em a p p i n gr u l e s t h et h e s i sa l s o a n a l y s e dt h et i m ec o m p l e x i t yo fa l g o r i t h m i no r d e rt om a k ex s d 2 x u m lm o r ep r a c t i c a l ,s o m et o o l sa l en e e d e d t h et h e s i s a n a l y s e sas e r i e so fk e yt e c h n o l o g i c a lp r o b l e m sa b o u tt h ei m p l e m e n tu s e db yt o o l s a b l u ep r i n ti sp u tf o r w a r dt o o t h i sb l u ep r i n ti sb a s e do np o w e r d e s i g n e r , w eu s e si t s x m lm o d e la sx m l e d i t o r ;x m ii su s e da st h ei n n e rf o r m a to fx u m l t h ed i s p o s e i n t e r f a c eo fx m ls c h e m ai sx s di n f o s e t ;a n de c l i p s ei su s e da st h ei n t e g r a t i o n p l a t f o r m t h et h e s i si m p l e m e n t sas i m p l ex u m le d i t o rb ye x t e n d i n gt h ec l a s sg r a p h m o d e lo fp o w e r d e s i g n e r i i 武汉理t 大学硕士学位论文 t h i st h e s i si ss u p p o r t e db yt h en a t u r a ls c i e n c ef o u n d a t i o no fh u b e i p r o v i n c eo fc h i n a ( n o 2 0 0 4 a b a 0 4 0 ) k e y w o r d s :x m l ,x m ls c h e m a ,m o d e lt r a n s f o r m a t i o n ,x u m l ,a l g o r i t h m i i l 独创性声明 本人声明,所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 入已经发表或撰写过的研究成果,也不包含为获得武汉理工大学或其它教育祝构 的学位或证书两使用过的材料。与我一同工作的同志对本研究所傲的任何贡献均 已在论文中作了明确的说明并表示了谢意。 研究生签名:挚豳期上喇 关于论文使用授权的说明 本人完全了解武汉理工大学有关保留、使用学位论支的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部内容, 可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 研究生签名: 武汉理工大学硕士学位论文 1 1 x m l 概述 1 1 1 x m l 简介 第1 章引言 可扩展标记语言( e x t e n s i b l em a r k u pl a n g u a g e ,x m l ) 1 o 标准于1 9 9 8 年 2 月由w 3 c ( w o r l dw i d ew e bc o n s o r t i u m ) 正式颁布,它是s g m l ( s t a n d a r d g e n e r a l i z e dm a r k u pl a n g u a g e ,标准通用标记语言) 的一个受限版本。 x m l 是自描述的、半结构化的和可扩展的标记语言。作为一种标记语言, 它将数据和对数据的描述( 元数据) 结合在一起,因而具有比关系模型更灵活、 更强的描述能力不仅能表示结构化数据,还能表示半结构化数据。x m l 基 于文本,与特定支撑环境无关,具有广泛的通用性。x m l 灵活的可扩展机制, 使得各行各业都可定义自己的x m l 词汇,并形成标准。 x m l 具有以下重要特征: ( 1 ) x m l 允许各个组织、个人建立适合自己需要的标记( t a g ) 集合,并且这 些标记可以迅速地投入使用。这一特征使得x m l 可以在电子商务、政府文档、 司法、出版、c a d c a m 、保险机构、厂商和中介组织信息交换等领域中一展身 手。 ( 2 ) x m l 的数据存储格式不受显示格式的制约。x m l 把文档的三个要素: 数据、结构以及显示方式独立开来,分别处理。首先把显示格式从数据内容中 独立出来,保存在样式表文件中;这样,如果需要改变文档的显示方式,只要 修改样式表文件就可以了。x m l 的自描述性能很好的表现许多复杂的数据关系, 使得基于x m l 的应用程序可以在x m l 文件中准确高效地搜索相关的数据内容, 忽略其它不相关部分。 ( 3 ) x m l 是一种跨平台的语言。x m l 可以作为公共的信息载体,在不同系 统和平台之间进行信息交流。 由于x m l 具有这些特征,自其发布以来,很快就成为一种数据表示和交换 的标准格式。在新一代w e b ( s e m a n t i cw e b ) 、文档处理以及内容管理系统( c o n t e n t m a n a g e m e n ts y s t e m ) 等应用中,x m l 被越来越多地用作数据表示和存储的数据 武汉理工大学硕士学位论文 模型。 x m l 同时是一种文档格式,它包含一系列说明x m l 文档的规则,该规则包 含语法上的规则和语义上的规则。x m l 文档的语法规则主要是形式化的,通过 x m l l 0 做了详细的定义。而语义规则主要是指有效性( v a l i d i t y ) 的约束,通过 x m l 的模式来进一步描述文档的语义和结构。 1 1 2x m l 的主要应用 目前,在i n t e r n e t 上或企业内部,x m l 正在迅速成为信息表示、交换和存 储的通用形式,被广泛地应用于各种领域。 ( 1 ) 语义网( s e m a n t i cw e b ) :这是w 3 c 提出x m l 的最初动机。目前的w e b 用h t m l 来记录网站,导致信息检索难以查全和查准。语义网是下一代w e b 的 雏形,x m l 将作为其中信息表示和存储的标准格式。 ( 2 ) 电子商务( e l e c t r o n i cc o m m e r c e ) :在b 2 b 或b 2 c 电子商务中,x m l 作 为“消息流 的标准交换格式。企业数据发布,也大量采用x m l 作为通用格式。 ( 3 ) 内容管理系统( c o n t e n tm a n a g e m e n ts y s t e m ) :这样的系统中,结构化和 半结构化数据并存,x m l 可作为一种“数据库逻辑模型,用于表示和持久存储 多种信息。 ( 4 ) w e b 服务( w e bs e r v i c e ) :这是i n t e r n e t 上的一种革命性应用。w e b 服务 基于几个标准:s o a p ( 简单对象访问协议) 、u d d i ( 通用发现、描述和集成) 、 w s d l ( w r e b 服务描述语言) ,这些技术都与x m l 密切相关,x m l 是w e b 服务 的基石。 1 1 3 x m l 模式分类及特点 x m l 的文档类型可以分为两种:一种是良构( w e l l f o r m e d ) 的x m l 文档,另 一种是有效的( v a l i d ) x m l 文档。只要符合x m l1 0 语法规定,就是良构的文档; 但要是一个有效的文档,必须通过模式进行有效性验证乜3 。对于x m l 的模式,主 要有d t d 、x m ls c h e m a 、r e l a xn g 、s c h e m a t r o n 等几种,下面分别介绍。 ( 1 ) d t d 文档类型定义( d o c u m e n tt y p ed e f i n i t i o n ,d t d ) 是描x m l 文档的一种常见 方法。它允许定义x m l 实例中的基本结构,包括: 2 武汉理工大学硕士学位论文 元素类型中子元素的结构和顺序 元素类型的属性 属性的基本数据类型 属性的默认值和固定值 代表其它数据格式的符号 d t d 有许多优点,它相对简单,语法紧凑,而且广泛地为x m l 实现者所理 解。如果设计得当,它可以是高度模块化的、灵活的和可扩展的。 然而,d t d 还是有一些不足。它采用独有的t x m l 语法,不能很轻易地支持 命名空间,而且提供非常有限的数据类型,这些数据类型仅适用于属性。 ( 2 ) x m 碳式定义语言( w 3 cx m ls c h e m ad e f i n i t i o nl a n g u a g e ) 在x m ls c h e m ad e f i n i t i o nl a n g u a g e ( 以后简称x m ls c h e m a 或s c h e m a ) 之前 已经开发了4 种模式语言:x d r ( x m ld a t ar e d u c e d ) 口1 、d c d ( d o c u m e n tc o n t e n t d e s c r i p t i o n ) 引、s o x ( s c h e m a f o r o b j e c t o r i e n t e dx m l ) 5 1 和d d m l ( d o c u m e n t d e f i n i t i o nm a r k u pl a n g u a g e ) 嘲。这4 种语言共同被认为是x m ls c h e m a 的起点,它 们的开发者也有很多参与了x m ls c h e m a 的创建。 w 3 c 于1 9 9 8 年开始制定x m ls c h e m a 。第一个版本,在2 0 0 1 年5 月2 日正式为 官方推荐;第二个版本,也在2 0 0 4 年l o 月2 8 日推出。正式推荐的版本包括x m l s c h e m ap a r t0 :p r i m e r ( 入门) 、x m ls c h e m ap a r t1 :s t r u c t u r e s ( 结构文档) 嘲和 x m ls c h e m ap a r t2 :d a t a t y p e s ( 数据类型文档) 1 这三个部分。 x m l s c h e m a 是本文采用的模式语言,其主要特性将在3 1 节中详细说明。 ( 3 )r e l a x n g r e l a xn g n 们专门用于有效性验证。r e l a xn g 没有内置的数据类型,而 是使用其它数据类型库。 r e l a xn g 有一些x m ls c h e m a 没有的便捷特性: 它在元素内容模型中包括属性。 它允许内容模型依赖于属性值。 它允许指定内容模型。 它对内容模型的确定性不作要求。 然而,与x m ls c h e m a 相比,r e l a xn g 也有一些不足之处: 它没有继承功能。 因为它专门用于有效性验证,所以不给处理器提供应用程序信息。 3 武汉理工大学硕士学位论文 ( 4 )s c h e m a t r o n s c h e m a t r o n 1 采用了与x m ls c h e m a 和r e l a xn g 不同的方法。s c h e m a t r o n 是基于规则的。它允许定义一系列文档必须遵循的规则。这些规则使用x p a t h 来 表示。与基于语法的语言不同的是,s c h e m a t r o n 认为只要不违反规则就是有效的。 这就不需要对每一个出现在实例中的元素类型和属性作出声明。 与r e l a xn g 一样,s c h e m a t r o n 专门用于实例的有效性验证,它有许多优点: 它简单易学,易于使用。它使x p a t h ,这是许多使用x m l 的人非常熟 悉的语言。 由于使用t x p a t h ,所以能够简洁灵活地表达出元素间的联系。这是其它 模式语言所不能及的。 实例中的值能包括在有效性验证中。 与x m ls c h e m a 相比,s c h e m a t r o n 也有一些局限: 它不提供实例数据的模型。人们不能通过查看模式而理解实例数据的作 用。 由于它专门用于有效性验证,所以不能够传递任何关于实例的信息。 s c h e m a t r o n 中除非明确禁止,任何内容都是有效的。 1 2 x m l 模型相关研究现状 1 2 1x m l 逻辑模型及逻辑设计 x m l 逻辑建模与x m l 自身的数据模型相关。w 3 c 定义了几种x m l ( 逻辑) 数据模型:i n f o r m a t i o ns e t ,d o m1 0l e v e l 2 ,x q u e r y l 0 x p a t h 2 0 ,x m l s c h e m a 。从本质上讲,x m l 的数据模型是标号图,不考虑某些细节,可简化为 带标号的有向树。x m l s c h e m a 具有 = l d t d 更强的结构描述能力,适合描述复杂 文档的逻辑结构。 规范化理论是r d b 逻辑设计的重要理论基础与方法,借鉴这思想,人们 开始研究x m l 模式的规范化,提出了几种x m l 的范式,试图为x m l 模式设 计提供理论基础。还有一些关于x m l 完整性约束的研究。 目前,已出现了一些可视化的x m l 逻辑建模工具,如a l t o v a 公司的 x m l s p y n 2 l ,s y b a s e 公司的x m lm o d e l ( 包含在p o w e r d e s i g n e r l 0 及以上版本 中) n 嬲 1 4 1 。 4 武汉理工大学硕士学位论文 1 2 2 x m l 概念模型及概念设计 x m l 的逻辑模型不够抽象且难以理解,所以设计合适的概念模型尤为必要。 目前,国内外在x m 嘲念建模的相关研究,包括如下几个方面: ( 1 )扩展e r 模型 概念模型的表示方法很多,其中最著名最常用的是e e c h e n 于1 9 7 6 年提出的 实体一联系方法( e n t i t yr e l a t i o n s h i p a p p r o a c h ) n 引,该方法用e r 图来描述现实世界 的概念模型。关系数据库中以e r 模型来描述数据库中实体与实体之间的联系, 获得了广泛、成功的使用。鉴于此,有人考虑能否直接用e r 模型来定义x m l 的 概念模型。 由于x m l 的结构与传统的e r 模型存在着一些差异,要用e r 模型定义x m l 的概念模型,必须对e r 模型进行扩展以适合更多的x m 螨性。根据文献,目前 主要有五种基于扩展e r 模型而建立的x m 魄念模型n 阳。 文献 1 7 从管理多个x m l 文档的角度出发,提出了e r x 模型,说明了该模 型的相关构件,特别提出了i n t e r f a c e ( 接口) 的概念来维护多文档语义上的不同。 文献 1 8 比较了e r 模型与x m l 的区别,提出并详细地定义了x e r 模型的构造, 以及与d t d 之间的转换。文献 1 9 从w e b 数据集成的角度提出了x 给出了模型的基本概念和x m ls c h e m a 至l j 该模型的转换。文献 2 0 为企业级的建 模,提出了cx m 骥型,定义了该模型的构件,并基于所谓嵌套树( n e s t e dt r e e ) 的思想描述了该模型与x m l s c h e m a 之间的转换。文献 2 1 按照数据库应用需求 来设计x m l 的概念模型,提出了e r e x 模型,依据x m l 的需求扩展了e r 模型, 描述了通过x g r a m m a r 转换到x m ls c h e m a 的算法规则。 文献 2 2 还从层次化视图的角度分析了e e r 至i j 定制化的x m ls c h e m a 的转 换,并提出了相关算法。 ( 2 )u m l 类图 u m l d e 为一种统一的建模语言已经得到了业界的普遍认同和接受,它们的 产品也大都支持u m l ,所以通过扩展u m l 类图来定义x m 魄念模型的相关工作 已经展开3 。 文献 2 4 是用u m l 建模x m 骥式最早的方法,尽管它是基于x m ls c h e m a 的一种前身s o x 的,但它仍介绍了扩展u m l 来对元素、属性、模型组等建 模的方法。文献 2 5 都是以建立面向对象软件设计和x m l 数据模式之间桥梁为 5 武汉理工大学硕士学位论文 出发点,定义了扩展u m l 类图来对x m u 慨念建模,同时提出了u m l 类图与x m l d t d 的映射规则。d a v i dc a r l s o n 提出的方法嘶1 描述了基于x m i 规则实现转换 u m l 到x m l s c h e m a 的方法,其中针对x m l s c h e m a 的概念定义了一系列的u m l p r o f i l e 。文献 2 7 中,p r o v o s t 针对文献 2 6 中的一些缺点给出了改进方法。文献 2 8 从概念、逻辑、物理三层来考虑u m l 和x m l s c h e m a 的关系,并给出了两者 直接的、一对一的映射规则;文中还从降低冗余、增强连通性的角度比较了相 关映射的优劣。其它的相关工作在文献 2 9 3 0 中都有描述。国内也有相关文 献,如 3 1 3 2 做了类似的研究工作。 ( 3 )其它 除了扩展e e r 和u m l 类图来建立x m l 的概念模型之外,还有些其它的 方法。 文献 3 3 3 提出了基于语义网( s e m a n t i cn e t w o r k ) 的设计x m l 文档的方法。 其中提出了对语义网的构件和约束的形式化定义,并依此给出了语义层和x m l 模式层的映射。 a o m ( a s s e to r i e n t e dm o d e l i n g ) 口们是一种全新的建模方法。在a o m 方法中, 引入了一个重要概念a s s e t ,用它来统一表示实体和联系。它的特点是表达能力 强、图形简洁和模块化。a o m 不仅有自己的理论,还有配套的图形化建模工具 k l e e n 。但a o m 方法并不成熟,且相对来说它的资料和技术支持都还有不足。 文献 3 5 提出了o r as s 模型,该模型将对象类、联系类型和属性区分开 来。o r as s 不仅能反映半结构化数据的层次结构,也能提供嵌套联系中的参引 ( r e f e r e n c e ) 信息。 1 2 3 存在的主要问题 以上的各种概念模型,不论是扩展e e r 、扩展u m l 类图还是其它模型,不 论是针对x m l 的d t d 还是x m ls c h e m a ,都存在着一定的局限性,其主要存在的 问题体现在:( 1 ) 模型不全面,不统一,缺乏标准;( 2 ) 大多数模型都缺乏对x m l 包含( c o n t a i n m e n t ) 语义的有力支持;( 3 ) u m l 2 x s d 有较多研究,u m lp r o f i l e 的 构造型集中在如何表达x m l s c h e m a 的特性,但对u m l 没有实质性扩展( 如:元素 嵌套参引和类型重用) ,模型的建模能力不能很好适应x m l 的层次化结构;( 4 ) 缺乏x m ls c h e m a 至u 概念模型的转换研究。 6 武汉理工大学硕士学位论文 1 3 本文的基本问题和研究目标 1 3 1基本问题 一方面,x m 啦用于不同的领域中,领域中的用户,特别是普通用户,对 x m l 可能并不十分了解,他所了解的只是其专业领域的知识。那么如何使得普 通用户能够很好地将x m l 应用到其专业领域昵? 另一方面,在企业数据建模和 企业信息集成领域中,如何高效的设计x m ls c h e m a 模式文档和集成x m l s c h e m a 模式? 为解决上述问题,需要建立一种更为抽象的概念模型来表示x m l s c h e m a 文档,该概念模型应将x m l 的相关特性融入其中,使得普通用户、设计 者能够借助于该概念模型来理解x m ls c h e m a 文档,从而不必( 也不应该) 关心 x m l s c h e m a 文档的细节,而只需专注于应用的领域。图1 - 1 示意了x m 嘶念模 型在应用领域中的桥梁作用。 图1 - 1x m l 概念模型在应用领域中的桥梁作用 从图卜1 中,可以看到x m l 概念模型的桥梁作用。本文的基本问题就是探 讨x m l 模式的概念化,其核心是将x m ls c h e m a 模式转换成概念模型的方法。 1 3 2 研究目标 以一种新的x m 蛹念模型x u m l 为基础,对它进行适当扩展,然后定义 出x m l 逻辑模型到扩展x u m 蜞型的映射规则,并以每个独立的构件映射规则 为基础,给出一个x m l s c h e m a 至w 扩展x u m l 的总体转换算法。最后给出x u m l 及转换算法实现的具体方案。 1 4 本文的主要工作及意义 本文的工作主要从以下几个方面展开: ( 1 ) 介绍一种x m l 的概念模型x u m l ,分析其特性。本文采用x u m l 作为x m l 的概念模型。 ( 2 ) 从元素、属性、数据类型、联系、约束等方面,形式化地定义了x m l 7 武汉理工大学硕士学位论文 s c h e m a 各构件到扩展x u m l 各构件的映射规则。 ( 3 ) 在映射规则的基础上,给出了一个从x m ls c h e m a 到扩展x u m l 的转 换算法x s d 2 x u m l 。 ( 4 ) 提出了利用p o w e r d e s i g n e r 实现x u m l 的简单原型,基于e c l i p s e 平台 和x m ls c h e m ai n f o s e tm o d e l 实现x s d 2 x u m l 转换工具。 1 5 论文组织 本文后面的内容安排如下:第2 章详细介绍了一种新的x m l 概念模型: x u m l ,这是本文研究工作的基础。第3 章针对x m ls c h e m a ,给出了x u m l 的p r o f i l e 定义。第4 章则是本文研究的重点之一:定义了x m ls c h e m a 模式到 扩展x u m l 模型的映射规则。第5 章描述了x m l s c h e m a 模型到扩展的x u m l 模型的转换算法一x s d 2 x u m l 。第6 章则介绍了利用p o w e r d e s i g n e r 设计 x u m l 的简单原型,以及基于e c l i p s e 平台和x m l s c h e m ai n f o s e tm o d e l 实现转 换算法( x s d 2 x u m l ) 的技术方案。最后,总结了本文的研究工作、分析了问 题并阐述了下一步的研究计划。 8 武汉理工大学硕士学位论文 第2 章x m l 概念模型x u m l 为了进行x m l 模式转换,需要选择一种合适的x m l 概念模型。本章介绍 一种新的x m l 概念模型x u m l ,详细说明它的主要构件及其特性。本文采用 x u m l 作为x m l 的概念模型。 2 1x u m l 模型概述 文献 3 6 提出并定义了一种新的x m l 概念模型,称之为x u m l 。x u m l 模型基于u m l ( 类图) ,专门针对x m l 领域设计的:x u m l 主要继承自u m l 的类图,同时结合x m l 的特性,增加了几个相关的重要概念。一般的u m l 模 型由数据结构、数据操作和完整性约束三者构成。由于x u m l 概念模型主要考 虑一些静态特征,因此x u m l 中不考虑u m l 模型中的数据操作部分,以下各 节介绍x u m l 的数据结构和完整性约束。 2 1 ,1基本模型构件 在x u m l 模型中,为了更好的描述x m ls c h e m a 模式,定义了一系列的构 件。下面列出x u m l 模型中的主要构件: 1 ) 类( c l a s s ) 2 ) 属性( a t t r i b u t e ) 3 ) 关联( a s s o c i a t i o n ) ,包括聚集( a g g r e g a t i o n ) 和组合( c o m p o s i t i o n ) 4 ) 泛化( g e n e r a l i z a t i o n ) 5 ) 包( p a c k a g e ) 6 ) 特性( p r o p e r t i e s ) :用于说明各种模型构件的特征( f e a t u r e ) 。 7 ) 广义聚集联系( g e n e r i ca g g r e g a t i o n ) 8 ) 组件类( c o m p o n e n t ) 9 ) 部件类( p a r t ) 10 ) 组件内关联( 1 0 c a la s s o c i a t i o n ) 1 1 ) x u m l 结构化类( x u m ls t r u c t u r e dc l a s s ) 9 武汉理工大学硕士学位论文 其中1 ) - - - 6 ) 是来自u m l ( 包括u m l 2 ) 的;7 ) 1 1 ) 是x u m l 模型 中特有的构件。下面对x u m l 模型中的主要概念进行详细说明。 2 1 2广义聚集 ( 1 ) 广义聚集定义 在x m l 中,一个联系可以有2 个以上的参与者,这是因为该联系涉及到所 有的参与者而不只是其中的2 个。因此几个2 元联系并不等于一个非2 元联系。 图2 - 1 ( a ) 中有2 个2 元组合联系,它们具有相同的“整体 ( 学院) ;但这2 个 联系是独立的,即项目和教师并不一定属于同一学院。而在图2 1 ( b ) 中只有一 个“非2 元的广义聚集 联系,此时,“整体与“部件的集合( c o l l e c t i o no f p a r t s ) 相关,即项目和教师属于同一学院。因此,x u m l 借鉴文献 3 7 ,定义了广义 聚集( g e n e r i ca g g r e g a t i o n ) ,并将其作为x u m l 的一种重要联系。 件类 ( a ) 2 个2 元聚集( b ) 一个非2 元广义聚集 图2 - 12 元聚集和非2 元广义聚集图示 广义聚集( g e n e r i ca g g r e g a t i o n ) :是一种x u m l 联系,对于一个广义聚集, 其中一个参与者( 整体) 的特性( p r o p e r t y ) ,部分地,由其它参与者( 部件) 的特性 来确定。整体( w h o l e ) 的抽象称为整体类,部件( p a r t ) 的抽象称为部件类。 ( 2 )广义聚集特性、约束及说明 广义聚集是u m l 关联( a s s o c i a t i o n ) 的特殊形式,是在a s s o c i a t i o n 基础上 定义的构造型( s t e r e o t y p e ) ,如图2 - 2 所示。其中,r e l a t i o n s h i p 和a s s o c i a t i o n 由 u m lc o r e 定义。 1 0 武汉理工大学硕士学位论文 圈 a s s 。c i a t i 。n 1 飞二蔼 广义聚集比u m l 中的普通2 元聚集更具通用性,它是非对称的 ( a s y m m e t r i c ) ,所以和u m l 中的n 元关联也不同。广义聚集的图形表示法还是 采用传统u m l 中的菱形符号,但与u m l 中聚集的树形风格表示不同的是,它 从聚集端( a g g r e g a t e ) 菱形的延长线分成多个分枝,如图2 一l ( b ) 所示。考虑到广 义聚集只有一个分枝的极端情况,这就成了一个普通的2 元聚集,因此普通的2 元聚集可以看成是广义聚集的一个特例,在x u m l 中仍存在普通的2 元聚集。 广义聚集可分为共享的( s h a r e d ) 和组合的( c o m p o s i t e ) 。共享的广义聚集 菱形是白色的,是一种非层次结构的;而组合的广义聚集菱形是黑色的,体现 一种层次化结构,这正是x u m l 模型需要的,用它描述x m l 中元素和子元素 间的层次联系,即包含联系。 图2 - 1 ( b ) 中的广义聚集只有2 层,通常情况下,它可以实现多层之间的 嵌套,而且层之间的广义聚集存在传递性。图2 3 实现了多层( 3 层) 嵌套,其中 的项目和教师是学院的( 直接) 部件类,而论文和研究生是学院的问接部件类。 任何部件类都只能参与一个广义聚集,即部件类只能有一个整体类,这 使得广义聚集层次形成一棵树。 一个类可以作为多个不同广义聚集的聚集端( 父类) 。对于同一种业务对 象,我们从不同角度观察,可以建立几个相互“垂直”( 独立) 的广义聚集联系 层次,在图2 - 4 中,以学院为聚集端,建有2 个独立的广义聚集。 广义聚集在x u m l 中的重要意义,在于它更准确地表示了x m l 中的“包 含 语义,描述了x m l 文档内最重要的联系,即,元素和子元素之间的“包含 联系 ,或称层次联系。 2 1 3 业务组件、路径与范围 ( 1 )业务组件 武汉理工大学硕士学位论文 组件( c o m p o n e n t ) 是系统中的一个模块化部件。在u m l 2 中,组件概念不 仅可以用在逻辑层或实现层,也可用作概念层术语。本章所说的组件都是指概 念层组件。 业务组件( b u s i n e s sc o m p o n e n t b c ) :业务组件代表一个能独立存在的单 元,它由组相关联的部件( 对象) 组成。 业务组件类:同一种类的业务组件的抽象,称为业务组件类,简称组件类。 在x u m l 中,用1 个广义聚集或1 个多层的广义聚集,来表示1 个组件类 的层次概念结构。 标识类( i d e n t i f y i n gc l a s s ) :是组件类中广义聚集层次的根类;在1 个组件 类中,只能有1 个标识类。 标识类是对x m l 文档中根元素的概念建模。1 个文档中只能有1 个根元素, 所以标识类是1 个特殊的类,它只能有1 个实例,即标识类的基数只能为1 1 。 图2 - 3 中有一个多层( 3 层) 的广义聚集,c o l l e g e 类是该组件类的标识类。 图2 - 3 多层广义聚集图2 - 42 个独立的广义聚集 传统的概念建模方法,例如e r 方法,倾向于将现实世界抽象成一系列基本 的、最小冗余的实体( 规范化实体) ,以及这些实体之间的联系。这样建立的概 念模式很容易转换成规范化的关系数据库模式。但是,在这样的概念模型中, 关于组件的概念常常是模糊的,因为组件可能已被人为地分解,变成了多个更 小的、规范化的实体。 在x m l 中,一个实例文档通常记录并描述一个组件,而对应的文档模式则 描述了这种组件的结构。所以在x m l 应用中,组件的概念比在常规数据库中更 为重要。x u m l 引入了组件类概念,并将其作为核心的建模概念。 ( 2 )路径和范围 1 2 武汉理工大学硕士学位论文 由于x u m l 中的广义聚集可以是多层次的,而且关联存在多种不同的类型, 为了明确说明相关概念,又定义了x u m l 中路径和范围的概念。 下面通过一个完整的例子,来说明相关概念。 设计一种文档的概念结构,它将一个“学校 作为业务组件,描述组件内 部的各种部件类及部件类之问的联系。假设根据用户的需求,得到了图2 - 5 所 示的x u m l 模型,它是学校组件的一种概念模型。 图2 - 5 组件内联系:广义聚集和组件内关联 图中有5 个广义聚集,描述了组件内的主要联系包含联系。还定义了9 个“组件内关联 联系。 x u m l 中的广义聚集层次构成了一棵树,为说明范围提供了一个很好的基 础。 x u m l 路径( p a t h ) :设t 是一棵x u m l 广义聚集树,从树根r 开始,到达 一个部件类p 。所经历的节点序列,构成了1 条x u m l 路径,记为:r p 。p 。, i 0 。当i = o 时,路径为树根本身。 图2 5 中,学校,学校学院,学校学院教师,都是合法的x u m l 路径。 范围( s c o p e ) :范围定义一个上下文( c o n t e x t ) ,它实际上是一棵( 子) 树,用( 子) 树的根来表示范围,根的所有属性和根下面所有的( 子孙) 部件类及其联系都在 根这个范围内。 1 3 武汉理工大学硕士学位论文 因此,在x u m l 中,每一种部件类( 包括叶子类) 都定义了一个确定的范围。 例如,图2 - 5 中,对于整个树来说,“学校”定义了一个范围,而且是最大的范 围;而对学院类及其子孙构成的树而言,“学院”定义了一个稍小的范围,项目 类和教师类,以及它们之间的关联“主持人”,都是在“学院 范围内定义的。 路径和范围是x u m l 中的重要概念。它们为组件内部关联的定义提供了一 个上下文环境,并且为后续到逻辑模型的转换提供了基础。 2 1 4 联系分类 ( 1 )联系分类 图2 - 6 列出了x u m l 中支持的各种联系,以及它们之间的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农发行淮安市涟水县2025秋招笔试创新题型专练及答案
- 2025年汝州市事业单位考试真题
- 2025年人工智能在金融服务中的风险管理报告
- 农发行湖州市吴兴区2025秋招笔试综合模拟题库及答案
- 2025年新能源行业上市公司股权激励计划实施案例分析报告
- 2025年新能源汽车电池原材料供应链稳定性分析
- 2025年制造业数字化转型数据治理与信息安全保障报告
- 中医药现代化进程中国际市场中医养生旅游市场拓展策略实证研究报告
- 2025年新能源汽车换电模式政策法规研究报告
- 农发行济宁市汶上县2025秋招群面案例总结模板
- 生鸡肉买卖合同协议书
- 银行承兑转让协议书
- 浙江省杭州市2025年八年级下学期语文期末试卷及答案
- 基于物联网的智能分拣系统设计-洞察阐释
- 8S标准培训教材
- 7.2做中华人文精神的弘扬者 课 件- 2024-2025学年七年级道德与法治下册 统编版
- 红领巾在新时代的使命与责任主题演讲稿范文
- 消防水池内有限空间安全施工方案
- 空间生产与社区发展-深度研究
- SMT工艺制程详解
- 大连理工大学《大学计算机高级基础》2023-2024学年第二学期期末试卷
评论
0/150
提交评论