(计算机应用技术专业论文)基于元模型的信息资源管理技术研究.pdf_第1页
(计算机应用技术专业论文)基于元模型的信息资源管理技术研究.pdf_第2页
(计算机应用技术专业论文)基于元模型的信息资源管理技术研究.pdf_第3页
(计算机应用技术专业论文)基于元模型的信息资源管理技术研究.pdf_第4页
(计算机应用技术专业论文)基于元模型的信息资源管理技术研究.pdf_第5页
已阅读5页,还剩47页未读 继续免费阅读

(计算机应用技术专业论文)基于元模型的信息资源管理技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于元模型的信息资源管理技术研究 摘要 信息系统在现代社会已经深入到备行各业中,在各自的位置上发挥着重要的作用。随着网络技术 的发展,使得基于网络的资源共享成为可能,几乎每一个大型或中等规模的公司和许多小型的公司, 都越来越依赖于计算机化的信息。信息的共享改变了人们的传统t 作方式,企事业之间,以及企事业 内部的各个部fj 之间,可以通过信息共享的方式加强合作,从藤提高t 。作效率。但是现在的闯题是, 由于原有信息系统开发环境和方式的独立性,形成了信息系统之间的数据和信息的异构性,很难进行 通信和资源的共享,从而形成了一个个信息抓岛。实现信息系统之间的数据集成可以解决这一问题。 信息系统之间进行数据集成有多种途径,阏而有多种解决方案。而采削元数据方案作为其最终的 集成解决方案,具备很多的优势。不同的硬件平台、操作系统、网络协议和数据管理系统进行集成, 通过元数据这一中间载体,可以屏蔽其具体的应用差别。通过元数据可以方便地实现异构数据的可靠 传输,实现异构数据的共享。同时,也可以使系统具有良好地可扩展性及适应性。 元数据管理,将系统内部和外部的不同结构的元数据资源进行整合,是企业进行资源共享和实现产 品数据管理( p d m ) 、企业应用集成( e a t ) 、企业资源规划( e r p ) 的技术基础。当前,实现元数据管理的 主流方式是通过网络进行元数据交换,实现系统的松耦合集成。其中关键技术之一就是元数据管理接 本文提山一种基于模型驱动的元数据管理技术,在统一、标准地描述各类元模型的基础上,采用 动态加载元模型的方法以统一的元数据交换形式,完成元数据的管理及应用,实现元数据的共享。 本文根据m d a 的思想,给出了用于统一描述元模型的元元模型的逻辑结构,以元元模型的方式对各类 元模_ 卑! 进行统一描述,并以多维的视角对元数据进行维度主题划分,实现元数据的多维管理。 本论文针对不同应用领域中异构系统的各类元模型,参照o m g 的四层元模型体系结构,在元模型 层之上,即在元元模型层中自定义统一的、标准的元元模型对下层元模型进行描述,以此作为集成应 用的基础。根据模型驱动的思想,在其应用中,通过统一的元元数据接口,动态加载元模型数据,完 成对元数据的访问及管理。同时,参照x m i 元数据交换标准,以x m l 作为中间数据文件格式,制定了 统一的元数据交换格式,来实现元数据在异质异构环境中的共享。 本论文成果已应用到大庆油田有限责任公司的录井专业数据库项目以及大庆石汕管理局的钻井信 息平台项目中。在此两个项目中,元数据管理作为整个应用平台的底层支持模块以及管理层应用模块, 解决了平台系统内部的多类元数据的统一方式的管理问题,为其它应用模块提供了统一调用元数据的 方法,弗为其它松耦合系统提供了元数据的交换,达到了元数据共享的目的。此种管理方式目前正是 国际热门研究的方向。 关键词;元数据管理,模型驱动,元元模型,元模型,元数据,维度 i n f o r m a t i o nr e s o u r c em a n a g e m e n tt e c h o l o g y r e s e a r c hb a s e do nm e t a - m o d el a b s t r a c t n o w a d a y st h ei n f o r m a t i o ns y s t e mi su s e di na l m o s te v e r yt r a d ei no u rs o c i e t ya n dp l a yav e r yi m p o r t a n t r o l e w i t ht h ed e v e l o p m e n to f i n t e m e t ,j tb e c o m ep o s s i b l et h a tt h ei m f o r m a t i o nc a r lb es h a r e di nw e b a l m o s t e v e r yl a g e 。s c a l eo rm e d i u m s i z e da n ds m a l lc o m p a n yb e c o m em o r ea n dm o r ed e p e n d i n go ni t t h es h a r i n g o fi n f o r m a t i o nc h a n g et h ew o r k i n g w a yo fp e o p l e t h e e f f i c i e n c ya n dc o l l a b o r a t i o no fw o r kb e t w e e n e n t e r p r i s e si sp r o m o t e da n ds t r e n g t h e n e dt h r o u g ht h i sw a yb u tt h e r ei sap r o b l e m ,b e c a u s ef o r m e ri n f o r m a t i o n s y s t e mw a sb u i l ti n d e p n d a n t l yi nd i f f e r e n tw a y , t h ed a t aa n di n f o r m a t i o nb e t w e e ni n f o r m a t i o ns y s t e m si s h e t e r o g e n e o u s ,s oc o m m u n i c a t i o na n dr e s o u r c es h a r i n ga p p e a r sh a r d 。t h er e s u l ti st h e r ea p p e a r sal o to f s i n g l ei n f o r m a t i o n i s l a n d t h er e s o l u t i o no fh i s p r o b l e m i s i m p l e m e n to fd a t ai n t e g r a t i o nb e t w e e n i n f o r m a t i o ns y s t e m s t h e r ea r cm a n yw a y st oi m p l e m e n to fd a t ai n t e g r a t i o nb e t w e e ni n f o r m a t i o ns y s t e m ,s ot h e r ea r em a n y s o l u t i o n so ft h i s p r o b l e m b u t al o to fa d v a n t a g ew o u l db et h a tt a k i n gm e t a d a t as o l u t i o na sf i n a l s o l u t i o n i n t e g r a t i o no fv a r i o u so fh a r d w a r ep l a t s ,o p e r a t i o ns y s t e m ,n e t w a r ep r o t o c o l sa n dd a t am a n a g e m e n t s y s t e m ,t h r o u g hm e t a - d a t aa sm e d i ,c a ns h i e l d t h ed i f f e r e n c eo fa p p l i c a t i o nd e t a i l s t h i ss o l u t i o nm a k e h e t e r o g e n e o u sd a t at r a n s m i t t e dc o n v e n i e n t l ya n dr e l i a b l ys h a r e d a n da tt h es a m et i m e ,i tm a k et h es y s t e m h a v ea d v a n t a g eo f f h v o u r a b l ee x t e n s i b i l i t ya n dw e l la d a p t a b i l i t y t h em e t a d a t am a n a g e m e n t ,m a k em e t a - d a t ao f v a r i o u sc o n s t r u c ti n t e r n a la n de x t e r n a lo n es y s t e mc o u l d b ei n t e g r a t e d s o m ei m p o r t a n te n t e r p r i s e - a p p l i c a t i o n ,s u c ha sp d m 、e a i 、e r pa n ds oo n ,d e p e n do nt h e i n t e g r a t i o nv e r ym u c h n o w d a y , g e n e r a l l yi n t e g r a t i o no fm e t a d a t ai sa c h i e v e dt h r o u g ht h ee x c h a n g eo fw e b d a t at h i sk i n do fi n t e g r a t i o ni sl o o s e - c o u p l i n ga n do n eo fk e yt e c h e n o l o g i e si st h ei n t e r f a c eo fm e t a - d a t a m a n a g e m e n t t h i sa r t i c l ep r e s e n tak i n do fm e t a - d a t am a n a g e m e n tt e c h e n o l o g yb a s e dm o d e l d r i v e d ,d e s c r i p tt h ea l l k i n d so fm e t a m o d e lc o n f o r m a b l ya n dn o r m a l l yb a s e dt h eu n i t e dd i s c r i p f i o n s ow ec a na c c o m p l i s ht h e m a n a g e m e n ta n da p p l i c a t i o no fm e t a - d a t aw i t ht h ea n i f o r me x c h a n g ew a yb yt h em e a n so fl o a d i n gt h e m e t a - m o d e la n ds h a r et h em e t a - d a t a a c c o r d i n gt ot h ei d e ao fm d a ,t h i sa r t i c l eg i v eal o g i cc o n s t r u c to fa u n i f o r m l ym e t a m e t a m o d e lu s e dt od e s c r i p tv a r i o u sr e c t a - m o d e la n dc o m p a r t m e n t a l i z et h em e t a - d a t ab y d i m e n s i o n sa n ds u b j e c t sa tm u f f v i e wa n dr e a l i z e dm u t i d i m e n s i o nm a n a g e m e n t t h i s p a p e rd e s c r i p t e d t h e s u b - l e v e lm e t a - m o d e l u s i n gu n i f o r m l ys t a n d a r d m e t a - m e t a - m o d e la t m e t a m e t a m o d e l l e v e la tt h et o po fm e t a m o d e l l e v e ia c c o r d i n gt ot h ef o u r - l e v e im e t a m o d e ja r c h i t e c t u r e a c c o r d i n gt ot h ei d e ao fm o d e ld r i v e n ,m e t a - d a t am a n a g e m e n tl o a dm e t a - m o d e ld a t ad y n a m i c a l l yt h r o u g h m e t a m e t a d a t ai n t e r f a c e 。a c c e s sa n dm a l l a g et h em e t a - d a t a a tt h es a m el i m e ,r e f e rt ox m i ,m e t a d a t a e x c h a n g es t a n d a r d ,au n i f o r mm e t a d a t ae x c h a n g ef o r m a te s t a b l i s h e db yt h ew a yo fx m l t oa c h i e v et h e s h a r e m e n to f m e t ao f h e t e r o g e n e o u s t h ef r u i to ft h i sa r t i c l eh a sb e e na p p l i c a t e di nt h ep r o g r a m so fm u d l o g g i n gp r o f e s s i a ld a t a b a s ef o r d a q i n gp e t r o l e a nf i e l d sa n dd r i l l i n gi n f o r m a t i o np l a t f o r mf o rd a q i n gp e t r o l e a nm a n a g e m e n td e p a r t m e n t i n t h e s et w op r o g r a m s ,a st h em o d u l e so fb o t t o ms u s t a i na n da p p l i c a t i o ni nt h em a n a g e m e n tl e v e l ,s o l u t e di n n e r v a r i o u sm e t a d a t am a n a g e m e n tp r o b l e mu n i f o r m l y , p r o v i d e st h eu n i f o r mm e t h o do f a c c e s s i n gm e t a - d a t at ot h e o t h e ra p p l i c a t e dm o d u l e sa n dm e t a - d a t ae x c h a n g e1 0t h eo t h e rl o o s e c o u p l i n gs y s t e m ,a c h i v es h a r e m e n to f m e t a d a t a t h i sm e t h o do f m a n a g e m e n to f m e t a d a t ai sar e s e a r c hi nh o t k e y w o r d s :m e t a - d a t a m a n a g e m e n t ,m o d e ld r i v e n ,m e t a - m e t a m o d e l ,m e t a - m o d e l ,d i m e n s i o n 刖蓦 以汁算机技术为代表的信息技术对人类社会已经产生了深刻的影响。随着网络的发展这种影 响的蔓延早现出愈演愈烈的趋势。社会对于信息的需求似乎永远也得不到满足。计算机硬件遵循摩 尔定律稳步发展。网络的法则则超过了摩尔定律。然而与之不相协调的是,计算机软件的生产一直 没有成熟起来。面对t 业化的需求,绝大多数软件还是通过手工艺阶段的生产模式开发的。 在早期阶段,软件的需求量并不大。而且运行软件的计算机设备昂贵。但随着计算机的酱及, 形势发生了变化,计算机设备的价格成百上千倍地下降,对软件的需求量也呈现出爆炸式的增长。 这种变化和工业革命早期从手工业转向机器大生产的情形极其相似。人们迫切需要找到一种生产软 件的机器以及和这种机器相配套的生产模式以满足工业化的软件需求。 信息系统在现代社会已经深入到各行备业,在各 的位置上发挥着重要的作用。随着应_ 【 ;| 集成 需求的不断扩大,软件系统复杂度的加大,系统内部产生了大量的元数据。这些元数据的使用及管 理则成为亟待解决的问题。开发商及软件开发人员在产生元数据的同时,带来了大量关丁- 元数据管 理方面的问题。系统中的元数据通常涉及到了多个领域,而不同领域内的元数据又千筹万别,其中 的元数据需要得到有效的管理和应用。随着信息普及,市场竞争的激烈程度加剧,用户的业务发艘 加快,应用软件的数据需求更新周期不断缩短,系统数据模型经常变动,而且很多情况f 模型与应 用程序耦合得过于紧密,很难修改,维护起来很困难,无奈投资重新开发整个系统,为企业造成i r 很大的浪费。基于目前存在的种种问题,用户已不满足从前的“量体裁衣”,而是希望能够尽快适应 业务变化和发展,对管理需求做出快速反映,系统开发迅速,维护简单。为此企业希望实现基于元 模型的元数据管理,可以自动对新的元模型提供支持,而无需对程序进行修改。 在需求的驱动f ,软件技术不断进步,软件的开发模式也发生了相应的变化。对象管理组织o m g ( o b j e c t m a n a g e g r o u p ) 在数据集成、软件建模及软件通用化方面推出了一系列的规范。m d a ( m o d e l d r i v e na r c h i t e c t u r e ) 模型驱动架构是由o m g 大力推广的一套体系架构它打破了传统的软件开发 方式,以模型为中心模型贯穿于信息系统的分析、设计、实现、配置、维护和管理的各个阶段, m d a 的推出标志着通用软件建模开始走向成熟。元对象设施规范m o f ( m e t a o b j e c tf a c i l i t y ) 是由 o m g 推山的关于元数据管理进行定义的一套规范,该规范的推出为通用软件的实现奠定了基础。 统一建模语言u m l ( u n i f i e dm o d e l i n gl a n g u a g e ) 是o m g 推出的一个通用的可视化建模语言,用 于对软件进行描述、可视化处理、构造和建立软件系统制品文档。是一种总结了以往建模技术的经 验并吸收当今优秀成果的标准建模方法。 软件复用技术也随着用户需求的发展不断的进步。软件复崩技术在解决软件危机方面起了很大 的作用,框架技术是流行的软件复片j 技术z 一,它是一人可重用的、部分实现的软件制黼,它面向 某一特定领域,它能被实例化以满足特定的应用。 在这些问题和技术的推动下,我们提出了元数据管理框架,元数据管理框架的研究采用模型驱 动的软件开发模式作指导,利用框架技术,用来解决信息系统在元数据管理方面存在的一些问题。 大庆石油学院硕士研究生学位论文 第一章概述 计算机的世界其实就是一个数据的世界,在这个数据世界中有相当一部分数据是用 来描述数据的。这就是元数据。随着计算机应用技术的快速发展,元数据也以迅猛的速 度增长着。对元数据管理及其相关的技术内容进行回顾,有着十分重要的意义。 1 1问题的提出 随着经济全球化的进程加速,企业业务以前所未有的速度飞速增长,而业务需求也 在不断变化,应用软件系统对业务需求变化的适应能力显得尤为重要。模型驱动的软件 开发模式,对软件系统功能的扩展是开放的,因而使变化中的软件系统具有较强的适应 性和灵活性,提高了对业务需求变化的适应能力,在抽象层次上保证了系统的稳定性和 延续性。与此同时,开发软件和维护人员要面对的是越来越多以及越来越有价值的元数 据。 目前,元数据在各个领域的应用已十分广泛,w i n d o w 的注册表实际上就是一种元 数据库,它内部存储了w i n d o w 操作系统运行时所需要的各种信息,其中包括了元数据。 针对元数据的应用研究已经非常热门,而对元数据的管理却比较忽视。元数据在应用过 程中经常不能独立形成一个体系,时常与业务数据库绑定在一起,难以管理。早期对元 数据管理的尝试曾提出的解决方案是定义一个无所不包的范型,该范型要覆盖所有不同 形式的模型。实践证明,这一方案并不可行。目前已有的对元数据管理方面的研究, 大部分是针对特定领域的特定元数据。比如针对数据仓库领域“1 、空间数据库领域。”以 及知识管理领域“1 方面的元数据管理研究,这种元数据管理各自为政的局面,不利于系 统的集成和扩展。 如何高效地、可扩展地进行统一的元数据管理,提供一种存储和管理关于信息系统 和应用程序的元数据的方法,已成为一个热门的研究课题。o m g ( o b j e c tm a n a g e rg r o u p , 对象管理组织) 提出的m d a ( m o d e ld r i y e na r c h i t e c t u r e ,模型驱动体系结构) ,是一个 规范和开发应用软件的方法,而m o f ( m e t ao b j e c tf a c i l i t y ,元对象设施) 是m d a 的一 种应用,m o f 与一些相关标准一起构成了模型驱动的元数据管理框架的基础”1 。本课题 提出一种基于元元模型的元数据管理框架,在元元模型层上对各类元模型进行统一描 述,在此基础之上,实现对元数据的统一访问接口。按主题对元数据进行动态分类,完 成对元数据的多维管理。 1 2 元数据应用及管理技术研究现状 在计算机应用相当普遍的今天,元数据的应用也已渗透到了很多领域,针对领域内 的元数据进行管理也是一个非常热门的话题。随着对元数据管理问题的研究的逐步深 入,不断有新的技术解决方法提出。本节将介绍各领域元数据应用及管理的现状。 1 2 1 元数据管理基本概念 元数据:是关于数据的数据。通常元数据可用来描述数据的静态特性和动态特性。 描述数据静态特性的元数据也称为设计期元数据,如数据字典是描述数据结构的元数 掘。描述数据动态特性的元数据也称为运行期元数据,主要用于数据仓库。 依据元数据所支持的功能,可分为描述性元数据、管理性元数据、结构性元数据。 摧述性元数据有助于发现和确定资源;管理性元数据是支持资源管理的信息;结构性元 数据是将一个复杂或复合资源各部分结合到一起并且使整体可用的信息。 元数据还可以划分为: ( 1 ) 技术元数据:说明数字化信息资源的类型、存贮格式和采用的技术标准; ( 2 ) 权限元数据:说明信息资源的责任人或产权关系; ( 3 ) 保存元数据:说明信息资源的存贮位置,用统一数据定位符等末标志; f 4 ) 资源发现元数据:说明信息资源的类别、主题标志等。 在本研究成果应用到的两个平台级项目,元数据可划分如下:系统元数据、界面元 数据、查询元数据、发布元数据、数据字典( 数据结构元数据) 、工作流元数据等。这 些元数据涉及到了信息平台的多个方面,既有数据层的元数据,也有表现层的元数据, 还有应用层的元数据。元数据的数据量很大,加之这些元模型的结构于差万别,语义也 有很大的差别,如果不能对其中的元数据进行有效管理,势必造成其应用上的混乱,而 这样的元数据现状却使其管理难度加大,复杂性提高。 1 2 2 元数据管理范围及策略 元数据的管理实际上是一种支持技术,它提供的是一个平台级的服务。元数据管理 被西方媒体称为“最根本的解决方案”,是企业i t 基础设施的重要组成部分。 元数据管理系统需要提供如下的功能: 1 ) 元数据的创建 2 ) 元数据的编辑 3 ) 元数据的更新 4 ) 元数据的应用 对于元数据的管理,通常有两种管理策略。一种是建立一个元数据访问和整个元数 据生命周期管理的系统一一元数据仓储,它是元数据访问和聚集的平台,企业内的所有 元数据均存放在此元数据仓储中,从而实现元数据的集成。还有- - e e 是建立一种元数据 交换的途径,不同系统中的元数据均可以通过这个途径来互访,从而把分布、异构的系 统集成在一起实现元数据管理的功能。 1 2 3 相关标准及其应用管理现状 没有规矩不成方圆。元数据管理之所以困难,一个很重要的原因就是缺乏统一的标 准。在这种情况下,元数据管理解决方案各不相同。在计算机应用相当普遍的今天,冗 数据的应用也已渗透到了很多领域,随着元数据应用范围的不断扩展,针对领域内的元 数据进行管理也是一个非常热门的话题。随着对元数据管理问题的研究的逐步深入,各 个领域内的元数据标准也在不断地完善,相应的元数据管理工具及系统也呈现百花齐放 大庆石油学院硕十研究生学位论文 的局面,不断有新的技术解决方法提出。本节将介绍几个主要的领域中元数据标准及元 数据管理的现状。 一数据仓库领域 近几年,随着m d c ( m e t a d a t a c o a l i t i o n ,元数据联盟) 的o i m ( o p e ni n f o r m a t i o n m o d e l ,丌放信息模型) 和o m g 组织的c w m ( c o m m o nw a r e h o u s em o d e l ,公共仓库 模型) 标准的逐渐完善,以及m d c 和o m g 组织的合并,为数据仓库厂商提供了统一 的标准,从而为该领域内的元数据管理铺平了道路。 下面我们分别介绍数据仓库领域中两个最主要的元数据标准:m d c 的o i m 标准和 o m g 的c w m 标准。 1 m d c 的0 i m 存储模型 m d c 成立于1 9 9 5 年,是一个致力于建立与厂商无关的、不依赖于具体技术的企业 元数据管理标准的非赢利技术联盟,该联盟有1 5 0 多个会员,其中包括微软和i b m 等 著名软件厂商。1 9 9 9 年7 月m d c 接受了微软的建议,将o i m 作为元数据标准。 o i m 的目的是通过公共的元数据信息来支持不同工具和系统之间数据的共享和重 用。它涉及了信息系统( 从设计到发布) 的各个阶段,通过对元数据类型的标准描述来 达到工具和知识库之间的数据共享。o i m 所声明的元数据类型都采用统一建模语言 u m l ( u n i v e r s a lm o d e l i n gl a n g u a g e ) 进行描述,并被组织成易于使用、易于扩展的多 个主题范围,这些主题范围包括: ( 1 ) 分析与设计 ( 2 ) 对象与组件 ( 3 ) 数据库与数据仓库。 ( 4 ) 业务工程。 f 5 1 知识管理。 上述主题范围中的包都是采用u m l 定义的,可以说u m l 语言是熬个o i m 标准的 基础。虽然o i m 标准并不是专门针对数据仓库的,但数据仓库是它的主要应用领域之 一。目前市场上基于该标准的元数据管理工具已经比较成熟,例如微软的r e p o s i t r y 和 c a 的r e p o s i t r y 均采用了o i m 标准。 2 o m g 组织的c w m 模型 o m g 是一个拥有5 0 0 多会员的国际标准化组织,著名的c o r b a 标准即出自该组 织。公共仓库元模型的主要目的是在异构环境下,帮助不同的数据仓库工具、平台和元 数据知识库进行元数据交换。2 0 0 1 年3 月,o m g 颁布了c w m1 0 标准。c w m 模型既 包括元数据存储,也包括元数据交换,它是基于以下三个工业标准制定的: ( 1 ) u m l :它对c w m 模型进行建模。 f 2 1m o f ( m e t ao b j e c tf a c i l i t y ,元对象设旋) :它是o m g 元模型和元数据的存储 标准,提供在异构环境下对元数据知识库的访问接口。 f 3 1x m i ( e x t e n s i b l em a k e u pl a n g u a g ei n t e r c h a n g e ,x m l 元数据交换) :它可以使 元数据以x m l 文件流的方式进行交换。 c w m 为数据仓库和商业智能( b i ) 工具之间共享元数据,制定了一整套关于语法 和语义的规范。它主要包含以下四个方面的规范: f 1 ) c w m 元模型:描述数据仓库系统的模型; f 2 1c w mx m l :c w m 元模型的x m l 表示: f 3 1c w md t d :d w b i 共享元数据的交换格式 r 4 1c w mi d l :d w b i 共享元数据的应用程序访问接口( a p i ) 在数据抽取过程中,数据从各个业务系统中被统一转换存储到中灾数据仓库中。 c w m 中的转换模型定义了数据在源和目的之间移动的过程,其中不仅包括源和目标之 问的参数,还包括转换中的业务逻辑。这些业务逻辑可能包括一些商业规则、类库甚至 是用户脚本。数据仓库如果有一个规范的转换模型将给工具软件厂商和专业服务提供商 带来极大的好处,例如,按照统一的规范厂商可以设计一个通用的模型从标准e r p 包 中抽取数据。工具厂商甚至可以随软件提供成熟的模型,集成商也可以将一个模型应用 到多个项目中。 最终用户同样也能从c w m 中受益,在使用商业智能分析软件进行多维分析的时 候,用户往往会对数据的含义和来源产生疑问。c w m 能够提供这些信息,用户可以清 楚地看到数据来自哪个系统,并且是如何组成的。 3 c w m 与o i m 之间的关系 前面分别介绍了与数据仓库相关的两个主要标准,c w m 实际上是专门为数据仓库 元数据而制定的一套标准,而o i m 并不是针对数据仓库元数据的。o i m 所关注的元数 据的范围比c w m 要广,c w m 只限定于数据仓库领域,而o i m 模型包括有:分析与 设计模型、对象与组件、数据库与数据仓库、商业工程、知识管理等五个领域。o i m 与 c w m 在建模语言的选择( 都选择u m l 当做自己的描述语言) 、数据库模型的支持、 o l a p 分析模型的支持、数据转换模型的支持方面都比较一致;但是o i m 并不是基于 元对象设施( m o f ) 的,这意味着用o i m 所描述的元数据需要通过其它的接口才能访 问,而c w m 所描述的元数据可以通过c o r b a i d l 来访问;在数据交换方面,o i m 必 须通过特定的转换形成x m l 文件来交换元数据,而c w m 可以用x m i 来进行交换。 尽管如此,由于o m g 与m d c 两个组织的合并,c w m 也会与o i m 相互兼容以保护厂 商已有的投资。 需要说明的是,m d c 与o m g 组织已经合并,今后所有的工具都将遵循统一的c w m 标准,不过支持c w m 的工具才刚刚出现,而支持o i m 标准的工具已经相对成熟。 元数据管理系统方面的研究有:基于c w m 的d m o l a p 元数据管理系统、 r e p o s i t o r y 产品等。 基于c w m 的d mo l a p 元数据管理系统:该系统是自主实现国产o l a p 服务器 d mo l a p 项目中的一部分。而国产o l a p 服务器d m _ o l a p 项目又是国家科技攻 关计划一科技信息决策支持系统的研究与开发的核心部分。该系统采用的元模型是进行 了一些扩展的c w m 模型。各工具的共享元数据经c w m 建模导入到中心元数据库中。 并以统一地对c w m 模型进行管理方式的方式来进行元数据的管理【”j 。 r e p o s i t o r y :由m i c r o s o f t 和p l a t i n u m 开发,是面向整个企业的集中式元数据管理系 统。 还有众多的数据仓库的厂商提供的数据仓库解决方案中都有各自的元数据管理工 具。如:i b m 公司的v i s u a lw a r e h o u s e ( v w ) 、s y b a s e 提供的w a r e h o u s es t u d i o 、s y b a s e i o 中的w a r e h o u s ec o n t r o lc e n t e r 、s a s 公司的s a s w a ( w a r e h o u s e a d m i n i s t r a t o r ) 、 p 1 a t i n 啪t e c h n o l o g y 公司的d e c i s i o n b a s e 、i n f o r m a t i c a 公司的s u p e r g l u e 等等。 二、知识管理领域 在知识管理领域中已开发并付诸使用的元数据种类繁多。其中,d u c l i nc o r e ( d c 元数据) 与m a r c 是目前发展比较成熟的两种元数据标准,并且在图书情报界及网络 得到广泛的认可【1 6 1 。知识管理领域中的这两种元数据已经作为两种常用的元数据标准。 1 d c 元数据 是由o c l c ( o l i n ec o m p u t e rl i b r a r yc e n t e r ) 和n c s a ( n a t i o n a l c e n t e rf o r 4 大庆石油学院硕士研究生学位论文 s u p e r c o m p u t i n g a p p l i c a t i o n s ) 联合于1 9 9 5 年3 月在俄亥俄的都柏林召开了会议时,产生 的个精简的元数据集都柏林核心元素集( d u b l i nc o r ee 1 e m e n ts e t ) 。 2 m a r c m a r c ( m a c h i n e r e a d a b l ec a t a l o g i n g ,机器可读目录) 从2 0 世纪6 0 年代开始由美国国 会图形馆研究开发,进入7 0 年代,被接收为国际标准。到9 0 年代后期改名为m a r c 2 1 。 它是一种复杂格式的元数据,具有严格的语义和完整的信息描述手段,是专供图书馆界 专业从事文献分编工作的研究馆员们使用的。 这种元数据标准较为常用,也有一些厂商开发一些元数据应用的产品,如书同文公 司开发的一整套数字化系统。 三、地理信息系统领域 地理空间数据对于地区、国家以至全球的经济增长、保持环境质量与稳定并推动社 会进步有十分显著的作用。对空间信息的获取、共享及有效使用带来的巨大经济和社会 效益也是世界各国共同关心的,政治家更是用战略眼光看待这一问题。地理信息标准化 对推动地理信息产业发展、加快地理信息产品生产和应用、建设国家空间数据基础设施 和构建“数字地球”均具有重要意义。这一领域的元数据的标准的建设也较早受到了重 视,目前已形成了各级标准,得到不同的应用。 1 c s d g m 由f g d c ( f e d e r a lg e o g r a p h i cd a t a c o m m i t t e e ,联邦地理数据委员会) 于1 9 9 4 年8 月发布第一版c s d g m 。此后,联邦政府内外的许多单位根据1 2 9 0 6 号总统令的要求, 从1 9 9 5 年开始执行这一标准,并利用自动索引和服务机制,为用户提供通过因特网访 问其数据库的服务。f g d c 于1 9 9 7 年完成了第二版c s d g m 。加拿大、印度等国已等 同采用c s d g m ,作为各自的国家标准。 2 i s o1 9 11 5 :2 0 0 3 由国际标准化组织于2 0 0 3 年发布的地理信息元数据标准。 3 中国的地理信息元数据 由国家基础地理信息中心负责起草的国家标准地理信息元数据2 0 0 4 年9 月3 r 在北京通过了专家审查。这个标准的制定参照了前面两个标准,并结合了中国的实际, 是中国的地理信息系统的元数据的国家标准。 1 2 4 存在问题 虽然,针对领域的元数据管理系统已经很多,并且部分产品的功能也相当完善,但 问题仍然很多: 、架构刁i 够先进 目前各种元数据管理系统其软件架构基本上都是c s ,而较少是b s 的。c s 结 构的程序是针对性开发,变更不够灵活,维护和管理的难度较大。通常只局限于小型局 域网,不利于扩展。并且,由于该结构的每台客户机都需要安装相应的客户端程序,分 布功能弱且兼容性差,不能实现快速部署安装和配置,因此缺少通用性,具有较大的局 限性。而b s 结构采用三层客户服务器结构,在数据管理层( s e r v e r ) 和用户界面层 ( c l i e n t ) 增加了一层结构,使整个体系结构成为三层。这种三层结构在层与层之涮相互独 立,任何一层的改变不会影响其它层的功能。随着w i n d o w s 将浏览器技术植入操作系 统内部,这种结构已成为当今应用软件的首选体系结构。显然b s 结构应用程序相对 于传统的c s 结构应用程序是一个非常大的进步。b s 结构的主要特点是分布性强、 维护方便、开发简单且共享性强、总体拥有成本低。 二、只针对特定领域,不支持扩展 闷前已开发的元数据管理系统基本上都是针对特定领域进行开发的。目前还没有一 种能够实现多领域的元数掘进行管理的软件系统,即一种通用的元数据管理系统。也就 是说,如果存在多个领域的元数据需要管理,那么就需要多次丌发元数据管理系统,并 且对新增的领域元数据不能提供自动提供扩展。 三、针对特定的数据库产品或数据格式 众多的元数据管理系统,大多数与具体的数据库实现相关的。这些元数据管理系统 针对某种数据库产品,一旦具体的数据库实现发生了改变,该系统就要进行修改,而不 支持其变更。 四、发展不平衡 由前面的介绍也可以看到,各个领域的元数据管理系统发展很不平衡,有些领域的 元数据管理产品相当成熟,比如数据仓库领域,有众多的成熟的产品,主要原因是由于 数据库厂商的积极参与。而在某些领域则发展较为缓慢,这种发展的不平衡也将使元数 据管理系统不能最大限度地发挥作用。 1 3 本课题研究内容 以模型驱动思想为基础的软件系统通过动态地读取模型来实现其业务功能。而对软 件系统提供支持的软件平台首先要设计出各类元模型来实现对不同类型的模型的描述。 软件系统对业务数据处理的方式有数据的采集、数据的存储、数据的表现、数据的转换 等。其元数据管理计算机技术的高速发展和企业内及企业间的信息管理的需求,使元数 据管理成为必需。而软件平台中的众多模块必须要实现其自身的元数据管理,则各模块 的工作重复且其可其维护任务加重,并且不能对新的元模型中的元数据进行管理,其可 扩展性差。如果将元数据管理作为一个通用模块提供各类元模型的元数据管理功能,则 可避免这些缺点。o m g 组织提出的改变整个软件开发方式的m d a 框架,为元数据管 理提供了一个新的思路。本课题提出一种基于元元模型的元数据管理框架,在元元模型 层上对各类元模型进行统一描述,在此基础之上,实现对元数据的统一访问接口。按主 题对元数据进行动态分类,完成对元数据的多维管理。 本论文研究内容的重点是: f 1 ) n 定元模型描述规范。 ( 2 ) 设计可以描述各类元模型的统一的元元模型。 ( 3 ) 设计从多维角度描述元数据的维度和主题元模型。 f 4 ) 提出一个基于元元模型的元数据管理框架。 ( 5 ) 实现对元数据的多维访问。 ( 6 1 以统一的元元模型为基础,实现基于数据模型驱动技术的元数据存取接口。 各类元模型从语义到结构都千差万别,采用一种无所不包的范型实现对所有模型的 描述是不可能实现的,早期对这方面的实验都以失败告终。基于模型驱动的元数据管理 技术,以完备、规范的元元模型为基础,为软件平台的各功能模块提供统一的元数据访 问接口。通过统一的元元模型对各类元模型进行建模,而不要求各类元模型语义、结构 的一致,这种方式使众多领域内的元模型及其元数据可以以统一的方式进行访问及管 大庆石油学院硕上研究生学位论文 理,不需要功能模块自身去实现自己的元数据管理功能模块。而以何种统一的方式去实 现对各类元数据的访问是本课题的研究重点之一。 基于模型驱动的元数据管理技术,可以实现业务建模和系统实现技术分离。从而提 高软件生产效率和质量,提高整个系统的可维护性、可扩展性,在实际业务不断地完善 的过程中实现快速调整。同时通过描述软件系统中不同层次中的元模型,实现软件系统 不同层次的各种应用的集成。 1 4 本文的组织方式 本论文共分为四章。第一章概述部分,介绍元数据管理产生的背景,相应技术的 发展现状和特点;在m d a 的思想上,阐明本论文的研究内容。第二章集中介绍模型驱 动体系结构、基于模型驱动的开发方式及其优点,并且讨论了如何进行基于模型驱动的 应用开发,以及设计和开发时涉及到并应解决的问题。第三章介绍了系统实现中涉及到 的相关技术。第四章给出了元模型描述规范以及统一的元元模型的设计。第五章给出了 个元数据管理的管理策略,并且提出了基于元模型的元数据管理框架。第六章元数据 管理框架的实现。包括了元元模型的设计原则及具体实现,以及多维元数据管理模块的 实现。总结与展望部分,总结所取得的研究成果,对下一步的工作进行展望。 1 5 本章小结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论