(计算机应用技术专业论文)面向语义网格的数据集成关键技术研究.pdf_第1页
(计算机应用技术专业论文)面向语义网格的数据集成关键技术研究.pdf_第2页
(计算机应用技术专业论文)面向语义网格的数据集成关键技术研究.pdf_第3页
(计算机应用技术专业论文)面向语义网格的数据集成关键技术研究.pdf_第4页
(计算机应用技术专业论文)面向语义网格的数据集成关键技术研究.pdf_第5页
已阅读5页,还剩142页未读 继续免费阅读

(计算机应用技术专业论文)面向语义网格的数据集成关键技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

:,7 曩,二( 、j 独创性声明 1 1 1 1 1 1 111 1 1 1i i i ii iiiii1 y 17 8 918 8 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽 我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的 研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 签名移 魄迎z ! 三:丛 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交 论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影 印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 日期2 翌仝:兰:! 摘要 摘要 随着信息技术的不断发展,不断产生的具有分布、异构、海量等特征的数 据源对存储资源、计算资源和网络资源等提出了极高的性能需求,也为以往的 数据资源管理技术带来了巨大的挑战。如何管理和使用这些数据资源并进行数 据集成访问,进而推动科学领域的研究,是当前迫切需要解决的问题。 语义网格作为一种基于语义的分布式计算技术,建立在语义w 曲及网格计 算相关技术规范基础之上,通过规范化的语义来描述网格资源,通过丌发有序 的管理架构来解决和实现复杂网格环境下大规模资源共享与协同计算。本文在 对语义网格的研究背景、发展历程和相关技术做了较为深入的研究基础上,以 资源共享和协同工作为目标,从概念集成、模式集成、实例集成和查询应用四 个不同阶段对网格资源集成访问时遇到的语义异构问题进行了分析和探讨,从 面向语义网格的数据集成体系架构、面向语义网格的本体模型、分命式本体集 成框架、语义网格服务流程管理以及数据集成中的查询优化5 个方面具体展开 研究,主要内容包括: ( 1 ) 面向语义网格的数据集成体系结构 本文讨论了语义网格环境中,在概念集成、模式集成、实例集成和查询应 用四个阶段面临的语义异构问题,利用现有网格数据资源,基于现有的网格计 算、w e b 服务和语义w e b 的相关规范和技术基础之上( 比如,采用语义w e b 的相关规范对数据语义、流程语义等进行描述和建模;采用o g s a d a i 等网格 体系架构规范对网格内的分布式数据资源进行管理;采用w e b 服务相关规范实 现服务流程组合) ,给出了面向语义网格的数据集成应用的一种通用结构,给出 了网格资源在数据集成中涉及到的关键业务流程,并对涉及到的关键技术进行 了具体说明,并将其应用于结构工程网格环境中。 ( 2 ) 面向语义网格的本体建模方法 本体技术已经广泛应用于语义网格环境中,目前关于本体技术的研究主要 侧重于理论层面和静态数据的语义表示,对网格计算领域内具有动念性等特征 的网格资源在实现数据集成过程中面临的语义表示的研究很少涉及。本文针对 此种现象,在对现有的本体建模方法进行了改进和扩展,提出了一个语义网格 环境下的本体模型,对该本体模型进行层次划分的基础上分析各层之间的关系, 同时基于u m l 规范对每一层的具体情况进行了阐述。并结合结构工程领域知 识,将结构工程实验内容总结为构件、加载和观测三方面,并对各部分含义进 行了详细的解释,依据结构工程实验需求对结构工程实验的参与角色进行了划 分,在印证该模型有效性的同时,根据该模型设计结构工程实验本体。 北京一i - j k 人学t 学博十学佗论文 ( 3 ) 分布式本体集成框架 如何有效组织和管理语义网格环境中存在的各类分布异构的小本体是数据 集成研究领域面临的新问题,本文提出了一种分布式本体集成框架,从体系结 构角度研究在实现分布式本体集成过程中涉及到的功能层次划分以及关键组 件。同时,考虑在语义网格环境中,为了更好地提高计算资源的利用率、更好 地满足用户需求,本文在分布式集成框架基础上提出虚拟本体的概念,同时提 出和设计了虚拟本体的构造算法v o s d g a ,通过仿真验证,证明该算法在一定 条件下可以提高计算资源利用率,从而提高分布式本体集成框架的效能。 ( 4 ) 语义网格服务流程管理研究 服务流程管理技术作为语义网格中的一个重要内容,已经成为了解决语义 网格的组织内部或者组织之间过程集成的有效手段,特别是基于工作流技术的 语义服务组合已经成为当今的研究热点。为了更好地在语义层实现数据集成, 本文从体系结构及流程管理两个方面重点研究服务流程管理中涉及的相关问 题,提出了一个基于工作流的服务流程管理框架,并通过建立语义网格服务三 层结构,在网格服务和语义服务引入代理服务层,实现网格工作流和语义工作 流的无缝连接,接着对服务注册进行了设计和实现,然后提出了基于q o s 的语 义工作流协商协议,支持语义工作流用户和语义工作流服务提供者之问能够就 服务质量问题进行协商,从而更好地满足最终用户的要求。 ( 5 ) 数据集成中的查询优化 针对查询处理过程中由于多连接操作所产生的优化问题,本文在研究了粒 子群优化算法的基础上,结合免疫系统中相关的信息处理机制实现,提出了改 进的免疫粒子群优化算法a i p s o 查询优化算法。通过仿真实验证明,该算法 有效的提高了查询连接性能。 关键词数据集成;语义网格:本体;服务流程:查询优化 a b s t r a c t a b s t r a c t w i t ht h ed e v e l o p m e n to fi n f o r m a t i o nt e c h n o l o g y , t h ee m e r g i n gl a r g ea m o u n to fd i s t r i b u t e d a n dh e t e r o g e n e o u sd a t as o u r c e sb r i n ga b o u ta ne x t r e m e l yh i g hd e m a n df o rs t o r a g e c a p a c i t y , c o m p u t i n ge f f i c i e n c ya n dn e t w o r kp e r f o r m a n c e ;m e a n w h i l e ,t h e s ed a t aa l s om a k ee f f e c t i v ed a t a m a n a g e m e n tag r e a tc h a l l e n g e t h e r e f o r e ,i ti sa nu r g e n tp r o b l e mt om a n a g ea n du s et h e s ed a t a f o ri n t e g r a t e da c c e s s ,w h i c hw i l lh e l pt op u s hf o r w a r ds c i e n t i f i cr e s e a r c h e s s e m a n t i cg r i di sak i n do fd i s t r i b u t e dc o m p u t i n gt e c h n o l o g yb a s e do ns e m a n t i c ,w h i c hh a s b e e ne s t a b l i s h e da c c o r d i n gt ot h es p e c i f i c a t i o n so fs e m a n t i cw e ba n dg r i dc o m p u t i n g i n s e m a n t i c 鲥d ,n o to n l yg r i dr e s o u r c e sa r ed e s c r i b e dt h r o u g hs t a n d a r d i z e ds e m a n t i c ,b u ta l s o l a r g e s c a l er e s o u r c es h a r i n ga n dc o l l a b o r a t i v ec o m p u t i n gu n d e rc o m p l e xn e t w o r ke n v i r o n m e n t a r er e a l i z e dt h r o u g hd e v e l o p i n go r d e r e dm a n a g e m e n tf r a m e w o r k i nt h i sw o r k ,w ef i r s tr e v i e w e d t h eb a c k g r o u n d ,d e v e l o p i n gp r o c e s sa n dr e l a t e dt e c h n o l o g yo fs e m a n t i cg r i d f r o mt h i sp o i n t , w i t ht h ea i mo fr e s o u r c es h a r i n ga n dc o l l a b o r a t i v ew o r k ,w ea n a l y z e da n dd i s c u s s e dt h e p r o b l e m so f s e m a n t i ch e t e r o g e n e i t yi nt h ep r o c e s so fg r i dr e s o u r c ea c c e s s i n gd u r i n gt h ef o u r d i f f e r e n tp h a s e s ( c o n c e p t i o ni n t e g r a t i o n ,s c h e m ai n t e g r a t i o n ,i n s t a n c ei n t e g r a t i o na n dq u e r y a p p i c a t i o n ) f u r t h e r m o r e ,5a s p e c t so fi n v e s t i g a t i o n sw e r ea c h i e v e d ,w h i c hi n c l u d es e m a n t i cg r i d o r i e n t e dd a t ai n t e g r a t i o ni n f r a s t r u c t u r e ,s e m a n t i c 酣do r i e n t e do n t o l o g ym o d e l ,d i s t r i b u t e d o n t o l o g yi n t e g r a t i o nf r a m e w o r k ,p r o c e s sm a n a g e m e n to fs e m a n t i c 鲥ds e r v i c e ,a n dq u e r y o p t i m i z a t i o no fd a t ai n t e g r a t i o n t h ed e t a i l so ft h e5a s p e c t so fr e s e a r c h e sa r ea sf o l l o w i n g ( 1 ) s e m a n t i c 鲥d o r i e n t e dd a t ai n t e g r a t i o ni n f r a s t r u c t u r e p r o b l e m so fs e m a n t i ch e t e r o g e n e i t yi nt h ep r o c e s so fg r i dr e s o u r c ea c c e s s i n gd u r i n gf o u r d i s p e r s ep h a s e sw e r ed i s c u s s e du n d e rs e m a n t i cg r i de n v i r o n m e n t l e v e r a g i n gc u r r e n tg r i dd a t a r e s o u r c e ,r e l a t e ds p e c i f i c a t i o na n dt e c h n o l o g yo fg r i dc o m p u t i n g ,w e bs e r v i c e ,a n ds e m a n t i cw e b ( e g d e s c r i p t i o na n dm o d e l i n go fd a t as e m a n t i ca n dp r o c e s ss e m a n t i cb ym e a n so fs e m a n t i cw e b r e l a t e ds p e c i f i c a t i o n ,m a n a g e m e n to fd i s t r i b u t e dd a t ar e s o u r c ei nt h e 鲥di nu s eo f 鲥d i n f r a s t r u c t u r es p e c i f i c a t i o ns u c ha so g s a d a i ,s e r v i c ep r o c e s sc o m b i n a t i o na c c o r d i n gt ow e b s e r v i c er e l a t e ds p e c i f i c a t i o n ) ,as e m a n t i co r i e n t e dd a t ai n t e g r a t i o ni n f r a s t r u c t u r ew a sp u tf o r w a r d , m e a n w h i l e ,k e yb u s i n e s sp r o c e s s e sd u r i n gd a t ai n t e g r a t i o nw e r ei n d i c a t e d ,a n dc o r et e c h n o l o g i e s w e r ed i s c u s s e di nd e t a i l ( 2 ) s e m a n t i c 酣do r i e n t e do n t o l o g ym o d e l i n g a g a i n s tt h es e m a n t i cd e m o n s t r a t i o np r o b l e md u r i n gg r i dr e s o u r c ei n t e g r a t i o nu n d e r s e m a n t i cg r i de n v i r o n m e n tt h a tm a i n l yf o c u s e do nt h es e m a n t i cr e p r e s e n t a t i o ni ns t a t i cd a t a ,a n i m p r o v e ds e m a n t i cw e b o r i e n t e do n t o l o g ym o d e lw a sp r o p o s e d o nt h eb a s i so fo n t o l o g ym o d e l s t r a t i f i c a t i o n ,r e l a t i o n s h i pb e t w e e nd i f f e r e n tl a y e r sw a sa n a l y z e d ,a n de a c hl a y e rw a sf u r t h e r d i s c u s s e da c c o r d i n gt ou m ls p e c i f i c a t i o n t h em o d e li m p r o v e e da n de x p a n d e de x i s t i n g o n t o l o g ym o d e l i n ga p p r o a c h e s ;w h a t sm o r e ,w i t hk n o w l e d g eo fs t r u c t u r a le n g i n e e r i n g ,b a s e do n s t r u c t u r a le n g i n e e r i n ge x p e r i m e n to n t o l o g yd e s i g n e di n t h i sm o d e l ,r e l a t e dk n o w l e d g ew a s 北京t 业大学t 学博十学位论文 d e f i n e da n di n d i c a t e di nd e t a i l ,a n df i n a l l y , l a y e r sw e r es t r a t i f i e da c c o r d i n gt ot h er o l e si n s t r u c t u r a le n g i n e e r i n ge x p e r i m e n t ( 3 ) d i s t r i b u t e do n t o l o g yi n t e g r a t i o nf r a m e w o r k e f f e c t i v eo r g a n i z a t i o na n dm a n a g e m e n to fd i s t r i b u t e do n t o l o g yb r i n g sa b o u tm a n yn e w p r o b l e m s a g a i n s tt h i so c c u r r e n c e ,ad i s t r i b u t e do n t o l o g yi n t e g r a t i o nf r a m e w o r k ( d o i f ) w a s p r o p o s e d ,i nw h i c h ,f r o mt h ea s p e c t o fi n f r a s t r u c t u r e ,f u n c t i o nl e v e ls t r a t i f i c a t i o na n dk e y c o m p o n e n t si n v o l v e di nt h ep r o c e s so fr e a l i z i n gd i s t r i b u t e do n t o l o g yi n t e g r a t i o nw e r es t u d i e d a t t h es a m et i m e ,i no r d e rt oe n h a n c et h eu t i l i z a t i o no fc o m p u t i n gr e s o u r c e s ,a n db e t t e rm e e tu s e r s r e q u i r e m e n t si ns e m a n t i c 鲥d ,c o n c e p to fv i r t u a lo n t o l o g yw a sd e f i n e do nt h eb a s i so fd i s t r i b u t e d i n t e g r a t i o nf r a m e w o r k ,a n dac o n s t r u c t i o na l g o r i t h mo fv i r t u a lo n t o l o g yv o s d g aw a s i m p l e m e n t e d ;w h a t sm o r e ,t h r o u g hs i m u l a t i o n ,i tw a sf o u n dt h a tt h ea l g o r i t h mc a ne n h a n c et h e u t i l i z a t i o no fc o m p u t i n gr e s o u r c e su n d e rp a r t i c u l a rc i r c u m s t a n c e s ,t h u sc a n i m p r o v et h e e f f i c i e n c yo ft h ed i s t r i b u t e do n t o l o g yi n t e g r a t i o nf r a m e w o r k ( 4 ) r e s e a r c ho ns e m a n t i cg r i ds e r v i c ef l o wm a n a g e m e n t a sa ni m p o r t a n tp a r to fs e m a n t i cw e b ,s e r v i c ef l o wm a n a g e m e n th a sb e e na ne f f e c t i v e m e a s u r et o p r o c e s si n t e g r a t i o nw i t h i na s e m a n t i cw e bo rb e t w e e nd i f f e r e n t o r g a n i z a t i o n s p a r t i c u l a r l y , s e m a n t i cw e bs e r v i c ec o m b i n a t i o nb a s e do nw o r k f l o wh a sb e c o m eah o t s p o t c u r r e n t l y t ob e a e rr e a l i z ed a t ai n t e g r a t i o ni nt h es e m a n t i cl a y e r r e l a t e dp r o b l e m si n v o l v e di n s e r v i c ef l o wm a n a g e m e n tw e r em a i n l ys t u d i e df r o mt w oa e s p e c t s ,o n ew a si n f r a s t r u c t u r e ,t h e o t h e rw a sf l o wm a n a g e m e n t ;t h e n ,as e r v i c ef l o wm a n a g e m e n tf r a m e w o r kb a s e do nw o r k f l o w w a se s t a b l i s h e d m o r e o v e r , t h r o u g hb u i l d i n gu pt h et h r e e - l a y e rs t r u c t u r eo fs e m a n t i cw e b ,a g e n t s e r v i c el a y e rw a si n t r o d u c e di n t og r i ds e r v i c ea n ds e m a n t i cs e r v i c e ,s oa st or e a l i z es e a m l e s sl i n k b e t w e e ng r i dw o r k f l o wa n ds e m a n t i cg r i dw o r k f l o w a f t e rt h a t ,s e r v i c er e g i s t r a t i o nw a sd e s i g n e d a n di m p l e m e n t e d ,a n das e m a n t i cw o r k f l o wn e g o t i a t i o np r o t o c o lb a s e do nq o sw a sp u tf o r w a r d , b ym e a n so fw h i c h ,s e m a n t i cw o r k f l o wu s e r sa n ds e m a n t i cw o r k f l o ws e r v i c ep r o v i d e r sc a n n e g o t i a t ea b o u ts e r v i c eq u a l i t y , a sar e s u l t ,u s e rr e q u i r e m e n t sc a nb eb e t t e rm e t ( 5 ) q u e r yp r o c e s sa n dq u e r yo p t i m i z a t i o ni nd a t ai n t e g r a t i o n t os o l v et h eo p t i m i z a t i o np r o b l e mc a u s e db ym u l t i c o n n e c t i o nm a n i p u l a t i o nw h i l eq u e r y i n g , a na d v a n c e di m m u n ep a r t i c l es w a r mo p t i m i z a t i o na l g o r i t h m ( a i p s o ) w a sp u tf o r w a r db a s e d o np a r t i c l es w a r mo p t i m i z a t i o na n di m m u n eo p t i m i z a t i o na l g o r i t h m s t h r o u g ht h es i m u l a t i o n , a i p s oc a ne f f i c i e n t l ye n h a n c et h ep e r f o r m a n c eo fq u e r yj o i n i n g k e y w o r d s :d a t ai n t e g r a t i o n ,s e m a n t i cw e b ,o n t o l o g y , s e r v i c ef l o w , q u e r yo p t i m i z a t i o n 目录 i i n l i 一, i i 曼詈詈皇 目录 摘要i a b s t r a c t i 第1 章绪论1 1 1 研究背景l 1 2 语义网格在数据集成时面临的挑战2 l3 语义网格相关技术发展现状6 1 3 1 语义w e b 6 1 3 2 网格计算7 1 3 3 语义网格8 1 4 数据集成相关研究1 l 1 4 1 数据集成逻辑框架1 1 1 4 2 数据集成方案介绍1 3 1 4 3 数据集成方法对比1 5 1 4 4 本文关注的数据集成研究内容1 6 1 5 本文主要研究内容及创新点1 9 1 6 本文结构2 l 第2 章面向语义网格的数据集成体系结构2 3 2 1 引言2 3 2 2 面向语义网格的数据集成需求描述2 3 2 3 面向语义网格的数据集成体系结构2 4 2 3 1 面向语义网格的数据集成体系结构2 5 2 3 2 面向语义网格的数据集成中关键流程设计2 7 2 3 4 该体系结构的关键技术要点3 0 2 4 本章小结3 0 第3 章面向语义网格的数据集成中的语义表示3 1 3 1 引言3 l 3 2 相关研究3 2 3 3 本体论概述3 3 3 3 1 本体建模的相关准则3 3 3 3 2 本体的建模原语3 3 3 3 3 本体建模流程3 4 3 3 4 本体建模语言o w l ( w e bo n t o l o g yl a n g u a g e ) 概述3 5 3 4 面向语义网格的本体模型3 6 3 4 1 面向语义网格的本体模型3 6 3 4 2 面向语义网格的本体建模方法的实现3 7 3 4 3 本体建模方法对比4 3 3 5 应用实例:结构工程实验本体的设计与实现4 4 3 5 1 结构工程实验背景分析4 4 3 5 2 结构工程实验相关本体库的建立4 7 3 6 本章小结5 0 第4 章分布式本体集成框架5 1 4 1 引言5 1 4 2 相关研究5 2 北京工业大学工学博士学位论文 4 3 分布式本体集成框架5 3 4 4 网格节点的设计5 5 4 4 1 网格节点的服务选择模块5 7 4 4 2 网格节点的知识缓存模块5 8 4 5 全局本体与局部本体的映射5 9 4 5 1 相关定义5 9 4 5 2 实例分析6 0 4 6 虚拟本体的构造6 6 4 6 1 虚拟本体构造算法的基础步骤6 6 4 6 2 虚拟本体的基本算子6 7 4 6 3 虚拟本体的评分机制6 8 4 6 4 虚拟本体集合动态生成算法详细描述6 9 4 6 5 仿真设计与结果模拟7 1 4 7 本章小结7 2 第5 章语义网格服务流程管理7 3 5 1 引言7 3 5 2 相关研究7 4 5 3 基于工作流的语义网格服务流程管理模型7 5 5 4 语义服务注册的设计与实现7 8 5 4 1 语义服务注册概述7 8 5 4 2 服务注册流程7 9 5 4 3 语义服务注册中心的设计实现8 0 5 5 语义网格工作流的创建8 2 5 5 1 网格服务的设计与实现8 3 5 5 2 中间层w e b 服务代理的设计与实现8 4 5 5 3 语义网格服务的设计与语义网格工作流的创建8 5 5 6 语义工作流协商模型8 8 5 6 1 服务质量体系8 8 5 6 。2 语义工作流协商协议的设计9 0 5 7 应用实例9 6 5 8 本章小结9 7 第6 章数据集成中查询优化的研究9 9 6 1 引言9 9 6 2 相关研究1 0 0 6 3 数据集成过程中的查询处理1 0 1 6 3 1 面向数据集成的查询处理体系结构1 0 1 6 3 2 查询处理具体流程1 0 2 6 3 3 查询分解1 0 3 6 4 查询优化问题建模1 0 5 6 4 1 查询优化问题分析1 0 5 6 4 2 局部本体中子查询的影响连接代价的因素1 0 6 6 5 基于改进的粒子群算法的查询优化1 0 8 6 5 1 粒子群算法概述1 0 8 6 5 2 粒子群算法描述1 0 9 t 目录 6 5 3 改进的免疫一粒子群优化算法1 1 4 6 5 4 实验结果及分析1 1 7 6 6 本章小结1 1 9 结论1 2 1 主要研究成果1 2 1 下一步工作1 2 2 参考文献1 2 3 攻读博士学位期间取得的研究成果1 3 3 致询i 1 3 5 北京工业大学工学博士学位论文 第1 章绪论 1 1 研究背景 第1 章绪论 随着信息技术、模拟技术和传感器技术不断发展,在许多研究领域所产生 的数据量正在呈现爆炸性的增长,其中既包括结构化的数据,如关系数据库, 半结构化的数据如x m l 、文本文件等,也包括非结构化的数据,如音频、视频 文件等。这些数据的典型特征是广泛分布、深度异构、分散自治,对存储资源、 计算资源和网络资源等都提出了极高的性能需求,为以往的数据资源管理技术 带来了巨大的挑战。如何管理和使用这些数据资源,并进行数据集成,进而推 动科学领域的研究,是当前迫切需要解决的问题。 网格计算( g r i dt e c h n o l o g y ) 这个概念于2 0 世纪9 0 年代被提出,它的目 标是将各种分散的且隶属于不同组织的计算和数据资源有机的结合起来,形成 一个虚拟组织,从而实现组织内各种异构资源的透明共享和高效的人机协同工 作【l 】。但是,现有网格上存在数据格式异构、数据语义的多重性以及数据关系 匮乏和非统一等问题,无法满足原先设想的网格应具有高度简单实用和无缝自 动化的需求,制约了网格技术的在研究领域的高层次应用。鉴于此种情况,英 国的e s c i e n c e 计划于2 0 0 2 年提出结合语义w 曲技术和网格技术,构建语义网 格【2 】,它的目标就是通过结合知识工程和人工智能等相关领域取得的研究成果, 扩展传统的网格基础设施,通过语义表达和知识表示等方式精确描述网格环境 内的各类资源,从更高的层次上满足网格环境内的资源共享和协同工作等要求。 为了实现这个目标,语义网格至少需要实现以下两方面功能: ( 1 ) 实现语义网格环境内分布、异构数据资源的语义互联互通,支持网 格资源共享 ( 2 ) 实现语义网格环境内不同机构、虚拟组织之间的语义互操作,支持 语义网格用户协同工作。 通过分析可以发现,这两方面功能的实现都需要基于数据集成技术提供支 持。数据集成作为一种通用的技术手段,其核心任务就是将相互关联的分布的 异构数据源进行有效集成,屏蔽它们的分布性和异构性,向用户提供透明、一 致的数据界面和高效、简便的信息服纠3 1 。 但是,目前无论网格计算、语义w e b ,还是语义网格技术仍处于发展阶段, 在技术规范和实施细节等很多方面依然不太成熟;并且语义网格应用范围不断 扩大,网格环境内资源不断增多,异构处理层次需求的不断深化( 从原先的数 据层到信息层,再到现在的语义层【4 】) ,这些都对如何应用数据集成技术实现 磨 。 北京一i :业大学t 学博十学位论文 语义网格环境内资源共享与协同工作提出了更高的要求。 以数据共享和集成为目标,研究者们在数据集成领域已经取得很多研究成 果,基于多数据库的集成、基于数据仓库的集成、基于应用的集成、基于模型 的集成、基于语义的数据集成等方案被先后提出,但是由于集成需求的不断深 入,并且其所涉及领域中总有新的技术与之结合,所以仍有大量的问题期待人 们解决。近十几年关于数据集成的研究从未停止过。分布、异构的数据源所带 来的不同层次的异构屏蔽、数据冲突、数据处理、查询处理等,始终是数据集 成领域的研究热点问题。尤其是在语义网格环境下,面向语义应用所产生的各 类问题,更成为近年来语义网格研究的热点。本文研究面向语义网格的数据集 成关键技术,就是以语义网格环境下各类资源的语义异构所带来的问题为主线, 从面向语义网格的数据集成体系架构、面向语义网格的本体模型、分布式本体 集成框架、语义网格服务流程管理以及关于分布式本体数据的查询连接优化5 个方面具体展开研究。 1 2 语义网格在数据集成时面临的挑战 随着语义网格应用的不断深入,研究人员对语义网格环境内的数据集成的 需求不再局限于仅仅满足分布异构的网格数据资源的透明访问,而是希望这些 分布异构的数据资源能够通过语义表达和知识表示等方式被精确描述出来提供 给最终用户,满足其特定的语义需求。但是由于历史遗留原因和技术本身的不 完善,在数据集成过程中将面临一些问题,主要包括: 1 ) 领域数据存在孤岛现象 由于早期数据化建设过程中,系统大多彼此独立设计,而且其技术实现手 段不尽相同,这就导致不同系统对数据的描述方式干差力别,数据的存储环境 也具有很大差异。另外,大量的异构数据环境是独立设计彼此分离的,难以直 接沟通,使得“数据孤岛现象普遍存在,且随着数据化进程的不断深入和数 据资源的不断积累,旧的“数据孤岛”尚未全部连通,新的“数据孤岛”又在 建设,大量的遗留系统的持续增加,如何减少“数据孤岛”,充分利用已有的数 据资源,逐渐成为各行业数据化建设急需解决的共同问题。并且数据孤岛现象 必然导致领域数据资源过分闲置,导致数据查询和知识发现等高层次应用无法 开展。 2 ) 领域术语标准缺失 实现数据集成的前提是:用标准化的领域术语来描述的全局本体库和各个 数据库具有一致的数据质量评估标准和维护策略【5 】。但是任何一个学科领域都 在不断演化发展,造成了领域术语的多样化,虽然相关的领域不断出台标准和 设计规范,但是仍不能满足数据化过程中的实际需求,且现存的数据管理系统 2 第1 章绪论 很少是按照这些标准来设计编制,对已建成的数据系统进行集成和共享是一件 非常困难的事,从而限制了数据挖掘和知识发现等各种高层应用的发展。 3 ) 领域数据存在质量缺陷 建立领域数据化建设的目标是从海量数据中找到新的方法和规则,支持学 科的持续化发展。但是由于数据使用程度较低,且存在体制上的约束,造成大 量数据不能够满足科学研究要求,不符合知识发现的需要,直接导致无法建立 实用的知识发现和决策平台。 4 ) 本体数据的不匹配引起的语义异构问题 本体能够解决特定应用中的知识共享问题。但是,事实上不可能构建出一 个全方位覆盖的统一本体,这不仅是因为世界知识的无限性决定构建这样的本 体存在工程上难以实施,更重要的是由于本体构建所具有的主观性和分布式的 特点,决定了这种统一本体的构建无法得到一致的认可【6 】。并且,过于庞大的 本体也往往难以维护和使用。实际中,不同的用户和团体根据不同的应用需求 和应用领域来构建或选择合适的本体。这样一来,即使在同一个领域内也往往 存在着大量的本体。这些本体所描述的内容在语义上往往重复或者关联,但在 所使用的本体表示语言和表示模型上却各具差异,文献【_ 卜9 】中针对性地提出本体 之间的不匹配是造成了本体数据异构的主要原因。本文从以下几个方面阐明语 义网格数据管理所要面临的挑战。 本体之间的不匹配是造成本体数据异构的主要原因。本体间不匹配的情形 可被划分为两个层次( 文献【lo 】) :第一个是语言层上的不匹配;第二个是模型层 上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论