(计算机应用技术专业论文)基于swrl推理的语义关联发现及其在本体映射与集成中的应用.pdf_第1页
(计算机应用技术专业论文)基于swrl推理的语义关联发现及其在本体映射与集成中的应用.pdf_第2页
(计算机应用技术专业论文)基于swrl推理的语义关联发现及其在本体映射与集成中的应用.pdf_第3页
(计算机应用技术专业论文)基于swrl推理的语义关联发现及其在本体映射与集成中的应用.pdf_第4页
(计算机应用技术专业论文)基于swrl推理的语义关联发现及其在本体映射与集成中的应用.pdf_第5页
已阅读5页,还剩104页未读 继续免费阅读

(计算机应用技术专业论文)基于swrl推理的语义关联发现及其在本体映射与集成中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江大学博士学位论文 基于s w r l 推理的语义关联发现及其在本体映射与集成中的应用 摘要 构造本体的目的是为了知识共享和重用。然而,语义w e b 由多种信息源组成,每 个信息源都以自身本体的形式表示,由于时间、地点、目的、知识以及构造者的不同, 导致即使对同一问题,本体的构造也会有很大的差异。这必然造成本体之间的冲突, 很难实现真正的共享和重用。为了解决该问题,人们提出了本体映射与集成技术。 本体映射与集成是语义网的两个关键技术,其中,发现本体概念之间的语义关联 至关重要。目前,相似度计算是发现语义关联的重要手段,通过相似度计算对概念间 的相似情况进行评价,推导出概念之间的相似与否,进而实现本体中概念的映射。然 而,不论是根据概念实例计算相似度还是利用启发规则计算相似度,都不能有效地发 现某些隐含的关联关系,甚至,某些关联根本无法从相似度计算中得到,需要人工干 预,具有一定的局限性。 本文提出的基于s w r l 推理的语义关联发现技术一量w r lb a s e ds e m a n t i c r e l e v a n t d i s c o v e r y ( 简称s s r d ) 是基于s w r l 中的o w l 语法,在推理过程中,将语 义网规则语言s w r l 和推理引擎j e s s 结合起来,通过建立规则和进行逻辑推理,能够 有效发现本体之间隐含的语义关联。该研究对语义映射中相似度计算进行了很好的补 充,是一种完善本体语义映射与集成方法的新尝试。 s s r d 参考了c h r i s t i n eg o l b r e i c h 关于家庭成员的关系模型,从中截取了模型中部 分类和相关的部分属性,重新构建了一些核心概念、实例及其相关关系,建立了家庭 本体模型f o ,该模型包含了家庭成员的o w l 本体和由s w r l 定义的成员关系。s s r d 以f o 为实例,展示了通过使用s w r l 和j e s s ,从语法、语义和判断推理上发现本体 概念语义关联的过程,实现本体映射与集成,并完善集成后的本体成员逻辑关系。 论文共七章。内容如下: 第一章从语义w e b 的基本体系结构出发,剖析了在本体推理、映射和集成研究中 存在的诸多问题,对该领域目前研究的总体现状进行了述评,介绍了论文的主要内容 和研究意义,并对论文的主要创新进行了简单归纳。 第二章介绍了本体的定义和构成,以及s h o e 、r d f 、r d f s 、d a m l + o i l 、o w l 等本体表示语言,重点分析了s s r d 系统所选用的基于描述逻辑o w l d l 的语法与语 义构成a 在此基础上,本章使用p r o t 6 酣构建了s s r d 的本体模型f o ,该模型包含了 游江大学游圭学位论丈基予s w r l 箍理鳓语义关联发现及箕在本体臃射与聚成中的成用 家庭成员静0 w l 本俸和幽s w r l 定义的成员关系。 第三章阐述了基于d l 的知识表示与推理方法,介绍丁本体逻辑与推理的相关知 谈,以及如秘对不完全知识避行摧理,着重研究了如留用名称匹配、概念定义、属性 约束来进行推理的方法,并通过一个推理实例展现了整个接理过程。与此同时,零毒 对s s r d 瓣关键技术一一语义霹麓剐语言s w r l 遗行了鞍为洋缨熬解辑,并奔绥了健 是摧耀技术确立语义关联戆方法。 笫函章辩本锌浚射醴及集成豹方法进行了系统概括和总结,并对每种方法的其体 肉容邂行了详细搐述。对s s r d 本体模垒f o 的穰念相似度遴行了计算,并掇出了基于 s w r l 推理的语义关联发现技术。 第五章将s w r l 规则与j e s s 接理弓 擎租结会,设计了s s r d 的总体槎絮,撼避 了实现s s r d 的6 个具体步骤,它们分别是:建立本体模型f o ,测用语义嬲嫂则语嘉 s w r l 为f o 模型设嚣窥测,将本体帮燕掰韵格式转换为维鬻雩| 擎酌攀实津帮麓簧g 露, 将转换蜃救缝果导入接理引擎,掺理萼| 擎送行拦疆产生赣黪本俸结擒,饕爨接理惹产 生静新本体结构。 第六章将s s r d 推理液精于本体映射与繁成,罐出了使甩s w r l ,j e s s ,r a c e r 实现 本体映射与集成的舆体步骤和过程,包括本体的建立、t b o x 和a b o x 的构建、本体的 映瓣与集成、本体一数性检登、查溜簿内容。 第七章作为论文的最磁总结,对来来羹点研究方向靼发鼹翦豢进行了展爨。 美键调:本髅映射;本体榘成;s w r l ;j e s s ;稷似废计算 l i 塑鎏杰堂篓主堂垒蔓亳薹量坠篓墨墼望墨差壁茎堡墨基壅查签墼塾童基蹙主墼蹙旦 a b s t r a c t o n t o l o g yi sb u i l tf o rk n o w l e d g es h a r i n ga n dr e u s e h o w e v e r , t h es e m a n t i cw e b i s c o n s t i t u t e db yav a r i e t yo fi n f o r m a t i o ns o u r c e sa n de a c hs o u r e ee x p r e s s e st h ek n o w l e d g eb y b u i l d i n gi t so w no n t o l o g y + a st h eo n t o l o g i e s a r eb u i l ta td i f f e r e n tt i m ei n d i f f e r e n t e n v i r o n m e n tw i t hd i f f e r e n tp u 驴s ea n db a c k g r o u n d ,e v e nf o rt h es a m ep r o b l e m ,d u et ot h e d i f f e r e n tb u i l d e rw i t ht h e i ro w nk n o w l e d g ea n du n d e r s t a n d i n g i tm a yb ed i v e r s eal o t t h e s e w i l tc a u s ec o n f l i c ta m o n gt h e s eo n t o l o g i e s s oi ti sq u i t ed i f f i c u l tt os h a r et h ei n f o r m a t i o n a m o n gs u c hs o u r c e s ,i no r d e rt os o l y et h ep r o b l e m , s e m a n t i cm a p p i n ga n di n t e g r a t i o ni sp u t f o n 榭d o n t o l o g ym a p p i n ga n di n t e g r a t i o na r et w ok e yt e c h n i cf o rt h es e m a n t i cw e b ,f i n d i n g t h es e m a n t i cr e l a t i o n s h i pa m o n gt h eo n t o l o g yc o n c e p t si sc r u c i a lf o rt h em a p p i n ga n d i n t e g r a t i o n ,c u r r e n t l y , , c o m p u t i n gs i m i l a r i t ya n dr e l e v a n ti s t h em a i na p p r o a c hf o rt h e s e m a n t i ca s s o c i a t i o n b yc o m p u t i n gt h es i m i l a r i t y , i tc a nh e l pt oi n f e rw h i c hc o n c e p t sa m o n g t h e s eo n t o l o g i e sa f es i m i l a ra n dw h i c ha r en o t ,h o w e v e r , n om a t t e rt h es i m i l a r i t yc o m p u t i n g a p p r o a c hi s i n s t a n c e db a s e do rh e u r i s t i cb a s e d , t h e yc a nn o td i s c o v e rs o m ec o n n o t a t i v e r e l a t i o n s h i p ,e v e n 搬o r e ,s o m er e l a t i o n s h i pc a l ln o tb eg o tf r o mt h es i m i l a r i t yc o m p u t i n g a p p r o a e h s oi tu s u a l l yn e e d sm a n u a lw o r k ,i th a si t sl i m i t a t i o n 。 t h i sd i s s e r t a t i o np r o p o s e san e wa p p r o a c h 釜嬲拄b a s e d 塾m a n t i cr e l e v a n td i s c o v e r y , s s r di ns h o r t ) i tc o n c e r n si m p l e m e n t a t i o nw i t hp r o t d g do w lp l u g i nf o rs w r i a e s s , b a s e do i lt h e0 # 旺c o n c r e t es y n t a xo f t h es w r l p r o p o s a l i ti n t e n d st oh e l pr e a s o n i n go w l o n t o l o g i e sw i t hj e s sc o m b i n e dw i t hs w r lr u l e s b ye s t a b l i s h i n gr u l e sa n dr e a s o n i n g l o g i c a l l y , s s r d c a nd i s c o v e rc o n n o t a t i v er e l a t i o n s h i pa m o n gt h eo n t o l o g yc o n c e p t s e f f e c t i v e l y i tm a k e sar e wa t t e m p tf o rt h eo n t o l o g ym a p p i n ga n di n t e g r a t i o na p p r o a c ha n di s ag o o dc o m p l e m e n tf o rt h es i m i l a r i t yc o m p u t i n g a p p r o a c h s s r dr e f e r st ot h e f a m i l y m o d e lf r o mc h r i s t i n e g o l b r e t e h ,d r a wo u t s o m e c l a s s i f i c a t i o na n dr e l e v a n t p r o p e r t i e s ,r e e s t a b l i s hs o m ec o r ec o n c e p t s ,i n s t a n c e sa n d r e l a t i o n s h i p ,s e tu pi t so w nf a m i l yo n t o l o g yf o ,w h i c hi n c l u d e sa no w lo n t o l o g y r e p r e s e n t i n gt h ef a m i l yu s u a lr e l a t i o n s h i p s , a n das w r lr u l eb a s er e p r e s e n t i n gt h e d e p e n d e n c i e sb e t w e e nt h o s er e l a t i o n s h i p s s s r dt a k ef oa sa l le x a m p l et oi l l u s t r a t et h e p r o c e s so f f i n d i n gc o n c e p tr e l a t i o n s h i pb ys w r lr u l e sa n dj e s s ,n o to n l ys y n t a c t i c a l l ya n d s e m a n t i c a l l y , b u ta l s oi n f e r e n c et og e ta l lt h ei n f e r e n c e s h i 浙江大学博士学位论文基于$ w r l 推理的语义关联发现及其在本体映射与集成中的应用 曩蛙sd i s s e r a t i o ni sd i v i d e di n t o4p a r t sc o m p o s e do f 9c h a p t e r s c h a p t e r1i sa l li n t r o d u c t i o n b ya n a l y z i n gt h eb a s i cs t r u c t u r eo ft h es e m a n t i cw e b ,i t s u m l l l a r i z e sa n de x p a t i a t e st h ek e yt e c h n i co fo n t o l o g yr e a s o n i n g , m a p p i n ga n di n t e g r a t i o n b a s e do nt h ec u r r e n tr e s e a r c ha c h i e v e m e n t , i tt h e np u tf o r w a r dt h em a i np r o b l e m si nt h e s e f i e l d s f i n a l l yi tp r e s e n t st h es i g n i f i c a n c ea n dm a i n c o n t e n to f t h er e s e a r c h 。 c h a p t e r2d e s c r i b e st h ed e f i n i t i o n ,s t r u c t u r ea n dm a i nf e a t u r e so fo n t o l o g ya n dg i v e sa n o v e r v i e wo f o n t o l o g yd e s c r i p t i o nl a n g u a g e ,s u c ha ss h o e ,r d f , r d f s ,d a m l + o i l ,o w l 。 a ss s r dc h o o s eo w ld la si t sd e s c r i p t i o nl a n g u a g e ,i ta l s oi n t r o d u c e st h es y n t a xa n d s e m a n t i cs t l l 3 c t u r eo fo w ld l 。i ts h o w st h ej a v ab a s e do n t o l o g ye d i t o r - p r o t 6 9 6w h i c hi s d e v e l o p e db ys t a n f o r dm e d i c a li n f o r m a t i c ss t a n d f o r du n i v e r s i l v , a n di l l u s t r a t e sh o wp r o t d g 6c a nb eu s e da n dc u s t o m i z e dt ob u i l ds s r do n t o l o g ym o d e lf o c h a p t e r3p r e s e n t st h eb a s i ck n o w l e d g ea n dm e t h o d so fl o g i cr e a s o n i n g ,d e m o n s t r a t e sa r e a s o n i n gp r o c e s s ,g i v e st h ed e t a i l e da n a l y s i so ns s r dk e yt e c h n i c s w r la n dj e s s f i n a l l yi ts h o w st h ew a yo f e s t a b l i s h i n gt h es e m a n t i cr e l a t i o n s h i pb yr e a s o n i n g c h a p t e r4p r o v i d e sa no v e r v i e wo fo n t o l o g ym a p p i n ga n di n t e g r a t i o nt e c h n o l o g y , s m n m a r i z e sa n dc l a s s i f i e s 也ec u r r e n tr e s e a r c ha c h i e v e m e n to nt h e s ef i e l d s p r e s e n t st h e s i m i l a r i t yc o m p u t i n ga p p r o a c h o ns s r do n t o l o g ym o d e lf o ,a n dt h e ne d u c em e s 靴i 。j e s sr e a s o n i n gs y s t e m c h a p t e r5d e s c r i b e sh o ws s r dc o m b i n e ss w r lw i t hj e s st ob u i l du pt h ei n t e l l i g e n t r e a s o n i n gs y s t e m ,i ts h o w st h ed e s i g na r c h i t e c t u r eo fs s r ds y s t e ma n dd e m o n s t r a t e 逊e 委x s t e p so f i m p l e m e n t a t i o n c h a p t e r6a p p l i e st h es s r dt oo n t o l o g ym a p p i n ga n di n t e g r a t i o na p p l i c a t i o n 。i ts h o w s t h ep r o c e s so fi m p l e m e n t a t i o nw i t hs u p p o r to fs w r l ,j e s sa n dr a c e r ,w h i c hi s s e t i n gu p o n t o l o g y , b u i l d i n gt h et b o xa n da b o x ,o n t o l o g ym a p p i n ga n di n t e g r a t i o n ,c h e c kt h e c o n s i s t e n c ya n dq u e r y c h a p t e r7g i v e st h ec o n c l u s i o n ,a n da l s op r o v i d ea n o v e r v i e wo f f u t u r ew o r k , k e y w o r d s :o n t o l o g y m a p p i n g ;o n 坞i o g y i n t e g r a t i o n ;s e m a n t i c w e b r u l e l a n g u a g e ( s w r l ) ; j a v ae x p e r ts y s t e m s s h e l l ( j e s s ) ;s i m i l a r i t yc o m p u t i n g 浙江大学博士学位论文基于s w r l 推理的语义关联发现及其在本体映射与集成中的应用 图表索引 图1 1 语义w e b 层次结构1 图2 - 1r d f 图形表示的直接关系1 4 图2 2o w l 的语法规范1 5 图2 3o w l 是一个r d f 的应用程式1 6 图2 - 4 在p r o t 6 9 6 系统中类编辑窗口的图形界面2 3 图2 5 本体的概念层次关系( 用p r o t 6 9 6 中的o w l v i z 插件绘制) 一2 4 图3 - 1 基于d l 系统的知识库2 7 图3 2 通过充分必要条件对本体中的概念进行定义3 4 图3 - 3 在p r o t 6 9 6 中对f a t h e r 进行定义一3 5 图3 - 4 通过概念约束发现语义关联3 6 图3 - 5s w j e s s 界面3 9 图3 - 6s w r l 的呈现方式4 0 图3 7s 、j 也架构4 1 图3 - 8s w r l a t o m 和本体关连图4 2 图3 - 9d lr e a s o n e r 架构图4 3 图3 1 0j e s s 界面4 4 图4 1 基于本体的语义映射模型4 8 图4 2 单本体方法5 3 图4 3 多本体方法5 4 图4 - 4 混合本体方法5 5 图4 5 本体概念的语义栈5 7 图4 6 相关性示意图6 0 图4 7r d f 图形表示的直接相关类型6 1 图4 8r d f 图形表示的间接相关类型6 1 图4 - 9 家庭本体的概念层次图6 3 图4 1 0 以父亲为中心的概念语义相似度等值线示意图6 4 i 塑堡杰堂堡主堂垡鲨塞茎主! 受魁苎璺鲤堡墨差丛垄垄垦基垄查燕墼堑兰篓盛! 堕! i 里 匮4 1 l 资源肉本体瓣映射过翟。醪 图4 ,1 2a l i c e 的f a m i l y - - t r e e ”6 6 图4 - 1 3 弦e v e 为中心匏概念语义糖酝度等馕线示意蚕,6 7 图4 1 4f o 的概念语义相似度( 由p r o t 6 9 6 的t g v i z t a b 生成) 6 7 圈5 ,js s r d 韵结构框架6 9 图5 - 2f o 中定义的属性7 0 图5 - 3f o 中的s w r l 7 1 蜜5 - 4 终本钵移s w r l 转换为箍理葶l 擎豹豢实痒稳攫则疼。7 2 图5 + 5 规则转换7 2 委5 - 6s w r l 转换海雄瑾l 擎矮瓣痒。7 3 图5 7j e s s 推理系统的s h e l l 7 3 图5 - 8j e s s t a b 的界面+ 7 4 图5 - 9s m i t hf a m i l y 的成员关系图7 4 图5 1 0 新f o 中的成员关系图。7 5 图6 - 1f o 斡摄念层次图7 6 图6 - 2f o 中类的表示7 7 图6 3f o 戆t b o x 7 7 图6 埘f o 的角色层次图_ 7 8 图6 - 5t b o x 结构7 9 图6 - 6a l i c e - f a m i l yt r e e ,。8 0 图6 7c h a r l e s f a m i l yt r e e 8 l 图6 - 8a l i c e - f a m i l yt r e e 8 2 图6 - 9c h a r l e s f a m i l yt r e e 8 2 蚕6 - l o 两个家庭静浚射关系s 3 图6 - 1 1 通过c h a r l e s 的角色映射的集成本体8 3 图6 - 1 2 新本体0 。的成员关系图8 4 图6 - 1 3r a c e r p r o 的启动界蕊8 5 图6 1 4r a c e r p r o 对本体进幸予检查和测试选项8 5 图6 一1 5 对零体进行接凝捡焱落6 图6 - 1 6r a c e r p r o 对本体进行一致性检查和测试8 6 v i i i 灏涯大学博士学位论文 基于s w r l 推理的语义必联发现及其在本体映射与集成中的应用 图6 1 7 致性检查结果8 7 图6 1 8 纛谗毅零俸中受热为u n c l e 戆残受。8 7 图6 一1 9 程p r o t e g e 中本体进行查询8 8 强6 2 0 淼键器瑟:奎途e v e 懿毅藏。8 8 图6 2 1 焱询显示:e v e 有叔父c h a r l e s 8 9 图6 2 2 焱询显示:b e t t y 有女,le v e ,d o r i s 8 9 表3 - 1 表4 - 1 表4 - 2 表4 3 表4 4 表4 - 5 s w r lb u i l d i n g 数值比较4 2 相关节点的完全推断集5 9 掇关节点鹣壹接攘叛集6 0 基于卷标的相似腹计算结果6 4 蘩子箍述逻辑懿穰纭凄计算结栗6 4 e v e 与其它人员棚关性的计算结果6 6 i x 浙江大学博士学位论文 y - 1 0 1 4 3 7 8 独创性声明 零人声明题呈交豹学经论文是本人在导薅指导下进彳亍抟谚究工作及取褥豹研究成 果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不龟含其他人已经发表 或撰写过豹瑷究残暴,也不恕含为获得逝姿盘茎或其他教育枧掏豹学位或证书裾馒 用过的材料。与我一同工作的同志对本研究所做的强何贡献均已在论文中作了明确的说 骥势袭示谢意。 学位论文作者签名:素支裘 签字日期:j ,年,月 瞬 学位论文版权使用授权书 本学位论文作者完全了解逝逛盘鲎有关保留、使用学位论文的规定,有权保 罄并尚国家看关部门鬣梳稳遴交论文静复窜件帮磁蠢,允诲论文被套阕弱诺瓣。本入授 权澎望盘堂可以将学位论文的全部或部分内容编入有关数据库进行检索,面丁以采用影 印、缩印或翻擒等复潮手段傺存、茬编学位论文。 ( 保密的学位论文在解掰后适用本授权书) 学位论文作糟签名:勃丈央 导师签名舷 签字日期:知以年j 月 日签字日期:年 月日 学位论文作者华监君去向: 工掾攀位: 通讯地址: j 电话: 邮编: 浙江大学博士学位论文基于s w r l 推理的语义关联发现及其在本体映射与集成中的应用 第1 章绪论 1 1 引言 目前,互联网已成为人们获取信息最重要的途径,不仅汇聚了海量信息,信息数 量也在以指数级速度增长,网络规模更是以惊人的速度增长。当前在互联网上大约有 三十亿个文档,全世界约有三亿用户存取和访问这些文档,并且这些文档的数量仍在 迅速增加。然而,呈指数级增长的海量信息使得来自各领域的用户对信息的查找、访 问、表示以及维护变得越来越困难起来。其中的主要原因之一是目前的w e b 对信息的 表示主要是“呈现”式的,大量的信息以自然语言、图片等方式罗列出来,计算机只 能从格式上进行处理和验证,而不能处理知识级别的问题。由此,使人淹没于对知识 的辨别、提取等繁杂的劳动中。 为了解决这个问题,t i mb e m e r s l e e 等人提出了下一代互联网的概念语义 w e b 。其思想就是利用元数据( m e t a d a t a ) 语言对w 曲信息资源的内容进行语义上的描述, 通过向数据添加机器可理解的语义和启发式信息,从而使计算机能够利用这些语义信 息对信息资源的内容进行理解和处理,并在此基础上,实现更高层的、基于知识的智 能应用,并且在一定程度上实现机器对信息的自动处理。语义w e b 的基本体系结构下 图所示: 图1 - 1 语义w e b 层次结构 语义w e b 体系结构包括七层,各层的基本功能和相互关系如下: 游涯大攀鞲蔓:学位论文蒸于s w r l 稚瑷韵语义关联发瑶及箕在本体映射与集成中龄应用 u r i s 和u n i c o d ew e b 环境下的应用之同不可避免玩需要翱童通秸,隰橇器可 读的格式传递或发布信息。这艟信息中很大一部分是对w e b 上资源的描述。因 此,首先应该以明确的方式来标识这蓥资源( 对象) ,语叉w e b 采用统一资源据 识符( u n i f o r mr e s o u r c ei d e n t i f i e r s , u g i ) 来标识资源及其属性,u r i 是一个i n t e r a c t 标寒,它争强镪常用酶统一资源定住眷( u n i f o r mr e s o u r c ei x 3 c a t o r , 礴沌) 铁及统 一资溅名称f 蹦f o 珊r e s o u r c en a m e ,u r n ) 媳蹑剐在- t - u r i 泛援黪鸯娃字符串 标识的满络资源,包含了u r l 和u r n 。另外,由于语义w e b 的最终璃的是要 构建一令全球信息麓溺络,在这个黧络上涵盏备种语言和文穿的信息资源,所班 它采用统一编码u n i c o d e 作为字符的编码方案。这一层是整个谱义w e b 的基石, 它着眼于解决w e b 上资源的定缘和跨地区字符编码的橼准格式的问题。 x m l 、n a m e s p a c e 、x m l s c h e m a 在u r i 和u 越c o d e 之上,是x m l 及捆荧 技拳层。x m l 免毒争愿户壤据慧要露定义一莹“有意义砖”标签,对辨发希信 息戆内容进行格记,并使用文糖类型定冀( d o c u m e n tt y p ed e f i n i t i o n ,d t d ) 或 x m l s c h e m a 来约束这些标签的结构 w a l s h ,1 9 9 8 1 。由5 - x m l 标签可以由用户 穰耱崮已的需要来定稍,这样; :可避免跑会造成标签麓名的情漉。为了避免这 样的冲突,w 3 c 采用了n a m e s p a c e 机制 b r a y , 1 9 9 9 。 r d f 、r d fs c h e m ax m l 屡之上是数据互操馋层一一资溅描述握黎f 疑e s o u r c e d e s c r i p t i o nf r a m e w o r k ,r d f ) 和r d fs c h e m a s 。r d f 本身莠没稽规定语叉,但 是它为每一令资源搂述体系提蠛一令毙够描述英特定需求题语义结鞠钓匏力。 从这令意义土拳涎,r d f 是一令舞教黪元数据框架 m a n o l a 。2 0 0 2 1 。这个元数耱 框架定叉了一种数据模整,可髓用采描述机器能理解的数据语义。r d fs c h e m a 兢范踊r d f 进一步定义了建模霹;吾 b r i c k l e y , 2 0 0 4 ,提供了r d f 模整申使用的 一个基本类型系统。这个类型系统有些类似于筒向对象的编程诺言。从描述逻 辑( d e s c r i p t i o nl o g i c ,d l ) 的鼹,奴采麓,r d f s 穰当于t b o x ( t e r m i n o l o g yb o x , 而r d f 相当于a b o x ( a s s e r t i o n b o x ) 。 o n t o l o g yr d f s c h e m a 誓疆定叉类,挚嶷、起类,榜槛、子特圣蠡双旋它们的约 慕,如定义域d o m a i n ) 和馇城fr a n g e ) 警。嚣此,姣巢秘意爻上说,r d fs c h e m a 本身辘怒一种简单的知识本傣( o n t o l o g y ) 谱言。但是r d f r d f s 对特定应用 领域词澎的描述能力池较弱,需簧进行扩展,把这个r d f r d f s 之上的扩展层 称为知识本体层。d f e n s e l 等人认为f f e n $ e l ,2 0 0 1 1 ,知识本体避渐引起人们重视 2 浙江大学博士学位论文 基于s w i l l 推理的语义关联发现及其在本体映射与集成中的应用 的原因在于知识本体能够在人们和应用系统之间达成对术语含义的共享和共同 理解。对同一概念的语义共享和共同理解恰恰是构建语义w e b 的关键。 l o g i c 、p r o o f & t r u s t 到目前为止,利用r d f r d f s 以及对r d f s 进行扩展的 一些知识本体语言可以对w e b 上的资源内容做出描述。仅有这些描述还远远不 够,基于语义的w e b 应用还需要根据特定的规则从这些描述性的知识中进行推 理。逻辑层的目标就是提供一种方法来描述规则 l e e ,2 0 0 0 1 。描述逻辑标记语言 ( d e s c r i p t i o nl o g i cm a r k u pl a n g u a g e ,d l m l ) 就是这样的一种方法,它用d t d 封装了描述逻辑中的逻辑连接词 d l m l ,2 0 0 0 】,可将基于描述逻辑的形式化知识嵌 入到被描述的文档之中。针对语义w e b 上的各种不同类型的应用,逻辑层可能 会采用多种逻辑语言的实现形式,这一点就和互联网t c p i p 协议模型中的每 一层都会针对不同的硬件乖软件系统采用不同的实现类似。p r o o f 和t r u s t 这 部分内容在概念上目前还没有一个公认的权威说法,但是语义w e b 的研究者普 遍认为p r o o f 和t r u s t 将是下一代w e b 的重要概念 l e e a 】。 总的来说,语义w e b 环境下的应用在事实的基础上,通过应用逻辑推理,得出某 种结论。这种推理的每一步对用户来说,都应该是可见的,或者说应该是可查的。这个 推理的过程,就是一种证明,推理最后得出得结论也应该是可以信任的。首先用户应该 可以信任所见的数据,并且可以信任所做的推理过程,只有在这个基础上用户才能最终 信任得到的结论。然而,就用户所见的数据而言,前面介绍的r d f 模型允许任何人对 任何资源进行任何描述,不同观点的人对同样的资源可能会做出完全相反的描述。本体 是使w e b 具有语义性的关键技术,在语义w e b 中起着重要的作用:它提供了一套对特 定领域知识的共享和共同认识,帮助人们在语法和语义上与机器实现准确的交流;它是 对领域的形式化与结构化的描述,是人和机器、程序间知识交流的语义基础。 1 2 研究背景 随着语义w e b 中信息量的增多,本体的数量也越来越多。由于w e b 环境的分布性 和开放性,信息表示是结构化的,本体是在并发环境下开发的,这就必然会导致在已 有可重用本体的情况下,人们还会继续重新开发新的本体,导致在同一个领域内会存 在多个本体。这些本体的概念分类可能不同,概念间的关系也可能不同,并且相同的 概念可能用不同的术语来表示。另外,本体的构造是一个非常费时费力的过程,一个 用户为满足自己的不同需要而建立多个不同的本体是不现实的。在许多场合,单个本 浙江大学博士学位论文基于s w p , , l 推璁的语义必联发现及其在本体映射与熊成中的应用 体不能充分宠或强标任务,必须联会多个本体寒竞戏。由于本体黪梅造一袁没毒个 统一的规范和标准,势必造成本体的冗余黧复,影响本体之间的爨用性和甄操作性, 导致这些零毒謇掰表豕懿囊识之淹存在互穗狰突。零髂之阕豹不匹甏衷瑗为: 概念的不同分层造成结构上的冲突:相同的实体被分在不同的子类中,或相同 的癸俸被定叉在不同的层次上; 关系不匹配:不同的关系( 或属性) 被分配到相同的概念中,或者一个属性用同 一个幂语表蒋但属蜮的类型却不同; 定义幂匹配:相同的概念躅不同砖术语拳表承,或者蕊一令拳语表示不同戆规念, 同一类型信息的命名不同( 同义异音) 或者不同类型信息的命名相同( 罔音异义) ; 类另或巢舍幂匹配:弱一数糖蟋表零不弱,造成数掇冲突。对于莱夸领域审的 多个本体,概念a 在一个本体中被分成许多子类,而在另一个本体中相同的概 念a 可琵訇不包含任何子类。 异构的本体之间不能进行互操作,这是本体共攀的主要障碍。因此需要进幸亍本体 之间的集成,实现本体之间豹重用,并检测本体之间的冲突。要实现本体之间的集成 首先需要建立本体之趣的联鬟,对零俸进行映射。爨兹,零体躲浚瓣仍存套诲多露趣; 本体映射的效果乖效率难以问时保诚。尽管有一些映射方法的效果不错,但这 些方瀣酶效搴碾难令人满意。这是强为拳舔内节点的数羁鑫常呈夭,为了逡隶 好的映射结果,人们往往采用多重穷法来对本体映射做综合考察,速必然导致 效率低下。必须要在映射效恭和映射效率之闽找到一个平衡点。 非常依赖专家的人工输入。尽管有些工具对于映射有推进作用,帮只能提供一 些有限的函数,如类堵和关系名的校验、一致性校验,t o d o 列表等,最后的判 建 还是依赖于专家去究或,英叁动化拳乎鼹低。 存在相似度的计算方法不完善,相似度的计算量过高,概念相似度的计算过于 冀委等褥题拳体一般可理辫席概念、属槛和美系酌集合。本侮映射主要集中 在概念问的相似度计算及相应的映射。在映射过程中,本体映射的核心内容是 计算两个概念闻的相似度,并求出本体中概念的相似矩阵。辫其相似度大于麓 个雕德对就认为这两个概念间存在一定的映射关系。在某种蟥况下,会毒杏撩 似度计算量偏高,概念相似发计算过于片面的问题。 基于以上原医,本文挺爨了基予s 猢辽雄理豹溪义关联发臻按零,逶邋建立栽弼 和进行逻辑推理,能够有效地发现本体之间隐含的语义关联。该技术可以与其它已有 4 浙江大学博士学位论文基于s w r l 推理的语义关联发现及其在本体映射与集成中的应用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论