




已阅读5页,还剩144页未读, 继续免费阅读
(计算机科学与技术专业论文)面向大规模本体重用的子本体模型研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学博士学位论文摘要 摘要 本体作为语义w e b 的知识表示基础,在构建基于语义的系统或应用中发挥着 至关重要的作用。随着本体规模的增长,系统处理和利用本体的效率会降低。对 于大规模的领域本体,语义w e b 应用通常只需要利用其中的部分内容。从目前语 义w e b 和本体的研究来看,还缺乏比较有效的模型与方法,来支持在语义w e b 应用中对大规模本体的重用。为了构建和推广面向语义w e b 的应用,有效地管理 和利用已有的大规模本体已经成为一个十分现实和迫切的需求。 基于上述背景,本文着重探讨了面向大规模本体重用的子本体模型,主要研 究内容和贡献包括以下几个方面: 口针对语义w e b 应用在利用本体时存在的局部性,提出了子本体的表示方法。 将来自于大规模本体的上下文相关的模块表示为子本体,给出了子本体的形式 化表示,并定义了针对子本体的对象操作。语义w e b 应用能够根据需要动态 地抽取子本体,创建特定的子本体知识库。将缓存机制与本体重用相结合,利 用子本体缓存作为系统的局部知识库,支持对大规模本体的动态重用。 口对面向子本体的推理问题进行了研究。提出了子本体中的基本推理任务,通过 特定的子本体推理算法,将本体的推理问题转化为子本体的推理问题,能从一 定程度上降低推理的复杂性、提高推理的效率。给出了基于子本体表示的 t a b l e a u 算法,支持模块化的本体推理。证明了面向子本体的t a b l e a u 算法相 对源本体而言是半判定的,并给出了保持一致性的扩展推理算法。 口针对子本体知识库的优化问题,提出了基于遗传算法的优化方法。该方法对传 统的遗传算法进行扩展,提出了基于语义的遗传算法s e m g a ,使用基于三元 组的非二进制编码方式将子本体表示为染色体,根据语义关系执行遗传算子。 利用s e m g a 进行动态地演化,从而达到优化知识库的语义结构的目的。与一 般的缓存策略相比,基于演化的方法在效率上和性能上都有比较明显的优势。 口面向分布式的w e b 资源,提出了基于子本体的资源集成与管理方法。该方法 浙江大学博士学位论文摘要 利用本体语义对分布式的w e b 资源进行集成,通过在资源模式与本体之间建 立语义映射,实现以子本体为单位的资源管理。将资源匹配过程转化为资源请 求与子本体之间的概念匹配,利用遗传算法进行资源优化,满足动态变化的资 源请求。模拟实验的结果表明,该算法能进一步提高资源匹配和重用的效率。 基于上述工作,同时还设计并实现了一个子本体原型系统d a r t o n t o ,支持面 向中医药领域的大规模本体重用。通过实例进一步说明了如何应用子本体模型创 建中医药知识服务,解决大规模领域本体的重用问题。 关键词:本体,语义w e b ,本体重用,描述逻辑,子本体,中医药 浙江大学博士学位论文 a b s t r a c t a b s t r a c t a st h ek n o w l e d g er e p r e s e n t a t i o nf o u n d a t i o no ft h es e m a n t i cw e b ,o n t o l o g i e sp l a ya c r i t i c a lr o l ei nb u i l d i n gal a r g ev a r i e t yo fs e m a n t i c b a s e ds y s t e m so ra p p l i c a t i o n s w i t h t h eg r o w t ho fo n t o l o g i e s ,i tw i l ld e c r e a s et h ee f f i c i e n c yo fs y s t e m si nm a n i p u l a t i n ga n d u s i n go n t o l o g i e s h o w e v e r , as p e c i f i cs e m a n t i cw e ba p p l i c a t i o no f t e nn e e d sp o r t i o n s o fal a r g e s c a l ed o m a i no n t o l o g y c o n s i d e r i n gt h ee x i s t i n gw o r ka b o u tt h es e m a n t i c w e ba n do n t o l o g y , i ts t i l ll a c k so fe f f i c i e n tm o d e l sa n dm e t h o d st os u p p o r tr e u s i n g l a r g e s c a l eo n t o l o g i e si n s e m a n t i cw e ba p p l i c a t i o n s i no r d e rt oc o n s t r u c ta n d p o p u l a r i z ea p p l i c a t i o n s t o w a r d st h es e m a n t i cw e b ,h o wt om a n a g ea n du t i l i z e l a r g e s c a l eo n t o l o g i e sh a sb e c o m eap r a c t i c a la n du r g e n tr e q u i r e m e n t u n d e rt h i sb a c k g r o u n d ,w em a i n l yt a l ka b o u tas u b o m o l o g ym o d e lf o rl a r g e s c a l e o n t o l o g yr e u s ei nt h i st h e s i s t h em a j o rr e s e a r c he f f o r t sa n dc o n t r i b u t i o n sa r ea s f o l l o w s : 口c o n s i d e r i n gt h el o c a l i t yo fs e m a n t i cw e ba p p l i c a t i o n si nu s i n go n t o l o g y , w e p r o p o s e t h e r e p r e s e n t a t i o n o fs u b - o n t o l o g y c o n t e x t s p e c i f i c p o r t i o n s f r o m l a r g e - s c a l eo n t o l o g ya r er e p r e s e n t e da ss u b o n t o l o g i e s t h i st h e s i sg i v e saf o r m a l d e f i n i t i o no fs u b - o n t o l o g ya n dd e f i n e sac o l l e c t i o no fo b j e c tm a n i p u l a t i o n sf o r s u b - o n t o l o g y s e m a n t i cw e ba p p l i c a t i o n sc a ne x t r a c ts u b - o n t o l o g i e sd y n a m i c a l l y a c c o r d i n gt or e q u i r e m e n t sa n df o r ms p e c i f i cs u b - o n t o l o g yk n o w l e d g e b a s e s t h i s t h e s i sa l s oc o m b i n e st h ec a c h i n gm e c h a n i s mw i t l lo n t o l o g yr e u s et of o r ma s u b o n t o l o g yc a c h e ,w h i c hi su s e da st h el o c a lk n o w l e d g e b a s eo fs e m a n t i c b a s e d s y s t e m st os u p p o r td y n a m i co n t o l o g yr e u s e 口t h i st h e s i sa l s o p r e s e n t s t h er e s e a r c ha b o u tt h es u b - o n t o l o g yr e a s o n i n ga n d i l l u s t r a t e st h eb a s i cr e a s o n i n gt a s k so fs u b - o n t o l o g y t h er e a s o n i n ga l g o r i t h mb a s e d o ns u b o n t o l o g yi su s e dt or e d u c et h er e a s o n i n gp r o b l e mf o ro n t o l o g yi n t ot h eo n e f o rs u b - o n t o l o g y i nt h i sw a y , i ti m p r o v e st h ee f f i c i e n c yo fr e a s o n i n gb yd e c r e a s i n g t h ec o m p l e x i t y at a b l e a ua l g o r i t h mb a s e do ns u b - o n t o l o g yr e p r e s e n t a t i o ni sg i v e n t o s u p p o r tm o d u l a r i z e do n t o l o g yr e a s o n i n g w ea l s op r o v et h a t t h et a b l e a u 浙江大学博士学位论文 a b s t r a c t a l g o r i t h mf o rs u b o n t o l o g yi ss e m i d e t e r m i n i s t i cc o m p a r e d 晰t 1 1t h a to fo n t o l o g y a ne x p a n s i o nr e a s o n i n ga l g o r i t h mi sg i v e nf o rp r e s e r v i n gc o n s i s t e n c y 口c o n s i d e r i n gt h ep r o b l e mo fs u b - o n t o l o g yk n o w l e d g e b a s eo p t i m i z a t i o n ,t h i st h e s i s p r e s e n t sa i lo p t i m i z a t i o na p p r o a c hb a s e do ng e n e t i ca l g o r i t h m t h ea p p r o a c h e x t e n d st h ec a n o n i c a lg e n e t i ca l g o r i t h mt of o r mas e m a n t i c - b a s e dg e n e t i ca l g o r i t h m c a l l e ds e m g a t h ea l g o r i t h mu s e st r i p l e b a s e dn o n - b i n a r ye n c o d i n gt or e p r e s e n t s u b o n t o l o g i e sa sc h r o m o s o m e sa n dp e r f o r m sg e n e t i co p e r a t o r sb a s e do ns e m a n t i c r e l a t i o n s s e m g ac a ne v o l v es u b o n t o l o g yc a c h ed y n a m i c a l l yt oo p t i m i z et h e s e m a n t i cs t r u c t u r eo fk n o w l e d g e b a s e c o m p a r e dw i t ht h et r a d i t i o n a lc a c h e p o l i c i e s ,t h ee v o l u t i o n - b a s e da p p r o a c hh a s b e n e f i t s i nb o t h e f f i c i e n c y a n d p e r f o r m a n c e 口t h i st h e s i sp r e s e n t sas u b o n t o l o g yb a s e dm e t h o df o ri n t e g r a t i n ga n dm a n a g i n g d i s t r i b u t e dw e br e s o u r c e s t h em e t h o dm a k e su s eo fo n t o l o g ys e m a n t i c st o i n t e g r a t ed i s t r i b u t e dw e b r e s o u r c e s i tm a n a g e sr e s o u r c e si nt e r m so fs u b o n t o l o g y b yc r e a t i n gs e m a n t i cm a p p i n g sb e t w e e nt h es c h e m a t ao fr e s o u r c e sa n do n t o l o g y t h ep r o c e s so fr e s o u r c em a t c h i n gi st r a n s f o r m e dt ot h em a t c h i n gb e t w e e nr e s o u r c e r e q u e s t sa n ds u b o n t o l o g i e s ag e n e t i ca l g o r i t h mi s u s e dt oa c h i e v er e s o u r c e o p t i m i z a t i o nt os a t i s f yd y n a m i cr e s o u r c er e q u i r e m e n t s t h er e s u l to fs i m u l a t i o n e x p e r i m e n ti l l u s t r a t e st h a tt h ea l g o r i t h mi m p r o v e st h ee f f i c i e n c y o fr e s o u r c e m a t c h i n ga n dr e u s e o nt h e b a s i so ft h ew o r kb e f o r e m e n t i o n e d ,t h i st h e s i sa l s op r e s e n t sap r o t o t y p e s y s t e mf o rs u b o n t o l o g yc a l l e dd a r t o n t o t h es y s t e mi su s e dt os u p p o r tr e u s i n g l a r g e - s c a l eo n t o l o g yi nt h ef i e l do f t r a d i t i o n a lc h i n e s em e d i c i n e w ei l l u s t r a t eh o wt o u s et h es u b o n t o l o g ym o d e li nc o n s t r u c t i n gt r a d i t i o n a lc h i n e s em e d i c i n ek n o w l e d g e s e r v i c ea n ds o l v i n gt h ep r o b l e mo fr e u s i n gl a r g e s c a l ed o m a i no n t o l o g yt h r o u g hau s e c a s e k e y w o r d s :o n t o l o g y , s e m a n t i cw e b ,o n t o l o g yr e u s e ,d e s c r i p t i o nl o g i c , s u b o n t o l o g y , t r a d i t i o n a lc h i n e s em e d i c i n e v n 浙江大学博士学位论文 图目录 图目录 图1 1 语义w e b 体系架构图2 图1 2 本体与语义w e b 应用系统之间的鸿沟3 图3 1 大规模本体的局部性重用2 4 图3 2 中医药本体( 部分) 和一个子本体2 8 图3 3 概念不连通的子本体2 9 图3 4 一个子本体空间示例31 图3 5 子本体抽取示例3 4 图3 6 基于动态存储模型的子本体缓存4 3 图3 7 基于子本体缓存的本体重用4 4 图4 1 包含方剂和中药知识的中医药本体( 局部) 5 4 图4 2 基于子本体的动态扩展推理6 2 图5 1 子本体缓存的优化7 2 图5 2 基于语义的遗传算法7 4 图5 3 面向子本体的四种不同的染色体编码方式7 6 图5 4 二进制染色体编码方式的不足7 8 图5 5 选择算子示例8 2 图5 6 交叉算子示例8 4 图5 7 变异算子示例8 6 图5 8 不同的子本体缓存策略比较8 9 图5 9 不同缓存策略的平均命中率一9 2 图5 。1 0 不同缓存策略的平均响应时间9 3 图5 1 1 演化后子本体缓存的子本体分类情况9 4 图5 1 2 基于s e m g a 的子本体缓存在不同的抽取深度下的平均命中率9 5 图6 1 关系数据库与本体之间的语义映射9 9 图6 2 利用语义映射集成关系数据库1 0 0 图6 3 可视化语义映射工具1 0 1 图6 4 以子本体为单位的语义映射1 0 2 图6 5 基层结构产品相关的本体与子本体1 0 5 图6 6 群体的适应度变化情况1 1 4 图6 7 系统的平均语义匹配度增长情况1 1 5 图6 8s m d 权重系数分析1 1 6 图7 1d a r t g r i d 体系架构1 1 9 图7 2d a r t o n t o 的体系架构1 2 1 图7 3d a r t o n t o 对d a r t g r i d 的本体服务进行扩展1 2 2 图7 4 中医药本体的w e b 界面1 2 4 图7 5 基于d a r t o n t o 的中医药知识服务体系1 2 6 i v 浙江大学博士学位论文 表目录 表目录 表1 1 部分大规模的领域本体及其规模2 表2 1 描述语言4 c c 的语法和语义1 4 表3 1 中医药本体的概念和关系的含义( 部分) 2 6 表3 2 中医药本体的公理( 部分) 2 7 表3 3 子本体表示与c y c 微理论表示的特征对比3 0 表4 1 面向北c 的t a b l e a u 算法的转换规则5 0 表4 2 子本体的概念和关系的含义5 5 表4 3 本体的推理算法比较6 7 表5 。l 子本体的染色体编码方法7 7 表5 2 模拟实验的基本参数设定9 0 表5 3 不同抽取深度下的平均子本体抽取时间9 6 表7 1 中医药本体的一级类目1 2 3 v 浙江大学研究生学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得盘姿盘堂或其他教育机构的学位或 证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示谢意。 学位论文作者签名: 毛钨专斤久 签字目期:2 0 0 8 年1 2 月1 2 日 学位论文版权使用授权书 本学位论文作者完全了解逝姿本堂有权保留并向国家有关部门或机构 送交本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权逝姿盘堂可 以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影 印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:毛囱予钦导师签名 签字日期:2 0 0 8 年1 2 月1 2 日签字目期:2 0 0 8 年1 2 月1 2 日 浙江大学博士学位论文致谢 致谢 在论文完稿之际,回首在求是园中学习和生活的点点滴滴,为自己能有机会 远离喧嚣与浮躁,在优越和宽松的科研环境和氛围下,静心钻研,潜心研究,略 窥学术之门径而感到欣慰。欣慰之余,我要向关心和支持我学习的老师、同学、 朋友和家人表示真挚的谢意! 首先,我要深深感谢我的导师吴朝晖教授。感谢他五年多来对我无微不至的 关怀和孜孜不倦的教诲! 正是他给了我学习深造的机会,也正是他引领我走进了 学术殿堂。本文是在吴老师的悉心指导下完成的,从论文选题,在学期间所撰写 的学术论文,直到本文最后定稿,自始至终都得到了他的精心指导。在博士研究 生阶段学习与研究的生活中,深深感受到吴老师渊博的学识、严谨的科学作风、 敏锐的科研洞察力、对工作的执著精神以及平易近人的品质。吴老师的言传身教 是我五年来最大的收获,在此谨向吴老师表示由衷的感谢! 我将继续刻苦钻研、 不断进取,只有这样才能不负导师的期望。 其次,我要感谢课题组的指导老师陈华钧副教授和姜晓红副教授,在日常的 科研和学习上给予了我极大的帮助和指导。此外,我还要特别感谢香港浸会大学 的张国威副教授,对我的研究课题和论文撰写给予了很多指导与帮助。在此表示 深深感谢! 我还要感谢浙江大学c c n t 实验室共同学习和工作的老师和同学们,特别是 网格计算课题组的全体老师和同学,他们是姚敏教授、赵民德副教授、杨莹春副 教授、潘纲副教授、吴健副教授、李莹副教授、杨建华博士、杨国青博士、李石 坚博士、邓水光博士、秦晋、陈翎、孟佳,以及郑国轴、周林华、封毅、周春英、 张字、于彤、马隽、张小刚、黄朝晖、卢宾、刘洋、郑清照、宓金华、秘中凯、 付志宏、王俊健、罗兆波等同学。他们在学业上的切磋和帮助,在生活上的嘘寒 问暖,都让我受益良多。感谢所有支持和帮助我的老师、同学和同事们。 最后,我要感谢我的家人。正是他们默默无闻的奉献和一贯的支持和鼓励, 浙江大学博士学位论文致谢 才使我有信心去克服一切困难,有充足的时间和精力去完成学业。他们全心的付 出和无言的关爱始终是我前进的巨大动力。没有他们的支持,也就没有本文的开 始! 作者 2 0 0 8 年9 月于求是园 浙江大学博士学位论文 序言 青专 当本体增长到一定的规模时,会降低系统处理本体的效率,对于大规模的领 域本体,语义w e b 应用通常只需要利用其中的部分内容。从目前语义w e b 和本 体的研究来看,还缺乏比较有效的模型与方法,来支持在语义w e b 应用中对大规 模本体的重用。对于大规模本体,必须提供一种模块化和局部化的机制,允许基 于语义的应用根据特定的上下文动态地重用本体。本文正是从这样的需求出发, 面向语义w e b 的应用,以语义w e b 和本体的相关理论和技术为基础,研究本体 重用的局部化表示模型及其相关理论,支持对大规模领域本体的动态重用与共 享,为构建基于本体的语义w e b 的应用提供更加有效的模型与方法。本文的主要 研究意义包括:进一步提高基于本体的系统利用大规模本体的效率,为语义w e b 应用提供更加形式化的本体局部化表示方法和组织架构,支持对大规模本体的动 态重用;利用本体的局部化表示,进一步完善包括推理在内的复杂任务,扩展系 统重用大规模本体的能力;通过更加有效的本体重用方法,实现动态灵活的语义 交互,支持广泛的语义w e b 应用。 本文的研究,得到了国家9 7 3 计划“语义网格的基础理论、模型与方法研究” 子课题“语义网格在中医药知识共享与服务中的应用”( n o 2 0 0 3 c b 3 1 7 0 0 6 ) 、国 家8 6 3 计划“中国中医药科学数据网格服务应用”( n o 2 0 0 6 a a 0 1 a 1 2 3 ) 、国家 自然科学基金杰出青年基金“智能空间的语义模型与行为感知认证”( n o n s f c 6 0 5 3 3 0 4 0 ) 等项目的支持。此外,本文的研究还得到了中国中医科学院信 息研究所的协作配合,并将部分研究成果应用于中医药领域。 浙江大学博士学位论文 第1 章绪论 第1 章绪论 1 1 研究背景与意义 1 1 1 研究背景 针对目前w e b 上信息表达不一致、无法互联互通的现状,w e b 创始人t b e m e r s l e e 于1 9 9 8 年提出了语义w e b ( s e m a n t i cw e b ) 【1 1 的概念。语义w e b 是 对现有w e b 的一个扩展,希望实现一个全局互联的信息空间,使不同的计算机程 序或系统能够基于精确表达的信息进行协同和交互,其最终目标是使整个w e b 成 为一个全局互联的“数据库,【1 1 。随着国际万维网标准协会( w o r l dw i d ew e b c o n s o r t i u m ,w 3 c ) t 于2 0 0 1 年2 月正式推出语义w e b 活动组【2 】,以及t b e m e r s l e e 等人在科学美国人上发表了介绍语义w e b 的文章【3 1 ,语义w e b 开始进入w e b 研究发展的主流。为了使不同的系统能够进行互操作,语义w e b 需要借助一个被称为本体( o n t o l o g y ) 的构件,来形式化地表达和描述信息或数 据的语义。作为实现语义w e b 的重要基础,本体提供了一种形式化和可重用的复 杂领域知识的表示方式。从语义w e b 的体系架构( 图1 1 ) 中可以看出,本体在 整个语义w e b 中所处的位置在r d f 和r d f s 层之上,在l o g i c 层之下,因此, 本体是语义w e b 的逻辑表示基础,在构建基于语义的应用和系统中发挥着至关 重要的作用。 语义w e b 的实现很大程度上依赖于本体的建立,同时本体也越来越广泛地 被应用到各个领域,如信息检索、机器翻译、知识管理、电子商务和信息集成等。 目前许多学科和领域都创建了相应的大规模领域本体,如面向生物医学的本体 u n i f i e dm e d i c a ll a n g u a g es y s t e m ( u m l s ) r 5 1 、面向基因化合物的本体g e n e o n t o l o g y l 6 】等,直接用于支持各种领域相关的语义w e b 应用。本体研究虽然并非 始于计算机领域,但是随着知识共享、信息集成、语义w e b 和w e b 服务等技术 的发展和推动,本体研究在计算机领域倍受关注,并逐渐成为研究的前沿和热点。 1 h t t p :w w w w 3 o r g 浙江大学博士学位论文 第1 章绪论 、r u t e s 圈1 l 语义w e b 体系架构田( 引自t b 盯n e r s - l e e 在x m l 2 0 0 0 上的演讲 为了实现语义w e b 的最终构想,必然需要构建大量的领域本体。当领域本体 不断地完善,其知识库( k n o w l e d g e b a s e ) 的内容不断地更新和增加,本体的规模 也会不断扩大,如u m l s 包含了近百万个概念和两百多万个概念名,c r e i l e o n t o l o g y 包含了近2 万个概念( 表1 a ) 。 表1 1 部分大规模的领域本体及其规模z 查壁生整塑垫塑羞塑丝 u m l s 9 醐7 5 3 5 4 多稳:盘洫刚 o p e n c y c ;一7 , 0 0 0i 簿惫 s u g g e s t e du p p e r m e r g e d o n t o l o g y 2 0 0 0 0 多个名词 7 0 0 0 0 多条公理 m g e d2 3 3 个概念,1 4 3 个 o n t o l o g y属性,6 8 1 个实例 h t i p :w w w g e n e o n t o l o g y o r g h t t p :l l w w w o p o n c y co r g h t t p :w w w o n t o l o g y p o r t a l 吲 h t l p :m g e d s o u r c e f o r g e n e t o n t o l o g i e s m o e d o n t o l o g y p h p 2 车立培出的统计数据为截至2 啷年3 月份的数据 新旺大学博士学位论文第l 章鳍论 当本体增长到一定的规模时,会降低系统处理和使用本体的效率,以至于一 般的应用无j 圭有效地利用和维护本体m l 。此外,基于规模庞大的本体直接进行查 询或推理,算法的复杂度会随着本体的规模呈指教增长,从而无法满足实际应用 的需要因此,在大规模本体和语义w e b 应用之同还存在一定的鸿沟( 田1 2 ) 。 因此,对于像g e n eo n t o l o g y 这样的大规模本体,必须提供一种模块化和局 部化的机制,允许基于语义的应用根据特定的上下文动态地重用本体本文正是 基于这样的研究背景,从局部化和动态性的角度来对本体重用( o n t o l o g yr e u s e ) 进行比较深入的探索和研究 本体 一 要t m 川系统t 固亘 啦川系统1 j 盈圜 飞量 、盈卤 田1 2 奉体与语义w e b 应用系统之闻的鸿沟 1 1 0 研究目的与意义 本体作为语义w e b 的知识表示基础,在构建基于语义的系统或应用中发挥着 至关重要的作用一个比较完善的领域本体通常规模庞大、内容众多,而一个具 体的语义w e b 应用往往只需要利用领域本体的部分内容。从目前语义w e b 和本 体的研究来看,还缺乏比较有效的本体重用模型与方法,来支持在语义w e b 应用 中对大规模本体的重用,特别是在动态、开放的w e b 环境下目前本体工程 ( o n t o l o g y 衄g i e f i n g ) 的研究也更多地侧重在本体的表示建模和开发等方面, 浙江大学博士学位论文 第1 章绪论 而在如何重用本体( 尤其是大规模本体) 方面还缺乏比较有效的模型与方法。 本文正是从这样的需求出发,面向基于语义的应用,以语义w e b 和本体的相 关理论和技术为基础,研究本体重用的局部化表示模型及其相关理论,支持对大 规模领域本体的动态重用与共享,为构建基于本体的语义w e b 应用提供更加有效 的模型与方法。本文的研究内容具有以下几个方面的意义: 口从表示的角度,为语义w e b 应用提供更加形式化的大规模本体的局部化表示 方法,并通过一种基于缓存的架构动态地组织模块化的语义信息,使得语义 w e b 应用能够更加方便地基于大规模本体创建局部的知识库,提高系统利用 大规模本体的效率,支持对大规模本体的动态重用; 口从算法的角度,基于本体的局部化表示方法,研究和实现了一系列针对大规模 本体的算法,能够进一步提高语义w e b 应用在执行包括推理在内的复杂任务 的效率,进一步扩展了系统重用大规模本体的能力; 口从应用的角度,将本文的研究内容与中医药应用相结合,提出基于子本体的中 医药知识服务原型系统,从一定程度上解决了大规模中医药本体的共享和重用 问题,为构建基于本体的中医药知识系统提供了有效的模型与框架。 1 2 主要研究内容和创新 针对大规模领域本体的重用问题,通过对现有的问题和挑战进行分析并提出 合理的解决方案,本文将面向大规模本体重用的子本体模型作为研究课题。首先 简要介绍了本体的基础知识和相关研究情况,作为后续内容的理论基础和依据; 接着针对大规模本体,研究了本体的局部化表示方法,定义了子本体的概念,以 及相关的对象操作和子本体的知识库模型,能够比较有效地从本体中获取和处理 子本体;同时还研究了子本体的推理问题,提出了面向子本体的模块化推理算法; 然后还着重讨论了子本体知识库优化的问题,利用遗传算法对基于本体的系统所 拥有的子本体进行优化;基于上述的子本体表示和优化方法,进一步研究了基于 子本体的资源管理,提出了一个资源优化算法,支持动态的资源匹配和利用;最 4 浙江大学博士学位论文 第1 章绪论 后给出了一个子本体原型系统,及其在中医药领域的应用。 本文在理论上的创新点可以概括如下: ( 1 ) 提出了形式化的大规模本体的局部化表示方法。将来自于大规模本体的上下 文相关的模块表示为子本体,定义了一组针对子本体的对象操作,并且证明了子 本体操作所产生的子本体是正确的。在子本体表示的基础上,进一步提出了子本 体知识库模型,利用缓存的思想来提高本体重用的效率,使得语义w e b 的应用能 够动态地创建以子本体为单位的局部知识库,支持对大规模本体的动态重用。 但) 提出了面向大规模本体的模块化推理方法。结合描述逻辑中的基本推理任务, 提出了面向子本体的推理任务,将面向大规模本体的推理问题转化为面向子本体 的推理问题,从一定程度上降低了推理的复杂性、提高推理的效率。给出了面向 子本体表示的t a b l e a u 算法,支持基于子本体的模块化推理。同时讨论了基于子 本体的推理与基于源本体的推理之间的一致性问题,并提出了保持一致性的扩展 推理算法。 ( 3 ) 提出了基于演化的子本体知识库的优化方法。提出了一种基于语义的遗传算 法,利用本体的形式化语义来改进常规遗传算法,使其更加适合于解决基于语义 的优化问题。针对系统需求变化的情况,利用基于语义的遗传算法对子本体知识 库的内容进行动态地演化,使得子本体知识库能够以自适应的方式满足需求的变 化。与一般的缓存策略相比,该方法在效率上和性能上都有比较明显的优势。通 过优化方法的局部性演化,能够进一步提高子本体知识库的效率。 ( 4 ) 提出了基于子本体的资源集成与管理方法。利用子本体的语义对分布式的 w e b 资源进行集成,在资源模式和子本体之间建立语义映射,实现了以子本体为 单位的w e b 资源管理,将子本体模型和基于语义的资源管理相结合,提出了一种 基于子本体的资源管理方法。利用遗传算法进行动态的资源优化,进一步提高了 资源匹配和重用的效率。 1 3 本文组织结构 本文的组织结构如下: 浙江大学博士学位论文 第1 章绪论 第一章是绪论,主要介绍本文的课题研究的背景、目的和意义,通过简单描 述本文的主要内容来指出所做的研究工作和论文的创新之处。 第二章对本体以及本体重用进行了综述。首先简要介绍了本体的基础知识, 包括本体的基本定义、表示语言、逻辑基础、建模和开发等,为后续的内容提供 基本的理论依据,同时介绍了与本文的课题相关的研究进展,对本体重用的研究 现状进行了综述。 第三章针对本体重用的局部化,提出了子本体表示方法。定义了子本体的基 本概念,利用子本体来表示上下文相关的局部化本体模块,给出了子本体相关的 对象操作。将缓存机制与本体重用相结合,提出了基于动态存储模型的子本体知 识库,利用案例推理中的动态存储模型组织子本体,支持模块化的大规模本体重 用。 第四章主要讨论了如何进行基于子本体的模块化推理。提出了子本体中的基 本推理问题,说明了推理的必要性和重要性。给出了基于子本体表示的t a b l e a u 算法,支持模块化的本体推理。研究了子本体推理和本体推理之间的一致性问题, 证明了基于子本体的t a b l e a u 推理相对源本体而言是半判定的,并给出了保持一 致性的扩展推理算法。此外,还分析了基于子本体的t a b l e a u 推理算法的时间复 杂度,并和其他现有的推理算法进行了对比。 第五章针对子本体知识库的优化问题,提出了一种基于遗传算法的优化方法。 对常规的遗传算法进行语义上的扩展,并利用基于语义的遗传算法对子本体知识 库中的语义信息进行动态地演化,优化知识库的语义结构,使子本体知识库通过 持续地演化满足本体重用的需要。针对子本体知识库的优化问题,对优化算法的 性能和效率进行了量化分析。 第六章针对动态、开放的分布式环境,提出了一种基于子本体的资源集成与 管理方法。基于子本体的语义对分布式的w e b 资源进行集成,并利用遗传算法进 行动态的资源匹配和优化,实现了以子本体为单位的w e b 资源管理。针对数据库 形式的w e b 资源,并通过一个模拟试验进一步验证和评价了该方法。 第七章设计并提出了子本体服务原型系统d a r t o n t o ,介绍了系统的总体结构 6 浙江大学博士学位论文 第1 章绪论 和实现原理,针对中医药领域的具体应用,描述了面向中医药的子本体知识服务 体系,并通过实例说明如何应用子本体模型解决中医药领域的本体重用问题。 第八章对本文的内容进行总结与展望。 浙江大学博士学位论文第2 章本体重用综述 第2 章本体重用综述 本体的概念最初来源于哲学领域,但是已经在信息领域如自然语言理解、知 识表示与获取、数据集成和信息检索等多个方向上得到了广泛的应用。本体和本 体工程吸引了来自不同领域的学者和研究人员,已经逐步成为信息领域的一个研 究热点。本章对本体的基础知识以及与本文相关的研究内容进行概括与总结,为 后续的章节提供基本的理论依据。 2 1 本体的基础知识 2 1 1 本体的基本概念 本体最初是哲学领域的一个概念,可以追溯到公元前古希腊哲学家亚里士多 德尝试对世界上的事物分类。在哲学上本体被定义为“对世界上客观存在物的系 统地描述,即存在论”。本体被引入信息领域始于人工智能的研究。在2 0 世纪6 0 年代的问题求解通用方法的研究中,研究人员开始利用有组织的领域知识来支持 自动推理。j m c c a r t h y 设想了一种具有常识的计算机程序,并使用适合逻辑语言 的语句来表达其知识【7 】【础;而j es o w a 也认为必须构建知识系统,尽可能地包含 世界上的事物及其相互之间的联系和相互影响的方式【9 】。知识在人工智能领域中 的应用形成了一个新的研究领域知识工程【1o 】。通过重用现有的知识,可以提 高知识库的构建效率,降低工作量和构造成本。因此,研究人员开始对各个领域 进行建模,分析领域的知识,确定领域内公认的词汇,并形式化地定义这些词汇 之间的关系。 t g r u b e r 和r n e h c e s 等人于1 9 9 1 年最早把本体明确定义为“构成相关领域 词汇的基本术语和关系,以及利用这些术语和关系构成的规定该词汇外延的规 则”【l l 】。t g r u b e r 采用概念化的形式定义 _ 一r d f 和r d f s ( r e s o u r c e d e s c r i p t i o nf r a m e w o r ks c h e m a ) 【2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大型宣传活动策划方案范本
- 陶瓷生产线智能化升级技术路线分析报告
- 高校学生创业计划书范本
- 微波铁氧体器件调测工成本预算考核试卷及答案
- 焊管机组操作工三级安全教育(公司级)考核试卷及答案
- 汽轮机运行值班员三级安全教育(车间级)考核试卷及答案
- 环境复杂度对机器人协同影响分析报告
- 12 一幅名扬中外的画(教学设计)-2023-2024学年统编版语文三年级下册
- B Your Friends说课稿-2025-2026学年初中英语北京课改版北京出版社2007七年级上册-北京课改版北京出版社
- 粉末冶金成型工抗压考核试卷及答案
- 超声科医院感染管理:培训与演练
- 养老院餐饮供应服务行业发展全景调研与投资趋势预测研究报告
- 《学会聆听(第一课时)》教学课件
- 中药草乌课件
- DL-T 892-2021 电站汽轮机技术条件
- 手术室核心制度
- 2023年社区工作者面试题库及答案
- 火力发电土建项目监理实施细则
- 上海肿瘤医院病理报告
- 普通动物学课件
- 医院疼痛科建设与管理的标准化经验
评论
0/150
提交评论