已阅读5页,还剩58页未读, 继续免费阅读
(管理科学与工程专业论文)基于本体语言owl的知识表示及推理算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着科学技术的迅速发展,知识更新速度加速度增长。这对高校的师生提m 了 更高的要求,需要更快速准确地掌握本学科领域最新的发展动态,以提高教学科研 水平。为此,提出丹发一个基于语义w e b 的教研辅助系统平台。该平台为广大高校 师生了解本学科领域的知识以及掌握学科发展动态提供支持。本文旨在为该教研辅 助系统平台建立良好的知识表示方法并设计其推理算法。 知识表示是人 二智能的一个永恒的主题。目前为止人们提出的具较大影响力的 几种知识表示方法包括:谓词演算、语义网络、框架、概念图、本体论方法等。但 是几乎每一种知识表示方法都不能兼顾表示能力与推理能力。知识表示语言对表示 能力,可理解性,可操作性,可扩充性的要求都很高:并且要求能够针对不同用户 群分层设计,语法简便。w e b 本体语言o w l 作为w 3 c 对本体描述语言的推荐标 准,基本具各知识表示语言所要求的优良性质。本文简要分析了前述的这几种知识 表示方法,在此基础之上,提出了基于语义w e b 的教研辅助系统的知识库的知识表 示方法。该力。法以教育部颁发的普通高等学校本科专、i k 目录中设立的学科体系 为知识框架建立依据,以w e b 本体语言o w l 为表示语言,将知识资源分为课程内 容、新闻、报告、学习心得等1 3 种类型并埘不同类型知识的表示加以区别。文中 对各种类型知识资源的表示 。法均加以说明,其中,重点阐述了课程内窖的本体论 知1 : 表示方法并简单介绍了其它各种类型知识的表示方法。随后,分析了将传统的 深度优先搜索算法和广度优先搜索算法应用到基于此种知识表示方法的推理算法 的可行性。然后,应用几个实例说明文中提出的知识表示方法的具体实现技术,并 崩一个知识检索的实例展示了原型系统的应用效果。论文最后针埘该种知识表示方 法提出了可改进之处,并指出了后续工作的重点。 硕士研究生于娟( 管理科学与工程) 指导教师马金平教授 关键词:知识表示:本体论;o w l ;学科体系;推理算法 o w l k n o w l e d g er e p r e s e n t a t i o na n dr e a s o n i n ga l g o r i t h m a b s t r a c t k n o w l e d g ee x p l o s i o na n dt e c h n o l o g yd e v e l o p m e n td e s i r eag r e a td e a lw o r kt oc a t c h u p ,e s p e c i a l l y f o ru n i v e r s i t yt e a c h e r sa n ds t u d e n t s ,w h os h o u l d g r a s p t h el a t e s t k n o w l e d g ea n dt h en e w e s tt e c h n o l o g yf o rt h e i rs t u d ya n dr e s e a r c h i nt h a t ,at e a c h i n ga n d r e s e a r c h i n ga i ds y s t e mw h i c hi sb a s e do ns e m a n t i cw e bw a sd e v e l o p e dt oa i du n i v e r s i t y t e a c h e r sa n ds t u d e n t si ni n f o r m a t i o nr e t r i e v a la n dk n o w l e d g eo b t a i n i n g t h i sd i s s e r t a t i o n p r o b e si n t ot h ek n o w l e d g er e p r e s e n t a t i o na n dr e a s o n i n ga p p r o a c ho ft h es y s t e m a p p r o a c h e st ok n o w l e d g er e p r e s e n t a t i o nh a v eb e e nk e e p i n go n e o ft h em o s t i m p o r t a n ta n dt h em o s tp o p u l a rs u b j e c ti nt h ef i e l do fa r t i f i c i a li n t e l l i g e n c e s e v e r a l i n f l u e n t i a la p p r o a c h e sh a v eb e e nr a i s e db u tn o n ep r o v i d e sb o t he f f e c t i v er e p r e s e n t a t i o n a n dp o w e r f u lr e a s o n i n gm e c h a n i s m k n o w l e d g er e p r e s e n t a t i o nl a n g u a g en e e d st ob e e x p a n d a b l e ,e a s yt ol e a r na n dt ou s ea n ds u i t a b l ef o rd i f f e r e n tk i n d so fu s e r s w e b o n t o l o g yl a n g u a g eo w l , w h i c hi s ar e c o m m e n d a t i o no fw 3 c ,b a s i c a l l yp o s s e s s e st h e r e q u i r e dq u a l i t i e so fb e i n gar e p r e s e n t a t i o nl a n g u a g e t h i sd i s s e r t a t i o na n a l y z e so w l a n di n i t i a t e sa no w lk n o w l e d g er e p r e s e n t a t i o na p p r o a c hw h i c hi sb a s e do nc u r r e n t c h i n ad i s c i p l i n es y s t e m t h i sa p p r o a c hd i v i d e sa l lo ft h ed i g i t a lk n o w l e d g er e s o u r c e s i n t o1 3 t y p e s ,i n c l u d i n gc o u r s e s ,n e w s ,e t c i t m a k e sd i s t i n c t i o n s a m o n gt h e r e p r e s e n t a t i o no fd i f f e r e n tt y p e so fr e s o u r c e sa n du s e so w la st h eo n l yo n e r e p r e s e n t a t i o nl a n g u a g e t h i sd i s s e r t a t i o ni n t r o d u c e sb r i e f l yt h er e p r e s e n t a t i o na p p r o a c h o fe a c ht y p eo fk n o w l e d g er e s o u r c ea n de x p l a i n sd e t a i l e dt h eo n t o l o g yr e p r e s e n t a t i o n a p p r o a c ho fo n eo ft h ek n o w l e d g er e s o u r c e - c o u r s e i ta n a l y z e st h ef e a s i b i l i t yo fa p p l y i n g t h et r a d i t i o n a ld e p t h - f i r s t a l g o r i t h ma n dt h eb r o a d f i r s ta l g o r i t h mi n t ok n o w l e d g e r e a s o n i n g i te x p l a i n ss i m p l y t h e i m p l e m e n t a t i o nt e c h n o l o g y o ft h i s k n o w l e d g e r e p r e s e n t a t i o na p p r o a c ha n dt h e i q l nr e s u l to ft h ep r o t o t y p es y s t e mu s i n gs e v e r a l e x a m p l e s i nt h ee n d ,t h i sd i s s e r t a t i o np o i n t so u tw h a ts h o u l db ei m p r o v e da b o u tt h e k n o w l e d g er e p r e s e n t a t i o na p p r o a c ha n dt h em a i nf a c e t so ft h ef u t u r ew o r k p o s t g r a d u a t es t u d e n t :y uj u a n ( m a n a g e m e n ts c i e n c ea n de n g i n e e r i n g ) d i r e c t e db yp r o f m aj i n p i n g k e yw o r d s :k n o w l e d g er e p r e s e n t a t i o n ;o n t o l o g y ;o w l ;d i s c i p l i n es y s t e m ; r e a s o n i n ga l g o r i t h m 第一章绪论 1 1 相关文献综述 第一章绪论 知识表示如何最佳地捕捉智能行为的关键特征以供在计算机上使用,或者 泌以供与人类进行交流一直是人工智能( a r t i f i c i a li n t e l l i g e n c e ,a i ) 的一个永 恒的主题。知识表示的研究源于2 0 世纪5 0 年代,7 0 年代成为研究热点。到目前为 止人们提出的具较大影响力的几种知识表示方法包括:谓词演算、语义网络、框架、 概念图、本体论方法等。每一种知识表示方法均能有效地表示某一类知识。这些知 识表示方法各有不同的形式化描述方法。不同的知识表示方法会直接影响对知识的 高效利用和推理机制。 知识表示方法通常致力于提供对于领域的全面地表示以支持智能应用,也即提 供一种表示方法使得能够从显性知识推理出隐性知识【1 j 。但是几乎每一种知识表示 方法都不能兼顾表示能力与推理能力。谓词演算注重推理能力,语义网络、框架、 本体论方法等基于网络图的知识表示方法注重表示能力。描述逻辑竭力在基于网络 的知识表示方法中添加更多规则限制以图在知识表示能力与知识推理能力之间达 到一个令人满意的平衡【1 1 。下面简单分析上述的几种知识表示方法。 谓词演算支持强有力的推理且易于实现系统问交互1 2 j ,其重要功能是根据一系 列真实断言推理出新的正确的表达式,强调对合式表达式的保持真值的运算。由此, 谓词演算的知识表示语言广泛应用于自动推理,模型检查、验证系统等。 语义网络的研究源于q u i l l i a n l 9 6 7 年提出的语义记忆模型1 3 1 ,该知识表示方法 把知识表示为一种图,图中节点划应于事实或者概念,弧对应于概念间的关系和关 联。语义网络通常用于自然语言理解,其第一次计算机实现就是2 0 世纪6 0 年代初 期用于开发机器翻译系统。 框架 4 1 是m i n s k y 于1 9 7 5 年在一篇论文中提出的,是语义网络的扩展。框架的 目的是在显式组织的数据结构中捕捉问题域中隐含的信息连接。它提供了一种用于 将实体表示为结构化的对象的工具,对象可以带有命名槽和对应值。其中,槽包含 的信息有:框架标识信息,框架问关系,框架的特征描述,被框架描述的结构的用 法的过程信息以及实例信息等等。 概念图1 5 j 于1 9 8 4 年由s o w a 提出,是一种有限连接二部图。般认为概念图是 语义网络和框架的进化产物。图的结点表示概念,概念闻的关系,具体对象( 猫、 电话、饭店) 或者是抽象对象( 爱、美丽、忠诚) 。每个概念图可以表示一个命题, 青岛大学硕士学位论文 基于概念图建立的知识库中包含大量这样的图。概念图理论还包括根据现有图产生 新图的运算,比如复制,限定,联合,简化等。总之,该种知识表示方法已经开始 关注表示能力和推理能力的共同提高。 语义网络、框架、概念图等知识表示方法统称为非逻辑的知识表示方法,也称 为关系表示方法。这类方法基于心理学家和语言学家对人类理解、记忆和执行任务 过程的实验研究成果之上。使用这类方法建立的知识库一般是一个描述世界的全局 性的静态的图结构。从实践的角度看,关系表示方法支持连接和相关推理规则的定 义( 比如继承就定义了一种特殊的推理关系) ,其可用性应该比逻辑方法更高。然 而,近几年出现了大量文献质疑这类知识表示方法,例如,机器人研究领域中b r o o k s r a 【6 ,l e w i sj a 和l u g e rg e 7 1 ,情景认知领域中的a g r ep 和c h a p m a nd 【8 j , l a k e o f fg 和j o h n s o nm 【9 1 ,他们指出非逻辑的知识表示方法缺乏明确的语义信息, 因而基于这类方法的应用系统相互间差异较大,几乎无法进行交互。 本体论本来是一个哲学上的概念,近二十年来,本体概念广泛应用到计算机领 域,用于人工智能研究中的知识表示、共享以及重用。本体是对某一领域的概念及 概念之间关系的显式说明。将本体技术应用于知识系统能够为人与计算机系统之间 的通讯提供语法或者语义上的标准,并有助于提高系统可重用性,可靠性及知识获 取能力 1 0 l 。就知识表示而言,本体语言作为描述逻辑语言,兼顾表示能力与推理能 力【1 1 】。本体论知识表示方法是目前最得广大知识表示研究者信任的方法。 当然,除上述知识表示方法,诸如基于规则的表示方法也是最古老的知识表示 方法之一,而且到目前仍然是建立知识密集型问题求解程序的重要技术。规则捕捉 了人类专家在实践中所使用的知识,融合了理论知识、经验性启发以及处理古怪实 例和其他异常情况的特殊规则。尽管如此,强启发系统仍很可能碰到任何现有规则 都不适用的问题,或者将启发规则误用于不适当的情况导致失败。因此,该种知识 表示方法的智能性和灵活性一直受到质疑。 另一方面,新的知识表示方法也在不断涌现,f j 前为止作者查找到的这类新方 法一般仅限于对前述经典知识表示方法的变形。例如,a r ht a w i l l ,w a g r a y 和n j f i d d i a n 在他们的论文中提出一种在多种类信息服务器环境下交叉模式语义 知识的发现和表示方法【1 2 】。x l i 和el a r a r o s a n o 提出了一种用于表示药学、工学 等动态知识的适应性模糊p e t r i 网【1 ”。g a b o rn a g y p a l 和b o r i sm o t i k 在研发欧洲历史 本体期间提出一种新的专用于表示本体中不确定的,带主观色彩的,模糊暂时性知 识的方法,并给出特定的推理方法【1 4 】。又如,2 0 0 4 年在美国人工智能会议上s t e p h e n b a l a k i r s k y ,e l e n am e s s i n a 等人小组讨沦垃圾收集机器人的知识表示时提出面向任 务的知识表示方法【:l 5 l 。c a t h o l i j nj o n k e r 等人在丌发一个多智能主体知识系统时使用 了图形对知识进行表示,并给出了将图形转换为有组织的知识库的图形转换器1 1 。 第一章绪论 国内,刘启和杨国纬提出了利用面向对象的技术表示语义和常识的方法,他们认为 可以将知网中的义原表示为类,同时将概念之间、属性之间的语义关系转换为类之 间关系以及类的属性之间的关系i l ”。刘培奇等人在对现有知识表示方法进行分析的 基础之上提出了扩展产生式规则知识表示方法i l ”。 另方面,针对上述知识表示方法的转换工具,表示语言和推理算法等也在不 断涌现。例如,m c d e r m o t t 以及a l l e n 等人提出的对于趟中的时间的推理1 1 9 h ”】。 k o w a l s k y 和s e r g o t 提出的对简单本体的推理分析【。r u u dv a n d e rp 0 1 提出了一种 能够根据事物特征描述概念的d i p e r 语言陋j 。y u z h o n go u 在论文中提出了一种针 对于w e b 本体语言的基于一阶逻辑的推理算法1 2 “。c a t h o l i j nj o n k e r 等人提出一种将 图形转换为有组织的知识库的图形转换器i l 。r i c c a r d or o s a t i 在论文中对本体论知 识表示方法的推理方法进行了探讨1 2 ”。林仙和刘惟一根据上下文的局部性原理和一 致性原理提出了基于上下文的表示和推理方法【2 ”。 除上述知识表示方法和推理算法之外,作者在硕士研究生期间也提出了一种综 合前述方法的知识表示方法基于学科体系的知识表示方法【2 9 1 和基于课程体系 的本体论知识表示方法【3 0 】。该知谚 表示方法是结合中国国情提出的。 在不同的知识库系统中一e 述知识表示方法各有应用。有的系统仅使用上述表 示方法中的某一种,有的将上述知识表示方法结合起来建立知识库。 1 2 本文研究的目的和意义 随着科学技术的迅速发展,知识更新速度加速度增长。这对高等学校的师生提 出了更高的要求,需要更快速准确地掌握本学科领域最新的发展动态,以提高教学 科研水平。同时,随着i n t e r n e t 技术的进步和网络信息资源的丰富,w e b 成为知识 海洋。容纳3 0 0 亿网页的w e b 已被广大教师作为信息检索、知识获取以了解本 学科领域前沿知识的最主要的教研工具之一。 另方面,由于第一代w e b 存在先天不足,只能按照某种格式进行信息显示, 无法表达语义,致使w e b 成为非结构化的庞大的信息容器,计算机无法将w e b 信 息自动生成为知识,也无法进行精确化的w e b 信息检索,语义识别还需要人工来判 断。基于此,x m l 2 0 0 0 会议上,t i m b e r n e r s l e e 提出了被称为第二代w e b 的语义 w e b ,“语义w e b 目标是实现机器自动处理信息,提供诸如信息代理、搜索代理、 信息过滤等智能服务”【3 “。自从w 3 c 在2 0 0 1 年2 月j f 式推出s e m a n t i cw e b a c t i v i t y ”l ,语义w e b 已成为当前研究的热点领域,被国内外专家学者看作是w e b 未来的发展方向。信息资源的语义描述语言已由最初的r d f 3 4 1 ,r d f s i 35 ,o i l 3 “, d a m l l 3 ”,d a m l + o i l l 3 6 】f 3 8 i 发展到w e b 本体语言o w l l 3 ”。 我们提出开发一个基于语义w e b 的教研辅助系统平台。该系统平台为广大高校 青岛大学硕士学位论文 师生了解本学科领域的知识以及掌握学科发展动态提供支撑。为此,我们建立了具 完备性的知识库并通过语义w e b 爬虫完善知识库。 本文研究的目的就是探讨在构建此系统的过程中需要解决的知识存储、知识检 索及推理等问题,包括:基于o w l ( w e b 本体语言) 的知识表示,推理算法,基 于o w l 的知识库的构建等。本课题的研究对于促进语义w e b 的发展及其商业化的 实现,以及知识管理系统研究开发水平的提高等都具有一定的理论意义和实际应用 价值。 1 3 本文研究的内容和创新点 本文致力于为这个基于语义w e b 的教研辅助系统平台建立良好的知识表示方法 并设计其推理算法。为此需要做三方面工作,第一,基于w e b 本体语言o w l 的知识 表示研究,包括:建立基于o w l 的知识体系、词汇体系、赋值机制,标记语言和语 法;第二,基于上述知识表示方法的推理算法的研究,包括:将传统的人工智能的 算法,例如,深度优先搜索、广度优先搜索等算法应用于基于o w l 的知识表示,建 成新的算法;第三,基于上述知识表示的知识库系统的应用案例。 为此,本文提出了一种基于学科体系的0 w l 知识表示方法,以教育部颁发的普 通高等学校本科专业目录中设立的学科体系为知识框架建立依据,并将知识资源 分为1 3 类,对不同类型知识的表示方法加以区别。对课程内容以教科书内容为依据 构建本体,并使用w e b 本体活言进行本体的描述。并将传统的知识推理算法应用到 该知识表示方法下的冗余检测算法和知识检索算法。 1 4 文章结构 文章共分为七部分。 第一部分“绪论”介绍选题的目的意义以及本文研究的内容和文章的框架。 第二部分“本体论与o w l 语言描述”介绍了本体论及其在知识表示中的应用, 介绍了w e b 本体语言o w l ,分析了其作为知识表示语言的优良性质。 第三部分“基于o w l 语言的学科体系的知识表示”提出以教育部颁发的普通 高等学校本科专业目录中设立的学科体系为知泌框架建立依据的知识表示方法。 将知识资源分为1 3 类并对不同类型知识的表示加以区别。 第四部分“基于o w l 语言的课程内容的知识表示”主要介绍课程内容的本体论 知识表示方法,同时简单介绍了其它类型的知识资源的表示方法。 第五部分“知识推理算法”归纳了该知识表示方法下的冗余检测算法和知识检 索算法。 第一章绪论 第六部分“知识表示实现技术”说明t o w l 女h 识表示的实现技术,并使用几个 应用实例解释了前述知识表示方法的应用。 第七部分“结沧与展望”在总结全文的基础上说明了进一步研究的方向。 各部分之间的关系图如图1 1 所示。 图1 1 论文各部分结构图 青岛大学硕士学位论文 第二章本体论与o w l 语言描述 本章简单介绍了本体论知识表示方法,提出将w e b 本体语言o w l 应用到知识 表示中。为此,对o w l 进行描述,并对它的表示能力,针对用户群的分层,可操 作性,可扩充性等方面进行了简要地分析,说明了o w l 的知识表示过程。基于o w l 的知识表示方法表示能力较强,语法独立,可扩充并适用于分布式系统的知识表示 方法。 2 1 本体论 2 1 1 本体的定义 本体( o n t o l o g y ,本体论o n t o l o g y ) 最早是一个哲学的范畴,意指客观存在的一 个系统的解释和说明,是客观现实的一个抽象本质。后来,随着人工智能的发展, 本体被赋予了新的定义。最初人们对o n t o l o g y 的解并不完善,关于本体的定义也 在不断的发展变化中,比较有代表性的有: n e c h e s 等人于1 9 9 1 年提出的本体的定义为:给出构成相关领域词汇的基本概念 和关系,以及利用这些概念和关系构成的规定这些词汇外延的规则的定义】。 g r u b e r 于1 9 9 3 对本体的定义为:概念模型的明确的规范说明,后来又对其进 行了完善 4 2 i 。 b o r s t 在1 9 9 7 年提出的定义:共享概念模型的形式化规范随明 4 3 o s t u d e r 等人又将b o r s t 对本体的定义完善为:共享概念模型的明确的形式化规范说 明【删。 g u a r i n o 和g j a r e t t a 经过对本体定义进行深入分析,给出了o n i o l o g y 的四层含义l “j : 概念模型( c o n c e d t u a l i z a t i o n ) :通过抽象出客观世界中一些现象( p h e n o m e n o n ) 的相关概念而得到的模型,其表示的含义独立于具体的环境状态。 明确性( e x p l i c i t ) :所使用的概念及使用这些概念的约束都有明确的定义。 形式化( f o r m a l ) :o n t o l o g y 是计算机可读的。 共享( s h a r e ) :o n t o l o g y q 6 体现的是共同认可的知识,反映的是相关领域中公认 的概念集,它所针对的是团体而不是个体。 总之,o n t o l o g y 的目标是捕获相关的领域的知识,提供对该领域知识的共同理解, 确定该领域内共同认可的概念词汇,并从不同层次的形式化模式上给出这些概念和 概念之问相互关系的明确定义。 将本体应用到知识系统中,能够为系统提供以下好处【l o 】: 第二章本体论与o w l 语言描述 可重用性( r e u s a b i l i t y ) :本体是领域内重要实体、属性、过程及其相互关系形 式化描述的基础。这种形式化描述可成为软件系统中可重用和共享的组件 ( c o m p o n e n t ) 。 知识获取( k n o w l e d g ea c q u i s i t i o n ) :构造知识系统时,用已有的本体作为起点和 基础来指导知识的获取,可以提高工作速度和可靠性。 可靠性( r e l i a b i l i t y ) :形式化的表达使得自动的一致性检查成为可能,从而提高 了软件的可靠性。 规范性( s p e c i f i c a t i o n ) :本体有助于确定信息系统( 如知识库) 的需求和规范。 2 1 2 本体的建模元语 g o m e z p e r e z 和b e n j a m i n s 用分类法组织了本体论,归纳出5 个基本的建模元 语( m o d e l i n gp r i m i t i v e s ) 1 4 6 j : 类( c l a s s e s ) 或概念( c o n c e p t s ) :指任何事务,如工作描述、功能、行为、策略 和推理过程。从语义上讲,它表示的是对象的集合,其定义一般采用框架结构,包 括概念的名称,与其他概念之间的关系的集合,以及用自然语言对概念的描述。 关系( r e l a t i o n s ) :领域中概念间的关系,形式上定义为l q 维笛常儿积的子集:r :c 1 c 2 c n 。如子类关系( s u b c l a s s o f ) 。在语义上,关系对应于对象元组的集合。 函数( f u n c t i o n s ) :一类特殊的关系。该关系的前n 一1 个元素可以唯一决定第n 个 元素。形式化的定义为f :c 1x c 2 c n l c 如m o t h e r o f 就是一个函数, m o t h e r - o f ( x ,y ) 表示x 是y 的母亲。 公理( a x i o m s ) :代表永真断言,如概念乙属于概念甲的范围。 实例( i n s t a n c e s ) :代表元素。从语义上讲,实例表示的就是对象。 本体中基本的语义关系共有4 种: 部分关系( p a r t o f ) :表达概念之间部分与整体的关系。 所属关系( k i n d o f ) :表达概念之间的继承关系,类似于面向对象中的子类与父 类之间的关系。 实例关系( i n s t a n c e o f ) :表达概念的实例与概念之间的关系,类似于面向对象 中的对象和类之间的关系。 属性关系( a t t r i b u t e o f ) :表达某个概念是另一个概念的属性。如“价格”是桌 子的一个属性。 在实际建模过程中,概念之问的关系不限于上面列出的四种基本关系,呵以根 据领域的具体情况定义相应的关系。 本体模型建立之后需要一定方式加以描述。目前在具体应用v o o n t o l o g y j 勺表示方 式主要有4 类:非形式化语言,半非形式化语言,半形式化语言,形式化语言。可以 青岛大学硕士学位论文 用自然语言来描述o n t o l o g y ,也可以用框架、语义网络或逻辑语言来描述。 2 1 3 本体的分类 g u a r i n o 提出以详细程度和领域依赖度两个维度对o n t o l o g y 进行划分【4 5 】。具体说 明如下: 按照本体建模的详细程度分为参考本体( r e f e r e n c eo n t o l o g i e s ) 和共享本体( s h a r e o n t o l o g i e s ) 。 按照本体对领域依赖程度划分为:描述与具体应用无关的最普遍的概念及概念 之间的关系的项级本体( t o p 。l e v e lo n t o l o g i e s ) ,如空间、时间、事件、行为等,描 述特定领域中的概念和概念之问的关系领域本体( d o m a i no n t o l o g i e s ) ,描述特定任 务或行为中的概念及概念之间关系的任务本体( t a s ko n t o l o g i e s ) 。描述依赖于特定 领域应用的概念和概念之间关系的应用本体( a p p l i c a t i o no n t o l o g i e s ) 。 2 1 4 本体的构建原则 出于对各自问题域和具体工程的考虑, 有一个标准的o n t o l o g y 的构造方法。但是 有影响力的【4 2 】: 构造o n t o l o g y 的过程各不相同。目前没 g r u b e r 在1 9 9 5 年提出的5 条规则是较 明确性和客观性:o n t o l o g y 应该用自然语言对所定义的概念给出明确、客观的 语义定义。 完全性:所给出的定义是完整的,完全能表达所描述的概念的含义。 一致性:由概念得出的推论与概念本身的含义是相容的,不会产生矛盾。 最大单调可扩展性:向o n t o l o g y 中添加通用或专用的概念时,不需要修改已有 的内容。 最小承诺:对待建模对象给出尽可能少的约束。 2 2 知识表示语言说明 知识表示语言对表示能力,可理解性,可操作性,可扩充性的要求都很高1 4 7 j ; 并且要求能够针对不同用户群分层设计,语法简便,多语种支持等l 鹌】;加之需要在 表示能力与推理能力之间做出艰难的平衡,到目前为止我们并没有非常完善的知识 表示语言。 另一方面,由于我们的系统中结合了多种知识表示方法,如果把各种表示方法 简单地组合在一起舸没有进行适当的融合,则必然会导致系统中存在繁琐的推理接 l 1 ,小便于系统分析,增加了系统_ r 发难度。所以需要有一种统一的形式描述语占 第二章本体论与o w l 语言描述 来融合不同类型的知识。而且利用知识进行推理时又能避免不同类型的知识相互混 淆。这样就使得知识系统能够综合多种知识表示方法的特点,处理更丰富的知识类 型,并针对不同的背景运用合理有效的推理模式,从而提高系统智能性。 w e b 本体语言o w l 适时出现。o w l 作为语义w e b 本体的描述语言,具备较 强的表示和推理能力。下一节就知识表示语言的要求方面对o w l 语言进行分析。 2 3o w l 语言简介 2 0 0 0 年x m l 会议之后,w 3 c 为在网页上标注语义积极推进语义标注语言的研 发。自从w 3 c 在2 0 0 1 年2 月正式推出s e m a n t i c w 曲a c t i v i t y ,w e b 信息资源的语 义描述语言已进化到w e b 本体语言o w l 。 o w l 作为w 3 c 的推荐标准,已受到软件与信息技术公司的关注。各重要公司 纷纷出台o w l 推理工具,例如,p r o t 6 9 6 4 ,j e n a 的o w l a p i 5 0 】等;另有一些公司 声明待o w l 稍加稳定即进行其推理支持工具的研发。我们认为这种互动不仅能够 使得o w l 语言得到支持,同时也将促进其发展。 o w l 的设计满足w e b 本体语言的需求,是w 3 c 一系列与语义w e b 十h 关的并不断 扩大的规范的一部分。o w l 是w 3 c 推荐的语义网“堆( s t a c k ) ”1 5 1 中的一部分,图 2 1 给出了w 3 c 的o n t o l o g v 语言堆描述: 图2 1w 3 c 的o n t o l o g y 语言堆描述 这个“堆”的表达如下: x m l t 5 2 :结构化文档的表层语法,对文档没有任何语义约束。 x m l s c h e m a 53 】:定义x m l 文档的结构约束的语言。 青岛大学硕士学位论文 r d f 【3 4 j 【5 4 j :对象( 或者资源) 以及它们之间关系的数据模型,为数据模型提供 了简单的语义,这些数据模型能够用x m l 语法进行表达。 r d f s c h e m a 3 5 1 :描述r d f 资源的属性和类的词汇表,提供了对这些属性和类 的普遍层次的语义。 o w “”j :添加了更多的用于描述属性和类的词汇,例如类之间的不相交性 ( d i s j o i n t n e s s ) ,基数( c a r d i n a l i t y ) ,等价性,更丰富的属性类型,属性特征( 例如 对称性,s y m m e t r y ) ,以及枚举类( e n u m e r a t e dc l a s s e s ) 等。 2 3 1o w l 的子语言 o w l 提供了三种表达能力递增的子语言o w l l i t e 、o w l d l 和o w l f u l l ,分 别用于特定的用户群体。 o w l l i t e 用于提供给那些只需要一个分类层次和简单约束的用户。例如,虽然 o w l l i t e 支持基数限制,但只允许基数为0 或l 。提供支持o w ll i t e 的工具应该 比支持其他表达能力更强的o w l 子语言更简单,并且从辞典( t h e s a u r i ) 和分类系 统( t a x o n o m y ) 转换到o w l l i t e 更为迅速。相比o w l d l ,o w l l i t e 还具有更低 的形式复杂度。 o w ld l 用于支持强表达能力的同时需要保持计算的完各性( c o m p u t a t i o n a l c o m p l e t e n e s s ,即所有的结论都能够确保被计算出来) 和可判定性( d e c i d a b i l i t y ,即 所有的计算都能在有限的时问内完成) 的知识表示。o w l d l 包括了o w l 语言的 所有语言成分,但使用时必须符合一定的约束,例如,一个类可以是多个类的子类, 但它不能同时是另外一个类的实例。o w l d l 的命名起因于它对应于描述逻辑,这 是一个研究作为o w l 形式基础的逻辑的研究领域。 o w l f u l l 支持最强的表达能力和完全自由的r d f 语法的用户,但是o w l f u l l 没有可计算性保证。例如,在o w lf u l l 中,个类可以被同时看为许多个体的一 个集合以及本身作为一个个体。它允许在一个本体增加预定义的( r d f 、o w l ) 词 汇的含义。这样看来,不太可能有推理软件能支持对o w lf u l l 的所有成分的完全 推理。 o w l f u l l 可以看成是对r d f 的扩展,而o w l l i t e 和o w l d l 可以看成是对 一个受限的r d f 版本的扩展。所有的o w l 文档( l i t e ,d l ,f u l l ) 都是一个r d f 文档;所有的r d f 文档都是一个o w lf u l l 文档,但只有一些r d f 文档是一个合 法的o w l l i t e 和o w l d l 文档。 在表达能力和推理能力上,每个子语苦都是前面的子语言的扩展。这三种子语 言之间有如下关系成立,但这些关系反过来并不成立。 每个合法的o w l l i t e 本体都是一个合法的o w l d l 奉体; 1 n 一 第二章本体论与o w l 语言描述 每个合法的o w l d l 本体都是个合法的o w l f u l l 本体; 每个有效的o w l l i t e 结论都是一个有效的o w l d l 结论; 每个有效的o w l d l 结论都是一个有效的o w l f u l l 结论。 实际应用中进行o w l 子语言的选择时,选择o w ll i t e 还是o w ld l 主要取 决于用户在多大程度上需要o w ld l 提供的表达能力更强的成分。选择o w ld l 还是o w lf u l l 则主要取决于用户在多大程度上需要r d fs c h e m a 的元建模 ( m e t a m o d e l i n g ) 机制( 如定义关于类的类和为类赋予属性等) ;相对于o w l d l , o w l f u l l 对推理的支持是更难预测的。 2 3 2o w l 的r d fs c h e m a 特性 o w l 与r d fs c h e m a 有关系的特性如下: c l a s s ( 类) :类定义了具有某些共同属性的一些个体。多个类可以用予类关系 组织为一个特定的层次结构。一个内置的最一般的类被称为t h i n g ,该类表示的是 所有个体,因此它是所有o w l 类的父类。另外一个内置的特殊类n o t h i n g ,它没有 任何实例,因此是任意o w l 类的子类。 r d f s :s u b c l a s s o f ( 子类) :可以给出一个或多个关于“一个类是另一类的子类” 的陈述来创建一个类层次结构( c l a s sh i e r a r c h i e s ) 。例如,可以声明类p e r s o n ( 人) 是类m a m m a l ( 哺乳动物) 的子类。推理机就可以据此推出:如果某个个体是一个 “人”,那么它也是一个。“哺乳动物”。 r d f :p r o p e r t y ( 属性) :属性表述个体之间或者从个体到数值的关系。分为对象 属性( o b j e c t p r o p e r t y ) 和数据属性( d a t a t y p e p r o p e r t y ) 两类。 r d f s :s u b p r o p e r t y o f ( 子属性) :通过给出一个或多个陈述声明“某属性是另外一 个或多个属性的子属性”可建立属性层次。例如,可以声明h a s s i b l i n g ( 有兄弟姐 妹) 是h a s r e l a t i v e ( 有亲戚) 的子属性。据此,推理机可以推出:如果一个个体以 h a s s i b l i n g 属性与另一个体相关联,那么它也一定可以与这个个体以h a s r e l a t i v e 属 性相关联。 r d f s :d o m a i n ( 定义域) :一个属性的定义域用来约束该属性可以适用的个体。如 果一个个体通过一个属性和另个体关联,并且该属性的定义域是某个类,那么该 个体必然属于这个类。r d f s :d o m a i n 是全局限制,该限制是在属性上声明的,而不是 只有当这个属性应用于某个类时才声明。 r d f s :r a n g e ( 值域) :一个属性的值域用来限制哪些个体可以成为属性的值。如 果一个个体以一个属性和另一个体关联,并且该属性的值域是一个类,那么另外那 个个体必然属于此类。值域也是全局限制。 i n d i v i d u a l ( 个体) :个体是类的实例,个体之问可以用属性相互关联。 一1 1 青岛大学硕士学位论文 2 3 3o w l 中的等价和不等价 下面描述o w l 语言中关于类、属性以及个体问的等价性和不等价性。 o w l :e q u i v a l e n t c l a s s :当两个类被声明为等价时,就是声明它们有相同的实例。 等价性可以用来创建同义类。例如,类c a r 可以被说成是类a u t o m o b i l e 的等价类。 据此,推理机可以推出:任何c a r 的实例都是a u t o m o b i l e 的实例,反之也成立。 o w l :e q u i v a l e n t p r o p e r t y :两个属性也可以被声明为等价。相互等价的属性将一 个个体关联到同组其它个体。它也可以被用来创建同义属性。例如,h a s l e a d e r 可以说成是h a s h e a d 的等价属性( o w l :e q u i v a l e n t p r o p e n y ) 。据此,推理机能够推出: 如果x 通过属性h a s l e a d e r 与y 关联,那么x 也通过属性h a s h e a d 与y 关联。推 理机还能推出:h a s l e a d e r 是h a s h e a d 的子属性,h a s h e a d 同时也是h a s l e a d e r 的子 属性。 o w l :s a m e a s :两个个体可以声明为相同。这个构词用来创建一系列指向同一个 个体的名字。 o w l :d i f f e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海交通大学《钢筋混凝土结构平面识读与钢筋算量》2025-2026学年期末试卷
- 沈阳药科大学《耳鼻喉头颈外科学》2025-2026学年期末试卷
- 沈阳音乐学院《教育学概论》2025-2026学年期末试卷
- 沈阳师范大学《广告文案写作》2025-2026学年期末试卷
- 沈阳音乐学院《公司治理学》2025-2026学年期末试卷
- 上海工艺美术职业学院《跨境电商概论》2025-2026学年期末试卷
- 沈阳药科大学《成人护理学》2025-2026学年期末试卷
- 沈阳师范大学《放射治疗学》2025-2026学年期末试卷
- 上海工艺美术职业学院《工程力学》2025-2026学年期末试卷
- 上海旅游高等专科学校《国际贸易学》2025-2026学年期末试卷
- 总经理(高管)聘用合同
- 电商教学合同
- hc工法组合桩施工方案
- 供电营业厅培训课件
- 清洁教室劳动课件
- 生活垃圾收集人员培训管理方案
- 无人机保险相关知识培训课件
- 十五五特殊教育发展提升行动计划
- 课件:深入学习习近平总书记关于教育的重要论述
- 超声内镜在胰腺疾病诊疗中的应用
- 供应链协同对农村电商发展的机制分析
评论
0/150
提交评论