(计算机应用技术专业论文)基于贝叶斯网络的本体不确定性推理研究.pdf_第1页
(计算机应用技术专业论文)基于贝叶斯网络的本体不确定性推理研究.pdf_第2页
(计算机应用技术专业论文)基于贝叶斯网络的本体不确定性推理研究.pdf_第3页
(计算机应用技术专业论文)基于贝叶斯网络的本体不确定性推理研究.pdf_第4页
(计算机应用技术专业论文)基于贝叶斯网络的本体不确定性推理研究.pdf_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本体( o n t o l o g y ) 作为一种能在语义和知识层次上描述知识模型的建模工具, 提供了概念的规范化描述,为知识的共享奠定了基础。但本体不能表示概念之间的 重叠或相交程度,也不能支持只知道概念或个体的部分信息的推理。贝叶斯决策理 论为处理不确定的事件或推理提供了理论基础。在不确定知识的表示和推理方面, 贝叶斯网络被证明是获得不确定性知识的置信度的最有效方法之一。本文将两者结 合起来,一方面能发挥本体在知识表述和领域范围内共享的优势,另一方面能充分 发挥贝叶斯网络的不确定性推理能力,扩展本体在不确定知识的表示和推理方面的 能力,具有更广泛的应用前景。 本文首先对本体技术进行了介绍。领域本体能够直观的提供对该领域知识的共 同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词 汇( 术语) 和词汇之间相互关系的明确定义。本文还对本体的建模原语和构建方法 进行了介绍,对本体语言o w l 进行了概率扩展,使它能支持不确定性信息的表示, 同时利用斯坦福大学的本体开发工具p r o t 6 9 6 3 3 ,构建带有概率信息的领域本体。 其次,对贝叶斯网络进行了研究。贝叶斯网络是概率论与图论的结合,表示数 据中变量之间的条件独立性与概率分布,用于概率推理。贝叶斯网络是一种有效的 不确定性推理方法。它被广泛用来进行不确定性推理,一个最重要的原因就是现实 世界中存在不确定性,而概率论是表示不确定性的一个合理的方式。本文还介绍了 其它几种不确定的推理方法,及各自的特点。 最后,本文开发将概率本体直接转换成贝叶斯网络的o n t o b n 原型系统。从本 体中抽取概率表示,通过j e n a 提供的o w l a p i ,以及n o r s y s 一公司提供的n e t i c aj a v a a p i 开发o n t o b n 系统,将概率信息转化成贝叶斯网络。实验证明通过贝叶斯网络 能扩展本体的推理能力,从而从知识系统中挖掘出更有价值的信息,辅助用户推理 和决策。 关键词:本体;贝叶斯网络;不确定性推理 a b s 仃a c t o n t o l o g yi sc o n s i d e r e da so n eo ft h ep i l l a r so ft h es e m a n t i cw e b i ti sam o d e l i n g t o o lf o rk n o w l e d g ep r e s e n t a t i o nb o t hi ns e m a n t i ca n dk n o w l e d g eh i e r a r c h y i tc a n p r o v i d ec o n c e p t u a ls p e c i f i cd e s c r i p t i o na n db u i l dt h ef o u n d a t i o nf o rk n o w l e d g es h a r i n g h o w e v e r , o n t o l o g yc a l ln o te x p r e s st h eo v e r l a p o rt h ed e g r e eo fi n t e r s e c t i o n ,a n dc a nn o t s u p p o r tu n c e r t a i n t yr e a s o n i n g b a y e s i a nd e c i s i o nt h e o r yp r o v i d e dt h et h e o r yf o u n d a t i o n o fu n c e r t a i n t ye v e n to rr e a s o n i nu n c e r t a i n t yk n o w l e d g ep r e s e n t a t i o na n dr e a s o n i n g , b a y e s i a nn e t w o r kp r o v e dt ob eo n eo fm o s te f f e c t i v em e t h o d si no b t a i n i n gb e l i e fo f u n c e r t a i n t yk n o w l e d g e t h i sp a p e ri n t e g r a t e db a y e s i a nn e t w o r ki nu n c e r t a i n t yr e a s o n i n g , e x t e n d e do w lw i t hp r o b a b i l i t yd e s c r i p t i o n ,s oa st ol e ti ts u p p o r tu n c e r t a i n t yk n o w l e d g e a n di n c o m p l e t eo ri m p r e c i s ei n f o r m a t i o n ,t h u sw ec a l lp r e s e r v et h ea d v a n t a g e so fb o t h , f o ro n t o l o g yh a sp o w e ro fk n o w l e d g ep r e s e n t i n ga n db a y e s i a nn e t w o r kp r o v i d e sa b i l i t y o fr e a s o n i n g i nt h i sw a y , w ee x t e n dt h ea b i l i t yo fu n c e r t a i n t yp r e s e n t a t i o na n dr e a s o n i n g i no n t o l o g y , a n dc a l lm a k eo n t o l o g yw i d e l yu s e d f i r s t l y ,w ei n t r o d u c e dt h ef o u n d a t i o no fo n t o l o g yb r i e f l y o n t o l o g yi sa l le x p l i c i t , f o r m a lr e p r e s e n t a t i o no ft h ee n t i t i e sa n dr e l a t i o n s h i p st h a tc a ne x i s ti nad o m a i no f a p p l i c a t i o n i tc a np r o v i d e st h ec o m n l o nu n d e r s t a n d i n go fad o m a i n , a n dp r o v i d e st h e e x p l i c i tr e l a t i o n s h i pb e t w e e nt h et e r m si nd i f f e r e n th i e r a r c h y w ee x t e n dw e bo n t o l o g y l a n g u a g e ( o w l ) w i t hp r o b a b i l i t yi n f o r m a t i o n ,m a k e i ts u p p o r tu n c e r t a i n t yp r e s e n t a u o n , a n dw eb u i l dad o m a i no n t o l o g yw h i c hw a se x t e n d e db yp r o b a b i l i t yi n f o r m a t i o ni n p r o t d g d 3 3 s e c o n d l y , w ea l s om a k er e s e a r c ho nt h eb a y e s i a nn e t w o r k b a y e s i a nn e t w o r ki sa n i n t e g r a t i o no fg r a p ht h e o r ya n dp r o b a b i l i t yt h e o r y i t i n d i c a t e st h ec o n d i t i o n a l i n d e p e n d e n c ea n dt h ep r o b a b i l i t yd i s t r i b u t i o na m o n gv a r i a b l e sa n di sw i l d l yu s e di n p r o b a b i l i t yr e a s o n i n g , f o rt h e r ea r eu n c e r t a i n t i e si no u r r e a lw o r l da n db a y e s i a nn e t w o r k c a l l p r e s e n tt h eu n c e r t a i n t y i nam o d u l a rw a y w ea l s oi n t r o d u c e ds e v e r a lo t h e r u n c e r t a i n t yr e a s o n i n gm e t h o d sa n dt h e i rf e a t u r e s f i n a l l y ,w ed e v e l o p e daf r a m e w o r kn a m e do n t o b nt o t r a n s l a t et h ep r o b a b i l i t y o n t o l o g yi n t o ab a y e s i a nn e t w o r k i tc a ne x t r a c tt h ep r o b a b i l i t yi n f o r m a t i o nf r o m o n t o l o g ya n dt r a n s l a t et h ep r o b a b i l i t yc o n c e p t si n t on o d e si nb a y e s i a nn e t w o r k ,a n dc a n r e a s o nb yt h eb a y e s i a nn e t w o r k t h ee x p e r i m e n tr e s u l ts h o w st h a tw ec a ng a i nm o r e i n f o r m a t i o nf r o mi t ,a n dc a np r o v i d eu s e f u li n f o r m a t i o nf o ro u rd e c i s i o n k e yw o r d s :o n t o l o g y ;b a y e s i a nn e t w o r k ;u n c e r t a i n t yr e a s o n l l 独创性声明 本人郑重声明:所提交的学位论文是本人在导师指导下独立进行研究工作所取得 的成果。据我所知,除了特别加以标注和致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果。对本人的研究做出重要贡献的个人和集体,均已在文中作了 明确的说明。本声明的法律结果由本人承担。 学位论文作者签名:日期:型:羔:塑 学位论文使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东 北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许 论文被查阅和借阅。本人授权东北师范大学可以采用影印、缩印或其它复制手段保存、 汇编本学位论文。同意将本学位论文收录到中国优秀博硕士学位论文全文数据库 ( 中国学术期刊( 光盘版) 电子杂志社) 、中国学位论文全文数据库( 中国科学技 术信息研究所) 等数据库中,并以电子出版物形式出版发行和提供信息服务。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:短 日期:兰婴:婴 学位论文作者毕业后去向: 工作单位: 通讯地址: 电话: 邮编: 东北师范大学硕士学位论文 1 1 课题背景及意义 第一章绪论 随着计算机科学和信息技术的飞速发展,人类所面临的知识和信息成倍增长, 在丰富的信息中获取知识日益重要。不同领域的人们都在期待能够从这些堆积如山 的信息中找到自己想要的知识。 对企业而言,知识正在成为其核心的竞争力。特别地,对知识密集型的企业和 组织来说,知识是决定企业和组织成败的战略资源。知识可以确保组织和企业活动 的有序进行,市场竞争目趋激烈客观上要求企业能迅速响应变化并做出合理的决 策。经验、观念等隐式知识对企业的决策也起着不可估量的作用,但是这部分知识 往往难以直接获得。 由于教育背景和研究侧重点的差异,同一领域的研究人员对同一个研究对象也 可能有不同的理解和表述,导致知识难于共享和重用乜1 ,使得基于知识的推理更 加困难。知识是对有用信息按其内在联系进行的组织与分类,要使知识能够在一定 范围内共享、使用,就需要使用一种概括性强又能较为具体地表示出知识之间关系 的表示模型。知识模型系统的研究一直是知识工程领域的一个研究重点瞄儿引。 本体( o m o l o g y ) 作为一种能在语义和知识层次上描述知识模型的建模工具, 提供了概念的规范化描述,为知识的共享奠定了基础拍3 。本体提供对领域知识的结 构化表示,支持对知识的重用,为人机之间的交流提供基础。目前,本体已经是知 识工程和人工智能研究的核心内容之一,而且在知识管理、自然语言处理、电子商 务、信息检索、数据库设计与集成、生物信息学等领域具有广泛的应用。但是到目 前为止,还没有一种本体语言能详细说明在某一领域里面获取关于概念、属性、实 例的不确定知识的方法。对于给定的两个概念,现有的方式是要么描述一个是 另一个的超概念,要么他们是对立的,不能表示概念之间的重叠或相交程度,也不 能支持只知道概念或个体的部分信息的推理。本体这一局限性也使得本体的应用范 围受限。随着各行各业对本体信息的需求日益繁多,如何有效且量化地实现这种不 确定性知识成为当今本体研究的又一热点。 贝叶斯决策理论为处理不确定的事件或推理提供了理论基础。贝叶斯网络被广 泛用来进行不确定性推理。一个重要的原因就是现实世界中存在不确定性,而概率 论是表示不确定性的一个合理的方式。另外一个原因就是贝叶斯网络能模块化地表 示不确定知识,这使得它们易于维护而且可以应用到不同的环境中去。因此贝叶斯 网络在不确定性推理方面就显得非常有吸引力。在不确定知识的表示和推理方面, 东北师范大学硕士学位论文 贝叶斯网络被证明是获得非确定性知识的置信度的最有效方法之阳m 1 0 1 。本文所采 用的研究方法就是利用贝叶斯网络来扩展本体对不确定性知识的表示和推理能力。 1 2 国外研究现状 随着语义网技术的不断深入,本体已经成为国外研究的热点,在多个领域出现 了具体应用,本体的研究与应用主要包括3 个方面h :( 1 ) 理论上的研究,主要研究 概念及其分类、本体上的代数等,其中最有代表性的是g u a r i n o 等人对概念及其分类 进行的研究工作n 船n 朝。( 2 ) 在信息系统中的应用,主要包括处理信息组织、信息检 索和异构信息系统互操作问题。( 3 ) 本体在语义w e b 中的应用。 目前国际上本体应用的著名项目主要有: ( 1 ) ( o n t o ) 2 a g e n t 3 :目的是为了帮助用户检索所需要的w w w 上已有的本 体,主要采用参照本体,即以w w w 上已有的本体为对象建立起来的本体,来保存 各类本体的元数据。 ( 2 ) o n t o b r o k e r n 舶:主要面向w w w 上的网页资源,使用本体转换w e b 文档, 向用户提供基于本体的问答服务,支持用户对知识的查询,目的是帮助用户更好的 检索到所需要的网页。它主要包括查询引擎、信息引擎、推理引擎和数据库管理引 擎等。 ( 3 ) o n t o w e b n6 1 :面向知识管理和电子商务的基于本体的信息交换,是欧盟从 2 0 0 1 年开始支持的项目,目的是联系学术界和工业界,加强各学科之间的联系,加 强欧盟对语义网标准的影响。 ( 4 ) g o d 引:基因本体( g e n eo n t o l o g y ) ,是基因本体联盟旨在建立一个适用 于各种物种的、对基因和蛋白功能进行限定和描述的、并能随着研究的不断深入而 更新的词汇标准。g o 是多种生物学本体语言的一种,提供了三层结构的系统定义 方式,用于描述基因产物的功能。尽管只包括了p a r t o f 等简单的关系,但是对生物 信息学界有着巨大的影响。 ( 5 ) s w o o g l e n8 | :是一个针对互联网上的语义网文档、术语以及数据的搜索引 擎。它利用一种搜索器系统来发现资源描述框架( r d f ) 文档以及内置有r d f 内 容的h t m l 文档。s w o o g l e 会针对这些文档及其组成部分( 如术语和三元组) 进行 推理,并在其数据库中记录和索引具有实际意义的,关于这些文档及其组成部分的 元数据。 但是在本体的不确定性推理和表示方面,国外也刚刚处于起步阶段,还没有成 形的技术和方法。目前,国外在本体不确定性研究方面较为前沿的大学有:s t a n f o r d 、 c m u 、u m b c 、k a r l s r u h e m a n c h e s t e r 、h e l s i n l d 、g e o r g e m a s o n 等。 2 东北师范大学硕士学位论文 1 3 国内研究现状 国内对本体的研究也已经有若干年,主要有信息检索n 引、产品信息建模、虚 拟企业建模汹_ 幻汹3 、常识知识库嘲1 等方面,如中国科学院计算技术研究所大规模 知识系统的研究删、中国科学院数学研究所常识知识库的研究盥刀、浙江大学人工 智能研究所基于本体论的产品信息集成研究等啪1 。 国内研究本体的一些著名专家学者是: 史忠植,中科院计算所研究员,他所主持的本体知识管理系统( k m s p h e r e ) , 可以辅助用户创建、管理领域本体,并提供通用的知识查询语言和知识服务机制, 支持面向应用的语义级知识服务。 曹存根,中科院计算所研究员,主持国家知识基础设施( n a t i o n a lk n o w l e d g e i n f r a s t r u c t u r e ,简称n k i ) 的建设。目标是建立一个大型的可共享的知识群体,不 仅集成各个学科的公共知识,而且还融入了各学科专家的个人知识。将为科研、教 学、科普和知识服务提供有效的知识基础。主要包括以下3 方面的研究内容:( 1 ) n 中的知识理论研究。( 2 ) 大规模知识获取方法研究。( 3 ) n 日支撑下的应用研 究。 俞勇,上海交大电子信息与电气工程学院教授,他负责的a p e x 实验室当前的 主要研究内容包括,下一代搜索技术、本体工程的理论和技术、语义网等。 瞿裕忠,东南大学计算机科学与工程系教授,语义w e b 的关键技术研究,国家 自然科学基金项目。 胡运发,复旦大学计算机与信息技术系教授,研究内容包括,语义w e b 、语义 w e bs e r v i c e s 、语义融合、o n t o l o g y 库、基于o n t o l o g y 库的语义推理、基于规则引 擎软件系统集成等。 我国对本体的研究具有以下几个特点:( 1 ) 近年来关于语义w e b 和本体研究的 论文数量骤增,说明本体作为语义w e b 的核心技术已引起了国内学术界的高度重 视。( 2 ) 论文的参考文献大部分为外文文献,表明我国本体的研究处于起步阶段。 ( 3 ) 对本体的研究具有一定的层次性,从基本介绍到理论探讨,由理论探讨到实 际应用,逐层递进。( 4 ) 在本体不确定性方面表示和推理还没有成形的技术和方法。 1 4 本文的主要研究工作 本体作为能在语义和知识层次上对知识系统建模的工具,由于它本身不能表示 不确定性知识,因而使它的应用范围受限,本文尝试扩展本体对不确定性知识的表 达能力。 本文利用o w l ( w e bo n t o l o g yl a n g u a g e ) 语言构建个简单的领域本体,将与 之相关的信息分别建成类。同时将表示不确定性的概率信息,也附加在它上面,这 东北师范大学硕士学位论文 样构建好的本体,就是带有概率扩展的o w l 本体。我们采用贝叶斯网络作为底层 的推理机制,贝叶斯网络的推理分为诊断性推理和预测性推理,当然也可以将两者 结合起来进行推理,贝叶斯网络的推理实际上是概率计算的过程。我们根据已知的 条件概率和给定的先验概率,可以推知最大的后验概率。 在本文中我们开发了一个将o w l 本体直接转换成贝叶斯网络的原型系统,利 用j e n a 开发了专门解析带有概率扩展的o w l 本体的本体解析模块,经过解析之后 将会生成三个文件,分别用于后期构建贝叶斯网络。格式转换模块,可以将解析生 成的三个文件进行格式的转换,使之更符合后期自动构建贝叶斯网络。贝叶斯构建 模块,利用n o r s y s 公司提供的n e t i c aa p i ,以j a r 包中封装好的图形模块为基本图 形元素,利用格式转换模块生成的类一实例文件,先验概率,条件概率这三个文件, 自动构建贝叶斯网络中的节点和边。最后构建好的贝叶斯网络可以在贝叶斯网络浏 览器或者n e t i c a 软件中直观地显示成图形化形式,我们可以在任意节点上输入已知 的证据,与之有因果关系的节点上的概率值,都会跟着变化,进而为我们的决策提 供依据。 本文的内容安排如下: 第一章:简要介绍本课题研究的背景、意义、国内外的研究现状,以及本文的 主要内容和基本框架结构。 第二章:这一章对本体的基础理论进行了详细的介绍,对本体的建模原语,构 建方法,本体语言和本体的分类都做了简要介绍,还介绍了不确定性推理的方法。 同时,对贝叶斯网络的概率基础和定义都做了简要的论述。 第三章:本章主要对本文所做的工作进行叙述。首先构建领域本体,并对o w l 语言进行了概率的扩展,给出了先验概率和条件概率的一般表达方式,还对系统中 用到的关键技术进行了研究。 第四章:本章介绍本课题提出的o n t o b n 系统的设计和实现,介绍了系统的开 发环境,系统结构,各部分功能模块,最后给出了实验结果,证实了本文所提出的 基于贝叶斯网络的本体不确定性推理,确实可以得出普通本体所不能得到的知识, 可以为生产实践和决策,提供依据。 第五章:本章主要对本课题作概括总结,并对后续工作进行了展望。 1 5 本章小结 本章简要的介绍了本体不确定性表示和推理的研究目的和意义以及国内外的 研究现状,最后给出了本文的主要内容和基本框架结构。 4 东北师范大学硕士学位论文 第二章本体与贝叶斯网络概述 2 1 本体相关理论概述 2 1 1 本体的定义 本体的概念最初来源于哲学,表示客观存在的一个系统的解释和说明,客观现 实的一个抽象本质。后来随着人工智能的发展,被人工智能界赋予了新的定义。 1 9 9 3 年,g r u b e r 给出了本体的一个最为流行的定义嘲3 ,即“本体是概念模型 的明确的规范说明”。后来,b o r s t 在此基础上,给出了本体的另外一种定义啪1 : “本体是共享概念模型的形式化规范说明”。s t u d e r 等对上述两个定义进行了深入 的研究,认为“本体是共享概念模型的明确的形式化规范说明 。这包含4 层含义 1 。:概念模型( c o n c e p t u a l i 、明确、形式化 和共享( ) 。 1 概念模型:指通过抽z a t 象i o n 出) 客观世界( e x 中p l i c 些i t ) 现象的相关( f o 概r m 念a l 而) 得到的模s 型h a r 。e 概 念模型所表现的含义独立于具体的环境状态。 2 明确:指所使用的概念及使用这些概念的约束都有明确的定义。 3 形式化:指本体是计算机可读的( 即能被计算机处理) 。 4 共享:指本体中体现的是共同认可的知识,反映的是相关领域中公认的概念 集,即本体针对的是团体而非个体的共识。 从以上定义我们可以认为构造本体的目标是捕获相关领域的知识,提供对该领 域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上 给出这些词汇( 术语) 和词汇间相互关系的明确定义。因此本体描述了知识,提 供对该领域知识的共同理解和表示。 2 1 2 本体的建模原语 p e r e z 等人用分类法组织了本体,归纳出五个基本的建模原语( m o d e l i n g p r i m i t i v e s ) 或者五个基本元素口副。 1 类( c l a s s ) 或概念( c o n c e p t ) :指任何事物的抽象,如工作描述、功能、行 为、策略和推理过程等。从语义上讲,它表示的是对象的集合。 2 关系( r e l a t i o n s ) :在领域中概念之间的交互作用。关系对应于对象元组的集 合,形式上定义为砚维笛卡儿积的子集。r :c 1 c 2 g ,如子类关系 ( s u b c l a s s o f ) 。 3 函数( f u n c t i o n s ) :一类特殊的关系。该关系的前刀一1 个元素可以唯一决定 5 东北师范大学硕士学位论文 第刀个元素。形式化的定义为映射,:c l c 2 c q e 。如:函数 f a t h e r - o f ( x ,y ) 表示x 是y 的父节点。 4 公理( a x i o m s ) :代表永真断言,如概念乙属于概念甲的范围。 5 实例( i n s t a n c e s ) :代表元素,从语义上讲实例表示的就是对象。 这5 个基本元素,也为构建本体提供了依据和方法。 2 1 3 本体的构建方法 本体的构建没有统一和标准的方法,目前常用的构造方法主要有以下几种: 1 t o v e 法 t o v e 是指多伦多虚拟企业( t o r o n t ov i r t u a le n t e r p r i s e ) ,专用于构建关于企 业建模过程的t o v e 本体,是由多伦多大学企业集成实验室研制,使用一阶谓词逻 辑进行集成。t o v e 本体包括企业设计本体、工程本体、计划本体和服务本体。 2 m e t h o n t o l o g y 法 m e t h o n t o l o g y 法,专用于构建化学本体,该方法已被马德里大学理工分 校人工智能图书馆采用。它的流程包括: ( 1 ) 管理阶段:这一阶段的系统规划包括任务的进展情况、需要的资源、如何 保证质量等问题。 ( 2 ) 开发阶段:分为规范说明、概念化、形式化、执行以及维护五个步骤。 ( 3 ) 维护阶段:包括知识获取、系统集成、评价、文档说明、配置管理五个步 骤。 目前,采用这种方法开发的本体有:( o n t o ) 2 a g e n t 和化学本体( c h e m i c a l o n t o l o g y ) 等。 3 。骨架法 骨架法,专门用来构建企业本体。它建立在企业本体基础之上,为相关商业企 业提供术语和定义的集合,该方法只提供开发本体的指导方针。目前企业本体项目 由爱丁堡大学人工智能研究所及合作伙伴共同承担。主要分为以下的步骤: ( 1 ) 确定本体应用的目的和范围:根据所研究的领域或任务,建立相应的领域 本体或过程本体,领域越大,所建本体越大,因此需限制研究的范围。 ( 2 ) 本体分析:定义本体所有术语的意义及其之间的关系,该步骤需领域专家 的参与,对该领域越了解,所建本体就越完善。 ( 3 ) 本体表示:一般用语义模型表示本体。 ( 4 ) 本体评价:建立本体的评价标准是清晰性、一致性、完善性、可扩展性。 ( 5 ) 本体的建立:对所有本体按以上标准进行检验,符合要求的以文件的形式 存放,否则转( 2 ) 。 4 k a c t u s 工程法 6 东北师范大学硕士学位论文 k a c t u s 工程法是基于k a c t u s 项目而产生的,k a c t u s 是指“关于多用途 复杂技术系统的知识建模”工程,是欧洲e s p r i t 框架下的研发项目之一,属于 e s p r i t - i l l 所支持的项目。支持e x p r e s s 和o n t o l i n g u a 语言。主要包括以下步骤: ( 1 ) 应用说明:提供应用的上下文和应用模型所需的组件。 ( 2 ) 相关本体范畴的初步设计:搜索已存在的本体,进行提炼、扩充。 ( 3 ) 本体的构造:用最小关联原则来确保模型既相互依赖,又尽可能一致,以 达到最大限度的系统同构。 5 七步法 斯坦福大学医学院提出的七步法,主要用于领域本体的构建。七个步骤分别是: ( 1 ) 确定本体的专业领域和范畴:在开始构造本体知识库之前,必须明确本体 的用途、覆盖范围和使用者。这些问题的答案随着知识本体设计过程的深入是可以 随时调整的,但是在任何特定的时间段里,他们对于限制模型的范畴都是有帮助的, 所以需要相对稳定,这样有助于最终达到设计需要。 ( 2 ) 考查复用现有本体的可能性:建立本体的目的就是要解决知识的重用和共 享,在建立一个新本体时尽量考虑重用已有的本体,这样一方面会减轻工作量,使 构建本体的周期缩短;更主要的是如果一个系统需要和其他应用系统交互时,这就 更有必要重用已有的本体。 ( 3 ) 列出本体中的重要术语:所谓重要是指所列出的术语对领域模型的解释贡 献比较大。同时将术语的尽可能多的性质和属性也列出来,还要列出与术语相关的 其他术语。 ( 4 ) 定义类和类的等级体系:定义概念的性质和属性,还要确定概念之间的层 次关系。可以采用自顶向下法,即由某领域中最大的概念开始,然后再将这些概 念细化;自底向上法,即由底层最小类的定义开始,它们是这个等级体系的细枝末 节,然后将这些细化的类组织在更加综合的概念之下;综合法,综合上两种方法。 每位研究者要采取什么方法主要依赖于个人对这一专业领域的理解程度,但是无论 选择哪种方法,都要从定义类开始。 ( 5 ) 定义类的属性:一旦定义好了类,就必须开始描绘概念间的内在结构。首 先从第三步的术语列表中选择好类,绝大多数剩下的术语可能是这些类的属性 ( p r o p e r t i e s ) 。任意一个类的所有子类都会继承该类的属性。通常,有几种对象属 性的类型能够成为一个本体中的属性: 1 ) 内在属性( i n t r i n s i cp r o p e r t i e s ) ,例如茶叶的颜色。 2 ) 外在属性( e x t r i n s i cp r o p e r t i e s ) ,例如茶叶的产地。 3 ) 与其它个体的关系,在此是指类与其它类之间的关系。 ( 6 ) 定义属性( 或称为槽) 的侧面:在本体中,属性有不同的侧面,诸如属性 值的类型、属性值的取值范围、属性值的数量以及其他的特征。 ( 7 ) 创建实例:定义某个类的一个实例,需要确定一个类,创建类的一个实例, 添加属性值。 7 东北师范大学硕士学位论文 本体构造是一个逐步求精的过程,要不断地对本体进行评价和修改,直到符合 要求为止。 2 1 4 本体语言 在具体的应用中,本体的表示方式可以多种多样,如阶谓词逻辑,语义网络, 基于框架的系统以及从后面两种方法发展而来的描述逻辑系统。虽然具体描述本体 的方法很多,但是目前使用最普遍的方法是o n t o l i n g u a 啪3 、c y c l 3 、l o o m 口5 3 和 o w l 嘲等。 本文我们采用o w l 语言来描述领域本体,o w l 是w 3 c 所推荐的标准,o w l 语言提供了描述能力渐增的三个子语言,以适用于不同的场合:o w ll i t e 提供了 用于描述分类层次和简单约束特性的机制,例如,虽然o w ll i t e 支持基数限制, 它只支持简单基数为o 或1 的约束方式;o w ld l 则提供在保证计算完备性和可 判定性前提下具备最大描述能力的描述机制,o w ld l 包括了所有o w l 语言的 构造子,但使用时需要满足些约束,如一个类不能同时是一个实例或属性,一个 属性也不能同时是一个实例或类。利用o w ld l 可以获得在足够好的计算能力的 支持下的强大的描述能力;o w lf u l l 提供了最大的描述能力,但代价是没有计算 上的完备性的保证。三者之间在描述能力上是一个递增的关系。但同时,对于o w l l i t e ,表达能力低,推理算法的效率也高,对于o w ld l 版本,可判定,在最坏的 情况下算法的复杂度较高,而对于o w lf u l l 版本,推理有时是不可预期的。本文 主要采用o w ld l ,它的部分语义表达如下: 1 领域概念的描述 o w ld l 使用类提供一个抽象机制来聚集有相同特征的资源,每个类都有隐含 的意义和相关的类外延,但是并不相等。o w l 用类描述( c l a s sd e s e r i p t i o n ) 来描 述o w l - 类,表达领域的概念含义。类描述分为六种方法:类标识、个体枚举、属 性约束、类描述合取、类描述析取、类描述否定。第一种方法是通过定义类标识( 以 u r i 引用表示) 描述一个类,后面五种方法通过在类外延上施加约束来描述匿名类, 如属性约束c a r d i n a l i t yc o n s 仃a i n t 限制类属性的个数,v a l u ec o n s t r m n t 约束类属性的 值域。 2 领域概念关系的描述 通过构造子o w l :c l a s s 和类标识( u r i 引用) 表示一个类,但仅用类标识不能 告诉我们更多的关于这个类( 概念) 的信息。因此,o w ld l 通过类公理描述概念 间的关系。类公理有三种构造子: ( 1 ) r d f s :s u b c l a s s o f 用来表达类的层次关系,表示类描述的类外延是另一个类 描述的类外延的子集。例如:m a nr d f s :s u b c l a s s o fp e r s o n 表示男人是人的子类。 ( 2 ) o w l :e q u i v a l e n t c l a s s 表示两个类描述有相同的类外延,可以通过枚举和合 取、析取、否定来表示。 8 东北师范大学硕士学位论文 ( 3 ) o w l :d i s j o i m w i t h 表示类描述的类外延和另一个类描述的类扩展没有相同 的成员,表示子类的不相关关系。 3 领域概念属性及属性约束描述 o w l 主要有对象属性( o b j e c tp r o p e r t i e s ) 和数据属性( d a t a t y p ep r o p e r t i e s ) 两种属性类型,用来约束属性的值域和定义域,并且通过属性公理来描述领域概念 属性及其属性间的关系。一个属性公理定义了属性的特征。最简单的属性公理仅仅 定义了属性的存在,例如: o w l 支持以下属性公理构造子: ( 1 ) r d f s c h e m a 构造子: r d f s :s u b p r o p e r t y o f 表示属性间的层次关系 r d f s :d o m a i n 表示概念属性的定义域 r d f s :r a n g e 表示概念属性的值域 ( 2 ) 属性间关系: o w l :e q u i v a l e n t p r o p e r t y 两个属性有相同的属性扩展,表示两个属性相同 o w l :i n v e r s e o f 表示两个属性之间存在可逆关系 ( 3 ) 全局基约束: o w l :f u n c t i o n a l p r o p e r t y 表示每个实例x 仅有一个值对之相对应 o w l :i n v e r s e f u n c t i o n a l p r o p e r t y 属性声明的客体有唯一确定主体 ( 4 ) 逻辑属性特征: o w l :s y m m e t r i c p r o p e r t y 声明属性具有对称性 o w l :t r a n s i t i v e p r o p e r t y 声明属性具有传递性 4 领域具体对象描述 o w ld l 使用个体描述领域中最具体对象的描述,个体通过个体公理( 事实) 来定义,有二种类型的事实: ( 1 ) 个体的类隶属关系( c l a s sm e m b e r s h i p ) 和个体的属性值 ( 2 ) 个体同一性: o w l :s a m e a s 表示两个u r ir e f e r e n c e s 指向同一个个体 o w l :d i f f e r e n t f r o m 表示两个u r ir e f e r e n c e s 指向不同的个体 o w l :a l l d i f f e r e n t 表示个体列表中的个体两两互不相同。 从建立本体的角度来说,o w l 通过s u b c l a s s o f , s u b p r o p e r t y o f 来形成概念及其 关系的分类化和层次化结构;通过s a m e a s ,s a m e p r o p e r t y a s , i n v e r s e o f , e q u i v a l e n t c l a s s 等构造子描述概念间的同义,反义等语义关系;通过i n t e r s e c t i o n o f , u n i o n o f , c o m p l e m e n t o f , o n e o f 等构造子描述概念间的逻辑组合关系;通过d o m a i n , r a n g e ,h a s v a l u e ,c a r d i n a l i t y ,m a x c a r d i n a l i t y ,m i n c a r d i n a l i t y 等对关系约束进行 描述;通过d i s j o i n t w i t h ,u n i q u e p r o p e r t y ,s y m m e t r i c p r o p e r t y ,t r a n s i t i v e p r o p e r t y 等 实现对概念及其关系的公理定义。 9 东北师范大学硕士学位论文 2 1 5 本体的分类 由于研究本体的机构和组织很多,各种本体定义描述了本体不同方面的特性, 因此就存在多种本体分类方式。这里介绍几种典型的分类方式啼 : 1 根据本体的通用性级别,本体可以分为以下四种类型: ( 1 ) 领域本体:针对特定的应用领域抽象领域知识的结构和内容,包括各种领 域知识的类型、术语和概念,并对领域知识的结构和内容加以约束,形成描述特定 领域中具体知识的基础。 ( 2 ) 通用本体:针对获取关于世界的通用性知识,提供基本的概念,如时间、 空间、状态、事件、过程、行为、部件等。因此,通用的本体定义的概念可以跨越 几个领域使用。 ( 3 ) 应用本体:针对特定应用领域知识建模的抽象定义。通常,应用本体是一 种概念的混合,这些概念来自领域本体和通用本体,然而,应用本体可能包括特定 方法和特定任务的扩展。 ( 4 ) 表示本体:主要描述在知识表示形式化背后的概念化,而不致力任何特定 的领域,这种本体提供表示性的中性实体,即它们提供的是表示框架,而不描述什 么该被表示以及怎样表示。这样,领域本体和通用本体可以使用表示本体提供的原 语进行描述。 2 根据本体的概念化的结构数量和类型方式可以把本体分为以下三种类型: ( 1 ) 术语学本体:类似于词典,定义了从不同方面表示知识的术语。 ( 2 ) 信息本体:定义了数据库的记录结构,数据库模式是这类本体的一个示例。 ( 3 ) 知识建模本体:定义了知识的概念化。与信息本体相比,知识建模本体通 常具有更加丰富的内部结构,进而,这类本体通常适用于一些特定的知识。 3 根据本体所刻画和描述的现实世界的不同方面可以把本体分为以下四类: ( 1 ) 静态的本体:描述世界中静态方面的特征,即存在的事物、它们的属性及 它们之间的关系。 ( 2 ) 动态的本体:描述世界中不断变化的方面,典型的原语概念包括状态、状 态转换和过程,描述世界。 ( 3 ) 意念型的本体:包括动机、意图、目标、信念、选择等,典型的原语概念 包括论题、目标、支持、否决、子目标、主体等。 ( 4 ) 社会型的本体:包括社会结构、组织结构、联盟等,社会型的本体通常用 执行者、位置、角色、权威、承诺等原语概念进行刻画。 4 g u a r i n o n 2 3 提出以详细程度和领域依赖度这两个维度来作为对本体进行划分 基础。详细程度是相对的、较模糊的一个概念,指描述或刻画建模对象的程度。详 细程度高的称为参考本体( r e f e r e n c eo n t o l o g y ) ,详细程度低的称为共享本体( s h a r e o n t o l o g y ) 。依照本体对领域的依赖程度又可以从低到高分成四大类: 1 0 东北师范大学硕士学位论文 ( 1 ) 项级本体( t o p l e v e lo n t o l o g y ) :描述最普通的概念及概念之间的关系, 如空间、时间、事件、行为等,与具体的应用无关,其他种类的本体都是该类本体 的特例。 ( 2 ) 领域本体( d o m a i no n t o l o g y ) :描述特定领域( 医药、汽车等) 中的概念 及概念之间的关系。 ( 3 ) 任务本体( t a s ko n t o l o g y ) :描述特定任务

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论