(计算机科学与技术专业论文)不精确本体模型与构建研究.pdf_第1页
(计算机科学与技术专业论文)不精确本体模型与构建研究.pdf_第2页
(计算机科学与技术专业论文)不精确本体模型与构建研究.pdf_第3页
(计算机科学与技术专业论文)不精确本体模型与构建研究.pdf_第4页
(计算机科学与技术专业论文)不精确本体模型与构建研究.pdf_第5页
已阅读5页,还剩74页未读 继续免费阅读

(计算机科学与技术专业论文)不精确本体模型与构建研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

了, 气 勺 t h e i m p r e c i s eo n t o l o g ym o d e l l i n ga n d i t sc o n s t r u c t i o n at h e s i ss u b m i t t e dt o d a l i a nm a r i t i m eu n i v e r s i t y i np a r t i a lf u l f i l l m e n to ft h er e q u i r e m e n t sf o r t h ed e g r e eo f m a s t e r0 fe n g i n e e r i n g b y l i ux i a o y i n ( c o m p u t e rs c i e n c ea n dt e c h n o l o g y ) t h e s i ss u p e r v i s o r :p r o f e s s o rl ig u a n y u j u n e 2 0 1 1 74洲6598 憎_m y 1 扩 1 、 k 大连海事大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果, 撰写成硕士学位论文:丕擅殉奎生搓型生掏建硒究:。除论文中已经注明引用的 内容外,对论文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。 本论文中不包含任何未加明确注明的其他个人或集体已经公开发表或未公开发表 的成果。本声明的法律责任由本人承担。 学位论文作者签名: 学位论文版权使用授权书 本学位论文作者及指导教师完全了解大连海事大学有关保留、使用研究生学 位论文的规定,即:大连海事大学有权保留并向国家有关部门或机构送交学位论 文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本 学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫 描等复制手段保存和汇编学位论文。同意将本学位论文收录到中国优秀博硕士 学位论文全文数据库( 中国学术期刊( 光盘版) 电子杂志社) 、 中国学位论文全文 数据库( 中国科学技术信息研究所) 等数据库中,并以电子出版物形式出版发行和 提供信息服务。保密的论文在解密后遵守此规定。 本学位论文属于:保 不保 年解密后适用本授权书。 在以上方框内打“”) 论文作:司 茹 镌 f缈年 签 燃加 导7:眵眺 心 i 扩 , 中文摘要 摘要 哲学术语o n t o l o g y 被借用于信息科学领域源于t g r u b e r 在1 9 9 3 年给出的定 义:“a no n t o l o g yi sa 1 1e x p l i c i ts p e c i f i c a t i o no fac o n c e p t u a l i z a t i o n ,其中强调“明 确的( e x p l i d t ) 是o n t o l o g y 的属性规定。可见,o n t o l o g y 在被引入信息科学领 域的伊始,就被界定为是“精确性模型 。随后“语义网体系结构的七层模型 也是基于“精确性”的基础之上,然而,语义网( s e m a n t i cw e b ) 的根本目标是建 立一种能理解人类语言的智能网络,由此决定了它只能以“不精确性 为限定, 即当前学术界正在探索的应该是“不精确性语义网”。在这样的情况下,构建不 精确本体的重要性就凸现出来,没有不精确本体,就没有办法进行不精确本体合 并、推理等一系列应用。同样,作为s e m a n t i cw e b 的语义基础,没有不精确本体, s e m a n t i cw e b 也只是空谈,语义w e b 服务的实现也就不可能。 目前国内外有对不精确本体研究还刚刚起步,大多停留在粗糙本体构建与模 糊本体构建阶段,而没有将粗糙本体与模糊本体相融合,使之成为真正意义上的 不精确本体。本文在详细研究了现有国内外粗糙本体与模糊本体模型与构建方法 的基础上,进行分析比较,而后结合粗糙集理论与模糊集理论,将包含度理论引 入不精确本体,描绘其中的关系,对不精确本体模型进行深入研究,提出了一种 不精确本体模型。以本文所提出的不精确本体模型为指导,使用本体构建工具 p r o t 6 9 6 在医学领域构建不精确本体,在构建本体过程中充分体现了不精确本体的 模糊性与粗糙性。最后,通过不精确本体与精确本体的比较研究,先后使用了本 体评估工具与不精确本体评估指标集对本文构建不精确本体进行评估。在本文的 结尾还探讨了不精确本体未来的研究方向。 本文的研究成果不仅可以加快不精确本体构建进程,还能提高不精确本体的 科学性、规范性,为构建不精确本体提供了一种可选的、有效的方法。 关键词:语义网;不精确性;粗糙性;模糊性;本体构建;包含度 , l_iiijil,k,ij1,ljlgl,j_|44i 0 f f a b s t r a c t 1 1 1 ep h i l o s o p h i c a lt e r mo n t o l o g yw a sf i r s t i n t r o d u c e di n t ot h ed o m a i no f i n f o n n a t i o ns c i e i l c ew h e nt g r u b e rg a v et h ed e f i n i t i o n a no n t o l o g yi s a ne x p l i c i t s p e c i f i c a t i o no fac o n c e p t u a l i z a t i o n ”i n 19 9 3 ,w h i c hi n d i c a t e dt h a te x p l i c i ti st h e e s s e r l t i a lc :h 孤a c t e :r t h e r e f o r e ,o n t o l o g yw a sc o n s i d e r e da sa p r e c i s em o d e l ”w h e n i t w a sf i r s ti n t r o e i u c e di n t ot h ed o m a i no fi n f o r m a t i o ns c i e n c e a n dt h ep r o p o s e d “s e v e n l a y e r so ft h es e m a n t i cw e b a r c h i t e c t u r e w a sa l s ob a s e do n p r e c i s i o n h o w e v e r , t h e o r i g i n a lg o a lo ft h es e m a n t i cw e b i st oc r e a t eas m a r ta n dc o m p u t e r - u n d e r s t a n d a b l e n e t w o r k w h i c hr e q u i r e si t t od e a lw i t hb o t hp r e c i s ea n di m p r e c i s ed a t a t h a ti s , c u r r e n t l vb e i n gb u i l ts h o u l db ea l l “i m p r e c i s es e m a n t i cw e b ”i ns u c hc i r c u m s t a n c e s , t h ei m p o r t a n c eo fb u i l d i n ga ni m p r e c i s eo n t o l o g yi ss t a n do u t w i t h o u tt h ei m p r e c i s e o n t 0 1 0 以w ec a n tp r o c e s s s o m ew o r ks u c ha si m p r e c i s eo n t o l o g ym e r g i n ga n d t e a s o n i n g s i m i l a r l y , w i t h o u ti m p r e c i s eo n t o l o g yw h i c hi st h eb a s e o fs e m a n t i cw e b , s e r n 砒l t i cw e bc a nd on o t h i n ga n dt h es e m a n t i cw e bs e r v i c ei si m p o s s i b l et oa c h i e v e d o m e s t i ca n df o r e i g nr e s e a r c ha b o u ti m p r e c i s eo n t o l o g yh a sj u s ts t a r t e d ,a n d m o s to ft h e ms t a yi nt h ep h a s eo fr o u g ho n t o l o g yc o n s t r u c t i o na n df u z z yo n t o l o g y c o n s t r u c t i o n t h e yd i d n ti n t e g r a t et h er o u g ho n t o l o g ya n df u z z yo n t o l o g yt ob ea n i n d 印e n d e n ti m p r e c i s eo n t o l o g y i n t h i s p a p e r , a ni m p r e c i s eo n t o l o g ym o d e l i s p r o p o s e da f t e ra n a l y z i n gd o m e s t i ca n df o r e i g n m e t h o da b o u tr o u g ho n t o l o g ya n d f u z z yo n t o l o g yc o n s t r u c t i o na n di n t r o d u c i n gt h ei n c l u s i o nd e g r e et h e o r yc o m b i n e d w i mr o u g hs e ta n df u z z ys e tt h e o r yt od e f i n ei t sr e l a t i o n s h i p u n d e rt h eg u i d a n c eo f t h e p r o p o s c dm o d e l ,a ni m p r e c i s em e d i c a lo n t o l o g yi s b u i l tu s i n ga l lo n t o l o g yb u i l d i n g t 0 0 1p r o t 6 9 6 t h ep r o c e s so fb u i l d i n gt h i so n t o l o g yr e f l e c t sb o t hr o u g ha n df u z z y c :h 砒a c t e r b yc o m p a r i n gw i t hp r e c i s eo n t o l o g ya n di m p r e c i s eo n t o l o g y ,t h e b u i l t i m p r e c i s eo n t o l o g yi s e v a l u a t e du s i n gp r e c i s eo n t o l o g ya n di m p r e c i s eo n t o l o g y e v a l u a t i o nt 0 0 1 a tl a s t ,t h er e s e a r c hd i r e c t i o no fi m p r e c i s eo n t o l o g y i ss h o w n t h er e s u l t so ft h i sp a p e rn o to n l yc a ns p e e du pt h ep r o c e s so fi m p r e c i s eo n t o l o g y b u i l d i n g b u ta l s oc a ni m p r o v ei t ss c i e n t i f i c a l n e s s ,s t a n d a r d a b i l i t ya n d a u t h o r i t a t i v e n e s s p r o v i d ea no p t i o n a la n de f f e c t i v em e t h o df o ri m p r e c i s eo n t o l o g yb u i l d i n g k e yw o r d s :s e m a n t i cw e b ;i m p r e c i s i o n ;r o u g h n e s s ;f u z z i n e s s ;o n t o l o g y c o n s t r u c t i o n ;i n c l u s i o nd e g r e e p,rt,。l - p ;1l 目录 第1 章绪论。1 1 1 研究动机及意义1 1 2 国内外相关研究现状2 1 3 主要研究内容5 1 4 论文章节安排6 1 5 论文研究框架7 第2 章不精确本体与模糊集、粗糙集相关理论8 2 1 本体相关定义8 2 1 1 本体定义8 2 1 2 本体的构成9 2 1 3 本体的应用领域1 1 2 1 4 本体的种类11 2 2 不精确本体1 2 2 2 1 不精确本体定义1 4 2 2 2 不精确本体的应用1 4 2 2 3 不精确本体构建方法评述1 5 2 3 精确本体与不精确本体比较1 7 2 4 粗糙集理论与模糊集理论18 2 4 1 模糊集理论1 8 2 4 2 粗糙集理论19 2 4 3 粗糙集理论与模糊集理论的比较2 0 2 5 包含度理论2 1 第3 章不精确本体模型2 3 3 1 本体模型2 4 3 2 不精确本体模型。2 6 3 2 1 模糊本体模型2 6 3 2 2 粗糙本体模型2 8 3 3 不精确本体构建方法31 3 4 不精确本体模型3 2 第4 章不精确本体构建3 6 4 1 构建本体的一般原则3 6 4 2 领域不精确本体构建过程中存在的问题3 7 卜 协矗 目录 4 3 本体构建工具3 8 4 3 1 本体构建工具分析3 8 4 3 2 本体构建工具比较4 3 4 4 构建系统环境配置4 6 4 5 不精确本体构建4 7 4 5 1 疾病领域不精确本体的分析与设计4 7 4 5 2 不精确本体的构建4 8 第5 章不精确本体评估5 4 5 1 工具评估5 4 5 2 评价指标体系评估5 7 第6 章总结与展望5 9 6 1 论文总结5 9 6 2 工作展望5 9 参考文献6 1 攻读学位期间公开发表论文6 5 致谢6 7 不精确本体模型与构建研究 第1 章绪论 1 1 研究动机及意义 w e b 是人们进行知识获取和交流的主要方式,而随着w e b 的快速发展,信息 量成几何量级的增长,面对如此海量的信息,人们已经很难从中找到真正需要的 知识了。为了更容易的查询所需要的信息,t i mb e r n e r s l e e 提出了语义网( s e m a n t i c w e b ) 的思想【1 1 。语义网s e m a n t i cw e b 是当前w e b 的扩展,w 3 c 将语义网s e m a n t i c w e b 定义为w e bo f d a t a 。信息被给予良好的语义定义,从而人与计算机可以更好 地协作【2 1 。随着语义网的体系结构的不断完善,本体( o n t o l o g y ) 成为支撑语义 网的核心内容 3 1 。本体的性质决定了语义网的性质。g r u b e r 意义上的o n t o l o g y 是“精 确性的”,目前为止学术界对基于本体的语义网的研究及取得的成果大多源于“精 确性假设。 然而,人们认识客观世界的过程与成果( 例如数据、知识、信息) 的本质特 征却是不精确( i m p r e c i s i o n ) 的,现实世界中的信息通常是不确定、模糊的,即概 念外延与内涵的关系是不确定的模糊关系。例如:“老年人消费水平低 ,其中 “老年人”作为对象是一个模糊集;“消费水平低作为属性只能由隶属程度来 表示,因为消费水平关系到衣、食、住、行、收入、文化娱乐和家庭负担等开销。 所以,它是多属性的模糊集,便会产生表示对象与属性之间隶属程度的模糊形式 背景。实现人类知识的机器理解与机器推理是语义网的根本目标,由此决定语义 网只能用“不精确性”限定,也就是说现在学术界正在探索研究的应该是“不精 确性语义网”。精确性( p r e c i s i o n ) 是人类由于认知能力有限,在处理不精确性 事物时的无奈选择,获得了可行解决方案的同时,却偏离了被处理对象的实质。 对疑难问题或者陌生问题采取“先忽略不确定性、后考虑不确定性 的两阶段研 究策略,是科学探索研究中的通常选择。当前,将对本体及语义网的研究由“精确 性”阶段推进到“不精确性 阶段的时机已经成熟。 在这样的情况下,不精确本体的构建的重要性就凸现出来,没有不精确本体, 就没有办法进行不精确本体合并、推理等一系列应用。同样,作为s e m a n t i cw e b 的语义基础,没有不精确本体,s e m a n t i cw e b 也只是空谈,语义w e b 服务的实现 也就不可能【4 叫。 第1 章绪论 虽然现在已经有很多的论文谈及到本体的构建问题,但是至今还没有一篇文 章描述如何具体构建不精确本体。本文在详细研究了现有国内外构建不精确本体 方法的基础上,提出了一种不精确本体模型,进而为构建不精确本体提供了一种 思路和方法。 本论文研究工作的主要理论与技术价值在于以下三个方面: ( 1 ) 不精确本体模型的表示框架。基于对概念和概念关系的模糊性和粗糙性 的描述,将不精确性引入对语义网本体的模型描述,使之更接近人脑认知和处理 信息的真实状态,克服语义网本体模型的局限性。 ( 2 ) 不精确本体关系描述。将包含度理论引入不精确本体关系描述,使其更 加接近信息的真实状态。 ( 3 ) 不精确本体的构建方法。本文把粗糙性与模糊性均考虑到其中,构建了 个不精确本体,为以后的研究提供良好的基础。 1 2 国内外相关研究现状 目前,国内外不精确本体构建与模型表示研究尚处于起步阶段,很多方法都 不成熟,没有形成统一的规范标准,不精确本体构建的方法学还没有成熟的理论 做指导。不精确本体构建方法主要集中在应用粗糙理论构建粗糙本体或应用模糊 理论构建模糊本体,并且具有一定针对性,普遍适用性不足。下面对主要的九种 不精确构建方法作以介绍分析,主要从粗糙性与模糊性两方面分成两类。 ( 1 ) 从粗糙性方面出发构建不精确本体 粗糙集扩展本体法:由日本的青山学院大学提出。在该方法中明确表达了粗糙 本体的概念【7 1 。粗糙本体是通过粗糙集概念【8 1 扩展而来的,它可以使我们通过本体 的形式灵活运用信息系统。通过使用粗糙集理论【9 】可以用本体概念去表示不完整 的信息,并通过一组属性对逼近精度进行定义。方法中还详细明确了规则如何生 成。 应用粗糙概念的本体工程方法:由意大利的k r d b 实验室提出。粗糙概念可 以表达粗糙集的内涵,尽管是不精确的,也可以帮助本体工程的进程。o w l 本体 通常不能明确的考虑知识的不完全性,为填补这一空白,使用o w l 2 和它的应用 喀 不精确本体模型与构建研究 基础与粗糙集相结合方式来解决这一问趔1 0 】。尽管o w l 2 q l 不能充分表达绝大多 数的粗糙集语义,但是本体基本数据访问框架的映射层把本体中的概念与数据源 中的查询语句相连接,可以充分确定概念是否粗糙,然后进行取舍,并在o w l 2 d l 本体中更精确地模型化。该方法通过粗糙集的核心概念扩展o w l 本体,并应用 h o r i z o n t a lg e n et r a n s f e r ( h g t ) 本体与1 7 g b 的地理数据库进行了验证。 ( 2 ) 从模糊性方面出发构建不精确本体 应用f u z z yp r o t 6 9 6 构建本体模型法:由突尼斯的m i r a c l 实验室提出。f u z z y p r o t 6 9 6 是一个半自动协作工具,可应用于模糊本体模型的构建,它是对著名的本 体构建工具p r o t 6 9 63 3 1 进行的一个插件扩展【l l 】。f u z z yp r o t 6 9 6 通过定义新的元类 来允许成员函数的参数化定义。当然它也支持模糊实例概念和允许隶属度的自动 计算。f u z z yp r o t 6 9 6 同样也允许基于模糊规则的模糊本体查询。在该方法中, m i r a c l 实验室提出了f u z z yp r o t 6 9 6 的内部架构和一些执行细节,及如何使用它 来建立和验证模糊本体。 本体生成框架方法:由新加坡南洋理工大学提出。该方法提出一个模糊本体 生成框架在不确定信息上自动生成模糊本体【1 2 】。它由以下几部分组成:模糊概念 分析;模糊概念聚类;模糊本体生成。首先通过模糊形式分析形成模糊概念格, 然后模糊概念聚类构建概念的层级,最后模糊本体生成部分是通过概念层级自动 生成模糊本体。该方法最大特点是可以自动生成本体,并对本体类进行分级,但 是在起始类、属性、关系的定义时仍需要人工介入。 基于模糊本体构建方法论的用例( u f o c ) 构建法:由浙江大学提出。它提出 一个基于模糊本体【1 3 】构建方法论的用例,来构建教学模糊本体,该本体由o w l 编码。另外,提供了一种在o w l 中表示模糊关系的解决方案。用模糊集理论对模 糊本体进行形式化定义,并建立模糊关系概念,包含两个o w l :d a t a t y p e p r o p e r t y , 一个表示模糊度,另一个表示两者之间的模糊关系。当需要一个模糊关系要素时, 就创建这个概念的实例,并指定每个属性的具体值【1 4 】。基于本体构建方法论的用 例( u f o c ) 构建法不仅提供了构建模糊本体的方法论,并用该方法构建了教学模 糊本体。 第1 章绪论 面向语义信息查询的模糊本体模型构建法:由华师大计算机系提出。该方法 考虑到领域知识在建模时产生的不确定性、模糊性与信息在查询时的一些局限性, 提出了基于模糊控制规则的模糊本体模型。首先用本体机器学习方法构建模糊控 制规则库,该方法是基于模糊聚类的;其次通过用计算模糊相似矩阵的方法得到 模糊概念之间语义关联:最后对词汇的相关概念进行语义分析与扩展,得到模糊 概念间的本质语义关系,实现基于模糊概念属性值的语义共用与信息查询【”】。 基于时空模糊本体的交通领域本体构建法:由武汉大学测绘遥感信息工程国 家重点实验室提出,来源于国家8 6 3 计划资助项目( 2 0 0 7 a a l 2 2 2 3 0 ) 。它是在分 析本体技术和交通信息特点的基础上,针对交通概念描述的特殊要求,提出了时 空模糊本体的概念,以描述交通领域概念,并利用时空模糊本体进行交通领域知 识建模 1 6 】。将模糊本体和时空本体的有关理论方法转嫁于传统的本体模型中,从 而扩展了精确概念属性的描述,使之模糊化,扩展了概念间关系的描述,从普通 关系到模糊关系和时空关系,基于这样的思想和方法,构建了面向交通领域的时 空模糊本体模型( s p a t i o t e m p o r a lf u z z yo n t o l o g y ,s t f o ) 。 基于模糊概念模型的模糊本体构建方法:由东北大学提出。针对从预先定义 的概念层次生成模糊本体这一非常困难的问题,提出利用模糊概念模型来构建模 糊本体,即模糊u m l 类图的模糊o w ld l 本体构建的方法【1 7 】。基于模糊集理论, 给出了两者的形式化定义,对u m l 概念模型及o w ld l 本体进行了模糊扩展。 在此基础上,描述了从模糊u m l 类图到模糊o w ld l 本体的映射方法,给出了 映射规则及公理的创建过程。 基于模型驱动架构( m o d e ld r i v e na r c h i t e c t u r e ,m d a ) 的模糊本体生成方法: 由上海大学提出。该方法根据模糊描述逻辑f u z z ys h o i n ( d ) 扩展了本体描述语 言o w l 为f u z z yo w l ( f o w l ) ,使其能够表示模糊本体【1 8 】。扩展本体定义元 模型( o n t o l o yd e f i n i t i o nm e t am o d e l ,o d m ) 为模糊本体定义元模型f o d m ,使 其能够支持模糊本体定义 1 9 】。模糊本体建模语言( f u z z yo n t o l o g ym o d e l i n g l a n a g u a g e ,f o m l ) 用m d a 元层次中的元对象设施( m e t a o b j e c tf a c i l i t y ,m o f ) 定义,以实现本体的图形表示。分别建立f o m l 到f o d m 及f o d m 到f o w l 的 映射( m a p p i n g ) 。模糊本体的创建过程是,先用f o m l 创建可视化的模糊本体 不精确本体模型与构建研究 模型,然后根据f o m l 到f o d m 以及f o d m 到f o w l 的映射,将模糊本体模 型映射成对应的f o w l 本体文档。 综上所述,国内外不精确本体构建基本处于起步阶段。从本体模型的表示架 构角度看,虽然有一定的不精确本体模型基础,但不够充分且尚不成熟,有很大 的局限性。而从方法本身角度来看,目前大多数方法只局限于或者从事模糊方面 研究,或者从事粗糙方面的工作,没有把两者结合起来。本文研究对象为“不精 确本体 ,正是着眼于把知识的“模糊性”与“粗糙性结合起来。 1 3 主要研究内容 本课题来源于国家自然科学基金项目“语义网本体不精确性模型研究 ( n o 6 0 9 7 2 0 9 0 ) 、国家自然科学基金项目“关系数据库对象级别信息检索关键技 术研究( n o 6 1 0 7 3 0 5 7 ) 和中央高校基本科研业务费专项资金资助项目“物联网 时空感知信息检索关键技术研究 ( n o 2 0 0 9 q n 0 3 1 ) ,以及“基于模糊逻辑的关 系数据库语义检索关键技术研究 ( n o 2 0 11 j c 0 0 7 ) 。论文工作是四个基金项目 的重要组成部分。 本文在上述基金项目先期相关的研究成果基础之上,提出了一个不精确本体 模型,通过模型的指导,在领域内构建不精确本体。在这个过程中将粗糙集与模 糊集理论的引入传统本体模型中,使概念属性的描述从精确值扩展到具有粗糙性 和模糊性的不精确值;概念间关系的描述从清晰明确的关系扩展到粗糙模糊关系, 再通过包含度理论描述关系间的度量,即可以构建既有模糊性又有粗糙性的不精 确性本体。本文的主要研究内容包括以下五个: ( 1 ) 分析并研究了当前国内外不精确性本体构建方法; ( 2 ) 提出一种新的不精确本体模型; ( 3 ) 通过对模糊集理论与粗糙集理论的有机综合,将两种理论同时引入不精 确本体描述; ( 4 ) 引入包含度理论,设计出适合初始本体的语义相似度计算公式; ( 5 ) 领域本体的设计与实现。 图1 1 描述了论文研究技术路线图梗概。 第l 章绪论 图1 1 论文研究技术路线图梗概 f i g 1 1b d f er o u t em a po f d i s s e r t a t i o n 在图1 1 中,首先分成语义强度和数据的确定性程度两个维度给出问题研究的 整体布局图,就实际研究的路线而言,考虑到实际问题的客观情形,必须引入不 确定性因素,因此将精确本体引申为不精确本体进行深入研究,以期拟合实际问 题,有利于真实情形的问题解决。只有这样,才能够使本课题的研究更贴近实际 问题,有利于实用性问题的解决。 1 4 论文章节安排 根据研究内容的要求,本文共分六章,章节安排如下: 第一章介绍了本文的研究背景和意义、国内外相关研究工作、本文的主要研究 内容和论文组织结构等。 第二章着重阐述了不精确本体定义和应用,本体构建的概念,综述了国内外已 有的不精确本体构建方法,并介绍粗糙集、模糊集,包含度理论。 第三章描述了不精确本体信息描述与相关算法的研究,提出了本文的不精确本 体模型。 不精确本体模型与构建研究 第四章介绍了不精确本体构建方法及过程,阐述了其开发环境的配置、设计 思想、体系结构及主要模块。 第五章实验评估。 第六章对本文工作进行了总结,指出了进一步的研究方向。 1 5 论文研究框架 通过对研究内容与论文章节的安排,本文的研究框架已经非常清晰、明了。 图1 2 是论文研究框架。 课题背景 理论研究 构建实施 聂j j j j j j 溺三鳓曩j j j j j j j _ 二- 评估;臣三卜匝堕固| - 图1 2 论文研究框架 f i g 1 2d i s s e r t a t i o nr e s e a r c hf r a m e w o r k 第2 章不精确本体模糊集、粗糙集相关理论 第2 章不精确本体与模糊集、粗糙集相关理论 本章将对不精确本体与其相关的模糊集、粗糙集等相关理论分别进行介绍。 首先从不同时期对本体的定义做了介绍,延伸出不精确本体的定义,评述了不精 确本体的应用方面并对目前国内外不精确本体构建方法进行了比较分析;其次, 介绍了粗糙集理论与模糊集理论;最后,对本文要引入的包含度理论进行了介绍。 2 1 本体相关定义 2 1 1 本体定义 关于本体( o n t o l o g y ) 的定义,经历了很长时间的发展,本体是一个源于哲学的 概念【2 0 1 ,从哲学的范畴来说,本体是“对世界上客观存在物的系统的描述 【2 l 】; 是一种对“存在的系统化解释;是客观存在的一个系统的解释或说明。本体所 关心的是客观现实的抽象本质,用于描述事物最本质的内涵。后来随着计算机科 学技术的发展,人工智能领域的学者将本体这个概念应用到了人工智能领域,以 及计算机知识工程领域。本体的概念被越来越多的应用于计算机知识工程领域, 用于对客观世界的存在进行系统化描述,方便知识的重用和交互。人们已经从不 同的角度和方面对本体概念进行了定义。 在人工智能界,最早给出o n t o l o g y 定义的是n e c h e s 等人,他们将o n t o l o g y 定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构 成的规定这些词汇外延的规则的定义 。n e c h e s 认为“本体定义了组成主题领域 的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规 则 【2 2 1 。在信息系统、知识系统等领域,越来越多的人研究o n t o l o g y 并给出了许 多不同的定义。1 9 9 3 年,g r u b e r 给出了本体的一个最为流行的定义,即“本体是 概念模型的明确的规范说明 【2 3 1 。s w a r t o u t 将本体定义为:“本体是一个为描述 某个领域而按层次关系组织起来的一系列术语,这些术语可以作为一个知识库的 骨架【2 4 1 。 后来,b o r s t 在此基础上,发展出了本体的另外一种定义,也是被较多人接受 和认可的本体定义:“本体是共享概念模型的明确的形式化规范说明 【2 5 1 ,可定 义为如下的公式: 不精确本体模型与构建研究 本体= 概念( c o n c e p t ) + 属性( p r o p e r t y ) + 公理( a x i o m ) + 取值( v a l u e ) + 名义( n o m i n a l ) 它包括四层含义【2 6 】: ( 1 ) 概念化( c o n c e p t u a l i z a t i o n ) :客观世界中现象的抽象模型;也可称为“概 念模型 ,指通过抽象出客观世界中一些现象( p h e n o m e n o n ) 的相关概念而得到 的模型。概念模型所表达的含义独立于具体的环境状态。 ( 2 ) 共享( s h a r e ) :本体中反映的知识是其使用者共同认可的,指本体体现 共同认可的知识,反映相关领域中公认的概念集,即本体针对团体而非个体的共 识。 ( 3 ) 明确( e x p l i c i t ) :概念及他们之间的联系都被精确定义,指所使用的概 念及使用这些概念的约束都有明确定义。 ( 4 ) 形式化( f o r m a l ) :精确地数学描述,指本体可以被计算机读取( 即能 被计算机处理) 。 本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该 领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇( 术语) 和 词汇间相互关系的明确定义。 除上述定义外,不少文献从不同问题领域和研究角度出发,对本体又给出了 各种各样的定义。这些定义之间相互补充,并且不断扩充本体的应用范围。它们 有一个共同点,都认为本体是描述领域概念以及概念之间关系的。 总而言之,本体的目标是获取、描述和表示相关领域的知识,提供对该领域 知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模型上 给出这些词汇( 术语) 和词汇间相互关系的明确定义。一般来讲,本体具有两个 特性:静态性和动态性静态性指的是它反映的概念模型;动态性指的是它的 内容和服务对象是不断变化的,针对不同的领域,可以定义和构造不同的本体。 2 1 2 本体的构成 p e r e z 等人认为本体可以按分类法来组织【矧,并归纳出本体的五个基本构成元 素。这些元素分别为:类( c l a s s e ) ,关系( r e l a t i o n ) ,函数( f u n c t i o n ) ,公理 第2 章不精确本体模糊集、粗糙集相关理论 ( a x i o m ) 和实例( i n s t a n c e ) 。通常也把c l a s s e 写成c o n c e p t ( 概念) 。下面对各 部分的含义进行分析: ( 1 ) 概念的含义非常广泛,可以指任何事务,如描述、功能、行为、策略和 推理过程等本体中的这些概念通常构成一个分类层次。 ( 2 ) 关系代表了领域中概念之间的交互作用。形式上定义为,z 维笛卡儿乘积 的子集:r :c l c 2 c 。如:子类关系( s u b c l a s s o f ) 。 ( 3 ) 函数是一种特殊的关系。在这种关系中前,z j 个元素可以唯一决定第玎 个元素。形式化的定义为:f :c lx c 2 x cn - l _ c 。例如m o t h e r _ o f 关系就是 一个函数,其中m o t h e r o f ( x ,力表示y 是x 母亲,显然x 可以唯一确定他的母亲y 。 ( 4 ) 公理代表永真断言,是定义在“概念和属性上的限定和规则,比如概 念乙属于概念甲的范围。 ( 5 ) 实例是指属于某概念类的基本元素,即某概念类所指的具体实体。 从语义上分析,实例表示的就是对象。而概念表示的则是对象的集合,关系 对应于对象元组的集合。概念的定义一般采用框架( f r a m e ) 结构,包括概念的名称, 与其它概念之间关系的集合,以及用自然语言对该概念的描述。基本的关系有四 种,如表2 1 所示。 表2 1 概念之间的基本关系 t a b 2 1t h eb a s i cr e l a t i o n s h i p sb e t w e e nc o n c e p t s 关系名称含义 p a r t o f k i n & o f i n s t a n c e o f a t t r i b u t e o f 概念之间部分与整体的关系 概念间的继承关系,类似于面向对象中的父类和子类之间的关系 概念的实例和概念之间的关系 某个概念是另外一个概念的属性 在实际应用中,不一定要严格按照上述五类元素来构造本体。同时概念之间 的关系也不仅限于表2 1 列出的四种基本关系,还可以根据特定领域的具体情况定 义相应的关系,以满足应用的需要。 不精确本体模型与构建研究 2 1 3 本体的应用领域 本体的研究和应用主要涉及三个方面: ( 1 ) 理论上的研究,主要研究概念及其分类,其中最有代表性的是g u a r i n o 等人对概念及其分类进行的研究2 8 1 。 ( 2 ) 信息系统中的应用,主要包括处理信息组织、信息检索和异构信息系统 互操作问题。目前本体应用在信息检索中的著名项目包括( o n t o ) a g e n t 、o n t o b r o k e r 和s k c 。 ( 3 ) 本体也是语义w e b 的重要基础。语义w e b 由u n i c o d e 、u r j 、x m l 、 r d f 、o n t o l o g y 、l o g i c 、p r o o f 和t r u s t 八层组成。处于第五层的o n t o l o g y 是为了 解决x m l 和r d f 在处理语义问题上的不足。本体通过对概念以及概念之间关系 的严格定义来确定概念的精确意义,表示共同认可的、可共享的知识。 目前,本体研究已经取得了一些重要的研究成果。表2 2 列举了部分与本体相 关的研究项目。 表2 2 本体研究项目及简要介绍 t a b 2 2o n t o l o g yr e s e a r c hp r o j e c ta n db r i e fi n t r o d u c t i o n 2 1 4 本体的种类 为了对本体进行有效的分类,g u a r i n o 提出以详细程度和领域依赖度两个维度 作为对本体划分的基础【2 8 】。详细程度是相对的、较模糊的一个概念,指描述或刻 画建模对象的程度。详细程度高的称作参考本体( r e f e r e n c eo n t o l o g i e s ) ,详细程 度低的称为共享本体( s h a r e do n t o l o g i e s ) 。依照领域依赖程度的不同,又可以进 一步细分为项级( t o pl e v e l ) 本体、领域( d o m a i n ) 本体、任务( t a s k ) 本体和应 用( a p p l i c a t i o n ) 本体4 类,具体详见表2 3 所示。 第2 章不精确本体模糊集、粗糙集相关理论 表2 3 本体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论