




已阅读5页,还剩60页未读, 继续免费阅读
(计算机应用技术专业论文)基于描述逻辑的语义web本体研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
魏榴花:基于描述逻辑的语义w e b 本体研究 6 5 扬州大学学位论文原创性声明和版权使用授权书 学位论文原创性声明 本人声明:所呈交的学位论文是在导师指导f 独立进行研究工作所取 得的研究成果。除文中已经标明引用的内容外,本论文不包含其他个人或 集体已经发表的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本声明的法律结果由本人承担。 学位论文作者签名:佩桶马耗 签字日期: 2 0 0 8 年易月2 日 学位论文版权使用授权书 本人完全了解学校有关保留、使用学位论文的规定,即:学校有权保 留并向国家有关部门或机构送交学位论文的复印件和电子文档,允许论文 被查阅和借阅。本人授权扬州大学可以将学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编 学位论文。同时授权中国科学技术信息研究所将本学位论文收录到中国 学位论文全文数据库,并通过网络向社会公众提供信息服务。 学位论文作者签名:魏耦花 导师签名: 签字日期: 2 8 年 6 月2 日签字日期:“年易 月 日 魏榴花:基于描述逻辑的语义w e b 本体研究 摘要 19 9 8 年,t i mb e r n e r s l e e 提出了“语义w e b 的概念,语义w 曲研 究的主要目的就是扩展当前的w w w ,使得网络中信息都是具有语义的, 便于人和计算机之间的交互合作。语义w e b 的兴起促进来本体技术的发 展,本体作为语义w e b 的基石,而描述逻辑作为语义w 曲的一个逻辑基 础,对它们的研究具有重要的理论价值和现实意义。本文的主要工作如下。 1 面向语义w e b 领域本体的建立与形式化研究。t h ew o r l dw i d ew e b c o n s o r t i u m ( w 3 c ) 正在制定的o w ld l 是一种面向语义w e b 的知识表示标 记语言,本文主要以大学本体为例,介绍领域本体建立和形式化研究的一 般方法,首先采用n k i ( n a t i o n a lk n o w l e d g ei n f r a s t r u c t u r e ) 语言描述了大学 领域本体的类,同时规范了它的属性和关系,然后详细分析了0 w ld l 和 描述逻辑之间的对应关系,并通过具体的大学领域本体的实例用描述逻辑 的语义解释了o w ld l 的各个元素,这样在描述逻辑领域的研究成果就能 应用到o w ld l 上来,为o w ld l 的知识表示和推理问题奠定来一定的 基础。 2 w 曲商务智能语义平台。本文以w e b 商务智能领域为研究对象,建 立了该领域的语义平台,具体讲述了它的w e b 数据资源模块、知识库模块 和用户模块,具体分析了本体的演化过程,因为w e b 商务信息具有明显的 时效性和上下文相关性,所以本文也同时建立了w e b 商务智能领域的时序 知识模型,并确定了时间本体的原子概念、关系和公理,实现了基于描述 逻辑的概念定义和公理的确定,奠定了形式推理的基础。 3 语义w e b 本体不一致性研究。本体在“语义w 曲”中起到了至关 重要的作用,它通过定义精确的共享术语,以提供某一特定领域可重用的 知识。但这些知识并不是静态的,而是随着时间的推移不断演化。本体在 演化发展的过程中,不可避免地会产生本体知识库的不一致现象,本文解 决了在本体演化后本体知识库产生的不一致性的处理问题,例如对不一致 的检验,不一致性的测量,后者对本体知识库的修复具有良好的参考价值。 2扬州大学硕士学位论文 在不一致的测量计算过程中,为了简化计算,我们采用基于结构划分和最 小不一致集的方法来对不一致值的计算进行优化,这样就能大大地减少了 不一致值计算时间。 关键词:语义w e b ,本体,描述逻辑,o w ld l ,商务智能,本体演化 魏榴花:基于描述逻辑的语义w e b 本体研究 3 a b s tra c t i n19 9 8 ,t i mb e r n e r s - l e ep u t sf o r w a r dc o n c e p to f “s e m a n t i cw e b ”,t h e m a j o rr e s e a r c ha i mi st oe x p a n dt h ec u r r e n tw w wa n dm a k ei n f o r m a t i o ni n t h en e t w o r ks e m a n t i c ,m a c h i n e u n d e r s t a n d a b l ea n dm a c h i n e - p r o c e s s a b l e , w h i c hi s h e l p f u lf o rt h ei n t e r a c t i o na n dc o o p e r a t i o nb e t w e e nh u m a n sa n d c o m p u t e r s t h es p r i n g i n gu po fs e m a n t i cw e bf b s t e r st h ed e v e l o p m e n to f o n t o l o g yt e c h n o l o g y a so n t 0 1 0 9 yi st h ef o u n d a t i o no fs e m a n t i cw e b ,w h i l e d e s c r i p t i o nl o g i ci sl o g i cb a s i s0 fs e m a n t i cw e b ,t h e yh a v eb e c o m ei m p o r t a n t c o n t e n tf o ri t sr e s e a r c ha n dd e v e l o p m e n t t h em a jo rw o r ki sa sb e l ow 1 t h ec o n s t r u c t i o no fd o m a i no n t o l o g ya n di t sf o r m a l i n f e r e n c er e s e a r c h o w ld l ,m a d eb yw 3 c , i sak i n do fk n o w l e d g e r e p r e s e n t a t i o n a n d a n n o t a t i o nl a n g u a g eo r i e n t e dt o w a r d ss e m a n t i cw e b i nt h i sp a p e r ,w et a k e u n i v e r s i t yo n t o l o g y f o re x a m p l et oi n t r o d u c et h e g e n e r a l m e t h o df o r c o n s t r u c t i o na n df o r m a l i z a t i o no fd o m a i n o n t 0 1 0 9 y ,f i r s t l y w ed e s c r i b e c l a s s e so fu n i v e r s i t yd o m a i nb yn k i ( n a t i o n a l k n o w l e d g ei n f r a s t r u c t u r e ) l a n g u a g ea n ds p e c i f yi t sp r o p e r t i e s ,r e l a t i o n s ,t h e nt h ec o r r e s p o n d i n gr e l a t i o n b e t w e e no w ld la n dd e s c r i p t i o nl o g i ci sa n a l y z e di nd e t a i lh e r e ,a n db yt h e c o n c r e t ee x a m p l eo fu n i v e r s i t y o n t o l o g y ,e v e r ye l e m e n to fo w ld li s i n t e r p r e t e db yd e s c r i p t i o nl o g i cs e m a n t i c ,b y t h i s w a y , t h er e s e a r c h a c h i e v e m e n t si nd e s c r i p t i o n l o g i cc a nb ea p p l i e do no w ld l ,w h i c hl a y s b a s i sf o rk n o w l e d g er e p r e s e n t a t i o na n di n f e r e n c ep r o b l e m s 2 w e bs e m a n t i cp l a t f o r mo fb u s i n e s s i n t e l l i g e n c e h e r ew et a k e 、r e b b u s i n e s s i n t e l l i g e n c e d o m a i na sr e s e a r c h o b je c t s , w ee s t a b l i s hs e m a n t i c p l a t f o r mo fs u c hd o m a i n ,a n a l y z ei t sw e bd a t as o u r c ef u n c t i o n a lm o d u l e , k n o w l e d g eb a s eo n ea n du s e ro n ea n da n a l y z ee v o l u t i o np r o c e s so fo n t o l o g yi n d e t a i l f o rt h er e a s o nt h a tw e bb u s i n e s si n f o r m a t i o nh a s a p p a r e n tt i m e e m c i e n c ya n dc o n t e x t - s e n s i t i v i t y ,h e r ew ee s t a b l i s ht i m es e q u e n c ek n o w l e d g e m o d e lo fw e bb u s i n e s si n t e l l i g e n c ed o m a i nt o o ,d e t e r m i n ea t o m i cc o n c e p t s , 4扬州大学硕十学位论文 r e l a t i o n sa n da x i o m so ft i m eo n t o l o g y ,r e a l i z et h ea i mt h a td e t e r m i n ec o n c e p t d e f i n i t i o na n da x i o m sb a s e do nd e s c r i p t i o ni o g i c ,t h e r e f o r e ,l a yb a s i sf o rf o r m a l i n f e r e n c e 3 i n c o n s i s t e n c ys t u d yo fs e m a n t i cw e bo n t 0 1 0 9 y o n t o l o g yp l a y sav e r y i m p o r t a n tr o l e i ns e m a n t i cw e b ,b yd e n n i n gp r e c i s es h a r e dt e r m s ,i to f f e r s r e u s a b l ek n o w l e d g eo fas p e c i f i cd o m a i n b u tt h ek n o w l e d g ei sn o ts t a t i c ,i t e v o l v e sc o n t i n o u s l yw i t ht h ep a s s a g eo ft i m e i nt h ep r o c e s so fo n t o l o g y e v o l u t i o na n dd e v e l o p m e n t ,i n e v i t a b l yo n t 0 1 0 9 yw i l lb ei n c o n s i s t e n t h e r ew e s o l v et h ei n c o n s i s t e n tp r o b l e m st h a to c c u ra f t e re v o l u t i o no n0 n t o l o g y k n o w l e d g eb a s e ,s u c ha si n c o n s i s t e n c yt e s ta n di n c o n s i s t e n c ym e a s u r e m e n t , t h el a t t e ri so fn i c er e f 色r e n c ev a l u ef o rt h er e p a i ro fo n t o l o g yk n o w l e d g eb a s e i nt h e p r o c e s so fi n c o n s i s t e n c yc o m p u t a t i o n ,f o rt h e a i mo fc o m p u t a t i o n s i m p l i f i c a t i o n , w e a p p l y s t r u c t u r e d i v i s i o nb a s e dm e t h o da n dm i n i m a l i n c o n s i s t e n c ys u b s e to n et oo p t i m i z et h ec o n l p u t a t i o no fi n c o n s i s t e n c y ,b yt h e w a y ,i n c o n s i s t e n c yc o m p u t a t i o nc a nb er e d u c e dg r e a t l y k e y w o r d s :s e m a n t i cw e b ,o n t o l o g y ,d e s c r i p t i o nl o g i c ,0 w ld l ,b u s i n e s s i n t e l l i g e n c e ,o n t o l o g ye v o l u t i o n ,i n c o n s i s t e n c y 魏榴花:基于描述逻辑的语义w e b 本体研究 1 绪论 1 1 选题背景及研究意义 1 1 1 选题背景 语义w e b 【1 2 j 是由w w w 的创始人b e r n e r s l e e 在2 0 0 1 年正式提出的。 它的提出,立即引起了人们的极大兴趣,在2 0 0 1 年就召开了两次关于语 义w e b 的专题学术讨论会。语义w 曲研究的主要目的就是扩展当前的 w w w ,使得网络中信息都是具有语义的,是计算机能够理解和处理的, 便于人和计算机之间的交互与合作。因而其研究的侧重点就是如何把信息 表示为计算机能够理解和处理的形式,即带有语义。在语义w e b 的研究中, 本体论、智能主体等都是极其重要的研究内容,它们都是不可分割的。 由于d l s ( d e s c r i p t i o nl o g i c ) 【3 j 可以为本体提供良好定义的、精确的语义 以及强大的推理工具,因此f r a n zb a d d e r 和i a nh o r r o c k s 等人在文【4 】中提出了 将描述逻辑作为本体【5 ,6 】语言应用到语义网中。给出了本体语言d a m l + o i l 【7 】 与描述语言s h i q 之间的关系和转化,并且使用s h i q 描述本体以及有关s h i q 的推理。描述逻辑因此成为人们研究的热点,并且随着语义w e b 概念的不断 升温,描述逻辑将发挥巨大的作用。 目前,业内人士已经充分认识到w e b 信息收集在商务中的重要性,并已 经存在很多信息搜索和情报收集等简单的信息整理和分类等研究工作。针对 w e b 上蕴含的极其丰富的各行业商业信息,现有的研究主要致力于对w e b 信 息进一步加工提炼便转化为专业领域内有价值的知识,为高效决策管理提供 更可靠的保证;利用大量的结构化和非结构化w e b 信息智能化地进行决策性 分析。但是现有商务智能系统仅能对本企业内部信息做分析处,而与之相应 的w e b 信息发掘技术也只限于用户访问模式的分析、网页链接分析和网页检 索。这造成大量有潜在利用价值的商业信息未得以充分利用。传统的信息收 集与使用方式无法适应企业商务需求,此方面的研究主要是在于w e b 商务智 能语义平台的提出来着重解决了在线w e b 知识获取和知识语义管理两个问 6扬州大学硕士学位论文 题,并且使其承载的信息具有较强的时效性和上下文( c o n t e x t ) 相关性。 语义w 曲的知识表示需要对概念、定义、对象、角色、属性进行分析, 然后选出计算机可利用的结果。异构信息的共享需要用一致定义的术语来 描述分散的资源。本体之所以在语义w e b 中起重要的作用是因为它们提供 了不同领域的共享词汇。本体有很多描述语言,例如描述逻辑,它是一阶 谓词逻辑的可判定子集【8 9 】,是知识表达能力和推理效率的一个好的折衷, 具有清晰的语义和形式化的属性。而w 3 c ( w 0 r l dw i d ew 曲c o n s o r t i u m ) 0 1 0 j 制定的o w ld l 是一种面向语义w e b 的知识标记语言,具有较强的知识 表达能力,为了进一步的研究它的知识表示、推理等问题,使之能借用描 述逻辑的大量研究成果,这方面研究的重点就是要研究描述逻辑和o w l d l 之间的对应联系。 在语义w e b 领域,随着具有很强表达能力的本体的发展,不可避免地 会发生本体不一致【1 1 ,1 2 】的现象,一个不一致的本体是没有任何作用的,不 一致问题已经成为阻碍w 曲本体的构建和应用的日益严重的问题。现在的 d l 推理器可以发现逻辑不一致性,比如说像p e l l e t 【13 1 、r a c e r 【1 4 1 和 f a c t 【1 5 】然而它们仅仅提供不可满足的类的列表。而不一致问题的解决就 留给了用户和本体工程师。改善本体对不一致性的推理迫在眉睫。 w 3 c ( w o r l d w i d ew e b c o n s o r t i u m ) ,d a r p a ( d e f e n s e a d v a n c e d r e s e a r c hp r o je c ta g e n c y ) 和 e r c i m ( e u r o p e a nr e s e a r c hc o n s o r t i u mf o r i n f o r m a t i c sa n dm a t h e m a t i c s ) 等研究机构,以及h p 、i b m 、m o t o r o l a 、n o k i a 、 p h i l i p s 等公司都积极地投入到语义w e b 的研究中。许多高校也相当重视 这方面的研究,如美国的m i t 、s t a n f o r d 、y a l e 、m a r y l a n d ,英国的m a n h c h e s t e r , 德国的k a r l s r u h e ,荷兰的v n j e 大学等等。我国相关的研究虽然开展较晚, 但越来越多的高校和研究所,例如浙江大学、北京大学、中国科学院技术 研究所等,已开始进行相关研究,例如,浙江大学、北京大学、中国科学 院计算技术研究所等,已开始进行相关研究。同时语义w e b 也被列入国家 9 7 3 项目指南。另外,有国外学者还认为2 0 0 6 年语义w e b 将成为下一个 w e b 技术的高峰,并将出现实用的语义w e b 应用,同时推动各种技术的进 步。 魏榴花:基于描述逻辑的语义w e b 本体研究 7 1 1 2 研究意义 随着i n t e m e t 的发展,在信息膨胀的今天,造成数据丰富而知识缺乏 的现状,如何有效、快速地从海量的数据里面提取有用的信息,如何更方 便地传递、交流、获取信息,在商务智能领域也存在着如何有效地从庞大 的网页信息资源中提取有用的知识或信息,如何构建出一种w e b 商务智能 语义平台,通过语义平台中的本体知识库进行知识的推理,将隐性的知识 显性化,并且在本体的演化过程中,需要对演化过程中本体出现的不一致 现象进行检验,而且如何使在该系统中表示的w 曲商务信息具有明显的时 效性和上下文相关性,从而达到提取其中存在的大量有潜在利用价值商业 信息的目的,这些都是本文要解决的问题。 w 3 c 正在制定的o w ld l 是一种面向语义w e b 的知识标记语言,而 描述逻辑作为语义w e b 的一个逻辑基础,在描述逻辑领域的研究取得了 大量的成果,而为了将这些成果应用到o w ld l 标记的本体中去,本文具 体提供了o w ld l 与描述逻辑的对应关系,通过具体的大学领域的本体的 代码来分析o w ld l 是怎样被翻译成描述逻辑的对应形式的。 本体是语义w e b 实现的关键,这将使得本体的数量和规模大大增加。在 万维网这样一个动态发展的环境,任何人可随时发送和更新信息。为此,用 户必须同发布其它信息一样方便地发布w 曲本体,同时也必须允许对这些本 体进行修改订正,并由此衍生了所谓的“本体演化”( o n t o l o g ye v 0 1 u t i o n ) 1 6 】 的问题。在本体的演化过程中,本体知识库中会不可避免地出现不一致的现 象根据经典的e xc o n t r a d i c t i o n eq u o d l i b e t ( e c q ) 原则,不一致的本体是没有作 用的。为了帮助用户解决本体的不一致问题,本文首先检查了本体的不一致 性,然后为了对不一致的本体进行修复,需要我们知道移除和修复知识库中 公理的优先级别,因为知识库中有的公理比其他的公理对不一致的“贡献 大,那么在将知识库转化为一致时,将该公理从知识库移除的可能性就更大 一些。那如何具体地量化本体知识库中的每一个公理对不一致性的“贡献, 即对不一致性进行测量,并且怎样简化测量的计算过程,就是本论文要解决 的问题的一部分。 扬州大学硕士学位论文 1 2 本文的主要工作和创新性 1 2 1 论文的主要工作 综合上述内容,本文提出了基于描述逻辑的语义w e b 本体研究。主要是 从领域本体的形式化推理研究、w e b 商务智能语义平台及其时序模型和语义 w e b 本体的不一致性测量这三个方面来进行相关基于描述逻辑的语义w e b 本 体研究。 1 2 1 1 面向语义w e b 领域本体的建立与形式化研究 现有的w e b 是由大量的h t m l 页面组成的,它的内容对于人而言, 是可读可理解的;对于机器而言,是不可理解的。为了让机器理解w e b 的内容,需要建立本体并依据本体用知识表示标记语言来标记w 曲内容, 本文主要以大学本体为例,介绍领域本体的建立与形式化方法,首先阐述 了领域本体的组成,接着采用n k i 本体语言以大学本体为例,对它的类和 属性、关系进行了具体的定义和描述,然后重点讲述了o w ld l 与描述逻 辑之间的相互翻译转换规则,为后面的分析做下了铺垫。而后具体分析了 该本体的概念【1 7 】,角色【17 1 ,属性等,详细讲述了大学本体的片段怎样转 译还成o w ld l 代码片段,最后给出该o w ld l 代码片段对应的描述逻 辑形式,实现了o w ld l 向描述逻辑的转化,为本体的形式化分析奠定了 一定的基础。 1 2 1 2 语义w e b 在商务智能领域的应用 随着计算机的发展,w 曲所涵盖的领域日益广泛,能提供的信息资源也 越来越多,企业也需要有效地对这个庞大的信息资源进行信息的获取、传播、 加工和辅助决策,以便于企业优化运营模式和管理方式,辅助产品销售、客 户关系管理和供应链管理等环节的实施。而现有的b i 系统不能充分利用具有 潜在利用价值的商业信息的问题,瞬息万变的市场资讯使得传统的信息收集 魏榴花:基丁二描述逻辑的语义w e b 本体研究 9 与使用方式无法适应企业实现了在线w 曲知识获取和商务需求,本文提出一 种基于知识挖掘的w e b 商务智能平台( k b 4 w b i ) 【1 8 】来实现知识的语义管理, 与已有的方法相比,该平台综合考虑了实时性和语义性,提高了知识精度和 效用,奠定了w e b 商务的智能性基础,具体地介绍了k b 4 w b i 平台的架构和 功能模块,针对w e b 商务信息具有明显的时效性和上下文相关性,着重研究 了基于本体演化以及在演化过程中出现不一致现象后,多协作的本体一致性 检查的算法,最后又从时间的角度上来解决k b 4 w b i 平台的知识维护问题, 也就相继引出了本体演化的问题,提出了演化模型的具体方案基于时间概 念标识的知识表示模型以及关于时间概念的相关理论。 1 2 1 3 本体的不一致性研究 本体在语义w e b 中起着非常重要的作用,改变一个一致的本体可能会 使本体处于不一致的状态,而且随着本体的规模增加并且应用变复杂,不 一致的问题在本体的设计和发展变的不可避免,那么对于对不一致的测量 也显得尤为重要,本文先具体简要概述了在本体在演化过程中会产生不一 致的原因,怎样对一致性进行检测,怎样保持本体的一致性,而后用一个 具体的知识库的实例具体讲解了本体在变化过程中产生不一致性的全过 程,进而引出:为了解决不一致性,需要对本体知识库中的公理进行不一 致性测量。然后具体讲解了将经济博弈论中的合作博弈的”s h a p l e y 值”概 念用于测量本体的不一致性的整个应用过程,这样就能将本体知识库中的 公理的不一致性得到了测量。最后对”s h a p l e y 值”的计算进行了优化。 1 2 2 论文创新性 语义w 曲的发展也面临着一系列的挑战,比如语义w 曲中大量有潜 在价值信息未得到充分利用,语义w e b 本体在复杂的演化过程中,不可避 免地会出现不一致的现象,出现不一致性现象之后,该怎样进行本体知识 库的修复工作,这些都是我们亟需解决的问题。本文的创新点归纳为以下 几个方面: 1 瞬息万变的市场资讯使得传统的信息收集与使用方式无法适应企 业商务需求,本文提出一种基于知识挖掘的w e b 商务智能平台( k b 4 w b i ) , l o扬州大学硕士学位论文 实现了在线w e b 知识获取和知识语义管理。针对w e b 商务信息具有明显 的时效性和上下文相关性,着重研究了基于本体演化的时序w e b 知识表示 模型。与已有的方法相比,该平台综合考虑了实时性和语义性,提高了知 识精度和效用,奠定了w e b 商务的智能性基础。 2 着重讲述了面向语义w e b 领域本体的建立与形式化研究的全过程, 以大学本体为例采用n k i 本体语言,对它的类和属性、关系进行了描述和 具体定义,接着具体分析了大学本体的o w ld l 代码,并把它翻译成对应 的描述逻辑形式,以达到将描述逻辑领域的大量研究成果应用到o w ld l 上来的目的。 3 本体在复杂的演化过程中,不可避免地会产生不一致的现象,为了 解决不一致的现象,我们首先要对本体知识库中的公理的不一致性进行测 量,本文采用经济博弈论中的合作博弈的”s h a p l e y 值”概念来测量本体的 不一致性,并对不一致值计算的过程进行了优化。 1 3 论文组织 本体是语义w e b 的核心,本文对基于描述逻辑的语义w e b 本体进行 研究,旨在为w e b 上丰富的信息资源构建语义平台,基于该平台对w e b 知识进行形式化推理研究,同时也对本体知识库的一致性进行分析和研 究。 第一章引言。首先分析了本课题的研究背景与研究意义,然后具体 介绍了本文的主要工作和创新性,最后介绍了本文的组织结构。 第二章基于描述逻辑的语义w e b 相关概念。首先概述了语义w e b , 接着介绍了描述逻辑的相关知识和概念,然后介绍了描述逻辑的基本描述 语言,它的主要内容是a l 语言基本描述和a l 语言族系,以及 a l c ( a t t r i b u t i v ec o n c e p td e s c r i p t i o nl a n g u a g ew i t hc o m p l e m e n t s ) 【1 9 】的语法和 语义表示,而后介绍了本体的相关知识,其中包括本体的定义、本体的分 类,最后具体地介绍了本体描述语言o w l 【2 0 2 2 】。 第三章面向语义w 曲领域本体【2 3 】的建立与形式化研究。首先描述了 领域本体的组成,接着以大学本体为例,用n k i 语言详细描述了大学本体 魏榴花:基于描述逻辑的语义w e b 本体研究 1 1 的类,定义和规范了它的属性和关系,接着给出了其类层次关系图,而后 又以大学本体为例,重点讲述了o w ld l 与描述逻辑的对应关系,为后面 的分析做下了铺垫,而后给出了大学本体的片段o w ld l 代码片段,具体 分析了该本体的概念,角色,属性等,然后给出该o w ld l 代码片段对应 的描述逻辑形式,实现了o w ld l 向描述逻辑的转化,更有利于领域本体 的形式化分析。 第四章语义w e b 在商务智能领域应用。首先简介了一下知识管理和 商务智能方面的知识,具体的分析了一下现有的b i 系统不能充分利用具 有潜在利用价值的商业信息的问题的现状,提出了k b 4 w b i ( k n o w l e d g e m i n i n gf o rw 曲b u s i n e s si n t e l l i g e n c e ,k b 4 w b i ) 平台,具体分析了它的各 个功能模块,具体讲述了本体的演化过程,最后由于w e b 环境的开放和动 态特征,所以w e b 知识必须具有时效性和上下文相关性,本文给出了基于 本体演化的时序w e b 知识表示模型,并确定了时间本体的原子概念、关系 和公理。 第五章语义w e b 本体的不一致性研究。首先介绍了基于本体在演化 和发展的过程中产生不一致性的原因,接着阐述了怎样对一致性进行检 测,怎样保持本体的一致性,而后用具体的本体知识库的实例来描述本体 在演化过程中产生不一致性的过程。针对这种不一致的现象,我们就提出 了本体不一致性测量的问题,我们将经济博弈论中的合作博弈的”s h a p l e y 值”概念用于测量本体的不一致性,并介绍了整个的应用和计算过程,得 本体知识库中公理的不一致性得到了量化,从而有助于知识库恢复一致 性。最后对”s h a p l e y 值”的计算进行了优化工作。 第六章总结与展望。对本文的研究工作进行了总结,介绍了作者的研 究结论和主要贡献;展望了下一步的研究课题和方向。 1 2 扬州大学硕+ 学位论文 2 基于描述逻辑的语义w eb 相关概念 2 1 语义w e b 概述 互联网的使用使得w e b 在当今人们的生活中起作越来越重要的作用,但 是信息的膨胀也使得人们同益处在无用信息海洋的包围之中。从某种意义上 讲,人们不是缺乏信息而是为信息所困为信息所累。因为目前的w w w 还不 能说是一个能自动管理的信息源,它更多的仅仅是一个文件媒介。对使用者 来说常常是比一个庞杂的档案馆好不了多少。信息的发展在不断地扩大w e b 页,对计算机来讲就是在不断增加文件。这样的w e b 被称为语义标注 ( m a r k u p ) h t m l 其仅能提供对文本的描述信息和供人类使用的图形信息,本 身并不具有智能。语义w e b 的目的是建立机器可以理解的w e b 资源,它的资源 因而能被自动工具如搜索引擎和人类用户共享和处理。不同代理间的信息共 享要求语义标注,即具有关于它的内容的信息w e b 页的一个注解,这些内容 是被搜索w 曲页的代理能理解的。这样的一个注解将在某些标准的、富于表 现的语言( 例如,提供逻辑操作符和一些定量的形式) 给出并且使用某些术 语。 语义w 曲是由w w w 的创始人b e r n e r s l e e 在2 0 0 1 年正式提出的。 语义w e b 研究的主要目的就是扩展当前的w w w ,使得网络中的信息都是 具有语义的,是计算机能够理解和处理的,便于人和计算机的交互和合作。 因而其研究的侧重点就是如何把信息表示为计算机能够理解和处理的形 式。即带有语义。语义w 曲主要基于x m l 和r d f r d f s 【24 。,并在此基础 上构建本体和逻辑推理规则,以完成基于语义的知识表示和推理,从而能 够为计算机所理解和处理。语义w 曲的体系结构,如图2 1 所示。 魏榴花:基于描述逻辑的语义w e b 本体研究 1 3 同 i 一 同 【一 网 i 一 t r u s l o n l 0 1 0 9 yv o c a b ul l l l ) r d f + r d s c h e m a d i g i c a i x m l + ns + x m l s c h e m a i j n 沁d eu r i 图2 1 语义w 曲的体系结构 1 u n i c o d e 和u r i ,是整个语义w e b 的基础,u n i c o d e 处理资源的编 码,u r i 负责标志资源; 2 x m l + n s + x m l s c h e m a ,用于表示数据的内容和结构; 3 r d f + r d f s c h e m a ,用于描述w 曲上的资源及其类型; 4 o n t o l o g yv o c a b u l a r y ,用于描述各种资源之间的联系; 5 7 是在下面四层的基础上进行的逻辑推理操作。核心层为 x m l ,r d f ,o n t o l o g y ,这三层用于表示w e b 信息的语义。 从上面的结构和定义可以知道语义w e b 信息组织和描述上一个重要的 区别是它注重对信息语义的刻画和在此基础上的联系,而其中o n t o l o g y 是组 织、抽象的基本方式。 语义w e b 采用统一资源标识符( u n i f o r mr e s o u r c ei d e n t m e r s ,u r i ) 以及 统一资源名称( u n i f o r mr e s o u r c en a m e ,u r n ) 的区别在于u r i 范指所有以字 符串标识的网络资源,包含了u r l 和u r n 。另外由于语义w e b 的最终目的是 要建立一个全球信息的网络,在这个网络上应该涵盖各种语言和文字的信息 资源,所以它采用统一编码u n i c o d e 作为字符的编码方案。这一层是整个语 义w e b 的基石,它成功地解决了w e b 上资源的定位和跨地区字符编码的标准 格式的问题。 语义w e b 对语义的描述就是元数据,通过添加元数据,w e b 为各种 智能和自动化的w e b 应用奠定了基础。语义w e b 主要要实现以下的目 1 4 扬州大学硕士学位论文 标【2 5 】【2 6 】: 1 表达意义:将w e b 资源的含义以一种结构化的形式表达出来,改 变目前w e b 内容面向人工处理的表示方式,使计算机能自动处理w 曲的 语义,理解其含义,能代替人类自动处理信息,从这个角度看,语义w 曲 集成了w e b 的普遍性和尽可能分散的特点。 2 知识表示:与人工智能中的知识表示有联系也有很大的区别,其中 重要的不同点是传统知识表示是集中式控制的,也即概念定义是全局的, 这种方式无法适应w e b 高度分布式的结构。语义w e b 针对w e b 的特点提 出了基于o n t o l o g y 的知识表示,能很好的支持高度分布式应用如w e b 服 务描述与发现。 3 本体论( o n t o l o g y ) ( 概念知识说明) :本体论是语义w e b 的基础,它 是用来描述语义信息的元数据的元数据。在语义w e b 中,人们都可以定 义自己的语义表述,但是在与其它服务交互时需要有一种机制声明所定义 的概念,否则就不可能解释元数据的含义。本体论定义了对象的类以及这 些类间的关系,还定义了推理规则,以文档的形式随语义描述一起发布, 已经发布的本体论语言标准是o w l l 2 7 1 。 4 知识的演化:语义w e b 中人们可以很方便的根据自身需要定义概 念知识,而语义w e b 规定了统一的语义标记语言,可以将这些概念组织 在一起,大大加快w e b 知识的优化和更新。 2 2 描述逻辑概述 描述逻辑( d l s ) 是知识表示的一种形式化语言,适合表示关于概念和概 念层次结构的知识,因此也叫做概念表示语言和术语逻辑。描述逻辑统一了 大家所熟悉的基于框架( f r a m e s ) 、语义网络( s e m a n t i cn e t w o r k s ) 、面向对象 的表示( o b j e c t o r i e n t e dr e p r e s e n t a t i o n ) 以及语义数据模型( s e m a n t i cd a t a m o d e l s ) 系统的逻辑基础,并给出一种形式化的基于逻辑的语义。 描述逻辑的基本构件是概念( c o n c e p t ) 、关系( r o l e ) 和个体( i n d i v i d u a l ) 。 概念描述了个个体集合的共同属性,并且可将概念解释为对象集的一元谓 词,将关系解释为对象之间的二元关系。描述逻辑的特点在于,将大量的 魏榴花:基于描述逻辑的语义w e b 本体研究1 5 构造符作用到简单概念上,从而可以建立更多复杂的概念。另外,d l s 将推 理作为中心服务,即从知识库中显式包含的知识推导出隐含表示的知识。 d is 注重关键推理服务的可判定性,并且提供了可靠的、完备的推理算法。 其主要的推理有分类( c l a s s i f i c a t i o n ) 、可满足性问题、包含关系以及实例检 测。分类是对一个基于包含关系的概念层次结构的计算,即判断一个术语表 中不同概念之间的子概念超概念的关系。实例检测是判断一个个体是否是 某个概念中的实例。 描述逻辑是由一系列基于概念的知识描述形式组成,它是一阶谓词逻辑 的可判定子集,它通过首先定义领域内相关的概念来描述领域知识。这些概 念被用来详细说明领域中对象的属性。通常,描述逻辑语言由两部分组成: 术语部分( t b o x ) 和声明部分( a b o x ) 。t b o x 包含了一公理形式呈现的内涵知识 而a b o x 包含领域内具体元素的外延知识,称为个体。t b o x 联合a b o x 被称为 描述逻辑知识库。在t b o x ,基本描述是原子概念( 用一阶谓词来表示) 和 原子角色( 用二阶谓词来表示个体间的关系) 。概念描述可以建立在反复采 用构造算子的原子概念上,构造算子可以是合取,析取,否定,值限制,存 在量化。公理表达的是概念和角色是怎样相互关联的。通常c d 表示“概 念c 被概念d 包含 ,或c 三d 表明c 互d 并且c2d ,其中c 和d 是概念描述。 a b o x 是有一系列的形如c ( a ) 和r ( a ,b ) ,其中r 是角色,a ,b 是个体,例如a b o x 中可能包含公理a r i s t o t l e 和p l a t o 是m a n 的实例,而且 是角 色p u p i l o f 的一个实例。比较典型的描述逻辑系统有:l o o m 、c r a i l 、 c l a s s i c 以及包括最早的k l o n e 系统【2 8 】 描述逻辑是知识表示形式化家族的一个新的名字,它首先定义现实世 界的应用领域中的一些相关概念,然后通过这些概念来说明领域中出现的 一些事物的属性。就像它的名字暗含的一样,它具有形式的基于逻辑的语 义,同时,它把推理作为一个中心服务。 基于描述逻辑的k r 系统便于建立知识库、内容推理和对他们的操作, 它的架构如图2 2 所示。 1 6 扬州大学硕士学位论文 图2 - 2 基于描述逻辑的知谚j 表不系统的架构 描述逻辑系统不光存储术语表和断言,他还提供了关于他们的推理服 务。判断某一个术语是否可以满足、一个术语是否包含另一个术语,这都 是典型的推理任务。 解释i 定义了概念,角色和个体的形式语义。它是由非空的集合,组 成,称为域。解释函数i 映射每一个原子概念a 到,的子集彳7 ,而且映射 每个原子角色r 到一个二元关系r 。另外,i 映射每个个体名字 a 到一个元素口。,。解释i 满足c d 如果c 7 d 7 。它满足c 三d 如果 c 。= d 7 它满足c ( a ) 如果口c 7 而且它满足r ( a ,b ) 如果( 口7 ,b 1 ) r 7 基本描述逻辑a l c 提供了否定、概念交、概念并、全局约束、存在 约束构造符。 描述逻辑在现实世界中需要指
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 兔子饲养中兔毛加工工艺的研究与开发考核试卷
- 肺脏疾病检查指南解读
- 新生儿气囊使用操作规范
- 脑血管疾病案例式教学
- 海姆立克儿童急救法
- 腮腺常见疾病超声诊断
- 糕点加工过程中的卫生管理
- GSK256066-Standard-生命科学试剂-MCE
- 2025年美容护理行业中期领跑新消费美妆个护全面崛起
- 2025年新疆生产建设兵团中考生物试卷及答案
- 水利工程施工组织设计模板
- 医院感染暴发报告及处置制度及流程
- 2025经皮穿刺脊髓电刺激治疗痛性糖尿病神经病变专家共识
- 山东省潍坊市2024-2025学年高二上学期期末考试历史试题(原卷版+解析版)
- 模具定制合同订单
- 中国影视产业发展现状与前景预测
- 人工智能辅助科研数据挖掘与分析
- 高速公路隧道防水层施工方案
- 河南省郑州市管城回族区2024-2025学年数学五年级第二学期期末联考试题含答案
- DGJ08-102-2003 城镇高压、超高压天然气管道工程技术规程
- 高炮广告牌施工方案
评论
0/150
提交评论