(计算机软件与理论专业论文)基于意见词汇本体的商品意见属性自动标注系统研究.pdf_第1页
(计算机软件与理论专业论文)基于意见词汇本体的商品意见属性自动标注系统研究.pdf_第2页
(计算机软件与理论专业论文)基于意见词汇本体的商品意见属性自动标注系统研究.pdf_第3页
(计算机软件与理论专业论文)基于意见词汇本体的商品意见属性自动标注系统研究.pdf_第4页
(计算机软件与理论专业论文)基于意见词汇本体的商品意见属性自动标注系统研究.pdf_第5页
已阅读5页,还剩68页未读 继续免费阅读

(计算机软件与理论专业论文)基于意见词汇本体的商品意见属性自动标注系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 i i i ii iii i l li i i iul lu i y 17 3 4 6 7 0 随着网络b 2 b 的发展,网上购物逐渐成为一种新兴的消费形式,它使人们在不同的 时间、不同的地点进行高效的网络b 2 b 成为可能。 目前,网络上积累了大量w e b 商品资源,但存在对w e b 商品资源意见属性的标注 结构简单、缺乏语义,特别是对w e b 商品资源的意见属性的自动标注方面,存在着严 重的不足,不能为用户提供及时的意见参考,制约着网络b 2 b 的发展,因此,如何对 w e b 商品资源进行意见属性的标注,并且反馈给用户对该资源的意见,为用户提供该资 源意见自动标注,将对资源的相关信息方便、快速地呈现给用户? 已成为网络b 2 b 中 亟需解决的问题。 论文把意见词汇本体理论和意见词汇相似度计算模型引入到w e b 商品中意见属性 自动标注系统中来,利用商空间下本体的形式化理论构建意见词汇本体,实现意见词汇 知识在语义层面上的任意跳转和推理,并利用意见词汇相似度计算模型计算意见元词汇 和意见词汇本体的相似度来确定对该商品资源的满意程度,实现对w e b 商品资源意见 语义自动标注系统,为用户提供对该商品资源的总体意见,方便用户对商品意见的查询。 论文主要内容是: ( 1 ) 结合软件开发的过程,提出商空间下本体形式化理论,为实现构建意见词汇本 体的层次间的任意跳转以及层次间的推理打下基础,并结合本体基本的建模方法和h o z o 开发工具,创建意见词汇本体知识模型,提供意见词汇分类体系。 ( 2 ) 通过对概念格理论和本体的层次结构的深入研究,构建了概念格理论下的语义 相似度计算模型,同时分析了意见元词汇和意见词汇本体,计算了意见元词汇和意见词 汇本体的相似程度,为w e b 商品资源意见属性的标注提供语义自动标注,形成对该w e b 商品资源意见描述文档。 ( 3 ) 基于构建的意见词汇本体知识和语义相似度计算模型,利用j a v a 程序语言设计 实现一个原型系统。系统具有w e b 商品资源意见元词汇的提取和意见相似度的计算。 通过对意见元词汇的相似度计算,系统能够为用户呈现所需要w e b 商品资源意见属性 自动标注。为用户网上购物提供意见参考。 l, a b s t r a c t w i t ht h ed e v e l o p m e n to fb 2 bn e t w o r k s ,o n l i n es h o p p i n gh a sb e c o m ean e wk i n do fc o n s u m p t i o n p a t t e r n s ,w h i c ha l l o w se f f i c i e n tb 2 b ,a td i f f e r e n tt i m e s ,i nd i f f e r e n tl o c a t i o n s ,p o s s i b l e a tp r e s e n t ,t h en e t w o r kh a sa c c u m u l a t e dal a r g en u m b e ro fw e bc o m m o d i t yr e s o u r c e s ,b u td u et ot h e s i m p l ea n n o t a t i o ns t r u c t u r eo fc o n m a e n tp r o p e r t i e so fw e bc o m m o d i t yr e s o u r c e s ,t h el a c ko fs e m a n t i c s ,a n d e s p e c i a l l yt h es e r i o u sd e f i c i e n c i e si na u t o m a t i ca n n o t a t i o no fc o m m e n tp r o p e r t i e so fw e bc o m m o d i t y r e s o u r c e s ,t h e r ea r en 0t i m e l ya d v i c eo fr e f e r e n c ef o ru s e r s ,w h i c hr e s t r i c t st h ed e v e l o p m e n to fb 2 b n e t w o r k s t h e r e f o r e ,h o wt oa n n o t a t et h ew e bc o m m o d i t yr e s o u r c e sw i t hc o m m e n ta t t r i b u t e s ,t op r o v i d e f e e d b a c kt ot h eu s e r so fa d v i c ea b o u tt h er e s o u r c e sa n dt op r o v i d eu s e r s 诵la u t o - t a g g i n gr e s o u r c ev i e w s w o u l dm a k er e l a t e dr e s o u r c e si n f o r m a t i o ne a s i l ya n dq u i c k l yp r e s e n t e dt ot h eu s e l 怎h a sb e c o m eu r g e n t p r o b l e m so f n e t w o r kb 2 b t h i sp a p e ri n t r o d u c e sc o m m e n tv a c a b u l a r yo n t o l o g yt e c h n i q u e sa n dc o m m e n tv a c a b u l a r ys i m i l a r i t y c o m p u t i n gm o d e lt oc o m m e n tp r o p e r t i e so fw e bc o m m o d i t ya u t o m a t i ca n n o t a t i o ns y s t e m i tu s e st h e 、 i v j 弋 、 目录 摘要i a b s t r a c t i i i 目录v 第一章绪论1 1 1研究背景l 1 2 研究现状2 1 2 1 语义标注研究现状2 1 2 2 本体研究现状3 1 2 3 语义相似度研究现状4 1 3 研究内容4 1 3 1 研究内容:。4 1 3 2 课题的创新点5 1 4 组织结构5 第二章本体形式化理论与意见词汇本体构建7 2 1商空间理论下本体形式化及其检验7 2 1 1 商空间基本理论7 2 2 2 本体的基本概念8 2 1 2 本体形式化模型的建立9 2 1 3 本体形式化模型的检验。l3 2 2 本体构建的基本方法1 4 2 2 1 本体的描述语言1 4 2 2 2 本体的建模方法1 6 2 2 3 本体开发工具1 9 2 3 本体的应用领域 、2 l 2 4 意见词汇本体构建过程2 2 v 2 4 1意见词汇本体需求分析2 2 2 4 2 意见词汇本体构建计划制定2 2 2 4 3 意见词汇本体构建实施2 2 2 5 本章小结2 8 第三章基于概念格理论的语义相似度计算模型2 9 3 1 概念格的基本理论。2 9 3 。2 语义相似度的关键因子3 0 3 2 1 域相似度3 1 3 2 2 概念相似度。3 2 3 2 3 属性相似度计算3 3 3 。3 语义相似度模型的建立3 4 3 4 本章小结3 5 第四章w e b 商品意见属性自动标注的关键技术。3 7 4 1w e b 商品意见领域特征元词汇分析及提取3 7 4 2 意见元词汇相似度的计算。3 8 4 3w e b 商品意见属性自动标注3 8 4 3 1w e b 语义自动标注方法3 8 4 3 2w e b 语义自动标注过程3 9 4 4 本章小结4 0 第五章原型系统的设计与实现4 1 5 1 系统需求4 1 5 2 系统设计4 2 5 3 系统实现4 3 5 3 1 开发平台4 3 5 3 2 开发环境配置一4 3 5 3 3 系统关键技术4 4 5 3 4 系统运行实例4 9 5 4 本章小结5 1 第六章总结与展望一5 3 v i f j :1 1 、 i 6 。1研究总结5 3 6 2 进一步的研究工作5 3 参考文献5 5 致谢5 9 攻读学位期间发表的学术论文目录6 1 独创性声明6 3 关于论文使用授权的说明6 3 v l i 上 , 一 第一章绪论 置 、 1 1 研究背景研究背景 i f 、 第一章绪论 随着网络b 2 b 的发展、网络商店已经成为下一代网络购物的新趋势,但是网络商 品十分丰富,如何为顾客提供该商品资源丰富的意见标注,为顾客购买商品提供意见参 考,成为人们关注的焦点。网络商品资源意见属性的语义标注作为一种新兴的网络资源 呈现形式,逐渐受到国内外语义研究领域的重视。 传统w e b 缺少必要的语义信息。传统的商品资源意见标注方式的特征主要是:在 w e b 页面上,提供一些商品的意见属性,为其他客户提供该商品资源的意见属性标注。 但是这种方式不适合每一个用户个性化的意见表达,不能满足多样化的商品意见属性的 自动标注。 网络商店是通过w e b 进行网上交易的,它充分利用网络技术提供的具有全新沟通 机制和丰富网络资源的环境。在网络b 2 b 的实施过程中,网络商店资源的建设以及客 户对资源意见的标注是核心组成部分,它消除传统网络b 2 b 在人员、地域、时空等多 方面的限制,提供大量全面的网络商品资源以及该资源的意见属性的个性标注,客户通 过对网络商品资源的意见标注,选择适合自己所需的商品资源。 然而,随着网络b 2 b 的发展,许多问题也随之产生。例如,资源结构杂乱、缺乏 语义、同时客户对资源的意见标注无法有效共享、异构系统之间不能有效互操作等。这 些问题严重制约了网络b 2 b 的发展。因此,如何有效地为网络商店进行意见属性的语 义标注;如何对这些商品资源的意见属性进行有效地管理,使客户能够准确地找到与需 求相关的商品资源;如何根据资源所具有的意见属性自动标注内容,将商品资源的相关 意见信息方便、快速地呈现给客户等等成为网络b 2 b 中亟需解决的问题。 t i mb e m e r sl e e 提出语义w e b ( s e m a n t i cw 曲) 概念,它能够在语义层次上对网络 资源的意见属性进行一致描述,这为解决上述问题提供了一个新的技术思路。语义w e b 是目前w e b 的一个扩展,它的基本思路是为网络资源添加一些机器可以理解的语义元 数据描述,使网络信息既能够让人阅读,也能够让机器在一定程度上理解w e b 信息的 语义。本体是语义w e b 的一个基本技术,它能够提供一种明确的、形式化的方式来表 基丁意见词汇本体的商品意见属性自动标注系统研究 示领域知识,进而提高异构系统间的互操作性、促进信息共享。 论文以意见词汇本体为例,研究商空间下本体形式化及其检验理论,为意见词汇本 体的构建及其在网络资源意见属性标注中的应用提供理论基础,并设计一个基于意见词 汇本体的w e b 商品意见属性自动标注原型系统。系统中利用意见词汇本体研究意见词 汇分类体系,对资源的意见属性进行有效的管理,使资源的意见属性可以在语义层次上 达到共享,并且为客户查看该资源的意见属性时,根据意见词汇本体把资源的意见属性 内容清晰地呈现给客户。 1 2 研究现状 1 2 1 语义标注研究现状 w e b 创始人t i mb e m e r s l e e 于1 9 9 8 年首次提出语义w e b 的构想,利用本体中定义 一 l 弋 、 第一章绪论 m n m 3 1 ,利用已有本体导出的标记标注文档是该工具的主要目标。德国k a r l s m h e 大学 a i f b 研究院开发是o n t o m a t 2 a n n o t i s e ,是c r e a m 标注环境框架下的一个参考实现, 该工具的目标是生成带标注的w e b 页面,其内容可供语义w e b a g e n t s 推理。属于u m l b a s e do n t o l o g yt o o l s e t ( u b o t ) 项目的一部分的a e r o d a m l 【4 】,主要采用自然语言信息提 取方法从w e b 页面自动生成d a m l 标记的知识标注工具,该工具把常见的概念和关系 与d a m l 本体中的类和属性联系起来。由m a n c h e s t e r 大学i n f o r m a t i o nm a n a g e m e n tg r o u p 和s o u t h a m p t o n 大学i n t e l l i g e n t ,a g e n t s ,m u l t i m e d i ag r o u p 联合研究开发的 c o h s e t 4 1 ( c o n c e p t u a lo p e nh y p e r m e d i as e r v i c e se n v i r o n m e n t ) 。由m a r y l a n d 大学计算机 科学系p a r a l l e lu n d e r s t a n d i n gs y s t e mg r o u p 研究开发的s h o e 4 ( s i m p l eh t m lo n t o l o g y e x t e n s i o n ) k n o w l e d g ea n n o t a t o r 。所有这些都是在基于本体的语义标注方面所取得的成 就。 但是这些标注工具仍然存在一些的不足:本体语言和语义标注语言没有采用最新的 w 3 c o w l ,大部分以r d f ( s ) 、d a m l + o i l 为主;在对w e b 内容进行语义标注时,本 体元素的使用上还很有限,甚至有些工具还不支持r e l a t i o n s ( 臣p 无法生成对语义w e b 极其重要的关系元数据) ;只有少数工具( 如s m o r e 等) 支持w e b 内容的多本体标注,这 与语义w e b 的本体环境不符;由于w e b 内容不仅只有h t m l 页( 文本) ,还有多媒体对 象、电子商务应用中的业务( 数据库x m l ) 数据、e s c i e n c e 中的科学数据等,但是几 乎全部工具只支持静态h t m l 页( 文本) 的语义标注;只有少数工具支持内容写作与语义 标注的同步进行,大部分工具仍然采用先创建内容、后进行标注的“两步法:语义标 注过程中,对本体查询、辅助推理支持及元数据产生的自动化程度还不够详细。这些标 注工具的使用,都影响了大量一般w e b 用户对工具创建语义w e b 内容的积极性和可能 性【5 1 。 1 2 2 本体研究现状 目前,本体已用于知识的表达、共享、和重用,被计算机的许多领域采用,例如: 信息检索、异构信息信息处理、知识工程、软件复用、数字图书馆等。由于本体是能够 在语义和知识层面来描述信息系统的概念模型的建模工具,引起越来越多的国内外研究 人员的关注。现在本体主要研究方向有:概念及其分类和本体上的代数的理论研究、 在信息系统中的信息的组织、知识的标注及检索的应用。 在实际的应用中,本体模型只有构建良好、准确完善,才能使本体在各个领域中发 1 。由于本 格意义上 方法论不 已经成为 。同时由 的关键环 体语言语 算本体中 目前的本 本体中语 语义标注 中意见属 现意见词 意见元词 品资源意 属性的查 形式表示 念、角色 演者的公 l 弋 、 第一章绪论 理。其次,研究角色概念间的关系。基本观点与思路是:每个角色都是一个个体;每个 角色都只有一个扮演者;对于每个角色至少有一个语境。如果存在多个语境:所有这些 语境都属于r e l a t i o n s 、p r o c e s s 和s u b s t a n c e 的其中之一;没有任何角色是另外角色的语 境。对多语境,基于角色聚合的思想来研究:根据其本质依赖,组织多语境依赖的角色 概念。角色聚合由基本概念和角色概念的层次结构来表示。这两种层次结构在角色聚合 上有相同的语义信息。 ( 2 ) 研究h t m l 解析器,并提出与意见词汇本体和元意见词汇相互结合的解析算法, 这是语义标注重点,基于此,对计算域相似度、概念相似度和属性相似度的算法进行研 究,进而构建语义相似度计算的三维空间模型。 ( 3 ) 基于构建的意见词汇本体知识和语义相似度计算模型,利用j a v a 程序语言设计 实现一个原型系统。系统具有w e b 商品资源意见元词汇的提取和意见相似度的计算。 通过对意见元词汇的相似度计算,系统能够为用户呈现所需要w e b 商品资源意见属性 二 自动标注。为用户网上购物提供意见参考。 1 3 2 课题的创新点 本课题的创新点在于: ( 1 ) 提出商空间下本体形式化及检验理论,为实现意见词汇本体的层次间的任意跳 转以及推理奠定了理路基础,并结合本体基本的建模方法和h o z o 开发工具,创建意见 词汇本体知识模型,构建意见词汇分类体系。 ( 2 ) 通过对概念格理论和本体的层次结构的深入理解,构建概念格理论下的语义相 似度计算模型,同时分析意见元词汇和意见词汇本体,计算意见元词汇和意见词汇本体 的相似程度。 1 4 组织结构 本文共六章,各章的主要内容如下t 第一章绪论。主要论述本课题的研究背景,分析了目前网络b 2 b 系统存在的问题, 并给出相应的解决方法引入语义w e b 的概念,它的一个核心技术就是意见词汇本 体。然后阐述了网络语义标注和本体研究现状,最后给出本课题所作的工作、创新点以 及文章的组织结构。 第二章本体形式化理论与意见词汇本体构建。阐述本体相关的基本概念,包括本体 s 基于意见词汇本体的商品意见属性自动标注系统研究 的定义、分类以及建模元语;了解本体的描述语言、开发工具以及目前存在的建模方法。 重点论述了商空间下本体形式化定义,为构建意见词汇本体提供更加便利的分类体系奠 定理论基础,最后在该形式化理论下论述了意见词汇本体的构建过程。 第三章基于概念格理论的语义相似度的计算模型。本章主要目的是为了提高意见元 词汇标注的准确性,首先分析目前概念格理论,然后根据本体的思想,提出完善的概念 格理论下语义相似度建模规范。 第四章w e b 商品意见属性自动标注的关键技术。首先阐述w e b 商品意见元词汇定 义及特点,着重论述描述商品资源的元词汇标准,分析元词汇与本体之间的区别,然后 提出基于元词汇和意见词汇本体下相似度计算模型算法,最后提出w e b 商品资源意见 属性语义标注的方法及过程。 第五章原型系统的设计与实现。在前三章的基础上,基于构建的意见词汇本体、提 取的意见元词汇及和意见词汇本体的相似度计算模型,同时利用j a v a 语言在m y e c l i p s e 开发平台上设计并实现了一个w e b 商品意见属性自动标注系统。 第六章结论和展望。对本课题的研究成果进行总结,对不足和有待改进的地方进行 了分析,并对下一步的工作前景进行了展望。 6 第二章本体形式化理论与意见词汇本体构建 第二章本体形式化理论与意见词汇本体构建 2 1商空间理论下本体形式化及其检验 用粒度商空间模型形式化本体并对其进行了解释和检验。实现了在不同层次的本体 商空间之间进行自由的跳转和推理,从而对本体的形式化更合理。为开发意见词汇本体 奠定理论基础。实现本体的智能全局分析能力。 在语义网中,本体具有非常重要的地位,是解决语义层次上w e b 信息共享和重用 的基础。本体是对客观存在的概念和关系的描述。而对于本体形式化和检验问题一直是 本体建模的热点。为了对客观世界进行形式化的描述和推理,以使计算机更具有人类的 智能推理能力,就需要一种合理的逻辑语言对本体进行合理的形式化表示,从而为本体 表达提供公理和推理规则,为智能推理提供基础。文【6 】中基于描述逻辑的本体模型的建 立【7 羽,文【9 1 中基于扩展序类逻辑的本体模型的建立都是在本体形式化建模方面所做的工 作。但是在表示本体不同层次空间世界上进行的问题求解,以及从一个本体层次空间跳 转到另一个本体层次空间仍然存在一定的困难,利用粒度商空间法对本体进行形式化的 研究,使得在本体分析的过程中更容易实现层次之间的跳转,从而为人类全局分析能力 建立智能模型。本章基于商空间来探讨本体形式化问题。 2 1 1 商空间基本理论 张钹、张铃教授提出的商空间理论【1 仉1 2 1 ,建立了基于商空间理论的粒度计算模型, 该模型用一个三元组( x ,f ,t ) 来描述一个问题,x 表示问题的论域,f ( ) 是一个映射, 表示论域的属性函数,用f :x y 表示,y 是n 维空间也可以是一般的空间,t 是论 域的结构,指论域x 中各元素的相互关系。分析或求解问题是指对论域x 及有关的结 构、属性进行分析和研究。该模型中,当x 很复杂的时,就用比较粗的粒度来考察问题, 也就是在论域x 上给出一个等价关系r ,得到一个对应于r 的商集 x 】,将对应的三元 组变为( 【x , f 】, t 】) ,称为对应于r 的商空间,从而将问题( x ,f ,t ) 转化为新层次的 问题( x 】,【f 】,【t 】) ,逐步细化,从而将问题表示成不同的粒度世界,达到简化问题、 解决问题的目的。商空间法是将不同的粒度世界与数学上的商集概念统一起来,表示对 7 基于意见词汇本体的商品意见属性自动标注系统研究 象模型的方法,该模型着重研究不同粒度世界之间的互相转换、互相依存的关系。 2 2 2 本体的基本概念 ( 1 ) 本体的定义 本体概念起源于哲学域,最初公元前古希腊哲学家亚罩士多德( 公元前3 8 4 _ 公元 前3 2 2 ) 尝试对世界上的所有事物进行分类。本体在哲学上的定义是“对世界上客观事 物系统措述,即存在论 ,是客观存在事物的一个系统的解释和说明,关注的是客观存 在事物的抽象本质。本体后用被应用到计算机科学和人工智能领域,被赋予新的含义。 在人工智能领域,美国s t a n f o r d 大学的g r u b e r 和n e c h e s 等人于1 9 9 1 年最早给出本体定 义【1 3 】,是:“构成相关领域词汇基本术语及其关系,和使用这些基本术语及其关系来构 成该词汇外延规则 。 在知识系统、信息系统领域,本体被越来越多的人研究,并给出许多不同的o n t o l o g 定义。其中最著名并且被最广泛引用的定义是g r u b e r 于1 9 9 3 年提出的。他采用概念化 的形式定义 y ,y 可以是n 维空间,也 可以是一般的集合,属性包括类属性和数值属性,类属性表示类间的关系,而数值属性 表示类的属性;t 是论域集的结构,它表示论域集中各元素之间的关系,例如p a r t o f , k i n d o f , i n s t 锄c e o f 和a t 仃i b u t e o l 对于给定的一个本体o ,有时需要在概念树上不同的层次间对本体进行问题分析, 因此需要研究不同粒度空间世界的关系。 o r o r i r 2 r n 设r i 对应的商集为 x 】i ( i = o ,n ) ,则不同层次的粒度论域集有如下的序关系: x 】o 【x 】i x 】2 ,d 、e 为两个s 一术 语公式,若对任意本体,有d c _ e ,则称e 包含d 。 定义5 :等价关系:给定术语构造符集s 和本体o = ,d 、e 为两个s 一 术语公式,若任意本体,有d c _ e 和e c d ,则称d 与e 等价,记为d - - = e 。 等价关系集r 给定本体o = ,确定等价关系集r = ,r l ,r 2 ,r n ) 使其本体能够 划分成不同层次的商空间,从而能够在同一商空间上或不同商空间上对本体进行分析和 推理。同时我们定义r 0 r 对应最“粗”的本体商空间。r n r 对应最“细 的本体商 空间。 定义6 :等价关系集r 是论域集x 上不可区分关系集。 定义7 :给定本体o = ,确定等价关系集r = ,r l ,r 2 ,r n ) ,对 于等价关系r i ,r i 满足 ( 1 ) r i ,r i r ( 2 ) i ,j 1 ,2 ,n ) ( 3 ) i ,i 0 ,1 ,2 ,o o l 9n ) ,其中 t 】i 表示不同层次的商空间以及同层次商空间之间的关系。 第二章本体形式化理论与意见词汇本体构建 定义8 :实例声明的模型:给定本体o = ,若存在本体等价关系集r ,使 得实例声明q 成立,则称等价关系集r 为q 的一个模型。如果等价关系集r 是 o n 声明 的模型,则称r 为 o 】n 的一个模型。 由于采用统一命名机制,因此,对本体中任意2 个个体 a 】n ,【b n 有 a 】n 【b n 。 2 1 3 本体形式化模型的检验 ( 1 ) 术语检验 对已定义的本体模型o = 和等价关系集r 进行以下方面的术语检验: 其中x 、y 为原子术语或者术语公式 可满足性检验:给定术语集s ,如果对于任意两个原子术语或者术语公式x 、y ,如 果存在一个本体商空间 o 】i 【x i 【f i ,【t i ,i e 0 ,l ,2 ,n ) ,使得【x 】乃,则 x 关于s 是可满足的,反之则称不可满足的。 术语的包含性检验:给定术语集s ,如果对于任意两个原子术语或者术语公式x 、y , 对于任意一个本体商空间 o 产 ,i 0 ,l ,2 ,o o 9 n ) ,有 x 】【y 】则 称y 包含x 。 术语的等价性检验:给定术语集s ,如果对于任意两个原子术语或者术语公式x 、y , 对于任意一个本体商空间【o 】i ,i e 0 ,l ,2 ,n ) ,有【x 】【y 】和【y 】【x 】, 则称x 兰v 。 术语的非交性检验:给定术语集s ,如果对于任意两个原子术语或者术语公式x 、y , 对于任意一个商空间【o 】i 【x 】i ,【f 】i ,i t i ,i 0 ,l ,2 ,n ) ,有 x 】f - 1 【y 】= 囝则称 y 与x 非交。 下面所设计的算法是根据以上的定义,对本体商空间 o 】i = ,i 0 , l ,2 ,n ,中的术语a 和b 是等价性进行的验证: ( 1 ) 给定本体o 一 和等价关系集r 。 ( 2 ) 在等价关系集r 的作用下,对本体o 进行商空间运算,形成不同层次的商空间: 【o 】o o 】l o 】2 o 】n 。 ( 3 ) 如果存在i e 0 ,1 ,2 ,n ) ,【o 】i = ,使得 a , b 【x i 成立。 ( 4 ) 如果有【a 】 b 】和 b 】 a 】成立,则根据商空间的保真原型1 ,一定有a = b 成立。 其他方面的检验方法类似,在此不在重复。 基于意见词汇本体的商品意见属性自动标注系统研究 ( 2 ) 实例检验 定义9 :实例声明的一致性:给定本体o = ,若存在本体等价关系集r 是实例声明q 的一个模型,则称q 是一致的,否则称a 是不一致的。若等价关系集r 是 q 的一个模型,又是 o 】n 的一个模型,则称( 3 1 关于 o n 是一致的。若等价关系集r 是 【o n 的一个模型,则称【o 】n 是一致的。 下面所设计的算法对本体实例一致性进行验证: ( 1 ) 给定本体o = 和等价关系集r = 粕,r l ,r n ) 。 ( 2 ) 在等价关系r n r 的作用下,对本体o 进行商空间运算,确定实例商空间 o 】n - 。 ( 3 ) 如果存在个体a ,使得类的实例声明【c i ( a n ) ( i ei ,2 ,n ) 成立,则成实 例声明q 关于 o n 是一致的。 如果存在个体a ,b ,使得属性的实例声明【p 】i ( a 】n ,【b 】n ) ( i 1 ,2 ,o eo 9n ) 成立, 则实例声明d 关于 o 】n 是一致的。 2 2 本体构建的基本方法 2 2 1 本体的描述语言 本体能否有效工作需要高级本体语言来表达和描述本体信息,我们可以用自然语言 来描述,也可以用框架、语义网络或逻辑语言来描述。不管用什么语言描述,应该满足 下面三条标准【1 8 】: ( 1 ) 对用户应该有较高的直觉,考虑到基于框架和面向对象建模范例的成功案例, 本体应该类似于框架。 ( 2 ) 应该包含已制定的推理特性的、定义良好的形式化语义,以保证本体的完整性、 正确性和有效性。 ( 3 ) 应与现有的w e b 语言有着适当的连接,以保证互用性。 关于本体的描述语言有多种 1 2 1 ,例如,简单h t m l 本体扩展( s i m p l eh t m lo n t o l o g y e x t e n s i o n ,简称s h o e ) 、本体标记语言( o n t o l o g ym a r k u pl a n g u a g e ,简称o m l ) 和基 于x m l 的本体交换语言( x m l - o n t o l o g ye x c h a n g el a n g u a g e ,简称x o l ) 等。目前, 比较常用的描述语言是r d f ( r e s o u r e ed e s c r i p t i o nf r a m e w o r k ) r d f ( s ) ,以及建立于 r d f ( s ) 之上的本体交互语言( o n t o l o g yi n t e r c h a n g el a n g u a g e ,简称o i l ) 和 1 4 第二章本体形式化理论与意见词汇本体构建 d a r p a ( d e f e n c ea d v a n c e dr e s e a r c hp r o j e c t sa g e n c y , 美国国防部高等研究计划局) 主体 标记语言+ 本体推理层( d a r p aa g e n tm a r k u pl a n g u a g ew i t ho n t o l o g yi n f e r e n c el a y e r ,简 称d a m l + o i l ) 。另外,以d a m l + o i l 为起点,开发出了w 曲本体语。- 言( w e bo n t o l o g y l a n g u a g e ,简称o w l ) ,它是w 3 c 推荐的标准,其语义表达能力最强。下面主要介绍 本课题使用的到r d f ( s ) 和o w l 。 ( 1 ) r d f ( s ) r d f 是w 3 c 在x m l 基础上推荐的一种标准,它定义了一个简单的数据模型。r d f 的基本模型可以描述成一个三元组 ,表示一个资源( o ) 具有属性( p ) ,属性值为( s ) , 通过属性和值来描述资源以及资源之间的关系。例如下面一段代码: m rs u n 它表示h t t p :l l w w w w 3 o r g ( o ) 的c r e a t e r 是( c ) m rs u n 。 但r d f 提供的语义原语是非常基础的,因此r d fs c h e m a 在r d f 基础上增加了许 多语义原语,描述了r d f 资源的属性和类型的词汇表,提供了对这些属性和类型的普 遍层次的语义,从而增强了对资源语义描述的能力。r d f ( s ) 在提供了简单的机器可理解 语义模型的同时,为o w l 本体语言提供了建模基础,并使基于r d f 的应用可以便利 地与这些本体语言所生成的本体合并。r d f 的语法规范可以参考w 3 c 网站 h t t p :w w w w 3 o r g r d f 。 ( 2 ) 0 w l o w l 语言是w 3 c 推荐的本体描述语言标准,它作为r d f ( s ) 的扩展,提供大量原 语以支持更加丰富的语义表达,并更好的支持推理。例如使用r d f s :s u b c l a s s o f 来声明子 类关系,使用属性o w l :c o m p l e m e n t o f 表示类互补,用e q u i v a l e n t c l a s s 声明等价概念。针 对不同的需求,o w l 有三个子语言: a 、0 w l f u l l o w lf u l l 使用全部的o w l 语言基元,允许这些基元随意地与r d f ( s ) 相互结合, 在语法和语义上与r d f 完全向上兼容。通过互相应用语言基元,允许改变预定义基元 的意思。并允许本体在预定义的词汇表上增加新词汇,因此,也导致任意推理软件均不 1 5 o w ld l 还是o w lf u l l 取决于用户在多大程度上需要r d f 的元模型机制,如在定义类 型的类型以及为类型赋予属性时,需要考虑o w ld l ;在使用o w lf u l l 而不是o w ld l 时,要考虑推理的不可预测性,因为目前还没完全实现o w lf u

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论