




已阅读5页,还剩68页未读, 继续免费阅读
(计算机软件与理论专业论文)基于功能语义的构件描述和检索技术研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江丁业大学硕士学位论文 基于功能语义的构件描述和检索技术研究与实现 摘要 软件复用是近年来国内外软件界研究的热点之一,它能大幅度提高软件质量 和生产率,降低软件开发和维护的成本。基于构件的软件开发( c b s d ) 是软件复用 的一种有效形式。而有效的构件描述和检索方法是实现软件复用的一项关键技术。 现有的构件描述和检索技术大多没考虑语义描述能力,其查全率和查准率往往无 法令人满意,不能很好地实现软件复用的目的。 针对上述问题,通过引入本体来弥补现有构件描述和检索技术中的语义缺失 的方法已成为新的研究热点。本文分析了基于刻面的构件描述和检索方法,将其 与本体技术相结合,提出以功能刻面为基础建立构件本体的方法,并在此基础上 研究了本体对构件检索的语义支持,提出了相应的检索改进方案。 本文的工作主要有以下几个方面: 1 、研究现有构件的刻面分类,分析不同刻面特征以及它们在描述和检索中的 贡献,重点研究了功能刻面下的术语特征和它们之间语义依赖关系,将其归纳为 功能依赖、数据依赖、控制依赖和通讯依赖关系,作为通用的功能语义关系;同 时研究了构件间的非功能关系将其归纳为相似关系和层次关系,作为通用的构件 语义关系;将上述关系间的关联提炼成规则,作为构件语义推理的基础。 2 、研究本体建立方法,提出利用构件的功能刻面来建立构件本体模型的方法, 将刻面术语映射成本体中的概念,利用功能依赖、数据依赖、控制依赖和通讯依 赖关系等功能语义关系来描述概念间的关系,给出基于功能语义的构件本体的形 式化描述,并以信用构件库系统中的功能刻面为例,给出一个本体建立的实例。 3 、在构件本体描述基础上,本文给出综合概念距离、重合度和层次差的概念 语义相似度计算方法,并结合构件属性相似度给出构件语义相似度计算方法。在 概念间和构件间的语义关系基础上,给出概念的语义相关度计算方法和构件的语 义相关度计算方法。 4 、最后用上述技术对基于刻面描述和检索的信用构件库进行改造,通过整合 i 语义相似度和相关度实现语义查询扩展、语义推理和语义推荐,为构件检索提供 语义支持。 关键词:软件复用,刻面,本体,语义检索 r e s e a r c ha n di m p l e m e n t a t i o no n c o m p o n e n td e s c r i p t i o na n dr e t r i e v a l t e c h n o l o g yb a s e do nf u n c t i o n a l s e m a n t i c s a b s t r a c t s o r 、a r er e u s ei so n eo fh o t s p o t si nt h ef i e l do fc o m p u t e rs o n ,a r er e s e a r c ha n d d e v e l o p m e n t nc 锄i n c r e a s es o 胁a r eq u a l i 哆a n dd e v e l o p e rp m d u c t i v i t ) r ,d e c r e a s et l l e c o s to fd e v e l o p m e n ta n dm a i n t e n a j l c e c o m p o n e l l t - b a s e ds o f t 、v a r ed e v e l o p m e n t ( c b s d ) i sc l 咖l e dt 0b ea i le 脏c t i v ef o mo fs o 胁a r er e u s e ,w h j l et 1 1 e e f f e c t i v e 、a yo f c o m p o n e n td e s c r i p t i o na n dr e t r i e v a li sak e yt e c h n o l o g y n et r a d i t i o n a lc o m p o n e n t d e s c r i p t i o na 1 1 dr e t r i e v a l 印p r o a c h e sh a v et l l ep r o b l e mo fl a c 妯唱t h es e m a n t i c d e s c r i p t i o na b i l i t ) r ,w l l i c h 析i e c tt l l er e c a l lr a t i oa n dp r e c i s i o nr a t i o t h e r e f o r et h e yc a n n o ta c h i e v et h ea i mo fs o 胁a r er e u s e o n t o l o g yt e c h n o l o g yi sa _ b l et os o l v et h ep r o b l e mo fl a c l d n gs e m a n t i cme x i s t i i l g c o m p o n e n td e s c r i p t i o na l r l d 胁i e v a jm e t l l o d s t h j sd i s s en ;a t i o na i l a l y s e st h ec o m p o n e n t d e s c r i p t i o n 锄dr e 砸e v a lb a s e do nf 如e ts c h e m 巩a n dc o m b i n e si t “t ho n t o l o g ) r t e c h n o l o g ) ,a na p p r o a c ho fb u i l d i n gc o m p o n e n to n t o l o g ) ,谢t hf h n c t i o nf a c e ti s p r o p o s e d t h ei m p r o v e m e n to fc o m p o n e n tr e 伍e v a lb a s e do nt h j so n t o l o g ) ri sp r o p o s e d , t o o m a i nc o n t l i b u t i o n si nt l l et h e s i sa r e : f i r s t l y ,s t u d y t h ec 唧r e n t 印p r o a c h e s o f c o m p o n e n td e s c p t i o n a n d r e t r i e v a j ,a i l a i y s i sd i 虢r e mf a c e tc h a r a c t e r i s t i c sa n dt 1 1 e i rc o n t r i b u t i o nt od e s c r i p t i o n a n dr e t r i e v a l ,r e s e a r c ho nt h et e mc h a r a c t e r i s t i cm l d e rt 1 1 ef h n c t i o nf - a c e ta 1 1 dt h e s e m a n t i cd e p e n d e n c yr e l a t i o n s h i p sw m c h 、e r ec l a s s i f i e di n t om n c t i o n md e p e n d e n c e , 龇 d e p e n d e n c e , c o r i 仃o ld e p e n d e n c ea n dc o m m u n i c a t i o nd e p e n d e n c ea sg e n e r a l 劬c t i o n a ls e m a l l t i cr e l a t i o n s h i p s n o n m n c t i o n a lr e l a t i o n s h i p so fc o m p o n e n t 、e r ea l s o s t u d i e da n dc l a s s i f i e di n t os i m i l a r i t ) ,r e l a t i o na n dm e m r c m c a lr e l a t i o na sg e n e r a l c o m p o n e n ts e m 枷i cr e l a t i o n s h i p s t h ea l s s o c i a t i o n s锄o n gt h e s er e l a t i o n sw e r e e x n ? a c t e di n t om l e sa st b eb a s i so fs e m a n t i ci n f e r e n c e s e c o n d l y ,a n 印p r o a c hi sp r o p o s e dt ob u i l dc o m p o n e n to n t 0 1 0 9 yw i t h m c t i o n f a c e t t 1 1 ea p p r o a c hm a p st l l em et e n l l su i l d e rn m c t i o nf 砬e tt ot h ec o n c e p t si nt h e o n t o l o g ym o d e la n dd e s c r i b e st h er e l a t i o n sb e t 、v e e nc o n c e p t s 州t hf l l n c t i o n a ls e m 觚t i c s r e l a t i o n s h i p s ,s u c ha sm n “o n a ld e p e n d e n t ,d a t ad e p e n d e n te t c af o m a ld e f i l l i t i o no f t h j so n t o l o g ym o d e li sa l s og i v e n c r e d i tc o m p o n e ml i b r a 巧i st a :k e na sa i le x 锄p l et o e x p l a i nt h i s 印p r o a c h t h j r d l y ,o nt h eb 商so fc o m p o n e n to n t o l o g y ,印p r o a c h e st 0c a l c u l a t i n gm e s e m a j l t i cs i i n j l a r i 够b e 似e e nt w oc o n c e p t sa n dc o m p o n e n t sa r ep r o p o s e d o nt h eb a s i s o fs e m a n t i cr e l a t i o n 锄o n gc o n c e p t sa 1 1 d 锄o n gc o m p o n e n t s ,a p p r o a c h e st oc a l c u l a t i n g t l l es e m a n t i cr e l a t i v i 哆a r ea l s op r o p o s e d f i n a l l y ,谢t l lt h e 印p r o a c h e sm e n t i o n e da b o v e ,i m p r o v e m e mi sm a d eo nt h ec r e d i t c o m p o n e n tl i b r a 叫b a s e d o nf a c e t c l a s s i f i c a t i o n ,p r o v i d i n gs e m a l l t i cs u p p o r tf o r c o m p o n e md e s c r i p t i o na n dr e t r i e v a l k e yw o r d s : s o 胁a r er e u s e ,f a c e t ,o n t o l o g y ,s e m a n t i cr e t r i e v a l 浙江工业大学 学位论文原创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作 所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包含其他个人或 集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构的 学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中 以明确方式标明。本人承担本声明的法律责任。 作者签名:亥协饥日期:水,月? 彳日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留 并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本 人授权浙江工业大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 本学位论文属于 l 、保密口,在年解密后适用本授权书。 2 、不保密吵 ( 请在以上相应方框内打“、”) 作者签名: 导师签名一 级 日期:m 湃,月“日 日期:唰年f 月占日 , 矗一0 彤允一 浙江:j 二业人学硕士学位论文 第1 章绪论 1 1 研究背景及意义 随着计算机技术在各行各业中的迅速发展,软件的需求量迅速增加,规模也 日益扩大,复杂性增高,传统的重复劳动的软件开发中存在如开发周期长、效率 低、可维护性差、适应性差、开发成本高和不能满足用户的需求等诸多问题,导 致了“软件危机,【l 】的出现。要彻底解决“软件危机”,保证软件生产的高效率和 高质量,就必须采用工程化的开发方法和工业化的生产技术【2 】。而有效利用他人 的软件产品,即进行软件复用,是一条现实可行的途径i ) j 。 软件复用是近年来国内外软件界研究的热点之一,基于构件的软件开发 ( c b s d ) 是软件复用的一种有效形式。随着复用实践和基于构件软件开发的深入, 以软件的构件化为基础的共享和复用技术越来越得到业界的广泛关注,以软件复 用为目的的各类软件构件标准也发展的如火如荼,例如m i c r o s o r 公司的 c o m c o m + 组件技术、s u n 公司制定的j a v 扭e a i l 、e j b 标准、o m g ( 对象管理 组织) 的c o i m a 等。这些标准为软件的复用的提供了前提条件,但随着它们的 普及和推广,也使产生了海量的自主丌发的构件、商业构件。针对这些构件的管 理涉及到的构件描述和检索方法是实现软件复用的一项关键技术,而有效的软件 复用则依赖于对构件的静态特性和动态行为做出准确、全面的描述,并提供良好 的检索方法支持【4 】。 现有的构件描述和检索技术中比较有代表性的包括信息科学编目查询技术、 基于框架、基于演绎和基于刻面的构件描述与检索方法,其中刻面分类以其较强 的描述能力和高效的检索效率成为构件描述的主流方法。这些方法都对构件的静 态特征作了较为详尽的考虑,也获得了较好的解决方案;但对于构件的动态特征, 例如构件在复用中的行为和功能以及它们之间的语义关系,则缺乏系统的分析和 准确表达;而且当前的检索方法,大多采用基于关键字匹配的检索技术,未考虑 检索语义及相关的领域知识,这些都会降低查全率、查准率,而且这些检索技术 也不能给用户提供领域知识辅助,造成用户满意度较低。 本体( o m o l o g y ) 作为一种能在语义和知识层次上描述信息系统的概念模型建 浙江 = = 业人学硕士学位论文 模工具,自提出以来就引起了国内外众多科研人员的关注,并在计算机的许多领 域得到了广泛应用。其本身具有良好的概念层次结构,支持逻辑推理,因此特别 适合于智能搜索中对概念及其语义的处理。由于本体采用精确的形式语言、句法 和明确的语义,使得问题域中的概念与概念、概念与对象、对象与对象之间的关 系更加明确,这就大大减少了对问题域中概念和逻辑关系可能造成的误解。用本 体来描述软件构件将具有较好的共享性能和一定的判断、推理能力,更利于计算 机理解与处理【5 j 。同时基于本体的构件检索也将具备一定的“智能 ,能更好的 “理解 和“猜测”检索需求,从而获得更好的查全率和查准率。本体技术的引 入,将为构件复用的发展带来的勃勃生机。 1 2 国内外研究现状 构件的检索是基于构件的有效表示之上的,构件的检索对应着构件的表示方 法,目前提出的构件描述方法有许多种,w f r a k e s 和h m i l i 等人对其进行了分类, 主要分为四种方法【6 】【7 1 :( 1 ) 规约描述方法;( 2 ) 基于人工智能的方法;( 3 ) 基于科 学信息科学的方法;( 4 ) 基于超文本浏览的方法。 针对上述构件描述方法,a n d yp o d g l l r s h 等人嘲提出的基于构件行为采样的检 索,m e 删d 等人【9 1 首次将神经网络用于构件检索,p e l l i xj 等人提出利用语义特征 对构件进行分类检索【1 0 】;对构件的形式化表示和检索,在文献【1 1 】中作者提出对 构件的基调匹配和规约匹配;1 9 9 9 年d 锄i 砌e 【1 2 1 将模糊数学用于构件的检索。 下面针对各类构件描述方法选取各类中比较具有代表性的构件检索技术做一概 述。 ( 1 ) 基于正文的构件检索 在基于正文的构件检索中,自动地提取构件的正文,将其表示为一个构件描 述符,自动地编码分类。在构件检索时,用户可以指定与所需构件相关的任意复 杂的字符串,并将该字符串与构件描述符进行匹配【1 3 】。这种方法的优点是:构件 无需编码,用户无需学习如何构造查询条件,成本代价低;其缺点是:必须与成 熟的语言处理系统相结合才能从复杂的正文中准确地抽取构件信息,而且该方法 还缺少上下文环境,用户指定字符串的含义可能与构件描述符中的字符串具有二 义性【1 4 】。 2 浙江工业大学硕士学位论文 ( 2 ) 基于行为采样的构件检索 基于行为采样的构件检索,其本质是1 5 】:通过构件的执行能力,即可执行的 特征,来进行构件间的匹配。由构件提供者为构件选择一组典型的输入数据交由 构件执行,得到一组输出数据,该输入、输出数据及返回类型被称为构件的行为 采样。构件检索时,用户可以提交要查找构件的一系列输入数据,以及期望得到 的输出数据及返回类型,即预期采样;然后由构件库中每个构件依次执行预期采 样中的输入数据,如果得到输出数据与预期采样中的输出数据相等,返回类型相 同,那么将该构件返回给用户。 利用行为采样进行构件检索的优点是:可以通过形式化的方法构造检索上下 文,具有较高的查准率;缺点主要是:要实现该方法下的松弛匹配和复杂匹配, 需要一个开放式行为采样脚本语言平台,实现代价较大【1 6 】。目前,基于行为采样 的构件检索主要适用于数学函数、符号运算函数和常用a d t ( a b s t r a c td a t a 聊e 抽象数据类型) 库这一类专业性比较强,并且行为采样比较容易的构件库。 ( 3 ) 基于词法描述符的构件检索 在基于词法描述符的构件检索中,构件的描述方法是基于受控词汇的表示方 法,即信息科学中的编目分类方法【1 7 】。一般来说,一个构件由一组领域专家详细 审查的关键字( 即术语) 来描述,这些关键字来源于一个反映领域概念的预定义的词 汇表。用户检索时,先输入若干个与要查找构件相关的关键字,并将其组成布尔 表达式,记为q 。将q 与构件库中的每一个构件描述进行匹配,如果返回值为真, 则认为该构件与查询相关,这种检索方法称为布尔检索,即基于偏序关系的检索。 如果在用户查询中仅单纯使用关键字,而不使用其布尔表达式,那么返回值将是 一个数值,表示两者之间的匹配程度,这种检索方法称为相似检索,即基于距离 的检索。可以利用带权语义网、模糊逻辑触发器或带权的术语空间等技术计算构 件之间的语义距离,实现近似查询【1 7 】。由于构件的描述方法不同,基于词法描述 符的构件检索有若干变种和细化。w f r a k e s 将现有的信息科学编目分类方法主要 分为关键词、枚举、刻面和属性值几类。其中,刻面分类法和关键词分类两种应 用最为广泛。 ( 4 ) 基于规约的构件检索 为了能够自动化地适配构件,基于规约的构件检索已经在软件工程项目中被 广泛提出。该方法以形式化的构件规约为基础,排除了正文和刻面检索的编码二 义性和不精确性,具有良好的理论背景,并且可以利用规约说明之间的偏序关系 3 浙江工业大学硕十学位论文 来组织构件库中构件的存储以提高构件检索的效率。该方法依赖于规约语言的表 达能力,往往具有很高的查全率。z a r e m s 虹和w i n g 提出的基调匹配( s i g l l 砷l r e m a t c i l i n g ) 和行为匹配( b e h a v i o r a lm a t c i l i n g ) 是比较著名的规约匹配方法,为研究通 用的规约匹配活动,以及规约之间逻辑关系的验证提供了一个基础【1 8 】【1 9 】。他们从 代码中直接抽取基调和行为公理进行构件检索,并设想了相应的构件证明系统。 基于规约的构件检索注重软件构件的行为特征,而不是它的外观描述,其优点是 明显的,即能完整描述构件的计算语义、检索的准确率高于非形式化方法等,它 能够提供层次丰富的规约匹配类型,较好地满足用户对构件检索查准率和查全率 的综合要求。但是,同时也给用户带来编写规约的额外开销,而且不能从自然语 言自动生成形式化规约。因此,基于规约的构件检索技术目前仍然处于理论研究 阶段,应用领域多为形式化方法关注的实时系统和交互系统。 ( 5 ) 基于语义的构件检索 尽管在构件检索方面已经取得了一定的进展,许多基本方法已被提出,并得 到实践应用,但这些方法都或多或少具有一些局限性。因此,s u g u m 踟1 和s t o r e y 在文献【2 0 】中提出了一种基于语义的构件检索方法,利用本体和领域模型为捕捉特 定领域应用知识提供有效的机制,这些知识能够表达构件检索所需的更潜在的查 询信息。他们研究的目标是开发一种可以使用自然语言接口的构件检索方法,并 且能够利用嵌入在本体和领域模型中的领域知识支持检索过程。 在基于语义的构件检索方法中,需完成建立可复用构件库、建立领域模型、 创建本体和设计自然语言接口四项工作,并按照产生初始查询、查询精化、构件 反馈和检索三个步骤实现检索过程。基于语义的构件检索优势在于将构件库与本 体和领域模型相结合,以提供附加的知识“理解”构件查询中的语义信息,使得 用户能够利用领域知识通过自然语言执行更为智能的查询过程。但是这种检索技 术需要自然语言程序理解、语义服务描述及发现机制的支持,因而检索代价较大。 1 3 论文主要研究内容 从以上研究现状来看,现有的构件描述和检索技术大多都没有考虑语义描述 能力,从而使构件描述和检索的灵活性受到了限制。本体技术的引入弥补了这种 不足,但现有的基于本体构件描述虽然在查全率和查准率上有较好表现,但检索 效率并不理想。本文兼顾检索的精度准度和检索的效率,提出在具有较好描述能 4 浙江工业大学硕十学位论文 力和检索效率的刻面分类检索方法中引入本体的方法,并在此基础上改进基于刻 面的检索算法,为其提供语义支持,提高查准率和查全率。最后给出了实现并将 其整合到原有的基于刻面检索的信用构件库系统中。 本文的主要研究工作体现在以下几个方面: ( 1 ) 研究现有构件的刻面分类,分析不同刻面特征以及它们在描述和检索中的 贡献,重点研究了功能刻面下的术语特征和它们之间语义依赖关系,将其归纳为 功能依赖、数据依赖、控制依赖和通讯依赖关系,作为通用的功能语义关系;同 时研究了构件间的非功能关系将其归纳为相似关系和层次关系,作为通用的构件 语义关系;将上述关系间的关联提炼成规则,作为构件语义推理的基础。 ( 2 ) 研究本体建立方法,提出利用构件的功能刻面来建立构件本体模型的方 法,将刻面术语映射成本体中的概念,利用功能语义关系来描述本体中概念间的 关系,给出基于功能语义的构件本体的形式化描述,并以信用构件库系统中的功 能刻面为例,给出一个本体建立的实例。 ( 3 ) 在构件本体描述基础上,本文给出综合概念距离、重合度和层次差的概念 语义相似度计算方法,并与构件属性相似度结合给出构件相似度计算方法。在概 念间和构件间的语义关系基础上,给出概念的语义相关度计算方法和构件的语义 相关度计算方法。 1 4 论文的组织结构 论文章节安排如下: 第一章介绍了论文的研究背景、研究意义和论文的主要研究内容。 第二章对本体的相关概念和基于本体的构件描述和检索技术进行了概述,为 基于功能语义的构件本体的提出和基于该本体的语义检索方案的设计做了理论和 技术上的准备。 第三章对构件的刻面分类进行了分析,重点研究了功能刻面下的术语特征和 它们之间语义依赖关系,提出在功能刻面下引入本体的思路,并详细论述了基于 功能语义的构件本体的建立过程,并给出其形式化描述。 第四章按构件入库推理、刻面语义查询扩展和构件语义推荐这样一个流程, 论述了构件本体对语义检索的支持。并重点介绍了刻面和构件的语义相似度和相 关度的计算方法。 5 浙江工业大学硕十学位论文 第五章给出基于功能语义的构件检索功能的具体实现,将原有的基于刻面检 索的构件库系统进行改进,通过整合概念语义相似度和相关度实现语义查询扩展, 通过规则进行构件关系推理,通过整合构件语义相似度和相关度进行构件推荐。 第六章是对全文的总结和进一步工作的展望。 6 浙江工业大学硕+ 学位论文 第2 章本体及基于本体的构件描述与检索 本体( 0 n t o l o g y ) 作为一种能在语义层次上描述信息系统的概念模型建模工具, 自提出以来就引起了国内外学者和研究机构的关注和研究,并得到了广泛的应用。 其本身具有良好的概念层次结构,支持逻辑推理,因此特别适合于智能搜索中对 概念及其语义的处理。 本章分两部分,前一部分先介绍本体的基本概念及其现阶段的应用,然后介 绍了作为本体语言的逻辑基础的描述逻辑的基本体系,最后介绍了本体描述语言 的发展和0 w l 语言。后一部分介绍了本体在构件表示和检索领域的研究现状。 2 1 本体概述 2 1 1 本体概念及分类 本体最早起源于哲学,其含义是客观存在的一个系统的解释或说明,它关心 的是客观现实的抽象本质。后来人们将本体的概念和方法应用于计算机领域尤其 是人工智能领域,用于知识表示、知识共享和知识重用,并赋予它新的定义。在 人工智能界最早给出本体定义的是n e c h e s 等人【2 1 1 ,他们认为:“本体定义了组成 主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表 外延的规则”。接下来g m b e r 【2 2 1 、b o r s t 【2 3 1 、s t u d e r 【矧等学者又对本体的概念进行了 深入的研究,并不断发展和完善概念定义。其中被多数人认可的是s t u d e r 的定义: “本体是共享概念模型的明确的形式化规范说明。 s t u d e r 在总结g m b e r 、b o r s t 定义基础上指出了本体的四层含义:概念模型( c o n c e p t u a l i z a t i o n ) 、明确( e x p l i c i t ) 、 形式化( f o 咖a 1 ) 和共享( s h a r e ) 。 概念模型:指通过抽象出客观世界中一些现象的相关概念而得到的模型,其 表示的含义独立于具体的环境状态。 明确:指所使用的概念及使用这些概念的约束都有明确的定义; 形式化:指本体是计算机可读或可处理的; 共享:指本体中体现的是共同认可的知识,反映的是相关领域中工人的概念 集,它所针对的是团体而非个体的共识。 7 浙江- 上业大学硕士学位论文 目前,普遍认为一个本体可由概念类( c l a s s e s ) 、关系( r e i a t i o n s ) ,函数 ( f 曲c t i o n s ) 、公理( a x i o m s ) 和实例( i n 咖c e s ) 五元素组成【2 5 1 。其中概念可形成一个 分类层次,并通过关系、函数、公理来表达概念之间或函数之间的关联、约束。 因此本体能够明确地描述领域概念的定义,通过概念之间的关系反映概念的语义 信息,并为简单的术语赋予明确的背景知识,从而使隐含的关系明晰化,保障语 义的一致性。本体能够在语义层次上描述信息,其本身具有良好的概念层次结构, 支持逻辑推理,因此特别适合于智能搜索中对概念及其语义的处理。 为了对本体进行有效的分类,g 嘶n o 在文酬2 6 1 中提出以详细程度和领域依赖 度两个维度作为对本体划分的基础。详细程度高的称作参考本体,详细程度低的 称为共享本体。依照领域依赖程度,可以细分为项级、领域、任务和应用本体等 4 类。 1 9 9 9 年,p e r e z 和b e n j 锄i n s 【2 7 】在分析和研究了各种本体分类法的基础上,归 纳出l o 种本体:知识表示本体、普通本体,顶级本体、元( 核心) 本体、领域本体、 语言本体、任务本体、领域任务本体、方法本体和应用本体。这种分类法是对 g 嘶n o 提出的分类方法的扩充和细化,但是这1 0 种本体之间有交叉,层次不够 清晰。 2 1 2 本体的功能及应用 现在己经有相当多的文献给出了本体的描述和本体的使用目的。大多数的应 用实例都是为了实现“重用”,都是把本体论当作一种建立知识的一种方式或者 当作知识库的一部分。另一个重要的用途是信息集成。这种方式主要体现在商业 事务的集成,分布式多代理系统和并发处理工程的设计上。目前本体在国外的应 用主要集中在以下几个方面: ( 1 ) 信息交流。本体的核心概念是知识共享,通过减少概念和术语上的歧义, 本体描述为某一组织或是工作小组提供了一个统一框架或是规范模型,使得来自 不同背景,持不同观点和目的的人员之间的理解和交流成为可能,并保持语义上 的一致性。其典型应用有i tt a l k s 【2 8 】,它是美国马里兰大学在d a i 冲a 资助下开发 的一个基于本体的w e b 门户系统,主要用于对i t 领域内的各种会议信息进行智能 集成和智能在线检索。此外,h o w 项目建立了一个水利本体2 9 】,对美国各个地区 的水利系统进行了开放标准的本体描述,有利于各个水利单位时间的信息共享和 协同合作。 8 浙江工业大学硕十学位论文 ( 2 ) 互操作。在不同的建模方法、范式、语言和软件工具之间进行翻译和映射, 以实现不同系统之间的互操作和集成。例如r c a l ( i 砸t s i n ac a l e n d a ra g e n t ) 【3 0 】是美 国卡耐基梅隆大学( c m 叻计算机学院机器人研究所最近开发的一个分布式约会安 排a g e n t ,其使用了多个分布式本体,并采用d a m l s 作为服务语义描述机制。当 r c a l 遇到一个自身本体中没有的概念时,就会通过0 w l s ( d a m l s ) 描述自动地 发现并选取恰当的翻译服务来执行,进而完成从未知概念到已有概念的转换。可 以采用标记语言表达转换关系,也可以从其他共享的本体中推理得出转换关系。 ( 3 ) 系统工程。本体分析能够为系统工程提供以下方面的好处:重用:本 体是领域内重要实体、属性、过程及其相互关系形式化描述的基础。这种形式化 描述可成为软件系统中可重用和共享的组件;知识获取:当构造基于知识的系 统时,用已有的本体作为起点和基础来指导知识的获取,可以提高其速度和可靠 性;可靠性:形式化的表达使得自动的一致性检查成为可能,从而提高了软件 的可靠性:规范描述:本体分析有助于确定信息系统( 如知识库) 的需求和规 范。总的来说,构造本体的目的都是为了实现某种程度的知识共享和重用。 国内本体论方面的研究整体上处于起步阶段,目前主要集中在知识工程、信 息管理和语义w e b 三个方面。本体工程方面的研究比较有名的通用本体构建研究 包括中科院计算技术研究所的大规模知识系统研究【3 1 】和中科院数学研究所的常识 知识库研究。信息管理方面讨论相对较多的主要有本体论与信息检索【3 2 】、本体论 与数字图书馆【3 3 】、本体论与信息管理【3 4 1 ,此外还包括知识库系统3 5 1 、数据挖掘【3 6 1 、 电子商务【3 7 】、机器翻译【3 8 1 、需求分析3 9 1 等。国内语义w e b 的方面研究主要集中在 服务的发现上l 4 0 】,基于本体论的构件的研究相对较少,注意力相对集中在语义w e b 和w e b 服务上。 本体的功能概括起来主要在以下几个方面: ( 1 ) 实现知识的共享。开发本体的主要目的之一就是在人们和软件智能体之间 对信息结构的理解提供一种可共享、共同的理解机制。 ( 2 ) 实现知识的重用。通过维护、扩充本体,使得面向某一领域的应用系统的 开发工作不必从头做起,大大缩短了开发周期,节省了开发费用。 ( 3 ) 分析知识,辅助知识获取。某一领域本体可以辅助该领域专家更好的理解 领域知识,领域专家反过来扩充该领域本体,使得领域本体的表示更加完备、内 容更加丰富。当构造基于知识的系统时,用已有的本体作为起点和基础来指导知 识的获取,可以提高其速度和可靠性。 9 浙江t 业大学硕十学何论文 ( 4 ) 知识的标准化。本体为人们描述目标世界提供了一组通用词汇,这种通用 的词汇正是实现知识系统化的基础。通用词汇和知识的系统化有利于实现知识的 标准化。本体分析有助于确定系统的需求和规范。 2 1 3 本体的建立方法 w 曲环境下实现语义检索的前提条件是有丰富的领域本体。因此,建立本体 的方法是当前本体研究中的热点问题。目前的本体建立方法都不是经权威标准化 机构认证的方法。m u s h o l d 试图制定出一套建立本体的方法,但正如他在文章中 指出的,他们并不是要给出一套规范性的指南,只是要表示这种方法在他们的研 究环境下能很好地发挥作用。k m a l l e s h 和b a t e m a i l 都给出了各自的本体建立原则。 这些原则都是研究人员在各自的系统开发经验之上提出的。实际上,几乎每一个 系统的丌发都会导致一些不同的本体建立方案产生。下面介绍目前国内外主要的 本体建立方法。 国外主要的本体建立方法主要有: ( 1 ) 骨架法( s k e l 吨dm e l o d 0 1 0 9 y ) 【4 1 1 :由m i k eu s h o l d & m i c h e a j ( h 血n g e r 提 出,该方法在企业本体基础之上,是相关商业企业间术语和定义的集合,该方法 只提供开发本体的指导方针。包括如下步骤:确定本体应用的目的和范围; 本体分析;本体表示;本体评价;本体的建立。 ( 2 ) t 0 v e 法【4 2 】:该方法用于t 0 v e 项目中,它的目标是建立一套为商业和公 共企业建模的集成本体。作为该项目的一部分,他们设计了一套创建和评价本体 的方法“e n t e 印r i s em o d e l l i n gm e t l l o d o l o g y ”。该方法主要分为以下步骤:设计 动机;非形式化的能力问题;术语的形式化;形式化的能力问题;将 规则形式化公理;调整问题的解决方案,使本体趋于完备。 ( 3 ) m e t h o n t o l o g y 法【4 3 】:该方法专用于建立化学本体( 有关化学元素周 期表的本体) ,该方法已被马德里大学理工分校人工智能图书馆采用。它的的建立 流程包括三个阶段:管理阶段;丌发阶段;维护阶段。目前,用这种方 法开发的本体有:( o n t o ) 2 a g e n t ,是基于本体的w 曲代理,使用参考本体作为知 识源,在一定的约束条件下进行新知识获取的工具;化学本体,基于本体的化学 教育代理,允许学生在学习的基础上自测本身在该专业领域内所达到的水平; o n t o g e n e r a t i o n ,使用化学领域本体和语言本体来生成西班牙语的描述,并把这些 描述作为对学生关于化学领域问题查询的答案。 1 0 浙江一t :业大学硕士学位论文 在国内,刘凤华等人【“】提出了基于需求分解的本体模型建立方法,该方法在 构筑面向应用的领域本体中,将研究用户的需求放在首要的位置。需求分解的思 想来自于系统工程开发设计的v 型模,将v 模型思想应用于知识系统的需求分析, 分析用户的需求问题。李景等人【4 5j 提出了建立领域本体的知识工程方法,该方法 在确定本体领域范围后,列出领域中所有的重要术语,再利用叙词表和学科分类 等知识来定义类和类的层次结构,进而形成一定的语义关联,再定义类的属性插 件和插件分面,最后创建类的实例。王昕等人m 】提出了一种基于本体的设计原理 信息提取方法。该方法以设计原理的知识模型为基础,通过查询驱动的用户界面, 可以动态的预测设计人员所关心的问题,并给出相应的回答。 以上方法都出于对各自学科领域和具体工程的不同考虑,建立本体的过程各 不相同。目前还没有一套标准的本体建立方法。一般认为,g r u b e r 在1 9 9 5 年提出 的5 条规则是比较有影响的【4 7 1 ,即: 明确性和客观性:本体应该用自然语言对术语给出明确客观的语义定义。 完整性:所给出的定义是完整的,能表达特定术语的含义。 一致性:知识推理产生的结论与术语本身的含义不会产生矛盾。 最大单向可扩展性:向本体中添加通用或专用的术语时,通常不需要修改己 有的内容。 最少约束:对待建模对象应该尽可能少列出限定约束条件。 目前大家公认在建立领域本体的过程中,需要领域专家的参与和协作。 2 1 4 描述逻辑 建立本体首先需要的是一个能描述本体并使其能够进行信息交换的语言标 准。o i l 、d a m l + o i l 和o w l 等本体语言应运而生。这些语言都以描述逻辑 ( d e s c r i n t i o nl o g i c ,d l ) 为基础。 ( 1 ) 描述逻辑的基本体系 描述逻辑是知识表示的一种形式化语言,适合表示关于概念和概念层次结构 的知识,因此也叫做概念表示语言和术语逻辑4 8 1 。描述逻辑的基本构件是概念、 关系和个体,其特点在于将大量的构造符作用到简单概念上,从而可以建立更多 复杂的概念。此外,描述逻辑将推理作为中心服务,即从知识库中显式包含的知 识推导出隐含表示的知识,描述逻辑注重关键推理服务的可判定性,并且提供了 可靠的、完备的推理算法。其主要的推理有分类、可满足性问题、包含关系以及 1 1 浙江- t 业人学硕十学位论文 实例检测4 8 1 。 描述逻辑知识库通常包含两个部分t b o x 和a b o x 【4 9 1 。其中,t b o x 是有关概念和 关系的蕴涵断言集合,即本体中的术语表( t e 枷n o l o g y ) ,描述概念和关系的一般属 性;a b o x 是有关个体的实例断言集合,断言一个个体是某个概念的实例( i n s t a l l c e a s s e r t i o n ) ,或者两个个体之间存在某种关系( r o l ea s s e r t i o n ) 。 t b o x 包含了本体描述领域的内涵知识( i i l t e n t i o n a l ) 知识,通常以术语公理 ( t e m i n o l o g y i c a la 撕o m s ) 的形式描述概念和任务的事实。一般术语公理有两种形 式( 符号含义详肋一如唧昭p 刚) : 蕴含( i 1 1 c l 戚o n ) :匹d 俾e i s ) ,例如:m a n e h 啪a n 。 等式( e q u a l i t ) ,) :c 三d 三$ ,例如:m o t h e r 三w o m a n nj h a s c h i l d p e r s o n 。 其中c 和d 表示概念,尺和婊示关系。在本文中,构件本体中的概念类及其关 系即为t b o x 。 a b o x 包含了外延( e x t e n t i o n a l ) 知识,通常以实例化公理断言描述个体和个体间 关系的事实。一般实例化公理有两种形式: 概念断言c ( 口) :个体口术语概念c ,例如m a n ( t o m ) 。 关系断言r 6 ) :个体口和6 存在尺关系,例如h a s c l l i l d ( t o m ,m a n y ) 。 ( 2 ) 描述逻辑中的推理 描述逻辑系统提供了不同种类的推理服务,可以将它们定义为逻辑推理,包 括概念推理、n o x 推理和a b o x 推理,这些都可归结为一个主要的推理问题 a b o x 的一致性检测【4 9 1 。 有关概念的推理有四个,其形式化定义如下。这罩设t 是一个t b o x 。 可满足性( s a t i s f i a b i l i t ) ,) :如果存在一个t 的模型i ,使得c 1 不为空,那么称 概念c 关于t 是可满足的,并且称i 是c 的一个模型。 包含性( s u b s 啪p t i o n ) :如果对于t 的每个模型i ,都有c 1 d 1 ,那么称概念d 关于t 包含概念c ,记为c 唧d 或者t c d 。 相等关系( e q u i v a l e n c e ) :如果对于t 中的每个模型i ,都有c 1 = d 1 ,那么称概 念c 和概念d 关于t 是相等的,记为c 哥d 或t b c 三d 。 不相交关系( d i s j o i l l t i l e s s ) :如果对于t 中的每个模型i ,都有c 1 n d l = 。,那么 称概念c 和概念d 关于t 是不相交的。 t b o x 中的基本推理任务就是包含性,即通过概念之问的包含关系,来建立术 语表中的层次
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年工业互联网平台IPv6升级与工业互联网平台供应链管理报告
- 行政公文写作中的贴近性思考试题及答案
- 行政管理重大责任试题及答案
- 2025年全球高端医疗器械国产化替代下的市场潜力与增长动力分析报告
- 企业战略决策中的数据应用研究试题及答案
- 2025年工程考试实战策略试题及答案
- 行政公文的沟通策略分析试题及答案
- 工程项目管理的微观与宏观试题及答案
- 水利水电工程气候适应性试题及答案
- 市政学理论应用试题及答案
- DB11T 334.5-2019 公共场所中文标识英文译写规范 第5部分:医疗卫生
- 英国海德公园
- 2022年高考真题-化学(天津卷) 含解析
- 林下经济的开发与利用
- 基于PLC的校园照明智能控制系统设计毕业设计(论文)
- 2024年保密教育培训考试(题目和答案)
- 山西建投集团考试真题
- DL∕T 1254-2013 差动电阻式监测仪器鉴定技术规程
- 足浴场所卫生管理要求
- 2024年辽宁省中考英语试题(附答案)
- 【必考题】中考初中三年级政治上模试题附答案
评论
0/150
提交评论