(计算机应用技术专业论文)基于本体的智能答疑系统研究.pdf_第1页
(计算机应用技术专业论文)基于本体的智能答疑系统研究.pdf_第2页
(计算机应用技术专业论文)基于本体的智能答疑系统研究.pdf_第3页
(计算机应用技术专业论文)基于本体的智能答疑系统研究.pdf_第4页
(计算机应用技术专业论文)基于本体的智能答疑系统研究.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(计算机应用技术专业论文)基于本体的智能答疑系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

论文题目: 专业: 硕士生: 指导教师: 基于本体的智能答疑系统研究 计算机应用技术 史月飞 张小艳 摘要 ( 签名) 期侈 、j 随着i n t e r n e t 技术的发展,教育领域中智能答疑越来越受到人们关注。传统的答疑系 统主要是基于关键字的查询,精度不高。提高现存答疑系统的精度,关键在于语义层面 上组织和表示信息。 本文在研究智能答疑系统现状基础上,首先给出将本体技术作为智能答疑语义基础 的观点,提出基于本体的智能答疑系统研究方案;其次,建立数据结构中线性结构 知识本体模型,归纳出教育领域构建本体的基本流程,并利用本体编辑器p r o t 6 9 63 2 生 成该模型的基于o w l + r d f 的形式化文档;最后,根据构建本体模型层次结构,设计智 能答疑中知识库的数据结构,将构建的本体模型映射至i j a c c e s s 数据库中,奠定智能答 疑系统的语义基础,构造专门针对数据结构的分词系统,约定用户查询问题模式, 采用v c + + 语言实现了基于本体的线性结构知识智能答疑系统。在系统中增设普通检索 和潜在语义检索两个模块,通过对比,验证了基于本体的智能答疑系统在一定程度上提 高了问题的查准率和查全率。 本文研究内容是基于本体的智能答疑系统,尝试在智能答疑系统中基于语义层面组 织和表示信息开拓新的思路和方案。通过仿真实验,验证了本文设计方案的性能,在一 定程度上提高了智能答疑系统的精度,更好的满足了学习者的需求。 关键词:本体;智能答疑;d s l l o m ;l s o a s 研究类型:应用研究 s u b j e c t :t h er e s e a r c ho fi n t e l l i g e n tq u e s t i o na n s w e r i n gs y s t e m b a s e do no n t o l o g y s p e c i a l t y:c o m p u t e ra p p l i c a t i o nt e c h n o l o g y n a m e:s h iy u e 酗( s i g n a t h r e ) 蟛 i n s t r u c t 0 1 :z h a n g a o y a 扛( s i g n a t 秘r e ) 型锲越越炉n a b s t r a c t w i t ht h ed e v e l o p m e n to fi n t e m e tt e c h n o l o g ya n di t sb r o a da p p l i c a t i o n ,i n t e l l i g e n t q u e s t i o na n s w e r i n gs y s t e mh a sb e e np a i dm o r ea n dm o r ea t t e n t i o ni ne d u c a t i o nd o m a i n t h e e x i s t i n gq u e s t i o na n s w e r i n gs y s t e mi sm a i n l yb a s e do nk e y w o r d se n q u i r i e s ,a n dh a st h el o w a c c u r a c y t oi m p r o v et h ea c c u r a c yo fe x i s t i n gq u e s t i o na n s w e r i n gs y s t e m ,r e a s o n a b l e d e s i g n i n go f t h ei n t e l l i g e n tq u e s t i o na n s w e r i n gs y s t e mm u s tb eb a s e do nt h es e m a n t i cl e v e l o r g a n i z a t i o na n de x p r e s s i o no f i n f o r m a t i o n i nt h i sp a p e r , o nt h eb a s i so fs t u d y i n gt h es t a t u so fd e v e l o p m e n to fi n t e l l i g e n ta n s w e r i n g s y s t e m ,f i r s t l y , t h ea u t h o rp u t sf o r w a r dt h ep o i n tt h a to n t o l o g yt e c h n o l o g yi st h es e m a n t i c b a s i so ft h ei n t e l l i g e n ta n s w e r i n gs y s t e m ,a n dp r o p o s e ss t u d y i n gp l a no ft h eo n t o l o g y b a s e d i n t e l l i g e n ta n s w e r i n gs y s t e m t h e n ,c o n s t r u c t so n t o l o g ym o d e lo fl i n e a rs t r u c t u r ei nd a t a s t r u c t u r e ,s u m m a r i z e sb a s i cp r o c e s so fo n t o l o g yc o n s t r u c t i o ni nt h ee d u c a t i o nf i e l d ,g e n e r a t e s o w l + r d f b a s e df o r m a ld o c u m e n t si nt h eu s eo fo n t o l o g ye d i t o rp r o t e # _ _ 3 2 f i n a l l y , a c c o r d i n gt oc o n s t r u c t i n go n t o l o g ym o d e l i n gh i e r a r c h i c a ls t r u c t u r e ,d e s i g n i n gd a t as t r u c t u r e o ft h ek n o w l e d g eb a s eo fi n t e l l i g e n ta n s w e r i n gs y s t e m ,t h ea u t h o rm a p st h ec o n s t r u c t e d o n t o l o g ym o d e l i n gt oa c c e s sd a t a b a s e ,l a y st h es e m a n t i c f o u n d a t i o nf o r i n t e l l i g e n t a n s w e r i n gs y s t e m ,s t r u c t u r e ss e g m e n t i n gs y s t e ms p e c i f i c a l l yf o rd a t as t r u c t u r e ,a r r a n g e s u s e rq u e r i e sm o d e l ,r e a l i z e st h eo n t o l o g y b a s e dl i n e a ri n t e l l i g e n ta n s w e r i n gs y s t e mb yv e + + l a n g u a g e w i t hc o n t r a s tb e t w e e nt h eg e n e r a ls e a r c ha n dp o t e n t i a ls e a r c ho fs e m a n t i c s , a n a l y t i cr e s u l t v e r i f i e st h a to n t o l o g y b a s e di n t e l l i g e n ta n s w e r i n gs y s t e mi m p r o v e st h e a c c u r a t es u r v e yr a t ea n dt h ee n t i r ei n v e s t i g a t i o nr a t eo ft h ep r o b l e m t h ec o n t e n t so ft h ep a p e ri st h er e s e a r c ho fi n t e l l i g e n tq u e s t i o na n s w e r i n gs y s t e mb a s e d o no n t o l o g y , t h ea u t h o rm a k e sa l la t t e m p tt oc r e a t ean e wi d e aa n dp r o g r a mf o rt h ea p p l i c a t i o n o fo n t o l o g yi ni n t e l l i g e n tq u e s t i o na n s w e r i n gs y s t e m t h r o u g hs i m u l a t e de x p e r i m e n tt h e a u t h o rv e r i f i e st h ef u n c t i o no fd e s i g n i n gp r o g r a mi nt h i sp a p e r , a n di nac e r t a i ne x t e n t ,t h e a c c u r a c yo fi n t e l l i g e n tq u e s t i o na n s w e r i n gs y s t e mi sg r e a t l yi m p r o v e d ,a n dt h en e e d so f l e a r n e r s a l es a t i s t i e dm u c hb e t t e r k e y w o r d s :o n t o l o g y i n t e l l i g e n tq u e s t i o na n s w e r i n g d s 。l l o ml s o a s t h e s i s :a p p l i c a t i o n r e s e a r c h 要柳技丈肇 学位论文独创性说明 本人郑重声赞:所曼交的学位论文是我个人在导簿指导下进行的研究工作 及其取褥研究成果。尽我所知,除了文中加以标注和致谢的地方外,论文中不 包含其他人或集体已经公开发表或撰写过的研究成果,也不包含为获得遥安科 技大学或其他教育机构的学位或证粥所使用过的材料。与我一同工作的同志对 本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。 学位论文作者签名;廖胁日期: 萝六“ 学位论文知识产权声明书 本人完全了解学校有关保护知识产权的规定,郯:研究生在校攻读学位期 间论文工作的知识产权单位属于西安科技大学。学校有权保键并向国家有关部 f j 或机构送交论文的复印件和电子舨。本人允许论文被查阅和借阙。学校可以 将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩 印或扫描等复制手段保存和汇编本学位论文。同时本人保证,毕业后结合学位 论文研究课题褥撰写的文章一律注明作者单位为西安科技大学。 保密论文待解密后适用本声明。 数做储鹕涉物 指导教师签名:噘,抱 矽护暮年多胄tb 嚣 l 绪论 1 1 研究背景 1 1 1 智能答疑现状 1 绪论 近年来,i t 发展迅速,i n t e r n e t 的普及使得网络信息成为一个廉价的资源库,为学 习者提供了一个免费瓷源的查询平台,但与此同时,学习者的需求愈来愈多,要求也愈 来愈严,尤其专业领域的学习者发现,面对浩瀚的网络资源要找到真正符合自己需求的 知识是一件很费时费神的事。 在教育领域为改善这种情况,各种具有答疑功能的网站相继出现,如上海交通大学 掰络教育学院的常见闷题f a q ,人民大学网络教育学院的值机答疑,北京邮电大学现代 远程教育系统,华南理工大学远程教育中心,浙江大学现代远程教育中心,西安交通大 学网络教育学院等。然而上述有答疑功能的教育类网站大多数都是采用电子邮件、留言 板、b b s 睽天室等基于网络的人际交互方式实现答疑;少数先进的答疑系统是基于关键 字自动搜索实现:更为先进则涉及语义,但准确率和针对性都比较差,效果不甚理想。 由于答疑功能模块有很高的研究价值,广大学者对其投入了大量的研究。1 9 9 8 年, 周睿斌f l l 首先提出“自动问答系统的设想并实现了a n s w e rw e b 自动答疑系统;2 0 0 0 年,柳泉波【2 】提如“智能答疑系统的设计;2 0 0 2 年,何向阳 3 1 提出了“人性化设计 的思路;2 0 0 3 年,洪小俐4 】提出了“知识库的共享”;刘亚军等1 5 j 提出了“语义网”;苏 群1 6 提出了“关联模式挖掘 ;田凤杰网提出了“答案抽取的推理策略”;2 0 0 4 年刘亚军 等f 8 】提出了“加权语义相似度模型 ;以上这些研究观点的提出,突出了语义理解是智能 答疑系统发展瓶颈,提高答疑系统精确度必须提高语义精确度。2 0 0 5 年黄新等一j 提出的 基于本体知识管理系统研究受到了广大学者的关注,成为研究热点。 1 1 2 本体在智能领域中的应用 a i 领域将哲学领域o n t o l o g y 的概念引入,用于知识表示和知识组织,其概念的内涵 也因此发生了改变,所以称为本体,英文名为o n t o l o g y ( 首字母小写) 以示区别于o n t o l o g y ( 首字母大写) 。这是斯坦福大学的g u a r i n o 与g i a r e t t a ( 1 9 9 5 ) 的建议。o n t o l o g y ( 首字 母大写) 是指哲学领域的本体论研究,而o n t o l o g y ( 首字母小写) 是指a i 领域的本体系 统和本体理论的研究u 0 。 a l 领域的文献中有许多关于本体的应用,中国社会科学院哲学研究所的杨学功教授 在“o n t o l o g y 的研究方面,有自己独到的见解。他认为,作为一种特殊的哲学理论 两安科技大学硕士学位论文 形态,o n t o l o g y 是以追求终极实在为依归,以奠定知识基础为任务,以达到终极解释为 西标的哲学,在a i 领域可作为知识组织的手段和方法。张晓林博士在“描述知识组织体 系的元数据 一文中h 2 1 ,利用o n t o l o g y 思想提取知识组织中的原数据,称“o n t o l o g y 为 “概念集”。他提到,所谓概念集( o n t o l o g i e s ) 是指特定领域公认的关于该领域的对 象( 实际对象和逻辑对象) 及其关系的概念化表述,包含以下部分: ( 1 ) 本领域对象类的等级体系: ( 2 ) 对象类的属性及属性取值限制; ( 3 ) 语义关系体系,即对象类之间的逻辑关系体系; ( 垂) 关于对象类及语义关系的推理规则。 浙江大学人工智熊研究所的高济教授在“基于r d f 的异构信息语义集成研究”一 文中使用了“概念模型( c m c o n e e p t u a l m o d e l ) 的称谓。他提到【1 3 】:“c m 由一个类 ( 概念) 层次和类属性以及一组符合有关类或其属性的公理的规则组成。因此通过在检 索到的事实组上应用这些规则,可能推理出新的事实。 按照他的表述,c m 实际上就 是本体。武汉大学的张玉峰教授【1 4 l 在“动态约束性概念网络与知识检索研究 一文中指 出,概念网络是知识检索的基础,“概念网络中的每个节点均反映唯一的知识内容,采 用若干属性的元组来表示,在他所说的概念网络中,“每一概念类都具有层次分明的 概念树状关系,形成概念网络中的主关联,通过概念分类形成了定的概念层次划 分。概念类不同,但概念层次相同的概念节点可以根据自身属性或内容相互连接成关联 网络。从而有效地揭示概念节点闻的各种相关关系,构成概念网络中的辅关联。 按照 他的表述,文中的“概念网络”实质仍然是本体。 分析综述以上文献,本体在智能领域有以下作用: ( 1 ) 反映词汇的语义映射关系和语义限制。 如果仅仅按照用户输入的检索词进行检索,肯定会造成“漏检”。用户输入的检索 词和用户自身的知识背景、检索能力以及检索经验相关,可能只是某一概念的若干同义 词、近义词或是相关术语中的一个。研究者可以利用本体规范概念集自动地将检索词映 射到它的同义词、近义词和相关词上,利用一组规范盼概念进行检索。另一方面,一个 词可以有多个含义,用户进行检索时往往只是针对它的一个含义。如果只进行简单匹配, 会造成“误检”。例如,用户输入“数据结构 ,可能会查找到“数据结构”的定义, 也可能会找出数据库的数据结构等信息。这时,可以利用本体来分析箱户检索词汇和信 息资源语义类型以及二者的语义匹配程度。在分析用户检索词的语义时,可以直接向用 户提供输入词汇的语义类型或语义关系,让用户通过选择加以明确。 ( 2 ) 对基于某个知识组织体系的信息资源进行结构化组织。 建立基于本体的信息门户或知识f j 户。利用复合( 集成) 本体从不同的焦度对信息 集合进行标引。这样可以根据用户的不同需求按照不同的知识体系进行检索和浏览。 2 1 绪论 ( 3 ) 表示信息内容与知识组织体系之间的链接。 可以将本体与信息系统进行链接,从而使用户在使用信息的过程中,更加便捷地利 用本体来理解具体的概念并链接相关概念和相关资源。链接方式可以是静态的( 即有关 链接事先嵌入到信息单元中,不能进行修改) ,也可以是动态的( 即在需要时,由系统 析取词汇和链接相应的本体) 。智能答疑一般针对专业领域,所以进行语义分析和选择 本体的工作都相对明确和简洁。 ( 4 ) 利用多种模式表现和理解信息集合。 利用本体,可以将信息进行可视化组织。可以依照本体的分类体系将检索结果进行 组织和显示。可以按照一定的语义关系显示问题答案,例如可以按照“在某种存储结构 下( 链式存储) ,对某某对象( 某种线性表) 进行某某操作( 插入、删除、查找) ”的 关系,显示针对某一类线性表,在何等的存储结构下进行某种算法的优缺点显示。 ( 5 ) 进行智能检索。 利用本体、其它元数据和网络资源中的语义信息进行智能检索和推理。 1 1 3 论点提出 在综合调研了大量文献后,挖掘出本体在智能领域存在很大发展空间,尤其是在教 学领域,所以给出本体作为智能答疑系统语义基础的观点,来拉升智能答疑在语义这一 方面的不足。 结合1 1 2 节中本体在人工智能领域中的作用,具体到教学领域中智能答疑系统,作 者认为本体作为其语义基础有如下作用: ( 1 ) 为数据和知识层次的互操作提供一种进行数据共享的可行手段。 ( 2 ) 使不同的计算机系统间可以通讯,这些计算机系统允许有不同的技术结构、信 息体系与应用领域。 ( 3 ) 可以便捷地复用领域知识。 ( 4 ) 为词汇、术语的标准化、形式化提供了理论基础。 ( 5 ) 提高了检索提问式的有效性,使检索结果更为准确。 综上所述,本体技术在智能答疑系统中的知识组织和问题检索中都能起到举足轻重 作用。由于本体具有良好的概念层次结构和对逻辑推理的支持,基于本体的检索,基本 思想是使用本体技术来构建学习者所要检索资源的知识库,推理出学习者提问的问题, 以达到提高查全率和查准率的目的。如果检索系统不需要太强的推理能力,知识本体可 用概念图的形式表示并存储,数据保存在关系数据库中,采用图的匹配技术来完成信息 检索。如果检索系统要求比较强的推理能力,就需要用一种描述语言表示本体,数据保 存在知识库中,应用描述语言的逻辑推理能力来完成信息检索。 3 西安科技大学硕士学位论文 1 2 本文工作 1 2 1 研究内容及意义 本文针对智能答疑研究现状,利用本体技术作为智能答疑系统的语义基础,设计实 现一个试验性的基于本体智能答疑系统,通过与其它技术方法普通数据库和潜在语 义抽取的对比,验证本体作为语义基础所表现出的优越性能。主要研究内容如下: ( 1 ) 利用本体技术作为智能答疑系统中语义基础,提出基于本体的智能答疑系统研 究方案。 ( 2 ) 构建数据结构中线性结构知识本体模型。 ( 3 ) 设计存储线性结构知识本体模型的数据库结构,为本体作为知识组织体系在答 疑系统中奠定基础性工作。 4 ) 构造专门针对数据结构的分词系统,约定用户闻题查询模式,采用豫+ + 语 言实现一个基于本体的线性知识智能答疑系统,实现模式推理的功能。 ( 5 ) 设计实现普通检索和潜在语义分析检索两个模块。分析实验结果,验证基于本 体的智能答疑系统性能。 智能答疑系统要成为具有发展活力的专业学科,在教育领域发挥更大的作用,就要 关注并参与i t 技术的尖端研究。知识本体作为先进的知识表示和知识组织正是现阶段a i 领域中最为热点的研究之一。所以基于本体的智能答疑系统侧重于研究和开发出系统而 完备的知识组织体系,以及基于本体的推理机制,加强教学领域中答疑系统进行更好的 知识组织和知识挖掘,提高向学习者解决疑难问题的能力。 1 2 。2 研究路线及方法 本文的研究重点是利用本体技术实现智能答疑,提高问题查准率和查全率,是以本 体理论为前期和基础,以本体的价值在智能答疑中的体现为目的。本文研究中采用理论 联系实际的方法进行知识本体建模和答疑系统构建,首先提出研究路线和方法,然后按 照预想的路线和方法进行工程实践,建立预期的研究环境,用实践检验研究方法的正确 性和可行性;或者通过建立实验平台,进行模拟实验,分析实验结果,并与同领域相关 研究成果进行比较、分析,并得出结论。除此之外,还用到以下方法: 1 ) 文献法。阅读和参考了4 0 余篇相关论文和文献。 ( 2 ) 构建法。知识本体构建法与系统构建法。对线性结构本体模型的构建采用了较 为通用的本体构建方法。利用a c c e s s 数据库和v c + + 6 0 进行了基于本体的智能答疑系统 的开发,包括分词、问题模式化和问题检索的设计与实现等工作。 4 1 绪论 1 2 。3 组织安排 论文第一章是绪论部分,分孝斤智能答疑的现状,弓l 燃本体在智能答疑中的重要作用, 总结了本文的研究内容及研究意义,提出本文的研究路线和方法。 论文第二章详细叙述本体的概念、类型及国内外研究现状和发展前景;举例说明本 体的应用领域;介绍本体的构建方法、描述语言、编辑工具;讨论与本体楣关理论技术 的联系与区别。 论文第三章全面阐述教学领域中数据结构中线性结构知识本体的建模过程,建 模意义及必要条件,建模方法、工具,建模的详细步骤。 论文第胆章在第三章完成基础上,设计a c c e s s 数据库结构,存储线性结构本体模型, 构造专门针对数据结构的分词系统,约定用户问题查询,采用v c 什语言实现一个基 予本体的线性知识智能答疑系统,并验证其性能。 论文第五章总结全文,展望今后工作。 5 西安科技大学硕士学位论文 2 本体概述 本章主要介绍本体的定义、类型、国内外研究现状、主要技术方法、描述语言和编 辑工具,最后分析了和语义网络的区别。 2 1 定义和类型 ( 1 ) 本体定义 “o n t o l o g y ( 以下统称本体) 的概念起源于哲学领域,1 7 世纪,“o n t o l o g y ”一词 由德意志哲学家郭克兰纽( r g o c l e n i u s ) 首次提出,但具有“o m o l o g y 内涵之哲理的 创建却可远溯至古希腊时代,那时的哲学家以探究世界的本源来构成他们的本体理论, 米都利学派便提出了西方哲学史上第一个哲学范畴始基说,由此演变出“本体”、“本 质”和“基质 等概念范畴。“o n t o l o g y 作为一种哲学理念和哲学型态,在苏格拉底 提出“始基 问题中萌芽,在柏拉图和亚里士多德那里奠定雏形,而最终在中世纪经院 哲学中成熟的【1 5 】。a i 领域将本体的概念引入,用于知识表示和知识组织,其内涵也因此 发生了改变。国内外学者持有不同的观点。 外国学者的观点: 斯坦福大学的g r u b e r 1 6 1 ( 1 9 9 3 ) 最早提出本体的定义,其后b o r s tp i m 博士【1 7 】( 1 9 9 7 ) 对g r u b e r 的定义作了少许修正。两个定义合并以后,表达如下: “i ti sa l le x p l i c i tf o r m a l s p e c i f i c a t i o no fas h a r e dc o n c e p t u a l i z a t i o n 译为中文即,本体是一套得到大多数人认同 的、关于概念体系的明确的、形式化的规范说明。 德国卡尔斯鲁厄大学的s t u d e r 等学者【1 8 】( 1 9 9 8 ) 认为本体有四大特征:明确的 ( e x p l i c i t ) ,形式化的( f o r m a l ) ,共享的( s h a r e d ) 、概念化的( c o n c e p t u a l ) 。 使用最广泛的本体定义是波音公司m i c h a e lu s c h o l d 博士等人【l 纠( 1 9 9 6 ) 提出的:“i t i sav o c a b u l a r yo ft e r m sa n ds o m es p e c i f i c a t i o no ft h e i rm e a n i n g ”,译为中文即,本体是一 套术语词表以及术语含义的规范说明。 a i 领域的文献中有许多关于本体的定义,其中很多大同小异。斯坦福大学的n a t a l y a f n o y 和d e b o r a hl m cg m i 皿e s s 【2 0 】认为,一个本体其实就是一套关于某一领域概念的规 范而清晰的描述,它包含类( c l a s s e s ,有时也被称作概念c o n c e p t s ) ,每一个概念的属性 ( p r o p e r t i e s ) 描述了有关概念的各种特征和属性( 又称s l o t s ,有时也被称为r o l e s 或 a t t r i b u t e s ) ,还有属性的限制条件( r e s t r i c t i o n s ,即分面f a c e t s ,有时也被称作r o l er e s t r i c t i o n s 或c o n s t r a i n t s ) 。 中国学者的观点: 中国社会科学院哲学研究所的杨学功先生在“o n t o l o g y ”的研究方面,有自己独到 6 2 本体概述 的见解。他不同意将“o n t o l o g y ”,译为“本体论 ,从而也不把它作为哲学的一个分 支学科来看待,而是把它当作一种特殊的哲学理论形态来看待。在a l 研究领域,对于 “o n t o l o g y 的理解和称谓也是仁者见仁,智者见智。孛科院李景媾士驻1 ,2 2 l 认为,本体 是一个关于某些主题的、层次清晰的规范说明。它是一个已经得到公认的形式化的知识 表示体系,它包含词表( 或名称表术语表) ,词表中的术语全是与某一专业领域相关的, 词表中的逻辑声明全都是晨来描述那些术语的含义和术语闻关系的,邸它们是怎样和其 它术语相关联的。 综合上述,作者认为本体在智能答疑系统中就是为教学领域提供了一个用来表达和 交流某些领域知识的词表和一个关系集,关系集是领域词表中术语间关系的集合。 2 ) 本体类型 本体类型按照应用领域的不同可大致划分为四大类【2 3 1 ,图2 1 为本体应用的三个主 要领域。 图2 1 本体鹿用的三个主要领域 具体来讲: 表示本体( 元本体,r e p r e s e n t a t i o no n t o l o g y 或m e t a - o n t o l o g y ) ,是指在一个特定 的知识表示体系中,用来获取对知识进行形式化的表达元词( 即词根) 的本体。 上层本体或通厢本体、顶级本体( g e n e r a lo ru p p e r - o n t o l o g y ) ,划分了存在于 客观世爨的实体的不同种类。具有普遍意义的观念在这类本体中得到了表示,这些观念 不依赖于特定的问题或学科领域。 领域本体( d o m a i no n t o l o g y ) 是专业性的本体。在这类本体中被表示的知识是 针对特定学科领域的。 应用本体( a p p l i c a t i o no n t o l o g y ) ,描述了既依赖于某个特定领域又依赖于某项 课题的知识。因此,这类本体与解决问题的方法相关联。一个应用本体与用来描述专业 领域的概念相关联,这些概念是解决阂题方法体系的组成部分。 7 西安科技大学硕士学位论文 2 2 主要研究现状 ( 1 ) 国外主要研究现状 2 0 世纪8 0 年代末至9 0 年代初,哲学领域的概念“o n t o l o g y 被越领域所借鉴, 知识本体的建模方法也初步确立。近年来,国外对本体建模作了大量研究并将其运用于 知识工程领域。现做篱单介绍: w 3 c 的研究。w 3 c 是w o r l dw i d ew e bc o n s o r t i u m 的简称,中文叫做“万维网 联盟”。w 3 c 是个关于信息、商业、通讯和共识的论坛。它立足于开发交互技术( 如 规范、指南、软件和工具) ,使得w e b 得以发挥最大的潜能。 a i f b 的研究。德国卡尔斯鲁厄大学( u n i v e r s i t yo fk a r l s r u h e ) 的r u d is t u d e r 、 a l e x a n d e rm a e c h e ,和以他们为首的应用情报学和规范描述方法研究所( a i f 阻o n s t i t u t e o fa p p l i e di n f o r m a t i c sa n df o r m a ld e s c r i p t i o nm e t h o d s ) 对本体基础理论( o n t o l o g y l e a r n i n g ) 和本体的数学表达进行了深层次的研究。 k s l 的研究。美国斯坦福大学的知识系统试验室( k s l - - k n o w l e d g es y s t e m s l a b o r a t o r y , 以下简称k s l ) ,无论是在本体建模工具领域,还是在本体应用层面的研究方 面,都站在了知识工程领域的最前沿。 ( 2 ) 国内主要研究现状 与国外相比,国内无论是在理论研究、实践研究,还是在技术手段的实现和应用方 面都相对落后,与国外高水平的研究相比存在很大差距。囡内对于本体的研究大约始于 2 0 世纪9 0 年代初。 中科院李景博士在2 0 0 3 年1 月初时,检索重庆维普中文科技期刊全文数据库( 收录 范围1 9 9 8 - 2 0 0 2 年) ,以“o n t o l o g y 一词为检索词,不限定学科范围,仅返回8 条结采, 其中3 条是无关结果;限制学科为“图书情报 ,无结果返回。以“概念集一词作为 检索词,不限学科范围,返回5 条结果,其中1 条为无关结果;限定学科为“图书情报, 返回l 条有效结果。以“本体论 为检索词,不限学科,检索出1 6 7 条,其中2 8 条相关; 限定学科为“图书情报 ,2 条有效。 2 0 0 6 年1 2 月底,作者检索重庆维普中文科技期于i j 全文数据疼( 收录范围2 0 0 3 2 0 0 7 ) , 以“o n t o l o g y 一词为检索主题词,不限定学科范围,返回3 2 8 条结果,其中1 1 6 条是无 关结果;限制学科为“人工智能 ,返回1 8 8 条有效结果。以“概念集一词为检索主 题词,不限学科范围,返回1 3 条结果;限制学科为“人工智能,返回3 条有效结果。 以“本体一词为检索主题词,不限学科范围,返回1 9 6 2 条结果;限制学科为“人工智 能 ,返回8 5 6 条有效结果。表2 1 为2 0 0 3 年李景博士检索重庆维普中文科技期刊全文数 据库的本体相关文献调查表。表2 2 为2 0 0 7 年作者检索重庆维普中文科技期刊全文数据 库的本体相关文献调查表。 8 2 本体概述 表2 12 0 0 3 年李景博士检索重庆维普中文科技期刊全文数据库的本体相关文献调查表 有效的检索结果 谭掰库存文献年限 限制学秘为捡索弱期 不限制学科 检索词 “豳书情报” o n t o l o g y l9 9 8 2 0 0 25 条( 8 )0 条2 0 0 2 1 l 概念集 19 9 8 2 0 0 2 4 条( 5 )l 条2 0 0 2 1 1 本体论 9 9 8 - 2 0 0 22 8 条( 1 6 7 )2 条2 0 0 3 。l 表2 - 22 0 0 7 年作者检索重庆维普中文科技期刊全文数据瘁的本体相关文献调查表 有效的检索结果 目 库存文献年限 限制学科为 检索日期 检索诩 不限制学科 “人工锣能” o n t o l o g y 2 0 0 3 2 0 0 7 2 1 2 条( 3 2 8 )1 8 8 条 2 0 0 6 1 2 概念集 2 0 0 3 - 2 0 0 76 条( 1 3 )3 条2 0 0 6 1 2 本体论 2 0 0 3 2 0 0 7 1 2 1 2 条( 1 9 6 2 )8 5 6 条 2 0 0 7 6 仔细考察表2 1 中的所有检索结果,得出两点结论: 文献数量少,而且数量有限的文献均集中在1 9 9 9 年以后。 文献的内容多为研究综述或是翻译匿外的研究成果。 对比表2 。l ,表2 2 中的所有检索结果,可以得出两点结论: 知识本体已成为研究热点,尤其是在a i 领域中的发展很迅速。 国内的文献在本体方面的研究仍多数是借用国外的研究成果。 2 3 主要技术方法 在本节中,本体的构建方法、描述语言和编辑工具等关键性技术会得到具体的分析 和比较。 2 3 1 构建方法 从本体发展前景可以看豳,本体的构建方法是当前研究热点。由于本体的构建多是 面向特定领域,如果没有好的方法路线指导,就难以在不同领域本体的构建中保持一致, 也不利于本体规模化和规范的建设。因前尚没有一套标准的本体构建方法。一般认为, g r u b e 一蠲在19 9 5 年提出的5 条规贝l 是比较有影响的: 明确性和客观性:本体应该用自然语言对术语给出明确、客观的语义定义。 完整性:所给出的定义是完整的,能表达特定术语的含义。 9 西安科技大学硕士学位论史 一致性:知识推理产生的结论与术语本身的含义不会产生矛盾。 最大单向可扩展性:向本体中添加通用或专用的术语时,通常不需要修改己有 的内容。 最少约束:对待建模对象应该尽可能少列出限定约束条件。 下面介绍几种常见的本体构建方法路线闭。 ( 1 ) t o v e 法。t o v e 法叉称g r u n i n g e r & f o x “评价法 。t o v e 是指多伦多虚拟企业 ( t o r o n t ov i r t u a le n t e r p r i s e ) ,专用于构建企业建模过程本体,由多伦多大学企业集成 实验室( e n t e r p r i s ei n t e g r a t i o nl a b ) 研制,使用一阶谓词逻辑进行集成。 ( 2 ) m e t h o n t o l o g y 法。m 琶疆o n 哟l o g y 法,专用于构建化学本体,该方法已 被马德罩大学理工分校人工智能图书镶采用。 ( 3 ) 骨架法。骨架法( m i k eu s c h o l d d e d e & k i n g u s c 9 5 ) 用来构建企业本体,是商业 企业间相关术语和定义的集合,该方法只提供开发本体指导方针。 g ) s e n s u s 法。s e n s u s 法是开发用于自然语言处理的s e n s u s 语言本体的方法路 线,由美国u s c i s i 研制开发。 ( 5 ) i d e f 5 法。i d e f 5 是美国k b s i 公司开发的用于描述和获取企业本体的方法。英文 羹q 傲“i d e f 5o n t o l o g yd e s c r i p f i o nc a p t u r em e t h o d ”。 ( 6 ) 七步法。斯坦福大学医学院开发的七步法,主要用于领域本体的构建。七个步 骤分别是:第一步确定本体的专业领域和范畴。第二步考查复用现有本体的可能性。第 三步列出本体中的重要术语。第四步定义类和类的等级体系。第五步定义类的属性。第 六步定义属性的分面。第七步创建实例。 综合上述六种方法体系,可以从中总结出本体的构建原则,总结如下: ( 1 ) 本体的构建要面向特定的应用目的。 ( 2 ) 本体的构建应该基予一定的专业领域、学科背景或研究课题。 ( 3 ) 本体中包含的概念数目应该尽可能的最小化尽可能地将冗余去除。 ( 4 ) 本体的规模应该是有限增长的。 ( 5 ) 本体中“类 的设计应当秉承独立性原则,即这个类可以独立存在。 ( 6 ) 类的设计还应当秉承共享性原则,即类一旦被确立,就定有被复用的可能和 必要。 2 3 2 描述语言 本体的标记语言,可称之为置标语言,又称本体的构建语言或者是表示语言。作为 表示本体的语言工具,应该具有如下的基本功能: 为本体的构建提供建模元语( m o d e l i n gp r i m i t i v e s ) 。 为本体从自然语言的表示格式转化成为机器可读逻辑表达格式提供标引工具。 l o 2 本体概述 为本体在不同系统之间的导入和输出提供标准的机读格式。 形式化语言表示,利用机器可读的形式化表示语言表示本体,可以直接被计算 机存储、鸯霜工、利用,或在不同昀系统之闯进行互操作。 本体可以用融然语言描述,也可以用框架( f r a m e w o r k ) 、语义网络或逻辑语言描述表 示。目前,比较著名的本体描述语言可以分为两类 2 6 1 :基于趟的本体描述语言和基于 w 西的本体描述语言。 ( 1 ) 基于a i 的本体描述语言。 自上个世纪9 0 年代以来,一些基于a i 的本体描述语言被提出,女n k i f 、o n t o l i n g u a 、 c y c l ,l o o m ,o c m l ,f l o g i c a k i f 。k i f ( k n o w l e d g ei n t e r c h a n g ef o r m a t ) 是由斯坦福大学开发的,它是一种 在不同知识库系统间交换知识的格式,是基于一阶逻辑的语言。 o n t o l i n g u a 。o n t o l i n g u a 是一种基于k i f 的语言,它采用统一的规范格式来描述本 体。其特点是:为构造和维护本体提供了统一酶、计算机可读的方式;由其构造的本钵可 以方便地转换到各种知识表示和推理系统,从而将本体的维护与使用它的目标系统分 离。 c y c l 。c y c l 是c y e 系统的描述语言,一种体系庞大丽菲常灵活的知识描述语言。 其特点是:在一阶谓词演算的基础上扩充了等价推理、缺省推理等功能,具备一些二阶谓 词演算的能力;其语言环境中配有功能很强的可进行推理的推理机。 l o o m 。l o o m 是一种基于一阶谓词逻辑的高级编程语言。其特点是提供表达能力 强的,声明性的规范说明语言;提供强大的演绎推理能力及多种编程风格和知识库服务。 o c m l 。o c m l ( o p e r a t i o n a lc o n c e p t u a lm o d e l l i n gl a n g u a g e ) 是由英国开放大学 k m i ( k n o w l e d g em e d i ai n s t i t u t e ) 开发的。 f l o g i c 。f l o g i c ( f r a m el o g i c ) 是长尔斯鲁厄大学开发的,是基于框架逻辑和一 阶逻辑的。它可以表示概念,概念分类,二元关系,函数,实例,公理和规则。 ( 2 ) 基于w e b 的本体描述语言。 近年来,随着互联网的发展,出现了一系列基于w e b 的本体描述语言,也称本体标 记语言,如s h o e ,x o l ,r d f ,r d f s c h e m a ,d a m l + o i l ,0 w l 。 s h o e 。s h o e ( s i m p l eh t m lo n t o l o g ye x t e n s i o n s ) 是h t m l 的扩展,是由马里 兰大学开发的。它基于框架和规则,使用不同于h t m l 的一些标记,使得可以在h t m l 文档中插入本体 x o l 。x o l ( x m l b a s e do n t o l o g ye x c h a n g el a n g u a g e ) 是由s 砌困际人工智能 中心开发的。它是一种简单通用的定义本体的语言。 r d f 。r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) ,是w 3 c 在x m l 的基础上推荐的 一种标准,它提供一种框架用于描述资源的信息。r d f 的数据模型实质上是一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论