(社会医学与卫生事业管理专业论文)医学本体的构建及检索研究——以心瓣膜疾病为例.pdf_第1页
(社会医学与卫生事业管理专业论文)医学本体的构建及检索研究——以心瓣膜疾病为例.pdf_第2页
(社会医学与卫生事业管理专业论文)医学本体的构建及检索研究——以心瓣膜疾病为例.pdf_第3页
(社会医学与卫生事业管理专业论文)医学本体的构建及检索研究——以心瓣膜疾病为例.pdf_第4页
(社会医学与卫生事业管理专业论文)医学本体的构建及检索研究——以心瓣膜疾病为例.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(社会医学与卫生事业管理专业论文)医学本体的构建及检索研究——以心瓣膜疾病为例.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华中科技大学同济医学院硕士学位论文 中文摘要 本体( o n t o l o g y ) 最初是哲学领域的概念,是对世界任何领域内的真实存在 所做出的客观描述。2 0 世纪9 0 年代以来,人们将本体的概念引入人工智能、知 识工程和图书情报领域,在这些领域中,本体主要是一种知识组织体系,通过对 领域中概念及概念间关系的描述来进行知识的表示和组织。近年来,关于本体的 研究与应用发展迅速,但国内关于本体的研究无论是在理论研究、实证研究,还 是在技术手段的实现和应用方面都相对落后,与国外研究相比存在很大差距。目 前,国内图书情报领域关于本体的研究尚处于起步阶段,尚未见到有关国内构建 具有推理功能的学科或领域本体系统的报道。 本论文介绍了国内外关于本体的研究现状,探讨了本体的相关理论与主要技 术方法。为了验证利用本体建立知识组织体系的可行性,论文以斯坦福大学提出 的“七步法”和其开发的p r o t 6 酌为工具,在国内首次进行了医学领域内心瓣膜 疾病本体的构建试验。通过建立概念、概念之间的继承、约束、实例关系表达了 心瓣膜疾病的领域知识。建立过程中验证了本体构建工具及方法的适用性,弄清 了构建领域本体的流程,为本体理论在医学领域的应用提供了范例。 在构建的心瓣膜疾病本体的基础上,初步实现利用p a l 语言对该本体的查 询功能。通过查询,表明基于本体的检索能避免传统数据库检索的字面机械匹配, 实现概念检索,同时可以提高检索精度,实现查询应答,并最终实现智能化检索。 本论文的研究意义在于将本体的概念、理论和方法引入了医学图书情报领 域,通过设计并构建心瓣膜疾病本体模型和对其进行检索,验证本体所具有的智 能检索功能,希望推动本体方法在医学信息检索、医学专家系统、医学教育系统 和自然语言理解等领域的应用和发展。 关键词:本体、领域本体、心瓣膜疾病本体模型、本体检索 华中科技大学同济医学院硕士学位论文 a b s t r a c t o n t o l o g yo r i g i n a t e di np h i l o s o p h y o n t o l o g yd e s c r i b e do b j e e t l ya b o u t b e i n g i n t h ew o r l d s i n c e1 9 9 0 s ,o n t o l o g yh a sb e e ni n t r o d u c e di na r t i f i c i a l i n t e l l i g e n c e , k n o w l e d g ee n g i n e e r i n ga n dl i b r a r y & i n f o r m a t i o ns c i e n c e s i nt h ed o m a i n s m e m i o n e d ,o n t o l o g yi sas y s t e mo fk n o w l e d g eo r g a n i z a t i o n o n t o l o g yr e p r e s e n t e d a n do r g a n i z e dk n o w l e d g eb yt h ed e s c r i b a t i o no ft h ec o n c e p ta n dt h er e l a t i o nb e t w e e n c o n c e p t so fas p e c i a ld o m a i n o n t o l o g yl e a r n i n ga n dp r a c t i c i n gh a v eb e a nd e v e l o p i n g r a p i d l yt h e s ey e a r s i nt h e s ef i e l d st h er e s e a r c hl e v e lo fo n t o l o g yi nc h i n ai sn o ta s d e v e l o p e da st h ew e s t e r nc o u n t r i e sn o w t h e r ei ss t i l l1 1 0d o m a i n - o r i e n t i e dt e n t a t i v eo r d e m os y s t e mb a s e do no n t o l o g yi nl i b r a r y & i n f o r m a t i o nf i e l d si nc h i n a t h es t a t eo fo n t o l o g yr e s e a r c hi nc h i n aa n df o r e i g nc o u n t r i e sh a sb e e ni n t r o d u c e d i nt h i sd i s s e r t a t i o n t h eo n t o l o g i c a lt h e o r ya n dm e t h o dh a v eb e e nd e s c r i b e d i no r d e r t ov a l i d a t et h ep o s s i b i l i t yo fc o n s t r u c t i n go n t o l o g y - b a s e dk n o w l e d g eo r g a n i z a t i o n , a h e a r tv a l v ed i s e a s eo n t o l o g ym o d e lh a sb e e nf i r s t l yb u i l ti nc h i n aw i t h “s e v e ns t e p s ” m e t h o da n dp r o t d g d t h eo n t o l o g yr e p r e s e n t e dt h ed o m a i nk n o w l e d g eo fh e a r tv a l v e d i s e a s eb yc o n s t r u c t i n gt h ei n h e r i t a n c e ,c o n s t r a i n ta n di n s t a n c er e l a t i o nb e t w e e n c o n c e p t s i nt h ep r o c e d u r eo fc o n s t r u c t i n go n t o l o g yt h ea d a p t i o no fo n t o l o g ye d i t o r h a sb e e nv a l i d a t e d ,t h ep r o c e s so fc o n s t r u c t i n go n t o l o g yh a sb e e nc l a r i f i e d t h eh e a r t v a l v ed i s e a s eo n t o l o g yc a nb e nu s e da sp a r a d i g m si nm e d i c i n e o nt h eb a s i so f h e a r tv a l v ed i s e a s eo n t o l o g y , i n q u e r i e st ot h eo n t o l o g yw i t hp r o t 6 9 d a x i o ml a n g u a g eh a sb e e nm a d ep r e l i m i n a r i l y d u r i n gs e a r c h i n g ,t h er e t r i e v a l b a s e d - o no n t o l o g ya v o i d e dm e r e w o r d - t o - w o r d m a t ew i t h i nt r a d i t i o n a ld a m b a s ea n d a c h i e v e dc o n c e p tr e t r i e v a l i nt h es a m et i m et h er e t r i e v a li n c r e a s e da c c u r a c y , a n s w e r e dt h eq u e s t i o n sa n dr e a c ha ni n t e l l i g e n tr e t r i e v a ld e 伊e e t h es i g n i f i c a n c eo ft h i sd i s s e r t a t i o ni st h ei n t r o d u c i n go fo n t o l o g yt h e o r ya n d m e t h o d si nm e d i c a ll i b r a r ya n di n f o r m a t i o nf i e l d si nc h i n a t h er o l eo ft h i s d i s s e r t a t i o ni sh o p e dt op r o p e lt h eo n t o l o g ym e t h o d sf o r w a r di nt h ef i e l d so fm e d i c a l i n f o r m a t i o nr e t r i e v a l ,m e d i c a ls p e c i a l i s ts y s t e m , m e d i c a lt e a c h i n gs y s t e ma n dn a t u r a l l a n g u a g ec o m p r e h e n s i o n k e y w o r d s :o n t o l o g y , d o m a i no n t o l o g y , h e a r tv a l v ed i s e a s eo n t o l o g ym o d e l , r e t r i e v a lb a s e d - o no n t o l o g y 华中科技大学同济医学院 硕士学位论文 郑重声明 本人的学位论文是在导师指导下独立撰写并完成的,学位论文没有剽窃、抄 袭、造假等违反学术道德、学术规范和侵权行为,否则,本人愿意承担由此而产 生的法律责任和法律后果,特此郑重声明。 学位论文作者( 签名) :镅习匕焉 砷1 年岁旯b 华中科技大学同济医学院 硕士学位论文 1引言 1 1 研究背景 1 1 1 本体的概念 本体论( o n t o l o g y ) 是哲学特有的一种形态,人们把它当作从柏拉图到黑格 尔的西方传统哲学的主干或“第一哲学”,这意味着它是各个哲学分支的理论基 础,是理论中的理论,哲学中的哲学;其它哲学问题都是围绕着建设、应用或怀 疑、反对本体论而展开的。古希腊哲学家亚里士多德将本体论分为两个方面,一 方面研究存在的本质,另一方面研究客体对象的理论定义,即整个现实世界( 本 体) 的基本特征【1 l 。从哲学意义上看,本体论关注的是“存在”,即世界在本质 上有什么样的东西存在,或者世界存在哪些类别的实体,所以哲学上的本体论是 对世界任何领域内的真实存在所做出的客观描述。 近年来,本体论的这些思想和方法被人们引入人工智能、知识工程和图书情 报领域,其概念的内涵也发生了改变。在这些领域中,o n t o l o g y 被称为本体,用 于解决知识概念表示和知识组织体系方面的有关问题,其最终目的是为了解决知 识的重用和共享。为区别“本体”分属的两层含义,斯坦福大学的g u a r i n o 与 g i a r e t t a 建议o n t o l o g y ( 首字母大写) 是指哲学领域的本体论研究,而o n t o l o g y ( 首字母小写) 是指a i ( a r t i f i c i a li n t e l l i g e n c e ,人工智能) 领域的本体系统和本 体理论的研究 2 1 。本论文在使用“o n t o l o g y ”这一英文术语时遵循着该惯例。 在计算机和人工智能领域中本体有多种定义。1 9 9 1 年,n e c h e s 教授和他的 同事在文献中给出:“本体是由一些术语、术语间的关系和规则组成,其中,术 语和术语之间的关系是用来描述问题域的知识,而规则是用来在术语和术语之间 的关系上进行推理的”。1 9 9 7 年b o r s t 提出“本体是共享概念模型的形式化规范 说明”。2 0 0 0 年f e n s e l 提出“本体是特定领域中重要概念的共享的形式化的描述”。 2 0 0 3 年u s c h o l d 提出“本体是关于共享的概念模型的协议”【3 j 。 其中,人们普遍接受的呈现高引用率的本体定义是由g r u b e r 给出的定义:“本 体是对共享的概念化( c o n c e p t u a l i z a t i o n ) 进行的形式的显式规范说明。”g r u b e r 对本体诸多定义进行概括分析后认为,本体的概念包括四个主要方面 4 1 : ( 1 ) 概念化( c o n c e p t u a l i z a t i o n ) :客观世界现象的抽象模型,其表示的含义 独立于具体的环境状态; ( 2 ) 明确( e x p l i c i t ) :概念及它们之间的联系都被精确的定义; 华中科技大学同济医学院 硕士学位论文 ( 3 ) 形式化( f o r m a l ) 精确的数学描述,计算机可读; ( 4 ) 共享( s h a r e ) :本体中反映的知识是其使用者共同认可的,是相关领域 中公认的概念集,它所针对的是团体而不是个体。 尽管定义有很多不同的方式,但是从内涵上来看,不同研究者对于本体的认 识是统一的,都把本体当作是领域( 可以是特定领域的,也可以是更广的范围) 内部不同主体( 人、机器、软件系统等) 之间进行交流( 对话、互操作、共享等) 的一种语义基础,即由本体提供一种明确定义的共识。这种共识的目标主要是为 机器服务。 1 1 2 本体的基本组成元素 本体的定义虽然有诸多表述,但有关它的必要条件基本能在定义中得到体 现。本体作为知识组织的重要手段应该具有以下要素阿: ( 1 ) 概念( c o n c e p t ) 概念原本是思维科学的一个术语,是“思维的基本形式之一,反应客观事 物的一般的、本质的特征”。在本体中,概念扮演着非常重要的角色,是人与机 器交互的桥梁:( i ) 概念是人类对现实世界理解的表意符号;( i i ) 概念是机器操 作的主要对象;( i i i ) 在人类和机器之间,需要建立一个数学模型使得人类能理 解并控制机器的运作,而概念又是数学模型主要的构成元素。本体中,概念又称 为类( c l a s s ) ,是相似术语所表达的概念的集合体。 ( 2 ) 关系( r e l a t i o n ) 本体中的关系表示概念之间的一类关联,典型的二元关系如概念之间的i s a 关系,它形成了概念之间的逻辑层次分类结构。 ( 3 ) 属性( a t t r i b u t e ,s l o t 有时也称为r o l e 或p r o p e r t y ) 概念的属性是指概念的一些描述方面,具有限制类中的概念和实例的功能, 属性是区分类的标准,属性具有继承性,一个属性必须具有相应的属性值,在概 念层上没有属性值。例如,概念“疾病”有属性“病因”。 ( 4 ) 公理( a x i o m ) 本体中公理是公认的事实( 或推理规则) ,是用来知识推理的。 ( 5 ) 函数( f u n c t i o n ) 函数是关系的特定表达形式。函数中规定的映射关系,可以使得推理从一个 概念指向另一个概念。 ( 6 ) 概念的个体实例( i n d i v i d u li n s t a n c eo f e o n c e p t ) 概念的个体实例是逻辑层次最低的概念,它的外延只有自身,因此称为概念 的个体实例,也简称实例。实例是本体中的最小对象。它具有原子性,即不可再 华中科技大学同济医学院硕士学位论文 分性。如果某个实例还可以再进行划分,那么它就是一个类,而不是实例。实例 可以代入函数中去进行运算,而函数的运算结果一定是另外一些实例或者是类。 类包含实例,而每个实例都有不属于其它实例的属性,这是区分不同实例的唯一 标识。 1 1 3 本体的类型 为了对本体进行有效的分类,c u a r i n o 提出以详细程度和领域依赖度两个维 度作为对o n t o l o g y 划分的基础。详细程度是相对的、较模糊的一个概念,指描述 或刻画建模对象的程度。详细程度高的称作参考( r e f e r e n c e ) 本体,详细程度低 的称为共享( s h a r e ) 本体。依照领域依赖程度,可以分为顶级( t o pl e v e l ) 、领域 ( d o m a i n ) 、任务( t a s k ) 和应用( a p p l i c a t i o n ) 本体四类嘲。 顶级本体( 上层本体或通用本体) 描述的是最普通的概念及概念之间的关系, 如空间、时间、事件、行为等等,这些观念不依赖于特定的问题或学科领域,与 具体的应用无关,其他种类的本体都是该类本体的特例。 领域本体描述的是特定领域中的概念及概念之间的关系,是专业性的本体。 在这类本体中被表示的知识是针对特定学科领域的。这类本体描述的词表,关系 到某一学科领域,如医药卫生、化学元素周期表等。它们提供了关于某个学科领 域中概念的词表以及概念之间的关系,或者该学科领域的重要理论。例如,g e n e o n t o l o g y 是关于基因和基因产物的本体。 任务本体描述的是特定任务或行为中的概念及概念之间的关系。任务本体提 供了用于解决与特定任务相关联问题的术语集合。因此,任务本体与解决问题的 方法相关。在问题判断过程中,任务本体的术语必然包括“观测( o b s e r v a t i o n ) ”、 “假设( h y p o t h e s i s ) ”和“目标( g o a l ) ”等。 应用本体描述的是依赖于特定领域和任务的概念及概念之间的关系。一个应 用本体与用来描述专业领域的概念相关联,这些概念是解决问题的方法体系的组 成部分。它们明确表示出在特定的解决问题的方法体系中,专业领域的概念所起 的作用。 虽然上述分类在知识工程领域中得到了普遍认同,但还是存在其它的分类方 案。例如,m i z o g u c h i 等人建议按照本体的内容划分类别,认为本体应分为三类: 领域本体、通用本体和任务本体 7 1 。 p e r e z 和b e n j a m i n s 在研究了多种本体分类方案的基础上,归纳出1 0 种类型, 分别是:知识表示本体( k n o w l e d g e r e p r e s e n t a t i o no n t o l o g y ) 、通用本体、项级 本体、核心本体( 或称元本体m e t a c o r eo n t o l o g y ) 、领域本体、语言本体( l a n g u a g e o n t o l o g y ) 、任务本体、领域一任务本体( d o m a i n - t a s ko n t o l o g y ) 、方法本体( m e t h o d 华中科技大学同济医学院 硕士学位论文 o n t o l o g y ) 和应用本体。这种划分方法是对c k l a r i n o 分类方法的扩充和细化,但 这十类本体之间的界限比较模糊,彼此又有交叉,层次不够清晰嘲。 1 1 4 本体的作用 本体是以机器可以理解的形式化语言来描述知识,目的是从根本上解决人与 机器、机器与机器之间的信息、知识交流障碍,因此,本体可以作为一座架在“语 义鸿沟( s e m a n t i cg a p ) ”上的桥梁,这座桥梁的一端是实际的语法表达形式,而 另一端是这种表达的抽象概念模型。构建一个本体可以解决以下问题【3 】: ( 1 ) 在用户间或软件代理间达成对于信息组织结构的共同理解和认识。假 如有若干包含医药信息或提供医药电子商务服务的w e b 站点,这些w e b 站点共 享相同的底层本体,那么计算机代理就可以准确、没有歧义的提取和集成这些来 自不同站点的信息,代理软件可以利用这些集成的信息来回答用户的检索式或向 用户提供数据。 ( 2 ) 可以复用专业领域知识。要构建一个大型的本体,可以将几个现成的 本体进行集成。 ( 3 ) 使专业领域内的假设变得更加明确。对于必须理解该领域术语的新用 户很有帮助。 ( 4 ) 从操作性知识中分离出领域知识。将专业领域的知识从知识管理的环 境中剥离出来。 ( 5 ) 分析专业领域的知识。在进行复用现有本体和扩展这些本体的尝试中, 对术语规范地分析是极有价值的。 1 1 5 本体在图书情报领域的应用 由于本体的概念模型本质,它可以应用于存在有信息、知识交流的各种领域, 如:医学、电子商务、房地产、金融财务、制造业和工商业的供应链、电子教学、 图书馆等。具体到图书情报界的信息检索和知识组织领域,可以通过本体论的构 建,在准确定义词汇概念的基础上,增加词语间关系的关联,建成基于本体论的 检索平台,就可以提高信息的查全查准率。本体为信息检索系统提供了资源描述 和形成查询所必需的元语。以本体技术为核心建立领域语义模型,为信息源提供 语义标注信息,使系统在对领域内的概念、概念之间的联系及基本公理知识有统 一认识的基础上进行信息检索,这更符合人类的思维习惯,可以克服传统检索方 法造成的信息冗余或信息丢失的缺点,从而能够显著地提高系统的联想能力和精 确性,快速、高效、精确地检索出用户所需的有价值的信息。如今本体已逐渐成 为一种智能信息检索系统的知识表示方式,是信息检索系统的核心组成部分。其 4 华中科技大学同济医学院硕士学位论文 主要有以下作用【9 】: ( 1 ) 帮助用户构造和优化查询。用户在构造查询时,本体可以支持用户的 行为,在确定检索范围和词汇选择方面提供可视化的工具,使模糊的信息需求在 检索的初始阶段得以显性化和清晰化。 ( 2 ) 提高词法分析和句法分析的准确性。在词法分析和句法分析过程中, 基于统计或基于规则的方法而产生的分析歧异,如果辅以本体的帮助,有助于语 义消歧。本体所提供的领域知识,对识别分析对象的语义类型也起到了相当大的 作用。 ( 3 ) 在一定程度上实现语义检索。本体作为共享概念模型的形式化规范, 对于领域中的词汇的语义以及词汇间的关系进行明确的定义,所以以本体为基础 而构造的知识库对语义控制的能力更强大。 ( 4 ) 加强对信息源的预处理。使用基于本体构建的语义信息模型对信息进 行注释,系统可预先从信息源中提取相互关联的概念,构成语义片断,并识别其 所属的知识领域,使后续的自然语言处理能相对简单,而且处理结果的准确性更 高。 此外,本体还能支持跨语种检索,进行机器翻译等应用。 1 2 研究目的及创新之处 目前我国本体的研究和应用还处于起步阶段,现有文献多是编译介绍国外的 研究成果。而在试验基础上提出领域本体构建流程的研究更少。分类法和主题法 是图书情报学所特有的知识组织体系,要寻求发展和创新,不能总是停留在原有 水平和层次上,应该引进新的知识组织手段和新的i t 技术,只有这样才会为图 书情报领域注入新鲜血液。本体是现阶段最为先进的知识表示和知识组织的手 段,凭借这种优势可以更好的进行知识组织和知识挖掘,这对图书情报领域在知 识管理中发挥作用十分重要,同时也能提高图书情报人员向用户提供知识服务的 能力,可以满足当前从文献信息服务走向知识服务的需要。本课题研究意在将本 体的概念引入到医学图书情报领域的应用层面,并了解其对于传统检索的改善效 果。其创新之处体现在: ( 1 ) 利用在本体构建中较为常用的构建方法和工具,在国内首次进行了医 学领域内心瓣膜疾病本体的构建试验。通过建立概念、概念之间的继承、约束、 实例关系表达了心瓣膜疾病的领域知识。建立过程中验证了本体构建工具及方法 的适用性,弄清了构建领域本体的流程,为本体理论在医学领域的应用提供了范 例,其建立方式对我国医学信息资源的开发具有重要的意义。 ( 2 ) 初步实现利用p a l 语言对该本体的检索功能,根据建立的心瓣膜疾病 5 华中科技大学同济医学院硕士学位论文 本体之间的关系,实现相关查询功能,表明基于本体的检索不但能改善传统检索 在查全率和查准率方面存在的一些问题,更能提高检索精度,实现智能化检索。 1 3 研究方法 本论文研究中采用了以下方法: ( 1 ) 文献调研法:阅读和参考了百余篇( 部) 相关论文、专著、工具书、 词典和专业词表。 ( 2 ) 统计分析法:对文献数据库中的近1 6 0 0 篇文献,按照其在不同分支学 科文献中出现的频率及其在所有文献记录中出现的频率进行了词频统计。 ( 3 ) 语义分析法,参照专业辞典、专业叙词表和专业教科书及相关本体对 相关心瓣膜疾病本体概念进行了语义分析。 ( 4 ) 本体构建法:在p r o t f 9 6 基础上,对心瓣膜疾病本体模型的构建采用了 较为通用的构建方法,并用p a l 语言对部分概念和关系进行了表示。 1 4 文章的组织结构 本文共分六章。第l 章阐述了本课题提出的背景、研究意义和研究方法;第 2 章介绍了国内外关于本体的研究进展,并就本体技术在生物领域的应用作了介 绍;第3 章分析了本体的理论基础及关于本体的描述语言、构建工具和构建方法 等内容;第4 章以心瓣膜疾病为例,进行实验性医学本体的概念、关系的分析与 构建;第5 章利用p a l 语言对己构建本体尝试推理查询;第6 章对研究工作进 行了总结和讨论,对未来本体研究方向作出了展望。 华中科技大学同济医学院硕士学位论文 2 本体相关研究 2 1 国外主要研究现状 2 1 1 w 3 c 的研究 2 0 世纪8 0 年代末至9 0 年代初,哲学领域的概念“o n t o l o g y ”被人工智能领 域所借鉴,本体的建模方法也初步确立。近年来,国外对本体建模作了大量研究 并将其运用于知识工程领域。 w 3 c 是w o r l dw i d ew e bc o n s o r t i u m 的简称,是一个国际化的联盟,是在 “互联网之父”t i mb e m e r s - l e e 倡导下成立的针对万维网的国际标准制定组织, 也是全球互联网界最具有影响力的标准组织【1 们。w 3 c 致力于本体的研究始于 2 0 0 1 年,几乎和对语义网的研究同步开始。主持本体研究的是w e b o n t o l o g y 工 作组,工作组一开始就将自己的研究定位于为语义网的构建打基础。 b e m e r s - l e e 为未来的w e b 发展提出了基于语义的体系结构。该体系从底 层到顶层分别是:u n i c o d e 与u r i ( 第一层) 、x m l + n s + x m ls c h e m a ( 第二 层,表示数据的内容和结构) 、r d f ( s ) ( 第三层,用于描述w e b 上的资源及其 类型) 、o n t o l o g yv o c a b u l a r y ( 第四层,用于描述各种资源之间的联系) 、l o g i c 、 p r o o f 和t r u s t ( 第五至七层,在以上四层的基础上进行逻辑推理操作) 【l ”。从这 个体系可以看出,在语义网的框架中,本体位于底层的u n i c o d e 字符集和x m l 语法结构之上,位于逻辑层和验证层之下。它既是基于x m l 的,同时又为语义 网络的逻辑推理和验证功能提供基础结构。可以说本体是语义网结构中的关键部 分,是解决语义层次上w e b 信息共享和交换的基础。 w e b - o n t o l o g y 工作组的主要贡献是从2 0 0 2 年1 月起开始制订o w l ( o n t o l o g yw e bl a n g u a g e ,又称w e bo n t o l o g yl a n g u a g e ) 1 1 2 j 标准规范。2 0 0 3 年8 月1 8 日,o w l 成为w 3 c 的候选推荐标准,2 0 0 4 年2 月1 0 日,o w l 己成 为了w 3 c 的( 正式) 推荐标准。o w l 的设计目的是要让软件代替人工来进行 信息内容的加工。o w l 促进了由x m l ,r d f ( s ) 支持的w e b 内容在机器间 的互操作性。o w l 拥有三种表达能力递增的子语言:o w ll i t e 、o w ld l 和 o w lf u l l c l 3 1 。 o w l 能够被用于清晰地表达词汇表中词条( t e r m ) 的含义以及这些词条之 间的关系,而这种对词条和它们之间关系的表达形式就称作本体。相对于x m l , r d f 和r d f ( s ) 来讲,o w l 拥有更多的机制来表达语义,因而它超越了x m l 、 7 华中科技大学同济医学院硕士学位论文 r d f 和r d f ( s ) 仅能够表达网上机器可读文档内容的能力。 2 1 2a i f b 的研究 德国卡尔斯鲁厄大学( u n i v e r s i t yo fk a r l s r u h e ) 的r u d is m d e r ,a l e x a n d e r m a e c h e ,和以他们为首的应用情报学和形式化描述方法研究所( a b i n s t i t u t eo f a p p l i e di n f o r m a t i c sa n df o r m a ld e s c r i p t i o n m e t h o d s ) 对本体基础理论( 如o n t o l o g y l e a r n i n g ) 和本体的数学表达进行了深层次的研究【1 4 】。a i f b 研究所目前从事的 研究重点是构建基于本体的知识门户和语义门户。其课题范围涉及知识管理、知 识表示与推理、语义网、本体工程、万维网系统、知识门户、数据和文本挖掘、 代理系统、语义标引、机器学习、形式概念分析、办公信息系统、商业过程分析 等十余个领域。承担这些项且的研究小组主要是知识管理研究组、商务信息和通 讯系统研究组和复杂性管理研究组 1 3 1 。 a i f b 目前进行的项目约6 0 项【l ”,其代表项目有o n t o w e b 和 o n - t o k n o w l e d g e ,其中,o n t o w e b 是2 0 0 1 - 2 0 0 4 年的一个项目,主要是针对知识 管理和电子商务实现基于本体的信息交换;o n - t o k n o w l e d g e 是较早的 ( 1 9 9 9 2 0 0 2 年) 个项目,通过进化本体来进行知识管理。其主要成果是提出了 一种本体描述语言o i l 【l ”。另外,a i f b 还开发了许多本体相关工具,如: k a o n ,w o n d e r w e b ,o n t o b r o k e r ,o i l e d i t 和s e s a m e 等。 o n t o w e bn e t w o r k 在基于本体技术的知识共享领域的研究包括 z t l : 推动语义网的研究成果从学术到产业的转化。 展示和协调与本体相关各领域的研究,如:w e b 标记语言、知识查询、知识 工程、知识再现、信息系统和数据综合、信息回归、语言工程、数字化图书 馆、软件代理和可读性学习。 加强欧洲本体研究领域在d a m l 项目方面与斯坦福大学知识系统实验室的 广泛协作。 与w 3 c 的元数据标准语言和推荐标准接轨。 2 1 3k s l 的研究 美国斯坦福大学的知识系统实验室( k n o w l e d g es y s t e m sl a b o r a t o r y ,以下 简称k s l ) 【1 8 】无论是在本体建模工具领域还是在本体应用层面的研究方面都站 在了知识工程领域的最前沿,当前k s l 正在进行的项目有8 项【l 川。其代表项目 是d a m lp r o i e c t ( d a r p a a g e n tm a r k u pl a n g u a g ep r o j e c t ) ,该项目研究重点是 d a m l 语言研究,d a m l 网络服务研究,d a m l 工具研究和基于d a m l 的查询 应答研究【2 0 】。其主要成果是创建了一种本体描述语言d a a 仉( 2 ”,该语言允 华中科技大学同济医学院硕士学位论文 许用户在其数据上标记语义信息,从而使计算机能对所标注的信息资源进行“理 解”。该实验室的o n t o l i n g u as e r v e r 是第一个本体构建工具,这个工具允许分散 团体通过w e b 发表、浏览、创立和编辑存储在o n t o l i n g u as e r v e r 上的本体,从而 辅助了协作开发。 目前,k s l 的研究主题主要有以下三大方面【1 3 1 : ( 1 ) 知识共享技术( k n o w l e d g es h a r i n gt e c h n o l o g i e s ) ,包括: 本体的合并及诊断( o n t o l o g ym e r g i n ga n dd i a g n o s i s ) 语义网技术 可复用知识的海量存储库( l a r g e s c a l er e p o s i t o r i e so f r e u s a b l ek n o w l e d g e ) 增强的设计对象复用技术( t e c h n o l o g yf o re n h a n c e dr e u s eo fd e s i g n o b j e c t s ) ( 2 ) 物理系统的建模与分析( m o d e l m ga n da n a l y s i so f p l a y s i c a ls y s t e m s ) , 包括: 异构系统的建模、分析和控制( m o 龇g ,a n a l y s i sa n dc o n t r o lo fh y b r i d s y s t e m s ) 基于建模支持的分布式协作设计( m o d e l b a s e ds u p p o r to fd i s t r i b u t e d c o l l a b o r a t i v ed e s i g n ) 机械设计的逻辑表示( l o g i c a lr e p r e s e n t a t i o no fm e c h a n i c a ld e s i g n ) ( 3 ) 应用性智能系统( a d a p t i v ei n t e l l i g e n ts y s t e m s ) ,包括: 虚拟剧院项目( v i r t u a lt h e a t e rp r o j e c t ) 医院自动护理项目( g u a r d i a n ) 可自主的移动代理项目( a ib o t s ) 在上述研究项目中,知识共享技术居于研究的首位。而在知识共享技术的研 究中,有关本体和以本体为基础的语义网技术的研究又处于首位。由此可见k s l 对本体研究的重视程度。 2 2 国内主要研究现状 与国外相比,国内无论是在理论研究、实证研究,还是在技术手段的实现和 应用方面都相对落后,与国外高水平的研究相比存在很大差距。国内对于本体的 研究大约始于2 0 世纪9 0 年代初【6 j 。 笔者的检索记录可以在一定程度上反映这一状况。以“本体”或“o n t o l o g y ” 一词为检索式检索“中国学术期刊全文数据库”( 1 9 9 4 2 0 0 6 年) 中的“教育与社 会科学”( 图书情报类的期刊属于这个专辑) 和“电子技术及信息科学”两个专 辑( 2 0 0 6 年3 月1 3 日检索) ,得到8 7 5 篇文献,排除哲学、文学方面的文献后, 华中科技大学同济医学院硕士学位论文 得到7 9 7 篇相关文献。其中国内第一篇关于本体的论文是计算机学报1 9 9 5 年第3 期刊载的中国科学院自动化研究所人工智能实验室王珏等人撰写的“关于 知识表示的讨论”;国内第一篇将本体引入图书情报领域的论文是图书情报工 作1 9 9 5 年第3 期刊载的武汉大学图书情报学院靳娟娟写的“情报学哲学基础 研究”;国内第一篇关于本体应用研究的论文是计算机研究与发展1 9 9 6 年1 1 期刊载的浙江大学人工智能研究所高济等人撰写的“基于表示本体论的智能系统 开发”。而有关本体研究的文献量从2 0 0 2 年呈高速增长态势。 目前,国内进行本体研究的主要有三支科研力量。一是中国科学院自动化研 究所的实验室,二是浙江大学人工智能研究所,三是哈尔滨工业大学计算机科学 与工程系,此外北京大学计算机系,视觉与听觉处理国家重点实验室,北京理工 大学计算机科学工程系人工智能研究所、同济大学c i m s 中心等单位也在进行有 关本体的研究【1 3 j 。 下面就几个实力单位的研究状况予以简单介绍。 浙江大学人工智能研究所创建于1 9 8 1 年,在2 0 多年从事计算机科学、技术 与工程的研究过程中,形成了一支拥有国际知名的学术带头人、具有创新精神的 学科队伍,其代表人物为高济。研究所的主要研究领域为人工智能领域:包括知 识发现与知识工程、认知科学与形象思维、智能美术与智能设计、智能机器人、 智能决策与控制、智能信息系统、分布式人工智能与a g e n t 技术、计算机语言学 与计算逻辑学等田l 。高济在1 9 9 6 年发表的论文中提到已经用o m s i 方法开发了 一个中等规模的知识库系统一输电网规划专家系统t r a n s p e s ,以及若干试 验性系统【2 3 1 。早期的知识表示和专家系统方面的成果,使得浙江大学无论在新技 术应用还是在本体研究中都处在国内领先地位。 中国科学院自1 9 9 8 年就开始从事本体领域的课题研究。其中,数学与系统 科学研究院,数学研究所、知识处理与人机交互实验室,管理、决策与信息系统 开放实验室一直走在研究的最前沿。 从1 9 9 9 年至今,哈工大计算机科学与工程系的研究人员一直致力于企业本 体论系统的构建和相关理论的研究。其中王念滨博士等人的研究是国内极少数面 向企业需求进行本体构建的实用性研究叫。在国内各大中型企业纷纷逐步走向集 团化、跨国经营的模式,且逐渐实现生产、管理的全部数控( c 讧s ) 模式的过 程中,这一研究具有重要的实践价值和指导意义。 2 3 本体在领域中的应用 目前关于本体的理论研究日趋成熟,而本体的应用则相对滞后。本体理论和 技术已初步应用于知识工程、信息系统、企业管理、电子工程、化学工程、远程 华中科技大学同济医学院硕士学位论文 教育、电子商务等领域。 2 3 1本体理论在农业及地理科学中的应用 农业本体服务项目( a g r i c u l t u r a lo n t o l o g ys e r v i c e ,以下简称a o s ) 是由 联合国粮农组织( f a o ) 国际农业研究信息管理中心负责的项目【2 5 】。 f a o 早就在研究农业本体方面有实际行动。他们把本体定义成一个包含术 语、定义以及术语规范说明的体系,认为本体是一个强有力的主题词表,能够提 供主题词表中内在的基础关系,其定义能够表示出更多、更规范的概念问特殊关 系。本体被设计成服务于特定领域词汇的中央核心,对该领域的知识进行编码, 实现标准化和结构化,使农业学科内的知识交流更为通畅。目前,由f a o 维护 的农业本体服务器( a g r i c u l t u r a lo n t o l o g ys e r v e r ) ,其作用如下【1 3 】: 允许定义和描述农业领域以及相关学科的知识。 在领域内交流,不会产生因语义模糊而带来的障碍。 能够复用农业领域的知识。 在不同的用户团体和软件平台上共享结构化的农业信息及其含义。 为建立其它特定( 相关) 领域的本体提供可以借鉴的经验。 a o s 为其它相关领域本体的开发和维护提供了一种类似于“积木”的原材 料。它包含着核心的术语词汇、定义以及术语与术语间的核心关系。a o s 提供 农业领域的所有术语和概念,其知识领域的学科子集包含林学、渔业、工厂生物 学、可持续发展的农业、农业经济学和营养学等。a o s 希望每个学科都会使用 自己构建的参考工具构建本学科内的领域本体。这些学科的领域本体一旦构建完 成,被引入知识库,能够被其它的知识库复用和改进。长此以往,形成了本体在 不断维护完善的过程中逐渐成为完备的良性发展过程。 地理空间科学的本体项目有著名的o n t o g e o 项目。o n t o g e o 项耳由希腊的雅 典国立理工大学( n a t i o n a lt e c h n i c a lu n i v e r s i t yo fa t h e n s ) 地理空间知识本体 研究小组( g e o s p a t i a lo n t o l o g yr e s e a r c hg r o u p ) 承担睇6 j 。 o n t o g e o 研究小组的研究领域属于地理信息科学。本体建模思想是该项目研 究的指导方针。研究小组目前的研究重点在于:地理学的概念理论、地理学分类、 概念映射( c o n c e p tm a p p i n g ) 、本体的模糊性( o n t o l o g i c a lv a g u e n e s s ) 、时空概 念的建模( s p a t i o - t e m p o m lm o d e l i n g

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论