(计算机应用技术专业论文)具有本体特征的档案管理系统设计与实现.pdf_第1页
(计算机应用技术专业论文)具有本体特征的档案管理系统设计与实现.pdf_第2页
(计算机应用技术专业论文)具有本体特征的档案管理系统设计与实现.pdf_第3页
(计算机应用技术专业论文)具有本体特征的档案管理系统设计与实现.pdf_第4页
(计算机应用技术专业论文)具有本体特征的档案管理系统设计与实现.pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

具有本体特征的档案管理系统设计与实现中文摘要 具有本体特征的档案管理系统设计与实现 中文摘要 如今档案已经不再仅仅以单一的纸质形式存在,以磁、电、光等介质为主要信 息载体的文件应运而生,产生了大量档案数据。与此同时,我校办学规模的迅速扩 大和教育体制的不断改革,学校档案管理工作量大幅度增加,其复杂性也越来越大, 传统手工档案管理已无法适应对档案的存储、查询处理。建立学校档案管理信息系 统,实现档案管理电子化是学校档案管理工作的方向,将计算机技术和互联网技术 应用到档案管理工作已成为档案管理的一次实质性的飞跃和发展。 本文结合我校档案管理工作实际情况,在对国内外档案管理现状进行介绍、分 析、比对后,设计并实现了具有本体特征的档案管理系统。文章重点对本体的构建 以及本体在档案检索领域中的应用进行分析研究。 本文的主要工作如下: ( 1 ) 对本体的相关理论进行研究,包括本体的定义、分类、构建方法、构建技 术难点以及构建本体的规则等,同时给出了档案管理的相关业务; ( 2 ) 在对档案领域本体的构建步骤进行分析、研究的基础上,提出了基于 p r o t 6 醇的档案检索领域本体构建,并给出具体过程; ( 3 ) 以u 】l 为工具对档案管理系统的业务流程进行详细分析,给出了系统主 要功能模块、工作流程和系统架构; ( 4 ) 研究了j e m 在本体中的应用,并将本体应用于档案管理系统的检索模块, 提出了含有本体的档案检索模型。 关键字:档案管理;本体;本体构建;u m l ;数据库; 作者:张艳 指导教师:孙涌 a b s t r a c 了d e s i g i l 柚di i n p l e m 朗t a t i o no ft i l ef i l em 柚a g e i m n ts y s t e mo no 巳塑l o g y 塑塑里塑 d e s i g na n di m p l e m e n t a t i o n o ft h ef i l em a n a g e m e n t s y s t e mo no n t o l o g yf e a t u r e a b s t r a c t f i l e sa r en 0l o n g e rj u s ts t o r e di nas i n g l ep a p e rf o 珊m a n yf i l e su s i n gm a g n e t i s m , e l e c t r i c i t ml i g h ta 1 1 d 0 t 1 1 e rm e d i a 雒t 1 1 em a i l lc 删e r so fi n f o n n a t i o nc a m ei n t ob e i l l g , w h i c hp r o d u c e sal a r g en u m b e f0 ff i l e sd a t a h lt l l em e a n w h i l e ,w i t l lm er a p i d d e v e l o p m e n to fo u rs c h 0 0 1a i l dt h ec o n t i n u o u sr e f b 锄so ft l l ee d u c a t i o ns y s t e m ,t 1 1 ef i l e m 觚a g e m e n tb e c o m e s m o r e 勰dm o r e 础o u s 觚dc o m p l e x ,m a l 【i n gm ei n f b r m a t i o nf i l e s 黟o wr a p i d l y ,t l l e f e f b r e ,t l l e 仃a d i t i o n a lm a 肌a lm a 瑚曙e m e mh 嬲b e e nu n a b l et 0m e e tm e n e e do ff i l es t o r a g e 觚dq u e 叫咖s a c t i o n i ti s t l l ed i r e c 惦o no ft l l ef i l em a n a g e m e mt o e s 讪1 1 i s hi n f 0 i m 撕o nm a m g e m e n ts y s t e i n si ns c h 0 0 l s i ta l s oh 勰b e c o m eas u b s t a n t i v e l e a p 勰daf 如td e v e l o p m e n tt 0a p p l yc o i n p u t e r 妣l l n o l o g y 锄dh l t 锄c t 妣l l l l o l o g yt 0n 圮 f i l em 绷忸g 锄e n t 1 1 1 i sa n i c l ed r a w sap a r a l l e li nt l l ea c t u a ls i t u a n m es t a m so fm ef i l e m 蝴g e m e n tb e t w e e n o i l rs c h o o l 孤do t l l e r sa th o m e 锄da b r o a d ,d e s i g l l s 觚dr e a l i z a t i o n o ft l l eo n t o l o g yf e a t i l r e si l laf l l em 觚a g e m e n ts y s t e m ,n _ l i sp a p e ra l s of o c u s e so no n t o l o g y c o n s 们j c t i o n 锄dt l l er e s e a r c ho nt 1 1 ea p i p l i c a t i o no fo n t o l o g yi nt l l ef i e l do ff i l e 脯i e v a l t h em a i nw o r ki s 雒f o l l o w s : ( 1 ) t h e 枷c l eh a v eb e e ns t i l d i 酣t l l eo n t o l o 酉c a lt h e o r y ,i l l c l u d i n gt h ed e f l l l i t i o n ,m e c l a s s i f i c a t i o l l t i l eo n t o l o g yc 0 i l s 们l c t i o nm e t h o d s ,t e c h l l i c a ld i f f i c u l t i e si n0 n t o l o g y c 0 i 塔虮l c t i o n ,t l l em l e sf b ro n t o l o g yc o n s 仇l c t i o n ,锄dt l l es e r v i c e s 坨l a t e dt l l ef i l e m 如a g e m e n t ( 2 ) b 雒酣o nt l l e 删y s i s 觚dr e s e a r c ho ft l l es t 印so ft l l eo n t o l o g yc o n s 仃u c t i o n ,a n d g i v i n gt l l ed 喊l e dp f o c e s sb 硒e do np r 0 惦9 6o n t o l o g yc o n s t n l c t i o ni nt l l ef i e l d o ff i l e r 嘶e v a l ( 3 ) u m l 硒at o o l t o 觚a l y s e st l l eb u s i n e s sp r o c e s so fm em 觚a g e m e ms y s t e m ,t l l e m a i l l 如n 曲o nm o d u l e sa n dw o r kf 1 0 w ,w l l i l es h o w i n gt l l es 咖c t u r eo ft l l es y s 锄 ( 4 ) t h ea p p l i c a t i o no ft h ej e n at 0n l eo n t o l o g y ,m e 印p l i c a t i o no fo n t o l o g yt 0t l l e r e t r i e v a lm o d e lo ff i l em a n a g e m e n ts y s t e m ,t l l ef i l er e t r i e v a lm o d e lc o n t a i l l i n go n t o l o g y k e y w o r d :f i l em a m g e m e n t ,o n t o l o g y ;o n t o l o g yc o i l s 锄c t i o n ;u m l ;d a t a b a s e ; w r i t t e nb y :z h a n gy 觚 s u p e n ,i s e db y :s u ny 0 n g 苏州大学学位论文独创性声明及使用授权的声明 学位论文独创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进 行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含 其他个人或集体已经发表或撰写过的研究成果,也不含为获得苏州大学 或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡 献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律 责任。 研究生签名: 幺壶日期:立姿:坐 学位论文使用授权声明 苏州大学、中国科学技术信息研究所、国家图书馆、清华大学论文 合作部、中国社科院文献信息情报中心有权保留本人所送交学位论文的 复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本 人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文 外,允许论文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分 内容。论文的公布( 包括刊登) 授权苏州大学学位办办理。 研究生签名: 幺生垒日期:之兰:! 竺 导师签名: 具有本体特征的档案管理系统设计与实现第一章绪论 1 1 研究背景 1 1 1 档案管理系统重要性 第一章绪论 档案是国家机关、团体及企事业单位在从事各种社会活动、生产活动过程中, 形成的具有一定价值的材料或实物,是人类共同的精神财富。档案管理是一项重要 工作,这种管理工作繁杂,任务量大,而且各档案馆或档案室的工作重点不同,对 外提供服务也不同。大量的手工操作致使人员编制多,而且效率不高。为了提高档 案管理工作效率、提高档案查找的准确率,加快检索速度,促进档案管理的规范化 和正规化,采纳一套规划严谨、科学、规范的软件系统来进行管理,实现档案管理 的电子化已经在我国的一些档案管理部门展开应用。这对于单位改善管理和降低成 本,提高内部管理的效率和效能至关重要,这是一种大势所趋的选择。 随着计算机网络的进一步发展,信息高速公路的进一步拓宽,数字化的数据、 信息将渗透到我们生活的各个领域,在学校建设数字化档案馆是档案工作发展的必 由之路,也是今后发展的目标。 数字化档案工作的主要内容包括: 1 、数字化档案的收集 数字化档案的收集手段主要通过计算机网络管理来完成。由于校园网建设已经 达到了成熟阶段,学校各部门也均已接通,所以数字化文件归档将是一种很便捷的 方式。只需各部门秘书将形成的电子文件通过校园网再转发一份到档案室即可。 2 、数字化档案的保管 档案存放方式由档案柜架变为用数字存储器以及光盘、磁盘存储,极小空间可 以存放大量的数字文件。它主要包括数字档案设备安全和信息安全两方面。设备安 全应当在设备制造、系统安装和应用软件配置时考虑,主要是抵御自然灾害、突发 事件等。而信息安全则需要有一系列措施给予保证。保证数字档案的可读性和可利 用性,对设备更新情况进行跟踪,在出现不兼容或不可读取等问题之前就应将旧载 体上的数字文件转换到新载体上。同时,防止信息丢失、被非法更改等,尤其是在 网络环境中,更应注意共享与保密、逻辑性处理与物理存储管理等问题。 第一章绪论具有本体特征的档案管理系统设计与实现 3 、数字化档案的利用 校园网的成熟运用,为数字化档案馆提供了极好的网络环境,也为开展档案信 息服务工作提供了良好的条件。通过校园网开展电子检索服务:在各校之间互传、 互换信息;联机建立用户使用文档。 1 1 2 国内外档案管理系统研究现状 l 、国外研究状况 发达国家的档案机构认为档案工作有保管和提供利用两大任务,其中后者是主 要的任务n 3 。这在定义上与我国的按全宗按门类组织管理的档案工作有些差别。因 此,发达国家的档案管理系统也是重要的检索研究与教育的工具,它们已有很完善 的档案管理系统。在它们的官方站点上,用户可以直接查询使用已经公开的数万件 原始文献全文与图片资料以及大量的家谱档案与私人档案。比较著名的几个网站如: 美国国家档案管理局( h t t p :价啊眦a r c h i v e s g o v ) 、加拿大国家档案馆 ( h t t p :价哪w c o l l e c t i o n s c a n a d a g c c a ) 、澳大利亚国家档案馆( h t t p :肌哪w n 龃9 0 v a u ) 、 英国公共档案馆( h t t p :伪哺啊n a t i o n a l a r c i l i v e s 9 0 v u k ) 。这些网络资源一方面打破了 传统的按全宗按门类组织管理的限制,使用户可获得按主题和关键字进行搜索跨全 宗跨门类的图、文、声像等信息,另一方面又使利用电子邮件、数据库交换、数据 库查询、传真等方式获得档案信息成为了现实。 国外档案信息化主要围绕检索。我国的档案系统有各种名称,诸如“计算机辅 助管理系统刀、“文档一体化管理系统”等。他们将档案的计算机管理一般统称为“计 算机检索系统”,其理由是档案应用计算机的主要功能和技术难点都在于检索。他们 将计算机档案检索分为档案信息的存入和取出,强调要按照档案检索的需要进行档 案信息的存储。为此,各档案馆十分注重档案著录标引的质量。他们的著录项目详 细,著录内容精细,著录层次由粗到细分为全宗、分全宗、系列、案卷、文件五个 层次,著录格式一般采用档案机读目录交换格式规范。 由于机读目录数据库普遍采用统一的交换格式,加上检索方法和软件技术成熟, 较好地解决了连网档案信息的共享和互联问题,他们检索的查全率和查准率都比较 高。 为了适应电子文件检索的需要,目前美国正在研究开发新的著录标准“档案编 2 具有本体特征的档案管理系统设计与实现第一章绪论 码著录 ( e n c o d e da r c l l i v e sd e s c r i p t i o n 简称e a d ) ,它是一项采用s g m l 或x m l 语言,描述档案信息内容特征和逻辑结构的著录标准。其优点是有利于解决异构机 读目录的联合检索和数据交换;有利于提高电子文件信息的著录,特别是内容信息 的标引质量;有利于提高标引效率,减轻人工标引劳动,适应档案计算机和网络检 索的发展需要;有利于保持档案信息的自然联系,为档案信息的开发利用和广泛共 享创造有利条件并为档案信息的智能化控制开辟了广阔前景。目前,e a d 已经成为 美国国家研究项目,e a d l o 版已经问世,并投入使用,美国档案界和图书界的专 家正在进一步联合攻关,积极发展e a d 技术盟3 。 2 、国内的研究现状 国内的档案管理与国外相比,差距非常的大。一方面是在档案管理和使用的目 的上,国内主要以按全宗按门类组织管理为主,主要用于企业或部门内部的查询、 借阅使用。另一方面在采用的信息技术上,目前在各行各业中,很大一部分己经根 据档案对象的规模大小和实际应用状况采用了不同的档案管理软件,其中包括独立 的档案管理系统、与信息管理和设计软件紧密结合的配套产品、或者是信息管理软 件自带的档案管理功能。 随着互联网的普及,档案管理出现了新的发展机遇。由于各种数据可以在网络 上高速流动,各种计算机尖端技术也被及时应用到档案管理系统中来,各种网上数 字化档案管理系统如雨后春笋般地被开发并投入运行,所以展望未来,计算机档案 管理的前途是不可限量的。 网络化档案管理是一种先进的管理技术,目前国内大多数机关单位均采用或准 备采用此种方式。使用网络平台进行的档案管理越来越多,主要是由于网络化档案 管理具有以下几个特点: ( 1 ) 节省人工。与传统手工管理档案相比较,人员大大的简化,归档、查询、 目录编著等工作效率得到大大的提高。 ( 2 ) 档案安全备份。与传统的手工翻阅比较,用无纸化档案管理可以将重要文 件的损害降低到最低限度,满足长期保存要求需要,储存条件不高,一般办公室条 件即可。 ( 3 ) 调阅快捷。由于高技术的加入,使得查询的工作量大大降低,查询速度大 3 第一章绪论 具有本体特征的档案管理系统设计与实现 大提高,一份档案的查询时间将以秒计。 ( 4 ) 技术的先进性。由于采用了最新的浏览器服务器结构,所有功能均可通 过标准的浏览器来实现,使软件系统的升级和维护变得轻而易举。而且一旦时机成 熟,可以平滑地通过h l t e m e t 为公众提供文档查询服务。 ( 5 ) 信息的安全性。使用先进的生物识别技术提供完整的技术方案,解决了权 限管理问题,增强了整个系统存储信息的安全级别,而且有包括二次开发,实际操 作服务等丰富的增殖服务方案可供用户选择。 目前,在国内的档案管理系统中,比较先进的有清华紫光档案管理系统臼3 、兰 台档案管理系统h 1 、泰坦档案管理系统睛1 等。以上系统具有如下特点: ( 1 ) 适用于一般企事业单位、政府机关的档案部门和档案管理单位使用。 ( 2 ) 采用标准、成熟、可靠的网络技术与先进的客户机月艮务器( c s ) 及浏览 器朋艮务器( b s ) 体系结构进行开发。 ( 3 ) 文档一体化。这是信息化建设是否成熟的一个标志,具体来说,就是要在 办公自动化系统中实现文书与档案管理的自动化、一体化,即相关文件在公文系统 中流转完成后,可以通过系统自动转移到档案系统中,在档案系统中则可以按照国 家相关的规定完成档案的管理、检索、借阅等一系列工作。 ( 4 ) 权限自定义。用户使用系统的权限可以灵活定义,既可以按照库的使用权 限划分,也可以按照功能和职责的权限进行划分,最大限度地保证系统操作的安全 性。 ( 5 ) 数据接口灵活。提供与企业等大型管理系统的数据接口,将其它系统中的 数据进行归档整理和利用。 1 1 3 档案管理系统发展趋势 档案是学校“记忆 的最重要组成部分,学校“知识 大量地沉淀在档案之中, 美国d e l p l l i 咨询集团的一项调查表明:在组织所获取的知识中,大约4 6 是以文本 和电子文档的形式存在的。所以档案“知识”来源的管理对于档案的发展起着举足 轻重的作用。 检索是档案管理系统中最重要的组成之一,在数字化档案管理的今天,档案信 息检索是社会发展到一定阶段的产物,并随着人类社会信息和科技的发展而不断发 4 具有本体特征的档案管理系统设计与实现第一章绪论 展。从人类社会利用档案信息的历史发展过程来看,档案信息检索大致经历了自然 检索、手工检索、计算机辅助检索和计算机智能检索四个阶段。随着计算机智能技 术的发展,档案信息智能检索就成为档案界不得不关注的一个新课题。所谓“智能 检索 ,就是计算机检索信息时系统进行自动分析,挖掘利用者提出该检索要求的深 层次意图,旨在实现档案信息利用服务的人性化。事实说明,在网络环境和人本化 社会里,传统档案信息检索已经不能快捷方便地满足利用者需求,智能检索成为新 的历史条件下的必然选择。也就是说档案信息的“智能检索是其领域的发展趋势。 1 2 选题意义 对于档案管理系统我们已经作了简单述说,那么接下来我们讨论的是具有本体 特征的档案管理系统的实现意义。目前对于本体论及本体的研究己经成为一个热点 问题,国内外,尤其是起步较早的国外专家和学者在很多方面都取得了很多成绩。 对于它的应用,我们将其归结为如下四类: 第一类,本体与其他学科和技术的关系。强调哲学本体与信息本体的融合,在 本体的分析及构建过程中应当引入哲学本体论。还有在研究本体与面向对象技术之 间的关系时关注的是本体技术与面向对象技术的结合使用。 第二类,将本体自身作为研究对象。主要研究本体的构建、评价、演化、管理 以及本体开发的环境和工具等。本体构建方面,比较著名的通用本体研究包括c y c 项目和c h 嬲d r a s e k 跏等关于任务和问题求解方法本体的研究。前者是美国的微电 子与计算机技术有限公司的研究项目,目标是开发本体,进行常识推理,目前己经 发展成为一个庞大的常识系统,后者则是研究可共享问题的求解方法,与领域无关 的推理方法。比较著名的领域本体研究包括爱丁堡大学的企业项目和多伦多大学的 虚拟企业项目。 第三类,基于本体的信息检索、集成和互操作。在网络应用方面,如门户网站 的建立、语义导航检索、网络信息集成等等。信息组织与检索和语义w 曲方面研究 的著名项目包括基于网络代理搜索本体的本体( ( o n t o ) 2 a g e n t ) 、基于本体的分布 式半结构化信息获取( o n t ob r o k e f ) 和可升级知识集成( s k c ) 。在分类法方面,将 本体看作一种新型的分类标准,如数字图书馆的建立、个性化信息服务、知识表达 和知识管理等方面的应用。在数据挖掘方面,研究本体在数据挖掘中的作用。 5 第一章绪论具有本体特征的档案管理系统设计与实现 第四类,本体驱动的信息系统。各种不同的领域本体的建立和分析,本体应用 于软件的需求分析和表达,借助本体进行领域分析等。 国内关于本体论及其应用的研究整体上处于起步阶段,目前主要集中在知识工 程、信息管理和语义w e b 三个方面,并以本体工程方面的研究为主。比较有名的通 用本体构建研究包括中科院计算技术研究所的大规模知识系统研究、中科院数学研 究所的常识知识库研究、中国农业科学院科技文献信息中心a o s 项目、浙江大学人 工智能研究所基于本体论的产品配置研究和哈工大计算机科学与工程系的研究人员 在企业本体论系统的构建和相关理论方面的研究。 档案信息系统本体是对档案领域应用本体方法分析、建模的结果,即把现实世 界中的档案领域抽象为一组概念及概念之间的关系。档案本体论被用来描述数据和 资源的特征,获取数据的模式,从而为数据的集成和共享提供统一的数据表示。 通过分析我们知道,用本体构建的档案信息概念模型是计算机可以理解的概念 模型,这是词表等体系所不具备的能力。通常我们使用主题词、关键词等来标引揭 示档案内容。这样的标引方案不够深入和细致,而且计算机对档案的内容仍然不能 透彻理解。因此,很难指望在基础上人们可以通过计算机检索查询到我们想要的档 案内容。我们使用档案元数据来组织和共享档案,元数据按照一定标准即档案元数 据标准来组织。这对于档案的规范和共享有一定帮助,但对档案的内容及档案之间 的相互关系则提示不够,特别是元数据体系基本上不具备概念推理能力,不能提供 档案检索和共享所需的知识支持。档案信息本体可以改善这种缺陷。我们认为档案 信息本体的优势就在于可以构建共享的档案信息概念模型;可以消除概念术语的歧 义性;可以构建档案信息知识库支撑;可以为档案信息的智能检索提供有效支持。 档案信息本体的这些优势及其在档案信息管理中的作用,可以在档案信息的检索问 题中得到很好的说明。 目前,众多软件厂商均推出自己的电子档案管理系统软件,并赢得了市场的认 同。然而,将当前档案管理系统应用于我们学校则存在以下几个方面的问题: l 、价格昂贵 动辄几万元的价格对于不是专业档案馆的学校档案室来说显得难以接受。 2 、技术复杂、安装维护困难 6 具有本体特征的档案管理系统设计与实现第一章绪论 目前常见的档案管理系统的安装配置与系统管理都需要有较高的专业知识,其 系统脆弱的安全性也难以令人信服,用户遇到问题很难自行解决,增加了对开发商 的信赖性。 3 、片面追求大而全一 某些软件厂商为了提高软件的价格,采用了“以大充好 办法,也就是不顾及 客户的实际需求而本着多模块也就高价格的“策略。但是实际工作中,学校的档案 室在应用中只需要几个常用的模块。还有一些厂商限于自身知识体系的局限或市场 定位的需要,在其开发的档案管理软件中,档案部门迫切需要的许多功能并不存在。 更有一些厂商在推销产品时误导用户,使其错误地认为“有些功能暂时可能用不到, 日后迟早会用到,并以“买的模块越多价格越优惠 来误导用户。我们知道软件产 品是有生存周期的,一个软件购买时是先进的,三五年后不可能还具有显著的先进 性。而档案部门信息化建设的投入是非常有限的。 所以,在目前的实际运用中还鲜见一种价格便宜、性能稳定、安装维护简单、 切实适合学校档案室需要的、小巧灵活的档案管理软件。针对以上分析为解决学校 档案室所面临的这一窘境,决定根据实际应用需求,定制有针对性的电子档案管理 软件。 1 3 本文主要研究内容 本文的主要内容是开发具有本体特征的档案管理系统,系统研究涉及到以下几 个方面: l 、结合我校目前档案管理的实际情况,在对档案管理业务进行分析的基础上, 以u m l 为工具给出系统需求分析,同时对档案管理系统的各个功能模块及其工作 流程进行描述,给出了系统的总体架构。 2 、在对档案领域相关概念及结构分析的基础上,提出了适用于档案领域本体结 构,给出其本体构建流程并实现。 3 、将本体应用于档案管理系统的检索模块,提出了含有本体的档案检索模型并 实现。 4 、档案管理系统能为用户提供充足的信息和快捷的查询功能。本文对于档案管 理系统中的档案检索部分的实验结果进行分析,比较出用户输入逻辑表达式和输入 7 第一章绪论具有本体特征的档案管理系统设计与实现 使用案卷编号本体扩展后的逻辑表达式两种方法的特点。得出引入本体后用户检索 档案管理系统的查全率和查准率得到提高的结论。 1 4 论文组织 本文共分为六章,每一章的具体内容如下: 第一章为绪论部分。本章简述了档案管理系统的重要性,在分析国内外档案管 理现状的基础上,给出了今后的发展趋势。然后介绍了本体在档案检索领域的研究 意义,在此基础上提出了本课题的意义及主要研究内容,最后给出了本文的组织结 构。 第二章为具有本体特征的档案管理系统相关技术介绍。本章首先介绍本体的定 义、分类及主要应用,然后介绍了本体的构建方法、技术难点以及构建本体的规则, 这些都为下文的研究、设计提供了充分的理论基础和技术支持。 第三章为基于p r o t 6 薛的档案检索领域本体构建。本章首先介绍了建模工具 p r o t 6 酌,然后分析了档案检索领域的主要概念,最后详细描述了构建档案检索领域 本体的具体过程。 第四章为具有本体特征档案管理系统分析与设计。本章首先描述了档案管理系 统的需求,给出了系统的工作模式与系统架构,设计基于本体的档案检索体系结构, 然后介绍了基于u m l 的档案管理系统的分析,最后给出了j e n a 在本体检索中的应 用。 第五章为系统实现与实验结果分析。本章首先详细介绍了具有本体特征的档案 管理系统的具体实现,然后给出了系统主要功能模块实现界面及流程,最后给出系 统测试及分析结果。 第六章为总结和展望。本章对本文所做的工作与贡献进行了总结,并且指出了 进一步完善该系统需要解决的若干问题以及今后的发展方向。 具有本体特征的档案管理系统设计与实现第二章具有本体特征的档案管理系统相关技术 第二章具有本体特征的档案管理系统相关技术 2 1 本体概述 2 1 1 本体定义 本体( o n t 0 1 0 9 y ) 叫卵最早是一个哲学上的概念,从哲学的范畴来说,本体是客观 存在的一个系统的解释或说明,关心的是客观现实的抽象本质。在人工智能界i 最 早给出本体定义的是n e c h e s 等人,他们将本体定义为“给出构成相关领域词汇的基 本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义 。 1 9 9 3 年,g l ? u b e r 给出了本体的一个最为流行的定义,即“本体是概念模型的 明确的规范说明 嘲。后来,b o 璐t 在此基础上,给出了本体的另外一种定义:“本 体是共享概念模型的形式化规范说明。s t u d e r 等对上述两个定义进行了深入的研 究,认为本体是共享概念模型的明确的形式化规范说明。这包含4 层含义:概念 模型( c o n c 印t i l a l i z a t i o n ) 、明确( e x p h c i t ) 、形式化( f o 】胁a 1 ) 和共享( s h a r e ) 。“概 念模型 指通过抽象出客观世界中一些现象( p h e n o m e n o n ) 的相关概念而得到的模 型。概念模型所表现的含义独立于具体的环境状态。“明确”指所使用的概念及使用 这些概念的约束都有明确的定义。“形式化指本体是计算机可读的,即能被计算机 处理。“共享指本体中体现的是共同认可的知识,反映的是相关领域中公认的概念 集,即本体针对的是团体而非个体的共识。本体的目标是捕获相关领域的知识,提 供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式 化模式上给出这些词汇术语和词汇间相互关系的明确定义诤1 。 2 1 2 本体分类 本体的类型有很多,根据本体的主题大致可以分为如下几种类型: l 、领域本体( d o m a i l lo n t o l o g y ) 。领域本体包含特定领域的相关知识,它提供 特定领域的概念定义和概念之间的关系,提供该领域中发生的活动及主要理论和基 ,。 本原理等。 2 、通用本体( g e n e r i co n t o l o g y ) 。通用本体要覆盖多个领域。 9 第二章具有本体特征的档案管理系统相关技术具有本体特征的档案管理系统设计与实现 3 、表示本体( r e p r e s e n t a t i o n a io m o l o g y ) 。表示本体提供了用于描述事物的实 体。 4 、任务本体( t a s ko n t o l o g y ) 。任务本体主要涉及动态知识。上述本体主要涉 及静态知识,任务本体包含了特定领域建模的全部知识。任务本体主要研究可共享 的问题求解方法,其实质是从推理和问题求解的角度刻画领域知识。任务本体有助 于解决领域知识不能以与其使用方式无关的形式表示问题,对知识库系统的重用和 组件化的开发十分重要。 除了上面所提到的本体以外,还有语言学本体,语言学本体是关于语言、词汇 等的本体。 为了对本体进行有效的分类,g u 撕n o 提出以详细程度和领域依赖度两个维度 作为对本体划分的基础。详细程度是相对的、较模糊的一个概念,指描述或刻画建 模对象的程度。详细程度高的称作参考( r e 胁n c e ) 本体,详细程度低的称为共享 ( s h a r e ) 本体。依照领域的依赖程度,可以细分为顶级( t o p 1 e v e l ) 本体、领域( d o m a i n ) 本体、任务( t a s k ) 本体和应用( a p p l i c a t i o n ) 本体等4 类。在这四类本体中,顶级 本体描述的是最普通的概念及概念之间的关系,如空间、时间、事件、行为等等, 与具体的应用无关,其他种类本体都是该类本体的特例。领域本体描述的是特定领 域中的概念及概念之间的关系。任务本体描述的是特定任务或行为中的概念及概念 之间的关系。应用本体描述的是依赖于特定领域和任务的概念及概念之间的关系。 1 9 9 9 年,p e 崩【和b e n j a i i l i 璐在分析和研究了各种o m o l o g i e s 分类法的基础上,归 纳出1 0 种本体:知识表示本体、普通本体、顶级本体、元( 核心) 本体、领域本体、 语言本体、任务本体、领域任务本体、方法本体和应用本体。这种分类法是对g u 撕n 0 提出的分类方法的扩充和细化,但是这1 0 种本体之间有交叉,层次不够清晰。 2 1 3 本体应用 本体构建的目的就是为了应用,本体已经被广泛应用于人工智能、信息管理、 知识管理、知识工程、自然语言处理、信息检索、软件复用、面向对象技术和语义 w 曲等各个领域,典型的应用有如下几类: l 、基于语义的信息检索,特别是网络搜索引擎和数字化图书馆n 1 儿1 2 1 。 l o 具有本体特征的档案管理系统设计与实现第二章具有本体特征的档案管理系统相关技术 2 、基于本体的数据集成、机器学习掣1 3 巾引。 3 、领域本体的应用。比如,在生物信息学中已经建成的g e n eo m o l o g y ,尽管 只包括了p a n - 0 f 等简单的关系,但是对生物信息学界已经有巨大的影响n 钉。 4 、语义w 曲服务n 副。 5 、在线元数据管理和自动信息发布n 砑。 九十年代初,美国国防高级研究计划署( d a 耐狐) 、国家自然科学基金( n s f ) 等四个政府部门联合提出了知识共享计划( k n o w l e d g e - s h a r i l l ge 触) r ,以研究一种 便于知识库和知识基系统共享和重用的途径,包括斯坦福大学、a t & t 、卡耐基蔫 隆等在内的十多个研究中心参加了这个计划,对本体的研究是这一计划的重要组成 部分。 本体自9 0 年代初提出以来,在计算机及相关领域得到了广泛的应用,其中在国 外比较有代表性的应用系统有: ( 1 ) t f u b i s t a m b i s ( 仃彻s p a r e n ta c c e s st 0 舢l t i p l eb i o i n f 0 h n a t i c si n f o l l i l a t i o ns o u r c e s ) 是英 国曼切斯特大学计算机科学系和生物科学学院的一个联合研究项目。 蝴b i s 通过 使用一个本体来帮助使用者从众多的外部数据库中发现合适的信息资源,并能用一 致的方式返回含有详细信息的结果。 ( 2 ) r c a l r c a l ( r e t s 玳ac a l e n d a ra g e n t ) 是美国卡耐基梅隆大学( c m u ) 计算机学院 机器人研究所最近开发的一个分布式约会安排a g e n t ,其使用了多个分布式本体,并 采用d a m l 奄作为服务语义描述机制。 ( 3 ) a g e n t c i t i e s a g e n t c i t i e s ( h n p :价y w w a g e n t c i t i e s o 哕) 近年发起的一个国际性的研究计划,其 主要目的是用a g e n t 技术实现网络上各种系统间的语义互操作性。本体在其中起着 重要作用,专门成立了“本体工作组 研究本体在语义互操作性等方面的实际应用 所面临的问题。其中b e d & b r e a k f a s t 是基于本体的进行食宿预定的一个多a g e n t 系统, 能简化和加快供求双方的交易过程,减少交互次数,并能提供关于服务的更多信息。 r r t a l k s 事务通知服务是以语义w 曲服务技术建立起来的r r 会议智能通知服务系统, 使用d a m l 零对本领域的服务本体进行了构建。 第二章具有本体特征的档案管理系统相关技术 具有本体特征的档案管理系统设计与实现 国内比较有影响的研究有:中科院数学所陆汝铃研究员领导的常识知识的实用 性研究;中科院计算技术研究所曹存根研究员主持的大规模知识系统的研究;中科 院数学研究所金芝研究员研究的基于本体的软件需求获取方法;浙江大学人工智能 研究所基于本体论的产品信息集成研究;浙江大学吴朝晖教授带领的团队着手建立 中医药本体;中国安全生产科学研究院、中国科技大学、清华大学等共同开发的应 急联动系统中也部分建立了应急联动领域本体。 2 2 本体构建 2 2 1 本体构建方法 本体的建立可以从不同的起点开始,可以从已存在的本体开始,也可以从数据 源文集开始,或者将两个方法组合起来使用。 目前产生本体的方法可以总结为:自下而上,从详细到一般;自上而下,从一 般到详细;自中间开始,从最重要的概念到一般和详细。更多时候,是采用提升算 法从基础本体中提升和获取不同层次的本体。 综合来看,目前比较典型的本体开发模式包含如下几种: 1 、m e f _ 5 方法 d e f 【i 力n 町的概念是在7 0 年代提出的,是在结构化分析方法的基础上发展起来 的。1 9 8 1 年美国空军公布的i c a m ( i n t e g r a t e dc o n l p u 衙加d e dm a 肌f a c t l l r i n g ) 工程 中首次用了名为“e f 的方法。d e f - 5 是k b s i ( k n o w l e d g eb a s e ds y s t e mh l c ) 开发的一套用于描述和获取企业本体的方法。d e f 一5 通过使用图表语言和细化说明 语言,获取关于客观存在的概念、属性和关系,并将它们形式化表达成本体。d e f - 5 创建本体的5 个主要步骤是: ( 1 ) 定义课题,组织队伍。确定本体构建项目的目标、观点和语境,并为组员 分配角色。 ( 2 ) 收集数据。收集本体构建需要的原始数据。 ( 3 ) 分析数据。分析数据,为抽取本体作准备。 ( 4 ) 本体初步开发。从收集的数据当中建立一个初步的本体。 ( 5 ) 本体优化与验证。完成本体构建过程。 1 2 具有本体特征的档案管理系统设计与实现 第二章具有本体特征的档案管理系统相关技术 2 、s k e l e t a lm e t h o d o l o g y 骨架法 m i k eu s c h o l d 和m i c h e a lc 衲i l i n g e r 提出了独立于本体领域的企业本体构建方法 骨架法n 钔,该方法只提供开发本体的指导方针。包括如下四个主要步骤: ( 1 ) 确定本体应用的目的和范围。 、, ( 2 ) 建设本体。该阶段包括本体获取、本体编码和本体集成。 ( 3 ) 评价本体。在这个方法中没有提出自己的本体评价方法,只是认为这应该 是整个方法论的一个环节。 ( 4 ) 文档化。文档主要包括本体中定义的主要概念、元本体等。 3 、t o v e 企业建模法 t o v e 本体建模方法汹3 是多伦多大学g m i l i n g e r 和f 0 x 等人从1 o v e 项目中总 结出来的。t o v e 流程嘲如图2 1 所示: - 1 0 t i v a t i n g s c e n a r i o c 唧1 e t e n e s s t h e o r e m s i n f o m a l c 唧e t 朗c y q l j e s t i o n s f i r s t o r d e r l o g i c : a x i o m s f i r s t o r d e r l o g i c : t e r m i n 0 1 0 9 y f o r 舰1 c 0 m p e t e n c y 沁e s ti o n s 图2 1t o v e 流程图 由图可见,。r o v e 方法包括如下几个步骤: ( 1 ) 激发场景。应用领域的某些场景激发了本体的构建,因此,给出一个场 景有助于理解构建本体的动机。 ( 2 ) 非形式化的能力问题。提出一个本体能够回答的各种问题作为需求。通 过指明能力问题和场景之间的关系,可以对新扩展的本体进行一定的非形式化的判 断。 ( 3 ) 术语的抽取和定义。 ( 4 ) 问题的形式化。 ( 5 ) 公理化本体词汇。本体中的公理指定了术语的定义以及约束。采用本体 中的谓词将公理定义为一阶逻辑的句子。 4 、me t h o n t o l o g y 2 1 】 j o n e se ta l l 提供了该方法的简要概述。它是马德里大学在开发人工智能图书馆 第二章具有本体特征的档案管理系统相关技术具有本体特征的档案管理系统设计与实现 时使用的方法。这个本体开发方法更接近软件工程开发方法,其基本流程如下: ( 1 ) 规格说明。该阶段要产生一份以自然语言编写的非形式化的、半形式化 的、或者形式化的本体规格说明书。 ( 2 ) 知识获取。 ( 3 ) 概念化。将获得的领域知识组织成概念模型,用规格说明书中明确的领 域词汇表描述问题和解决方案。 ( 4 ) 集成。重用其他本体中已经建好的定义时,可以通过查看原本体来选择 适合自己概念模型的,也可以选择和自己概念模型中的语义和实现一致的术语定义。 ( 5 ) 实现。用任何一种形式化的语言编码实现本体。 ( 6 ) 评价。在本体生命周期的每个阶段和阶段之间,利用某种参考框架对本 体、软件环境、文档进行技术判断。 ( 7 ) 文档化。在本体构建的全过程中,每个阶段都应该有对应的文档。 2 2 2 本体构建工具 本体的构建离不开工具的支持。随着本体在人工智能、语义网、电子商务、信 息检索和抽取等领域的广泛应用,涌现出了许多本体构建工具。目前支持本体开发 的工具多达数十种,功能各不相同,对于本体语言的支持能力、表达能力、逻辑支 持能力以及可扩展性、灵活性、易用性等都相差很大,其中较著名的有p r o t 6 酌、 o m o e d i t 、o i l e d 、o n t o l i n g l l a 吻3 等。p r o t 6 酌啪3 是目前较活跃的本体工具,是可以免 费获得的开放软件。它用j a v a 语言开发,通过各类插件支持多种本体格式,甚至己 经能够支持刚刚发布的,也是目前最有前途的w 3 c 的o w l 格式。因此本文选取了 p r 优6 9 6 作为构建的工具。 胁1 6 酌是由斯坦福大学的s t 觚f 6 r dm e d i c a li i l f o 肌a t i c s 开发的一个开放源码的 本体编辑器,可以从网站h t t p :p 怕t e g e s t 觚f o r d e d u 免费下载p r o t 6 9 6 界面风格与普 通应用程序风格一致,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论