转载关于声像电子档案归档本体在城建档案信息管理系统中的应用.doc_第1页
转载关于声像电子档案归档本体在城建档案信息管理系统中的应用.doc_第2页
转载关于声像电子档案归档本体在城建档案信息管理系统中的应用.doc_第3页
转载关于声像电子档案归档本体在城建档案信息管理系统中的应用.doc_第4页
转载关于声像电子档案归档本体在城建档案信息管理系统中的应用.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本体在城建档案信息管理系统中的应用孙庆辉 霍建飞内容提要本体,作为一种能在语义和知识层次上描述信息系统的概念模型的建模工具,已在许多领域得到了广泛的应用。本文应用基于本体的方法来建立城建档案信息管理系统的分析设计工作,借鉴该领域内现有的本体研究,提炼出了档案信息系统模型,阐述了本体在城建档案信息系统中的应用情况实例。关键词 本体 系统模型 城建档案 信息系统一、引言本体,作为一种能在语义和知识层次上描述信息系统的概念模型的建模工具,迅速成为信息系统与人工智能领域的一个研究热点,并在许多领域得到了广泛的应用,如知识工程,软件复用,信息系统间异构信息处理,自然语言理解等。特别是在信息检索领域,本体提供了一种对信息和知识进行规范化描述和建模方法,在构建智能化的检索系统、构建语义等方面具有重要的意义1。二、本体的基本知识2.1本体的定义本体是由eches与ikes在1991年提出的2,是领域术语及其关系的外在形式化表示,术语及其联系是现实世界的提取。本体作为一种服务方式作用于领域知识的抽取、描述、传递与共享3。本体能使智能代理更加清晰地理解相关的元素、关系以及概念,使知识表示更加合理与方便,帮助人们作出更恰当的选择。2.2基于本体的信息检索的基本原理本体是把现实世界中的某个应用领域抽象成一组概念及概念间的关系。在传统信息检索技术中融入本体,既能够发挥概念信息检索的优势,又可以克服概念信息检索的局限性,即它不能对概念关系进行处理。由于本体能够对概念关系进行处理,并通过概念之间的关系来表达概念语义,所以检索的查全率和查准率会得到提高。基于本体的个性化信息检索是对需求集合和信息集合进行了匹配与选择,并在其中加入了本体的元素。三、本体在城建档案信息管理系统的中的应用利用本体理论指导并开发城建档案信息管理系统,目的是使城建档案管理的过程信息化、现代化,以适应当前工作的需要。城建档案信息管理系统是以城建档案为核心,以馆藏档案资源为基础,以计算机技术为载体,用本体理论来建立档案信息的检索模型,将现代的计算机技术与传统档案查询服务方式相融合。它不仅做到了统一、完整,而且还具有容量大、速度快等特点,还能够做到较为准确的查询,充分开发城建档案信息资源、提高了工作效率和管理水平。3.1 本体知识在城建档案信息检索中的应用由于城建档案系统数据量大且复杂繁琐,为减少数据检索时间,提高数据的匹配效率,故引入本体知识来改善检索的效率。信息检索过程涉及 3个方面: 用户任务 (用户需求 )、文献的逻辑表示 (文档替代物 )、相关性判断。为了提高系统的响应速度,信息检索系统一般不直接进行用户需求和文档的相关性分析,而是使用表现形式既简单又相似的需求替代物和文档替代物进行相关性匹配 。文档替代物,如关键词向量,可以通过人工标引或者自动标引获得,生成之后一般不再更新;需求替代物,如查询表达式,一般由用户或者检索系统辅助构造而成。文档替代物是档案的元数据,文档类的替代物是文档类的元数据。从检索效率的角度来看 , 标引能显著提高全文数据库的查全率和查准率,并能缩短检索时间。检索结果可以是题名、知识、概念含义水平上的信息或全文等多种形式。城建档案文本标引工作至少应该包含主题标引和实体关系标引两个方面 , 因为文本内部既包含主题信息,又包含实体关系信息,这是两类不同类型的信息,文本信息检索系统应该提供这两类信息的检索入口。到目前为止,主题标引技术已经比较成熟 , 被广泛用于信息检索系统之中,实体关系标引技术还需进一步完善。城建档案信息检索引入本体技术的一个重要目的是变关键词 (或者主题词 ) 匹配为基于语义的匹配,使系统在查全率和查准率上有更好的保证。然而,现有的基于本体的信息检索系统在标引过程中对本体的利用过于简单,只是借助于领域本体,判断文档所属的领域,对文档按领域进行分类。领域本体能否在标引过程中发挥更多的作用,有没有必要对标引功能进行相应的改造,例如,使用本体描述档案文档,用本体作为档案文档的替代物,这些都有待继续进行研究。在标引过程中,本体技术可以发挥更多的作用。但是,应该将领域本体分为两类:一类是反映特定领域内概念之间关系的本体,简称概念关系本体;一类是反映特定领域内实体之间关系的本体,简称实体关系本体。这两类领域本体的作用不同。实体关系标引属于信息抽取技术,可视为信息检索技术的一个深化。在标引过程中,实体关系本体可以充当信息抽取框架。实体关系标引的过程可以按以下几个步骤进行:1标引系统对城建档案进行主题标引,识别文本中所包含的主题,并根据文本主题将文本按照领域进行归类。2 利用文本的领域归属信息从文本中识别出命名实体。3 利用信息抽取模板将特定的描述信息与实体联系起来。4在实体识别的基础之上标注出实体之间的关系。对文本信息检索系统而言,没有必要使用本体形式的文档替代物,因为文档的多个主题词之间的概念关系比较简单。文档主题词只是某些概念关系本体上的几个概念节点 ,用标引词向量作为文档替代物就可以了。3.2系统流程图1城建档案管理流程图43.3结构与功能设计图2 结构设计图43.4 模式特色该系统模式主要有以下特色1一切从实际需要出发,完全根据城建档案馆档案管理工作的实际需要来进行功能分析、系统架构甚至是界面设计,档案馆工作人员对系统的使用不存在过长的熟悉时间。2实现了数据库管理系统的“瘦管理”,用户无须过多的了解SQL Server 2000的使用和管理技术就可以对系统进行维护和管理。3系统采用分布式体系结构(客户/服务器(C/S)模式),全部数据管理采用开放式数据结构/接口设计,用于数据共享与数据交换,方便档案管理系统的升级、功能扩充。4系统在档案管理中广泛采用了报表技术,实现了对用户编目时所需的资料文件内容的打印功能,提高了工作效率和准确度。5数据库实现了对图片和文件的存储,在方便了档案文件的管理的同时也提高了档案文件的安全性。6通过使用OLE技术,工作人员可以系统的将处理结构进行有自己特色的二次加工。7建立电子文件归档系统,解决存量档案的电子化工作,建立了法规标准体系。5四、讨论城建档案信息化管理,是形势发展之必然,也是建立节约型社会,坚持科学发展观的重要手段。“保定市城建档案管理信息系统”的立项研发,是由保定市城建档案馆和河北工业大学共同开发进行的,如今已正常运转多年。实践结果证明,随着计算机在社会生活中的广泛应用,大众对数字信息的需求越来越强烈,信息技术开始面临种种新的挑战,如知识的表示、信息的组织、软件的复用等。本体作为一种新兴的概念建模工具,迅速在信息系统诸多领域得到广泛的应用。因此,本体必将为人机对话架起便捷的桥梁。参考文献:1 张书祥,董永峰,候向丹本体及其信息在检索中的应用J 河北省科学院学报2005,8:1761782 eches R,ikes R E,ruber T R,eta. Enabling Technology for Knowledge Sharing J.AI Magazine,1991,12(3):36-56.3 Studer R, Benjamins V R, ensel D, Knowledge Engineering, Principles and MethodsJ. Data an

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论