毕业设计-文档检索系统的设计与实现论文.doc_第1页
毕业设计-文档检索系统的设计与实现论文.doc_第2页
毕业设计-文档检索系统的设计与实现论文.doc_第3页
毕业设计-文档检索系统的设计与实现论文.doc_第4页
毕业设计-文档检索系统的设计与实现论文.doc_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于vb和数据库技术的文档检索系统设计与实现摘要:随着计算机与网络的普及,信息资源变得越来越丰富,人们期望通过自然、便捷的方式获取所需的内容,由此产生了信息检索技术以及基于该技术的文档检索系统。用户以输入关键字的形式提出查询,通过计算机检索系统返回可能相关的文档。本文主要论述了有关文档检索系统的信息检索技术及数据库技术,并针对文档检索的要求,对文档检索系统的功能和结构进行分析与设计,并且依据设计,建立数据库、编写程序,完成在vb和access数据库平台上的系统实现。关键字:数据库;信息检索;系统分析;系统设计the design and realization of documents retrieval systembased on the vb and access database technologyabstract: along with computer and network popularization, the information resource changes more and more richly. the people expected through the nature, the convenient way gain the content of which he needs. from this, the information retrieval technology have been born as well documents retrieval system which was based on this technology. the user proposes a inquiry by inputting keywords and obtain the documents through the computer search system which may be connected. this paper mainly discusses the the information retrieval technology and the database technology which are related with documents retrieval system,. the writer aims at the request of the documents retrieval system, carries on the analysis and designs the documents retrieval system function, the structure and database, then completes with vb and access database platform system realization.keywords : database;information retrieval;system analysis;system design目 录引言11文档检索系统涉及理论与技术11.1 信息检索技术概述11.1.1 信息检索11.1.2 信息检索技术21.2 信息检索模型21.2.1 信息检索模型简介21.2.2 布尔逻辑模型(集合模型)21.2.3 向量空间模型21.2.4 概率检索模型21.2.5 三种模型的比较21.3 文档的组织与查询31.3.1 文档的组织31.3.2 结构化文档的组织与存储31.3.3 文档的查询31.4 数据库系统31.4.1 数据库技术31.4.2 数据库管理系统31.4.3 数据库与信息检索技术的结合41.4.4 数据库与vb程序设计的结合 51.4.5 数据库应用开发系统简介52文档检索系统的设计52.1 文档查询52.2 应用需求分析62.3 功能设计72.4 系统功能模块设计92.5 数据表设计92.6 系统结构图103文档检索系统的实现103.1 非关键部分的设计103.2 文档检索与文档信息编辑的实现113.2.1 main窗体 113.2.2 searchform窗体 113.2.3 searchform1窗体123.2.4 searchform2窗体123.2.5 editform窗体 133.2.6 editform1窗体133.2.7 editform2窗体14结语14参考文献15引言在日常工作中,知识的主要载体是文档。无论是政府机关、设计院、银行还是企业,工作体现在大量的文档中,包括公文图纸、票据、文件等,这些都是人类智慧的结晶。随着计算机与网络的普及,信息资源变得越来越丰富,人们期望通过自然、便捷的方式获取所需的内容,对文档进行信息管理、检索和利用的需求非常迫切。随着社会的发展进步,文档信息工作出现了一些变化。首先是随着以计算机及网络技术为代表的现代信息技术迅猛发展,文档信息载体出现了多样化的趋势。文档信息载体的变化,主要表现在载体材质的变化和信息记录方式的变化两个方面。在载体材质方面,由原来单一的纸质材料逐渐发展成为多样化、系列化的光、磁介质材料;信息记录方式方面,由原来的手写文字或图形发展成由机器识别的数码形式。其次,新知识的涌现也使得文档信息工作的难度越来越大。再次,由于高科技手段引发的信息流动的速度空前加快、载体建立周期大幅缩短和载体信息的大范围、高密度的频繁利用,文件档案信息相对固化的特性日趋减弱,而这类信息不断增加的流动性日渐明显。伴随这些变化,文档信息工作进一步现代化。随着文档信息资源的遽增,人们期望通过自然、便捷的文档检索方式获取所需的内容。伴随技术进步文档检索已经从最初的手工管理步入到数据库管理阶段,从而脱离了重复而繁重的手工检索。现代文档检索技术融合了图书馆学、档案学、情报学等理论,又融入了现代计算机及通讯技术,例如网络技术、数据库技术等。这使得我们不仅可以进行单机环境下的检索,而且可以实现通过网络对远程信息资源进行检索。文档检索系统即是一种信息检索系统。用户以输入关键字的形式提出查询,通过计算机检索系统返回的可能相关的文档,获得所要检索的信息。本论文是利用数据库和程序开发及信息检索理论,针对文档检索的要求,对文档检索系统的功能和结构进行分析与设计,并且依据设计,建立数据库并编写程序,完成在vb和access数据库平台上的系统实现。1 文档检索系统涉及理论与技术1.1 信息检索技术概述1.1.1 信息检索所谓信息检索就是用户提出一个查询,通常以关键字的形式输入,计算机通过关键字匹配,返回可能有关的文档。用户通过查看文档,获取所需要的信息。这类信息检索,不限任何领域,可以快速地返回相关的文档3。1.1.2 信息检索技术信息检索技术目前主要采用关键字匹配法。文档的内容表示为某些特征项的集合,查询的要求也用项来表达,检索的目的是查找哪些文档可能符合查询的要求。首先对查询进行预处理:项扩展、增加同义词或者根据用户前一次查询返回的信息等,其目的是提高对查询要求的精确表示。然后对文档和其它信息源进行索引,按照字或词对全文做索引 ,如果对词做索引,则需要对文档进行分词、词性标注、词组抽取等处理。最后比较查询和文档的类似性以决定哪些文档是与查询相关的1。现代信息检索技术发展越来越快,基于概念的检索、个性化检索、智能化检索等相继出现,并出现了一些新兴的算法、方法等,例如文档聚类算法、优化倒排文档检索算法、焊接文档检索方法等。1.2 信息检索模型1.2.1 信息检索模型简介信息检索主要研究信息的表示、存储、组织和访问,在ir领域中主要存在两类问题:一是如何表示用户查询和文档,即信息的表示与组织;二是如何比较用户查询表达式与文档的表达式,即信息的查询与访问信息检索检索模型问题,信息检索模型是基于内容的信息检索系统的核心技术,决定了信息组织的模式及信息查找的方式。在信息检索领域中有三大经典的模型,它们是:布尔逻辑模型、向量空间模型和概率模型3。1.2.2 布尔逻辑模型(集合模型)布尔模型是最简单而常用的严格匹配检索模型,它的基本思想是以关键词出现与否来表示文档内容。布尔模型定义了一个二值变量集合来表示文档,这些变量对应于文档中的特征项,一般是由文档集中的词条或短语组成。如果某特征项在文档中出现时,该特征项所对应的变量的值就为1 (true),否则就是0(false)。在布尔模型中,用户查询也被表示成布尔表达式,使用逻辑运算符将查询关键词连接起来。检索时,根据用户提交的检索条件是否满足文档表示中的逻辑关系将检索文档分为两个集合:相关文档集和不相关文档集3。1.2.3 向量空间模型向量空间模型(vector space model, vsm)对信息的处理是按照向量的方式,将文档信息的匹配问题转化为向量空间中的矢量匹配问题,从而以向量代数以及集合论的方法来解决信息检索中的实际问题。vsm的基本思想是:将文档映射成为空间中的一个点,对于所有文档和用户查询都可映射到向量空间。使用它表示特征词在该文档中和查询请求中的重要程度。通过计算文档与查询的相关度,将符合查询请求的文档选出排在最前面,提供更好的检索服务3。1.2.4 概率检索模型概率模型是以概率论为基础,运用概率统计学方法来挖掘信息特征,理解用户查询语义。概率模型基于这样一种概念排队理论:当文档按相关概率递减的原则排列时可以获得最大的检索性能。概率模型更为准确地描述关键词和文档之间的关系。根据专家的相关判定,建立关键词和文档之间的相关概率关系,对关键词出现在相关文档和不相关文档中的影响作了明确的区分,包括定义了关键词间的依赖关系,权重计算,查询文档相似性计算,因此具有更好的相关特征,查询精度更高3。1.2.5 三种模型的比较布尔逻辑模型(集合模型)的优点是:结构简单,实现起来容易,检索速度快,因而是迄今为止能独立实用的检索系统数学模型。其它数学模型,如代数模型和概论模型都需要和集合模型混合使用。这是因为在所有检索系统数学模型中,集合模型对文献群的模拟最直接,占据的内存空间最少,使用也最简单。其余数学模型由于技术上的限制和使用上的复杂使它们的实用性大大降低3。1.3 文档的组织与查询1.3.1 文档的组成文档由文档的属性、内容和结构组成。文档的属性指的是文档中不涉及到文档内容和结构的信息,比如类型信息、文章大小等。文档的逻辑结构可以被认为是文档的一个层次结构图。一篇文档可以包含标题、摘要信息、章节及子章节等。结构允许我们将各种不同的数据类型对象,从简单的数据如日期、标题这样的特征,到复杂的数据如文本、多媒体信息, 以人们日常的方式自然地组织起来。文档各部分之间的联系和文档之间的联系,都必须通过结构来得到。文档依据其结构,将各部分分别处理和存储。1.3.2 结构化文档的组织与存储因为文档的属性是结构化的数据,所以可以用结构化的关系数据模型进行存储。对于文档内容信息,可以利用传统的倒排文档、签名文档等格式来存储。而文档的结构存储,对于文档的结构索引与存储,现在研究的比较少。1.3.3 文档的查询 根据文档的组成,文档的查询可以分为对文档的属性、内容、结构的查询。由于文档的属性是结构化的数据,并且通过关系型数据库组织与存储,所以对其使用结构化查询语言sql查询查准率与查全率都很高。14对于文档内容的查询应用于全文信息检索技术。全文检索是对完整的文本文档进行检索。对数据库中所存储的文档全文实施检索操作时, 用户提出的检索词不一定要来自系统提供的检索词表, 也不需要与数据库中的数据结构完全一致(比如与记录的字段名一致)。绑定三种查询提供的是以文档为中心的逻辑概念检索,而不是以全文为中心的检索。将文档的结构吸收进信息检索系统,为用户提供一个真正的能够表达实际文档的逻辑模型。更为重要的是,它将结构化数据查询和半结构化、非结构化数据查询结合起来,使查询效果更为强大1。1.4 数据库系统 1.4.1 数据库技术随着人类社会的不断发展,人类采集到的数据也在激增,因而必须对数据进行存储、组织、管理。数据管理技术的发展也随之经过三个阶段:人工管理阶段、文件系统阶段和数据库阶段。人工管理阶段和文件系统阶段的数据管理都存在相当多的缺陷,诸如数据冗余性 ,数据不一致性以及数据联系弱等等。也正是由于这些原因,促使人们研究新的数据管理技术,从而产生了数据库技术,并得到了迅速发展。1.4.2 数据库管理系统数据库管理系统(dbms)是指数据库系统中管理数据的软件系统。dbms是数据库系统的核心组成部分。对数据库的一切操作,包括定义、更新及各种控制,都是通过dbms进行的。dbms总是基于某种数据模型,可以把dbms看成是某种数据模型在计算机系统上的具体实现。根据数据模型的不同,dbms可以分成层次型、网状型、关系型、面向对象型等。ms access2003就是一种关系型数据库管理系统。关系模型主要是用二维表格结构表达实体集,用外键表示实体间联系。关系模型是由若干个关系模式组成的集合。关系模式相当于前面提到的记录类型,它的实例称为关系,每个关系实际上是一张二维表格。关系模型是数学化模型8。dbms根据其特点和功能可以分为三个子系统:设计工具子系统、运行子系统和dbms引擎。设计子系统有一个方便数据库及其应用创建的工具集。它典型地包含产生表、窗体、查询和报表的工具。dbms产品还提供编程语言和对编程语言的接口。运行子系统处理用设计子系统开发的应用组件。它所包含的运行处理器用来处理窗体和数据库的数据交互,以及回答查询和打印报表等。dbms引擎从其他两个组件接受请求,并把它们翻译成对操作系统的命令,以便读写物理介质上的数据。dbms引擎还涉及事务管理、锁、备份和恢复。1.4.3 数据库与信息检索技术的结合信息检索研究文本文档集合检索的问题。web上文本文档的不断增加使得对很多人来说搜索文档成为每日例行的操作,并且web将数据库管理系统和信息检索前所未有的结合。数据库和信息检索的共同目的是要支持对数据集的检索。关系dbms通用结构化查询语言sql实现对于各类数据集的检索包括文本字段。目前,支持文本字段的关系dbms的文本检索的实现是使用一个与dbms松耦合的单独的文本搜索引擎。结构化查询语言(sql) 是操作关系数据库的标准语言。通过它可以实现文档检索所有对数据库的操作包括定义、操作、查询和控制4个方面。本系统主要在程序中通过嵌入方式使用结构化查询语言( sql 语言) 来实现其强大的数据库操作功能。查询是其中最主要的部分,从sql的英文名称“结构化查询语言”上看就能看出sql在查询中的贡献,可以说数据库查询语句是sql语言的核心。查询语言(query language,简称ql)主要完成对表中记录的查询(select语句)。select语句的含义是:根据where子句的条件表达式,从from子句指定的基表或视图中找出满足条件的记录,在按select子句中的目标列表达式进行过滤,选出记录中属性值形成结果。常用查询条件:查询条件 符号比较 =,=, , =,not范围 between and,not between and集合 in,not in模糊匹配 like,not like空值 is null,is not null条件 and,or1.4.4 数据库与vb程序设计的结合数据库与vb的连接:visual basic提供了与底层数据库系统紧密的连接。visual basic 支持不同的关系数据库管理系统并充分发挥每一个数据库的特长。生成独立应用或脱离服务器运行的服务以上的应用,visual basic连接数据库的方式有两种:通过使用visual basic的 data控件。 通过使用由visual basic提供的专用的直接与数据库相连的接口。 在vb的应用程序开发中,访问数据库的方法可归纳为两种。一种是通过ado的数据源对表中的数据进行直接操作,另一种是通过标准的sql语句结合connection 对象对数据库中的数据进行操作,对表中的数据进行检索和统计。visual basic 6.0推出了ado 技术。ado中文含意是activex数据对象(activex data object),它是一种面向对象的接口。ado访问数据库是通过访问ole db使用程序和ole db供给程序来进行的,它在封装ole db的程序中使用了大量的com接口,是一种高层的访问技术。此外,ado技术可以以activex控件的形式出现。ado data 控件使用microsoft activex 数据对象(ado)来快速建立数据绑定的控件和数据提供者之间的连接。数据绑定控件是任何具有“数据源”属性的控件。数据提供者可以是任何符合ole db 规范的数据源。ado data 控件有作为一个图形控件的优势,可以用最少的代码实现ado控件与本地或远程数据库连接:打开一个指定的数据库表,或定义一个基于结构化查询语言(sql)的查询、存储过程或该数据库中表视图的记录集合。将数据字段的数值传递给数据绑定的控件,可以在这些控件中显示或更改这些数,添加新的记录,或根据对显示在绑定的控件中的数据的任何更改来更新一个数据库15。1.4.5 数据库应用系统开发简介在数据库应用系统开发之前,对开发数据库的基本概念应当了解,对数据库的结构、开发数据库应用程序的步骤、开发体系及方法都应当有相当清晰的了解和认识。数据库应用系统开发的目标是建立一个满足用户长期需求的产品。开发的主要过程为:理解用户的需求,然后,把它们转变为有效的数据库设计。把设计转变为实际的数据库,并且这些数据库带有功能完备、高效能的应用。数据库技术在计算机软件邻域研究中一直是非常重要的主题,产生于60年代,30多年来数据库技术得到了迅速发展,并已形成较为完整的理论体系和一大批实用系统。并且,近年来,随着world wide web(www)的猛增及internet技术的迅速发展,使得数据库技术之时成为最热门技术之一。2文档检索系统的设计2.1系统目标文档检索系统作为一个完整并且独立的自动化系统, 应具有的主要功能为: 收集、整编、检索、利用等。在这几种功能中, 应以检索、利用功能为主, 系统设计以方便、实用为目标。采用现代化手段收集文档数据, 并能运用计算机技术对所收集的数据进行分类、统计、存储、检索。2.2应用需求分析文档是国家机关、社会团体和个人在社会活动中形成、保存备查的文字、图表、声像等其他各种形式的原始记录,是历史的真实写照。文档检索系统即是对大量文档(包括公文文档、学术文献、工程图纸等)进行收集整编并支持用户进行检索。文档由文档的属性、内容和结构组成。文档的属性指的是文档中不涉及到文档内容和结构的信息,比如类型信息、文章大小等。文档的结构可以被认为是文档的一个层次结构图。一篇文档可以包含标题、摘要信息、章节及子章节等。文档各部分之间的联系和文档之间的联系,都必须通过结构来得到。文档依据其结构,将各部分分别处理和存储。文档结构的各部分组成了文档的内容。文档的检索是基于对文档内容的描述元数据。元数据的定义是:元数据是描述数据的数据,它通过按一种约定俗成的规则来描述对象的手段来组织和管理信息资源。其特征包括:描述性、动态性、复杂性、多层次性、支撑性。其中描述性是所有元数据的最本质的特征。元数据是描述数据的数据,只有先描述才会有组织与管理功能的发挥。支撑性:某种程度上来说,元数据相对内容而言处于次要的地位,但又是必不可少的,起支撑的作用,它有效地维护所描述对象的原始性和完整性。元数据的这两项主要特性决定了需要通过元数据来组织和管理文档内容,包括标题、作者、机构、关键字、摘要等等。文档的内容元数据和属性共同构成文档的信息,我们通过对信息的检索获得对文档的检索。在系统使用过程中,用户进行文档检索,管理员进行文档管理的流程图如下: 用户存档文献管理员 文档维护 文档收录文档查询从流程图可以得出,文档检索系统需要满足来自两个方面的需求,这两个方面分别是文档检索用户、文档管理人员。文档检索者的需求是查询文档库所存的文档、以及文档内容和文档属性情况及个人信息的修改;文档检索系统管理人员的功能最为复杂,包括对用户口令、权限、文档信息进行管理和维护,及系统状态的查看、维护。文档检索者可直接查看文档数据库文档情况,如果用户根据本人用户名称和密码登录系统,还可以进行文档信息情况的查询和维护部分个人信息。一般情况下,文档检索者只应该查询和文档信息和维护个人信息。并且可以生成检索结果的报表,在本系统中由于没有打印机设备供试验,所以预先把报表打印改成报表预览。系统管理人员功能的信息量大,数据安全性和保密性要求最高。本功能实现对文档信息、用户信息的管理和工作人员和管理人员信息查看及维护。系统管理员可以浏览、查询、添加、删除、修改、统计文档的内容元数据信息和属性;浏览、查询、统计、添加、删除和修改检索用户的基本信息,但是,删除某条文档内容基本信息记录时,应实现对该文档属性记录的级联删除。根据分析本系统设计应满足如下需求:设计不同用户的操作权限和登陆方法;对所有用户开放的文档查询;检索者维护个人部分信息;维护检索者个人密码;根据检索情况对数据库进行操作并生成报表;查询及统计各种信息;维护文档信息;维护管理员信息;维护检索者信息;处理信息的完整性;良好的人机交互界面,以及应用程序与数据库的接口。2.3功能设计文档检索系统功能结构图文献归档数据维护文档检索文档浏览打印服务用户手册用户管理记录删除记录修改文档收录复合检索简单检索报表打印增加用户修改密码删除用户记录添加1 用户管理(1)设置用户功能:设置文档检索系统的用户及其使用权限。具备分级用户权限管理设置,以确保档案的保密性和安全性。整个文档检索系统由多个功能模块组成,不同的模块完成不同的功能,所以可以为不同的用户分配不同的功能,使其具有不同的权限,完成其权限所对应的功能,从而很好地管理好整个系统。操作:选择该功能后,屏幕上显示出所有文档检索的用户名称。这时,可进行如下的操作:增加: 增加一用户。按该按钮后,就可输入新用户的内容,如:用户名称,密码和权限。所输入得登录名一定不能重复。修改: 修改用户设置。按该按钮后,就可修改选中用户的用户名,密码和权限,每一权限对应系统菜单上的一项功能,可为该用户选择任意的权限。用户在使用本系统时,要求输入用户的口令,为了安全,用户需建立一个只有自己才知道的特殊口令。通常,系统的权限分为三大部分,即:管理权限:设置用户和系统参数。输入权限:文档卡片生成。查询权限:文档查询。根据需要,可以把这些功能分配给不同的用户。删除: 删除用户。按该按钮后,经确认,则选中的用户被删除。(2)用户登录功能:用户登录进入文档检索系统。系统启动后,首先要做的就是用户登录。若不登录系统,所有功能都无法使用。用户只有登录系统后,根据其具有的权限,才能执行一定的操作。操作:进入该功能后,要求输入用户的登录名及其口令,只有其登录名和口令完全正确,才能进入文档检索系统。系统会根据为用户分配的权限,设置其对应的功能为有效,用户就可操作该功能。2 辅助表管理辅助表管理功能是高级管理员及中级管理员拥有的权限,它的功能是对数据库进行的添加。主要是对“文档类型”表中的字段“文档类型”,“载体类型”的字段“载体类型、”,“秘密级别” 表中的字段“秘密级别”,进行添加,修改,删除操作。通过它的这个功能可以有效的对这些属性的扩充进行及时的计算机管理。只要管理员进行简单的数据字段添加即可。3 文档编辑功能: 灵活的数据记录编辑功能,可以随时对记录进行增加,修改,更新,删除,浏览等编辑操作。并将查询方式有机溶入编辑界面,可以实现对某项记录定位,再进行编辑,修改,更新。(1)文档内容元数据卡片管理功能:对全部文档内容元数据信息记录进行浏览;添加记录;对文档内容元数据记录进行修改;删除内容元数据记录;按编号进行查找,快速查找该文档的详细资料;按某一字段的内容进行筛选,筛选最后的结果是将和所选内容相同的全部找到。 (2)文档属性卡片管理功能:该模块与文档内容元数据卡片管理类似,对全部文档属性记录进行浏览;添加记录;对文档属性记录进行修改;删除文档属性数据记录;按编号进行查找,快速查找该文档属性的详细资料。 4 检索功能:。功能:对文档的检索功能,包括唯一条件查询与多条件复合查询的模糊检索。该模块的主要分为两部分:一是完成选择要查询的字段、条件操作符等功能;二是用来显示用户进行查询的完整条件及查询、退出按钮。当查询的条件选择完毕,点击确定按钮,在显示部分显示出来后,点击查询按钮才正式完成该模块的查询功能。根据文档元数据表中的各字段,选择相应的条件操作符输入相应的值即可进行文档查询。并且可以浏览符合检索条件的文档内容和查看文档的属性。5 打印功能: 对所查询的资料可以通过打印形式进行备份。6 用户手册:提供本系统用户详尽的操作手册,用户使用本系统时有不明之处都可以查看操作手册。2.4 系统功能模块设计本系统分为如下的几大模块:1 主界面模块。该模块提供管理系统的主界面,是主系统的唯一入口和出口,该界面提供用户选择并调用各子模块。2 文档记录编辑模块。该模块提供全部文档记录添加、修改、删除的界面。本模块由editform,editform1,editform2窗体组成。通过editform可以实现对删除、修改、添加三个功能的选择。选择添加或修改功能后调用editform1进行文档内容元数据的编辑,再调用editform2进行文档属性的设置。并将查询方式有机溶入编辑界面,可以实现对某项记录定位,再进行编辑,修改,更新。3 检索模块。该模块提供查询符合某一条件的文档记录的界面。本模块由searchform,searchform1, searchform2, datereport1, browserform窗体组成.在searchform可以进行唯一条件简单查询和多条件复合查询的模糊检索。 searchform1由searchform调用,对检索结果中的当前记录进行显示。 searchform2由searchform1调用,对当前文档记录的属性进行显示。 datereport1由searchform调用,通过报表打印对该文档的内容元数据和属性进行备份。在searchform调用browserform窗体对文档内容进行全文浏览。4 系统维护模块。该模块提供对用户进行添加、口令修改、删除的界面。由setuserform, setuserform1构成。setuserform窗体用于添加、删除、和修改使用本系统的用户。调用setuserform窗体可以对用户管理表进行添加、删除、修改。setuserform1窗体由setuserform窗体调用以编辑用户记录。5 辅助表管理模块。该模块提供对数据库进行的添加,由wdlxform、ztlxform和mjform组成。调用wdlxform对辅助表“文档类型表”中的“文档类型”字段进行添加。调用ztlxform对辅助表“载体类型表”中的“载体类型”字段进行添加。调用mjform对辅助表“秘密级别类型表”进行添加。2.5 数据表设计1 文档内容元数据表:该表用于存放所有文档内容元数据记录,包括文档编号、标题、作者、关键字、摘要、完成日期、机构等。每个文档有唯一文档编号,其余字段则表示文档元数据描述了文档的结构内容。2 文档属性表:该表用于存放文档属性数据,包括文档编号、文档类型、归档时间、秘密级别、载体类型、文档大小、存储位置等。每条记录的文档编号唯一对应于文档内容元数据表中的文档编号。3 用户管理表:该表用于存放本系统用户数据。包括用户名、口令、级别(分“一般操作员”和“系统管理员”两类)。4 文档类型表:系统所收录的文档包括很多种类,例如公文文档、学术论文、以及工程图纸等。该表用于存放系统所收录文档的类型,包括编号、文档类型、说明。5 载体类型表:系统所收录的文档存放于各种载体。该表用于存放系统所收录文档的载体类型,包括编号、载体类型、说明。6 秘密级别类型表:系统所收录的文档对于不同的用户有不同的使用权限,管理员根据用户级别进行级别控制。该表用于存放系统收录文档的秘密级别类型,包括编号、秘密级别、说明。2.6系统结构图pass窗体main窗体系统维护文档记录检索文档记录编辑辅助表管理editform1editformeditform2searchformsearchform1searchform2setuserformsetuserform1datereport1browserformwdlxformmjformztlxform3文档检索系统的实现3.1 非关键部分的设计文档检索系统主要完成的功能是对文档记录的检索和编辑,所以对于一些不属于关键部分的窗体与功能笔者仅作设计而不进行创建与实现,其中包括: pass窗体:pass窗体用于接受用户的用户名口令输入,判断是否为合法。如果是合法用户,释放该窗体并启动main窗体;否则释放该窗体不启动main窗体。 setuserform和setuserform1窗体:setuserform用于添加、删除和修改本系统用户。setuserform1被setuserform调用用以编辑用户记录。 辅助表管理模块及其窗体:该模块用于分别添加、删除和修改三个辅助表的记录。 browserform窗体:该模块用于浏览当前文档记录的内容浏览的实现主要采用vb的ole技术。vb通过ole控件支持对象的链接和嵌入,ole可以使应用程序访问windows环境下的其它应用程序。本系统对浏览设计如下:通过检索界面的浏览,调用browserform,根据每个文档的存储位置(即路径),通过ole控件将文档内容对象链接到本系统,实现对各种不同媒体的文档内容的查看。 datereport1:它的功能是实现对当前文档记录的打印备份功能3.2文档检索与文档信息编辑的实现3.2.1 main窗体main窗体是一个多文档窗体其设计界面如下图所示该窗体设计有一个菜单,菜单结构如下:wdjs(capion=”文档检索”)jdjs(capion=”简单检索”)fhjs(capion=”复合检索”)wdbj(capion=”文档编辑”)wdtj(capion=”文档添加”)wdxg(capion=”文档修改”)wdsc(capion=”文档删除”)3.2.2 searchform窗体searchform窗体用于实现用户对文档信息的检索。本系统检索将简单检索与复合检索融合在一起,可以支持逻辑与或连接的多条件检索,并且实现了用户检索条件的自由设置。由于检索采用模糊技术,所以检索更加智能,查全率更高。为了代码设计的简易,对于条件的输入设置从前到后的顺序。对于用户不合法的输入,系统通过良好的反馈机制,提醒用户。本窗体包含一个ado控件,并绑定一个datagrid控件,用来连接“文档内容元数据”表并显示数据记录。另外,包含文本框、下拉列表框用来设置查询条件。点击“检索”控件获得符合条件的检索结果,通过“显示”调用searchform窗体显示记录内容,并且通过“置空”重新设置检索条件。3.2.3 searchform1窗体searchform1窗体由searchform窗体调用,显示当前记录的文档内容元数据显示,并且实现对searchform窗体的调用,显示文档属性。本窗体通过一个ado控件并绑定datagrid控件来连接“文档属性数据”表并显示数据记录。点击“属性”按钮可以调用searchform2窗体,点击“返回”回到searchform窗体。3.2.4 searchform2窗体searchform2窗体由searchform1窗体调用用于显示文档属性。本窗体通过文本框将searchform1窗体中的ado控件所指的当前记录内容显示。3.2.5 editform窗体 editform窗体可以实现对删除、修改、添加三个功能的选择,并将查询方式有机溶入编辑界面,可以实现对某项记录定位,再进行编辑,修改,更新。对于删除可以实现文档内容元数据和文档属性记录的级联删除。本窗体包含一个ado控件,并绑定一个datagrid控件,用来连接“文档内容元数据”表并显示数据记录。另外,包含文本框、下拉列表框用来设置查询条件,点击“确定”实现检索定位。3.2.6 editform1窗体editform1窗体由editform窗体调用,通过各文本框实现对文档内容元数据记录的修改和添加,其最大特点是使得添加与修改融合到一个界面。本窗体通过一个ado控件并绑定datagrid控件来连接“文档属性数据”表并显示数据记录,通过点击“设置属性”进一步调用editform2窗体对ado当前指向的文档属性记录进行编辑。3.2.7 editform2窗体editform2窗体由editform窗体调用,通过窗体中的文本框进行文档属性记录的修改与添加。以上七个窗体经代码编写、调试运行得到实现,完成了本系统核心的检索与编辑功能。结语:经过两个多月的设计和开发,文档检索系统基本开发完毕。其功能基本符合用户需求,能够完成应用程序与数据库连接,从而实现文档纪录的检索、显示与添加、修改、删除等编辑功能,并且提供友好的用户界面和反馈。但是由于毕业设计时间较短,所以该系统还有许多不尽如人意的地方,比如对文档内容浏览、系统维护、以及报表打印、数据备份等功能未能实现的问题,这些都有待进一步改善。参考文献1 郭军.智能信息技术.北京:北京邮电大学出版社.1944-1472 姚国祥,罗伟其.网上信息搜索技术与搜索引擎.计算机科学.2000年第3期.75-763 张保明.数学在情报检索理论中的应用.情报科学.1981年第3期.69-714 邓珞华等.图书情报数学.东北师范大学.1983年11期.54-555 周宁.关于数据库课件设计的探讨j.图书情报知识.2000年第5期.13-146 美微软公司.sql sever7.0实现数据库设计m.北京希望电子出版社.19997 甘仞初.信息系统分析与设计.北京:高等教育出版社.20038 王珊,陈红.数据库系统原理教程.北京:清华大学出版社.19989 邓大权 ,薛兵.基于www的远程教育系统中数据库的建立.计算机工程与应用.2002年第12期.45-4710邓珞华.信息检索系统数学模型的理论及其评价.武汉:武汉大学学报.2001年第11期.24-2511王克仁等编译.软件项目管理.北京:科学出版社.200212龚沛曾等编.visual basic 程序设计简明教程.北京:高等教育出版社.200313黄梯云.管理信息系统.北京:高等教育出版社.200014陈光祚.计算机情报检索系统导论.北京:书目文献出版社.199315李春葆,张植民.visualbasic数据库系统设计与开发.北京:清华大学出版社.200316郑阿奇,曹弋.visualbasic实用教程.北京:电子工业出版社.2000.10 anyway, i was here in amber some years ago. not doing much of anything. just visiting and being a nuisance. dad was still around, and when i noticed that he was getting into one of his grumpy moods, i decided it was time to take a walk. a long one. i had often noticed that his fondness for me tended to increase as an inverse function of my proximity. he gave me a fancy riding crop for a going-away present-to hasten the process of affection, i suppose. still, it was a very nice crop-silver-chased, beautifully tooled-and i made good use of it. i had decided to go looking for an assemblage of all my simple pleasures in one small nook of shadow. it was a long ride-i will not bore you with the details-and it was pretty far from amber, as such things go. this time, i was not looking for a place where i would be especially important. that can get either boring or difficult fairly quickly, depending on how responsible you want to be. i wanted to be an irresponsible nonentity and just enjoy myself. texorami was a wide open port city, with sultry days and long nights, lots of good music, gambling around the clock, duels every morning and in-between mayhem for those who couldnt wait. and the air currents were fabulous. i had a little red sail plane i used to go sky surfing in, every couple of days. it was the good life. i played drums till all hours in a basement spot up the river where the walls sweated almost as much as the customers and the smoke used to wash around the lights like streams of mi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论