(计算机应用技术专业论文)面向数字化校园的数字档案馆的实现.pdf_第1页
(计算机应用技术专业论文)面向数字化校园的数字档案馆的实现.pdf_第2页
(计算机应用技术专业论文)面向数字化校园的数字档案馆的实现.pdf_第3页
(计算机应用技术专业论文)面向数字化校园的数字档案馆的实现.pdf_第4页
(计算机应用技术专业论文)面向数字化校园的数字档案馆的实现.pdf_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士论文面向数! ,化校同的数:档案馆的实现 摘要 进入2 l 世纪知识经济时代,数字化校园的概念逐步被广泛关注、认同:数 字化校园以计算机技术和网络系统为依托,从环境( 设备教室等) 、资源( 图书 等) 到活动( 包括教学、办公、服务等) 全部信息化,使教学资源得到充分优化 利用的一种虚拟教育环境。 档案信息作为一种富有现实价值和历史价值的原生信息,伴随着社会信息化 的脚步,逐渐迈入了现代化、网络化、智能化的发展轨道。数字化档案馆首先要 求档案信息化:利用数据库技术、数据压缩技术、高速扫描等技术手段,将纸质 文件、声像文件等传统介质的文件和已归档保存的电子档案系统组织成具有有序 结构的档案信息库;同时,通过网络平台,实现高度共享档案信息库。 本课题结合我院数字化档案馆建设的过程,对数据库、信息处理技术等档案 馆建设中若干问题进行探讨,有利于档案部门档案数字化的建设,适应现代信息 技术的挑战。 关键词:网络化,数字化,档案 a b s t r a c t 硕1 :论文 a b s t r a c t i n t ot h e21s tc e n t u r yk n o w l e d g ee c o n o m ye r a , t h ec o n c e p to fd i g i t a lc a m p u s h a v e b e e nd e e p e n e d :i ti st oc o m p u t e rt e c h n o l o g ya n dn e t w o r ks y s t e m sr e l yo n ,f r o m t h ee n v i r o n m e n t ( e q u i p m e n t ,c l a s s r o o m s ,e t c ) ,r e s o u r c e s ( b o o k s ,e r e ) t oa c t i v i t i e s ( i n c l u d i n gt e a c h i n g ,o f f i c e ,s e r v i c e s ,e t c ) a l lo ft h ei n f o r m a t i o no r i e n t e d ,s ot h a t t e a c h i n gr e s o u r c e sc a nb ef u l l yo p t i m i z e du s eo fav i r t u a le d u c a t i o n a le n v i r o n m e n t f i l ei n f o r m a t i o na sar i c ha n dh i s t o r i c a lv a l u eo ft h er e a lv a l u eo ft h eo r i g i n a l h e a l t hm e s s a g e s ,a l o n gw i t ht h ep a c eo fs o c i a li n f o r m a t i o n , a n dg r a d u a l l yi n t oa m o d e m ,n e t w o r k e da n di n t e l l i g e n td e v e l o p m e n tt r a c k d i g i t a la r c h i v e so ft h ef i r s tt o r e q u e s tt h ef i l ei n f o r m a t i o n :u s i n gd a t a b a s et e c h n o l o g y , d a t ac o m p r e s s i o nt e c h n o l o g y , h i g h s p e e ds c a n n i n gt e c h n i q u e s ,t h ep a p e rd o c u m e n t s ,a u d i oa n dv i d e of i l e sa n do t h e r t r a d i t i o n a lm e d i at os a v ea r c h i v e dd o c u m e n t sa n da ne l e c t r o n i cf i l es y s t e mo r g a n i z e d i n t oas t r u c t u r e 晰t 1 1o r d e r e dt h ef i l ei n f o r m a t i o nd a t a b a s e ;t h es a m et i m e t h r o u g ht h e n e t w o r kp l a t f o r m ,t oa c h i e v eah i 曲d e g r e eo fs h a r e df i l er e p o s i t o r y t h et o p i c so fo u ri n s t i t u t e 、i mad i g i t a la r c h i v e ss h a p et h ep r o c e s so fb u i l d i n g o nt h em a s s i v ed a t a b a s e ,i n f o r m a t i o np r o c e s s i n gt e c h n o l o g ya n do t h e ra r c h i v e st o e x p l o r et h eb u i l d i n go fan u m b e ro fi s s u e s ,c a ng u i d et h ea r c h i v e sd e p a r t m e n to ft h e c o n s t r u c t i o no ft h e d i g i t a lf i l e t om e e tt h e c h a l l e n g e s o fm o d e mi n f o r m a t i o n t e c h n o l o g y k e yw o r d :n e t w o r k - b a s e d ,d i g i t i z e d ,a r c h i v e s n 硕1 :论文面向数字化校阔的数 档案馆的实现 图表目录 图1 1 数字化校园体系结构2 图3 1s s 结构图一一一一”8 图3 2 信息采集需求分析图9 图3 3 功能管理结构图1 1 图3 4 数据库系统的系统结构1 4 图3 5 档案管理系统e _ r 图”1 6 图3 6 党群档案管理表d q g l d a 1 8 图3 7 员工登录信息表y g b 1 9 图3 8 附件链接表f j 1 9 图4 1 校园局域网络2 2 图4 2 档案目录采集界面2 3 图4 3 档案条目的目录2 3 图4 4 模糊检索2 9 图4 5 检索结果3 0 图4 6 按年代对档案总数统计的结果3 1 图4 7 到期档案与利用情况分析统计表3 1 图4 8 档案借阅登记界面3 1 图4 9 催还单3 2 图4 1 0 数据按类目导入( 出) 示意图3 2 图4 1 1 用户登录界面3 3 图4 1 2 对每个用户设置不同使用权限3 3 图4 1 3 数据库备份3 4 图4 1 4 数据库恢复3 5 i i i 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生签名: 舀左塑 知解月日 v 弋,- 一 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的部分或全部内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名: 砼晷 卜f j 年1 ( 月 日 硕_ i :论文面向数宁化校阔的数字档案馆的实现 l 绪论 进入以信息时代为标志的2 1 世纪后,随着计算机多媒体技术和网络通信技 术的迅猛发展,传统高等教育的校园模式已经越来越不适应时代的发展,建设数 字化校园就成为一个摆在各大高校面前急待完成的任务。数字档案馆作为数字化 校园的核心应用支撑系统之一,它的概念正逐渐被提出并受到广泛的关注,它的 出现和发展不仅从根本上改变了档案馆的工作模式和服务类型,而且为档案信息 的共享提供了更为广阔的发展空间。 1 1 课题研究背景 1 9 9 0 年由美国克莱蒙特大学教授凯尼斯格林( k e m t hg r e e n ) 发起并主持 的一项大型科研项目“信息化校园计划”( t h ec a m p u sc o m p u t i n gp r o j e c t ) ,是 数字化校园概念的最早出现。1 9 9 8 年1 月3 1 日,美国前副总统戈尔在美国加利 福尼亚科学中心发表了题为“数字地球:二十一世纪认识地球的方式( t h e d i g i t a le a r t h :u n d e r s t a n d i n go u rp l a n e ti nt h e2 1s tc e n t u r y ) 的演讲, 最先提出“数字地球”概念,全世界普遍接受数字化概念,引出“数字城市 、 “数字校园 等各种概念。进入2 1 世纪后,数字化校园的概念得到了进一步的 深化:数字化校园是一个非常广泛的概念,它是以计算机网络为基础,从环境( 包 括设备、教室等) 、资源( 如图书、讲义电子课件等) 到活动( 包括教学、科研、管 理、办公、服务、教学质素反馈等) 全部信息化。 数字化校园是新型的大学模式,是校园信息化建设的高级阶段。“数字化校 园 用层次化、整体化的观点实施校园的信息化建设,它是在传统的校园基础上, 利用计算机技术、网络技术、通讯技术对学校的教学、科研、管理、服务等有关 的资源进行全面的数字化,校园网络和各种应用系统是整个校园的神经系统,管 理人员可以更科学更规范地管理、发布自己的数据,将学校建成超越时间和空间 的虚拟校园,为师生提供网上信息交流环境,用户可以在网上快速发现自己需求 的信息,从而达到提高教学质量、管理水平、科研水平的目的。 “数字化校园是以数字化信息为基础,以计算机技术和网络系统为依托, 支持学校教学、科研和管理信息的网上信息流,实现教学、管理、科研、服务等 信息的收集、处理、存储和应用,使教学资源得到充分优化利用的一种虚拟教育 环境【l l o 数字化校园的体系结构为: ( 1 ) 网络基础层。网络基础层是数字化校园的基础设施,是数字化校园中“数 l 绪论硕上论文 字信息”流动的通道。基础设施不完善,“数字信息就不能流动,就不能形成 数字空间。网络基础层是指各种硬件设施,包括网络线路、交换路由设备、服务 器等。 ( 2 ) 网络基本服务层。网络基本服务层包括电子邮件、信息发布、域名服务、 身份认证、文件传输等,它是数字流动的软件基础。 ( 3 ) 应用支撑系统层。主要包括办公自动化系统、数字图书馆、数字档案馆、 网络教学系统、教务管理系统等。它直接管理各种信息资源,是数字化校园的核 心支持系统。 ( 4 ) 信息服务层。它是面向用户提供服务的一个接口,用户发出请求,信息服 务层将数据提供给用户,比如信息查询等。 ( 5 ) 虚拟大学层。虚拟大学是校园数字化后向社会沿伸,校园功能自然扩展, 它使得大学成为一个无疆域大学,用户可以在这个“大学”里获得与其身份相对 应的信息与服务瞳1 。 数字化校园体系结构如图1 1 所示。 图1 1 数字化校园体系结构 本课题主要研究数字化校园第三层中数字档案馆的实现等相关问题。随着数 字化校园建设进程的不断深入,数字档案馆作为数字化校园建设的一个有机组成 2 硕士论文面向数字化校同的数档案馆的实现 部分,它的建设成为必然的发展趋势。对于档案信息来说,它只有在传播中才能 创造价值。档案馆的数字化建设可以有效拓展档案信息的传播路径,因此成为档 案馆自身发展的迫切需要。档案馆其所存储信息的价值在于传播,而不在于储藏。 档案的价值需要通过对档案信息的处理、传递与广泛利用来实现,如果档案只保 存在档案库房中,其价值是很有限的。高校档案部门作为一个信息服务机构,其 生存条件就在于数据库化的信息和网络化的服务。所以高校的档案部门要积极创 造条件建设数字化档案馆,从而可以及时接收、归档网上的电子文件,实时采集 学校各基层的电子信息、电子文件,同时在网络上发布、传播馆藏非保密的档案 信息,并在工作过程中实现档案信息处理计算机化、信息存储数字化、信息采集 实时化、信息服务利用网络化,以便最大限度地发挥档案的作用,为学校的改革 发展服务。 1 2 课题研究意义 进入数字时代以来,信息化程度包括信息技术水平的提高,信息产业的发展, 对信息资源的占有和利用已经被当做衡量数字化校园建设的重要尺度,高校数字 档案馆是档案工作随着数字化校园发展到一定阶段而出现的一种新的工作趋势。 随着我校信息化建设的实施,数字校园的成功运转,为学校信息管理提供了先进 的技术手段和崭新的网络环境。一方面,档案部门出于自身管理需要使用计算机 管理档案,以方便信息统计与查询,使传统以纸质为载体形式的档案信息逐步向 数字格式转变。另一方面,计算机大量应用于高校教学、科研及管理,我院又采 用了网上无纸化办公系统,网上处理日常的各种文件,产生了大量的电子文件, 进而形成数字化形态的档案信息。面对数量众多的传统档案和新载体的数字文件 档案,开展档案数字化档案馆建设,规范其管理,更好地为学校各项工作提供档 案信息服务,成为档案部门的当务之急。 2 0 0 4 年以来,我院着手数字档案馆的初期建设,构建了档案馆局域网络, 使用单机版档案管理系统进行档案日常管理,后来随着信息化程度的不断提高, 我院对档案管理系统进行了升级、改版,并将馆藏档案全部数字化,提高了档案 馆对信息资源的掌握、分析和反应能力,实现档案管理的标准化、信息化、数字 化、规范化,提高了档案馆的服务水平。数字档案馆是以数字技术和数字化信息 资源为基础,当档案转化为数字化信息后,必将有利于档案信息资源的开发利用。 首先,数字化的档案信息打破了档案利用上的时间概念,利用网络的传输便利, 提供快速有效的利用服务,使异地档案资源传输和利用成为可能,使档案工作服 务的时效性更加突出,实现档案信息资源最大限度的共享。其次,传统的手工方 式处理档案管理、查询和利用,速度较慢而且准确率低,数字档案馆便于利用计 l 绪论硕j :论文 算机进行检索、统计等各种日常管理,有利于档案信息资源的快速、高效地开发 利用。 数字档案馆的实现对促进学校馆藏档案管理有着重要的意义。数字档案馆使 馆藏的原有纸质、声像等多种档案载体变为电子档案载体,彻底改进现有的管理 方式,发挥现有管理方式不能实现的作用。首先,在数字化环境下,进一步改变 馆藏档案结构,节省存储空间,大量的电子档案不需要有形的档案密集架架来存 放,馆藏档案信息量得以增长,节省了资源。其次,延长了档案原件的寿命,档 案的查阅利用不再需要反复翻阅原件,直接调用电子全文档案,阅览和打印,降 低档案原件丢失与损坏的风险,还可以解决纸张脆化的档案利用问题,保护了档 案原件。档案数字化还可以用某种方法增强了原始档案信息:通过各种编辑软件 消除档案上外来的斑痕、污迹等方式改善、恢复原始档案的信息,并且持久清晰 便于反复使用。 1 3 论文结构安排 本文从数字化档案馆的概念入手,研究了该系统项目的属性特点、结构、功 能以及各功能模块的具体实现。 论文共分五个章节。分别是绪论、数字档案馆的概述、数字档案馆的总体设 计、数字档案馆的实现、结论。 第一章介绍了数字化档案馆的研究背景:随着计算机技术和网络通信技术迅 猛发展,各高校都加入了建设数字化校园的大军,以充分利用各种教学资源,作 为数字化校园的核心应用支撑系统之一数字档案馆的建设成为必然的发展 趋势,同时阐述了数字档案馆的研究意义。 第二章介绍了数字档案馆的概念、属性、基本特征和基本功能,从整体上对 数字化档案馆进行描述。 第三章介绍了数字档案馆的总体设计,包括系统的拓扑结构、数字档案馆的 功能需求分析和数据库设计。 第四章在前面总体设计的基础上,对数字档案馆的各功能模块进行具体实 现,并给出部分重要的功能程序。 第五章结论,分析了数字化档案馆正常运行后的优点,同时也指出了几点不 足之处,已待其功能的进一步完善。 1 4 本章小结 本章简要介绍了课题的研究背景,研究本课题的意义,并对论文的篇章结构 进行了扼要介绍。 4 硕士论文面向数二化校同的数档案馆的实现 2 数字档案馆概述 2 1 数字档案馆的概念 数字档案馆是建立在现代信息技术普遍应用的基础上,利用数字化手段,以 数字档案信息资源为核心,对档案信息资源进行存储、管理和维护等管理,通过 网络通信设施进行连接和提供利用,实现资源的共享的信息系统。数字档案馆的 特征是“有序的信息空间和开放的信息环境”,它是办公自动化系统、公共信息 数据管理系统等大系统的组成部分。 “数字档案馆”的概念有广义和狭义之分。广义的数字档案馆是指存储和利 用档案信息资源的信息空间,是一个由众多档案资源库群、档案信息资源处理中 心、档案用户群构成的数字档案馆群体。狭义的数字档案馆则是指广义数字档案 馆中的个体档案馆,代表的是一种信息环境和基础设施的构建,即硬件设施的架 构,软件系统的设计和实现,实体档案馆的建立,包括档案信息的收集、整理、 编目、校藏档案数字化、归档、保管、检索、利用、鉴定和统计等内容。 从信息服务的角度来看,数字档案馆是一个电子化信息的仓储,能够存储大 量各种形式的档案信息,用户可以通过网络方便地访问它,以获得这些信息,并 且其信息存储和用户访问不受地域限制”【3 j 。 从技术角度来看,数字档案馆是指“用二进制编码的数字方式存储、处理档 案信息内容,应用计算机、通讯和多媒体技术,提供电子网络检索和服务的档案 信息系统 4 j 。 从资源共享的角度看,数字档案馆“是一个数字化的信息系统,它把分散于 不同载体、不同地理位置的信息资源以数字化的形式存贮,以网络化的方式互相 连接,从而提供及时利用,实现档案资源共享”【5 】。 综合以上各种表述,可以给数字档案馆下这样一个定义,即:数字档案馆是 建立在现代信息技术普遍应用的基础上,以数字档案信息资源为主要对象,实施 档案的数字化存储、管理和维护,以网络化的方式将档案资源信息进行连接,使 档案信息的利用不受时间和空间的限制,实现资源共享的信息系统。 2 2 数字档案馆的属性 数字档案馆的建设涉及档案工作业务流程的计算机化和校藏档案的数字 化。它代表了网络环境下档案信息资源的整体处理方式,涉及到一系列档案标准 规范的制定和推行、硬件基础设施构建、数字资源建设、应用系统开发、人才队 伍培养等方方面面内容,是一个与计算机工程、软件工程、网络工程等有着密切 5 2 数字档案馆概述硕十论文 联系的系统工程【6 1 。 2 3 数字档案馆的基本特征 与数字图书馆和数字中心等数字化信息系统不同,数字档案馆是存储和利用 数字化档案信息的基地和中心,档案信息是具有凭证价值的原始信息,数字档案 馆采用的标准和技术规范同时也必须满足传统档案信息和档案馆的标准和要求。 数字档案馆具有如下基本特征。 第一,校藏档案实体的数字化。档案馆的物质基础是档案,数字档案馆保存 的实体就是由传统档案转换而来或是办公自动化过程中直接形成的电子档案。目 前,各级档案馆的档案主要是以纸质载体档案为主,所以,将校藏的传统档案转 化成数字的形式,成为信息社会的客观需要,是档案资源进入信息网络并实现资 源共享的前提。计算机技术和网络技术的广泛应用,使档案工作的客观物质基础 发生了重大的变化【7 1 。 第二,档案传输网络化。数字化是信息社会的特征,是以电脑的广泛使用为 基础,以网络技术的普及和发展为标志的。现代网络的特点是适时性、开放性、 交互性、高速、方便、快捷,人们通过网络通信设备,随时随地进行沟通,不受 任何限制。随着学校办公系统实现“无纸化 ,网络技术在办公自动化中广泛应 用,档案信息也逐渐以数字的形式存在并通过网络进行传输,将数字化的档案信 息通过网络及时进行网上收集、归档、鉴定和保管,并通过网络进行交换、传播, 电子档案的采集既是档案馆数字化的重要手段,也将成为数字档案馆的一项基础 性工作【8 j 。 第三,空自j 虚拟化。数字档案馆可以实现不同地域、多个数据库的连接,档 案使用者可以不受空间的限制,通过远程登录、查询使用数字档案馆的数据,方 便快捷地获取自己所需的信息。 第四,档案信息共享化。档案工作的目的是方便社会利用,数字档案馆的建 立就是为了更好地提供社会利用。要实现档案利用共享化,档案馆上网是最基础 的工作。只有尽快将各类校藏档案数字化,建立档案馆网站,实现档案信息社会 共享,才能更大程度上发挥数字档案馆的作用。 第五,档案服务知识化。知识化是指档案利用时提供的是以知识为主要内容 的产品。知识经济时代是以知识的生产、使用为基础,知识管理和网络信息环境 要求档案服务不能停留在仅提供原始档案实体的层次上,而应该实现档案材料的 分析再加工,档案管理必须实现由保管元到知识元的处理,转化成二次信息或是 三次信息。知识化是档案服务的最高层次,也是数字化档案馆发展的基本目标。 能否提供知识化的服务及产品,将决定数字化档案馆的生存。 6 硕j 二论文面向数字化校冈的数档案馆的实现 第六,方便快捷化。人们不用到档案馆就可以在一定的权限范围内通过计算 机查到自己所需要的信息,利用方便快捷。数字档案馆的这种优越性能满足档案 利用者的多方面需求,更多的人愿意通过网络利用档案资源。 2 4 数字档案馆的基本功能 数字档案馆与传统档案馆类似,具备两大基本功能:一、采集档案信息并安 全保管;二、管理档案信息,提供各种服务。主要职能包括: 第一,数字档案信息采集功能 数字档案馆的基石是内容丰富的档案信息,数字档案馆是数字档案信息贮存 的基地。它主要针对三个方面的档案信息进行采集和保管:一是档案目录信息的 采集;二是将现有校藏纸质档案进行数字化,实现数字化档案资源在网络上的发 布和传递;三是接收办公自动化系统中办理完毕应当归档的电子文件,实现电子 文件的及时归档,真正实现文档一体化。 第二,数字档案信息管理功能 数字档案馆提供了新的信息和知识传播手段,改变了档案利用服务以提供物 理实体为主的传统方式,指引终端用户通过网络获驭存储在各个站点的档案信息 资源,为用户提供超越时空限制的个性化服务,利用者可以通过网络对数字化档 案信息资源进行查阅( 包括目录、索引和全文) 。数字档案馆具有友好的用户界面 以及完善的借阅管理和调用控制功能,有借阅、催还功能,对档案进行分析统计, 有多种查询途径、强大的检索能力、能根据检索项提供多条件组合查询,并能对 常用检索途径进行优化,满足用户对查全率和查准率的要求;能对查询结果进行 显示、排序、转存、打印输出等技术处理。用数字化手段对档案业务各流程进行 管理,实现整个档案馆业务流程的全面数字化。 2 5 本章小结 本章介绍了数字档案馆的概念、属性、基本特征和基本功能,数字档案馆是 软件工程、网络工程、计算机工程、信息组织工程密切联系的系统工程,它的实 现可以摆脱传统档案馆的手工操作和管理,突破了时间和空间的限制,档案信息 可以获得最大程度上的共享。 7 3 数档案馆的总体设计硕士论文 3 数字档案馆的总体设计 3 1 系统的拓扑结构 在系统的拓扑结构上,最初我们采用传统的客户服务器( c s ) 模式,即将 所有的档案数据集中存储,档案的管理和利用局限在档案馆的内部。对于系统中 的每一个数据库和文件服务器,都采用( c s ) 结构的工作方式,每一个子系统中, 按需要同时配置一个或多个的客户机作为档案录入和校验的工作站。这种拓扑结 构,对于数据量小和用户少的情况,工作的很好。但是,当数据量变大,用户增 多时,系统运行的就比较糟糕。根据档案管理系统的实际情况,即档案数据量逐 渐增大,档案数据需要分布存储,并且希望档案数据通过授权的形式提供给各种 用户使用,同时考虑到档案文书的数字化,我们将系统升级成浏览器服务器 ( b s ) 软件模式,通过这种转化很好的解决了大数据量、多用户、分布式的问 题,这种结构有非常大的灵活性。 采用b s 模式,客户端无需安装任何的应用程序,仅仅只需一个浏览器,就 可以通过授权在任何位置使用系统中除档案数据采集以外的所有功能。在b s 结 构中,我们使用了一个w e b 服务器和一个应用程序服务器,w e b 服务器用来 响应客户端( 浏览器) 的请求,然后将所有的处理工作交给应用程序服务器来处 理,最后w e b 服务器将处理的应用程序服务器处理的结果返回给客户端。通过 这种b s 模式,可以为系统提供简单、统一的设计接口,而所有复杂的工作全部 交给应用程序服务器处理。应用程序服务器通过一定的协议访问所有分布在各个 物理位置的数据库和文件服务器,向客户提供统一的服务。如图3 1 所示。 浏 h t t p 协议方式的请求数据请求。,一 r 数据库 览w e b 器 发同浏锰器 服务器 返同数据结果 服务器 、一一一一 图3 1b s 结构 3 2 数字档案馆的功能设计 数字档案馆按照功能主要由以下三个模块构成:一、信息采集模块;二、信 息管理模块;三、系统维护模块。 8 硕j :论文面向数 化校阔的数字档案馆的实现 3 2 1 信息采集模块 信息采集模块指数字档案馆将各种非结构化的信息保存到结构化的数据库 中,包括:档案目录的采集,馆藏档案的数字化信息采集,电子文件的收集归档 等。 信息采集流程如图3 2 所示: 厶基刁 图3 2信息采集流程 l 、档案目录的采集 档案是在文件办理完毕后,经过鉴定归档转化形成的,档案的管理活动有其 自身的一套规则,编制档案目录数据是其重要环节,最终形成目录汇总集,根据 用户的需求开展各种查询、利用服务。 2 、馆藏档案数字化 ( 1 ) 制定统一的信息采集标准和规范 p d f 文件规范,由于其“高保真的特性,己成为事实上的国际标准,被 广泛应用于电子文件传递、交换和发行。p d f 兼容了结构化正文格式与图像格式 的特性,既可以基于正文使用该文档,也可以通过它在屏幕上的外观显示使用该 文档。但该格式的最大优点还在于能如实保留原有文件的内容与外观,具有将源 文件的正文与视图原貌忠实地编码能力,能保留源文件的字体、版式、颜色、图 形等原始文件的内容与版面的所有细节,从而实现印刷型文件在计算机上的原版 再现,集多媒体信息于一身。同时,p d f 文件占用的空间小,非常便利于互联网 的发放和信息传播,已成为馆藏档案数字化信息的标准文件格式。 9 3 数,档案馆的总体设计 硕士论文 在档案原件被转化前和转化时,要确保原件不被篡改、修饰、覆盖和添加; 在扫描后将信号输入计算机等设备时不被修改、删除和添加,能够按原貌再现。 档案馆保管的传统档案的数量巨大,档案的价值也有不同,所以档案馆要根 据校藏情况、服务对象和档案馆的功能类型,有重点、有选择地对校藏档案进行 数字化,要综合分析校藏档案的价值特点,兼顾利用需求。 第一,对档案馆中永久收藏的并且出于安全考虑不方便用户随时翻阅原件的 珍贵档案进行数字化。 第二,对具有长远使用价值的档案进行数字化。 第三,对利用率高、需求量大的开放档案进行数字化。 第四,校藏的珍本和孤本应当优先数字化。 ( 2 ) 具体实现 目j j 馆藏纸质档案信息采集主要是利用高速扫描仪将档案馆中己经开放的 并且是需要优先上网的档案逐一扫描成为图像信息,标引编目后存储在硬盘或是 光盘的数据库中,通过挂接程序实现与档案目录信息挂接,提供给用户通过互联 网进行检索和查阅,可以获取较为清晰的图像,直接查看原文。 3 、电子文件的收集 随着数字化校园的不断深入,我校采用了无纸化办公系统,不再产生大量的 传统的纸质、声像类档案,数字档案馆需要开发程序,将档案数据库和办公自动 化系统数据库对接,电子档案按要求直接转到档案数据库,实现实时采集电子文 件归档成档案。 3 2 2 信息管理模块 现代技术的发展导致了档案数量急剧增加、档案利用率不断提高,传统的手 工管理、档案检索、统计等工作方法无法解决档案工作面临的种种难题。出现各 种矛盾,比如,档案数量的日益增长与管理资源的矛盾:档案寿命有限与需要长 久保存的矛盾;利用需求增多等等,无不需要现代化手段解决。数字档案馆利用 计算机技术管理档案,实现档案资源不受任何空间和时间限制的共享。信息管理 模块结构如图3 3 所示: l o 硕= 1 :论文匝向数字化校同的数字档案馆的实现 图3 3信息管理模块结构 ( 1 ) 档案查询 档案查询是数字档案馆最主要的功能,目的是帮助用户快速、方便地查询到 自己想要找到的档案条目。用户可以通过从档案的主要特征:档号、标题、责任 者、日期、主题词等关键词匹配进行检索,既可单一条件检索,也可以几个条件 综合检索或者输入部分内容进行模糊检索。 ( 2 ) 档案修改 在使用过程中发现录入档案数据有误或者档案条目涉及的信息由变化,有 修改全新啊的管理员可以对档案数据进行相应的修改。 ( 3 ) 统计、分析功能 对各类档案进行归档统计,按类别、年度、类目号等条件统计保管期限为永 久、长期、短期的卷宗、文件总数等,以了解库存档案的情况,通过档案利用情 况的统计,了解档案利用构成情况。 ( 4 ) 借阅、催还功能 利用计算机及加密技术,识别用户合法身份,办理借阅手续,随时掌握利用 者正在调阅的档案数量、调阅时间、密级等情况,可计算归还时间,若到期未还, 可打印催还通知。 ( 5 ) 文件导入( 导出) 功能 导出功能就是将全部归档文件导出生成文本文件( 幸t x t ) ,另一方面也可以 通过档案软件的数据恢复功能将数据按档案类别导入数据库中。 ( 6 ) 打印功能 对各类档案报表、查询结果进行打印。 3 2 3 系统维护模块 网络技术的飞速发展和网络的日益普及,信息量的高速增长,使得信息交流 3 数宁档案馆的总体设计硕土论文 空前简化,系统故障、人为误操作、计算机病毒、黑客攻击等不确定因素在时刻 威胁着信息的安全。 信息安全指数据的保密性、完整性、真实性、可用性、不可否认性及可控性 等,保证信息安全可采用。信息系统的安全是数字档案馆实现的重点。 信息系统安全已引起大家的高度重视。对网上的信息,如果安全得不到保障, 攻击破坏者就可以通过窃取相关数据密码获得相应的权限,然后进行非法操作。 所以,在这个虚拟的网络社会中,安全问题显得至关重要。随着社会信息化程度 的不断提高,信息系统的安全与否已成为影响校园网安全的重要因素。 保密性:保证非授权操作不能获取受保护的信息或计算机资源。 完整性:保证非授权操作不能修改数据。 有效性:保证非授权操作不能破坏信息或计算机资源。所以,网络信息系统 以信息流为中心,依赖网络设施完成信息流通。 系统维护模块的主要功能有:身份认证机制、访问控制技术、防火墙控制等。 1 、身份认证机制。 网络安全的第一道防线就是身份认证机制,它也是最重要的一道防线。用户 代理在访问服务器代理时,首先经过的是身份认证过程:用户输入用户名和密码, 同时发出认证请求:管理服务器收到用户请求后,身份认证机制对用户的身份进 行判定,判断其是否为合法用户,对于不合法的用户则拒绝访问。可见,身份认 证机制是保护系统安全的基础设施,是最基本的安全服纠明。 2 、访问控制技术。 访问控制规定了主体对客体访问的限制,客体指系统的资源,主体指访问资 源的用户,确定该合法用户在系统中对哪类信息有什么样的访问权限。用户访问 权限是指不同的用户对于不同的数据对象允许执行不同的操作权限,在数据库系 统中,每个用户只能访问他有权存取的数据并执行有权使用的操作,因此,必须 预先定义用户的存取权限。用户权限管理是档案信息安全性控制的重要环节,系 统能将不同的用户分配为各自的安全角色,并规定每一个角色的访问系统的权 限。 3 、防火墙控制 “防火墙 是设置在被保护网络和外部网络之间的一道屏障,在外部网与内 部网之间建立起一个安全网关,从而防止发生不可预测的、潜在破坏性的侵入。 它可以通过监测、限制、更改跨越防火墙的数据流,尽可能地对外部屏敝网络内 部的信息、结构和运行状况,以此来实现网络的安全保护。常见的防火墙可以归 为三类,即包过滤防火墙、双宿网关防火墙和屏蔽子网防火墙。【l o 】它既可以阻止 对本系统信息资源的非法访问,又可以组织秘密信息被非法输出,并防止病毒入 1 2 硕十论文面向数宁化校园的数: 档案馆的实现 侵。 防火墙技术并不是万能的,它无法抵御来自内部的攻击,也无法抵御因底层 系统中的弱点而造成的危害,在实际工作中要与其他安全系统配合使用。 4 、信息加密 信息加密是为提高数字档案信息的保密性所采用的主要技术手段之一,一般 与防火墙技术配合使用。加密就是利用一定的加密算法将明文转换成无意义的密 文,阻止非法用户理解原始数据,从而确保数据的安全性。按作用不同,数据加 密技术主要分为数据传输加密技术、数据存储加密技术、数据完整性鉴别技术以 及密钥管理技术四种。我院数字档案馆在数据存储加密技术上得到了保障,防止 在存储环节上的信息失密,可以保障数字档案信息的保密性和完整性【l o l 。 5 、病毒防治 信息安全主要的敌人就是计算机病毒。网络病毒的泛滥对计算机网络系统构 成严重的威胁,它以各种方式破坏档案信息的有效性和完整性。我院数字档案馆 密切关注网络病毒动态,适时对服务器和客户端查毒、杀毒,并制定严格的防毒 制度,保障数字档案信息的完整性和可用性。 6 、数据备份与恢复。 数据备份与恢复系统,也称为容灾系统或灾难恢复系统,就是通过特定的数 据备份恢复机制,能够在各种灾难损害发生后,仍然能够最大限度地保障提供正 常应用服务的计算机信息系统,是数据库管理员维护数据库安全性和完整性的重 要操作。 通常的备份方式有三种,它们是完全备份,增量备份和差量备份。本系统采 用s q l 企业管理器来实现完全备份数据库。完全备份是指对整个系统( 如组成 服务器的所有卷) 或用户指定的所有文件数据进行一次全面的备份。这是最基本 也是最简单的备份方式。如果在备份间隔期间出现数据丢失等问题,可以只使用 一份备份文件就可以快速的恢复所丢失的数据。 恢复数据库就是把原来备份的数据恢复到备份前的状态。恢复数据库时,s o l s e r v e r 会自动将备份文件中的数据全部复制到数据库,并回滚任何未完成的事 务,以保证数据库中数据的一致性。本系统恢复数据库是使用s q ls e r v e r 企业管 理器实现。 3 3 数据库设计 数据库是指:长期储存在计算机内的、有组织的、可共享的数据集合。目 前数据库的种类很多,如o r a c l e 、s y b a s e 、d b 2 、s q ls e r v e r 等大型数据库,以 及a c c e s s 、m y s q l 、b d 2 等小型数据库。 1 3 3 数7 档案馆的总体设计硕t 论文 s q ls e r v e r 是微软在w i n d o w s 平台上开发的数据库,提供了强大的数据管 理功能。它具有支持远程管理功能,数据库管理员可以通过网络使用s q ls e v e r e n t e r p r i s em a n a g e r 来管理s q ls e r v e r 服务器;提供稳定的数据备份、恢复功能, 联机分析处理数据库中的数据和复杂查询。 结合实际情况本系统后台数据库采用m i c r o s o f s q ls e r v e r2 0 0 0 。 3 3 1 数据库系统系统结构1 1 1 l 从数据库管理系统角度看,数据库系统通常采用三级模式结构,这三级模式 结构是指数据库系统是由外模式、模式和内模式这三级构成。如图3 4 所示。 图3 4 数据库系统的系统结构 模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有 用户的公共数据视图,是对数据库中全体数据的逻辑结构和特征的描述,不涉及 到具体的值。 外模式是数据库用户( 包括应用程序员和最终用户) 能够看见和使用的局部 数据的逻辑结构和特征的描述,是与某一应用有关的数据的逻辑表示。 内模式是数据物理结构和存储方式的描述,是数据在数据库内部的表示方 式。一个数据库只有一个内模式,它是数据库管理系统对数据库中数据进行有效 1 4 硕 :论文面向数字化校同的数档案馆的实现 组织和管理的方法。 对于每一个外模式,数据库系统都有一个外模式模式映象,它定义了外模 式与模式之间的对应关系。这些映象定义通常饱含在各自外模式的描述中。当模 式改变时,由数据库管理员对各个外模式模式的映象作用相应改变,可以使外 模式保持不变,从而应用程序不必修改,保证了数据的逻辑独立性。 数据库系统的三级模式结构将数据库的全局逻辑结构同用户的局部逻辑结 构和物理存储结构区分开来,给数据库的组织和使用带来了方便。不同的用户可 以有各自的数据视图,所有用户的数据视图集中在一起统一组织,消除冗余数据, 提高存取效率,改善性能。 3 3 2 三种模型1 1 2 j l 、概念模型 概念模型是数据库的全局逻辑数据视图,是数据库管理元所看到的实体、实 体属性和实体问的联系。它是一种面向用户面向现实世界的数据模型,按用户的 观点来对数据和信息建模,主要用于描述一个单位的的概念化结构。概念模型包 括以下两个特点: ( 1 ) 具有较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识; ( 2 ) 应用简单、清晰、易于用户理解,是用户与数据库设计人员之间进行交流 的语言。 用于描述概念模型的方法能实体联系模型,即e r 图。 2 、数据模型 数据模型也叫逻辑模型,是按计算机系统的观点对数据建模,通常将数据模 型分为3 种:层次模型、网状( 或网络) 模型和关系模型。数据模型是严格定义 的一组概念的集合,通常由下3 个部分组成。 ( 1 ) 数据结构:用于描述系统的静态特性,研究与数据类型、内容、性质有关 的对象,例如关系模型中的域、属性、关系等。 ( 2 ) 数据操作:主要有检索和更新( 包括插入、删除、修改) 两大类操作。 ( 3 ) 数据的约束条件:数据的约束条件是一组完整性规则的集合。完整性规则 是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据 模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。此外,数 据模型还应该提供定义完整性约束条件的机制。 目前常用的是关系模型,如本系统采用的s q l s e r v e r 2 0 0 0 数据库。 3 、物理模型 数据库的数据最终须存储到存储介质上,反映数据的物理存储方式的数据模 型就是物理模型。它与计算机硬件有着密切的关系。 1 5 3 数7 档案馆的总体设计 硕士论文 3 3 3 数据库表设计 根据档案管理系统的功能及管理的数据及关系,构建相应的e r 图,并创建 相应的数据表。 l 、e r 图 档案管理系统e r 图如图3 5 所示。用户实体和档案实体通过“管理”建立 联系。用户对档案的管理,包括采集档案信息、查询档案、统计分析、借阅催还 等操作。 1 6 图3 5档案管理系统e r 图 硕i :论文面向数7 化校园的数字档案馆的实现 档案可包括纸质档案、声像档案、实物档案等类别,档案实体的属性包括档 号、分类号、正题名、存址、副题名、缩微号、附件链接等。 用户实体可分为只有录入权限的录入员、只有查阅权限的借阅者、可以进行 维护的系统管理员等,用户实体的属性包括:员工编号、姓名、性别、密码、补 码、操作权限、联系电话等。 “管理的属性包括员工编号、档号、使用同期、应还日期、档案状态等。 2 、关系模式 根据上述档案管理系统的e r 图,分析系统开发时所需的表及字段。它们的 关系模式如下: 用户信息( 员工编号,姓名,密码,性别,部门,操作权限,联系电话) 档案( 档号,分类号,正题名,副题名,缩微号,存址,附件链接) 管理( 员工编号,档号,使用日期,应还日期,档案状态) 3 、数据库表 列举几个典型的数据库表如下。 ( 1 ) 党群类档案管理档案表d q g l d a 如图3 9 所示,主要字段包括: n h :分类号,类目的简明编码,我院所有档案采用一种类目,所以此字段为 空: d h :档号,由全宗号、年代、类别号、保管期限、盒号、子件号组成,一个 档案文件对应一个档号,所以此字段不能为空; s w h :缩微号,影像档案的编号,此字段可以为空; c z :存址,指档案文件在库房的具体存放位置。当需要查看档案原件时,可 以先在系统里搜出它存放在哪个库房,哪个档案柜后直接拿取; z t m :正题名,指档案文件的标题,一般查档者都是模糊记住所查档案的名字, 在系统里模糊匹配“正题名 字段查询,即可轻松查出所需档案; t i m :副题名,部分文件可以有副题名,此字段可以为空。等等。 1 7 3 数字柑馆总体设计砸l 论空 3 6 党群档案管理表d q g l d a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论