少数民族古籍的数字化及数据库建设.doc_第1页
少数民族古籍的数字化及数据库建设.doc_第2页
少数民族古籍的数字化及数据库建设.doc_第3页
少数民族古籍的数字化及数据库建设.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

少数民族古籍的数字化及数据库建设刘佳摘 要 随着信息技术的飞速发展,作为具有特色馆藏资源的中国少数民族图书馆,如何利用现代的信息技术手段,将特有的少数民族档案、资料、图书等内容进行数字化的管理与利用是摆在我们面前的一项艰巨的任务并且这项工作势在必行。本人着重阐述了少数民族古籍的定义、特点以及少数民族古籍数据库建设等一系列的问题。关键词 少数民族古籍 数字化 数据库建设 中华民族文化是古老、伟大、多元的文化,是共同生活在中华民族这个大家庭里的各个民族共同缔造的文化。少数民族文献是浩瀚的中国文献宝库中的一颗璀璨明珠。全面系统地研究少数民族文献的历史、现状和发展趋势,深入地总结少数民族文献工作将对建立具有中国特色的文献学体系,弘扬中国多民族文化,促进各民族共同繁荣发展有着重大深远的意义。而在浩繁的少数民族文献中,带有浓郁时代色彩的少数民族古籍以其不可再生的珍贵性更为人们所重视。1少数民族古籍的内涵及其整理的意义古籍即古书。古,是个时间概念,不同时期对古籍的“古”的时间界定也不同。中国的古籍,就现行的形式可分为汉文古籍和少数民族古籍。民族古籍是相对汉文古籍而言的。它囊括55个少数民族的古籍,因此,民族古籍是个总的称呼。少数民族古籍由于历史原因,它不仅是指那些有文字记录的手写的或印刷的出版或非出版物,还包括至今仍流传在民间的口碑文献。而我们在这里要研究讨论的则是有实物存在的少数民族古籍。整理民族古籍是全面继承和发扬中华民族优秀传统文化的重要组成部分,对进一步加强各民族的团结和促进各民族经济、文化繁荣与发展,不仅有深远的历史意义,更有深刻的现实意义。 1.1 我国是一个统一的多民族国家。民族古籍记录了各民族自己独特的形成、发展和统一的过程。通过整理民族古籍,展现这种你中有我,我中有你的源远流长,血肉相连的民族关系,对巩固祖国的统一,反对民族分裂,有着十分重要的意义。 1.2 由于历史原因和正统观念的影响,过去各个少数民族不仅在政治上没有地位,在文化上也没有地位。所以,整理民族古籍不仅能填补某些学科的空白,而且还纠正了某些学术上历史的错误。 1.3 少数民族古籍表面看来是属于本民族自己的历史文化,实际上也是整个人类的文化遗产。民族古籍为充实人类文学、历史、民俗、天文历算、哲学、宗教等学科的研究,提供着极其珍贵的资料。因此,从某种意义上讲,整理民族古籍具有世界意义。2少数民族古籍数字化的概念及其必要性2.1 少数民族古籍数字化的概念 少数民族古籍资源的数字化也是少数民族古籍资源的集成化、有序化和利用便利化。少数民族古籍资源的数字化,就是将长期尘封在书库里的古老的古籍文献资源数字化。目前从信息的存储形式上看,少数民族文献数字化分为图像版和全文版两种。 图像版是利用扫描技术将少数民族古籍以图像方式存入光盘或计算机存储器,这种方式可以保存少数民族古籍的原貌,在技术上比较容易实现,以前国内在民族古籍数字化制作时多采用这种方式。图像版民族古籍存在的缺点是占据存储空间较大,不能检索到字、词,必须配备索引,如果索引过于简单(目前一般只设标题索引),对民族古籍的揭示就会不够深入。但索引越完备,所需的标引工作量就会越大。而针对民族古籍多学科内容并存的现象,图像版的制作技术起到了保存民族古籍的作用,也是目前图书馆最容易实现的方法。全文版是以文本方式将少数民族文献存入光盘或存储器,并在全文检索系统的支持下,对文本实行逐字、词检索。相对于图像版来讲,全文版的少数民族文献具有更大的优点,可以更有效地支持学术研究和快速检索的需要。全文版少数民族文献制作时,民族文字的信息处理技术是关键问题。民族文字信息处理技术的成功开发研制,为少数民族文献数字化建设创造了必要的条件,为少数民族文献的深层次开发利用开辟了广阔的前景。2.2 少数民族古籍数字化的必要性纸质的珍贵少数民族古籍资源、档案资料、技术图纸等的保存,不仅需要占据大量空间,而且还需要适当的物质环境保管条件。一般情况下,随着时间的推移,纸张会出现变色、变质和字迹模糊,加之虫蛀、鼠啮、潮湿等危害,使纸质文献难以持久保存。若查阅、复印次数多,对古籍和档案的磨损程度会加剧。数字化可以妥善解决少数民族古籍这类珍贵文献信息资源的保护和利用问题。当原件处于易损或变质的状态时,数字化可制作视读替代品,以保存原件。数字化替代品的出现,不但使原件的保存具有更可靠的安全性,而且能提高信息内容的使用效率。信息资源数字化有利于少数民族古籍进行长期的保存和保护。而传统的工作方法、落后的技术装备同面临的新情况之间,出现了许多难以解决的问题。只有运用科学管理方法,采用先进的技术设备,把少数民族古籍工作从传统的手工操作转移到现代化的基础上来,实现少数民族古籍工作现代化,才能解决上述问题。少数民族古籍工作现代化是客观形式的需要,是少数民族古籍工作发展的必然趋势,它不仅有助于人们去开发利用少数民族古籍资源,而且对少数民族经济、社会、科学文化的发展都有着不可估量的作用。 3少数民族古籍的数据库建设 所谓数据库就是按一定的组织方式将相关联的数据库集合,存储的总汇。数据库资源建设是图书馆为读者服务的基础,是图书馆自动化的重要组成部分,也是实现资源共享的重要环节。建立少数民族古籍数据库应首先建立书目数据库,有条件再建立综合性、专题性篇目数据库,最后考虑全文数据库。 按少数民族古籍的揭示深度和重要程度分别建立以下几种类型的数据库: 3.1 书目型(索引型)数据库 该数据库将收录图书馆目前所藏有的全部少数民族古籍,可以说是图书馆少数民族古籍的总扩账本,可以展示图书馆少数民族古籍全貌。这是我们目前应建立的首要数据库,也是读者使用率最高的数据库。侧重于对文献的外部特征(如书名、著者、页码、开本、价格、分类号、收藏单位等)进行描述,可以按照CNMARC的格式分字段进行著录,力求为读者提供最多最全的检索途径.利用该库可以检索到那些使用率低的文献。在该库中的数据记录可以按所收录文献内容的学科属性,依据中图法,按普通图书的排列方式进行编排。其特点是文献收集齐全、简明扼要,能最大限度地提供文献的查找途径,对于查找那些长期无人使用的文献很有助益。它是宣传展示馆藏少数民族古籍全貌的最佳方式之一,也是数据库建设必不可少的方式之一。 由于少数民族古籍本身的特殊性,它的书目数据库也与目前的普通图书的书目数据库有所不同,根据新版机读目录格式的规定,我总结了如下几点: 3.1.1 古籍正题名与普通图书正题名信息源之不同。按照新版中国机读目录格式使用手册规定,正题名的信息源是版权页和书名页,尤其以书名页为主;但古籍正题名则依正文卷端所题著录。于是,在做200字段(题名与责任者项)时正题名取自古籍卷首卷端,而其它的如封面题名等著在相关题名字段。 3.1.2 古籍著录设立了许多相关题名字段。其中根据中文古籍编目增加了191、193、194、696;根据中文汉字特点增加了393;封面题名著在512字段;不在卷首的卷端题名与正题名不同时,著在514字段(卷端题名);古籍版心上的题名在515字段(逐页题名);古籍书根上的题名在516字段(书脊题名);另外的函套题名、别名、从属题名、第三个以上合刻题名在517字段(其他题名);对于古籍题名中的繁体字、异体字,在200字段使用简化字、规范字著录,而在517字段记录其繁体字、异体字,以便读者检索;未在古籍中出现的,视具体情况补充的非统一题名的关键词题名或通俗题名,可著录在540字段(编目员补充的附加题名)。 3.1.3 古籍版本项由版本说明、版本附加说明及与本版有关的责任说明组成。其中版本附加说明是对版本类型的补充说明,包括版次、底本版本、影抄、彩色套印、活字制字材料,还包括版次日期的补充说明。 3.1.4 古籍的出版地、出版者是鉴定古籍版本的依据,因此对于210字段(出版发行项)的各个子字段做得很详细,并在620字段著录出版地或制作地,刻书者还要在702个人名称或712团体名称字段加以揭示。 3.1.5 为了说明古籍所含有的书目或索引及其部位设定了320字段(文献内书目、索引附注);相反,说明古籍被何种索引、摘要著录过,或被何种文献引用过而被列入参考书目,用321字段反映。 3.1.6 反映古籍底本的版本情况,所编的古籍是复制品(如:影印本),用324字段(原作版本附注);反映所编古籍的其它复制品信息用325字段(复制品附注)。 3.1.7 许多古籍在一个题名下含有许多子目,很多读者只需要了解文献组成部分或某张照片而不是全文,为此设定了327字段(内容附注)用于子目及重要内容的揭示。 3.1.8 古籍中繁体字较多,系统所使用的字符集中不含有这些繁体字,因此设定了393字段(所缺字符在200字段中用“”代替,不能用空格),它用规定的形式、符号和文字描述字符集所缺字符,并注明其汉语拼音读音。 3.1.9 古籍往往含有许多子目或分册,并且这些子目单立成章,读者只需其中的某一篇而不知总书名,在这种情况下应选用461(总集)、462(分集)、463(单册)字段。 3.1.10 所编古籍文献与一个或一个以上版本相同的文献装订在一起,为了揭示另一古籍文献应选用488字段。 3.1.11 古籍中含有检索意义的附刻、附录、书目、年谱等资料,称为附属文献。附属文献的信息被著录在491字段;附属文献题名若不完整,应在题名的适当部位加“”号标识自拟题名,“”号内的自拟题名一般取自200字段的正题名。若200字段标识附属文献信息,则所属文献的题名信息著录于492字段。 3.1.12 古籍分类号按国内其他分类法分,其分类号著录在696字段。 3.2 提要型(摘录型)数据库 该数据库将图书馆少数民族古籍的形式与内容进行有机结合。有选择性地对一些少数民族古籍在描述其外部特征的基础上,再增加内容提要和概述,以便让读者对图书馆的民族古籍有进一步的了解,从主题方面进行深度检索。该库收录范围包括:有一定研究价值的民族古籍;有一定读者队伍的民族古籍;某一特定专题的所有民族古籍。 3.3 全文型数据库 该数据库级别最高,能提供全方位的检索,是对数据最深度的加工,应当说也是读者最佳的选择。收入该库中的少数民族古籍选择就应慎重,否则会占据硬盘空间,造成人财物的极大浪费。可以在提要型数据库的基础上,进一步筛选出经典的、具进步意义的、受广大用户欢迎的、有效信息量集中的、有极高收藏和研究价值的古籍进行全文录入。4少数民族古籍数据库的筹建 4.1 人员配备数据质量是数据库的生命,而质量的控制体现在生产的每一个过程中。组织有较高综合素质的业务骨干队伍,配备既懂手工编目又懂机读目录的图书编目人员,计算机操作人员,信息开发人员,以及对少数民族古籍文化有一定了解的人员,承担起少数民族古籍的整理、编目、著录、标引、输入等工作,并对建成的数据库进行定期检查和更新,确保为少数民族古籍研究者提供高质量的数据。4.2 资金整理古籍,把祖国宝贵遗产继承下来,是“一项十分重要的、关系到子孙后代的工作”。少数民族古籍资源数据库建设是一项大工程,必须有足够的资金扶持。要积极

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论