


全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
文章来源 毕业论文网 汉文化资料库不同层次的实用要求文章来源 毕业论文网 汉资料库,是一个非常大的概念。它可以是包括诸如文字的、图像的、声音的等等各种表现形式的、古往今来的所有汉文化资料在内。我这里仅就古文献这一层面,并从一名使用者的角度来谈一点不同层次实用要求的意见。一就目前我看到的已制作出来的汉文化古文献数字化资料,数量已不在少数。当然与全部传世古文献相比,也还只是很小一部分。然仅就这些已制作出的古文献数字化资料来看,其中有不少重复的制作,也有不少并不完全符合该古文献实际功能和使用者需要的制作。这也许是由于现在机制的关系,互相封锁,互相竞争,有些重复很难避免。但更多的原因可能是制作者对各类不同性质古籍的使用价值了解不够所造成的。这里、物力、财力的浪费是非常可惜的。因此,如何从整体上来规划汉文化古文献资料库的建设,应当说已经提到日程上来了。这里,我想就目前已制作成成品流通、销售的部分大部头丛书类古籍,作一些简单的评析。这些大部头丛书类古籍(包括传世的和新编的),也正是眼下制作汉文化数字资料库的一个热点。这类古籍数据库中面世最早的大概是古今图书集成,接着是二十四史(或加清史稿为二十五史)、正续资治通鉴、全唐诗等,再下来便是部帙巨大的四库全书、四部丛刊等。其他,如“北京大学与超星公司超星数字图书馆合作推出古籍专题图书馆”中,也提供了大量的古籍丛书类的数据资料库。如:四库全书存目丛书、四库全书禁毁书丛刊、续修四库全书、四库未收书辑刊、丛书集成、二十四史订补、二十五别史、二十五史三编、中国野史集成、中国野史集成续编、北京图书馆藏珍本年谱丛刊、北京大学图书馆藏稿本丛书、北京大学图书馆藏善本医书、善本戏曲丛刊、明清抄本孤本戏曲丛刊、古本小说丛刊等等,都是部头大、史料价值相当高的原始文献。上述文献中,像二十五史、全唐诗、四库全书等,还先后出了好几种版本。此外,佛教经典文献的电子化进程,也是十分值得人们注目的。除了散见的单本佛教经典外,现在可以看到的制作成电子数据库的整部大藏经有:佛梅大藏经、大正藏(155卷、85卷) 、中华大藏经、永乐北藏、龙藏、高丽藏,以及即将面世的佛光大藏经等。道教经典总集道藏和藏外道书也已有图像版在“北京大学图书馆与超星公司超星数字图书馆合作推出古籍专题图书馆”中流通。在这些数据库中,大部分只是图像数据,一部分是电子文本数据(如二十五史、正续资治通鉴、全唐诗、佛梅大藏经、大正藏等),再一部分是图像数据与文本数据对应合成(如四库全书、四部丛刊、高丽藏等)。其中技术表现手段,互有短长,各有特色。如果从制作质量(主要从图像清晰、文字校对质量、缺字处理和解决等方面来衡量)和技术表现手段(主要从系统兼容、浏览界面、检索技术、显示速度等方面来衡量)来比较一下的话,有两件作品值得提出一讲。一是由北京书同文数字化技术有限公司制作的电子版四部丛刊,一是由中华佛学研究所制作的电子版大正藏cbeta 电子佛典(大正版)。这两部作品从制作质量方面来讲,都是上乘的,文本校对精细,缺字的解决也比较完善。如,四部丛刊是用造字和图像字配合,直接显示在文本中;大正藏则全部制作成图像字,而在文本中则以组字形式(按一定规则组成)表达。这样在纯文本中缺字完全以组字形式出现,人们据此可构思出此字字形来,而在超文本或word文本中,则可通过点击组字部分,连结显示该图像字。再有四部丛刊中的原书图像也是相当清晰的。再从技术表现手段方面来讲,这两件作品也都相当优秀。四部丛刊设计了相当美观的浏览界面,电子文本的页面设计得与原书的页面基本一样,每页的行数和每行的字数,乃至双行小注,都一一对应。(按,这里说“基本一样”是以比较苛刻的要求来说的,因为虽说每一页面都能做到行数和每行的字数完全对应,但其中有相当多的页面在处理上还比较粗糙,字体大小变换不当,致使每行字填不满本行的空间,损害了页面的统一与美观)而且,电子文本页与原书图像页之间的连接,一点转换,非常方便,使得使用者在对电子文本产生疑问时,马上就可以调出原书加以核对。这对供研究使用,特别是古籍校勘使用的电子资料库来说,是一项非常重要的内容和功能。本书的检索功能也是相当完美的,书名、作者名、任意字词的检索都极其方便,而且可以快速将检索条目提列出来,给出数,并当点击某一条目时,又能迅速连接显示该条目所在之页面。然本书在技术上最大的突破点,是在它的超平台通用性,它可以在英文windows、繁体中文windows和简体中文windows系统上通用,更关键的通用性是它突破了由于输入简、繁体(无论是gbk码繁体还是btg5码繁体)汉字之间的不相容给检索带来的麻烦,实现了无论输入何种内码繁、简体汉字,它都能自动识别、转换,检索出你所要求的字词条目。目前,不同内码的汉文资料库在不同汉字系统中的显示问题,相对来讲已经不是很大的问题了。然在检索方面用不同内码输入,造成不同汉字系统之间无法实现检索,则还是一个严重的问题。所以四部丛刊系统在这方面的突破,把不同内码的汉文资料库在不同汉字系统中的应用,变成了现实。大正藏在技术表现方面,根据不同使用者的不同需要,通过几种不同层次的电子文本版本来予以体现。它总共提供了6套版本,即:xml版(纯文字档,xml标记)、普及版(一般文字档)、app版(“行末句点”格式之文字档)、rtf版(richtext格式,可在word或是wordpad中浏览)、htmlhe1p版(具有目录、全文检索多功能)、html版(可以直接使用网络浏览器阅读)。使用者可以根据自己的需要来选择,或再一次开发。它在技术上的处理是考虑得非常细致的。如它在普及版和app版中,在每行行首都注明了册数、经文编号、页码、栏位、行数等信息,方便读者复核。又如,在htmlhe1p版中,页面处理上的特点是,首先以大正藏的栏位为基准,每一栏处理成一页显示,以清眉目;其次为消除使用者来回翻页的麻烦与检索的方便,设计者将每页的最后二行重现在下一页的前面,并以蓝色字体显示。同时,这一版本还提供了线上佛学词典(两部),极为方便周到。从以上所列的成果看,汉文化电子资料库的技术表现手段和形式,已经基本成熟了,有些还达到了相当高的水平。当然如果要精益求精,则还有许多技术手段有待提高和完善。从总体上来讲,我认为,目前汉字古文献的电子化工作中迫切需要解决的有三个问题:一是字库(字符集)问题,这是一个极大的专门问题,本文暂且不谈。二是文本的准确性和可靠性问题,什么时候我们的古籍电子文本也能在学术论著中被引用,成为一个被承认的版本,这才能真正体现出电子资料库存在的价值和意义。三是资料库的分类分层次的问题,这也是本文要着重讨论的问题。二作为一名使用者,我认为汉文化古文献资料库,按照文献自身的性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025山东省考试题及答案
- 2025三国闯关考试题及答案
- 2025平安证券开通创业板试题及答案
- 2025年秋招:新媒体运营笔试题目及答案
- 2025年秋招:市场营销题目及答案
- 2025年秋招:客服专员题库及答案
- 2025年煤矿招生笔试题目及答案
- 2025年龙源新能源笔试题库及答案
- 微信课件上传至WPS
- 2025年土建工程培训试题及答案
- 工作总结及工作思路(输电运维班)
- 气管及支气管内插管
- 2025年高处吊篮安装拆卸工(建筑特殊工种)证考试题库
- 2025内蒙古森工集团招聘工勤技能人员3100人笔试参考题库附带答案详解析集合
- 登销记以及运统46系统运用21课件
- 动物育种学第四章生产性能测定
- DB32T 4252-2021 民用建筑燃气安全规范
- 事务所合同管理制度
- 最新五年级上册音乐教案
- 河蟹的营养需要与饲料优化技术
- GHTF—质量管理体系--过程验证指南中文版
评论
0/150
提交评论