DB34∕T 4333-2022 古籍数字化工作指南_第1页
DB34∕T 4333-2022 古籍数字化工作指南_第2页
DB34∕T 4333-2022 古籍数字化工作指南_第3页
DB34∕T 4333-2022 古籍数字化工作指南_第4页
DB34∕T 4333-2022 古籍数字化工作指南_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS01.140.20

CCSA14

34

安徽省地方标准

DB34/T4333—2022

古籍数字化工作指南

DigitizationguidelineofancientChinesebooks

2022-10-26发布2022-11-26实施

安徽省市场监督管理局发布

DB34/T4333—2022

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由安徽省文化和旅游厅提出并归口。

本文件起草单位:安徽省文化和旅游厅、安徽省图书馆。

本文件主要起草人:白宫、王东琪、曹冬生、葛小禾、姚夙阳、刘双葆、陈红军、黄静静、石梅、

彭红、王永光。

I

DB34/T4333—2022

古籍数字化工作指南

1范围

本文件确立了古籍数字化工作的基本要求,并给出了古籍数字化工作项目遴选、数字资源制作、数

据库建设、数字资源发布的一般性方法。

本文件适用于古籍数字化工作。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB18030信息技术中文编码字符集

GB/T21712古籍修复技术规范与质量要求

GB/T31076.1汉文古籍特藏藏品定级第1部分:古籍

GB/T31219.2图书馆馆藏资源数字化加工规范第2部分:文本资源

WH/T66古籍元数据规范

WH/T91汉文古籍集外字描述规范

3术语和定义

下列术语和定义适用于本文件。

古籍ancientChinesebooks

中国古代典籍的简称,主要指书写或印制于1911年以前(含1911年)的普通形制典籍。

注:凡内容具备“三性”(历史文物性、学术资料性、艺术代表性)之一,且采用中国传统装帧形式的书籍,其时

代断限可适当延伸至1949年。

古籍数字化digitizationofancientChinesebooks

古籍整理工作的一部分,从保护和利用古籍的目的出发,采用计算机技术对古籍进行数字化处理,

制成可以再现或检索、阅读、分析的古籍数据库,从多个角度揭示古籍文献信息资源的一项系统工作。

古籍数字资源digitalresourcesofancientChinesebooks

将古籍原件信息转化为数字存储而获得的资源总和。

古籍数据库ancientChinesebooksdatabase

按一定的概念结构组织的数据集合,其概念结构描述古籍数据的特征及其对应实体间的关系。

古籍修复restorationofancientChinesebooks

使破损古籍尽可能恢复原貌,而对其进行去污、脱酸、修补、装订等处理。

1

DB34/T4333—2022

4职责与要求

组织与职责

4.1.1组织

宜成立古籍数字化项目组,分配古籍数字化管理人员、古籍数字化制作人员、古籍书库管理人员、

古籍修复人员和缩微胶片库管理人员工作职责。

4.1.2职责

4.1.2.1古籍数字化管理人员

负责古籍数字化项目的选题、申报、数字化制作来源与方式、制定项目实施方案;管理与过程相关

的人员、设备、财产、数字资源与档案,确保古籍文献和数据资源的安全。

4.1.2.2古籍数字化制作人员

负责古籍数字化的前期准备工作,进行古籍图像的采集、输出、标引、发布、存档、备份和各项统

计,办理古籍原典的出入库交接,对数字化设备进行维护保养。

4.1.2.3古籍书库管理人员

根据古籍数字化计划合理调取古籍,办理古籍出入库交接手续。

4.1.2.4古籍修复人员

修复破损古籍,使其满足数字化需求。

4.1.2.5缩微胶片库管理人员

对缩微胶片进行检验,按数字化制作要求对缩微胶片采取技术处理。

工作环境

应确保古籍安全及古籍受环境影响的合理范围,宜选择在古籍存藏机构内部开展。

工作流程

宜按照项目遴选、数字资源制作、数据库建设、数字资源发布四项流程开展古籍数字化工作。

知识产权

4.4.1宜采用数字水印、安全加密封装等方法保护古籍数字化资源的知识产权。

4.4.2宜对古籍数字化资源规定清晰的版权声明,建立纠纷应对机制,及时发现和管控知识产权风险。

5项目遴选

对象选择

根据古籍存藏情况,优先开展具有地方特色的古籍数字化工作。

版本选择

2

DB34/T4333—2022

5.2.1宜优先选择已入选国家珍贵古籍名录、地方名录或已文物定级的古籍。

5.2.2宜依据GB/T31076.1的规定进行定级,优先选择级别较高的古籍。

5.2.3宜辨别版本优劣,择其善者为数字化底本。所选底本应体现古籍版刻工艺、装帧形式、纸张行

款、字体墨色以及藏印、题跋等版本细节信息。

数据库选择

按照古籍数字资源使用需求确定建设古籍数据库的类型,如书目数据库、全文数据库等。

6数字资源制作

制作流程

宜按照前期准备、数据采集、数据加工、数据验收、数据归档五项基本流程开展工作。

图像制作级别

6.2.1古籍数字化宜按照不同使用要求制作档案典藏级、复制加工级和发布服务级三种级别的数字图

像。

6.2.2档案典藏级用于数字图像的长期保存,可作格式转换和复制的母本。需满足以下技术要求:

——色彩位深24bit;

——分辨率不低于600DPI;

——像素不低于3600万;

——文件保存格式为TIFF(LZW)或RAW(sRAW);

——色调再现使用ICC配置文件。

6.2.3复制加工级由档案典藏级图像经技术手段转换而成,是用于加工复制各种精度、大小的屏幕浏

览图像的母本文件。需满足以下技术要求:

——色彩位深24bit;

——分辨率不低于600DPI;

——文件保存格式为JPG或JPEG;

——色调再现使用ICC配置文件。

6.2.4发布服务级由复制加工级图像转换或压缩生成,用于古籍数据库建设,直接面向公众发布。宜

满足以下技术要求:

——扫描或拍照制作而成的资源色彩位深24bit,缩微胶片转换制作而成的资源色彩位深8

bit灰度;

——分辨率不低于200DPI;

——像素不低于1000万;

——文件保存格式为JPG或PDF。

制作前准备

6.3.1器材准备

按照数字化制作需求,可选择扫描设备、拍照设备或缩微数字转换设备进行古籍数字化工作。

——扫描设备宜选择零边距或非接触式扫描仪。需满足以下技术要求:

•应为无紫外线的同步冷光源;

•设备实际光学分辨率不低于600DPI;

3

DB34/T4333—2022

•CCD感光元件不低于5000像素点;

•色彩位深24bit;

•宜在A4(210mm×297mm)~A0(1189mm×841mm)画幅间自由调整。

——拍照设备宜选择数码相机或数码后背,并配置托稿台、背景等配套设备。需满足以下技术要

求:

•数码相机或数码后背有效像素不低于3600万;

•托稿台材质应经过脱酸处理,托架稳定牢固;

•宜选择中灰色的纸板作为扫描或拍照背景。

——缩微数字转换设备宜选用专业级缩微胶片扫描仪。需满足以下技术要求:

•扫描设备具有胶片保护装备,不划伤、损伤胶片;

•设备光学分辨率400DPI以上;

•画幅最短边CCD感光元件不低于7000像素点;

•色彩位深8bit灰度。

6.3.2整理准备

6.3.2.1数字化制作人员对古籍书况进行全面检查,重点记录阙叶、错叶、重叶、夹叶位置及破损面

貌,并形成记录文档。

6.3.2.2缩微胶片库管理人员对缩微品进行检查,缩微品质量不合格的古籍,可提取古籍原件进行数

字化。

6.3.2.3古籍修复人员依据GB/T21712对修复后方可进行数字化制作的古籍实施修复,以满足数字

化加工的技术要求。

数据采集

6.4.1采集方式

资源采集方式主要包括扫描/拍照、缩微胶片数字转化以及图文转换等。

6.4.2数字扫描(拍照)

采用扫描或拍照的方式进行数字化制作应满足以下要求:

——应确保古籍安全及古籍受环境影响在合理范围内;

——宜注意拍摄光源及环境光源,避免透光或反射光的影响;

——扫描或拍照后的图像清晰,没有重叶、缺叶、错叶、折页等情况(原书缺叶、错叶除外);

——扫描或拍照后的图像与古籍原件颜色一致;

——扫描或拍照后的图像以中缝为中心线,保持原文献的天头、地脚尺寸不变,图像倾斜角度不

大于0.2度,尽量减少畸变与失真;

——每部古籍第一册封面宜与色卡及标尺一同拍摄,色卡及标尺宜放置于古籍原件左侧,距古籍

0.1cm~1.0cm;

——按1:1比例扫描或拍摄,拍摄图像外围应有留白,宽度不超过1cm;

——扫描或拍照时原则上不进行拆卷处理,如遇特殊情况(夹字、粘连等),需经古籍数字化管

理人员与古籍修复人员会商核定后,由古籍修复人员进行拆卷、修整与还原;

——扫描或拍照时出现透字现象,由古籍修复人员选择纸性相近的修复纸进行托衬;

——古籍原件表面如粘贴有其他物件时(如签条等),需先将原件与粘贴物一同扫描,然后将粘

贴物揭开,再次扫描;

4

DB34/T4333—2022

——古籍原件内夹有其他物件时(如夹页、夹签),可记录夹签位置,取出单独扫描或拍照后置

于该册末尾。

6.4.3缩微胶片数字转换

采用缩微胶片数字转换的方式进行数字化制作需满足以下要求:

——应注意对缩微胶片的保护;

——宜选择第二代负像缩微品进行数字化;

——宜选择专业级缩微胶片数字转换设备;

——缩微胶片整体密度较为均匀、图像质量较好、图像大小基本相同时,宜采用高速扫描仪对其

进行快速整卷/盘扫描,否则宜采用低速扫描仪逐画幅扫描。

6.4.4图文转换

对扫描或拍摄后的图像进行图文转换需满足以下要求:

——宜照实录入,保留原始文献中的错别字及各种文字变体,保持古籍内容的原始面貌;

——宜采用光学字符识别和人工录入实现文字的数码转换,文字的处理应依据GB/T31219.2对

文本录入和光学识别质量进行控制;

——字符编码处理应符合GB18030的规定。

数据加工

6.5.1档案典藏级图像处理

档案典藏级图像处理应在不改变采集到的图像数据的色彩、分辨率、格式等情况下进行,主要包括:

——图像纠偏:对方向与角度不正确的图像进行旋转纠偏,使其更好满足阅读习惯;

——图像裁剪:对图像外边缘空白处进行裁切修剪,可根据实际裁至0.5cm~0.75cm;

——图像拼接:对画幅较大导致分幅扫描或拍摄的图像进行拼接,接缝处无缝吻合,不应缺失或

增加内容,可完整还原古籍原件全貌。

6.5.26.5.2复制加工级图像制作

复制加工级图像由档案典藏级图像加工制作而来,要求如下:

——制作时宜使用档案典藏级图像的备份文件,避免制作中损坏原始数据;

——制作完成后的图像应与档案典藏级图像的分辨率和像素相同,且一一对应。

6.5.3发布服务级图像制作

发布服务级图像由复制加工级图像加工制作而来,要求如下:

——制作时宜使用复制加工级图像的备份文件,避免制作中损坏原始数据;

——制作时宜添加水印,但不应对正常阅读产生影响;

——制作时可适当压缩图片分辨率和像素,但不应对正常阅读产生影响。

6.5.4元数据制作

宜优先采用excel表单著录,包括但不限于以下三方面:

——古籍元数据:应符合WH/T66的要求;

——描述元数据:包括古籍的书目信息和卷目信息;

——管理元数据:包括古籍的外字信息和数字化加工的过程、主要技术指标。

注:外字描述应符合WH/T91的相关要求。

5

DB34/T4333—2022

数据验收

6.6.1古籍数字资源制作完成后应由古籍数字化管理人员对成品质量进行验收。

6.6.2图像数据应满足但不限于以下要求:

——图像数据完整、连续;

——图像数据比例放大至100%后无模糊、透字等现象;

——图像的规格要求和技术参数满足不同制作级别的要求;

——图像数据按要求保存并命名。

6.6.3文本数据应满足但不限于以下要求:

文本数据忠实于原文献,完整有序;

——文件格式与编码无误;

——字符错误率不超过0.3‰;

——文本数据按要求保存并命名。

6.6.4元数据应满足但不限于以下要求:

——元数据能够准确全面描述古籍原件及数字化成品,无缺漏项;

——元数据描述符合相应规范,便于识别利用;

——元数据储存格式具备通用性,可与各类型系统兼容。

数据归档

6.7.1数据分类

宜以传统四部分类法为基础但不限于此分类方法。

6.7.2长期储存

宜配置专门的数据空间用于存储数据,记录与数字资源保存、调用、迁移等活动关联的元数据信息。

为防止古籍数字资源因存放时间久远无法识读,宜每5年~10年进行一次设备介质更新。

6.7.3异地备份

入选国家珍贵古籍名录、地方名录或已文物定级的善本古籍数据宜托管备份至省级有关单位服务

器。

7古籍数据库建设

建设原则

古籍数据库应兼具实用性、规范性与开放性,数据库中的数据、软硬件系统宜采用通用的格式与标

准化协议,便于交换和共享,数据库及数字资源应安装至本地服务器。

数据库功能要求

7.2.1数据库基本功能

数据库系统应具有输入、输出、存储、修改、更新等基础功能。

7.2.2查询、检索功能

6

DB34/T4333—2022

宜首先建立起基于元数据仓储模式下的查询、检索平台,逐步实现词义匹配、全文检索以及多种知

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论