




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
各工序制作规范一、 前期预备环节 1.图书编号 为了便于管理,项目中所有加工图书均采用统一编号。编号长度为8位,分为2段,格式为“AADDDDDD”。 其中,AA代表资源加工中心代号,本公司的加工代号是“06”; DDDDDD为6位流水号,唯一标识对应一本图书。 每本图书与编号一一对应,不能出现一本书重复加工,使用两个编号的情况,或一个编号被两本书同时使用的情况。2. 工作目录路径在扫描图书之前,现场管理员在工作站上预先建立一些目录来存放图书扫描和识别的结果以及相应的元数据。在每个目录下,又细分为3 个子目录:OTIFF, PTIFF 和META。其中,OTIFF最初存放扫描的TIFF 图片文件,最终存放去污后的TIFF 图片文件,PTIFF 存放识别及转换产生的DJVU 文件,META 存放图书的目录文件catalog.xml、元数据dc.xml及a.opf文件。二、 元数据 参照著录规则06417。元数据内的标点符合均在全角状态下录入。三、 图像扫描1.命名扫描图像必须与原页面一一对应,不得出现颠倒、缺页、重页或错页情况。图像按流水顺序以tiff格式保存,文件名自00000001.tif依次排布。即schema name为#。注:页码不连续的以缺页代替。连续5页以上缺页,只要扫一个缺页,缺页的页面里标注“缺10-25”。2.分辨率扫描分辨率标准为600dpi二值,二值TIFF图像采用CCITT4压缩格式,图像格式为tif;对于有灰度插图的页面,采用600dpi 256级灰度,256级灰度TIFF图像,采取LZW算法进行压缩,图像格式为jpg;对于彩页,采用600dpi 32K色扫描,采取无算法进行压缩,图像格式为jpg;颜色模式为为Binary,图像均保存原图于OTIFF目录下。对于普通图书,彩色封面、封面折页、封底折页、不含照片的彩色插页和灰度插图的页面,均采用600dpi 256级灰度扫描;对于含有人头照片、风景照的彩色插页及对于图像有特殊要求的(如广告),采用600dpi 真彩色扫描。注:1、三页以内(含三页)JPG页面扫描必须扫正 2、由于彩色JPG页面后道工序不作处理,所以要求扫描时每一页面尽量做到无白边、黑边,不倾斜。 3、所有页面遵循阅读方向(不论有没有页码) 4、扫描时如无封面,扫书脊3.清晰度扫描图像字迹清晰、颜色恰当,不宜过浅或过深,并且不得出现字迹笔画残缺或字迹笔画叠合而影响阅读的情况,即使原书本存在锈斑变质、颜色过浅或深浅不一致,也应保证扫描图像可读。对于古籍,因书本颜色泛黄,纸张诱斑变质、颜色过浓或深浅不一致现象极严重,扫描员必须反复调试扫描参数,兼顾页面整体效果,尽量做到扫描图像基本可读。由于书本页太薄或颜色过浓,扫描时会倒映反面文字,其文字上的污点无法去污,但需保证正文文字能看清楚。扫描留下的黑迹宽度不得超过0.5厘米,并且指印和黑线不能覆盖或影响书本正文内容。4.图像内容扫描的页面内容基本居中显示,不可出现明显偏左或偏右的现象。页号、页眉、页脚信息完整图像内容与书本页面完全对应,不得出现书页内容残缺或将旁边页面信息扫入本页的现象。对于古籍,因书本普遍极为陈旧,页面纸张十分脆弱,很多书本页面破碎不全,扫描无法将内容扫全,但图像内容必须保证书本原貌,与书本页面完全对应,不得出现原书页内容残缺或将旁边页面信息扫入本页的现象;另外,古籍书本全部都是线装订形式,有些书本装订线覆盖了部分页面内容,如书不允许拆装的情况下,扫描应在尽可能不损坏书本的前提下,尽量将页面有用内容扫描下来。普通图书的书脊页不予扫描,封面折页或封底折页如果为空白或颜色也不予扫描;否则封面、封二、折页、封底都必须按图书顺序依次扫描。四、 图像处理对于彩色与灰度的扫描图像只要将页面旋转成正面即可,黑白的扫描图像,图像处理需要注意以下几点: 图象处理后必须保证图象信息与原书本内容完全一致,不得删除页面任何有用信息,包括正文内容、页眉、页脚、手写注释和印鉴等(图书馆藏书章除外)。2. 所有扫描留下的黑线、指印或阴影都必须清除干净。3. 扫描图像整体倾斜不得超过3度;不得出现图象的一部分倾斜或扭曲而影响阅读的现象。书本页面存在部分倾斜的,以页面中的文字纠正为准。4. 对装订线较近的书本或较厚书本,边角的几个字会产生扭曲现象,但需保证正文文字能看清楚。5. 由于书本印刷质量或纸张质量等造成的页面上有零星的污点,如果在页面视图下看不清楚,或该污点嵌在文本行中无法清除,可以不清除,但要保证图像可读。6.所有TIFF图像都必须采用识别及转换DJVU工具经过识别,然后转换为300dpi的双层DJVU格式。(识别及转换DJVU工具不够稳定,偶尔会出现某些页面无法识别的现象,对于软件无法识别的页面可以采取DJVU Pro或TIF TO DJVU工具直接转换为300dpi的DVJU格式)处理后的图像保存于PTIFF目录。7. 对于古籍图像处理附加以下标准:(1) 古籍书本页边都留有“卷XXX”半个字样,处理员尽量保留此信息完整,不允许删除这些信息,并且对于旁边的黑色阴影须清除干净。(2) 由于古籍书本普遍陈旧泛黄、纸张诱斑变质且过薄,造成页面上麻子污点和反面倒映文字污点零零星星比较多,如果在页面视图下看不清楚,或该污点嵌在文本行中无法清除,可以不清除,但应尽量保证图像可读。(3) 所有TIFF图像都必须采用识别及转换DJVU工具经过识别(识别选项选择“不识别”),然后转换为300dpi的DJVU格式。(识别及转换DJVU工具不够稳定,偶尔会出现某些页面无法识别的现象,对于软件无法识别的页面可以采取DJVU Pro工具直接转换为300dpi的DVJU格式)处理后的图像保存于PTIF目录。8. 对于书法绘画类图书的图像处理附加以下标准:(1) 对于采取黑白二值模式扫描的TIFF图像必须采用识别及转换DJVU工具经过识别,然后转换为300dpi的双层DJVU格式;对采取8位灰度模式扫描的TIFF图像采取DJVU PRO工具直接转换为300dpi的DVJU格式;对于采取24位彩色模式扫描的TIFF图像首先采取DJVU PRO工具直接转换为300dpi的DVJU格式,如果不能正常转换则采取将图像尺寸压缩到30%的比例然后采取DJVU PRO工具转换为300dpi的DVJU格式。五、 目录制作 在OEBE软件内的“文本输入”中录入目录: 例:第一章 综合 1 00000017 鹿城区行政区划情况 3 00000019 第二章 农业 35 00000051 乡镇基本情况 37 00000053内容导向 封面 1 书名页 2第一行为一级目录,顶格,前一个数字为这条目录对应的本书的实际页码,后一数字为这条目录对应扫描图像的文件名;第二行为二级目录,半角状态下空一格,依次类推,三级空二格,四级空三格等。内容导向的内容有:目录中录入的其他信息,包括封面、目录、内容提要、ABSTRACT、前言、参考书目、附录、感谢、标题页、题跋、引语、绪言、贡献、索引、注释、术语表、版权表格清单、插图清单等,必须根据书本录入相关信息,并且标引到相应页面。“封面”后的数字为扫描图像的文件名。目录导航需要注意以下几点:1. 录入的导航信息正确率要求99.9%,包括目录的标题及其对应页码和目录中出现的所有可以在软件中录入的特殊符号,如等。2. 录入的目录标题项都必须输入相应页码,如果书本欠缺页码,或书本目录页码标识错误,都必须根据书本实际情况,查找正确页码,进行录入。3导航信息要求整齐美观,章、节、标题与序号之间必须加一个空格。4录标引标准:对所有目录标题都必须做标引,并且要将相应页面标引到相应目录项,不得出现张冠李戴的现象。5录入方式标准:所有英文字符、标点符号、数字字符和一些特殊符号都在全角方式下录入。6特殊情况处理: (1)目录中的角标问题:目录中包含上、下角标。例如:X2可以录入为X2即(X+上划线+2);X2可以录入为X_2即(X+下划线2);同时含有上、下角标的先录入上角标,后录入下角标。目录中包含繁分式。例如:可以录入为(AB)/(CD)/(EF)/(GH);目录中包含根号。若根号下为数字,如:”根号2”,则可以录入为2。注意: 32(三次根号2) 与3*2(三倍根号2)的区别!若根号下为表达式,如:“根号下A加B”,则可以录入为(AB)。(2) 文字录入应遵循原书的简繁体格式,对于GBK不包含的汉字,可以录入其对应的全拼拼音。(3) 对于无法录入的特殊符号,可以使用“”代替。(注:“”必须在全角下录入)。(4) 对于目录在上册且下册没有目录的图书,应该将在上册中对应于下册的目录录入。(5) 对于有总目录的图书,应该录入总目录。有简目和详细目录的,录简目。(6) 对于分册的图书,应该录入本分册对应的目录。(7) 编委会之类的标题应该根据书中的标题录入。(8) 若目录中的标题为中、英文混合或其它国家文字的混合,则应该将在页码前的文字全部录入。(9) 书本含有多个目录,如有中文目录和英文目录的则录入中文目录。(10) 图书目录标题与图书中对应的正文标题不一致,则根据书本中的正文标题录入。(11) 若图书目录编制错误,并且书本中正文目录也错误时,根据书本按正确方式编制目录。(12) 对于欠缺目录的书本,要求翻查书本,编制三级目录,并录入。(13) 若目录中字数太多无法标引的,则可以只录入前二十个字,省略部分用“”表示。(14) 若图书目录中页码是错误的(即页码不是按顺序排列的),则必须按照真实目录信息录入.(15) 若图书中目录标题与图书中对应的正文标题不一致的, 则应该录入图书中的正文标题。(16) 若一本图书中有两个或两个以上的目录(但其中一个目录A是另一个目录B的一部分),则录入最完整的那个目录。其它的因书的内容制定。7.制作完成的XML文件应保存在相应图书工作目录的META文件夹下。8. 对于古籍的目录制作附加以下标准:由于古籍书本基本都欠缺目录,要求录入员对应图书图像尽可能查找相应标志性的目录标题,编制图书目录并进行录入,对录入的目录层次做以下规定:9. 欠缺目录,录入员须根据书本实际情况编制三
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 声测管注浆施工方案
- 美术培训机构宣讲
- 上海市延安实验初级中学2026届九年级英语第一学期期末监测模拟试题含解析
- 高胆红素血症的护理措施
- 行为管理安全培训
- 2026届石狮七中学英语九年级第一学期期末质量检测试题含解析
- 黑龙江省哈尔滨市松北区2026届化学九年级第一学期期中调研试题含解析
- 山东省济南市育英中学2026届九上化学期中质量检测模拟试题含解析
- 2026届吉林省长春市中学九年级化学第一学期期中达标测试试题含解析
- 2026届安徽省六安市舒城县九年级化学第一学期期末质量检测试题含解析
- GB/T 8923.1-2011涂覆涂料前钢材表面处理表面清洁度的目视评定第1部分:未涂覆过的钢材表面和全面清除原有涂层后的钢材表面的锈蚀等级和处理等级
- TSZUAVIA 009.9-2019 多旋翼无人机系统实验室环境试验方法 第9部分:冲击试验
- 舞蹈基础教学舞蹈基础知识科普培训PPT教学课件
- ECPR临床应用与进展课件
- 《装配式综合管廊施工及验收标准》
- 罗湖区-空气质量状况及原因分析
- 玉米病害图谱 症状课件
- 2013版电力建设工程概预算定额宣贯讲义
- 伤逝-课件完整版
- 养老机构入住老人服药记录表模板
- 决策分析管理运筹学课件
评论
0/150
提交评论