周长岭新闻内容资源加工系列讲解_第1页
周长岭新闻内容资源加工系列讲解_第2页
周长岭新闻内容资源加工系列讲解_第3页
周长岭新闻内容资源加工系列讲解_第4页
周长岭新闻内容资源加工系列讲解_第5页
已阅读5页,还剩132页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、新闻出版内容资源加工规范标准讲解周长岭中新金桥数字科技(北京)有限公司(原方正国际软件有限公司BPO事业部)2014年8月 厦门目录1、背景和定位3、特点及关系4、具体标准介绍2、总体介绍产业背景数字出版是产业升级契机产业升级的核心是围绕内容产品变革的流程再造以及经营理念和模式的根本性改变内容产品变革的核心是内容与形式分离,内容基于知识组织的结构化,复用和重组最大化,形式和渠道多样化内容资源的加工如同高楼大厦的地基建设,将决定内容产品的价值,能走多远,能做多大问题和矛盾轻数据重系统盲目加工过度加工缺规划缺设计定位指导当前的内容资源加工梳理应用与加工的关系提供基本管理流程提供基本的加工规格和质量

2、指标参考面向新闻出版单位,规范全流程重新认识和定位内容资源加工引入体系化管理思路支撑企业内部标准建立建立企业的加工管理流程建立企业的数据规格和质量体系规范为完成转型升级提供基础依据完成对内容产品体系的基础改造完成对内容数据的基础定义目录1、背景和定位3、特点及关系4、具体标准介绍2、总体介绍新闻出版内容资源加工规范系列体系表加工专业术语数据加工及应用模式数据加工规格数据加工质量资料管理数据管理数据交付图书加工教材加工工具书加工辞书类百科类手册类规范规范类表谱类科技图书加工报纸加工期刊加工古籍加工1术语2元数据3长期保存4版式采集510 音频加工视频加工新闻出版内容资源加工规范体系图新闻出版内容

3、资源加工规范已完成的10个部分第一部分:加工专业术语第二部分:数据加工及应用模式第三部分:数据加工规格第四部分:数据加工质量第五部分:资料管理第六部分:数据管理第七部分:数据交付第八部分:图书加工第九部分:报纸加工第十部分:期刊加工总体介绍-是什么?规范资源加工的术语规范资源加工与应用的关系规范成品数据的规格与质量规范数据与资料的管理规范交付过程管理图书、报纸、期刊的成品数据总体介绍-有什么用?帮助理解内容资源加工的目的帮助制定资源加工的要求、规格和质量帮助提高数据和资料的管理水平规范交付管理、提高项目运营水平总体介绍-谁来用?新闻出版单位资源加工单位监理单位总体介绍-新闻出版单位怎么用?企业

4、标准构建适合自身特点的企业资源标准建立全面、完善内容资源加工管理规范个性调整根据自身的建设目标确定应用功能及范围根据自身建设需要对加工标准做适应性调整参考利用选择标准中有限集合与自身资源建设需求结合对比、应用和验证加工要求的合理性理解掌握理解标准的架构和特点理解标准的目的和应用范围目录1、背景和定位3、特点及关系4、具体标准介绍2、总体介绍加工标准编制原则内容全面包含术语、加工、交付和管理等方面内容。包括主流资源加工规格:图书、报纸和期刊。提取共性综合多方管理和监理需求涵盖大部分加工项和应用需求加工粒度和深度适中,可选内容全面、灵活。个性应用根据自身需求做加工项和加工粒度的取舍和扩展忌盲目加工

5、到最全面最细化的程度标准特点易使用描述准确,清晰易懂管理规范清晰,易执行易扩展个性需求易于扩展个性规格易于调整指标化加工规格严谨准确检验规格详细全面加工项、粒度与成本的关系什么是加工项?什么是粒度?表格公式目次注释插图术语封面参考文献拆分到条拆分到字段作者姓名拆分加工项、粒度与成本的关系成本¥加工项粒度/深度加工项C加工项B加工项A加工项越多,成本越高加工粒度越细,成本越高加工深度越深,成本越高十个部分间的关系加工专业术语数据加工及应用模式数据加工规格数据加工质量资料管理数据管理数据交付图书加工报纸加工期刊加工目录1、背景和定位3、特点及关系4、具体标准介绍2、总体介绍第一部分加工专业术语第一

6、部分 加工专业术语规范资源加工对象、过程、规格、质量和管理等方面的相关术语规范化的术语是各单位、各环节沟通、商讨的基础;是后续标准的概念基础加工术语体系新闻出版内容资源加工专业术语 278通用加工术语21基础术语6符号术语4文字术语11加工对象术语110基本类型术语29内容结构术语26物理原件术语46装订保存术语9流程、工艺和信息安全术语 29加工流程术语7加工工艺术语15加工设备术语2信息安全术语5数据规格和质量术语 95元数据术语40分类标引术语16数据格式术语17数据备份术语14数据质量术语8数据交付术语23数据提交术语12数据服务术语11通用加工术语通用加工术语基础术语与内容加工相关综

7、合性术语;符号术语字符、公式等方面的相关术语;文字术语文字和字处理等方面相关术语。加工对象术语加工对象术语基本类型术语图书、报纸、期刊等出版物类型术语;内容结构术语图书、报纸、期刊等内容结构划术语;物理原件术语加工对象物理原件方面的术语;装订保存术语加工对象装订及资料保存术语。流程、工艺和信息安全术语流程、工艺和信息安全术语加工流程术语加工过程方面相关术语;加工工艺术语加工工艺方面的相关术语;加工设备术语加工设备方面的相关术语;信息安全术语安全管理和安全环境术语。数据规格和质量术语数据规格和质量术语元数据术语元数据加工方面的相关术语;分类标引术语分类和标引方面的相关术语;数据格式术语数据格式方

8、面的相关术语;数据备份术语数据备份方面的相关术语;数据质量术语文字、图像质量相关术语。数据交付术语数据交付术语数据提交术语数据提交方面的相关术语;数据服务术语数据服务方面的相关术语。第二部分数据加工及应用模式第二部分 数据加工与应用模式描述资源加工的等级、应用模式和两者之间的关系通过应用方向确定资源加工的范围和粒度,避免过度加工加工等级加工类型数据加工等级加工等级划分索引内容索引级全文全文基础级全文标准级结构化结构化基础级结构化复杂级版式版式基础级版式重构级版式复杂级索引类加工内容索引级基本元数据的加工:对描述出版物基本信息的元数据进行加工整理;基本对象数据的加工:对出版物的内容以扫描图像文件

9、形式进行加工整理,或将电子数据转换生成版式文件的集合。全文类加工全文基础级在内容索引级的基础上,对基本对象数据进行基本结构拆分,对全文内容进行识别处理,建立基于全文的索引。全文基础级加工不包括对正文部分进行文字校勘处理。全文标准级在全文基础级的基础上,对正文部分进行文字校勘处理,使文字差错率符合相关出版质量标准。加工对象为电子数据时,需经转码处理,将版式文件解析后提取准确的文字信息并转换为流式文件。结构化类加工结构化基础级在基本结构拆分基础之上,对内容资源的结构进一步拆分,对显性内容进行标引,包括:图书的显性内容:篇、章、节和作者等内容;期刊的显性内容:栏目、标题、作者、摘要和关键词等内容;报

10、纸的显性内容:日期、专刊、版名、栏目、标题和作者等。结构化复杂级复杂的显性内容拆分如下:1)图书:条目、词目、参考文献、脚注、公式和图表等;2)期刊:参考文献、脚注、公式和图表等;3)报纸:分级标题、图表和广告等。隐性内容标引包括分类和主题词等;对链接关系进行标引,如参考文献、图表或脚注等版式类加工版式基础级专指单层图像版式文件。版式重构级在版式基础级的基础上,对文字内容部分进行加工处理,使文字部分可选取、拷贝和查找,包括:电子数据经转换处理,还原至与原出版物一致的全矢量的数字版式文件;纸质出版物经加工处理,可生成双层矢量化版式文件和单层矢量化版式文件,双层矢量化版式文件的全文部分分为采用全文

11、基础级加工和采用全文标准级加工两种。版式复杂级文内链接关系标引:1)标引图书、期刊的脚注、参考文献、索引等并建立与引用点之间的关系;2)建立数字内容对象中“下转”、“上接”的链接关系;3)建立报纸版式文件与流式文件的链接关系。重新排版:因移动阅读设备屏幕尺寸限制而对原版式进行改编并重新排版的处理方式。该版式的调整不影响原语义关系或阅读顺序。数据加工应用模式面向长期保存面向长期保存可采用内容索引级加工,形成规范化和可管理的数字化存档,支持索引应用、长期保存和按需印刷应用等,并为后续的数字化加工处理提供数据基础。面向一般电子书应用面向一般电子书应用可采用索引级加工,可支持以版式呈现和浏览为主的电子

12、书应用,可支持基本元数据检索和数字版式文件浏览。加工对象为纸质出版物时,数字版式文件可采用全文基础级、版式基础级加工,内容不经结构化处理。加工对象为电子数据时,数字版式文件可采用全文标准级、版式重构级,内容不经结构化处理。面向高品质电子书应用面向高品质电子书应用可采用全文标准级、版式复杂级加工,以流式为主版式辅助的方式呈现,支持浏览、检索、选取文字、拷贝、链接跳转等电子书应用。面向内容数据库应用面向内容数据库应用可采用版式重构级或版式复杂级、高精度全文级、结构化基础级或结构化复杂级加工,使内容可脱离原有载体的限制,以较小的颗粒度进行拆分、标引或重组聚合,形成新的内容体系并灵活支持各种检索和知识

13、组织应用。加工等级与加工应用模式的关系加工类型加工等级应用模式面向长期保存面向一般电子书面向高品质电子书面向内容数据库长期保存索引库POD电子样书库以阅读和浏览为主的数字图书馆移动阅读内容数据库或以内容检索应用为主的数字图书馆索引内容索引级全文全文基础级全文标准级结构化结构化基础级结构化复杂级版式版式基础级版式重构级版式复杂级注:“”表示为必选;“”表示在同组加工类型中应选择一项;“”表示无。第三部分数据加工规格第三部分 数据加工规格描述数字化加工成果物的内容、构成、规格。根据标准结合自身情况确定自己的加工成品数据规格成品数据的构成成果物规格涉及参数应用方向内容结构化数据XML/XSD版本1.

14、0,字符集,编码数据库、知识库图像数据TIF色彩、压缩算法、精度长期保存对象数据JPG、GIF色彩、压缩算法、精度图片库、公式库、表格库版式数据PDF文字质量、图像参数、书签、链接关系电子书阅读、移动阅读流式数据Epub、Mobi样式、段落、阅读顺序电子书阅读、移动阅读源文件书版、MS-Word、Indesign长期保存样例:成品数据样例:结构化数据样例:对象数据样例:版式数据-单层矢量样例:版式数据-双层矢量样例:版式数据-双层矢量样例:流式数据结构化数据XML 1.0/XSD1.0字符集 GB 18030编码 UTF-8对象数据格式 JPG/GIF精度 100300 DPI模式:彩色/灰度

15、/二值图像数据格式 TIFF精度 300600 DPI模式:彩色/灰度/二值版式数据PDF 1.6以上版本单层/双层图片参数书签文内链接流式数据Epbu 3.0 以上版本图片参数格式信息样式信息成品数据的规格加工类型规格面向长期保存面向其他应用双层矢量单层矢量单层图像单层矢量PATH双层矢量单层矢量单层图像单层矢量PATH色彩模式彩色图像采用彩色模式灰度图像采用灰度模式黑白图像(文字)采用二值模式分辨率600DPI-300DPI150DPI以下-压缩方式彩色与灰度图采用JPEG彩色与灰度图采用JPEG2000二值图像采用GROUP 4二值图像采用JBIG2线条矢量化-全文嵌入子集-校勘-设置字

16、体字号-集外字及特殊符号其他符号替代-GIF图片-造字-书签集外字及特殊符号其他符号替代-上下脚标采用HTML语法替代文内链接采用HTML语法 注:“”表示为必选;“”表示为可选;“-”表示不可选。版式文件数据详细参数表第四部分数据加工质量第四部分 数据加工质量规定了数字化加工成果物的各类数据各方面的质量要求。结合自身的需求和情况确定自己的内容资源加工质量要求。质量要求完整性类型完整内容完整文档完整规范性规格规范命名规范存储规范有效性准确性文字准确性图像准确性内容结构化准确性关联关系准确性样式准确性数据质量结构成品数据的准确性分布结构化数据对象数据版式数据流式数据文字准确性图像准确性结构化准确

17、性关联关系准确性样式准确性完整性要求类型完整各类要求的类型数据要全易丢失的有对象数据、版式数据等内容完整各类数据的类型都要完整可能的不完整:结构化数据缺章节、版式文件缺页、对象文件不全等管理文档完整缺少相关检验文档规范性要求规格规范文件格式、版本、XML规范性等要符合规范文件的类型、参数、精度等要符合要求命名规范符合命名体系要求可能的错误包括名称重复、编号位数不足等存储规范符合存储体系要求可能的错误包括文件夹归属错误等有效性要求各类文件均应有效所有文件读取有效可能的错误:无法打开文件读取错误校验错误准确性要求(1)原则数据质量判定依据应建立在数据加工所使用的资料基础之上差错率计算方法:注:1.

18、检测标准单位一般按千、万、十万取值 2.抽样检测范围应不低于检测标准单位的20倍差错率 = 检测标准单位中的错误数 / 检测标准单位准确性要求(2)文字准确性差错率:符合相关出版质量管理规定基本检测单位:壹万,单位:字符(个)图像准确性差错率:千分之一基本检测单位:壹仟,单位:图像(个)内容结构化准确性差错率:万分之三基本检测单位:壹万,单位:字符(个)关联关系准确性差错率:千分之三基本检测单位:壹仟,单位:链接(个)样式准确性差错率:万分之三基本检测单位:壹万,单位:字符(个)差错统计方法文字准确性文字:错字、别字、多字、漏字、倒字符号:错用、漏用、多用图像准确性比率、浓淡、污点、倾斜等内容

19、结构化准确性漏标、错标和层级错误关联关系准确性漏链、错链、多链样式准确性版式差错:对位、排版格式、字体信息错误等流式差错:重排后的排版格式和文字样式错误第五部分资料管理第五部分 资料管理提出了加工过程中对资料的移交、使用、保管和归还等方面的要求。结合自身的情况和需求使用或调整使用本标准提出的要求。资料管理的构成加工资料整理委托方移交委托方-加工方使用加工方保存加工方归还加工方-委托方资料的整理分类对待加工的新闻出版内容资源按照纸质、电子数据和胶片的划分核对核对资料的物理形态是否与资源清单一致;核对资料出版信息、卷册信息等,确定是否为所加工版本;核对电子数据是否完整,数据版本是否为最终版。检查检

20、查是否存在缺页和少页等;检查是否存在纸张缺角、残边和折角等损坏;检查资料附带的唯一标识是否存在脱落;检查外包装是否破损;检查电子数据、胶片的完整性和有效性等。登记登记核对和检查过程中发现的各类问题,生成完整的资料登记清单。资料登记清单包括基本信息和检查结果信息资料的移交移交内容及信息项目名称:项目代称或资料统称;交接时间:完成移交的时间;资料数量:批次数量,单批次数量,总量;种类数量:需加工种类数量;加工批次:如资料分批加工,需填写;介质类型:如纸质图书或移动硬盘等;签名签章:双方负责交接的管理人员签字或签章确认;移交单附件:附上资料整理详细清单。资料的使用借出使用者在填写资料使用流转单后,由

21、资料管理员提取资源,在双方确认资源状况,使用者签字领取使用做好资料保管、保护和保养;不应损坏、勾划、删改、加注、折页等;不应转借他人、移作他用、私自带出,若发生丢失应及时登记;如需拆分、裁切等,应有委托方的许可说明;使用保密资料时应做好资料保密工作。交还资料使用完毕后使用者应及时交还,交还时双方在确认没有新的污损后由资料管理员做交还登记。若有新的资料污损应及时填写问题反馈登记表资料的保存资料保存的基本要求存放地点应相对独立并远离火源、水源及其他危险物品;保存在多层木质或金属架上,存放架最低层距地面应大于20cm;保存区域内应避免阳光直射,温度控制在在1530,湿度控制在20%50%之间;保存区

22、域内应放置驱虫、驱鼠、灭火等装置;保存区域内应保持清洁、整齐。资料的归还资料归还的基本要求根据委托方的要求,资料在成品数据交付并验收合格后可分阶段或整体归还委托方,归还时由加工方出具资料归还清单(与资料移交单一致),资料归还清单见4.2资料移交单。双方对资源本身的数量及品相核查无误后签字确认。归还的资料应保证:对裁切处理过的物理件,使用后应恢复原始状态;带有专属包装袋(盒)的资料,使用后应按原顺序装回等。第六部分数据管理第六部分 数据管理规定了资源加工过程中数据的类型、命名和交接、管理等方面的要求。应细化数据类型和命名的规则,根据自身管理需求调整应用数据交接、管理和信息安全方面的要求。数据管理

23、的内容数据交接数据类型数据命名数据管理数据安全数据的交接数据接收流程接收物理存储介质;备份原始数据;验证备份数据有效性并形成资源清单;形成数据接收清单并经委托方确认;归还委托方原始数据。数据交付流程加工方将交付数据存储在要求的介质中;加工方形成数据交付清单;委托方接收存储介质及交付清单;委托方验证数据存储有效性;委托方确认数据交付有效性。数据接收清单介质类型;数据名称及数据格式;数据容量及数量;数据日期信息及版本信息;接收日期;双方交接人员签章。数据交付清单数据交付介质;交付的数据清单;交付数据的存储空间及文件数;数据交付的日期;双方交接人签章。数据的类型成品数据纸质加工过程数据纸质出版物电子

24、加工过程数据电子数据成品数据过程数据基础数据数据的命名数据命名的原则命名应清晰准确的反映数据的内容、状态及版本等信息应包括唯一ID号码;处理数据的环节编号;处理数据的版本编号;本环节完成的日期及时间。数据的管理基础数据过程数据成品数据命名和存储基础数据命名应遵守数据命名规则,其中环节编号和版本编号可省略或均设置为0。基础数据在线存储,供后续数据加工环节随时调用,使用权限均设置为只读过程数据命名应遵守数据命名规则。过程数据按项目、环节和日期等信息进行区分并集中在线存储。成品数据命名应遵循数据命名规则并符合加工需求文档的要求。成品数据需在线存储,以便随时检查、核对或修改。数据备份基础数据离线存储1

25、2份备份并长期保存,也可用于覆盖恢复出现问题的在线存储基础数据。应确保离线存储备份数据的有效性和安全性。过程数据除集中在线存储,还应在相应的数据加工设备内保留备份。修改过程数据时,应同时更新覆盖2份备份。成品数据离线存储12份备份并长期保存。应确保离线存储备份数据的有效性和安全性。数据的管理过程数据流转规范应根据使用者角色严格控制过程数据的使用权限。过程数据流转应严格按照流程进行,禁止不同环节间直接进行数据传递(返工数据应遵循同一流程),过程数据流转的管理流程为:从上一环节接收该环节成品数据;参照环节、日期、质量版本等进行存储;将数据按生产流程分发给后续环节。数据长期保存数据的存储应至少有2份

26、独立的物理备份;数据的存储优先使用磁介质和光介质;存储刷新应在介质理论寿命的一半时进行;当出现先进成熟的存储介质和方法时宜及时迁移到新介质上。数据核销加工方对过程数据和成品数据的存储具有时间限制,成品数据验收合格后保留时间不超过3个月,如委托方有特殊要求,可按委托方要求的时间存储,一般不超过1年。数据存储到期后应进行数据的核销。数据的核销应包括过程数据及成品数据在内的全部数据以及各种数据备份。数据核销时委托方可到场监督,数据核销后委托方应向加工方出具数据核销证明文档。数据的安全管理数据安全保障体系制度管理环境管理设备管理人员管理技术管理数据控制数据的安全管理制度管理规章制度;工作规范;作业流程

27、和及作业指导书;工作报表模板等。环境管理无死角监控视频;作业区域应与其他非作业区域隔离,无关人员禁入;出入门禁控制;与作业无关物品禁入等。人员管理有完善的人力资源管理制度,人力资源使用符合国家相关规定;人员无犯罪记录;人员上岗前应通过相关制度培训并符合岗位技能要求等。设备管理内外网物理隔离;作业用计算机USB接口禁用;数据服务器及存储设备专用;存储介质设专人保管;关键设备和存储设备配置不间断供电电源;采用高性能局域网络及IDC机房等。技术管理使用的系统和工具软件应设置认证登录功能;不同的岗位应设置不同的系统和工具软件的使用权限;作业用系统及工具软件应具备版本管理和使用规范;系统管理人员和作业人

28、员的操作日志可回溯等。数据控制有完善的数据存储、备份和容灾管理体系,专人负责;采用存储介质进行数据流转应有完善的控制管理流程;关键过程数据在内部流转应加密处理或采用特殊的非通用格式;成品数据的调出应有专门的审批流程等。第七部分数据交付第七部分 数据交付规定了数据交付的目标、要求、流程、持续改进和交付保证体系打了个方面的内容数据交付应按交付要求和保障体系要求执行,并根据持续改进要求提高数据交付的质量。交付管理的内容保障体系目标与要求成品数据交付交付成果物持续改进数据维护服务保障体系交付管理保障体系制度保障条件保障技术保障品质保障保障体系制度保障规章制度;工作规范;作业流程和及作业指导书;工作报表

29、模板。条件保障具备经验的交付管理团队和作业人员团队;网络、存储及计算机等设施设备;原始资料状况的甄别整理能力;技术方法、工艺和操作流程;质量检测经验和能力;工作场地和环境。技术保障具备经验的技术团队;专业技术储备;可实时进行过程信息管理的技术平台;及时发布和更新标准作业指导书;不断通过技术手段提升过程操作效率的能力。品质保障品质保障制度体系;具备经验的品质保障团队;与目标和需求匹配的质量管理方针;质量管理流程;质量检测方案;实时质量回溯及持续改进能力。交付基本流程确定数据加工团队及职责,形成相应的管理文档;确定交付目标及需求,形成加工需求文档,在需求发生变化时及时更新;确定质量管理方针,形成质

30、量管理办法文档,明确数据质量要求、检测方法、返工流程等,质量管理应根据质量改善情况持续更新;确定并验证生产工艺,形成数据加工工艺文档,在需求发生变化时及时更新;确定作业指导书,根据生产工艺编写各环节的作业指导书文档,包括加工规则、操作方法和操作技巧等内容,当工艺发生变化时及时更新;制定生产实施计划,形成生产计划文档,明确生产阶段和目标;在生产实施过程中,每周形成生产周报文档,汇总阶段产能和质量情况,分析与生产计划的偏离情况及改进方法等;阶段/整体交付,形成项目交付报告,汇总交付数据的基本情况,包括交付量、交付日期和双方交接信息等。目标与需求管理的内容原始资料状况委托方应对加工资料的基本保存状况

31、以及原质量负责。加工范围和数量委托方应明确数据加工资料的详细范围和数量。加工规格委托方应明确数据加工规格,并提供详细的规格说明文档。加工质量委托方应明确数据加工的详细质量要求。加工周期委托方应明确数据加工的总体周期和阶段目标。交付方式委托方应明确交付方式,包括交付节点以及验收方案等。目标与需求管理的过程需求分析和目标确定。委托方盘点原始资料状况,确定数据加工的范围和数量、周期、交付方式等目标,明确数据加工规格和质量要求并形成加工需求文档,作为数据加工处理的唯一依据需求变更数据加工过程中出现需求变化、细化、增加或删除时应及时进行需求变更,并更新至加工需求文档,经确认后执行;目标调整当出现重大的交

32、付目标与需求变化时,应重新进行需求分析和目标确定。成品数据交付加工方提交交付成果物;委托方接收交付成果物;双方签署数据交付交割单;委托方在约定时间内核查数据的完整性和有效性并给出反馈,通常在7天内;委托方在约定时间内核查数据的规范性和准确性并给出反馈,通常在30天内;交付成果物满足加工需求文档的要求,委托方及时出具交付数据验收报告;交付成果物不符合加工需求文档的要求,加工方应及时修改数据并再次提交。交付成果物交付数据交付方式;存储介质;存储结构;命名体系;数据实体。交付文档交付报告;交付数据清单;交付物理件清单;交付接收单;质量检验报告。物理件在完成成品数据交付后应归还相应的物理件(附清单),

33、并按照要求进行包装及运输。交付过程持续改进规划确定在约定的时间内交付成品数据的数量、交付策略及计划实施按照计划实施数据加工并按计划交付数据检查在实施过程中通过对比分析规划目标及实际完成情况之间的差异,确定工作的改善方案。改进执行改善方案,通过持续改进动态调整规划和实施过程,不断提高交付能力和水平。数据维护服务数据维护服务特殊数据服务。当数据出现大面积损坏或重点内容发现关键错误等情况时,需要紧急修复或修改数据,通常响应时间在24h内。常规数据服务。数据在使用过程中发现非重要或非关键的错误时,按批次由加工方进行完善性修改,通常响应时间在7天内。第八部分图书加工第八部分 图书加工规定了图书加工的成果

34、物内容、规格和质量要求以及命名和存储规范。根据标准的要求,结合自身业务和技术需求适当调整,制定个性化的图书加工成品数据。图书加工成品数据组成成品数据元数据图像数据内容结构化数据对象数据版式文件数据流式文件数据元数据元数据集图书基本元数据目次元数据文章元数据单页元数据作者元数据附件元数据脚注元数据参考文献元数据管理元数据元数据规格同内容结构化数据元数据质量要求同内容结构化数据图像数据加工范围图像数据的加工范围包含从封面至封底所有页面,每页为一个图像文件规格TIFF:LZW压缩;分辨率300600dpiJPG:Jpeg压缩;分辨率100dpi以上。色彩模式根据原图可加工为彩色、灰度和二值。质量要求

35、图像数据质量的差错率要求为千分之一。内容结构化数据组成内容选择性内容说明篇章内目次元数据可选体现篇章中的内容组织结构,包含标题和页码信息文章元数据必备体现篇章的主题、来源等信息,包含篇章标题、副题、作者、摘要、关键词、页码等参考文献元数据可选包含篇章中的引用文献信息,由参考书名、作者、版本、文章标题、网站等组成参考文献可采用逐条列写,或细粒度拆分两种加工方式逐条列写:每条参考文献作为整体存放细粒度拆分:每条参考文献根据组成部分拆分成为独立信息脚注元数据可选当前页面中引用到词句的解释说明及出处,包含脚注序号及内容脚注可采用随文夹注或引用关联两种方式列写随文夹注:清除脚注序号,内容紧随正文引用位置

36、引用关联:放于文章末尾,并重排序号,与正文引用点关联正文内容必备当前篇章的文字、图片、排版信息及关联信息内容结构化数据规格内容结构化数据采用XML1.0及以上版本格式,其中字符宜采用GB18030字符集。质量要求文字质量要求应符合CY/101.4-2014中5.5.1和相关出版质量管理的规定;内容结构质量的差错率要求为万分之三;关联关系质量的差错率要求为千分之三。内容关联信息目次与正文章节的链接关系;脚注引用点与脚注的引用关系;插图引用点与插图的引用关系;表格引用点与表格的引用关系;公式引用点与公式的应用关系;参考文献引用点与参考文献的引用关系;图像引用点与图像文件的链接关系。对象数据图像类对

37、象数据质量要求图像类对象数据质量的差错率要求是千分之一。对象数据技术指标技术参数选择性内容说明色彩模式二值图像必备用于存储黑白的图像压缩方式LZW无损压缩必备底色透明必备用于网站发布时,与矢量文字底色一致技术指标技术参数选择性内容说明分辨率300DPI可选用于存储并发布的高精度图像,一般用于网站发布的大图150DPI介于300DPI至96DPI之间,一般用于网站发布的大图96DPI用于发布缩略图,一般用于网站缩略图展示色彩模式彩色图像必备用于存储彩色的图像灰度图像必备用于存储灰度或黑白的图像二值图像可选用于存储黑白的图像压缩方式JPEG必备生僻字图片技术规格其他图像类对象数据技术规格对象数据规

38、格结构化表格对象,采用HTML5.0及以上版本格式存储;结构化化学公式对象,采用CDX或CDXML格式存储;结构化数据公式对象,采用MathML3.0及以上版本格式存储。质量要求结构化对象数据质量的差错率要求是万分之一。规格特殊字符集采用TTF(TrueTypeFont)格式存储。质量要求矢量化对象数据质量的差错率要求是万分之一。矢量化对象数据结构化对象数据版式数据规格版式数据的加工范围包含从封面到封底的全部内容。采用PDF1.6及以上版本格式,技术规格见CY/101.3-2014的表2。质量要求文字质量要求应符合CY/101.4-2014中5.5.1和相关出版质量管理的规定;版式文件质量的差

39、错率要求为万分之三;图像质量的差错率要求为千分之一;关联关系质量的差错率要求为千分之三。流式数据组成内容选择性内容说明书目信息必备用于存储图信息,包含书名、作者、出版社、出版日期、版权等信息目次信息必备用于存储图书的目次信息,体现目次的组成形式文件组成信息必备用于管理流式文件的结构排版信息可选排版信息包含流式文件显示内容时的特殊效果,如段首缩进、段落间距、浮动窗口、列表形式等文字样式可选用于展示文字时体现的样式,主要包含:文字字体、字号、颜色、粗体、斜体、下划线、删除线、着重符号、等信息。生僻字采用贴图或造字的形式展示图片样式可选图片样式用于展示图片的位置及与文字的关系,如:位置可以为居左、居

40、中、或居右;与文字的关系可以为环绕,悬浮等表格样式可选表格包含表格标题、表格内容和表格注释。可采用HTML方式展示或采用图片方式展示公式样式必备公式采用图片方式进行展示流式文件规格:采用EPub 3.0及以上版本格式,具体如下:流式数据流式数据质量要求文字质量要求应符合CY/101.4-2014中5.5.1和相关出版质量管理规定;流式文件质量的差错率要求为万分之三;图像质量的差错率要求为千分之一;关联关系质量的差错率要求为千分之三。类别编号规则图书种类编号八位数字组成,每种图书从00000001记起,每种记1图书册编号三位数字组成,每册图书从001记起,每册记1页号四位数字组成,每卷期从000

41、1记起,每页记1图书加工成品数据命名文件夹命名方法:图书种类编号+(图书册编号)+ 图书名;示例:X:00000001-001-红楼梦图像文件命名方法:图书种类编号+(图书册编号)+ 页号;示例: 00000000-001-001.TIF矢量版式文件命名方法:图书种类编号+(图书册编号)+ S ;示例: 00000000-001-S.PDF双层版式文件命名方法:图书种类编号+(图书册编号)+ D;示例: 00000000-001-D.PDF图像版式文件命名方法:图书种类编号+(图书册编号)+ T;示例: 00000000-001-T.PDF转曲版式文件命名方法:图书种类编号+(图书册编号)+

42、P;示例: 00000000-001-P.PDF结构化数据命名方法:图书种类编号+(图书册编号);示例: 00000000-001.XML流式数据EPub命名方法:图书种类编号+(图书册编号)。示例: 00000000-001.Epub图书加工成品数据存储格式验收与维护数据验收委托方在确认收到成品数据后应在30个工作日内完成验收工作。验收工作应对成品数据的完整性、规范性、和有效性进行检验,在这3个方面都符合质量要求后,再根据质量要求检验成品数据的准确性。在检验过程中应逐一记录发现的错误情况。验收工作完成后委托方出具验收报告。数据维护加工方在数据验收合格后应按双方约定提供数据维护服务,维护服务的

43、周期由双方协商而定,通常为1年。数据维护服务的主要内容包括及时修改后续发现的数据错误,提供数据规格、存放规则、存储清单等文档,为委托方提供数据应用支持和咨询服务等。第九部分报纸加工第九部分 报纸加工规定了报纸加工的成果物内容、规格和质量要求以及命名和存储规范。根据标准的要求,结合自身业务和技术需求适当调整,制定个性化的期刊加工成品数据。报纸加工成品数据组成成品数据元数据图像数据内容结构化数据对象数据版式文件数据流式文件数据元数据元数据集报纸基本元数据报纸单期元数据报纸单版元数据新闻元数据图片元数据广告元数据管理元数据元数据规格同内容结构化数据元数据质量要求同内容结构化数据图像数据加工范围图像数

44、据的加工范围包含从头版至末版所有版面,每版为1个图像文件。规格TIFF:LZW压缩;分辨率300600dpiJPG:Jpeg压缩;分辨率100dpi以上。色彩模式根据原图可加工为彩色、灰度和二值。质量要求图像数据质量的差错率要求为千分之一。内容结构化数据组成内容选择性内容说明单版元数据必备包括单版信息,由期号、版号、版名、责任编辑等组成新闻元数据必备包括新闻的标题、作者、来源及内容等信息图片元数据可选包括图片对象、图片标题、图片说明等内容信息广告元数据可选包括广告标题、广告产品、广告主等内容信息正文内容必备包括正文文字内容单版结构数据的组成内容结构化数据规格内容结构化数据采用XML1.0及以上

45、版本格式,其中字符宜采用GB18030字符集。质量要求文字质量要求应符合CY/101.4-2014中5.5.1和相关出版质量管理的规定;内容结构质量的差错率要求为万分之三;关联关系质量的差错率要求为千分之三。内容关联信息导读与新闻内容的链接关系;“上接”和“下转”的链接关系插图引用点与插图的引用关系;表格引用点与表格的引用关系;图像引用点与图像文件的链接关系。对象数据图像类对象数据质量要求图像类对象数据质量的差错率要求是千分之一。对象数据技术指标技术参数选择性内容说明色彩模式二值图像必备用于存储黑白的图像压缩方式LZW无损压缩必备底色透明必备用于网站发布时,与矢量文字底色一致技术指标技术参数选

46、择性内容说明分辨率300DPI可选用于存储并发布的高精度图像,一般用于网站发布的大图150DPI介于300DPI至96DPI之间,一般用于网站发布的大图96DPI用于发布缩略图,一般用于网站缩略图展示色彩模式彩色图像必备用于存储彩色的图像灰度图像必备用于存储灰度或黑白的图像二值图像可选用于存储黑白的图像压缩方式JPEG必备生僻字图片技术规格其他图像类对象数据技术规格对象数据规格结构化表格对象,采用HTML5.0及以上版本格式存储;质量要求结构化对象数据质量的差错率要求是万分之一。规格特殊字符集采用TTF(TrueTypeFont)格式存储。质量要求矢量化对象数据质量的差错率要求是万分之一。矢量

47、化对象数据结构化对象数据版式数据规格版式数据的加工范围包含从头版到末版的全部内容。采用PDF1.6及以上版本格式,技术规格见CY/101.3-2014的表2。质量要求文字质量要求应符合CY/101.4-2014中5.5.1和相关出版质量管理的规定;版式文件质量的差错率要求为万分之三;图像质量的差错率要求为千分之一;关联关系质量的差错率要求为千分之三。流式数据流式文件规格:采用EPub 3.0及以上版本格式,具体如下:组成内容选择性内容说明期次信息必备用于存储期次相关信息新闻标题信息必备用于存储新闻标题及所属栏目等信息文件组成信息必备用于管理流式文件的结构排版信息可选排版信息包含流式文件显示内容

48、时的特殊效果,如段首缩进、段落间距、浮动窗口、列表形式等文字样式可选用于展示文字时体现的样式,主要包含:文字字体、字号、颜色、粗体、斜体、下划线、删除线、着重符号、等信息。生僻字采用贴图或造字的形式展示图片样式可选图片样式用于展示图片的位置及与文字的关系,如:位置可以为居左、居中、或居右与文字的关系可以为环绕,悬浮等表格样式可选表格包含表格标题、表格内容和表格注释可采用HTML方式展示或采用图片方式展示流式数据流式数据质量要求文字质量要求应符合CY/101.4-2014中5.5.1和相关出版质量管理规定;流式文件质量的差错率要求为万分之三;图像质量的差错率要求为千分之一;关联关系质量的差错率要

49、求为千分之三。报纸加工成品数据命名文件夹命名方法:报纸种类编号 + 期号;示例:X:0001-00001图像文件命名方法:报纸种类编号 + 期号 + 版号;示例: 0001-00001-001.TIF矢量版式文件命名方法:报纸种类编号 + 期号 + S;示例: 0001-00001-S.PDF双层版式文件命名方法:报纸种类编号 + 期号 + D;示例: 0001-00001-D.PDF图像版式文件命名方法:报纸种类编号 + 期号 + T;示例: 0001-00001-T.PDF转曲版式文件命名方法:报纸种类编号 + 期号 + P;示例: 0001-00001-P.PDF结构化数据命名方法:报纸

50、种类编号 + 期号;示例: 0001-00001.XML流式数据EPub命名方法:报纸种类编号 + 期号。示例: 0001-00001.Epub类别编号规则报纸种类四位数字组成,从0001记起,每种报纸记1期号五位数字组成,每期报纸从00001记起,每期记1新闻编号四位数字组成,每卷期从0001记起,每篇新闻记1版号三位数字组成,每卷期从001记起,每页记1报纸加工成品数据存储格式验收与维护数据验收委托方在确认收到成品数据后应在30个工作日内完成验收工作。验收工作应对成品数据的完整性、规范性、和有效性进行检验,在这3个方面都符合质量要求后,再根据质量要求检验成品数据的准确性。在检验过程中应逐一

51、记录发现的错误情况。验收工作完成后委托方出具验收报告。数据维护加工方在数据验收合格后应按双方约定提供数据维护服务,维护服务的周期由双方协商而定,通常为1年。数据维护服务的主要内容包括及时修改后续发现的数据错误,提供数据规格、存放规则、存储清单等文档,为委托方提供数据应用支持和咨询服务等。第十部分期刊加工第十部分 期刊加工规定了期刊加工的成果物内容、规格和质量要求以及命名和存储规范。根据标准的要求,结合自身业务和技术需求适当调整,制定个性化的期刊加工成品数据。期刊加工成品数据组成成品数据元数据图像数据内容结构化数据对象数据版式文件数据流式文件数据元数据元数据集期刊基本元数据单期元数据文章元数据作

52、者元数据引文元数据脚注元数据段落元数据管理元数据元数据规格同内容结构化数据元数据质量要求同内容结构化数据图像数据加工范围图像数据的加工范围包含从封面至封底所有页面,每页为一个图像文件规格TIFF:LZW压缩;分辨率300600dpiJPG:Jpeg压缩;分辨率100dpi以上。色彩模式根据原图可加工为彩色、灰度和二值。质量要求图像数据质量的差错率要求为千分之一。内容结构化数据文章结构数据的组成组成内容选择性内容说明文章元数据必备体现篇章的主题、来源等信息,包含篇章标题、副题、作者、摘要、关键词、页码等作者元数据必备包含作者相关信息引文元数据可选包含篇章中的引用文献信息,由引文书名、作者、版本、

53、文章标题、网站等组成。引文可采用逐条列写,或细粒度拆分两种加工方式。逐条列写:每条引文作为整体存放;细粒度拆分:每条引文根据组成部分拆分成为独立信息脚注元数据可选当前页面中引用到词句的解释说明及出处,包含脚注序号及内容脚注可采用随文夹注或引用关联两种方式列写。随文夹注:清除脚注序号,内容紧随正文引用位置;引用关联:放于文章末尾,并重排序号,与正文引用点关联正文内容必备当前篇章的文字、图片、排版信息及关联信息段落元数据可选包含段落及知识点等信息内容结构化数据规格内容结构化数据采用XML1.0及以上版本格式,其中字符宜采用GB18030字符集。质量要求文字质量要求应符合CY/101.4-2014中5.5.1和相关出版质量管理的规定;内容结构质量的差错率要求为万分之三;关联关系质量的差错率要求为千分之三。内容关联信息脚注引用点与脚注的引用关系;插图引用点与插图的引用关系;表格引用点与表格的引用关系;公式引用点与公式的应用关系;引文引用点与引文的引用关系;图像引用点与图像文件的链接关系。对象数据图像类对象数据质量要求图像类对象数据质量的差错率要求是千分之一。对象数据技术指标技术参数选择性内容说明色彩模式二值图像必备用于存储黑白的图像压缩方式LZW无损压缩必备底色透明必备用于网站发布时,与矢量文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论