标准解读
《GB/T 38548.1-2020 内容资源数字化加工 第1部分:术语》是关于内容资源数字化加工领域的国家标准之一,主要规定了该领域内常用的基本术语及其定义。这份标准适用于所有涉及内容资源数字化加工活动的相关方,包括但不限于图书馆、档案馆、出版社以及各类信息服务中心等机构和个人。
在该标准中,“内容资源”指的是任何形式的信息载体,如书籍、报纸、期刊、图片、音频、视频等。“数字化加工”则指将这些传统介质上的内容转换为数字格式的过程,这一过程可能涵盖扫描、录入、编码等多个步骤。通过明确这些关键概念,标准旨在促进行业内对于相关术语的一致理解和使用,从而提高沟通效率和工作质量。
此外,《GB/T 38548.1-2020》还详细列举了诸如“元数据”、“OCR识别”、“全文检索”等与数字化加工紧密相关的专业词汇,并对每个术语给出了准确的定义。例如,“元数据”被定义为描述信息对象特征的数据;而“OCR识别”则是指利用光学字符识别技术自动将图像中的文字转换成可编辑文本的技术。
如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。
....
查看全部
- 现行
- 正在执行有效
- 2020-03-06 颁布
- 2020-10-01 实施
文档简介
犐犆犛35.240.30
犔70
???????????
犌犅/犜38548.1—2020
?????????
?1??:??
犆狅狀狋犲狀狋狉犲狊狅狌狉犮犲狊犱犻犵犻狋犻狕犪狋犻狅狀—犘犪狉狋1:犜犲狉犿犻狀狅犾狅犵狔
20200306??20201001??
??????????
??????????
??
目次
前言Ⅲ…………………………
1范围
1………………………
2通用加工术语
1……………
3加工对象术语
2……………
4流程和工艺术语
3…………………………
5规格质量术语
4……………
6数据服务术语
6……………
参考文献8………………………
索引9……………………………
Ⅰ
犌犅/犜38548.1—2020
前言
GB/T38548《内容资源数字化加工》分为以下6个部分:
———第1部分:术语;
———第2部分:采集方法;
———第3部分:加工规格;
———第4部分:元数据;
———第5部分:质量控制;
———第6部分:应用模式。
本部分为GB/T38548的第1部分。
本部分按照GB/T1.1—2009给出的规则起草。
本部分由国家新闻出版署提出。
本部分由全国新闻出版信息标准化技术委员会(SAC/TC553)归口。
本部分起草单位:中新金桥数字科技(北京)有限公司、电子工业出版社有限公司、中宣部机关服务
中心(中宣部信息中心)、清华大学、人民卫生电子音像出版社有限公司。
本部分主要起草人:赵海涛、李建伟、王德胜、刘成勇、刘勇、张沫、窦天芳、赵晨阳、石雄、黄燕云。
Ⅲ
犌犅/犜38548.1—2020
内容资源数字化加工
第1部分:术语
1范围
GB/T38548的本部分界定了内容资源数字化加工中涉及的通用加工、加工对象、流程和工艺、规
格质量和数据服务的术语和定义。
本部分适用于内容资源的数字化建设和管理。
2通用加工术语
2.1
字符犮犺犪狉犪犮狋犲狉
用于表示组织或控制数据的元素集合中的一个成员。
示例:字符可作如下分类:
[GB/T5271.4—2000,定义04.01.01]
2.2
字符集犮犺犪狉犪犮狋犲狉狊犲狋
不同字符(2.1)的一个有限集合,它对于给定目的是完整的。
示例:GB/T1988字符集的国际基准版。
[GB/T5271.4—2000,定义04.01.02]
2.3
图像分辨率犻犿犪犵犲狉犲狊狅犾狌狋犻狅狀
图像中存储的信息量,可以有多种的衡量法。
注:本部分中以每英寸的像素DPI(DotsPerInch)来衡量。
2.4
符号狊狔犿犫狅犾
用字母、数字、象形文字或其任何组合的标识。
[GB/T4894—2009,定义4.1.1.2.16]
1
犌犅/犜38548.1—2020
2.5
异体字狏犪狉犻犪狀狋犆犺犻狀犲狊犲犮犺犪狉犪犮狋犲狉
汉字通常写法之外的一种音同、义同,只是字形笔画或结构不同的字。
示例:升[升、皗],迹[?、矦],泪[?]。
[GB12200.1—1990,定义4.1.3.12]
2.6
系统外字狅狌狋狊犻犱犲狊狔狊狋犲犿犮犺犪狉犪犮狋犲狉狊
用户需要,但计算机当前操作系统中并不存在的汉字。
[CY/T101.1—2014,定义3.3.10]
2.7
乱码犵犪狉犫犾犲犱
由于系统或软件缺乏对某种字符(2.1)编码的支持,而产生的不能正常显示阅读的混乱字符(2.1)。
[CY/T101.1—2014,定义3.3.11]
3加工对象术语
3.1
内容资源犮狅狀狋犲狀狋狉犲狊狅狌狉犮犲
任意载体形式、任何描述粒度的,用于记录知识并具有一定研究、学习和应用价值的内容。
3.2
对象狅犫犼犲犮狋
可感知或可想象的任何事物。
注:对象可以是物质的(如,一台发动机、一张纸、一枚宝石)、非物质的(如,转化率、一个项目计划),或假象的(如,
一头独角兽)。
[GB/T18391.1—2009,定义3.2.22]
3.3
文本狋犲狓狋
以字符(2.1)、符号(2.4)、词、短语、段落、句子或者其他字符(2.1)排列形成的内容,用于表达意义,
其解释基本上取决于读者对于某种自然语言或者人工语言的知识。
注:改写GB/T4894—2009,定义4.1.1.2.4。
3.4
图片犻犿犪犵犲
表示事物图像的数字阵列。一个多维的采样并量化的函数,由相同维数的连续图像产生。
3.5
表格狋犪犫犾犲
以一定逻辑排列单元格用于显示数据、事物分类等,以便直观呈现、快速比较和引用分析的表达
形式。
3.6
缩微胶片犿犻犮狉狅犳犻犾犿
内容资源影像按照一定比例缩小后制作成的胶片。
2
犌犅/犜38548.1—2020
3.7
原生数字资源狀犪狋犻狏犲犱犻犵犻狋犪犾狉犲狊狅狌狉犮犲狊
由软件工具生成的包含数字内容的资源文件。
4流程和工艺术语
4.1
数字化加工犱犻犵犻狋犪犾狆狉狅犮犲狊狊犻狀犵
针对出版物、表单、公文、档案文献等内容资源(3.1),通过专业化的解决方案,加工成多种可编辑的
电子格式文件的活动。
[CY/T101.1—2014,定义5.1.1]
4.2
加工对象狆狉狅犮犲狊狊犻狀犵狅犫犼犲犮狋
数字化加工(4.1)过程中作为一个单位处理的记录信息或实物对象(3.2)。
[CY/T101.1—2014,定义5.1.2]
4.3
内容加工犮狅狀狋犲狀狋狆狉狅犮犲狊狊犻狀犵
将大量分散、零乱、无序的内容资源(3.1)或文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科
学体系加以编排存储,使之系统化的活动。
[CY/T101.1—2014,定义5.1.3]
4.4
标准作业指导书狊狋犪狀犱犪狉犱狅狆犲狉犪狋犻狅狀狆狉狅犮犲犱狌狉犲;犛犗犘
用以指导某个具体过程技术性细节描述的可操作性文件。
[CY/T101.1—2014,定义5.1.6]
4.5
加工工艺狆狉狅犮犲狊狊犻狀犵狋犲犮犺狀狅犾狅犵狔
数字化加工(4.1)所采用的技术方法和流程。
[CY/T101.1—2014,定义5.2.1]
4.6
图像拼接犻犿犪犵犲狊狋犻狋犮犺犻狀犵
将多幅来自同一场景的具有一定重叠区域的小尺寸图像,通过软件系统拼合成为一幅大型的无缝
的图像。
注:改写GB/T31219.3—2014,定义3.12。
4.7
数据转换犱犪狋犪犮狅狀狏犲狉狊犻狅狀
将数据从一种表示形式变换成另一种表示形式。
[CY/T101.1—2014,定义5.2.11]
4.8
光学字符识别狅狆狋犻犮犪犾犮犺犪狉犪犮狋犲狉狉犲犮狅犵狀犻狋犻狅狀;犗犆犚
自动识别通过扫描仪、数码相机、摄像机等得到的图像中的字符(2.1),便于存储、编辑和检索。
[GB/T31219.2—2014,定义3.4]
3
犌犅/犜38548.1—2020
4.9
版面分析犾犪狔狅狌狋犪狀犪犾狔狊犻狊
将扫描图像划分为不同区域块,并确定各图像区域块所需识别内容所在的区域范围的活动。
[CY/T101.1—2014,定义5.2.14]
4.10
图像处理犻犿犪犵犲狆狉狅犮犲狊狊犻狀犵
图片处理狆犻犮狋狌狉犲狆狉狅犮犲狊狊犻狀犵
对于对象(3.2)和数据的图像表示,为给定目的而施加任一操作的过程。
示例:操作实例有景物分析、图像压缩、图像复原、图像增强、预处理、量子化、空间过滤及二维与三维对象模型的
构造。
注:改写GB/T5271.13—2008,定义13.01.04。
4.11
无损压缩犾狅狊狊犾犲狊狊犮狅犿狆狉犲狊狊犻狅狀
去掉或减少数据中的冗余信息,但这些冗余信息可以重新插入到数据中。无损冗余压缩是可逆的
过程。
[GB/T31219.3—2014,定义3.10]
5规格质量术语
5.1
元数据犿犲狋犪犱犪狋犪
关于数据或数据元素的数据(可能包括其数据的描述),以及关于数据拥有权、存取路径、访问权和
数据易变性的数据。
[GB/T5271.17—2010,定义17.06.05]
5.2
著录规则犱犲狊犮狉犻狆狋犻狏犲狉狌犾犲狊
著录各个事项的具体规则和方法。
[CY/T101.1—2014,定义6.1.2]
5.3
都柏林核心元数据犱狌犫犾犻狀犮狅狉犲犿犲狋犪犱犪狋犪;犇犆
一种根据各类信息资源的共同特点确定的,适用于不同领域间信息资源、特别是网络信息资源的元
数据(5.1)。
[CY/T101.1—2014,定义6.1.3]
5.4
内容分析犮狅狀狋犲狀狋犪狀犪犾狔狊犻狊;狊狌犫犼犲犮狋犪狀犪犾狔狊犻狊
对内容及其组成部分之间关系的分析。
[CY/T101.1—2014,定义6.2.5]
5.5
标引犻狀犱犲狓犻狀犵
根据标引规则规定的词或短语,对资源内容或形式表示的过程。
[CY/T101.1—2014,定义6.2.7]
4
犌犅/犜38548.1—2020
5.6
自动标引犪狌狋狅犿犪狋犻犮犻狀犱犲狓犻狀犵
用计算机程序所做的标引(5.5)。
[CY/T101.1—2014,定义6.2.9]
5.7
数字资源对象犱犻犵犻狋犪犾狉犲狊狅狌狉犮犲狅犫犼犲犮狋
数字形态的资源文件的集合。
5.8
数据格式犱犪狋犪犳狅狉犿犪狋
数据保存在文件或记录中的编排格式。
[CY/T101.1—2014,定义6.3.2]
5.9
可移植文档格式狆狅狉狋犪犫犾犲犱狅犮狌犿犲狀狋犳狅狉犿犪狋;犘犇犉
描述固定版式信息,与操作系统平台无关的一种电子文件格式。
[CY/T101.1—2014,定义6.3.4]
5.10
版式文件犳犻狓犲犱犾犪狔狅狌狋犱狅犮狌犿犲狀狋
排版后生成的,包含版面固化呈现需要的全部数据的一种文件。
[CY/T96—2013,定义6.1.5]
5.11
流式文件狉犲犳犾狅狑犻狀犵犱狅犮狌犿犲狀狋
按照内容逻辑顺序,内容呈现可适应终端设备屏幕或窗口变化的一种文件。
[CY/T96-2013,定义6.1.6]
5.12
电子出版文件格式犲犾犲犮狋狉狅狀犻犮狆狌犫犾犻犮犪狋犻狅狀;犈犘狌犫
一种内容可自动重排的文件格式。
[CY/T101.1—2014,定义6.3.16]
5.13
数学置标语言犿犪狋犺犲犿犪狋犻犮犪犾犿犪狉犽狌狆犾犪狀犵狌犪犵犲;犕犪狋犺犕犔
一种基于XML的标准,用以描述数学符号(2.4)和公式的置标语言。
[CY/T101.1—2014,定义6.3.17]
5.14
化学置标语言犮犺犲犿犻犮犪犾犿犪狉犽狌狆犾犪狀犵狌犪犵犲;犆犕犔
一种基于XML的标准,用以描述化学式和公式的置标语言。
5.15
数据损坏犱犪狋犪犮狅狉狉狌狆狋犻狅狀
偶然或故意破坏数据的完整性。
[GB/T25069—2010,定义2.1.35]
5.16
数据质量犱犪狋犪狇狌犪犾犻狋狔
数据在采集、加工、存贮、传输中满足相关的质量要求和指标的情况。
5
犌犅/犜38548.1—2020
[CY/T101.1—2014,定义6.5.1]
5.17
差错犲狉狉狅狉
算出的、观察的或测量的值或状况,与真的、规定的或理论上正确的值或状况之间的差异。
[GB/T5271.14—2008,定义14.01.08]
5.18
一致性检查犮狅狀狊犻狊狋犲狀犮狔犮犺犲犮犽
确定彼此间依赖的对象(3.2)是否遵循预先约定的要求的数据验证活动。
[CY/T101.1—2014,定义6.5.7]
5.19
抽样狊犪犿狆犾犻狀犵
从主体中选取能代表整体的一定比例的样本。
[CY/T101.1—2014,定义6.5.8]
6数据服务术语
6.1
成品数据犳犻狀犻狊犺犲犱犱犪狋犪
已经完成全部数据处理过程且符合预先设定的规格和质量要求,可实现交付的最终数据形态。
[CY/T101.1—2014,定义7.1.1]
6.2
数据库犱犪狋犪犫犪狊犲
按照概念结构组织的数据的汇集,它描述这些数据的特征及与数据对应的实体间的关系,并支持
一个或多个应用领域。
[GB/T5271.1—2000,定义01.08.05]
6.3
内容数据库犮狅狀狋犲狀狋犱犪狋犪犫犪狊犲
按照一定逻辑组织并集合内容的数字出版产品。
[CY/T96—2013,定义4.2.8]
6.4
电子书犲犫狅狅犽
通过相关设备直接呈现文字、图像、音频、视频等内容的数字出版产品。
注:电子书包括电子图书、电子期刊和电子报等。
[CY/T96—2013,定义4.2.4]
6.5
按需印刷狆狉犻狀狋狅狀犱犲犿犪狀犱;犘犗犇
按照用户要求的内容和数量,在指定地点和时间,利用数码及超高速印刷技术设备进行数字印刷并
装订成册的出版方式。
[CY/T101.1—2014,定义7.1.11]
6.6
知识库犽狀狅狑犾犲犱犵犲犫犪狊犲
一种数据库(6.2),包含有关某领域人类经验和专家知识的推理规则和信息。
6
犌犅/犜38548.1—2020
注:在自完善系统中,知识库还包括由以前所遇问题的解法产生的信息。
[GB/T5271.1—2000,定义01.06.18]
6.7
信息安全犻狀犳狅狉犿犪狋犻狅狀狊犲犮狌狉犻狋狔
保护、维持信息的保密性、完整性和可用性,也可包括真实性、可核查性、抗抵赖性、可靠性等性质。
[GB/T25069—2010,定义2.1.52]
6.8
数据保护犱犪狋犪狆狉狅狋犲犮狋犻狅狀
采用管理或技术措施,防范未经授权访问数据。
[GB/T25069—2010,定义2.1.34]
6.9
访问控制犪犮犮犲狊狊犮狅狀狋狉狅犾
一种保证数据处理系统的资源,只能由被授权主体按授权方式进行访问的手段。
[GB/T25069—2010,定义2.2.1.42]
6.10
数据完整性犱犪狋犪犻狀狋犲犵狉犻狋狔
数据没有遭受以未授权方式所作的更改或破坏的特性。
[GB/T25069—2010,定义2.1.36]
6.11
数据保密性犱犪狋犪犮狅狀犳犻犱犲狀狋犻犪犾犻狋狔
保证数据在传输过程中不会被非法用户获得的特性。
7
犌犅/犜38548.1—2020
参考文献
[1]GB/T4894—2009信息与文献术语
[2]GB/T5271.1—2000信息技术词汇第1部分:基本术语
[3]GB/T5271.4—2000信息技术词汇第4部分:数据的组织
[4]GB/T5271.9—2001信息技术词汇第9部分:数据的传输
[5]GB/T5271.13—2008信息技术词汇第13部分:计算机图形
[6]GB/T5271.14—2008信息技术词汇第14部分:可靠性、可维护性与可用性
[7]GB/T5271.17—2010信息技术词汇第17部分:数据库
[8]GB/T12200.1—90汉语信息处理词汇01部分:基本术语
[9]GB/T18391.1—2009信息技术元数据注册系统(MDR)第1部分:框架
[10]GB/T25069—2010信息安全技术术语
[11]GB/T31219.2—2014图书馆馆藏资源数字化加工规范第2部分:文本资源
[12]GB/T31219.3—2014图书馆馆藏资源数字化加工规范第3部分:图像资源
[13]CY/T96—2013电子书内容术语
[14]CY/T101.1—2014新闻出版内容资源加工规范第1部分:加工专业术语
8
犌犅/犜38548.1—2020
索引
汉语拼音索引
犃
按需印刷6.5………
犅
版面分析4.9………
版式文件5.10………
标引5.5……………
标准作业指导书4.4………………
表格3.5……………
犆
差错5.17……………
成品数据6.1………
抽样5.19……………
犇
电子出版文件格式5.12……………
电子书6.4…………
都柏林核心元数据5.3……………
对象3.2……………
犉
访问控制6.9………
符号2.4……………
犌
光学字符识别4.8…………………
犎
化学置标语言5.14…………………
犑
加工对象4.2………
加工工艺4.5………
犓
可移植文档格式5.9………………
犔
流式文件5.11………
乱码2.7……………
犖
内容分析5.4………
内容加工4.3………
内容数据库6.3……
内容资源3.1………
犛
数据保护6.8………
数据保密性6.11……
数据格式5.8………
数据库6.2…………
数据损坏5.15………
数据完整性6.10……
数据质量5.16………
数据转换4.7………
缩微胶片3.6………
数学置标语言5.13…………………
数字化加工4.1……
数字资源对象5.7…………………
犜
图片3.4……………
图像处理4.10………
图像分辨率2.3……
图像拼接4.6………
犠
文本3.3……………
无损压缩4.11………
9
犌犅/犜38548.1—2020
犡
系统外字2.6………
信息安全6.7………
犢
一致性检查5.18……
异体字2.5…………
元数据5.1…………
犣
知识库6.6…………
著录规则5.2………
自动标引5.6………
字符2.1……………
字符集2.2…………
英文对应词索引
犃
犪犮犮犲狊狊犮狅狀狋狉狅犾6.9………………
犪狌狋狅犿犪狋犻犮犻狀犱犲狓犻狀犵
5.6…………………………
犆
犮犺犪狉犪犮狋犲狉2.1……………………
犮犺犪狉犪犮狋犲狉狊犲狋2.2………………
犮犺犲犿犻犮犪犾犿犪狉犽狌狆犾犪狀犵狌犪犵犲5.14………………
犮狅狀狊犻狊狋犲狀犮狔犮犺犲犮犽5.18…………………………
犮狅狀狋犲狀狋犪狀犪犾狔狊犻狊5.4……………
犮狅狀狋犲狀狋犱犪狋犪犫犪狊犲6.3……………
犮狅狀狋犲狀狋狆狉狅犮犲狊狊犻狀犵
4.3…………………………
犮狅狀狋犲狀狋狉犲狊狅狌狉犮犲3.1……………
犇
犱犪狋犪犮狅狀犳犻犱犲狀狋犻犪犾犻狋狔
6.11………………………
犱犪狋犪犮狅狀狏犲狉狊犻狅狀4.7……………
犱犪狋犪犮狅狉狉狌狆狋犻狅狀5.15……………
犱犪狋犪犳狅狉犿犪狋5.8…………………
犱犪狋犪犻狀狋犲犵狉犻狋狔
6.10……………
犱犪狋犪狆狉狅狋犲犮狋犻狅狀6.8……………
犱犪狋犪狇狌犪犾犻狋狔
5.16………………
犱犪狋犪犫犪狊犲6.2……………………
犱犲狊犮狉犻狆狋犻狏犲狉狌犾犲狊5.2……………
犱犻犵犻狋犪犾狆狉狅犮犲狊狊犻狀犵
4.1…………………………
犱犻犵犻狋犪犾狉犲狊狅狌狉犮犲狅犫犼犲犮狋5.7……………………
犇狌犫犾犻狀犮狅狉犲犿犲狋犪犱犪狋犪5.3………………………
犈
犲犫狅狅犽6.4………………………
01
犌犅/犜38548.1—2020
犲犾犲犮狋狉狅狀犻犮狆狌犫犾犻犮犪狋犻狅狀5.12……………………
犲狉狉狅狉5.17………………………
犉
犳犻狀犻狊犺犲犱犱犪狋犪6.1………………
犳犻狓犲犱犾犪狔狅狌狋犱狅犮狌犿犲狀狋5.10……………………
犌
犵犪狉犫犾犲犱
2.7……………………
犐
犻犿犪犵犲3.4………………………
犻犿犪犵犲狆狉狅犮犲狊狊犻狀犵
4.10…………………………
犻犿犪犵犲狉犲狊狅犾狌狋犻狅狀2.3……………
犻犿犪犵犲狊狋犻狋犮犺犻狀犵
4.6……………
犻狀犱犲狓犻狀犵
5.5……………………
犻狀犳狅狉犿犪狋犻狅狀狊犲犮狌狉犻狋狔
6.7………………………
犓
犽狀狅狑犾犲犱犵犲犫犪狊犲6.6……………
犔
犾犪狔狅狌狋犪狀犪犾狔狊犻狊4.9……………
犾狅狊狊犾犲狊狊犮狅犿狆狉犲狊狊犻狅狀4.11………………………
犕
犿犪狋犺犲犿犪狋犻
温馨提示
- 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
- 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
- 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。
最新文档
- 挤压修模工岗后考核试卷含答案
- 珂罗版制版员安全意识强化知识考核试卷含答案
- 金属材涂层机组操作工创新意识强化考核试卷含答案
- 金属版印刷员操作水平模拟考核试卷含答案
- 中药散剂(研配)工岗前安全教育考核试卷含答案
- 新生儿脐炎的并发症及处理
- 基础护理学第四版:疼痛管理
- 莞邑探径:东莞市城区小学教师教育科研素质的现状剖析与进阶策略
- 药液实时精确计量与变量喷雾控制技术:原理、应用与创新
- 荧光原位杂交技术在尿路上皮癌与前列腺癌诊疗中的深度解析与应用拓展
- 全胃切除病人全程营养管理中国专家共识(2026版)
- 2026年四川成都市中考地理试卷含答案
- 2025-2026 学年人音版初中音乐八年级下册全册知识点梳理
- 2026年自贡市自流井区社区工作者招聘笔试参考试题及答案解析
- 2026年版闲鱼卖货实战手册(选品+定价+爆款打造完整攻略)
- 雨课堂学堂在线学堂云审计法律研究与案例(西南政法大学)单元测试考核答案
- “十五五”规划纲要应知应会100题及答案
- 2026安徽合肥市发展和改革委员会上半年招聘事业单位工作人员20人考试备考试题及答案解析
- 限额以下小型工程常见安全隐患指导手册(2026版)
- 年龄相关性黄斑变性课件
- 小水电生态流量监测项目招标文件
评论
0/150
提交评论