标准解读
《GB/T 40035-2021 双语平行语料加工服务基本要求》是针对双语平行语料处理服务制定的一项国家标准。该标准主要规定了提供双语平行语料加工服务时应遵循的基本原则、技术要求以及质量保证措施等,旨在提高双语平行语料的质量和可用性,促进语言资源的有效利用。
根据此标准,双语平行语料加工服务涵盖了从原始文本到最终可用于翻译记忆库、机器翻译训练或其他自然语言处理任务的高质量双语文本数据整个过程。它强调了对于源语言与目标语言之间对应关系准确性的重要性,并且对参与人员的专业技能提出了具体要求,比如需要具备良好的双语能力以及相关领域的专业知识。
如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。
....
查看全部
- 现行
- 正在执行有效
- 2021-04-30 颁布
- 2021-11-01 实施
文档简介
ICS03080993524030
;
CCSA.10...
中华人民共和国国家标准
GB/T40035—2021
双语平行语料加工服务基本要求
Basicrequirementsforbilingualparallelcorpusprocessingservice
2021-04-30发布2021-11-01实施
国家市场监督管理总局发布
国家标准化管理委员会
GB/T40035—2021
目次
前言
…………………………Ⅲ
范围
1………………………1
规范性引用文件
2…………………………1
术语和定义
3………………1
总则
4………………………2
基本要求
5…………………3
服务提供方
5.1…………………………3
语料加工人员
5.2………………………3
服务环境
5.3……………3
加工内容
5.4……………3
加工结果
5.5……………3
完整性
5.5.1…………………………3
准确性
5.5.2…………………………3
可用性
5.5.3…………………………4
规范性
5.5.4…………………………4
语料加工工具
5.6………………………4
可靠性
5.6.1…………………………4
易用性
5.6.2…………………………4
本地化界面
5.6.2.1…………………4
操作功能
5.6.2.2……………………4
帮助系统
5.6.2.3……………………5
效率
5.6.2.4…………………………5
兼容性
5.6.3…………………………5
加工流程
6…………………5
预处理
6.1………………5
语料准备
6.1.1………………………5
清洗
6.1.2……………5
去重
6.1.3……………5
脱敏
6.1.4……………5
语料对齐
6.2……………6
语料审核
6.3……………6
服务内容
7…………………6
需求沟通
7.1……………6
客户协议
7.2……………6
项目管理
7.3……………6
加工环节
7.4……………6
Ⅰ
GB/T40035—2021
交付内容
7.5……………7
质量保证期
7.6…………………………7
服务评价与改进
7.7……………………7
数据安全
8…………………7
数据备份
8.1……………7
文档管理与日志
8.2……………………7
数据存储
8.3……………7
附录资料性双语平行语料加工人员的培训
A()………8
附录资料性双语语料加工的元数据
B()………………9
附录资料性文件常见编码格式
C()TXT……………11
附录资料性格式规范
D()TMX………………………12
附录资料性文件的命名规则编码格式及文件格式
E()、……………14
参考文献
……………………15
Ⅱ
GB/T40035—2021
前言
本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定
GB/T1.1—2020《1:》
起草
。
请注意本文件的某些内容可能涉及专利本文件的发布机构不承担识别专利的责任
。。
本文件由全国语言与术语标准化技术委员会提出并归口
(SAC/TC62)。
本文件起草单位中国标准化研究院中国翻译协会上海一者信息科技有限公司上海佑译信息科
:、、、
技有限公司中译语通科技股份有限公司北京悦尔信息技术有限公司苏州联跃科技有限公司四川语
、、、、
言桥信息技术有限公司北京百度网讯科技有限公司沈阳雅译网络技术有限公司上海智膳合网络科
、、、
技有限公司北京语言大学北京邮电大学
、、。
本文件主要起草人刘智洋张井叶剑柴瑛黄宝荣罗慧芳蒙永业朱励张雪涛王海涛朱宪超
:、、、、、、、、、、、
韩林涛郑春萍何中军于立梅张春良甘克勤张宝林
、、、、、、。
Ⅲ
GB/T40035—2021
双语平行语料加工服务基本要求
1范围
本文件规定了双语平行语料加工服务的基本要求加工流程服务内容和数据安全等内容
、、。
本文件适用于以原文和译文为对象的以文字为表达形式的数字化双语语料加工服务其他数字化
、,
文本的语料加工也可参照使用也适用于对语料对齐工具的评价
,。
2规范性引用文件
本文件没有规范性引用文件
。
3术语和定义
下列术语和定义适用于本文件
。
31
.
文本text
以字符符号词短语段落句子表格或其他字符排列形成的数据用于表达意义其解释基本上
、、、、、、,,
取决于读者对于某种自然语言或人工语言的知识
。
来源
[:GB/T4894—2009,4.1.1.2.4]
32
.
语料corpus
温馨提示
- 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
- 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
- 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。
最新文档
- 电工实践考试题及答案
- 地理湘教版测试题及答案
- 公关品牌政府事务岗面试指南:媒体沟通与危机公关
- 粮库安全生产试题及答案
- 2026山东省面向喀什籍未就业少数民族高校毕业生招聘事业单位人员15人模拟试卷(名师系列)附答案详解
- 空间遥感智能测绘
- 低空经济配套基础设施与解决方案
- 人工智能大模型应用方案
- 2026三年级读写数字化资源应用课件
- 数据要素深度确权与安全评估体系构建
- 2024北京海淀区五年级(下)期末语文试题及答案
- 黑龙江哈尔滨历年中考作文题与审题指导(2001-2024)
- 射频电路元件与工作原理解析
- 2025《医药企业防范商业贿赂风险合规指引》解读课件
- 常州强基计划数学试卷
- 关于物业客服培训的
- 经国济民学习通超星期末考试答案章节答案2024年
- vte的预防与护理
- 电子元器件来料检验规范指导书
- 牛头刨床(机械原理课程设计)完整版
- 消化道早癌筛查知识讲座
评论
0/150
提交评论