DB51∕T 3359-2026 人工智能 数据标注通 用技术要求_第1页
DB51∕T 3359-2026 人工智能 数据标注通 用技术要求_第2页
DB51∕T 3359-2026 人工智能 数据标注通 用技术要求_第3页
DB51∕T 3359-2026 人工智能 数据标注通 用技术要求_第4页
DB51∕T 3359-2026 人工智能 数据标注通 用技术要求_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

DB51DB51/T3359—2026人工智能数据标注通用技术要求2026-05-29发布2026-06-29实施I 4 4 4 4 4 4 本文件按照GB/T1.1—2020《标准13.13.23.33.423.5——客观规范与真实安全:数据标注应基于客观事实和真实数据,确保所标注的数据能够真——透明可信可解释:标注规则应清晰、具体,便于理解和执行。同时,规则的解释应具有——一致性与复用性:同类数据的标注应保持一致,确保不同标注人员或工具的结果可比、——效率与经济性:通过整合资源、采用适当的技术措施等,提升标注工作效率及成本优化——质量优先与可改进性:标注规则应设置质量检测与反馈机制,保证标注的持续改进与迭4.2规则制定与验证——在任务实施前应根据项目需求制定标注指南,内容涵盖标注目标、数据范围、方法说明4.3特殊数据的规则要求——涉及个人隐私数据:应遵守相关法律法规的要求,进行脱敏与访问权限控制,并符合GB/T——行业敏感数据:如医疗、金融、政务等领域,应符合相应相关行业法律法规、行业标准35.2语音标注/口音标注、语音意图标注、韵律标注等类型,应使用时间戳等,根据应用要求可精确到秒级、毫秒级5.3图像标注5.5多模态数据标注——功能全面:数据标注工具及平台具备管理、标注、质量控制、验收等功能,以提高标注——易用性与交互性:标注工具及平台具备良好的用户界面和操作流程,支持快捷键、批量——开放性与互操作性:标注工具及平台支持多种数据格式,能与不同领域应用场景的系统——数据安全与合规性:采用加密存储与安全传输协议,防止数据泄露,支持脱敏处理与访6.2功能要求47.2人机协同标注7.3机器标注——规则驱动标注:通过人工预设明确的逻辑规则、判断条件或模式;如:关键词匹配、阈——数据驱动标注:以已标注的样本数据为基础,通过训练算法模型使其自主学习数据内在与规律,待模型达到预设性能标准后,再利用该模型对新的未标——高精度/高风险场景:包括但不限于医学诊断、金融风控等,宜采用人工标注或人机——大规模低风险场景:包括但不限于社交媒体文本情感分析、通用商品图像分类等,宜采5——跨领域或敏感数据:包括但不限于跨语种医疗文献标注、政务敏感数据处理、企业商业文档要素提取等,需兼顾跨领域知识适配与数据安全的场景,宜采用——时效性要求高场景:包括但不限于实时舆情监测、即时内容审核、工业生产实时质检等应根据GB/T37973和GB/T35274的GB/T45654和GB/T4567——数据切分与重组:对大尺寸图像、长文本或长时序数据进行合理切分,降低单样本标注——几何与物理一致性变换:在不影响语义判定的前提下,进行尺度调整、轻微旋转、镜像8.2数据标注过程6——数据需求方应明确标注目标、应用场景与使用需求,并联合标注管理方、数据标注方将——涉及数据安全要求的,应符合GB/T45674的相关要求,明确数据安全管理机制提出数据标——自有数据准备:数据需求方应核对自有原始数据,确定数据的安全等级。数据标注方应——采集数据准备:对已授权的采集数据进行数据登记、核查、整理、预处理、脱敏脱密、分级等,形成与标注任务要求匹配的待标注数据;数据标注方8.2.4标注规则确定与统一——小规模试标及验收:开展小规模样本试标,记录试标过程及结果,并根据试标结果调整——编制标注规则指南:按照任务说明编制标注规则指南,内容包括但不限于标注任务说明——标注人员培训:数据标注方应建立标准作业程序,并根据标注规则指南对标注人员开——明确质量检查规则:应根据任务说明和GB/T42755的相关要求制定质量检查规则,包括但•准确性:应声明标注结果的准确性评估方法及指标,如:召回率、精确度、平,如:Kappa系数、F1分数等一致性定量指标,人工审核和讨论对标注•可追溯性:记录标注任务全流程信息,如:人员、工具、时间节点等。7——明确质量控制方法:错误率等指标超过指标阈值时,数据标注方应进行数据标注返工与标注人员再培训;安全性标注质量应满足数据需求方的要求,当未通过安——数据标注方应按

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论