国家标准《网络安全技术 生成式人工智能数据标注安全规范》(征求意见稿)编制说明_第1页
国家标准《网络安全技术 生成式人工智能数据标注安全规范》(征求意见稿)编制说明_第2页
国家标准《网络安全技术 生成式人工智能数据标注安全规范》(征求意见稿)编制说明_第3页
国家标准《网络安全技术 生成式人工智能数据标注安全规范》(征求意见稿)编制说明_第4页
国家标准《网络安全技术 生成式人工智能数据标注安全规范》(征求意见稿)编制说明_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、工作简况

1.1任务来源

2023年,全国网络安全标准化技术委员会(SAC/TC260)提出了国家标准

《网络安全技术生成式人工智能人工标注安全规范》(标准名称后修改为《网络

安全技术生成式人工智能数据标注安全规范》)的制定需求,该标准由全国网络

安全标准化技术委员会(SAC/TC260)提出并归口管理。

1.2制定背景

生成式人工智能已经成为人工智能领域的一个重要分支,具有广阔的应用前

景和发展空间,生成式人工智能人工标注的准确性、安全性对于生成式人工智能

的性能和安全应用具有重要的影响。近年来随着生成式人工智能的爆发式发展,

人工标注的产业规模迅速增长,越来越多的专业标注公司和众包标注平台涌现,

生成式人工智能模型的对于数据标注的需求不断增长。

2023年7月,中央网信办联合多部门发布《生成式人工智能服务管理暂行

办法》,其中数据标注是其中重要内容,相关内容实施落地亟需配套标准支撑相

关工作开展。目前国内外尚无针对数据标注活动的相关标准进行安全指导和规范。

为落实《生成式人工智能服务管理暂行办法》的相关要求,有必要针对生成式人

工智能产品研制中的数据标注环节,对数据标注规则制定、标注实施安全、标注

质量及安全性核验要求、标注人员安全管理要求、过程安全控制要求、安全证实

方法等方面提出规范指引。

1.3起草过程

1、2023年3月,组建标准起草组,编制形成第一版草案。

2、2023年4-5月,标准编制组对生成式人工智能数据标注企业、人工智能

大模型厂商等相关方进行调研,同步进行生成式人工智能数据标注活动安全需求

分析和安全要求梳理,组织多次起草组内部研讨,进一步完善标准文本。

3、2023年6月,标准编制组在昆明召开的全国网络安全标准周上进行立项

汇报。

4、2023年7月,标准编制组在全国网络安全标准化技术委员会的网络安全

国家标准立项专家评审会上答辩汇报,标准正式立项。

5、2023年8-10月,正式成立标准编制组,标准由国家计算机网络应急技

术处理协调中心牵头,中国电子技术标准化研究院、北京中关村实验室、清华大

学等共同组成标准编制组,对标准内容进行研讨,分工修改完善标准草案。

6、2023年11月,标准编制组在武汉召开的全国网络安全标准周上进行汇

报,并申请本标准转阶段至征求意见稿。

7、2023年11月至2024年1月,标准编制组征集到相关专家意见61条,

处理结果为采纳38条,部分采纳18条,未采纳5条。

8、2024年3月15日,标准编制组提交标准征求意见稿由TC260专家审议,

收到意见31条,处理结果为采纳28条,部分采纳3条。

二、标准编制原则、主要内容及其确定依据

2.1标准编制原则

《网络安全技术生成式人工智能数据标注安全规范》通过借鉴国内外相关

标准,结合国内应用实践和标准编制组的研究成果,提出与国内外相关标准接轨、

适合我国国情,并具有一定创新性的标准。

本标准的编制遵循以下原则:

1、兼容性:标准编制过程中广泛参考国内外人工智能领域相关标准成果,

与相关标准在标注流程、数据管理等标准内容兼容;

2、科学性:广泛调研国内生成式人工智能在数据标注、人员管理、质量核

验等方面情况,标准内容适合我国国情;

3、简明性:标准易于理解、实现和应用;

4、一致性:术语与国内外标准所用术语最大程度保持一致。

2.2主要内容及其确定依据

(一)主要内容

本标准针对生成式人工智能产品研制中的人工标注环节,对人工标注规则制

定、标注实施安全、标注质量及安全性核验要求、标注人员安全管理要求、过程

安全控制要求、安全证实方法等方面提出规范指引。本标准制定对促进生成式人

工智能人工标注工作的规范和标准化,提升标注人员理解标注任务能力,提高标

注流程安全性,减少标注过程中可能出现的有害信息、歧视信息、虚假信息等内

容,提高标注数据的质量及安全性,进而提高生成式人工智能模型的帮助性、诚

实性和无害性。本标准将为生成式人工智能人工标注活动提供安全指南,填补目

前国内外该领域标准空白,有效提升生成式人工智能人工标注实施及应用安全性。

主要内容包括:

(1)生成式人工智能数据标注基本概念;

(2)标注任务前期准备安全要求;

(3)标注任务执行安全要求;

(4)标注结果输出安全要求;

(5)标注过程活动控制安全要求;

(6)标注安全测试方法。

(二)确定依据

为落实《生成式人工智能服务管理暂行办法》等文件的明确要求,按照全国

网络安全标准化技术委员会《关于发布2023年度网络安全国家标准需求的通知》,

确定了本标准的主要目标和主要内容,旨在推动提升生成式人工智能产品研制中

人工标注环节的标注规则、标注人员培训、标注内容正确性等内容的规范性,促

进生成式人工智能技术领域发展。

本标准在有关主管部门的指导下,广泛国内外生成式人工智能技术研发机构

及企业、数据标注企业等所开展的探索和应用,根据国内产业发展需求和网络安

全管理需要,提出了相应的开展生成式人工智能数据标注工作的相关实施要求。

标准编制单位涵盖了相关研究机构、生成式人工智能研发企业、数据标注企

业、网络安全企业等相关方,标准编制过程中将充分考虑生成式人工智能技术发

展在优化训练、标注管理等方面需求,助力生成式人工智能数据标注工作的规范、

有序开展。

标准编制过程中将注重标准落地实施的可行性、科学性,充分协调生成式人

工智能监管支撑单位、生成式人工智能技术研发单位、数据标注实施单位等相关

方结合实际应用场景进行讨论、论证以及在实验环境下的技术验证,并积极推进

在真实数据标注生产环境下的试点验证,充分验证本标准各环节的相关实践,确

保标准内容安全、可落地、可实施。

2.3修订前后技术内容的对比[仅适用于国家标准修订项目]

不涉及。

三、试验验证的分析、综述报告,技术经济论证,预期的经济效益、社会效

益和生态效益

3.1试验验证的分析、综述报告

3.2技术经济论证

3.3预期的经济效益、社会效益和生态效益

本标准的制定可满足生成式人工智能数据标注的安全管理需要,亦可有效助

力我国生成式人工智能技术的发展与推广应用,能够产生较好的经济效益、社会

效益和生态效益,有效提升生成式人工智能人工标注实施及应用安全性。

四、与国际、国外同类标准技术内容的对比情况,或者与测试的国外样品、

样机的有关数据对比情况

标准编制过程中,根据国内生成式人工智能数据标注实际需要,引用了《人

工智能面向机器学习的数据标注规程》(GB/T42755-2023),在基本流程方面

与该标准内容相一致。

在国际标准方面,ISO/IEC23053:2022Informationtechnology-Artificial

intelligence-Artificialintelligenceconceptsandterminology,建立了人工智能的术

语并描述了人工智能领域的概念。可用于制定其他标准并支持不同的利益相关方

之间的沟通。ISO/IEC23053:2022FrameworkforArtificialIntelligence(AI)

SystemsUsingMachineLearning(ML)建立了人工智能(AI)和机器学习(ML)

框架,用于描述使用ML技术的通用AI系统。该框架描述了人工智能生态系

统中的系统组件及其功能。已批准工作项目ISO/IECAWI27090Cybersecurity-

ArtificialIntelligence-Guidanceforaddressingsecuritythreatsandfailuresin

artificialintelligencesystems,为组织应对人工智能系统中的安全威胁和故障提供

了指导,旨在帮助相关企业和组织更好地了解人工智能系统在其整个生命周期中

面临的安全威胁和后果,以及如何检测和减轻此类威胁。ISO/IECWD27091

CybersecurityandPrivacy-ArtificialIntelligence-Privacyprotection,为组织解决

人工智能系统和机器学习模型中的隐私风险提供了指导。除了一些框架性国际标

准在流程中提及标注数据以外,针对数据标注活动,目前还没有专门的标准进行

安全指导和规范,本标准将为生成式人工智能数据标注活动提供全面的安全指南,

填补目前国内外标准中该领域的空白。

五、以国际标准为基础的起草情况,以及是否合规引用或者采用国际国外标

准,并说明未采用国际标准的原因

本标准不涉及相关情况。

六、与有关法律、行政法规及相关标准的关系

《办法》第八条提出:在生成式人工智能技术研发过程中进行数据标注的,

提供者应当制定符合本办法要求的清晰、具体、可操作的标注规则;开展数据标

注质量评估,抽样核验标注内容的准确性;对标注人员进行必要培训,提升尊法

守法意识,监督指导标注人员规范开展标注工作。《办法》第十九条提出:有关

主管部门依据职责对生成式人工智能服务开展监督检查,提供者应当依法予以配

合,按要求对训练数据来源、规模、类型、标注规则、算法机制机理等予以说明,

并提供必要的技术、数据等支持和协助。目前,国内还没有生成式人工智能数据

标注的安全规范标准,《办法》为本标准的制定提供了重要的指导性参考,本标

准旨在落实《办法》的相关要求,对《办法》要求进行进一步补充和细化并提供

具体的规范化实践指引。

七、重大分歧意见的处理经过和依据

无。

八、涉及专利的有关说明

本标准不涉及专利。

九、实施国家标准的要求,以及组织措施、技术措施、过渡期和实施日期的

建议等措施建议

建议对标准中的条款进行宣贯,加强对开展生成式人工智能数据标注过程中

的标注规则制定、标注实施、人员管理、质量核验等方面的实施思路的宣贯介绍,

以在标准适用的相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论