国家标准《网络安全技术 生成式人工智能预训练和优化训练数据安全规范》(征求意见稿)编制说明_第1页
国家标准《网络安全技术 生成式人工智能预训练和优化训练数据安全规范》(征求意见稿)编制说明_第2页
国家标准《网络安全技术 生成式人工智能预训练和优化训练数据安全规范》(征求意见稿)编制说明_第3页
国家标准《网络安全技术 生成式人工智能预训练和优化训练数据安全规范》(征求意见稿)编制说明_第4页
国家标准《网络安全技术 生成式人工智能预训练和优化训练数据安全规范》(征求意见稿)编制说明_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、工作简况

1.1任务来源

为加强网络安全国家标准在国家网络安全保障工作中的基础性、规范性、引

领性作用,全国网络安全标准化技术委员会调研国家网络安全重点工作和技术产

业发展需求,研究形成了2023年网络安全国家标准需求清单,含《网络安全技术

生成式人工智能预训练和优化训练数据安全规范》。2023年5月,北京中关村实

验室联合相关单位参与申报该标准,于2023年8月份通过全国网络安全标准化技

术委员会立项。

1.2制定背景

2022年11月底,生成式人工智能的出现引发各方广泛关注。为促进生成式人

工智能技术健康发展和规范应用,2023年4月11日,国家互联网信息化办公室起

草的《生成式人工智能服务管理办法(草案)》向全社会公开征求意见。其中,

第七条有关“生成式人工智能产品的预训练数据、优化训练数据”条款备受关注。

2023年4月13日,全国网络安全标准化技术委员会发布《关于发布2023年度第一

批网络安全国家标准需求的通知》,将本标准纳入2023年网络安全国家安全标准

需求项目。2023年7月13日,《生成式人工智能服务管理暂行办法》正式公布,

并已于2023年8月15日正式施行。

2023年8月25日,全国网络安全标准化技术委员会发布《全国信息安全标准

化技术委员会关于2023年第一批网络安全国家标准项目立项的通知》,明确本标

准由北京中关村实验室作为项目牵头单位负责标准编制工作。

1.3起草过程

1、2023年4月,北京中关村实验室牵头组建标准前期研究工作小组,小组

对研究《生成式人工智能管理办法(征求意见稿)》,广泛收集专家对办法的讨论

与解读,形成相应标准草案,并准备申报材料。

2、2023年6月,北京中关村实验室编制组在全国网络安全标准化技术委员

会2023年第一次“标准周”上进行标准汇报,通过组内成员单位投票。标准编

1

制组根据意见进行认真修改。

3、2023年8月,全国网络安全标准化技术委员会发布《全国信息安全标准

化技术委员会关于2023年第一批网络安全国家标准项目立项的通知》,同意本标

准由北京中关村实验室作为项目牵头单位负责标准编制工作。

4、2023年9月,北京中关村实验室召开标准研讨会,继续完善标准草案,

并对外公开征集标准参编单位。

5.2023年10月,北京中关村实验室正式成立标准编制组,召开国家标准制

定启动会,并就标准草案内容向参编单位征集贡献,对标准内容进行完善。

6.2023年11月,北京中关村实验室编制组在全国网络安全标准化技术委员

会2023年第二次“标准周”上进行标准汇报。SWG-BDS工作组对标准进行了审

议并行成“修改完善后转为征求意见稿”结论。标准编制组根据意见进行认真修

改。

二、标准编制原则、主要内容及其确定依据

2.1标准编制原则

本标准的编制遵循以下原则:

(1)先进性:标准反映当前《生成式人工智能服务管理暂行办法》等最新

法律要求以及生成式人工智能的先进技术水平;

(2)开放性:标准的编制、评审与使用具有开放性;

(3)适应性:标准结合我国国情;

(4)简明性:标准易于理解、实现和应用;

(5)中立性:公正、中立,不与任何利益攸关方发生关联;

(6)一致性:术语与国内外标准所用术语最大程度保持一致。

本标准通过“数据通用安全”和“数据处理安全”两个维度,对生成式人

工智能服务的研发者开展预训练和优化训练过程中涉及的数据处理过程安全保

护要求作出明确规范,以实现降低生成式人工智能服务遭受数据投毒、恶意诱导

性提示等安全威胁目的。

2.2主要内容及其确定依据

本项目旨在于支撑《生成式人工智能服务管理暂行办法》第七条对预训练

和优化训练等训练数据处理活动规范的落地实施,试图明确生成式人工智能服务

2

研发者在预训练和优化训练等训练数据处理活动中的数据来源等方面的管理要

求,解决生成式人工智能服务可能存在的被诱导生成侵害他人知识产权、个人信

息等问题,提高生成式人工智能服务的安全性。

2.3修订前后技术内容的对比[仅适用于国家标准修订项目]

不适用。

三、试验验证的分析、综述报告,技术经济论证,预期的经济效益、社会

效益和生态效益

3.1试验验证的分析、综述报告

本文件规定了生成式人工智能预训练和优化训练数据及其处理活动的安全

要求,描述了对应的评价方法。

本文件适用于指导生成式人工智能服务提供者开展预训练和优化训练数据

处理活动以及开展与训练预训练和优化训练数据安全自评价,也可为监管评估提

供参考。

北京中关村实验室牵头制定本标准,并承担标准应用推广工作。国家计算机

网络应急技术处理协调中心、中国电子技术标准化研究院、清华大学、北京深言

科技有限责任公司、北京面壁智能科技有限责任公司、北京智谱华章科技有限公

司等单位将承担标准应用试点和技术支持任务。

本标准编制过程主要分为标准文本编制及完善、标准试点工作等。前期以北

京中关村实验室为牵头单位,组织联合申报单位充分调研学术界、产业界相关情

况后共同撰写修改标准草案。标准完善后,在北京深言科技有限责任公司、北京

面壁智能科技有限责任公司、北京智谱华章科技有限公司等参与单位展开标准试

点工作。

3.2技术经济论证

虽然落实本标准提出的安全要求,在短期内给生成式人工智能服务研发者增

加了经济成本,包括但不限于:新增知识产权等方面合规人员的成本、开发分类

模型等数据识别清洗计算机程序的成本、安全风险自评估的成本等,但这些成本

能够有效增加生成式人工智能服务在社会公众使用、公众舆论方面的接受度和认

可度,降低生成式人工智能服务在知识产权、个人信息等方面纠纷、争议的成本。

总的来说,该技术标准给企业带来正面的经济效应。

3.3预期的经济效益、社会效益和生态效益

3

该标准的社会效益在于保护生成式人工智能服务的安全性,减少生成式人工

智能服务在侵害知识产权、个人信息等方面的风险,并在此基础上促进生成式人

工智能服务商业方面的良性竞争。

该标准不涉及生态效益。

四、与国际、国外同类标准技术内容的对比情况,或者与测试的国外样品、

样机的有关数据对比情况

目前生成式人工智能预训练和优化训练数据安全不存在对应的国际标准,也

未见其他国家制定了对应的技术标准。

五、以国际标准为基础的起草情况,以及是否合规引用或者采用国际国外

标准,并说明未采用国际标准的原因

当前,国际标准并没有对生成式人工智能预训练和优化训练数据安全开展标

准化工作,其他国家也没有制定对应的技术标准,因此本标准制定工作中没有采

用国际标准或国外标准。

六、与有关法律、行政法规及相关标准的关系

本标准与现行法律、法规以及国家标准不存在冲突与矛盾。

本标准为《生成式人工智能服务管理暂行办法》等法律法规的落地实施提供

支撑,建议与标准《网络安全技术生成式人工智能数据标注安全规范》等配套

使用。

七、重大分歧意见的处理经过和依据

无。

八、涉及专利的有关说明

无。

九、实施国家标准的要求,以及组织措施、技术措施、过渡期和实施日期

的建议等措施建议

本标准规定了生成式人工智能在预训练和优化训练过程中,对所使用数据的

通用安全要求、数据处理方面的安全要求,以及评价方法,适用于面向我国境内

公众提供生成式人工智能服务的组织或个人提高预训练及优化训练数据获取与

准备的安全水平,可也为生成式人工智能的数据提供者提供参考。

十、其他应当说明的事项

无。

4

国家标准《网络安全技术生成式人工智能预训练和优化训练数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论