版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中华人民共和国国家标准Cybersecuritytechnology——Securityspecificationforgenerativeintelligencepre-trainingandfine-t在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。I III 1 1 1 24.1安全风险 24.2安全框架 2 2 36.1数据收集 36.2数据预处理 36.3数据使用 3 47.1数据收集 47.2数据预处理 47.3数据使用 4 48.1通用安全评价方法 4 5 5 5 6 6 6 6 7 8A.1包含违反社会主义核心价值观的内容 8A.2包含歧视性内容 8A.3商业违法违规 8A.4侵犯他人合法权益 8 10 10 10 11本文件由全国网络安全标准化技术委员会(SAC/TC260)提本文件起草单位名单根据实际情况决定):(1网络安全技术生成式人工智能预训练和优化训练数据安全规范本文件规定了生成式人工智能预训练和优化训练数据及其处理活动的安全要求,描述了对应的评本文件适用于指导生成式人工智能服务提供者开展预训练和优化训练数据处理活动以及开展与训GB/TAAAAA网络安全技术生成式人工智能数据安全标注3.1生成式人工智能generativeartificialintelligence3.2具有文本、图片、音频、视频等内容生成能力的人工智能系统。生成式人工智能服务generativeartificialintelligence3.33.4服务使用者serviceuser3.623.7预训练数据pre-trainingdata3.8所有用于生成式人工智能预训练4概述生成式人工智能预训练和优化训练数据的安全性涉及数据自身的安全性以及生成式人工智能服务4.2安全框架生成式人工智能预训练和优化训练数据安全框架包括数据通用安全以及数据处理活动安全。数据括数据收集、数据预处理、数据使用等活动数据收集数据预处理数据收集数据预处理数据使用安全监测分类分级应急响应安全监测分类分级应急响应安全防护审计追溯b)应采取技术措施对预训练和优化训练数据进行安全监测,发现数据安全缺陷、漏洞3e)应对预训练和优化训练数据的数据收集、数据预处理、数据使用等的数据处理活动进行记录,6.1数据收集c)通过互联网网站收集数据时,应记录所收集数据或数据所在网页的6.2数据预处理6.3数据使用b)使用包含敏感个人信息的数据前,应取得对应个人单独同意或符合法律、行政法规d)应采取措施降低生成式人工智能被诱导生成安全风险内容的可能性47.2数据预处理b)生成式人工智能生成内容构成的数据样本,应添加所使用生成式人工智能模型或服务的版本、c)优化训练数据的数据标注活动应符合GB/TAA7.3数据使用1)检查服务提供者对预训练和优化训练数据的操作过3)检查服务提供者预训练和优化训练数据的安全防护技术措施;5)检查服务提供者是否具有记录预训练和优化训练数据的数据收集及准备阶段处理活动的1)服务提供者对预训练和优化训练数据进行了分58.2预训练数据处理活动评价方法2)检查服务提供者数据来源记录中同类型数据所使用数据来源的数量;4)检查服务提供者是否通过交易或合作等方式从其他组织或个人收集数据;抽样检查服务2)服务提供者同种类型数据的具有多个来源数量;3)服务提供者未从互联网网站收集预训练数据预处理安全要求的评价方法、预期结果和结果2)随机抽样服务提供者预处理1)抽样样本全部具有元数据内容;样本涉及其他组织或个人数据集来源的,具有数据集名2)抽样样本全部具有安全风险内容情况记录;61)检查服务提供者是否使用包含个人3)抽样样本不涉及知识产权侵权风险,或抽样样本无知识产权风险并与知识产权侵权风险4)人工抽检的抽样数据样本中不含安技术抽检的抽样数据样本中不含安全风险内容样本数量占总抽样数量的比值不低于988.3优化训练数据处理活动评价方法优化训练数据收集安全要求的评价方法、预期结果和结果判定如1)按照8.2.1a)规定的评价方法评2)检查服务提供者是否收集生成式人工智能的生成内容;检查服务提供者收集的生成式人工智能生成内容是否具有所使用生成式人工智能模型或服务的版本、获取时间等信息记2)服务提供者没有收集生成式人工智能的生成内容,或具有所使用生成式人工智能模型或1)按照8.2.2a)规定的评价方法评价服73)检查优化训练的标注数据是否符合GB/TAAAAA的安全2)抽样样本涉及生成式人工智能生成内容的,样本的元数据内容包括生成式人工智能模型3)优化训练标注数据符合GB/TAAAAA的安4)抽样样本为生成式人工智能生成内容的,具有生成式人工智能生成数据的安全风险内容优化训练数据使用安全要求的评价方法、预期结果和结果判定如1)按照8.2.3a)规定的评价方法评价2)采用人工抽检方式从全部数据中随机抽取不少于4000个样本,核查服务提供者使用数据8A.1包含违反社会主义核心价值观的内容b)危害国家安全和利益、损
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年住宅装修项目可行性研究报告
- 2024-2030年人造黄油企业创业板IPO上市工作咨询指导报告
- 2024-2030年书写纸行业风险投资发展分析及投资融资策略研究报告
- 2024-2030年主动声纳浮标行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2024-2030年中成药项目商业计划书
- 2024-2030年中国鼻子和耳朵的毛发修剪器行业市场发展趋势与前景展望战略分析报告
- 2024-2030年中国麻纺织行业十四五发展分析及投资前景与战略规划研究报告
- 2024-2030年中国鱼罐头市场调研及发展策略研究报告
- 2024-2030年中国高速铁路信息化数字化系统发展规模预测及市场运行分析报告
- 四年级下册数学教案-4.7《小数的近似数》人教新课标
- JTT535-2015 路桥用水性沥青基防水涂料
- 【真题】2023年徐州市中考化学试卷(含答案解析)
- 第1课 秋天 一年级语文上册同步分层作业设计系列(统编版)
- 心电监护仪的使用及维护保养
- 客厅家庭影院装修方案
- 设备维保的关键绩效指标与评估方法
- 2024年《新媒体营销师、广电全媒体运营师》职业技能及理论知识考试题库与答案
- 玉米种植方案
- 贷款营销方法及技巧
- Elsevier期刊投稿模板及投稿经验
- 山东教育出版社(五·四学制)小学美术五年级下册 第3课 喜怒哀乐 全国获奖
评论
0/150
提交评论