T∕GXDSL 109-2025 小数据增强算法技术要求与测试方法_第1页
T∕GXDSL 109-2025 小数据增强算法技术要求与测试方法_第2页
T∕GXDSL 109-2025 小数据增强算法技术要求与测试方法_第3页
T∕GXDSL 109-2025 小数据增强算法技术要求与测试方法_第4页
T∕GXDSL 109-2025 小数据增强算法技术要求与测试方法_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35020I6519

T/GXDSL团 体 标 准T/GXDSL109—2025小数据增强算法技术要求与测试方法TechnicalRequirementsandTestingMethodsforSmallDataAugmentationAlgorithms2025-12-5发布 2026-3-5实施广西电子商务企业联合会 发布PAGE\*ROMANPAGE\*ROMANIIT/GXDSL109—2025目  次前  言 II一、引言 1二、范围 1三、规范性引用文件 1四、术语和定义 2五、技术要求 4六、测试方法 5七、质量评估 5八、实施要求 6九、安全管理 6十、附则 7T/GXDSL109—2025前  言本文件依据GB/T1.1-20201草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由广西产学研科学研究院提出。本文件由广西电子商务企业联合会归口。本文件为首次发布。PAGEPAGE1T/GXDSL109—2025小数据增强算法技术要求与测试方法一、引言6二、范围35%50%40%。本标准适用85%90%95%以上。通过本三、规范性引用文件GB/T5271.31-2025信息技术人工智能术语GB/T38667-2025信息技术人工智能机器学习模型及系统质量评估规范GB/T39335-2025信息技术人工智能机器学习服务平台技术要求T/GXDSL109—2025GB/T40685-2025信息技术人工智能深度学习框架评估规范ISO/IEC23053:2025人工智能机器学习系统框架IEEEStd2851-2025人工智能数据质量标准ISO/IECTR24028:2025人工智能可信度概述GB/T41864-2025信息技术人工智能算法伦理风险评估规范四、术语和定义(一)小数据增强(3-5()90(如准确率、F135(及可解释性(增强逻辑可追溯)要求。(二)数据生成算法Flows)、扩散模型(DiffusionModels)以及自回归模型等。该类算法通(FIDIS85(基于特征空间覆盖率计算)(MMDKLGPU1000(224×224)4GB。生成样本还MO≥4.5%。(三)数据变换算法T/GXDSL109—2025((((即变换后样本仍保持原有标签语义95(即参数范围符合领域先验且避免极端失真90(如可通过可视化或统计检验说明变换合理性)85%以上。同时,要求支持变换策略组合(10种以上基础变换的任意组合(根据样本特性动态调整变换强度且变换过程耗时10%。(四)数据融合算法(如基于注意力((如多视图学(25(相较于最佳单源数据100GB(标准服务器配置(即多次运行结果方差<5%)95(支持新数据源动态加入(自动处理不同源间的标注冲突或分布冲突(可追踪每个输出样本的数据来源及融合权重)。(五)增强有效性评估系统性评价小数据增强算法性能的指标体系,涵盖数量指标(如增强倍数、样本总量)、质量指标(()3(如分类、(如传统数据扩增的对比分析;所有评估结果需可复现(实验代码及环境需开源或可提供)。(六)样本多样性指数T/GXDSL109—2025(ImageNetResNet-50)提取所有样本的特征向量;随后计算特征向量的聚类质量(如轮廓系数≥0.7)、类别间差异度(90%)以及特征空间覆盖率(85%)0.8(归一化至[0,1]区间),0.1(七)分布一致性度量WassersteinKL(MMD)不得超过原始数据自(bootstrap15%(p0.05)证明无显著分布偏移。此外,对于条件分布(如每类样本的分布)0.05。(八)增强可解释性(如使用了哪些变换规则及参数(如通过显着性图谱(如图像增强需可逆显示变换过程(如领域专家评分≥4.5/5)及自动化指标(LIMESHAP80%)共同验证。五、技术要求FID25.0,IS35.0,KID0.05908510004GB,GPU85%以上。在数据变换方面,变换效果要求:变换后数据有效性达到95%以上,标签保持率98%以上,分布一T/GXDSL109—2025901095%的使用场景,100013095%以上,信息损失5100GBCPU70%,内存使用效85%95%9098%以上。六、测试方法FID、IS、KID1000035%0.01100000725CPUGPUTPU等,测试兼容性和性能表现。3(p-value<0.05)5七、质量评估3MOS(平均意见分)90%以上。定量指标评FID、IS、KID实用性评估包括下游任务性能提升和计算效率评估。下游任务性能要求在使用增强数据后,模型准T/GXDSL109—202515%3025%。计算效率要求增强处理时间在可接受范围内,资源消耗与性能提升成正比。10%。八、实施要求PEP890951005%。部署要求支持多种部署方式,包括本地部署、云端部署、边缘部署等。接口要求提供标准化API100至少一次版本更新,每年一次大版本升级。兼容性要求支持主流深度学习框架,包括TensorFlow、PyTorch、PaddlePaddle九、安全管理9998%95%以上。隐私保护要求个人信100100GDPR审计监督要求建立完整的操作日志,记录所有数据访问和算法使用情况。日志保存期

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论