CESA-2020-3-009《信息技术 人工智能 服务器系统性能测试规范》征求意见稿编制说明_第1页
CESA-2020-3-009《信息技术 人工智能 服务器系统性能测试规范》征求意见稿编制说明_第2页
CESA-2020-3-009《信息技术 人工智能 服务器系统性能测试规范》征求意见稿编制说明_第3页
CESA-2020-3-009《信息技术 人工智能 服务器系统性能测试规范》征求意见稿编制说明_第4页
CESA-2020-3-009《信息技术 人工智能 服务器系统性能测试规范》征求意见稿编制说明_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国电子工业标准化技术协会

一、工作简况

2020年,中国电子技术标准化研究院启动了《信息技术人工智能服务器系

统性能测试规范》(立项号:CESA-2020-3-009)的研制工作。该标准由中国电

子技术标准化研究院、华为技术有限公司、浪潮电子信息产业股份有限公司联合

发起。起草单位包括中国电子技术标准化研究院、华为技术有限公司、浪潮电子

信息产业股份有限公司、中国科学院软件研究所、中国科学院计算技术研究所、

曙光信息产业股份有限公司、科大讯飞股份有限公司、北京旷视科技有限公司、

北京航空航天大学、联想集团有限公司、腾讯科技股份有限公司、阿里云计算有

限公司。归口单位为中国电子工业标准化技术协会和中国电子技术标准化研究

院。

2020年2月13日,《信息技术人工智能服务器系统性能测试规范》标准编

制工作组成立。

2020年2月19日,召开第一次标准研讨会,确定标准范围、目的、标准化对

象、章节目录。

2020年3月27日,召开标准研讨会,确定标准各章节的初步内容。

2020年4月2日,召开标准研讨会,进行标准第一次的内容讨论、迭代。

2020年4月13日,召开标准研讨会,进行标准第二轮的内容讨论、迭代。

2020年4月22日,召开标准研讨会,进行标准第三轮的内容讨论、迭代。

2020年5月29日,召开标准研讨会,进行标准第四轮的内容讨论、迭代。

2020年6月12日,召开标准研讨会,就标准立项问题进行讨论、分析。

2020年6月18日,召开标准研讨会,对立项材料的编写进行讨论。

2020年7月3日,召开标准研讨会,讨论立项材料,完善内容。

2020年8月22日,中国电子工业标准化技术协会下达标准计划任务。

2020年9月16日,召开标准研讨会,组内审查标准草案,会后在组内进行就

标准草案征求意见。

1

中国电子工业标准化技术协会

2020年9月23日,整合意见,召开标准研讨会,就意见进行讨论修改。并讨

论标准配套测试工具的设计开发工作。

2020年9月,开始标准配套测试工具第一版本的开发工作。

2020年11月18日,召开标准研讨会,讨论人工智能服务器性能测试工具实验

验证及相关事宜。并在编制组内部开展试验验证工作。

2020年12月16日,召开标准研讨会,讨论推动标准试验验证工作。

2021年2月24日,召开标准研讨会,讨论研究标准试验验证后续工作。

二、标准编制原则和确定主要内容的论据及解决的主要问题

1.标准编制原则

该标准的编制原则包含两个方面:

(1)该标准涉及相关方众多,鼓励人工智能相关单位参与,以确保本标准

规定的内容科学合理,具有普适性。

(2)该标准是《国家新一代人工智能标准体系建设指南》中的总体基础性

标准,对人工智能规划与建设具有重要的基础支撑作用。该标准应充分借鉴国际、

国内相关先进研究成果,与国家人工智能相关政策导向相一致。

2.标准主要内容

该标准规定了人工智能服务器系统(含AI服务器、AI服务器集群、AIHPC

计算设施等)的性能测试方法。该标准适用于AI服务器系统(含AI服务器、AI

服务器集群、AIHPC计算设施等)的性能评估。

内容框架如下:

1.测试类型

a)开放测试

b)封闭测试

2.训练

a)训练过程;

b)测试控制要素(含准确率门限、机器学习框架、混合精度训练、

训练结果精度要求、数据读入要求、数据预处理过程、数据遍历要求、

目标模型要求、超参选取规则、优化算法技术要求、损失函数技术要求、

操作系统及环境要求等);

2

中国电子工业标准化技术协会

c)结果符合性(含元数据、结果模型一致性、训练代码要求、日志

要求等)

d)场景(含通用及行业专用场景);

e)指标及获取方法(含通用指标、测试学相关指标、行业专用指标

等);

f)测试工具要求(构架、功能要求、公平性保障要求);

3.推理

a)推理过程;

b)测试控制要素(含作业到达控制、准确率、机器学习框架、量化、

重训练、数据预处理、数据后处理、数据遍历、数据缓存、作业延误及

丢失控制、操作系统及环境要求等);

c)结果(含元数据、模型一致性要求、代码技术要求、日志要求等);

d)场景(含通用及行业专用场景);

e)指标及获取方法(含通用指标、测试学相关指标、行业专用指标);

测试工具要求(构架、功能要求、公平性保障要求等)。

3.标准解决的问题

当前具有代表性的通用AI测试基准、HPC性能测试基准或服务器技术规范,

如MLPerf、AIBenchmark、benchcouncil、AI-HPL、Linpack、DAWNBENCH、《T/CESA

1043-2019面向深度学习的服务器规范》、《GB/T9813.3计算机通用规范第

3部分:服务器》、《人工智能芯片面向云侧的深度学习芯片测试指标与测试

方法》、AIIADNNbenchmark等,在AI服务器系统性能测试方面,仍存在一些

未解决的问题:

1)通用服务器技术规范对AI服务器系统的性能测试的规定不深入、而且存

在同质化倾向。在测试指标方面,仅端到端运行时间、能耗等不能准确反映

AI服务器系统。系统内部运行时效能方面,尚不存在标准化的测试方法。

2)通用AI性能测试,使用公众可获得的模型、数据集。它们与行业(如金

融、医疗)实际使用的模型、数据有较大差异。通用测试的结果,对行业指

导意义不强,行业业务在AI服务器系统计算设施上的运行效果,无直接评

判依据。

3

中国电子工业标准化技术协会

3)当前的测试基准对测试科学(testtechnology)理论的实践相对较薄弱。

这些测试基准对性能的理解、解释及测试方法仅限于稳定状态运行时间,而

未考虑真实运行环境及系统自身现实状态。

针对以上问题,该标准拟结合测试技术,在通用及行业应用两方面,研究并

标准化测试方法、用例,达到较为全面、准确的测试效果。

三、主要试验[或验证]情况分析

无。

四、知识产权情况说明

无。

五、产业化情况、推广应用论证和预期达到的经济效果

无。

六、转化国际标准和国外先进标准情况

无。

七、与现行相关法律、法规、规章及相关标准的协调性

与现行法律法规以及相关标准中的有关定义协调一致。

八、重大分歧意见的处理经过和依据

无。

九、贯彻标准的要求和措施建议

标准研制过程中广泛吸纳人工智能相关方参与,发布后尽快组织标准宣贯、

试验验证。

十、替代或废止现行相关标准的建议

无。

十一、其它应予说明的事项

无。

《信息技术人工智能服务器系统性能测试规范》团体标准编制起草组

2021-3-1

4

中国电子工业标准化技术协会

一、工作简况

2020年,中国电子技术标准化研究院启动了《信息技术人工智能服务器系

统性能测试规范》(立项号:CESA-2020-3-009)的研制工作。该标准由中国电

子技术标准化研究院、华为技术有限公司、浪潮电子信息产业股份有限公司联合

发起。起草单位包括中国电子技术标准化研究院、华为技术有限公司、浪潮电子

信息产业股份有限公司、中国科学院软件研究所、中国科学院计算技术研究所、

曙光信息产业股份有限公司、科大讯飞股份有限公司、北京旷视科技有限公司、

北京航空航天大学、联想集团有限公司、腾讯科技股份有限公司、阿里云计算有

限公司。归口单位为中国电子工业标准化技术协会和中国电子技术标准化研究

院。

2020年2月13日,《信息技术人工智能服务器系统性能测试规范》标准编

制工作组成立。

2020年2月19日,召开第一次标准研讨会,确定标准范围、目的、标准化对

象、章节目录。

2020年3月27日,召开标准研讨会,确定标准各章节的初步内容。

2020年4月2日,召开标准研讨会,进行标准第一次的内容讨论、迭代。

2020年4月13日,召开标准研讨会,进行标准第二轮的内容讨论、迭代。

2020年4月22日,召开标准研讨会,进行标准第三轮的内容讨论、迭代。

2020年5月29日,召开标准研讨会,进行标准第四轮的内容讨论、迭代。

2020年6月12日,召开标准研讨会,就标准立项问题进行讨论、分析。

2020年6月18日,召开标准研讨会,对立项材料的编写进行讨论。

2020年7月3日,召开标准研讨会,讨论立项材料,完善内容。

2020年8月22日,中国电子工业标准化技术协会下达标准计划任务。

2020年9月16日,召开标准研讨会,组内审查标准草案,会后在组内进行就

标准草案征求意见。

1

中国电子工业标准化技术协会

2020年9月23日,整合意见,召开标准研讨会,就意见进行讨论修改。并讨

论标准配套测试工具的设计开发工作。

2020年9月,开始标准配套测试工具第一版本的开发工作。

2020年11月18日,召开标准研讨会,讨论人工智能服务器性能测试工具实验

验证及相关事宜。并在编制组内部开展试验验证工作。

2020年12月16日,召开标准研讨会,讨论推动标准试验验证工作。

2021年2月24日,召开标准研讨会,讨论研究标准试验验证后续工作。

二、标准编制原则和确定主要内容的论据及解决的主要问题

1.标准编制原则

该标准的编制原则包含两个方面:

(1)该标准涉及相关方众多,鼓励人工智能相关单位参与,以确保本标准

规定的内容科学合理,具有普适性。

(2)该标准是《国家新一代人工智能标准体系建设指南》中的总体基础性

标准,对人工智能规划与建设具有重要的基础支撑作用。该标准应充分借鉴国际、

国内相关先进研究成果,与国家人工智能相关政策导向相一致。

2.标准主要内容

该标准规定了人工智能服务器系统(含AI服务器、AI服务器集群、AIHPC

计算设施等)的性能测试方法。该标准适用于AI服务器系统(含AI服务器、AI

服务器集群、AIHPC计算设施等)的性能评估。

内容

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论