DB11-T 2518-2026 人工智能算力中心技术要求_第1页
DB11-T 2518-2026 人工智能算力中心技术要求_第2页
DB11-T 2518-2026 人工智能算力中心技术要求_第3页
DB11-T 2518-2026 人工智能算力中心技术要求_第4页
DB11-T 2518-2026 人工智能算力中心技术要求_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

DB11北京市市场监督管理局发布 人工智能算力中心技术要求和应用提供人工智能算力、大模型开发训练、推理和统一监控运营等服务的专为人工智能计算设计、符合人工智能服务器硬件接口的扩展加速设备,简称“人工智能算力中心包括基础设施层、资源协同层、智算平台管理层和安全层,见图1。基础设施层为人工智能算力中心提供机房和IT基础设施等支撑;资源协同层对基础设施层的算力等资源进行统一6.2.2存储基础设施应支持全闪存、大容量盘、6.2.3网络基础设施络和管理平面网络,网络结构见图2,要求如下:b)宜支持地址解析协议ARP或邻居发现协议ND表项与主机路由互通;e)网络平面宜支持物理独立部署,确保不同业务流量间无冲突,保障训练性能;通用服务器存储服务器通用服务器存储服务器业务平面网络存储平面网络.1应支持作业间的逻辑隔离,算拓扑亲和及更大规模,并由最上一级交换机进行合轨,支持服务器每张网卡双.2宜支持存储服务器使用25Gbps以上速率端口接入网络,并支持智算服务器和存储服务器双.1管理平面网络应分为带内管理和带外管理两个互相隔离的网络,覆盖对算力设备、存储设7.1.1算力资源感知7.1.2算力数据统计7.1.3算力标识7.2算力调度7.2.1算力调度能力应支持跨架构算力协同调度能力,如两种以上不同厂商、不同型号的人工智能加速卡算力的混合调7.2.2算力调度策略a)支持统一任务调度模型,支持基于模型设置队列、优先级、并行度等关键调度属性;b)支持通过预留可编程接口(hook)等方式对外提供调度过程不同阶段执行的自定义流程;c)支持不同资源在不同任务执行之间的流动;);f)支持根据不同任务的资源需求确定资源分配策略,向资源管理模块申请相应资源;g)支持接收任务调度及容器调度对资源的申请,并在权限/配额允许情况下,分配相应资源;h)支持不同任务运行状态管理和查询。7.2.3算力集群调度适配服务,支持进行算力、数据、软件等资源管理7.3.2应具备按需服务能力,包括支持根据需求进行资源选择及使用,支持根据需求进行资源计量计的资源调度策略、具备多种策略管理能力,为作应支持算力资源的动态监控与应支持多样存储服务,如并行文件存储、应支持特征工程,包括特宜支持多种模型开发方式,包括可视化建模及直接提宜支持主流的开发工具链集成,支应支持多种分布式训练框架,支持数据并行、模应支持微调高质量数据集生成和数据抽取工具,应宜支持提示词优化工具,应支持灰度发布,支持对多个版本的模型文件设置不同0宜支持大模型压缩,方法包括但不限于模型稀疏化、权重矩阵分解、应支持对算法训练调优过程的可视化工宜支持多种模型评估算法,包括混淆矩阵、二分类模宜支持语言、知识、推理、多学科等模型评宜支持标注内容组件及预置的标注应支持采用引入外部数据源进行模型训练和调优,并为模型应用提供检索增强生成等数据服应对原始数据的使用过程采用技术方法进行安求,以及高性能计算设备和液冷系统的特殊搬9.3.1应对敏感数据在存储、传输、使用等),9.3.5应支持对训练数据、输入提示词、检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论