版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大学模型支撑平台技术参数序号仪器设备名称技术指标参数(功能需求)数量单位1模型支撑平台1、规格:机架式服务器,高度≤8U。2、处理器:支持≥2颗X86可扩展处理器,单颗处理器≥48核,基本主频≥2.1GHZ,UPISPEED≥20GT/S,UPI链接数≥3。3、内存容量:配置≥2048GB(≥32PCS*≥64GB,DDR5≥4800HZ)。4、内存插槽:≥32个。5、硬盘:配置≥2块≥960GBSATASSD,≥4块≥7.68TBNVMESSD2.5IN。6、RAID卡:配置SAS和SATARAID卡。7、GPU:配置≥8块GPU卡/芯片/AI处理器,单GPU卡/芯片/AI处理器配置显存容量≥141GB,GPU卡/芯片/AI处理器算力覆盖不少于FP64、FP32、FP16、INT8精度,单GPU卡/芯片/AI处理器FP64理论峰值算力(非TENSORCORE)≥30TFLOPS,单GPU卡/芯片/AI处理器FP32理论峰值算力(非TENSORCORE)≥60TFLOPS,单GPU卡/芯片/AI处理器FP16理论峰值算力≥1900TFLOPS,GPU卡/芯片/AI处理器间互联带宽≥900GB/S。8、IB卡:配置≥4个CONNECTX7NDR400G(单端口,含光模块),≥2个CONNECTX6HDR200G(单端口,含光模块)。9、网卡:配置≥1个25G双端口网卡(含模块),≥1个1GB(带内管理口)。10、电源:配置≥6个热插拔电源模块。11、配套异构算力管理平台,平台功能要求如下:一、算力管理模块:(1)支持异构资源管理,支持国产AI算力芯片(包括但不限于昇腾、昆仑芯、海光),可实现英伟达及国产AI算力芯片(如昇腾、昆仑芯、海光)的显存、算力切分。(2)支持与现有的2台8卡A800的资源统一调度管理。(3)支持查看集群/节点的实时资源使用情况,包括GPU、CPU、内存、磁盘的使用率和利用率。(4)支持设置统计时段,查看资源的平均使用情况、GPU、CPU、内存的使用趋势、以及GPU、CPU、内存的使用峰值。(5)支持按团队维度统计服务器资源的分配情况,包括已分配资源(团队成员资源、子团队资源、共享资源等)和未分配资源,其中资源统计包括但不限于CPU,内存,GPU等3种以上资源分配的统计。(6)支持按团队维度统计已分配的服务器资源的使用情况,包括已分配未创建容器、容器内未使用以及容器实时使用资源。(7)支持按GPU、CPU的资源实时使用量、近三天平均使用率、近三天的空闲率等维度的排行榜。(8)支持查看节点监控在线状态、节点名称、节点IP。(9)支持查看所有计算集群节点的GPU使用情况,包括显卡数量、温度、每张卡的显存和实际使用显存。(10)支持查看所有计算集群节点的CPU、内存、磁盘的实时使用量以及资源总量。(11)支持用户自定义报警阈值,支持集群、节点、团队、成员维度分别设置报警阈值;支持告警级别、告警抑制间隔、统计周期、有效时段等设置。(12)支持指定回收对象和回收集群,在设定的回收时间执行回收任务,资源回收将同步销毁容器和重置资源分配值为0;支持定时回收和立即回收两种模式。(13)支持查看计划详情以及执行情况;在回收时间前修改和取消回收计划;支持取消指定回收计划下的子任务。(14)支持对纳管节点和集群启动和禁用。启用节点/集群后,该节点/集群的资源作为当前系统分配的资源,禁用节点/集群后,该节点/集群仅监控不做资源分配,系统可分配值减少禁用节点/集群的资源量。二、资源分配管理模块:(1)支持分配计算集群/存储集群的资源,分配对象类型包括团队、成员或者共享,可批量选择分配对象进行统一分配。(2)新增分配时可查看分配对象的资源使用情况,包括资源额度以及资源使用情况;可查看当前操作的团队剩余的可分配额度以及本次分配后分配对象的实际资源额度情况。(3)支持资源分配的超分模式,允许管理员分配的资源总量超过实际物理资源的总量,管理员可自定义超分比例。(4)支持查看资源分配情况,可查看子团队的资源额度以及子团队的资源分配情况,可查看成员的资源额度以及创建容器占用的资源情况。(5)支持修改已有资源分配的用户的资源额度,分配对象为子团队时,修改分配的最小值为子团队已分配下去的资源量,分配对象为成员时,修改分配的最小值为成员已创建容器占用的资源;修改分配的最大值为当前团队空闲资源加当前团队已拿到的资源额度。(6)支持团队成员提交个人资源申请到团队管理员;支持团队管理员提交团队资源申请到上一层管理员。(7)支持查看申请记录详情,包括申请进度、申请的资源配置和实际分配的资源量。(8)支持团队管理员/资源管理员查看已接收到的成员/子团队的资源申请记录。(9)支持审批申请,可查看申请对象已拿到的资源额度以及资源使用情况,同时展示当前团队剩余空闲资源量;审批时审批人可根据实际情况调整资源量,实际分配资源值以审批提交为准,审批通过后拿到的实际分配值将与申请对象原已获取的资源量进行叠加。三、容器管理模块:(1)可选择已启用的系统应用模板以及团队共享模板,查看容器推荐值;容器的分配类型包括无GPU模式、单GPU模式以及多GPU模式;可灵活配置容器的资源上限值,包括显存、内存和CPU的限制。(2)支持查看容器所在节点、容器类型以及查看容器实时使用资源量、占用的资源上限值以及容器状态。(3)支持资源管理员/团队管理员查看本层级及所有下级的容器情况,包括创建中、运行中、已销毁、已离线的容器。(4)支持对运行中的容器直接销毁和重启。(5)支持对运行中的容器进行资源量的调整,可调整容器的显存、内存和CPU的限制。(6)支持WEBSSH、JYPUTER、WEBIDE、SSH远程链接等方式访问容器实例。(7)支持将容器固化为镜像存储到存储集群中,团队管理员可保存为团队镜像,团队成员可保存为个人镜像。(8)支持指定容器将容器内已启动的服务端口映射到容器外访问。(9)支持管理员查看近三天无使用记录且CPU、GPU实际使用量为0的空闲容器。(10)支持创建独享模式的容器;独享模式的容器仅系统管理员和创建人可访问,创建独享模式的容器时自动挂载当前账号在本团队的个人目录和共享目录,独享模式的容器对个人目录可读可写,对共享目录为只读不写。(11)支持创建共享模式的容器;共享模式的容器为当前团队均可使用;共享模式的容器时自动挂载本团队的共享目录,对共享目录为可读可写。(12)支持资源管理员/团队管理员下发定时容器到管理的团队及所有下级团队的团队成员,下发任务容器时可选择使用人的团队镜像、个人镜像,下发任务容器时可选择容器可访问时间,访问时间结束后容器自动回收。(13)支持下发任务容器的团队管理员查看任务容器信息及最近资源使用情况,随时回收已下发的任务容器,回收时销毁容器并将资源回到团队空闲资源。(14)支持任务容器的延时申请,可修改实际延时时间。(15)支持资源管理员/团队管理员下发课程资源到管理的团队及所有下级团队的团队成员,可指定授课对象以及上课时间,创建课程批量为课程授课对象批量下发课程容器资源额度,在课程进行时可使用课程容器额度创建课程容器。(16)支持对进行中的课程进行创建容器,在课程结束时自动销毁课程容器,支持针对运行中的任务容器设置期望回收时间,提交延时申请。四、文件管理模块:(1)文件管理分为个人目录和共享目录。(2)个人目录为团队成员管理并仅本账号在该团队下可见;共享目录为团队管理员管理,团队成员均可见。(3)文件上传支持断点续传,可查看上传进度。(4)个人目录的文件上传限制在当前账号在本团队内分配到的文件存储的大小,超过不可继续上传。(5)共享目录的文件上传限制在当本团队分配的共享类型的文件存储的大小,超过不可继续上传。(6)支持下载文件,可暂停/继续/取消下载;下载过程中可查看下载进度。(7)支持查看下载记录,支持删除文件,删除后已挂载该目录的容器同步对该文件不可用。五、镜像管理模块:(1)资源管理员可上传镜像TAR包作为系统镜像;其他角色用户可通过容器保存为镜像。(2)可查看当前账号在本团队内可管理的镜像,资源管理员可管理系统镜像,团队管理员可管理团队镜像和个人镜像;团队成员仅可管理个人镜像。(3)可启用/禁用镜像,启用镜像时创建容器可用,禁用时创建容器不可用,禁用状态的镜像不影响已引用的运行中的容器。(4)可查看镜像信息及引用当前镜像的运行中的容器记录。(5)可编辑镜像信息,包括镜像标签和镜像描述等。(6)可查看当前账号可用的系统镜像和团队镜像。六、数据集管理模块:(1)支持创建已标注图片数据集和文本数据集。图片数据集支持图片单分类、物体检测、语义分割、实例分割场景。图片数据标注格式支持PASCALVOC、COCO、文件夹分类等格式。(2)数据上传支持未标注和已标注两种类型数据,上传数据源支持本地上传,文件格式支持CSV,TXT,JPG,PNG文件,图像格式包括DCM、NII等。(3)支持项目数据集列表展示、公共数据集列表展示,支持对数据集进行增删改查等操作。(4)支持对数据进行打标签、将数据划分到各个项目中进行管理。(5)支持用户对一个图像数据进行多层标注,不同层的标注信息可单独进行导出。(6)提供将同一项目的图像识别结果批量导出功能,导出结果应包括识别物体、可信度、识别物体位置等信息。(7)提供图像自动分割功能,在选择好需要分割的图像后,对系统中的图像进行分割功能,提供分割结果预览功能,并支持对分割结果进行调整和审核。七、大模型训练推理模块:(1)支持将容器训练好的模型进行纳管以及对外提供推理服务。(2)提供外部商业模型(如DeepSeek、Qwen等大模型)的接入。(3)支持在本地部署开源DeepSeek671B和Qwen等大模型。(4)支持基于本地/外部大模型进行智能体的开发。(5)支持根据用户权限对智能体的功能进行权限控制,不同角色使用不同的智能体,同时根据用户权限对智能体能够使用的本地知识库进行权限控制,实现数据隔离,确保用户只能访问授权数据。(6)支持基于大模型的基础推理能力进行应用开发,并提供对外服务。(7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026甘肃武威古浪县海子滩镇中心卫生院招聘2人备考题库及参考答案详解(突破训练)
- 2026上半年四川中医药高等专科学校招才引智招聘5人备考题库(上海场)附参考答案详解(轻巧夺冠)
- 2026黑龙江省大庆市“庆蓝优引·社会招引”市属学校人才招聘14人备考题库附答案详解(黄金题型)
- 2026年宿州九中教育集团(宿马南校区) 教师招聘备考题库及答案详解(真题汇编)
- 2026华中农业大学校园建设与安全保卫部劳动聘用制人员招聘3人备考题库(湖北)及答案详解【网校专用】
- 2026中兴财经暑假实习生招聘备考题库带答案详解(精练)
- 2026绵阳科达人才安居有限责任公司员工招聘1人备考题库有完整答案详解
- 2026年3月临泉皖能环保电力有限公司社会招聘1人备考题库(第二次)及参考答案详解(综合题)
- 2026广东韶关市新丰县医共体招聘专业技术人员公30人告含答案详解(新)
- 2026甘肃平凉崆峒区乡镇卫生院招聘乡村医生1人备考题库及参考答案详解(突破训练)
- 《广西壮族自治区 农田建设项目预算定额及概算编制规程》
- 岫岩污泥干化项目可行性研究报告1130
- 招标代理机构遴选投标方案(技术标)
- TGXAS-成人急性中毒患者洗胃操作技术规范
- 民事起诉状诈骗范文
- 部编版八年级下册课外古诗李白《送友人》课件35张
- DL-T2528-2022电力储能基本术语
- DZ∕T 0214-2020 矿产地质勘查规范 铜、铅、锌、银、镍、钼(正式版)
- 《中电联团体标准-220kV变电站并联直流电源系统技术规范》
- 液氮库设计事故排风方案及措施
- 保洁外包服务合同-2024
评论
0/150
提交评论