版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大规模并行AII/O带来突破性的奇偶校验RAID版权所有©2026GraidTechnologyInc.,保留所有权利。执行摘要 硬件优势:SUPREMERAID™2.0、NVIDIARTX2000EADAinnogritN3X 2 3性能对比 4检测描述 4测试环境 41.4K随机读取性能 52.4K随机写入性能 53.1M随机读取性能 64.1M随机写入性能 7CPU效率分析(RAID5最优配置) 8读取效率:小数据块与大数据块 ..............................................................................................................................................9结论 版权所有版权所有©2026GraidTechnologyInc.,保留所有权利。人工智能工作负载规模庞大、高度并行且要求严苛。它们会在数千个线程、队列和数据集中产生高强度的小块数据及混合I/O模式的突发负载。在大规模部署场景下,这种压力会使得传统存储控制器成为训练、推理和数据准备过程中的主要本联合白皮书阐述了SupremeRAID™2.0如何重新定义AI时代的奇偶校验RAID性能。通过将24块InnoGritN3XSLCNVMe硬盘与SupremeRAID™Ultra(搭载50WNVIDIARTX2000EAda芯片)组合使用,我们消除了数据保护与性能之间的传统权衡关系。测试结果聚焦于定义AI基础设施效率的关键指标。SupremeRAID™在奇偶校验RAID处于最佳状态时,可实现数百万级随机写入操作;即使在降级模式下,仍能维持领先的吞吐性能——而这些场景下,传统软件RAID往往难以维持。由此带来的效果是:数据采集速度显著提升、元数据响应更加敏捷,且在大规模硬件该测试平台代表了现代AI服务器的理想架构,通过将新一代GPU卸载版权所有版权所有©2026GraidTechnologyInc.,保留所有权利。存储介质由24块InnoGritN3XNVMeSSD硬盘构成,基于KIOXIAXL-flash™技术。基于KIOXIAXL-FLASH™技术。该类SSD通过采用SLC(单层单元)架构,在DRAM与传统NAND闪存之间实现性能衔接,具备极低时延与确定性性能表现。通过将SupremeRAID™2.0引擎与N3X的原生高速性能相结合,我们构建了一个在启用奇偶校验保护的情况下,仍可跑满PCIe总线带宽的存储子系统,从而有效避免“尾时延”抖动对并行AI训练负载造成的阻塞。相较于传统企业级应用,AI数据平台对存储系统提出了截然不同的压力模型。其工作流程通常融合以下几类负载特征:版权所有版权所有©2026GraidTechnologyInc.,保留所有权利。奇偶校验RAID(RAID5/6)具有显著优势,因其在大规模部署下具备较高的容量利用率而具有吸引力。然而,其核心挑战始终在于:在高强度随机写负载下难以保持性能,以及在降级模式(Degraded,指磁盘发生故障、重建流程进入数据路径时)下性能难以维持。SupremeRAID™2.0即是为解决这两类瓶颈而设计以下结果对比了在相同的24盘NVMe配置下,LinuxMD(mdadm)与SupremeRAID™2.0Linux驱动程序的性能表现。每个子章节先呈现数据,再分析其对AI工作负载的影响。•硬件oCPU:AMDEPYC9755128核处理器×2),低矮型结构,功耗50WoNVMe硬盘:InnoGritN3XSLCNVMe×24•软件o操作系统:Ubuntu24.04.2LTSoRAID实现方案:LinuxMD(mdadm)v4.3o基准工具:fio-3.40•配置o一个包含24块物理硬盘的RAID组(支持RAID5和RAID6)o最佳:所有驱动器均正常o已损坏:一块驱动器故障版权所有版权所有©2026GraidTechnologyInc.,保留所有权利。观察分析:随机读取性能对于AI数据加载与数据混洗至关重要。LinuxMD在最佳状态下表现优异,但在性能下降模式下,由于重建过程中的CPU瓶颈,其性能会骤降超过99%。SupremeRAID™2.0利用GPU处理I/O,在最优状态下可实现超大吞吐量,即便在发生驱动器故障时,仍能维持高达1260万IOPS的性能输出。场景Improvement0.186观察分析:该指标是衡量元数据更新与检查点写版权所有版权所有©2026GraidTechnologyInc.,保留所有权利。场景Improvement0.149观察分析:大块数据读取对应高吞吐量的数据摄入和训练数据供给场景。在最优状态下,两者性能相近(均受限于驱动器/总线带宽上限),但降级模式下的差距才真正体现出两者的本质区别:SupremeRAID™2.0在降级状态下仍版权所有版权所有©2026GraidTechnologyInc.,保留所有权利。观察分析:大块数据写入对于AI模型检查点保存至关重要。SupremeRAID™2.0在最优状态下可提供242GB/s的写入吞吐量,性能超越LinuxMD达16倍以上。尤为关键的是,即便在降级状态下,其吞吐量仍可维持在200GB/s以上,确保单块驱动器故障不会中断模型训练进程。版权所有版权所有©2026GraidTechnologyInc.,保留所有权利。本章节对存储操作的CPU开销进行评估。通过将CPU利用率与性能输出进行标准化处理,可以衡量出存储软件的真实"成本"。数值越低,表明效率越高,即可供AI计算工作负载使用的CPU算力资源越充裕。•CPU总利用率:计算公式为100%-空闲率•目标单位:100万IOPS(适用于4K)或10GB/s(适用于1M)。观察结果:在读取操作中,SupremeRAID™消除了软件RAID固有的CPU瓶颈。在4K随版权所有版权所有©2026GraidTechnologyInc.,保留所有权利。LinuxMD GB/sLinuxMD 观察结果:写入工作负载场景下,两者的差距最为显著。LinuxMD受制于繁重的奇偶校验计算与中断处理开AI工作负载对存储架构提出了大规模、高并行、强韧性的严苛要求。本次评测结果证实,SupremeRA0驱动程序凭借其重新设计的I/O卸载引擎,所交付的性能与上述需求高度契合。通过充分释放由KI此外,SupremeRAID™通过将I/O处理任务卸载至GPU,显著提升了CPU效率,从而实现更高的吞吐量,同时将主机计算资源释放给核心AI任务。该解决方案依托仅50W功耗的NVIDIARTX2000EAda,为下一代AI存储节点提供了高密度、高能效的基础平台,确保N3X存储介质的极低延迟和数据一致性得到充版权所有©2026版权所有©2026GraidTechnologyInc.,保留所有权利。版权所有版权所有©2026GraidTechnologyInc.,保留所有权利。):版权所有©
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 日照市辅警招聘考试题库及答案
- 庆阳市辅警招聘考试题库及答案
- 钦州市辅警招聘面试题及答案
- 呼吸观察的临床意义
- 企业业财一体化的转型实践
- 《计算机网络基础与应用》Linux部分实训任务 教案 任务三 实现域名解析服务
- 轨配工岗前安全风险考核试卷含答案
- 2026年学校后勤合同(1篇)
- 仓储货架安全管理规范
- 2026年医疗电子合同(1篇)
- 影视摄影实务课件
- 2025贵州铜仁市“千名英才·智汇铜仁”本地引才413人笔试考试备考试题及答案解析
- 山东省日照市2025-2026学年高一上学期期中校际联合考试日语试卷(含答案)
- 高处作业吊篮安装、拆卸、使用技术规程(2025版)
- 艺术学概论课件彭吉象
- 湖南中考数学三年(2023-2025)真题分类汇编:专题10 四边形(原卷版)
- 奶油风软装设计方案
- 邮政投递高级试题及答案
- 2024年道路运输企业主要负责人考试题库附答案
- 非营利组织治理模式探讨-洞察阐释
- 2025年高考真题-化学(重庆卷) 含解析
评论
0/150
提交评论