版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
内容目录一、节产进规落地期 4需求:模训与推对Scale-up刚需求现 4供给:内厂超节产密发布 5二、节驱产链值量估核原因 10价值跃:AI器相通服器机值约25倍增在间呈显梯分化 10集群交推动厂毛率构抬升 11三、关的 13浪潮息超点柜布已,头建新联体 13华勤术超点半年产付,26全入预超亿 14风险示 15图表目录图表1:顶生式AI模型练力求进势(2020-2025) 4图表2:MoE架对带宽延和态度力的求升 4图表3:超点决服务集面的三墙”题 5图表4:数中网从Scale-out阶的服堆叠升至Scale-up段的超点” 5图表5:Hopper与Blackwell两代对的柜级Scale-Up形态 6图表6:GB200NVL72连接构意 6图表7:NVIDIAPolyphe原,于GB200机架NVL576向展统 7图表8:华超点图 7图表9:华为CloudMatrix384结示图 8图表10:Atlas9508图表Atlas960超点 8图表12:2025界网大乌峰期中曙光scaleX640受注 9图表13:科光scaleX40具低槛署稳定行开即用系统新势 9图表14:度池256超节单吞升3.5倍 9图表15:池512点单点成亿数练 9图表16:里久AL128超点 10图表17:久超点ScaleUp互拓图 10图表18:Semianlysis对2xIntelSapphireRapidsServer与NvidiaDGXH100的本行比,AI服务器比准CPU务的多约25倍 10图表19:统8卡器和节互组占比 11图表20:GPU集群扩大内通数量超线增长 11图表21:务器工产主有12层级 12图表22:潮超点务器CRS6000S 14图表23:潮信牵组建新合体 14图表24:勤AI超产品 14一、超节点产业进入规模落地期Scale-up域刚性需求显现ScalingLaw17501.82025Llama-4KimiK2xAIGrok4ClaudeMythos5102)Qwen2.5-Max14.82020-202510002–3202710图表1:顶级生成式AI模型训练算力需求演进趋势(2020-2025)超节点技术体系白皮书MoEAll-to-All2024-2025DeepSeek-V2/V3MoEGLM-5.1KimiK2.5Gemini3.1ProLlama4MoEMoE(EP)要求高频All-to-Alltoken图表2:MoE架构对互联带宽、延迟和动态调度能力的要求提升维度Dense/TP时代MoE/EP时代主要通信模式AlReduce,AllGatherA1l-to-A1(动态路由)流量可预测性带宽敏感性高(同步、对称)高(梯度同步)低(稀疏、动态、非对称)极高(每层每token均需路由)延迟敏感性中(可隐藏)极高(EP路由在关键路径上)尾延迟容忍度可接受极低(一个慢专家拖慢全局)对交换芯片的要求聚合带宽聚合带宽+动态负载均衡+低排队时延维度Dense/TP时代MoE/EP时代主要通信模式AlReduce,AllGatherA1l-to-A1(动态路由)流量可预测性高(同步、对称)低(稀疏、动态、非对称)超节点技术体系白皮书TBAISclet(P)和序列并行(CP)产生大量跨节点网络通信,跨服务器的带宽与时延成为根本瓶颈,制约模型训练效率提升。Scale-up超节点突破Scale-outScale-upAIMoEScaleUP20%RMC图表3:超节点解决传统服务器集群面临的“三堵墙”问题维度传统服务器集群超节点通信墙千亿级模型一次梯度同步即TB级数据,传统以太网难以承受超节点能够提供大带宽、低时延的互联能力,支持更大规模AI处理器的高效协同,实现更大范围、更高流量的数据传输功耗与散热墙
为破通信墙而提升密度,促使液冷、48V供电成为标配
部署液冷散热技术,精确控制核心器件工作温度,降低因热应力导致的故障风险万级处理器带来故障常态化,任一组件或一次光 采用逻辑切分技术,赋予系统精准定位和隔离故障的能力,电转换失败都会放大为全局可用万级处理器带来故障常态化,任一组件或一次光 采用逻辑切分技术,赋予系统精准定位和隔离故障的能力,电转换失败都会放大为全局可用度/利用率问题 大幅降低故障扩散风险复杂度墙图表4:数据中心网络从Scale-out阶段的“服务器堆叠”升级至Scale-up阶段的“超节点”ProspectingforPerformance:DataCenterNetworkingin2025NVIDIA到Rubin2020年,NVIDIANVSwitchA100162022r架构推出的第三代Sich32颗UN2024年lkllNSich36个B0(共72颗)NDGXGB200SuperPod图表5:Hopper与Blackwell两代GPU所对应的机柜级Scale-Up形态超节点技术体系白皮书GB200GB200NVL72NVL729NVLinkswitchtraysswitchtray2NVLinkswitchchips18switchchipsB200GPU18条NVL5links,并采用“每个GPUswitchchip1条链GPU18switchswitchchip72GPU1GB200NVL72576GPUNVSwitch走向机架级NVLink域。图表6:GB200NVL72连接结构示意超节点技术体系白皮书GB200NVL722025Blackwell架构的持续增长势头推动,且GB300的收入占Blackwell总收入的比例超过了2025202612和Rubin500020262月英伟达第四季度财报电话会,目前各大云计算服务商、超大规模云计算企业、AI模型研发商和企业客户部署的Blackwell90RubinUltraNVL576NVIDIARubinUltraall-to-allNVLink576。RubinUltraNVL5768MGXNVL(72个RubinUltraGPU)576-GPUNVLink图表7:NVIDIAPolyphe原型,基于GB200的多机架NVL576纵向扩展系统NVIDIA官网AIAtlas800910AHCCS800TA2910B8CloudMatrix384Scale-Up816384NPUCM3848NPUCPUUB48UB超节点技术体系白皮书图表9:华为CloudMatrix384结构示意图超节点技术体系白皮书CM3842025CloudMatrix384(20259900A3SuperPoD3002020259Atlas950(Ascend950DT8192Ascend950DT2026、Atlas960基于Ascend960154882027。图表10:Atlas950超节点 图表11:Atlas960超节点 2025华为联大会 2025华为联大会2025640卡scaleX64020倍,基于AIMoE30%-40%20263界首个无线缆箱式超节点cal040张PPS,8120%330%SothisAIscaleX640备受关注 运行和开箱即可用系创新优势中曙微公号 中曙微公号2025256512超256256张P8002025450%P8003.52026H15122565122026H24000图表14:百度天池256超节点单卡吞吐提升3.5倍 图表15:天池512超节点单节点成万亿参数训练百智云信众号 百智云信众号20259128超节点AIAI计算芯片,集成阿里自研CIPU2.0EIC/MOCPb/sScale-UpnsAI50%HPCCPFS3NVIDIAH20AINVIDIAH10050%AI128图表16:阿里磐久AL128超节点 图表17:磐久超节点ScaleUp互连拓扑图算核微公号 算核微公号二、超节点驱动产业链价值量重估的核心原因价值量跃迁:AI25AISemiAnalysis置的BOM拆解,一台双路IntelSapphireRapids1.05万美元,而一台NvidiaDGXH100AI26.924.7衡量AIAI25图表18:Semianlysis2xIntelSapphireRapidsServerNvidiaDGXH100的成本进行了比较,AI服务器CPU25倍成本 价值量成长性组件2xIntelSapphireRapidsServerNvidiaDGXH100(3)/(1)-1(1)(2)(3)(4)CPU1,85017.70%5,2001.90%1.818GPU+4NVSwitchBaseboard00.00%195,00072.50%-内存3,93037.50%7,8602.90%1.00存储器硬盘1,53614.70%3,4561.30%1.25网卡SmartNIC6546.20%10,9084.10%15.68机箱(外壳、背板、电缆)3953.80%5630.20%0.43主板3503.30%8750.30%1.50散热(散热器+风扇)2752.60%4630.20%0.68电源3002.90%1,2000.40%3.00组装测试4954.70%1,4850.60%2.00Markup6896.60%42,00015.60%59.96总成本10,474269,01024.68内存DRAMBOM37.50%2.90%存储NANDBOM14.70%1.30%MemoryBOM52.20%4.20%SemiAnalysisGPU+NVSwitchBaseboard是价值量跃迁的绝对主导环节,占AI服务器整机BOM比例超70%。在通用服务器中,GPU与NVSwitchBaseboardDGXH10019.5占整机BOM72.5%GPUNvidiaAIAIGPU654DGXH100的10,908美元,绝对值增幅达15.7倍,位列所有环节第二。其技术成因在于AI训练与推理对Scale-outUN0C7B0C812AI周期中GPUNVL72内部通过NVLinkSwitch+72SemiAnalysis的BOM(Retimer等BOM8如DGX3%提升至15%-20%GPURubinUltraNVL576图表19:传统8卡服务器和超节点互联组件占比架构互联组件占比说明DGXH100~3%PCIe+NVSwitch(4颗)+铜缆GB200NVL7215%-20%18颗NVSwitch5+铜背板+高速线缆SemiAnalysis图表20:GPU集群规模扩大,内部通信数据量呈超线性增长中兴官网"ODM"BOM4951,4852.0AI台"升级为柜""Pod"Markup60Markup()689AI4.260BOM15.6%ODM在BOM倍(3.0(2.0(1.5(1.0倍)>(0.7)>(0.4倍AI芯片、通信、电源、整机集成与Markup、CPU集群化交付推动ODMODMPodODMODM交付单元从"台""柜"乃至"Pod"①交付形态跃迁:从L6零部件到L11整机柜系统集成2l(l11News图表21:服务器代工生产主要有12个层级AMAXAIL6L6,再加关键零组件到L102026Rubin架构,NVIDIA有意指定三家ODMNVIDIAL10后出货给英伟达,再由ODMODM②系统级交付的工程复杂度提升,ODM议价权上升超节点整机柜的交付复杂度,远超传统单台服务器。据超聚变数字技术有限公司产品规划专家在亚洲数据中心峰会(DataCenterAsia1500同位置的芯片接收到的电压不一样。因此,在单芯片1500瓦以上就可能要考虑垂直供电。垂直供电对整机柜的影响主要是增加了节点空间高度,架构上带来U位和节点间距的变革。(kWV0W2500A400V、800V400VAI从构建大规模AI我们认为,当交付复杂度提升、合格供应商稀缺时,ODM具备向客户转移工程溢价的实际能力。客户结构集中化当前AIODMPCIe5.0/6.0及SerDes1e-12100kW+99%400G/800G+AIODMODM三、相关标的超节点整机柜的设计需解决高密度GPU协同工作的挑战,多环节价值量有望显著提升:AI82611)SD200:202587日,2025OCTCOCPAIS4AI3000W250w2)超节点服务器CRS6000S:202619CR
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 眩晕患者营养与饮食护理
- 精神科护理操作规范
- 2026年学校中央空调设备合同协议
- 2026年信用贷款保证合同(1篇)
- 2026年消防工程补充合同(1篇)
- 2026中式烹调师高级考试题库(附答案)
- 天秤星跨境出口电商支付平台
- 题型1力电综合计算
- 2026年小儿肠系膜囊肿诊疗试题及答案(儿科消化版)
- 流感预防的长期策略与可持续发展
- 2026年放射工作人员培训试卷含答案解析版
- 2026年专职安全员C2证题库及答案解析
- 2026云南省精神病医院社会招聘编外工作人员招聘6人笔试备考试题及答案详解
- 2026年广东省深圳市罗湖区中考化学二模试卷(含答案)
- 2026山东济南新旧动能转换起步区招聘40人备考题库及答案详解(真题汇编)
- 北京市西城区2026届高三(一模)英语试卷(含答案)
- 2026年青海省西宁市八年级地理生物会考考试题库(含答案)
- 2026年山东省高校毕业生“三支一扶”招募考试模拟试题及答案(二)
- 2026年春人教PEP版(新教材)四年级下册英语全册教案
- 药品包装岗位培训
- 污水管道封堵方案措施
评论
0/150
提交评论