版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录VeraRubin:六大芯片协同升级,推理性能大幅提升 5算力:NVFP4推理性能提升5倍,推理成本显著下降 6存储:针对大量KVCache问题,推出推理上下文内存存储平台 6PCB:从CableTray到Cableless互联,PCB价值量显著提升 8Rack:系统协同设计显著提升,ODM环节核心受益 9开源模型:从数据到代码全覆盖,Nemotron3构AgenticAI范式 10物理AI:从Cosmos到Alpamayo,走向商业化落地 11投资建议 12风险因素 12图目录图1:VeraRubinNVL72概述 5图2:VeraRubin平台六款新芯片 5图3:VeraCPU主要参数 6图4:RubinGPU相较于Blackwell算力提升5倍 6图5:RubinHBM4总内存带提升至22TB/s 7图6:NVLink-C2C一致性内架构 7图7:BlueField-4DPU 7图8:Rubin平台的存储结构 8图9:VeraRubin计算托盘采用cableless无缆互联架构 8图10:基于VeraRubin构的NVIDIADGXSuperPOD 9图11:英伟达开源模型生态统 10图12:英伟达全栈物理AI11图13:英伟达推出开源世界础模型Cosmos 11图14:面向自动驾驶领域的源工具链Alpamayo 11VeraRubin:六大芯片协同升级,推理性能大幅提升Rubin15CEOCES2026AICPURubinGPU、NVLink6交换机、ConnectX-9SuperNIC、BlueField-4DPU和NVIDIASpectrum-66tokenRubin平台的旗舰产品是RubinNVL72AINVL72图1:VeraRubinNVL72概述vidia官图2:VeraRubin平台六款新芯片vidia官算力:NVFP4推理性能提升5倍,推理成本显著下降CPU:88Olympus176线程的英伟达空间多线程,1.8TB/sNVLink-C2C支持CPU:GPU统一内存,系统内存达B(是ePU的3倍SCAMRXB图3:VeraCPU主要参数vidia官RubinGPU:引擎,NVFP450PFLOPSBlackwellGPU5BF16/FP4NVFP4训练35PFLOPSBlackwell3.5图4:RubinGPU相较于Blackwell算力提升5倍vidia官存储:针对大量KVCache问题,推出推理上下文内存存储平台HBM:影响整体效率的主导因素。RubinGPU集成了新一代的HBM4,每个最高配备288GBHBM422TB/sBlackwell2.8倍。这使得RubinGPU能够在不牺牲并发性或者利用率的情况下,支持长上下文推理、高批次MoE执行和交互式推理。DRAM:CPU1.5TBLPDDR5X1.2TB/sLPDDR5XSOCAMMNVLink-C2CCPURubinGPU1.8TB/sCPULPDDR5XHBM4KVCacheNAND:AIKVCacheKVCacheAIRubin平台引入了由BlueField-4NVIDIA推理上下文内存存储,构建了一个AI原生的KVCacheGPUtokens554BlueField-4150TB上下文NANDGPU16TBNAND200Gbps储架构或将显著提升NAND图5:RubinHBM4总内存带宽提升至22TB/s 图6:NVLink-C2C一致性内存架构2282522820151050BlackwellHBM3e
RubinHBM4vidia官 vidia官图7:BlueField-4DPU图8:Rubin平台的存储结构东PCB:从CableTray到Cableless互联,PCB价值量显著提升NVIDIABlackwellNVL72cabletrayRubinNVL72cablelessPCB18图9:VeraRubin计算托盘采用cableless无缆互联架构Rack:系统协同设计显著提升,ODM环节核心受益NVIDIADGXSuperPOD作为大规模AI8DGXRubinNVL72系统,用NVLink6Spectrum-XEthernetNVIDIANVIDIAMissionControlGPU练与推理任务。由于在6款芯片、托盘、机架、PodRubinBlackwellMoE1/4GPUMoEtoken成1/10。图10:基于VeraRubin构建的NVIDIADGXSuperPODvidia官开源模型:从数据到代码全覆盖,Nemotron3重构AgenticAI范式本次ES(nlUiveseAC、AI物Eh2、cAn、物理A(()Alyo图Nemotron系列是此次更新的重点,覆盖了四个应用方向。1)3NanoNemotron2NanoVLNeMoRL、NeMoGym等强化学习训练工具。2)在RAG(检索增强生成)方向,提供了NemotronEmbedVL(向量嵌入模型、NemotronRerankVL(重排序模型、相关数据集和NeMoRetrieverLibrary(。3)NemotronContentSafetyNeMoGuardrails4)NemotronASRDataset语音数据集和NeMoLibrary物理AI:从Cosmos到Alpamayo,走向商业化落地AICosmosIsaacGR00T--Alpamayo。CosmosAI3D3DCosmosAI测轨迹。它可以依据3DAlpamayo是一个面向自动驾驶领域的开源工具链,也是首个开源的视觉-语言-行动(VLA)推理模型。Alpamayo最大的突破在于它是推理型自动驾驶模型。传统自动驾驶系统是感知-规划-控制的流水线架构,看到红灯就刹车,看到行人就减速,遵循预设规则。而Alpamayo引入了推理能力,理解复杂场景中的因果关系,预测其他车辆和行人的意图,甚至能处理需要多步思考的决策。图12:英伟达全栈物理AI平台范图13:英伟达推出开源世界基础模型Cosmos 图14:面向自动驾驶领域的开源工具链Alpamayo科 科英伟达Rubin平台正式发布开启AI算力新纪元,全球算力设施向AI工厂
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 气功指导员考试合格证书颁发流程规范试卷
- 区块链智能合约漏洞测试试题
- 人身保险承保管理与保单签发手册
- 生活垃圾收集转运与无害化处理手册
- 苯巴比妥杂质检查课件
- 2025年影视声音艺术设计评估试题及答案
- 水行政执法考核制度
- 统战通讯员考核制度
- 大陆官员考核制度
- 城管局案件考核制度
- 2026年上海市宝山区初三上学期一模物理试卷和答案及评分标准
- 丁华野教授:上卷:幼年性纤维腺瘤与叶状肿瘤
- 输液导轨施工方案
- 货运行业安全责任意识培训计划
- 《肿瘤治疗相关心血管毒性中医防治指南》
- 《电力电子技术》复习资料
- 工作作风存在问题及整改措施
- JC╱T 529-2000 平板玻璃用硅质原料
- 肺结节科普知识宣教
- 脾胃论与现代医学的契合医学课件
- 钢结构安装合同
评论
0/150
提交评论