版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
内容目录2026黄仁勋演讲回顾 5推理拐点驱动收入增长,Blackwell及Rubin收入有望持续高增 5RubinPOD发布,引入机架 6RubinPOD 6Groq3LPX 7需求分类,高性能服务器触及更多市场 8RubinNVL72 8RubinNVL72+LPX 产品路线图 机架与拉动需求 12平台创新&Agent加速渗透,存储需求有望持续释放 17英伟达Rubin平台创新AI存储架构,驱动存储增量跃升 AgentAI应用驱动消耗激增,存储数据底座需求有望持续释放 XR升维:从娱乐终端跃迁为核心载体,应用场景持续拓宽 22投资建议 27风险提示 27图表目录图收入指引与构成 5NVL72(tokentoken成本) 6图RubinPOD示意图(7款芯片,5款机架) 7图RubinNVL72+Groq3工作示意图 8图5:NVIDIAGroq3示意图 8图Rubin运营效率与用户交互体验示意图 9图Rubin推理市场收入潜力 10图RubinNVL72+LPX运营效率与用户交互体验示意图 图Rubin+LPX推理市场收入潜力 图10:英伟达产品路线图(GTC2026) 12图英伟达产品路线图 13图与ComputeTray对比图 13图13:托盘示意图(左中:NVLink;右14图14:Oberon与机架对比图 14图ComputeTray(左)及右)示意图 15图NVLINK托盘示意图 15图机架参数 18图计算托盘 18图19:四种导致传统服务技术在低延迟推理中效果欠佳的因素 18图20:Groq3计算托盘 19图GPU与Groq3性能参数 19图22:Dynamo异构解耦合推理 19图和Groq3组合带来极致性能提升 20图和Groq3组合提了10倍的收入增长机会 20图25:2025-2030年消耗量年复合增长率达3418% 21图26:Token消耗月度排名 21图27:各大模型周度消耗量 22图28:VITUREGTC展位解决方案 23图与英伟达及斯坦福大学CongLab合作 24图30:VITUREXR眼镜 25图31:VITURELuma系列包揽多个国家亚马逊眼镜销量榜首 26表1:单GPU对应PCB价值变化情况 17表2:2025年第三季度美国市场分品牌销量表现情况 25GTC2026黄仁勋演讲回顾推理拐点驱动收入增长,及收入有望持续高增英伟达预期Blackwell与产品在2025-2027年实现收入约英伟GTC2025上预期Blackwell与Rubin产品在2025-2026年实现收入约5000GTC2025之后,、GTC2026上,英伟达预期Blackwell与Rubin产品在2025-2027年实现收入约100002026财年(20250127-20260125,如未特殊说明均为日历年)2159.38亿2026-202760%来自超大规模40%NCP、等。图1:BLACKWELL+RUBIN收入指引与构成伟达新产品推动推理成本革命。下图左TokensperWattDrivesFactoryRevenue所示,随着用户端TPS(TokensperSecond)的增长,同一系统TPW(TokensperWatt)逐渐下降。下图右PerformanceDrivesTokenCost所示,随着用户端TPS的增长,单Token的产出成本逐渐增长。在实现相同TPS的情况下,GB300NVL72的表现显著优于H200NVL8及所示竞品。当用户端TPS持续走高时,H200NVL8及竞品的单瓦产出趋向于0;Token成本则快速上升,大幅高于GB300NVL72。图2:GB300NVL72推理成本革命(左:每瓦token数驱动厂商收入;右:性能降低token成本)伟达发布,引入机架英伟达在GTC2026上推出VeraRubinPOD,该平台包括7款芯片,5种机架。VeraRubinPOD由16VeraRubinNVL72机架+10Spectrum-6SPX以太网机架+10Groq3LPX机架+2VeraCPU机架+2BlueField-4STX存储机架组成。7RubinNVLink6ConnectX-9SuperNIC、BlueField-4DPU和NVIDIASpectrum-6AGroq3。目前该平台搭载的七款新芯片已全面投产。5种机架分别为:1)Vera机架,6个GPU36ConnectX-9SuperNICDPU,与BlackwellGPU10倍,每机架,单机架256CPU150%。3256128GBSRAM640的纵向扩展带宽。LPU专为智能体系统的低延迟和长上下文需求而设计,LPX与VeraRubin协同部署有望为AI供应商拓展营收机遇。LPX机架预计将在2026年下半年面世。4)BlueField-4STX存储机架,作为AI原生存储基础设施,可在整个POD中无缝扩展GPU内存。5)Spectrum-6SPX以太网机架,专为加速AI工厂东西向流量而设计,可灵活配置Spectrum-X以太网交换机或NVIDIAQuantum-X800InfiniBand交换机,能够在大规模部署中提供低延迟、高吞吐量的机架间互连。图3:VeraRubinPOD示意图(7款芯片,5款机架)伟3Groq3标志着Rubin强强联合,汇聚了两款处理器的极致性能,使得每兆瓦的推理吞吐量提升高达3510倍的营收机遇。LPX机架搭载256个LPU处理器。大规模部署时,由LPU组成的集群能够作为一个巨大的单一逻辑处理器运行,提供快速、确定性的推理加速。LPX机架搭载256个LPU处理器,配备128GB片上SRAM和640TB/s的纵向扩展带宽。与VeraRubinNVL72协同部署时,RubinGPU和LPU通过协同计算AI模型的每一层来生成每一个Token,从而显著提升解码速度。为万亿参数模型和百万级上下文而优化协同设计的架构,与强强联合,最大限度地提高了功耗、内存和计算方面的效率。每瓦特吞吐量和提基础设施构建,可无缝集2026年下半年面世。图4:VeraRubinNVL72+Groq3LPX工作示意图伟达图5:NVIDIAGroq3LPX示意图伟达需求分类,高性能服务器触及更多市场72VeraRubinNVL72在Premium场景下表现优异。下图纵轴为TPS/MW,反映AI工厂的运营效率;横轴为TPS/User,反映用户实际交互体验或效用。图中英伟达将TPS/User划分为Free、Medium、High、Premium四个层级。1)Free,以极低成本实现Qwen32K上下文支持每月约3K2.5(1Trillion参数,128K上下文)、100TPS/User,平衡成本与性能;3)High,62Trillion参数大模型+128K上下文,200TPS/User,针对更高价值场景;4)Premium,支持每月约45美元的高额收费,典型为2参数大模型+400K超长上下文,400TPS/User需求。VeraRubinNVL72创收能力显著优于BlackwellNVL72。在Free、Medium、High、PrmumubnTPS/Wckwl22310raubn创收能力显著优于BlackwellRubin的优势随着TPS/User的增长而放大。吉瓦Rubin15005倍。图6:VeraRubinNVL72运营效率与用户交互体验示意图伟达图7:VeraRubinNVL72推理市场收入潜力伟达Groq3进一步提高的Rubin提供高带宽内存与强大计算,LPX则专注驱动的超低延迟解码,系统在高TPS/user场景下的TPS/MW曲线下降速度放缓。RubinNVL72+LPXPremiumTPS/MW表现达到ckwl35ubn10ta2Trillon参数大模型+400K800TPS/User)150美元的收费。得益于此,每GW(吉瓦)RubinNVL72+LPX工厂年营收潜力可达300010倍。图8:VeraRubinNVL72+LPX运营效率与用户交互体验示意图伟达图9:VeraRubinNVL72+LPX推理市场收入潜力伟达产品路线图预计平台于2026年问世,Feynman平台于年问世。平台预计在2026Blackwell平台的Oberon拓展至Oberon、NVL576,OberonETL256,KyberNVL144。Feynman2028年问世,机架形OberonNVL144NVL1152Feynman平LP408CPO芯片。图10:英伟达产品路线图(GTC2026)伟达机架与拉动需求VeraRubinNVL72与LPX有望在2026年实现量产。下图为GTC2026前的英伟达Rubin2026年下半年实现量产,CPX之后逐步起量,VR300(Ultra)2027年实现量产。考虑GTC2026Groq3LPX,并声明相关芯片均已投入生产。我们调整对英伟达产品路线的预期,预计Rubin722026PU2026ubntra2027年实现量产。图11:英伟达产品路线图emiAnalysisRubin平台取消托架内部线缆,PCB有望承担更多功能。为提高组装效率,解决传统有线缆托盘在装配与运维中的问题,Rubin平台采用无线缆、无软管、无风扇设计的计算托盘架构。随着托盘内部线缆的减少,PCB有望承担更多功能。图12:GB300与VRComputeTray对比图伟达图13:托盘示意图(左:LPX;中:NVLink;右:VeraRubin)伟达Kyber机架有望使用PCB背板取代铜缆。英伟达在GTC2025上推出了使用Kyber机架的RubinUltraNVL576,Kyber机架与Oberon机架相比,主要有以下区别:计算托盘旋转度。度呈刀片状排列以实现更高的机架密度。单机架芯片数达576个。18个计2GPU2144个芯片)。将采用PCB背板取代铜缆,作为GPU与机架内NVSwitch之间的扩展链路。机架背面的NVSwitchPCB背板的背面连接到计算托盘。图14:Oberon与Kyber机架对比图emiAnalysis英伟达在2026大会上展出正交GTC2026上展出了ComputeTray、及SwitchTray。下图ComputeTrayplane18列ybromputeTryd-pneSwtchryGTC2026上展出PCB技术路线确定性提高。图15:RubinTray(左)及右)伟达图16:Rubin托盘示意图伟达IBt2026655058.44%,有望拉动服务器需求增长。我们假设P&SIC总量同比增长40%PCB价值增长50%2026年IPCB110%,实现翻倍增长。GPUPCB价值情况测算如下:量的因素,PCB26层升级为例,简单估7.69%10%。价的因素119Resonac31日起调涨铜箔(CCL)30%Resonac并CCL实施调价的材料厂,2025年底,建滔集团向客户发涨价函,新接单10材料升级换代的涨价。PCB高频高速需求推动原材料持、30%。良率的因素,PCB新产品更迭&92%87%5.75%。GPUPCB1.00202658.44%,有望拉动我们假设总量同比增长,结合单卡对应价值增长50%,预计2026年AIPCB市场规模同比增长110%,实现翻倍增长。进一步,我们展望未来的增量:832256128GB片640机架内需要处理大量数据吞吐且实现极低延PCBPCB价值进一步上涨。LPU有望实现大规模出货,PODRubinNVL72机架比例为16:10,可得POD中RubinGPU与LPU比例约为1:2(1672:10256),RubinPOD有望拉动LPU大规模出货。Mid-plane技术路线确定性提高。2026机架下的Compute、、SwitchTrayPCB进行正交连接的确定性提高,PCB价值有望进一步增长。表1:单GPU对应PCB价值变化情况价值指数备注P01.00量的因素k11.101)增层或增阶导致原材料&工艺流程直接增加。以多层板26层向28层升级为例,简单估算原材料使用量增加7.69;2)背钻、层压等工艺增加,设备、人工成本增加;3)假设材料、工艺等量的变化推动产品价格上调10。价的因素k21.301)存量原材料阶梯式涨价;2)材料升级换代的大幅涨价;3)假设原材料价格变动推动产品价格上调30。良率的因素k31.051)新产品&材料、工艺升级等因素压制良率,假设良率由92降低至87,价格需上涨5.75;2)假设良率因素推动产品价格上调5。P11.50未考虑无线缆设计带来的配板增量P2/LPU增量+材料升级P3/Kyber架构使用PCB实现正交连接,PCB用量进一步增加联平台创新英伟达平台创新存储架构,驱动存储增量跃升推出基于BlueField-4数据处理器的推理上下文记忆存储平台,单机柜存储容量实现跃升。英伟达Rubin平台在存储配置上较Blackwell平台实现了全方位迭代升级。英伟达在Rubin平台推出了基于BlueField-4数据处理器(DPU)的推理上下文记忆存储平台,GPU内存和可扩展共享存储Mubn72单PU配备288GB4,单机柜M20.7Tlckwl1.5RM方面,CPUCPU1.5TBLPDDR5X总Blackwell2.5倍,实现热温冷数据智能流转,进一平台在存储架构上,BlueField-4DPU4DPU150TBGPU16TB上下文空830TB。图17:Rubin机架参数 图18:Rubin计算托盘 伟达官网 伟达官网推出适配低延迟推理需求的机架,创新增量需求AI正从生成模型跨入代理模型时代,交互式推理成为核心需求,而这也让AI在生成的解码(Decode)阶段面临严重的延迟与存储器带宽瓶颈。从生成模转向对延迟极度敏感的交互式应用。在这一转型中,大模型生成Token的解码阶段成为关键瓶颈。代理型AI需要将复杂目标拆解为多步推理,每一步的延迟都会累积为用户可感知的端到端响应时间,因此稳定的单Token性能和极低的尾延迟至关重要。解码阶段的挑战在于其自回归特性:模型需顺序生成Token,且每次生成都需读取全部模型权重与历史上下文的KV缓存,导致计算量远小于数据搬运量,核心瓶颈从计算吞吐转向了内存带宽。同时,更长的上下文窗口和更高的用户并发进一步加剧了内存带宽压力,并削弱了传统吞吐优化系统所依赖的批处理效率。因此,专为高吞吐设计的GPU架构在解码阶段面临内存墙困境,其片外高带宽存储的访问延迟成为制约响应速度的主因。图19:四种导致传统服务技术在低延迟推理中效果欠佳的因素伟达官网英伟达通过整合Groq团队技术,推出专为低延迟推理设计的Groq3LPU。Groq3LPU单颗芯片集成500MB片上SRAM,虽然与每个RubinGPU上容量高达288GB的1/500150TB/s22T带宽7机架级设置中,8Groq3Groq3256128GB推理加速带宽。图20:Groq3计算托盘 图21:Rubin与Groq3性能参数伟达官网 伟达官网LPU与GPU在分工配比上,英伟达的策略是让负责预填充阶段,让Groq负责解码阶段。等级的庞大参数与KVCache。NVIDIA因此于本次GTC提出解耦合推理(DisaggregatedInference)架构,通过名为Dynamo的AI工厂作业系统,将推理流水线一分为二:处理代理型AI时,需进行大量数学运算并储存庞大KVCache的Pre-fill、Attention运算阶段,交由具备极高吞吐量与巨量存储器的VeraRubin执行。而受限于带宽且对延迟极度敏感的译码与Token生成阶段,则直接卸载至扩充了巨量存储器的LPU机柜上。图22:Dynamo异构解耦合推理伟达官网RubinGPU和GroqLPX异构架构带来了推理性能及经济效益的极致提升。根据英伟达官方基准测试,以运行2万亿参数规模的MoE模型为例,RubinGPU与GroqLPUNVIDIA35倍。从经济效RubinGB2005倍的收入,10倍。图23:RubinNVL72和Groq3LPX组合带来极致性能提升
图24:RubinNVL72和Groq3LPX组合提供了10倍的收入增长机会伟达官网 伟达官网Agent应用驱动消耗激增,存储数据底座需求有望持续释放Agent的消耗量较传统应用激增,预计将推动算力需求实现指数级增长。推理-消耗相较于传统AI应用一问一答的脉冲式交互,呈叠加式增长;同时,Agent必须携带完整历史上下文进行每轮推理,上下文随交互轮次指数膨胀,形成滚雪球式Token消耗;且其内置心跳/定时任务机制实现7×24小时后台静默运行,无用户交互也持续产生隐性Token消耗。此外,Agent需加载庞大的系统提示词与工具定义,同时多个子Agent并行、工具链级联触发进一步放大消耗,最终使单任务Token消耗较传统AI大幅跃升。以OpenClaw为例,一个重度养虾用户,日均消耗Token在3000万至1亿之间。作为对比,一个普通ChatGPT用户即使天天聊天,月消耗也不过百万级。根据IDC预测,未来五年,全球Agent生态将经历一场指数级的扩张,到2030年,全球活跃AI智能体将达22.16亿,年度Token消耗量将从2025年的0.0005PetaTokens飙升至15.3万PetaTokens,年复合增长率高达3418%。图25:2025-2030年Token消耗量年复合增长率高达3418%DCOpenClaw的发布实现了大模型从对话式AI到执行型AI的范式跃迁,加速AgentAI生态破圈。OpenClaw本地优先架构、跨平台操控、插件化技能支持数千种扩展能力,以及其具备长期记忆和主动任务执行能力等创新设计,使其做到能真正接管用户电脑、自动调用工具完成复杂任务,像一个24小时在线的数字员工,精准击中了市场对能干活AI的刚需,因而一经发布2026年初即实现爆火,迅速从极客圈破圈至全民热潮,跃升为全球范围内Token消耗最高的应用。根据AI模型聚合平台OpenRouter数据,截至2026年3月21日,OpenClawToken当月消耗量达到13.2万亿,成为该平台Token消耗最高的应用。图26:Token消耗月度排名penRouter国产厂商则凭借极致的成本优势及政策端的支持,实现调用规模对海外模型厂商的追赶。调用价格大幅低于海外同类产品;同时深圳、无锡等各地相继出台养龙虾支持政策,国产模型调用量快速增长,并逐步实现对海外模型厂商的追赶。根据国家数据局,2024年初中国日10002025630万亿,1300OpenRouter数据,202639315日,排名前十榜单中的中国大模型的周调用总量达到46万亿okn2.3万亿Token,中国大模型的周调用总量实现连续三周大模型调用规模超过美国。图27:各大模型周度Token消耗量penRouter随着AgentAI应用场景不断拓展、落地规模持续扩大,Token消耗的激增态势预计将长期延续,存储作为支撑其稳定运行的核心基础设施,其扩容、升级及优化需求有望持续释放,有望成为AI产业进程中的核心需求增长点。XR能力的交互载体。随着2026年英伟GTC大会上,VITURE作为行业内持续探索XR+AI的代表企业参展,集中展示了BC达官方合作的XR智能眼镜品牌,VITURE重点展示了其携手英伟达及斯坦福大学(StanfordAutomation解决方案,以及搭载GeForceNOWImmersive3D沉浸式云游戏体验。此外,备受瞩BeastXR领域的领先布局与技术实力。专业级应用实现关键突破,XR+AI迈向高壁垒的科研场景。当前,各类通用型助手已广泛融入人们的日常生活,在信息获取、决策辅助、日常陪伴等场景中发挥着重要作用。然而,面对科研领域高度专业化、流程复杂化、操作精密化的严苛要求,传统AI技术难以满足动态场景理解、实时专业指导、关键决策参与等核心需求,导致其应用落地长期受限,至今仍面临诸多挑战。VITURE在2026GTC现场推出的XR-AILabAutomation实验室自动化解决方案,率先突破技术瓶颈,将XR+AI融合技术落地高精度科研场景,将XR设备的应用边界拓展至实验室科研级别。该方案以VITURELumaUltraXR智能眼镜为核心硬件载体,搭配VITUREPro颈环与后台AI系统深度响应,协同机械臂作业,为AI赋予第一视角,在科研场景下实现所见即所识——实时呈现可视化数据、指导实验操作、分析关键参数并全程追踪项目进度,可协助科学家完成基因编辑级别的精密实验,让Co-Scientist人机协作科学家的概念变为现实。目前,该方案已可以应用于免疫疗法、干细胞工程及材料科学等研究领域,显著提升了科研工作的精准度与效率。图28:VITUREGTC展位XR+AILabAutomation解决方案T之家XR+AI斯CongXR+AI的融合,可将原本需要数年能完成的科研工作缩短至数周,数百万美元量级的实验成本降至数千美元,复杂的实验培训周期也从数月缩减至数天,其降本增效成果远超传统科研模式。相较于普通娱乐或消费场景,科研环节对设备稳定性、数据精准度、实时交互效率有着极为严苛的要求。传统科研模式依赖多台设备切换、频繁调整视线,极易造成效率损耗与认知中断,进而影响实验进度VITUREXR智能眼镜可将实验流程、数据提示、操作指引直接叠加在科CongXR眼图与英伟达及斯坦福大学合作T之家Immersive3D技术颠覆内容生态,AI眼镜消费级体验迎来突破。在消费级层面,XR的内容生态与体验边界,打破算力与内容供给的瓶XR质量原生3D内容生产成本居高不下,长期制约着XR设备的体验升级。VITURE在GTC现场全球首次展示了其旗舰级AI功能Immersive3D搭载于英伟达GeForceNOW云游戏服务的沉浸式游戏体验。Immersive3D功能依托自研算法、生成式AI能力与云计算技术的支持,能够将传统2D画面实时转化为具备空间深度感的3D视觉效果,用户无需依赖高性能本地设备。这不仅为激活存量现有资源提供了全新路径,也显著降低了用户获取沉浸式内容的门槛,推动XR内容供给从高成本稀缺创造走向低成本普惠转化。Immersive3D技术正推动XRImmersive3DVITURE携手天坛公园打造沉浸式XR游览体验,实现时空穿越式文旅互动,即便处于户外强光环境,也能为游客带来影院级高清视听感受;在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广告学:理论、方法与实务(3版)- 课件第7、8章-广告设计与制作、-广告媒体及媒体策略
- 2026年上海市杨浦区初三语文二模试卷及答案
- 2026年高二生物下学期期中考试试卷及答案(五)
- 2026年口腔科牙槽突裂骨移植术护理配合要点课件
- 跨学科融合:全能启蒙-培育创新思维提升综合素质
- 科技引领业务新篇章-数字化转型的影响与应用
- 学科全景探索-研究领域与价值剖析
- 培养四年级学生的表达能力-提高学生表达能力
- VBSE背景下中职会计线上线下课堂教学的实践分析
- 谈农村小学班主任工作感悟
- 2025年西藏检察系统聘用制书记员招聘笔试真题
- (2025年)中外名著知识竞赛题(含答案)
- 危险化学品使用单位从业人员安全培训考核试卷及答案2026年
- 河南质量工程职业学院单招职业技能考试题库及答案解析
- 2026北京昌平区卫生健康委员会所属事业单位第一批招聘事业单位56人笔试备考试题及答案解析
- 2026上半年安徽黄山市休宁城乡建设投资集团有限公司及权属子公司招聘18人备考题库附参考答案详解(预热题)
- 2026年上海市浦东新区高三二模生物试卷(含答案)
- 2026年道路运输企业两类人员考试题库及答案
- 内蒙古翔福司源网荷储一体化项目(风光储部分)环境影响报告书
- 慢性病患者的心理康复与治疗
- 国家基本公共卫生服务项目第三版课件
评论
0/150
提交评论