计算机行业深度报告：从Rubin到FeynmanAI推理时代已至

上传人：加*** IP属地：北京上传时间：2026-06-08 格式：DOCX 页数：92 大小：16.12MB 积分：12 举报 版权申诉

已阅读5页，还剩87页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

计算机行业深度报告：从Rubin到Feynman，AI推理时代已至最近一年走势最近一年走势相关报告《计算机行业专题报告：GPU+ASIC渗透加速，液冷市场规模再添增量（推荐）*计算机*刘熹》——2025-12-25《计算机专题报告：超节点渐成共识，产业链成长动能明确——AI算力与模型应用月报（202510推荐）*计算机*刘熹》——2025-11-17《计算机事件点评：百度昆仑芯新品发布，助力中国AI产业向上（推荐）*计算机*刘熹》——2025-11-162025/03/282025/06/272025/09/262025/12/262026/03/27表现计算机沪深300-13.7%-4.4%-5.2%-3.3%2.0%14.5%2233本篇报告解决了以下核心问题：1、AI进入推理拐点成为算力需求增长核心驱动力，CSP资本开支大幅增长、云业务高增、订单储备充足等数据，验证算力需求的短期景气与长期可持续性；2、针对推理时代低延迟、大上下文、高吞吐量等算力需求，英伟达GTC2026发布VeraRubin平台7大芯片与5款机架，LPU首次亮相；3、AI服务器、存储、算力租赁/GPUaaS三大环节有望率先受益。u一、需求端：推理拐点已至，算力需求大幅增长AI发展进入推理阶段，头部CSP资本开支大幅扩容。AI从感知、生成进化至推理/智能体阶段，OpenClaw重塑AI操作系统，推动Token消耗量级跃迁，直接拉动模型厂商算力与Token需求，推理成为算力需求核心驱动力。2026年北美五大CSP（亚马逊、微软、Meta、谷歌、甲骨文）资本开支合计预计达7295亿美元，同比增速超60%、较2023年增长3.5倍以上，绝大部分投向AI算力；国内腾讯、阿里巴巴2025年资本开支也保持增长，且英伟达H200有望恢复对华供货，国内算力供给有望改善。CSP云业务与订单储备双高增，英伟达算力需求指引超市场预期。北美CSP云业务收入增速持续提升，剩余履约义务（RPO）/积压订单大幅增长，国内云业务收入也加速增长，算力短缺成为行业最大瓶颈，为算力产业提供长期需求支撑。黄仁勋预测到2027年Blackwell+VeraRubin产品线收入达1万亿美元，叠加生态内需求创造，算力行业长期空间明确。u二、供给端：英伟达技术迭代，开启低延时推理新时代VeraRubin平台推出7款核心芯片与5款专用机架，LPU登场重构异构架构。VeraRubin平台针对AI智能体工作负载优化，整体性能与能效大幅提升。英伟达收购Groq团队并获得其技术授权推出LPU，凭借极低延迟、超高片上内存带宽，与GPU形成异构协同，GPU处理预填充/注意力机制，LPU加速解码环节，推理吞吐量每瓦特提升35倍，Groq3LPU预计2026Q3出货。技术创新持续突破，机架设计模块化、高壁垒。英伟达在GTC2026推出全球首个CPO以太网交换机，去掉DSP芯片降低功耗与延迟；预告2028年Feynman架构，采用3D芯片堆叠、定制HBM，算力架构持续升级；同时发布太空模块Space-1、智能体平台Nemoclaw，拓展AI算力应用场景。VeraRubin平台机架采用MGX模块化设计，实现无电缆、液冷化，组装与维护效率提升20倍；新一代Kyber机架将实现NVLink域容量翻倍，为超大规模AI计算奠定基础。44u三、产业链各环节：高景气传导，各赛道迎发展机遇AI服务器：鸿海、纬创、广达等头部厂商2026年加速扩产（美国为核心基地），AI机柜/服务器出货量预计倍数增长，行业产能接近满载。存储：进入新一轮超级周期，2026搭载HBM4世代模块的AI加速芯片将正式量产出货；DDR4与DDR5价格倒挂、QLC/TLC现货持续上涨；Rubin平台总FastMemory存储用量较Blackwell翻倍，存储需求大幅提升；三星、SK海力士、美光均向HBM/企业级SSD倾斜产能，机构普遍看涨2026年存储价格。算力租赁/GPUaaS：2026年，英伟达已先后投资CoreWeave、Nebius各20亿美元，支持其合计部署超10GW算力；算力供需失衡推动租赁价格大幅上涨（截至2月底,H200月租金环比涨25%-30%），海内外云服务商均开启涨价潮，商业模式以2-5年承诺制合同为主、按需付费为辅，行业高景气持续。553）服务器组件：①散热：曙光数创、英维克、飞荣达、申菱环境、高澜股份、同方股份；②存储：兆易创新、佰维存储、东芯股份、江波龙、德明利、朗科科技；③网络：中际旭创、新易盛、天孚通信、华工科技、中兴通讯、锐捷网络、盛科通信；④电源：麦格米特、欧陆通、中国长城。⑤连接：澜起科技、华丰科技、鼎通科技、沃尔核材；⑥PCB：5）数据中心：云赛智联、世纪互联、大位科技、润泽科技、光环新网、奥飞数风险提示：宏观经济影响下游需求、大模型产业发展不及预期、市场竞争加剧、中美博弈加剧、相关公司业绩不及预期，AI开源中间体安全问66OpenClaw重塑AI操作系统，2026资本开支指引大幅增长资料来源：英伟达官网资料来源：英伟达官网●AI的三个阶段。根据Infoq官网，黄仁勋在英伟达GTC2026将AI分为三个阶段1）ChatGPT开启生成式AI时代：计算从“基于检索”转向“基于生成”。这彻底改变了计算机的架构、供应和建设方式。（2）推理AI（o1/o3）的出现：AI开始拥有反思、规划、分解问题的能力。o1让生成式AI变得可靠且基于事实。为了“思考”，输入和输出Token的使用量大幅增长。（3）ClaudeCode开启代理（Agentic）时代：这是首个代理模型。它能阅读文件、编码、编译、测试并迭代。它革新了软件工程。现在NVIDIA内部每个工程师都在使用AI代理辅助编程。●“AI已经从“感知”进化到“生成”，再到“推理”，现在已经可以执行极其高效的实际工作。“推理拐点”已经到来。AI要思考、要行动、要阅读、要推理，每一环都在进行推理（Inference）。现在已经远超训练阶段，进入了推理的疆场。过去两年，计算需求增长了约10000倍，而使用量增长了约100倍。资料来源：APIYI，ClawHub，资料来源：APIYI，ClawHub，●OpenClaw重新定义AI“操作系统”。ClawHub是开源AI助手OpenClaw的官方技能商店（SkillMarketplace类似于智能手机的AppStore，用于为OpenClaw查找、安装和管理扩展技能。SaaS（软件即服务）行业在向AaaS（Agent-as-a-Service，智能体即服务）转变。OpenClaw创始人Steinberger认为：多数现有的App本质只是资料管理界面，未来很可能被代理人取代，例如健身、代办清单、记账与记录工具，都能由代理人直接处理，只有具备实体感测器的应用较可能留下。●目前，OpenClaw技能涵盖生产力与办公、开发者与DevOps、AI模型集成、浏览器自动化与数据采集等多个场景。试成求资料来源：APIYI，star-history，资料来源：APIYI，star-history，●OpenClaw底层支持广泛的大型语言模型，包括国内外主流Claude、Gemini、MiniMax等。OpenClaw对token消耗量OpenClaw的发布或意味着后推理时代AI的转折点。●黄仁勋预计Blackwell和Rubin两条产品线的收入到2027年达到1万亿美元，超过2025年10月黄仁勋预测的2025-2026年Blackwell和Rubin两条产品线市场需求约5000亿美元。1万亿美元仅包括Blackwell与VeraRubin两条产品线，且仅统计至2027年。如果加上独立CPU、Groq、存储以及网络设备，规模可能会达到1.25万亿美元。●在英伟达的业务中，60%来自云服务商（Hyperscalers其中40%～50%的需求由英伟达创造，支持其内部AI消费（如推荐系统、搜索向大模型的迁移更通过英伟达的生态系统加速每一家AI实验室。另外40%则遍布区域云、主权云、企业级服务器及工业自动化。我们预计，2026年亚马逊、微软、Meta、谷歌、甲骨文的资本开支将分别达到2000亿美元、1500亿美元、1250亿美元、1800亿美元、745亿美元，五家CSP合计将达到7295亿美元，同比增速超60%，对比2023年的1612亿美元增长3.5倍以上，这一增长的资本开支的绝大部分将投向AI算力产业。--63266419资料来源：Wind，Bloomberg，微软官网，Meta官网，亚马逊官网，华尔街见闻，各公司公告资料来源：Wind，Bloomberg，微软官网，Meta官网，亚马逊官网，华尔街见闻，各公司公告注：OracleQ3对应每年6-8月，以此类推）395351322322278226214278226214250190250190200226240224221224137576137540349259214034925921797242858518169242858518169679159679128232823IIIII2023Q12023Q22023Q32023Q42024Q12024Q22024●微软：2025Q4云业务收入同比+29%，2025年，云业务收入为1204.55亿美元，同比+14.9%。●AWS：2025Q4云业务营收同比增长24%，实现13个季度以来的最快同比增速，季度环比+26亿美元，同比增长近70亿美元。2025年，云业务收入为1287.73亿美元，同比+19.7%。●谷歌云：2025Q4云业务收入大幅加速增长48%，2025年，云业务收入为586.84亿美元，同比+35.8%。三大变化：①获得新客户的速度更快：年底时，新客户增速是Q1的两倍。②2025年签署的10亿美元级大单数量超过了前三年的总和。③继续加深与现有客户的关系，其支出比最初承诺高出30%以上。030930935633032933029328830992752932883099275240267268255240267268255250242231241242231205203210921032052032109210322158706358697375808492966358I20222427303341I资料来源：Bloomberg注：OracleQ4对应每年9-11月，以此类推）亚马逊mn谷歌微软Oracle亚马资料来源：Bloomberg注：OracleQ4对应每年9-11月，以此类推）090880186290880175358743233126384资料来源：资料来源：Bloomberg注：OracleQ4对应每年9-11月，以此类推）13●微软：截至2025年底，RPO已达6250亿美元，同比+110%，加权平均期限约为2.5年，约25%将在未来12个月内确认为收入，同比+39%，未来12个月之后确认的剩余部分增长了156%。RPO中约45%来自OpenAI，其他余额增长了28%，反映了持续广泛的客户需求。●AWS：截至2025年底，RPO规模已达到2440亿美元，同比+38%。●谷歌云：截至2025年底，RPO约2428亿美元，环比Q3（1577亿美元）增长了54%。这主要和谷歌GCP（包括基础设施资源、Gemini大模型、企业级AI产品等）相关。6250523052304553455339803750242839803750242832102980321029802690266024402420269026602440242022202160195020002220216019502000788979868991788979868991932973924889725802606679741655932973924889725802606679741655649649643612617623524607512466505385022Q322Q423Q1●腾讯和阿里巴巴2025全年资本开支分别为792、1231亿元，同比增速分别为3%、72%；云业务收入分别为2294、1466亿元，同比增速分别为8%、29%。2026年3月，英伟达表示已经获得了向中国众多客户销售H200的许可证，也已经收到了来自众多客户的采购订单，目前正处于恢复生产的过程中。543543236638636631829031829089871898775805269696157704044357580526969615770404435030240■腾讯n.阿里巴巴——腾讯yoy——阿里巴巴yoy0-4284224482084725826085555495445235205044874864333983343012812762652562512475315612963175826085555495445235205044874864333983343012812762652562512472022Q12022Q22022Q32022Q42023Q12023Q22023Q32023Q40■腾讯n.阿里巴巴——腾讯yoy——阿里巴巴yoyNVIDIAGTC2026：LPU登场开启低延时推理时代●VeraRubin是一个完整的、端到端优化的系统，专为智能体（Agentic）工作负载设计，其中核心是七颗芯片：RubinGPU、VeraCPU、NVLink6交换机、ConnectX-9SuperNIC、BlueField-4DPU、Spectrum-6以太网交换机，新整合Groq3LPU，以及五款机架。●RubinGPU：每个GPU2个Die，集成224个SM，第六代TensorCore。NVFP4推理和训练性能分别达到了50/35PFLOPS，NVLink6双向带宽：3.6TB/s，HBM4提供22TB/s的带宽。●VeraCPU：专为极高单线程性能设计，采用LPDDR5内存，是全球唯一使用LPDDR5的数据中心CPU，适合AI智能体工具调用。●存储系统：BlueField4+CX9，面向AI时代的全新存储平台，全球存储行业100%加入。●CPOSpectrumX交换机：全球首款共封装光学以太网交换机，已全面量产。●LPU：采用确定性数据流处理器架构，由编译器在编译阶段完成所有调度，运行时不需要动态仲裁。同时，LPU配备大容量片上SRAM（静态随机存储器数据直接集成在芯片上，访问延迟远低于GPU从外部显存读取数据的方式。●英伟达收购Groq团队并获得其技术授权。Groq是一种确定性数据流处理器（DeterministicDataflowProcessor采用静态编译和编译器调度，拥有大量SRAM，专为推理单一工作负载优化，具备极低延迟和极高token生成速度。●NVIDIAGroq3LPU：LPU架构通过编译器控制紧密耦合计算、内存和通信，实现快速、可预测的tokens生成。LPU并非仅仅优化峰值算术吞吐量，而是强调确定性执行、高片上内存带宽和显式数据移动，这对解码主导、延迟敏感的推理场景尤为重要。●LPU的核心组件是MEM模块——一种扁平化的、SRAM优先的内存架构，其中500MB的高速片上SRAM为推理的主要工作存储器。每个LPU间将配备150TB/s的片上内存带宽以及高带宽的芯片间（C2C）通信。●NVIDIAGroq3LPX是一款全新的机架式推理加速器，专为NVIDIAVeraRubin平台打造，满足智能体系统对低延迟和大上下文的需求。该系统以256个互连的NVIDIAGroq3LPU加速器为核心构建。其架构强调确定性执行、高片上SRAM带宽和紧密协调的纵向扩展通信，因此即使并发量增加和请求形状变化，交互式推理也能保持响应速度。●LPX与VeraRubinNVL72协同部署，加速解码循环中对延迟敏感的部分，包括FFN和MoE专家执行，RubinGPU继续处理预填充和解码注意力机制。它们共同构建了一个异构服务路径，在不牺牲AI工厂吞吐量的前提下，提升了交互响应速度。●LPX计算托盘：加速器包含32个液冷式1U计算托架，每个托架均旨在支持大规模低延迟推理。每个托架集成了8个LPU加速器、一个主机处理器和交换矩阵扩展逻辑，采用无电缆设计，简化了机架式部署，并将计算与通信紧密耦合。●LPU芯片间（C2C）链路提供托盘内直接通信、通过LPUC2C主干网跨托盘通信以及随着系统扩展而跨机架通信。连接性至关重要，因为交互式推理不仅仅关乎原始计算能力，它还取决于系统在请求跨设备流动时移动数据、协调工作以及避免延迟变化的能力。单个LPX计算托盘LP30芯片8片上SRAM4GBSRAM带宽通过结构扩展逻辑进行DRAM扩展最高可达256GB通过主机CPU运行DRAM最高可达128GBAI推理计算（FP8）9.6PFLOPS扩展带宽20TB/s资料来源：英伟达官网，资料来源：英伟达官网，●智能体推理时代需要一种新的架构。推理并非单一的、统一的工作负载。在一次请求中，预填充和解码对硬件的要求各不相同，而且这些要求会随着批处理大小、上下文长度和模型结构的变化而变化。某些阶段，例如自注意力机制和稀疏模态扩展（MoE对内存带宽和数据移动非常敏感；而另一些阶段，例如密集投影层和前馈层，在并行性充足的情况下，可以在吞吐量优化的硬件上高效扩展。在交互式解码中，许多操作以非常小的批处理大小运行，这使得延迟对停顿、争用和抖动更加敏感。●异构系统可结合两种方法，兼顾了低延迟的交互性能和高AI工厂吞吐量。GPU为上下文密集型预填充任务提供高输出，并执行解码注意力机制；LPU则加速对延迟敏感的解码组件，例如FFN/MoE的执行。二者协同工作，在不牺牲AI工厂吞吐量的前提下，提升了交互性能。变化重要性低延迟在交互式应用中，响应速度不再仅仅是基础设施指标；它也是用户评价的一部分。长推理输出随着模型生成更长的输出和多步骤的思维链，越来越多的请求转向顺序标记生成。前缀缓存重用共享提示状态可以降低预填充成本，但同时也增加了仍需快速处理的请求特定解码工作的相对份额。长上下文随着上下文的增加，Transformer的自注意力机制会越来越受到数据移动和内存带宽的限制。资料来源：英伟达官网资料来源：英伟达官网●Groq之于英伟达，就如同Mellanox之于英伟达一样，是一次架构层面的重要补充。GPU与LPU协同：在英伟达新引入的Dynamo软件框架协调下，RubinGPU利用其288GBHBM4和强大的浮点运算能力，处理复杂的注意力机制（Attention）计算和数学运算，存储大型KVCache。GroqLPU利用其150TB/s的超高带宽，处理前馈神经网络（FFN）层计算，实现极低延迟的逐token生成。根据英伟达官方基准测试，当运行达到1万亿参数规模的大语言模型时，RubinGPU与GroqLPU组合相比上代方案，推理吞吐量每瓦特提升高达35倍。●将VeraRubin与Groq结合开辟新的细分市场：大模型+长上下文+超快token生成速率。黄仁勋认为，在一座算力工厂的配置中，75%仍将是纯VeraRubin部署；另有25%将是VeraRubin与Groq的组合部署。三星为英伟达生产Groq3LPU芯片，并正在加快生产速度，黄仁勋表示该芯片将于2026Q3正式出货。资料来源：资料来源：Semianalysis●CPO（Co-PackagedOptics，光电共封装）直接将光引擎直接集成到与计算芯片或交换芯片相同的封装内，功耗和延迟更低。以800GSR8为例，DSP芯片功耗可达整个光模块功耗50%，CPO可以去掉DSP，且缩短传输距离。●NVIDIA推出全球首个CPO（Co-PackagedOptics）光电共封装的NVIDIASpectrum-XEthernetSwitch，英伟达与台积电共同发明了COUPE，一种将电子器件与硅光子引擎直接集成在同一块芯片上的技术。目前，英伟达占据了台积电COUPE工艺产能的绝大多数，Spectrum-X的量产爬坡已经启动，未来还将持续扩大规模。●NVIDIASpectrum-6大规模引入硅光子技术，并将在未来几年把硅光子加入到NVLink的纵向扩展技术中。英伟达投资Coherent和Lumentum布局上游供应链。资料来源：科创板日报，英伟达官网资料来源：科创板日报，英伟达官网23●Space-1VeraRubinModule：NVIDIA正研发部署在太空的数据中心计算机“VeraRubinSpace-1”，将数据中心级AI计算能力部署到卫星和轨道数据中心（ODC并强调其面向在轨推理、实时地理空间智能和自主航天任务。●Nemoclaw：打造安全高效的Agent，将OpenClaw纳入英伟达的软硬件生态，实现（1）内置OpenShell运行时，给Agent加上安全沙箱和策略引擎，让企业敢用2）自动装上英伟达自家的Nemotron开源模型作为本地推理大脑，日常任务不出内网，需要更强能力时通过隐私路由调用云端前沿模型3）硬件绑定——NemoClaw可以跑在GeForceRTXPC、RTXPRO工作站、DGXSpark、DGXStation上，Agent需要7×24小时不间断运转。资料来源：英伟达官网资料来源：英伟达官网年据果壳公众号报道，Feynman架构GPU确认采用3D芯片堆叠技术。●黄仁勋表示，Feynman将定制化HBM内存，并将搭配新的LP40，并推出全新RosaCPU、SuperNICCX10。（CPO）Scale-up将首次共存。2525三、服务器Rack：机架设计高壁垒，盈利能力稳中向好资料来源：英伟达官网资料来源：英伟达官网●VeraRubinPOD引入了五个全新的专用机架级扩展系统，适用于需要高吞吐量、超低延迟推理、密集型CPU沙盒和大规模上下文内存存储的代理式AI工作负载。这些机架共同构成了一个紧密的系统，将为全球最节能、最具成本效益的数据中心提供动力支持。资料来源：英伟达官网，资料来源：英伟达官网，●（1）VeraRubinNVL72：峰值算力达到3.6Exaflops，搭载HBM4显存（288GBGPU之间的NVLink互连带宽甚至能达260TB/s。●（2）VeraCPU机架：256个液冷VeraCPU、74个Bluefield-4DPU和ConnectXSuperNIC，配备高达400TB的LPDDR5内存，总内存吞吐量达300TB/s。VeraCPU的定位是大规模数据处理、AI训练和智能体推理场景，其效率是传统机架式CPU的两倍，速度提升50%。资料来源：英伟达官网，资料来源：英伟达官网，●（3）BlueField-4STXRack：AI原生存储机架，可将GPU内存无缝扩展到整个POD（物理数据中心）。BlueField-4结合了VeraCPU和ConnectX-9SuperNIC，可提供高带宽共享层。●（4）Spectrum-6SPXRack：提供低延迟、高吞吐量的机架间连接。●（5）Groq3LPXRack：256个Groq3LPU，提供128GB的SRAM和40PB/s的推理加速带宽，通过每个机架640TB/s的专用扩展接口将这些芯片连接起来，用于低延迟推理。LPX采用全液冷设计，基于MGX基础设施构建，可无缝集成到将于2026年下半年推出的下一代VeraRubinAI工厂中。资料来源：英伟达官网资料来源：英伟达官网●NVIDIAMGX机架采用单宽设计，优先考虑基于PCB的连接。它支持完全模块化、无电缆、无软管、无风扇的计算和NVLink交换机托架，从而实现最高的可靠性、可扩展性和可维护性。单19英寸宽的机架还简化了运输和物流，加速了AI工厂的部署。该机架采用高度模块化的背板，由最多四个预集成且经过预验证的铜缆盒组成，每个托架连接成一个整体。该背板可容纳数千根线缆，并且MGXNVL和MGXETL机架采用相同的机械外形尺寸。●NVIDIAVeraRubinNVL72旨在无缝融入现有数据中心空间。它拥有比NVIDIAGB200NVL72几乎两倍的晶体管数量，并通过极致的协同设计，实现了每瓦性能提升10倍。该机架集成了72个NVIDIARubinGPU、36个NVIDIAVeraCPU、ConnectX-9SuperNIC和BlueField-4DPU，分布在18个计算托架上，此外还配备9个NVLink交换机托架。整个机架共包含130万个独立组件，近1300个芯片，全部封装在一个单宽的第三代NVIDIAMGX机架中，重量约为4000磅（约1818公斤相当于一辆皮卡车的重量。资料来源：电子工程专辑，storage资料来源：电子工程专辑，storagereview●VeraRubinNVL72内部的计算托盘与NVIDIABlackwell相比进行了彻底的重新设计。它采用坚固的PCB中板，专为单宽机架设计，实现了无电缆、无软管、无风扇的无风扇布局。这种简化将计算托架的组装时间从近两小时缩短至仅五分钟，组装速度和维护效率提升高达20倍。●每个计算托架都配备两颗NVIDIAVeraRubin超级芯片，每颗芯片包含17,000个组件——大约是现代智能手机组件数BlueField-4DPU。资料来源：英伟达官网资料来源：英伟达官网●为了突破NVL576的容量限制，NVIDIA将推出全新的MGX机架——NVIDIAKyber。NVIDIAKyber是新一代MGXNVL机架设计，每个机架的NVLink域容量将翻倍，可容纳144个GPU。●NVIDIAKyber将采用类似的直接光互连技术，实现机架间扩展，最终构建出规模庞大的全机架NVL1152超级计算机。Kyber为下一代基于NVIDIAFeynman的超大规模AI计算奠定了基础。资料来源：英伟达官网资料来源：英伟达官网●Kyber将首先与VeraRubinUltra一同推出，作为独立的NVL144系统，为客户提供三种VeraRubinUltraNVLink扩展域的选择：NVL72、NVL144和旗舰级NVL576。RubinUltra定位为VeraRubin高端迭代版本，推理性能将大幅提升，预计2027年下半年正式推出。（Midplane）”。有别于传统的水平插拔，Kyber采用垂直插入设计，通过背板的中NVLink网域内连接多达144个GPU，突破了传统铜缆连接的距离限制。●营收：2月营收为5958.13亿元新台币，月减18.39%，年增8.06%；1-2月累计营收1.33万亿元新台币，年增21.63%。●AI服务器：公司将部分服务器的交易模式从buyandsell改为consignment，因此预计2026Q1表现环比持平。如果还原成原来的交易模式，则呈现显著成长态势。公司正全力投入资源，将美国打造成公司最大AI服务器生产基地。公司预计2026年达到每周2000柜产能不是问题，实际出货量还需视物料供应情况而定。另外，根据客户每代产品设计规格不同，出货节奏会出现波动。●展望：2026Q1AI机柜出货环比高双位数增长、AI服务器营收呈现环比增长态势；2026全年AI机柜倍数成长，AI多元解决方案并进有望推升市占率。48655109507447550744750●营收：2月营收为2848.93亿元新台币，月增24.75%，年增177.37%；1-2月累计营收5132.60亿元新台币，年增●AI服务器：AI相关产品目前占公司营收约7成，纬创除稳定掌握的OEM及大型企业端客户外，与纬颖也分别锁定NeoCloud新兴AI原生云服务商和超大规模业者（hyperscaler在GPU、ASIC等多平台全线推进、均衡发展，持续在L10位居主要供应商之一。●产能：持续在中国台湾、美、墨及东南亚等生产据点积极扩充产能，公司预计2026年资本支出将大幅增长7成至600亿元新台币。美国设厂进度顺利，预计Q1底、Q2初开始在美国交货。●展望：公司预计，2026年在高基期情况下，仍有望高双位数增幅。公司预计2026年网通业务可较2025年成长10倍。0●营收：2月营收为2155.83亿元新台币，月减6.61%，年增43.18%；1-2月累计营收4464.18亿元新台币，年增52.30%。●AI服务器：公司预计，2026Q1GB300出货动能大于GB200，Q1AI服务器出货或季增。●产能：2025年资本支出200亿元新台币，2026年预计可达300亿元新台币。公司预计AI服务器2026年底产能将是目前的两倍以上。●展望：公司预计，第一季GB300出货动能大于GB200，2026年AI服务器营收仍有三位数增长，公司看好今年AI伺服器需求仍强劲，而美国新厂预计第二季至第三季陆续贡献产能，越南河内厂预期3月正式量产，在新产能挹注下，正向看今年营运，2026年应能继续成长。户户四、存储：进入新一轮超级周期资料来源：海力士公开路演资料来源：海力士公开路演PPT，艾邦半导体网，37●HBM（HighBandwidthMemory）：是一款新型的CPU/GPU内存芯片（即“RAM”），是将很多个DDR芯片堆叠在一起后和GPU封装在一起，实现大容量，高位宽的DDR组合阵列。HBM3E内存已经量产，HBM4产品有望于2026年正式推出并量产，同样，美光和三星也计划在2026年量产HBM4。GPU/CPU，左die是DDR颗粒之间用TVS方式连接，现在2/4/8三种层资料来源：半导体产业纵横公众号资料来源：半导体产业纵横公众号●HBM容量快速翻倍。2024年上半年，NVIDIA数据中心AI加速芯片的HBM总容量区间达80GB—144GB，标配HBM3E世代模块，单模块容量为16GB或24GB，均基于8层DRAM芯片堆叠工艺实现。到2025年下半年，HBM3E世代将推出36GB规格的升级模块，采用8层×4.5GBDRAM裸片的工艺方案；搭载该模块的AI加速芯片总内存容量上限将达288GB，较2024年上半年的144GB上限实现翻倍。●搭载HBM4的AI加速芯片2026年正式表：NVIDIA和AMDAI芯片及HBM规格路线图（2024Q1至2026Q4）量产出货，核心需量产出货，核心需求方为NVIDIA与AMD两大GPU厂商。2026年，搭载HBM4世代模块的AI加速芯片将正式量产出货。相较于HBM3E，HBM4的DRAM堆叠层数仍为8层，单模块容量升级至48GB（8层×6GB裸片同时数据传输速率较HBM3E提升超50%，成为新一代AI芯片的核心性能增量点。HBM的核心需求方为NVIDIA与AMD两大GPU厂商，其中NVIDIA是商用数据中心AI加速芯片的领先供应商，资料来源：Wind，CFM，资料来源：Wind，CFM，●DRAM价格变化：DDR4与DDR5价格维持倒挂，截止2026年3月27日，DDR4(2Gx8)现货平均价74.68美元，环比上周-3.64%，环比上月-6.54%；DDR5(2Gx8)现货平均价37.46美元，环比上周-4.36%，环比上月-5.17%。●NAND价格变化：1Tb服务器用QLD与TLC价格仍处于上涨态势。图：DRAM原厂价格走势图（美元）图：1TbTLC（2025年-2026年）价格走势（美元）2024-11-052025-现货平均价:DRAM:DDR5(16Gb(图：1TbQLC（2025年-2026年）价格走势（美元）资料来源：英伟达官网、资料来源：英伟达官网、图：Rubin与Blackwell存储用量的变化的对比资料来源：各公司官网、资料来源：各公司官网、继续优先发展用于人工智能应用的高附加值产品•预计持续的人工智能热潮将推动SOCAMM2、GDDR7等产品扩大与人工智能相关的产4242五、GPUaaS/算力租赁：英伟达投资Nebius，coreweave资料来源：SemiAnalysis资料来源：SemiAnalysis资料来源：CoreWeave招股书，资料来源：CoreWeave招股书，●3月11日，英伟达与AI云服务商Nebius宣布达成战略合作，英伟达将向Nebius投资20亿美元，双方合作开发并部署面向AI市场的新一代超大规模云计算服务。本次合作基于Nebius已在其全球平台内部署的英伟达基础设施，包括位于美国的多个GW级AI工厂。为支持Nebius在2030年底前实现超过5GW算力部署的目标，英伟达将协助Nebius率先采用其最新一代加速计算平台。●1月26日，英伟达公司宣布向云计算服务商CoreWeav追加投资20亿美元，支持后者在2030年前增加超过5GW的CoreWeave的投资者，并曾承诺在2032年前从该公司采购超过60亿美元的服务。CoreWeave的平台从根本上进行了全新架构设计，旨在为人工智能工作负载提供前沿性能。CoreWeav构，以提供人工智能所需的基础设施和技术堆栈，并对其进行优化，去除了诸如管理程序层等服务以及损耗的不必要托管服务。CoreWeave的托管软件服务，包括我们的编排解决方案CKS以及应用程序服务开创了GPU基础设施支持的贷款模式，到目前为止，我们已通过12轮融资筹集了超过14近由黑石集团（Blackstone）和麦格理集团（Magnetar）牵头筹集的76亿美元承诺的GPU基础设施的私募债务融资之一，这表明债务投资者对为我们公司提供资金以构建和扩展下一受益于与供应商和客户之间牢固、互利的关系，这些关系强化了公司作大规模部署最新的GPU技术。反过来，我们也是资料来源：CoreWeave公司公告资料来源：CoreWeave公司公告●（1）承诺制合同：合同期限通常为2-5年（截至2024年，承诺制合同的加权平均期限约为4年客户需在合同期内预留算力容量并支付固定费用，。主要为AI实验室和企业，其需求为大规模、高强度AI工作负载（如模型训练对算力稳定性要求高。以“每签约GPU每小时”为计价单位，合同期内价格固定，每月按客户预留的使用承诺计费；客户通常在签约时支付预付款（占合同总价值TCV的15%-25%）。●（2）按需付费模式（On-Demand）按实际使用量实时计费，支持客户动态调整算力规模，适配突发工作负载（如模型测试

人人文库> 全部分类> 办公材料 > 办公文档

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

计算机行业深度报告：从Rubin到FeynmanAI推理时代已至

文档简介

温馨提示

最新文档

评论

计算机行业深度报告：从Rubin到FeynmanAI推理时代已至

文档简介

温馨提示

最新文档

评论

相关文档