半导体行业深度报告:Agentic AI时代的算力重构:CPU从“旁观者”到“总指挥”的价值回归_第1页
半导体行业深度报告:Agentic AI时代的算力重构:CPU从“旁观者”到“总指挥”的价值回归_第2页
半导体行业深度报告:Agentic AI时代的算力重构:CPU从“旁观者”到“总指挥”的价值回归_第3页
半导体行业深度报告:Agentic AI时代的算力重构:CPU从“旁观者”到“总指挥”的价值回归_第4页
半导体行业深度报告:Agentic AI时代的算力重构:CPU从“旁观者”到“总指挥”的价值回归_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

增持(维持)间可并行但控制流完全不同。分支类任务不适合由GPU流发散导致算力利用率急剧下降。而分支类任务却正是CP推理会产生巨大的KVcache,其占用随对话轮次与上下文长度线性增长,快速耗尽GPUHBM容量。而CPU搭道:从实验数据复盘来看,CPU成为AgenticAI的真实瓶颈。研究显产业端推进方面,AWS和GoogleCloud等头部CSP的隔离与编排能力,通过运行时与调度体系的Forest采用纯能效核设计,核心数可达144甚至288核。我们认为,与高并发场景下CXL驱动的“存力+算力”协同升级。建议关注龙芯中2 4 4 4 5 5 7 72.2.CPU龙头迭代方向明确:Agent驱动下的超 8 9 3 4 4 5 5 7 8 9 41.从对话模型到行动智能体:Agent架构重塑CPU与GPU分工1.1.主流Agent形态从模型推理走向“浏览器+代码执行”Agent的本质是运行在一个具备操作系统能力的云端沙盒计算环境中。我们认为Agent的能力跃迁,并非来自在GPU上堆叠更多token进行推理,而是来自调用外部系披露,ChatGPTAgent通过视觉浏览器、代码解释器等工具完成复杂多步骤任务,能力图1:OpenAI的Agent模式集成多种工具调用形态图2:Manus沙盒数据来源:OpenAI,数据来源:Manus,1.2.为何CPU在Agent时代具有控制流完全不同。在同一周期内执行同一条指令。一旦同一warp内线程进入不同分支路径(WarpDivergenceGPU会将不同分支串行执在32路完全发散的极端情况下,性能下降可达2正是CPU微架构长期优化的主战场。图3:不同GPU在不同Warp分支发散程度下性能表现(单位:毫秒)图4:CPU在复杂任务编排中具备同步与调度能力数据来源:ScienceDirect,数据来源:SemiEngineering,56Agent场景下,单纯追求极致GPU延迟并非最优解。以GP配大容量DDR5/LPDDR5(并通过CXL扩展)承载KVCa7CPU成为AgenticAI的真实瓶颈。在AgenticAI场景下,CPU侧工作负载呈现爆6.3秒以上,增幅超过2倍。其根本原因是并发进程而是决定Agent系统并发上限与服务能力的关键基础设施,其配置与规模将直接约束图5:Agent任务中,CPU占据端到端总延迟的绝大部分数据来源:《ACPU-CentricPerspectiveonAgenticAI》,注:图中数据为各类Agentic工作流在不同基准任务下的端到端运行时间拆分(单位:秒其中堆叠部分区分CPU侧工具执行耗时与GPU侧模型推理耗时8推出AmazonBedrockAgentCoreRuntime/CodeInt行代码,并对每个session设定明确的CPU与内存资源边界,实管化与资源池化管理。GoogleCloud在2025年明确提出AgentSandb在头部厂商产品规划中得到验证:AMD推出的Turin最高可达192核,主打高密度图6:IntelXeon6700/6900代数据中心CPU的核心数最高可达288核数据来源:HotHardware,Intel,9图7:AMD数据中心CPU核心数持续上行数据来源:TheNextPlatform,AMD,内存体系之下。作为对比,传统GPU服务器所搭载的大容量、高带宽内存实际承担了Agent图8:英伟达GB200GraceBlackwellSuperchip结构图数据来源:英伟达官网,DeepSeek新模型架构将部分参数外置并由CPU调度。DeepSeek在2026年论文中图9:DeepSeek明确由CPU调度Engram数据库,CPU重要性凸显数据来源:DeepSeek,著高于已披露水平,供给约束已成为主要掣肘。AMD:数据中心业务增长强劲。AMD在25Q3业绩法说会上声称数据中心业务实现创纪录增长,核心由EPYC服务器C/MI400/MI450机架级AI方图10:AMD营收拆分及盈利预测(亿美元)游戏客户端嵌入式数据中心500450400350300250200500202020212022202320242025(E)2026(E)数据来源:Bloomberg,注:盈利预测采用Bloomberg一致预期图11:Intel营收拆分及盈利预测(亿美元)400020212022202320242021202220232024注:内部抵消项系扣减代工部为自家产品线代工而重复计入的内部关联交易收入数据来源:Bloomberg,注:盈利预测采用Bloomberg一致预期Agent时代“高并发、长任务、强隔离”所要求的超多核、高内存带宽算力

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论