版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
推理与AgenticAI正推动AI基础设施从GPU单点算力竞争转向CPU-GPU投资建议:CPU重回AI基础设施核心中枢,异构协同驱动产业价值重估。随着AI迈向推理与AgenticAI,算力瓶颈正由GPU转向具调用及多智能体协作中作用凸显,正迎来估值重塑与供需错配,升,未来AI数据中心将从单纯堆GPU转络+软件”的整体优化。推动CPU架构向系统级协同优化演进,包括更多核心、高带宽缓存、CXL互联和新型共享内存架构。CPU与GPU协同成为AI数据中心核心,带动产业链价值提升。上游半导体材料和设备国产化进风险提示:AI智能体落地不及预期风险,风险,行业竞争加剧及份额流失风险,资本开支周期波动风险。行业专题研究2 31.1.CPU:AI基础设施的大脑 3 3 5 7 92.1.AI进入“持续执行”阶段,CPU需 92.2.AgenticAI打开CPU需求弹性,CPU从“调度器”升级为“执行中2.3.从全球市场到国产生态,CPU需 2.4.从价格上涨到交期拉长,CPU需求回升进入 3.2.CPU产业链全景梳理:从上游材料到下游应用发展机遇 4.2.国内CPU重点公司梳理:国产CPU从信创替代走向AI系统中枢.24 行业专题研究3迟响应、分支控制、任务调度和串行执行。在传统计算机GPU拥有大量计算核心,擅长处理矩阵乘法、Attention高度规则、可并行化任务;CPU则拥有更强的单核能力度效率、任务流转效率和系统稳定性。任务单一、重复且高度并行,系统瓶颈天然集中于浮点算力与显存带宽。数据库访问、权限验证、缓存管理、网络通信、KVCache行业专题研究4训练时代的瓶颈是GPU浮点算力,那么推理时代的瓶颈已经逐步转移至CPU侧的请求处理、编排调度与数据加工。CPU开始承担类似“空中交通理、Token流管理、KVCache调度景下,GPU真正执行推理计算的时间甚至已经低于C合等大量工作。尤其是在AgenticAI时代,CPU景下,GPU实际执行推理计算的耗时已经低于CPU的资料来源:英特尔商用公众号大模型架构本身也正在发生变化,进一步强化性。过去Transformer的运行逻辑,本质上是依靠大量Attention与FFN此GPU长期承担了大量Memory与数据访问压《ConditionalMemoryviaScalableLookuLanguageModels》提出的Engram架构,就是典型代表。其核心思路是:将部分高频、固定的语言模式存储为独立Memory,在推理时直接通过再需要所有知识都依赖GPU计算生成,而是开始出现类似“缓存系统”的行业专题研究5知道需要读取哪些Memory,因此系统能够在GPU执行计算的同时,由算+CPU调度+Memory理、任务协调以及推理流水线控制。随着AgenticAI与长上下文模型的发展,AI系统正在逐渐从“单一算力系统”演变为“完整计算系统”,CPU与Memory子系统的重要性也将进一步提升。1.3.AgenticAI出现,CPU需求发生“质变”“一次性推理”演变为“持续执行”。传统Chatbot本质上是一个“输入—输出”式系统:用户输入Prompt后,模型执行一次推理计算,生成答案后任务即结束,其核心是短时、高密度的并行计算,因此GPU天然适合承担这类工AI更像一个“持续在线的执行系统”,它不仅需要理解用户目标,还需要自主拆解任务、调用外部工具、获取环境反馈并持续调整执行路径。AI的目标也因此从“回答问题”升级为“完成任务”。当AI开始帮助用户订机票、查图7:GPU的并行批处理模式vsCPU驱动的行业专题研究6资料来源:深思SenseAI公众号越来越多的学术研究也开始验证:Agent系统本质上是“CPU驱动”的。《TowardsUnderstanding,Analyzing,andOptimizBash执行、数据库检索等任务,往往主要依赖CPU运行前Agent系统已经开始从“单纯提升GPU性能”转向“CPU-GPU协同优化”仍是核心算力引擎,但CPU重新成为决定Agent系统效率与扩展能力的关键中枢。行业专题研究7几年,大模型训练需求推动GPU成为AI产业绝对核心,行业几乎默认AI模构成了竞争重点。但随着AI进入推理与Agent阶段,系统复杂度迅速提GPU、内存、网络以及软件栈之间的整体协同效率。从更底层的架构逻辑来看,AI系统实际上正在重新回到一种“AI行业专题研究8体吞吐率。从架构层面看,AI基础设施正在形成一种新的“大型机逻辑”:合、统一调度、资源协同优化的超级计算系统。非终极形态,长期来看,AI产业必然会重新走向类似“去IOE”机、Oracle数据库和EMC存储体系的替代,而未来AI产业也可能通过软具调用以及传统软件栈的,仍然是CPU。未来客户真AI基础设施将逐步从“GPU孤岛”走向“CPU+GPU+网络+软件”的异构协同行业专题研究9承担绝大部分工作负载,CPU主要负责简单的数据加载CPU首先负责请求接入与分发,包括多用户并发排队、库访问、文档检索、搜索结果筛选与数据拼接等工作。此外,为提升G利用率,CPU还需要动态执行Batch调度,对不同用户请网络化与服务化的,CPU还承担网络通信、安全认证、权限控制以及系统驶、机器人以及PhysicalAI场景中,模型需要不断调用环境、执行动作、接收反馈并重新规划路径,大量系统级任务因此转移到CPU侧。尤其是在成以及分布式协同等复杂工作,其资源消耗往往远超传统训练阶段。求快速上升,其中一个核心驱动力就是强化学习与智能体工作负载对CPU资源的持续消耗。这意味着AI基础设施已经从单纯“GPU算力堆叠”转向“CPU+GPU协同执行”,CPU开底层资源。行业专题研究资料来源:英特尔商用公众号之间的资源配比也正在持续发生结构性变化。训练时代的大模型工作负载是配套组件,行业普遍采用“4~8个GPU配1个CPU”的架构。在AI发展的早期训练阶段,CPU主要负责少量调度与后勤保障,两维持在1:8左右。但随着AI应用从实验室走向真心从训练转向推理,系统复杂度已经逐渐从计算层转移至控制平面与数据资料来源:AMD行业专题研究件处理、数据库查询和跨软件工作流编排,CPU将承担越来关,服务器CPU也将从AI服务器的配套资源升级为Ag“执行中枢”承担绝大多数数学计算。AMD文章《AgenticAIChangestheCPU/GPU性推理系统,因此基础设施设计高度偏向GPU。但AgenticAI彻底改变了中不断循环执行、验证结果与重新规划。在这一过程中,C解析PDF、获取实时股价并组织多轮推理;在自动办公与企业CentricPerspective》指出,在智能体工作负载中,大量任务已经从“GPU-程大量运行在CPU侧;搜索类Agen复杂的信息过滤与重排序;ToolUse场景下,CPU需要持续执行Bash、Python、SQL以及第三方API调用。AMD在《AgenticAIChangesthe显转向CPU密集型,其中CPU主要负责工作流编排、步推高了CPU压力:不同Agent之间需要动态同步状态与任务,而长上下文Memory则要求CPU持续维护历史状态、缓存与长期记忆步、实时性强且事件驱动的特点,很难像GPU训练那时性与扩展能力的关键底层资源。行业专题研究资料来源:CSDN缘智能和高性能异构计算等新增需求。究院数据,2024年中国CPU行业市场规模约为2300亿元,2025年预计达均存在上行空间。展,CPU市场的竞争维度正在从单一性能竞争,逐步转态、供应链安全和异构协同能力的综合竞争。对于国内产业链而言,AI基础设施建设与国产替代趋势共振,有望为海光、龙芯、飞腾、鲲鹏等国产行业专题研究究究究究但随着AI产业逐渐从训练走向推理与Agent阶段,CPU重新成为AI系统长:过去通常只需1~2周即可交付,而现在已经延长至8~价已经上涨约30%,而部分型号出现超过六个月的延迟交付。这种现象背发生变化。由于AgenticAI、推理与强化学习带来的CP估的关注度明显提升,Intel等传统CPU厂商的AI基行业专题研究部署数千万颗AWSGravitonCPU核心,专门用于AgenticAIworkloads。这而现在大型云厂商已经开始单独建设面向Agent工作负载的CPU集群。未达成多年协议,在全球AI数据中心大规模部署Xeon至强处理器而CPU也因此重新成为云计算与AI基础设施中的核心战略资源。资料来源:I行业专题研究能力;但随着AI产业从训练走向推理,并进一步进入Agentic生根本变化。Seminanalysis《CPUsareBack》指出,2026年将成统调度,还需要承担任务编排、ToolUse、Memory管理、多Agent协作以及RAG检索都会显著增加缓存访问压力。同时,更高带宽的DDR5与检索、数据拼接以及长链路Memory访问等高吞吐场景。除此之GPU与内存之间的统一共享与低延迟访问,从而缓解大模势之一是ContextMemoryStorag求,新的共享内存与分层存储架构正在成为行业重点。此外,包括AMD正需要购买的,不是单一GPU,而是完整异构系统解决方案。下,GraceCPU等面向AI场景优化的新型CPU开始出现,其核心目标并不行业专题研究是替代GPU,而是强化CPU与GPU之间的协同效率。同时,IPU过去典型AI服务器以GPU为中心,CPU只是headnode;而未来AI服务而会形成GPURack与AgenticCPURack并存的新型架构。这意味着AI基中国CPU行业市场规模约为2300亿元。及医疗等多个高景气赛道。其中,个人电脑(PC)作为传统主力,尽管面行业专题研究支周期,相关芯片设计、服务器整机及异构系统生态均将进入价值重估阶续增长。ASIC业务增速惊人,环比+30%,同比几乎翻行业专题研究面量产爬坡阶段,均创下Intel五年先进封装订单年需求已达到数十亿美元规模资料来源:ASI才。Intel还与SambaNova合作,通过数据流处理同,为客户提供更高效的AI计算解决方案。的EPYC服务器CPU销售持续扩大,增长幅度显著,这不仅来自传统数据行业专题研究点CPU用于连接各类加速器并逐步扩张,而智能等领域,凭借高性能与总拥有成本优势,EPYCCPU在中端及中小瓦性能优化以及每美元性能优化,尤其推出设施打造的EPYCCPU,用于智能体AI工作负载。这使AMD每瓦性能上明显优于竞品x86方案,并在与领先务需要CPU提供可靠的控制和调度能力。在软平台持续优化CPU和GPU协同性能。及AI模型训练/推理,并提供对主流开源模型的Day0支持,包括谷歌模化出货,并在2027年实现更大规模部署。这一硬件与软件协同体系使AMD在智能体AI基础设施市场中形成独特优势,并确保CPU在AI推理和调度中的核心地位。行业专题研究资料来源:SemiAnalysis传统通用CPU和AI主节点CPU相比,智能体AICPU的增量显著,直接强调,这并非通过牺牲GPU份额实现,而是智能体AI任务带来系列GPU将按计划规模化出货。AMD财报预测,2026长期市场扩张和AI基础设施生态系统的建立打下坚实基础。涵盖通用计算、AI加速器主节点,还包括专门面向AgenticAI的CPU。公时确保EPYCCPU在全球云计算和企业市场中的了难以替代的竞争壁垒,为未来营收和利润增长提供坚AMD依托服务器CPU与GPU的软硬件协同优势,在AI及数据中心市场行业专题研究线获得了良好的市场反馈,Graviton3基于键环节。根据ARM最新发布的AGICPU数据,ArmAGIC图资料来源:ARMARM在技术上通过NeoverseV3境中可以处理更多独立任务,这种设计理念避免了多核线程并行的性能瓶增长比芯片数量更重要的原因,未来CPU核行业专题研究ARM通过NeoverseCSS与IP8i训练/推理系统中使用ArmAxionCPU替代原即便芯片颗数未显著增加,CPU核心数和计算密度的提升也将显著改变整体AI基础设施的计算比例,从而驱动ARM在高性能数据中心和AI部署中占据关键地位。一方面是基于NeoverseIP和计算子系统(CSS)的AGICPU及未来定制芯片业务的直接销售收入。到2031财年,ARM预计元,总收入达到250亿美元。这一双引擎模式不4)高通:端侧与数据中心CPU协同AI生态高通可为超大规模云厂商提供定制化、低TCO中心CPU与AI推理加速器也在研发中,将在未来HexagonNPU及OryonCPU的协同计算能力,高通在行业专题研究的长期战略合作,将进一步推动CPU在自动驾驶海光信息技术股份有限公司深耕高端处理器领域,核心技处理、人工智能与商业计算领域。公司通过发布AI软件栈体系,进一步夯实芯片级技术协同能力,为千行百业智能化提供海光信息在技术与芯片层面的核心竞争力体现为三大维度:一是技术地位谱等365款主流大模型,覆盖全球99%行业专题研究核心/线程主频支持系统主要应用场景HYCON7000线程GHz多种服务器操作系统大规模AI训练、数据中心应用、虚拟化环境、数据库、高性能计算(HPC)、AI推理HYCON5000线程2.8GHz主流服务器操作系统云计算、企业应用、虚拟化、数据库、办公、文件服务、一般AI推理任务HYCON3000程2.5GHz桌面及轻量级服务器操作系统桌面办公、轻量级服务器、开发测试、中小规模AI推理量NVMe设备NVMe设备过33%,硕士及以上学历占比超过25%,并汇聚多名国统,实现深度AI训练和推理任务的高效执行。这些服务器支持国产AI框架DeepSeek,实现CPU与AI算力平台深度耦合,使CPU在AI调度、任高性能服务器飞腾腾珑E2000~单核、双核、四核设计,主频约1.0~片实现高性能计算、AI推理及业务流程智能化控制高密度集成计算核心(包括国产CPU及AI加速卡)和高速互联技行业专题研究栈算力服务。业务零数据丢失和高可靠性运行。FlashNexus9000全5G通信、电力数据管理等场景中,实现毫秒级控、系统集成与协同调度能力、存储高性能与可靠性以及绿色高效运行四FlashNexus9000通过超级隧道技术和全互联矩阵设超算中心、政务智算中心和行业云平台,为AI、大数据和云计算应用提供设施中的快速增长和自主可控化趋势。在中国大陆及海外市场提供软件与硬件一体大型私有云基础设施的高可靠性和高性能运行。在AI算力方面,深信服在2025年发布了AI应用创新平台和A型和自融合学习算法,实现低门槛应用效果调优和持续优化历
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年消防员专业技能考核试卷(附答案)
- 2026年造价工程师考试《园林工程预算》专项训练试卷
- 2026宁波财务面试题库及答案
- 2026培训新员工面试题及答案
- 2026期货营销面试题目及答案
- 2026青蛙王子面试题目及答案
- 2026人口均衡面试题及答案
- 2026软件测试师面试题及答案
- 2026扇贝产品运营面试题及答案
- 2026射频工程师面试题及答案
- 【中考真卷】台湾省2026年初中物理学业水平考试(含答案)
- 2026年高考生物真题云南卷含答案
- 2026云南红河发展集团有限公司第一次社会集中招聘26人考试模拟试题及答案详解
- 2026年辽宁锦州文旅(集团)有限公司计划招录15人备考题库及完整答案详解一套
- 焊工理论考试题及答案2026年
- 2026年氢能行业深度分析报告
- 2025江西上饶市属国有企业第一批次招聘105人笔试历年参考题库附带答案详解
- 中国儿童青少年近视防控循证指南(2026年)
- 精细化工生产线项目运营管理方案
- 2026年青岛中考物理考试试题及答案
- 2026储能系统集成商竞争策略与市场份额报告
评论
0/150
提交评论