计算机行业研究:再谈CPU涨价能持续多久_第1页
计算机行业研究:再谈CPU涨价能持续多久_第2页
计算机行业研究:再谈CPU涨价能持续多久_第3页
计算机行业研究:再谈CPU涨价能持续多久_第4页
计算机行业研究:再谈CPU涨价能持续多久_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容目录一、CPU以回心位? 4大辑示Agent对CPU的性求 4Agent生扩引爆CPU能颈,CPU现价潮 4二、CPUTAM容,CPU/GPU署例升 6CPUTAM倍修预到2030年TAM超1000亿元 6CPU与GPU配有提至1:1甚更多 7三、有CPU构受,ARM中变更著 11ARM构功、核心度特更合Agent作载 11ARM放态契大厂求,NVGrace跑通 12四、AgenticAI动CPU重构全厂开新轮架升级 14外:x86与ARM线竞,能能与构协全升级 14国内自架加突破产CPU向化替代 17五、关的 20风险示 21图表目录图表1:KVCache卸使得KVCache能从限的存传到大且价更的储 4图表2:未来5全跃Agent数将现式增长 5图表3:大数Agentic工作载景,CPU到端迟比著于5图表4:五代性Agent工负中任延分布 5图表5:五代性Agent工负中任延分布 6图表6:Meta布署GravitonCPU足AgenticAI需求 6图表7:CPU入长将在2028前过GPU和XPU增长 7图表8:大的理负载致CPU7图表9:对CPU担、代、度需持提升 7图表10:数中心CPU核心将续升 8图表11:NVIDIADGXH100(640GB)/H200(1,128GB)系组描述 9图表12:DGXH100/200系统扑构 9图表13:GB200NVL72规格 10图表14:英达的GraceCPU连接 10图表15:通过NVLink接的GraceHopper超片进内访问 10图表16:英达VeraRubinNVL72机系统CPU与GPU载例为1:2 11图表17:VeraRubinNVLinkC2C架图 11图表18:x86及ARM特性比 11图表19:2029年于ARM架的CPU望据制AIASIC服器机CPU市场90的额 12图表20:数中的力消持大增加 12图表21:GraceCPU形分中效高3倍 13图表22:GraceCPU据分中效高2.1倍 13图表23:AWSGravitonCPU 13图表24:微软Cobalt200布图 14图表25:Xeon6+E核架构 14图表26:Xeon6+为款18A数心CPU 14图表27:频下Intel18A较Intel3耗低36%-38% 15图表28:EPYC9005续领x86构务器CPU能准 15图表29:六代EPYC性再飞跃 16图表30:ArmAGICPU规格况 16图表31:Arm商模从IP授拓为IP授权计算系(CSS)权+自研片 17图表32:鹏920参数 17图表33:光CPU持续代级最第代处器过术实核4线并发 18图表34:知电三产品绍 18图表35:知子TF7000列性核处芯片数示 18图表36:腾云S5000C系参介绍 19图表37:腾云S2500参介绍 19图表38:芯自指系统LoongArch 19图表39:芯3C6000包括、SD个本 19图表40:内外流务器CPU参对比 20一、CPU何以重回核心地位?月们布 《CPU价持多?率揭示Agent对CPU的性求及CPU需失全爆发去4月,CPU辑持得强化Arm头厂大修服器CPUTAM,MetaAWS大加码CPU署需侧续AMD库趋交拉并续价景气不提同新一代VeraRuBinAI系中CPU/GPU配持抬,CPU正辅角重回到AI统心。AgentCPUChatbotAgentAgentGPUCPU我们认为,AgentChatbotAgentMulti-AgentOSGPUCPUAgentokenCPUCPUKVCacheCPUKVCacheTransformer8TokenKVCacheGBKVCacheCPUSSDHBMCPUGPUGPUHBMKVCacheCPUCPUCPUAgentCPUAgentCPU图表1:KVCache卸载使得KVCache能够从有限的GPU内存中传输到更大且性价比更高的存储Nvidia官网Agent生态扩张引爆CPU性能瓶颈,CPU现涨价潮Agent生态正发生指数级扩张。据IDC预计,活跃Agent的数量将从2025年的约2860万,快速攀升至2030年的22.1620254402030415Agent20250.00052030152,6673418%。图表2:未来5年全球活跃Agent数据将呈现爆发式增长IDC咨询微信公众号Agent工作负载驱动CPUIntelACPU-CENTRICPERSPECTIVEONAGENTICAI主流AgentCPUHaystackRAG0.8-1.1ENNS6.0-8.0AgenticCPU进行调度,Agent数量暴增将急剧推高CPU图表3:大多数Agentic工作负载场景下,CPU端到端延迟占比显著高于GPUACPU-CentricPerspectiveonAgenticAI》,RitikRaj,HongWang,TusharKrishnaBatchSize增加,不同AgenticLangchainBatchSize642.9BatchSize1286.3LLM2.63.9CPU图表4:五大代表性Agent工作负载中的任务延迟分布ACPU-CentricPerspectiveonAgenticAI》,RitikRaj,HongWang,TusharKrishnaAgentCPULangChain工作负载下,当BatchSize1128,系统38.186.7BatchSizeBatch时,PUUBchSie8CU7l7Jous44%CPU图表5:五大代表性Agent工作负载中的任务延迟分布ACPU-CentricPerspectiveonAgenticAI》,RitikRaj,HongWang,TusharKrishnaAI基础设施布局开始向CPU2026217Grace2027CPU24进一步与GravitonCPUAgenticAICPU49XeonCPUAIMetaGraceCPUCPUCPU正重回AI图表6:Meta宣布将部署GravitonCPU以满足AgenticAI需求Meta官网CPU2510TrendForce13RaptorLake14RaptorLakeRefresh10%261WccftechCPUCPU集成AMDCPU价26325AMD34月起上调全系列CPU1-28-126AI,AIAMDCPUCPU二、CPUTAM扩容,CPU/GPU部署比例抬升CPUTAM2030年TAM1000亿美元CPUTAMAMD/ARM2030CPUTAM10001)AMDFY26Q1AMDCEOAICPU352030CPUTAM1200CPUARMFY26Q4AGICPU1020AIAgent4CPU20301000CPUASPFuturum2028GPUXPU图表7:CPU收入增长率将在2028年前超过GPU和XPU的增长FuturumCPUGPU1:1AgenticCPU1:2/1:1Intel、ADMARMCPUCPU1)FY26Q1ADMCEOCPUGPU1:41:1CPUGPU2)FY26Q1CEOCPUCPUGPU1:1AICPUGPUCPU3)ARMFY26Q4CPUGPU3000CPUAgenticAICPU1.24CPUARMCPU4ARMAGICPU36kWGPU7:1,CPU。图表8:大量的代理工作负导致CPU过载 图表9:对CPU承担编排、代理调度的需求持续提升ARMCEOkeynote ARMCEOkeynote图表10:数据中心CPU核心数将持续攀升SemiAnalysisAMD,CPU1)CPUTAM2)AICPUCPUGPUIONVIDIAGraceGPUCPU(KVCache)CPUGPU1CPU24GPUNVVeraRubin1VeraCPU2AICPUNVIDIAVeraCPUNV机柜CPUGPU1HX双路U带8配比1:8或12GB30NVL7272NVIDIABlackwellUltraGPU36ARMNVIDIAGraceCPU1:2。3)VeraRubinNVL7272RubinGPU36VeraCPU,1:2VeraCPUAgentCPU:GPUDGXH100/H200DGXH100/H200CPUGPUPCIe1)x86CPU2颗Ineleonlatnum480CP5611,8NVIDIAH100/H200GPU,CPUGPU1:42)(PCIeSwitchesNVIDIADGXH100PCIeGen5SwitchCPUGPUPCIeGPUPCIeSwitchCPUCPUGPUPCIeGen5x163):PCIeGen5x16128GB/sGPUNVLink900GB/sGPU-to-GPUGPUGPUCPU-GPUPCIe2TBDDR580GBHBM3H200141GBHBM3e4.8TB/s。NVIDIA官网图表12:DGXH100/200系统拓扑结构NVIDIA官网GB200/300NVL72:NVLink-C2CCPU-GPUPCIecache-coherentCPU/GPU1:2HGXGPUPCIeGen5GPUGPUCPUIOGPUAIBlackwellNVIDIAGB300NVL72NVLink-C2CCPU-GPU1)NVIDIAGB300NVL7236ARMGraceCPU(72ArmNeoverseV2)72BlackwellUltraGPU1:2CPU/GPU2)CPUGPUNVLink-C2C900GB/sPCIeGen5x1673)GB200GPU372GBHBM3eCPU480GBLPDDR5X,GPUNVLink-C2CGraceCPULPDDR5XAgenticAI(Test-TimeScaling)NVIDIA官网图表14:英伟达的GraceCPU连接 图表15:通过NVLink连接的GraceHopper超级芯片行内存访问 Semianalysis NVDIAVeraRubinrack-scaleAIfactoryGPUCPUAgenticAIVeraRubinNVL72Blackwell72RubinGPU36VeraCPU(88/176ARMNVIDIAOlympus)CPU:GPU=1:2GPUCPUAgentNVDIA引入VraCU(eraCURac256颗eraCPUAgentrolloutCPUGPUPU2NLi-C2C1.8TB/s。3)VeraRubinGPU576GBHBM4,CPU1.5TBLPDDR5X。图表16:英伟达VeraRubinNVL72机架系统CPU与GPU搭载比例为1:2NVIDIA图表17:VeraRubinNVLinkC2C架构图Semianalysis三、所有CPU架构均受益,ARM中期变化更显著ARMAgent工作负载x86ARMAgent(APIPythonCache)ARMNVIDIAVera88/176特性 x86特性 x86架构 ARM架构指令集类型复杂指令集(CISC)精简指令集(RISC)解码复杂度高,需要微码翻译低,直接执行性能表现单线程性能方面表现出色,善于处理大规模的计算任务和数据处理需求,多用于高性能计算单核性能相对较弱,密集型任务中表现稍差功耗表现功耗较高,部分服务器CPU功耗00W,需较强散热支持,产生高额的电费支出与运营成本更低功耗、更高性能效率,能效比相比传统服务器提升50以上,适合大规模部署的云计算、边缘计算等场景,适合高密度部署核心扩展能力多核扩展受功耗和散热限制,通常单路服务器CPU核心数较少,且高核数下功耗和成本显著增加多核并行和扩展能力强,适用于核心密度较高的环境,通过横向扩展提升算力生态兼容性软件生态覆盖90以上商用场景,主流数据库管理系统主流Linux系统支持较好,部分传统闭源软件需重新编译或适配,(MySQL、PostgreSQL、SQLServer)都在x86架构上得到全面优化和支持逐步配 owsonARM定制化能力定制化能力较弱,厂商难以根据自身特定需求进行深度定制化开发厂商可根据自身需求定制,满足特定应用场景的优化需求服务器领域占据传统服务器主流,生态成熟单核面积小,功耗比领先,可“堆核”提升性能代表产品英特尔至强(Xeon)系列、AMD霄龙(EPYC)系列AWSGraviton系列、英伟达Grace、鲲鹏920CSDN,SEMICONDUCTORENGINEERINGARMARMFY26Q4TPU2030CPUArm。Counterpoint2029ARMCPUAIASICCPU90x86RISC-V10。图表19:2029年基于ARM架构的CPU有望占据定制AIASIC服务器主机CPU市场90的份额CounterpointAgentIEA,2025AI2025950TWh2)ITAFCOM,202527kWUPS3):AgenticAIToken20-30CPU图表20:数据中心的电力消耗持续大幅增加IEAARMNVGrace率先跑通ARM86Intel/AMDIPARMCSPCPUTCO。GraceCPU1)NVIDIAGraceCPUx86CPU2.432.122)CPU在200W耗限下保过90性能下可持80性能进在率限环境图表21:GraceCPU在图形分析能效提高3倍 图表22:GraceCPU在数据分析能效提高2.1倍 NVIDIA官网 NVIDIA官网AWSGraviton5:AWSCPUGraviton5202512192NeoverseV33nm1720CPU,AWSGravitonCPUTrainium3GravitonCPU1CPU4XPU,Graviton4Trainium3Graviton5图表23:AWSGravitonCPUSemianalysisCobalt200:Cobalt2002025128132NeoverseV33MBL2ARMNeoverseCMNS33nm(computediesCobalt200AzureCPUAIMaia200GraniteRapidsCPU。图表24:微软Cobalt200布局图Semianalysis四、AgenticAI驱动CPU重构,全球厂商开启新一轮架构升级海外:x86与ARMIntel:x86Xeon6Chiplets12Intel18A3Intel32Intel7I/O122.5D64DarkmontE2886SierraForest1.9238:1图表25:Xeon6+E能效核架构 图表26:Xeon6+为首款18A数中心CPUIntel IntelXeon6+18AXeon6E(Clearwater2026H1P(Diamond2027Intel18AIntel18Ax86CPUx86Intel336%-38%RibbonFET通过PowerVia40%30%15%20%图表27:同频率下Intel18A较Intel3功耗降低36%-38%DonanimHaberADEPC5AcAIADUPC5Zen5架构相比上一代Zen416%IPCEPYC9965Zen5cZen519238412DDR5-6400内存128PCIe5.0EPYC9965CPUCPUAMD996566%AI70%93%LLM推理IntelXeon6980P,EPYC9965Llama3.18833%、6B中汇28%Llama3.21B36%。图表28:EPYC9005持续引领x86架构服务器CPU性能标准Tom'sHardwareEPYC50%+CPUAMD2026H2代服务器PEPCicmnnc256270%本和AICPUCEO26Q1上表示,相较市场上其他x86Arm2EPYC,50%图表29:第六代EPYCVenice性能再度飞跃WccftechArm:AGICPUAgenticAIArmAGICPU136个NeoverseV36GB/sDDR5-8800100ns27236kW308,160AISupermicro336ArmAGI45,000个。图表30:ArmAGICPU规格情况ARM官网ArmAGICPU的核心密度优势实质为结构性TCOArmAGICPU300WTDP1360.45个核心,相比之下AMD192核EPYC0.38144核Xeon0.2930–40%ArmArmAGICPUx86100快科技CPU920是目前业界领先的ARM-based7nm制造工艺,基于ARMSPECintBenchmark25%30%920图表32:鲲鹏920核心参数华为海思x86CPUx8670005000系3000SoC70016-32128路PCle个DDR42016AMD授权技术启动x86架构海光C86-1GCPUC86-4GCPU20255月发布C86-5G12851214(IPC)17%图表33:海光CPU架构持续迭代升级,最新第五代处理器将通过SMT-4技术实现单核4线程并发半导纵横ARMCPU先机,TF9000202582.542.3317.05%ARMTF1600020261TF9000Armv9Grace系列,相较第二代产品TF700030%PCIe5.0200%100%TF7000TF9000GPU图表34:熠知电子三代产品介绍产品类型CPU架构NPU架构产品特征应用场景9000系列融合处理器及板卡ARMV9TFMXCPU+NPU一体化等AI智算领域。是一款具有高性能、超高性价比的算力芯片。互联网,大模型一体机,工厂智能化等7000系列融合处理器及板卡ARMV8.2TFACC2.0内置多个处理器核心,集成通用的高性能外设接口,拥有完善的软硬件生态环境和完备的系统安全机制,适用于数据计算和事务处理等通用型应用。AI、云计算、物联网、信息服务等异构AI处理器及硬件ARMV8TFACC1.0依托标的公司自研的高性能ManyCoreTM深度学习运算加速引擎和高性能CPU,能够以优异的功耗表现从容应对复杂的运算任务。视觉AI,边缘计算图表35:熠知电子TF7000系列高性能核心处理器芯片参数展示公司官网S5000C-E202512ARMCPU28.04%S系列服务器CPU,已包括S2500、S5000C、S5000C-ES5000C-ECPU80S5000C-6450%2025S5000C-E(80核)DeepSeekAICPUARMv8202512S5000C-MCPU2025-20265G8000CPU5G20264S5000C、S5000C-E图表36:飞腾腾云S5000C系列数介绍 图表37:飞腾腾云S2500参数介绍公官网 公官网3C50003D50003C60003C6000LoongArch1282563C5000NVLinkCPU500台服务器全部采用龙芯3C6000/D服务器芯片。据龙芯中科董事长胡伟武在25&26Q1CPU2000-3000323C6000/D2025年应LoongArchX86与ARM体CPU2020CPU产品2023月CPUIPCPUIP43C6000/D(64核TPC-C100LoongArch图表38:龙芯自主指令系统LoongArch 图表39:龙芯3C6000包括、S、D三个版本公官网 公官网CPU海IntelXeon7DiamondRapids512AMDEPYC2nmNVIDIACPUArmAGICPUCPUAgenticAI2)C86-5GS5000C-E50%3C6000产服务器CPUCPU图表40:海内外主流服务器CPU参数对比架构厂商CPU型号制程核心数线程数内存PCIe通道数TDPx86IntelXeon6+Clea

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论