算力价格跟踪及市场洞察:AI浪潮下的供需博弈与未来走向_第1页
算力价格跟踪及市场洞察:AI浪潮下的供需博弈与未来走向_第2页
算力价格跟踪及市场洞察:AI浪潮下的供需博弈与未来走向_第3页
算力价格跟踪及市场洞察:AI浪潮下的供需博弈与未来走向_第4页
算力价格跟踪及市场洞察:AI浪潮下的供需博弈与未来走向_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

算力已成为AI时代的核心生产力,算力价格影响产业发展2023年ChatGPT的兴起引发了全球范围内的AI大模型热潮,中国企业也纷纷加入这场技术竞赛,预计2026年中国智能算力市场规模达到4080EFlops,相比2023年复合增长率高达36.2%;算力、算法、数据成为AI应用的三大核心要素,在训练和推理场景中,算力硬件成本占比均超过了50%;且随着大模型应用场景的拓宽,AI推理需求成为驱动算力增长的核心引擎,算力成本最高占比将近65%,算力价格不仅决定AI项目落地成本,也牵动芯片、云等多条产业链。450040003500300025002000150010005000中国智能算力市场规模及预测(EFlops,FP16)4080CAGRCAGR:36.2%3175226014508702023年2024年2025年E2026年E2027年E算力算力数据算法AI数据算法AI应用核心要素50%65%15%20%15%5%15%5%5%5%资料来源:公开资料,科智咨询整理22••A系列:A100/A800经历了价格高涨到趋于平稳的过程,A100作为初始算力市场的主力,供给严重不足,加上出口管制的影响,短期内急剧放大了,导致价格短期内暴涨;在经历了H系列等更先进的芯片成为市场新宠、芯片封装工艺提升、有效产能和供给增加,降低了对A系列的需求压力,价格降幅最大•H系列:H100需求旺盛,但产能成为核心瓶颈,导致供给严重短缺,价格高企;后期后期针对中国的H100、H800被禁后,短期内对H20需求增长,但整体需求和价格走势相对低迷,•消费级显卡:随着市场和需求平复,2024年上半年价格开始回落。后因RTX5090新一代产品的出现,4090价格整体走低,逐渐趋于平稳;•国产芯片:价格走势平稳,以昇腾910B为例,2023年下半年,该芯片单价维持在7-8万元区间,昇腾910B在特定场景下的性价比优势逐渐显现,在政务云、国有企业等市场中份额稳步提升。2825221916131072825221916131072023年6月2023年12月2024年6月H8002024年12月H202025年6月2025年10月H100111099882022年12月2023年6月2023年12月2024年6月2024年12月2025年6月2025年10月A100A80091088642023年6月2023年12月2024年6月2024年12月1088642023年6月2023年12月2024年6月2024年12月昇腾910B2025年6月2025年10月210.90.8502022年12月2023年6月2023年12月2024年6月2024年12月2025年6月2025年10月RTX4090●●资料来源:公开资料,科智咨询整理332022年10月2023年6月2023年12月2024年6月2024年12月2025年6月2025年10月H100H800H2018161412108642855•A系列:2022年底至2023年初,AI模型训练需求激增,推动A100/A800租赁价格高涨。2023年下半年后,企业转向更高效的H系列或云服务,需求减少,价格下降。2025年,AI推理需求增长,但更倾向于低成本GPU,A系列需求进一步萎缩;•H系列:大语言模型(LLM)训练需求爆发,推动H100价格高涨,后期需求从训练转向推理,H系列需求增长放缓;•消费级显卡:以RTX4090为例,AI推理需求增长,推动了价格高涨,随着消费级GPU需求稳定,以及新一代产品推出,租赁市场竞争加剧,价格下降;•国产芯片:2024年,中国AI公司在美国制裁下转向国产GPU,需求爆发,推高价格;2025年,华为推出新一代昇腾芯片,且AI模型训练需求增长放缓,价格下降。13131211109876322022年12月2023年6月2023年12月2024年6月2024年12月2025年6月2025年10月A100A8006●●544●7●●3●12024年6月2024年12月2025年6月2025年10月昇腾910B21.50.981.50.981''0.750.650.650.60.502023年6月2023年12月2024年6月2024年12月2025年6月2025年10月RTX409014资料来源:公开资料,科智咨询整理4算力租赁价格跟踪2:GPU云服务器算力成本下降,AI技术落地成本降低2023年至2025年10月间,主流GPU云服务器租赁价格整体下降,以H100为例,其租赁价格从2023年初接至2025年中,跌幅超过50%,主要由于供需关系的根本性转变,训练需求阶段性饱和以及新芯片上市带来的替代效应;随着NVIDIA自身产能提升、新一代芯片上市,以及华为、寒武纪等竞争者涌入市场,供给大幅增加。同时,企业AI投入趋于理性,需求从“疯狂囤货”转向“按需使用”,价格理性回归。28242016242016127754543.843.33.843.302023年6月2023年12月2024年6月2024年12月2025年6月2025年10月A100A800H100H800H20RTX4090异腾910B2资料来源:公开资料,科智咨询整理100%80%60%40%20%0%28%30%33%35%28%30%33%42%59%72%70%67%65%72%70%67%58%41%2022202320242025E2026E2027E随着大模型在千行百业和具体场景的落地应用需求增加,推理侧算力需求增加:AI的商业价值最终体现在大规模落地应用上,这意味着海量的用户每一次调用模型(如与AI对话、生成图片、智能推荐)都会产生持续的推理算力消耗,改变了算力资源的消耗模型,使其从项目制资源转变为如同“水电煤”一样的基础设施性n国产算力卡崛起打破垄断,是市场多元与价格加了市场有效供给,更通过引入良性竞争,有效平抑了因供需n随着AI应用大规模落地,推理需求已占主导,推理多元模式满足了差异化需求,减少了资源闲置,从宏观上优化资料来源:公开资料,科智咨询整理66B200A800A100RTX4090算力:2250(FPB200A800A100RTX4090算力:2250(FP16)算力:312(FP16)场景:推理算力:312(FP16)场景:推理算力:330(FP16)场景:推理算力:312(FP16)场景:推理2023年11月2025年9月2022年3月2023年3月2023年11月2023年11月2025年9月2022年3月2023年3月●●2022年10月●●2022年10月2020年5月2022年11月2025年3月2024年3月2020年5月2022年11月2025年3月H100H800H200算力:419(FP16)场景:推理算力:989(H100H800H200算力:419(FP16)场景:推理算力:989(FP16)RTX5090算力:148(FP16)算力:148(FP16)算力:989(FP16)算力:989(FP16)H100的FP16Tensor算力为989,B200的H100的FP16Tensor算力为989,B200的FP16/BF16算力为2250,算力提升了约1.28倍,降低了单位算力成本;B200的每token能耗相比H100降低了约4.6倍,B200能够以更低的能耗完成相同的计算量,有效降低了单位算力成本。B200的FP8能效比约为8.3TFLOPS/W,能效比提升约45%,降低了电力成本,进而降低了单位算力成本;7资料来源:公开资料,科智咨询整理7国产算力其他算力9.0%9.0%1.0%90.0%英伟达其他算力1.0%国产算力40.0%国产算力英伟达59.0%英伟达产品型号FP16算力(TFLOPS)产品优势华为昇腾910B376FP16算力超A100,达芬奇架构能效寒武纪MLU59031515%-25%壁仞BR100512沐曦曦云C500280CUDA兼容率95%,成本为A100的80%nn随着国产化进程推进,国产GPU在国内市场的渗透率显著提升,预计2025年国产GPU整体市场份额达40%,其中头部企业(华为、壁仞、摩尔线程等)可贡献超80%的国产份额;n国产GPU在算力指标上不断突破,与国际主流产品的差距逐渐缩小,凭借高性价比为市场注入活力,助力算力供给市场形成,进而稳定价格;nn“2025年人工智能产业及赋能新型工业化创新任务揭榜挂帅申报指南”指出,预期目标是到2027年,大模型训练芯片覆盖主流模型框架,适配90%以上大模型,支持混合精度计算、低精度训练等技术,半精度浮点数算力性能达到国际先进训练芯片90%以上。n软件生态建设取得积极进展。多家国产芯片企业通过兼容CUDA生态、自研编程框架等不同路径,努力降低用户迁移成本。生态差距的缩小为国产算力规模应用创造了条件。8资料来源:公开资料,科智咨询整理8n未来算力市场价格可能呈现更为复杂的走势。一方面,AI训练侧的高端芯片价格可能因技术迭代而持续下降。另一方面,推理侧芯片价格则可能随着应用场

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论