版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《2026年中国AI算力产业链月报:芯片、云、租赁与推理需求》版本:2026年6月号|发布日期:2026年6月4日声明:本报告基于公开信息、行业数据与趋势研判编制,仅供决策参考,不构成投资建议。报告中涉及的市场规模、芯片性能、租赁价格等均为行业估算或公开披露信息,不同统计口径可能存在偏差。0.封面文案本月AI算力产业链核心判断:行业从"训练为王"全面转向"推理主导",国产芯片迎来结构性机遇Token调用量两年增长超千倍,H100租赁价格半年涨近40%,算力荒倒逼国产替代加速阿里云、腾讯云、百度云集体涨价,昇腾/寒武纪/海光Q1集体爆发,超节点架构重塑竞争格局适合:硬件厂商、云服务商、算力投资人、产业研究者1.算力市场总览1.1本月一句话结论AI算力产业链正经历从"训练驱动"向"推理主导"的结构性转变,Token调用量井喷导致算力供需缺口急剧扩大,H100租赁价格半年涨近40%,云厂商集体涨价,国产芯片(昇腾、寒武纪、海光)凭借推理场景适配优势和超节点架构迎来历史性替代窗口。1.2本月五大关键发现市场规模持续高增。2025年中国AI算力集群市场规模达454亿元,预计2026年突破714亿元,同比增长57%。其中集群服务市场495亿元,集群产品市场219亿元。算力供需缺口急剧扩大。2024年初中国日均Token调用量1000亿,2025年底跃升至100万亿,2026年3月突破140万亿,两年增长超千倍。Token井喷直接导致算力荒,头部云厂商及模型厂商均公开提及算力资源紧缺。租赁价格进入卖方市场。H100一年期GPU租赁合同价格从2025年10月低点1.70美元/小时/GPU飙升至2026年3月的2.35美元/小时/GPU,涨幅近40%。阿里云、腾讯云、百度云2026年Q1-Q2连续涨价。国产芯片集体爆发。2026年Q1,寒武纪营收28.85亿元(同比+159.56%),海光信息营收40.34亿元(同比+68.06%),摩尔线程营收7.38亿元(同比+155%)并首次实现季度盈利。华为昇腾累计出货超81万片,建成多个万卡级集群。超节点架构成为国产算力差异化竞争核心。华为AtlasSuperPoD系列从384卡(A3)演进至8192卡(A5,2026年)和15488卡(A6,2027年),内存容量为NVL144的15倍,推理场景性价比优势显著。1.3下月最值得关注的三件事昇腾950系列大规模量产交付进度及客户反馈云厂商涨价后的客户流失率与国产算力替代节奏推理算力需求持续爆发后,液冷散热和电力配套瓶颈是否显现2.供需变化与价格走势2.1现象描述2026年Q1-Q2,中国AI算力市场呈现"需求井喷、供给紧张、价格普涨"的卖方市场特征:需求端:Token调用量两年增长超千倍。国家数据局局长刘烈宏在2026年3月中国发展高层论坛透露,2024年初中国日均Token调用量1000亿,2025年底跃升至100万亿,2026年3月突破140万亿。推理需求超越训练需求。IDC预计到2028年,推理工作负载占比将达到73%。2026年AI推理计算需求已达训练需求的4-5倍。智能体和多模态应用爆发。Agent应用、AI视频生成、实时语音交互等场景对低延迟推理算力的需求急剧增加。供给端:英伟达高端卡受禁售影响,H100/H200国内供应紧张。H100一年期租赁合约现货市场流动性几近枯竭。国产算力集中交付但总量仍不足。2025年中国AI加速卡总交付量约400万片,其中国产厂商交付165万片(占比41%),但高端推理卡仍存缺口。大厂自建产能释放有限。阿里云、腾讯云等虽加大资本开支,但建设周期导致短期供给增量受限。价格端:H100租赁价格半年涨近40%。从2025年10月低点1.70美元/小时/GPU升至2026年3月2.35美元/小时/GPU。H200涨幅更高。2026年2月末H200时租价格达7.5-8.0元/卡时,月租金6.0-6.6万元,环比涨幅25-30%。云厂商集体涨价。阿里云2026年4月一个月内三次调价,DDoS高防费用上调50%;腾讯云4月宣布AI算力、容器服务等产品价格统一上调5%;百度云智谱等厂商亦持续加价。2.2原因分析需求端驱动因素:大模型应用落地加速。从"模型训练"转向"应用推理",用户侧调用量呈指数级增长。Agent和多模态应用爆发。智能体需要持续推理能力,多模态(文本+图像+视频)生成对算力需求呈乘数效应。企业AI渗透率提升。超过78%的企业将视频化表达列为核心战略,企业端算力需求占比超50%。供给端制约因素:英伟达断供。美国出口管制导致H100/H200国内供应受限,新增采购渠道收窄。国产芯片产能爬坡。华为昇腾、寒武纪等虽加速扩产,但先进制程产能和良率仍受制约。建设周期滞后。智算中心从规划到投产通常需要12-18个月,无法快速响应需求爆发。价格端传导机制:供需失衡直接推升价格。H100现货市场"一票难求",租赁商掌握定价权。成本转嫁。云厂商上游芯片和电力成本上升,通过涨价向下游传导。预期自我强化。价格上涨预期导致客户提前锁单,进一步加剧短期供需紧张。2.3影响判断对云厂商:涨价提升短期收入,但需警惕客户流失和国产替代加速。连续涨价可能倒逼客户转向国产算力。对算力租赁商:进入高景气周期,已锁定长约的企业享受"量价齐升"红利,但需关注设备折旧和电力成本。对AI应用企业:算力成本上升压缩利润空间,中小模型厂商面临生存压力,可能加速行业集中。对国产芯片厂商:算力荒创造替代窗口,但需快速证明产品稳定性和生态成熟度,否则窗口期关闭。2.4机会与风险机会:国产算力替代加速。推理场景对单卡算力要求低于训练,国产芯片性价比优势显现。算力租赁高景气。已布局高端卡库存的租赁商享受价格上涨红利,长期合约锁定收益。液冷散热和电力配套。算力密度提升带动液冷需求,PUE优化成为刚需,英维克、高澜股份等企业受益。风险:价格泡沫风险。当前价格上涨部分由恐慌性采购驱动,若需求增速放缓或供给释放,价格可能快速回落。客户流失风险。云厂商涨价可能导致客户转向自建算力或国产替代方案,长期损害生态。电力瓶颈。智算中心电力消耗巨大,部分地区电网承载能力受限,可能制约算力扩张。2.5建议对算力需求方:优先签订中长期租赁合约锁定价格,避免按需实例的高溢价;评估国产算力替代可行性,分散供应链风险。对算力供给方:加快国产算力适配和优化,抓住替代窗口期;投资液冷和电力基础设施,提升算力密度和能效。对投资人:关注已锁定长约的算力租赁商和液冷配套企业,规避纯概念型算力项目。3.GPU/国产芯片进展3.1国际GPU市场格局3.1.1现象描述英伟达仍主导全球高性能AI芯片市场,份额超80%。但受美国出口管制影响,H100/H200国内供应紧张,价格大幅上涨。Blackwell系列芯片(B100/B200)单小时租金已达4.08美元,较两个月前上涨48%。3.1.2原因分析技术垄断:英伟达CUDA生态壁垒深厚,开发者迁移成本高。政策限制:美国对华高端芯片出口管制持续收紧,H100/H200获取渠道受限。需求刚性:大模型训练和高端推理仍依赖英伟达芯片,短期内难以完全替代。3.1.3影响判断英伟达国内市场份额将逐步下降,但高端训练和科研场景仍保持主导地位。国产芯片在推理场景率先突破,训练场景替代仍需时间。3.1.4机会与风险机会:英伟达供应受限为国产芯片创造替代空间。风险:若美国放松管制或英伟达推出合规版芯片,国产替代窗口可能收窄。3.1.5建议对国内企业:评估业务对英伟达生态的依赖度,制定分阶段替代计划。对国产芯片厂商:优先攻克推理场景,积累客户案例和生态工具链。3.2国产芯片五强进展对比3.2.1现象描述2026年Q1,国产AI芯片厂商集体迎来业绩爆发:厂商2026年Q1营收同比增速关键进展华为昇腾——累计出货超81万片,950PR量产交付,多个万卡集群部署寒武纪28.85亿元+159.56%思元590/690系列支持FP8,获互联网巨头批量采购海光信息40.34亿元+68.06%深算三号支持FP8,兼容x86生态,性能接近A100的80%摩尔线程7.38亿元+155%首次实现季度盈利,MTTS5000支持FP8沐曦5.62亿元+75%亏损环比收窄76%,曦云C600对标国际旗舰3.2.2原因分析政策驱动:国产替代政策持续加码,政务、运营商、金融等关键行业优先采购国产芯片。技术突破:国产芯片性能快速提升,昇腾950PR推理性能达H100的287%(INT8吞吐量),寒武纪思元590对标H100。生态改善:DeepSeekV4实现8家国产芯片Day0适配,打破了"只有英伟达能做到"的局面。产能释放:摩尔线程、沐曦等IPO后加速扩产,2026年产能预计突破瓶颈。3.2.3影响判断对国产芯片行业:从"可用"向"好用"跨越,商业化拐点确立。对下游客户:选择国产芯片的顾虑降低,但软件生态适配仍是主要障碍。对国际竞争:国产芯片在推理场景已具备竞争力,训练场景仍需追赶。3.2.4机会与风险机会:推理场景替代节奏快于训练。推理对单卡算力要求低,但对内存容量和互联带宽敏感,国产超节点架构恰好契合。政策采购红利。政务、国企、金融等关键行业国产芯片采购比例持续提升。资本市场支持。寒武纪市值超5200亿元,天数智芯、壁仞科技登陆港交所,融资渠道畅通。风险:软件生态差距。CUDA生态成熟度仍领先,国产芯片软件栈(CANN、MLU-OPS)覆盖度不足。先进制程瓶颈。7nm及以下先进制程依赖外部代工,供应链安全风险仍在。维修生态薄弱。国产芯片MTTR(平均修复时间)2-5天,远高于英伟达的4小时。3.2.5建议对芯片厂商:优先完善软件生态和开发者工具链,降低客户迁移成本;建立快速维修响应体系,提升服务竞争力。对下游客户:从推理场景开始试点国产芯片,逐步扩展至训练场景;要求芯片厂商提供充分的适配支持和性能优化服务。对投资人:关注已实现规模化出货和盈利拐点的厂商(寒武纪、海光、摩尔线程),规避纯概念型芯片项目。3.3新兴架构:TPU与超节点3.3.1现象描述中昊芯英2026年5月发布自研TPU芯片"刹那",千卡集群可支撑超千亿参数大模型运算。TPU架构相同功耗下能效比为GPU的2.3倍。华为AtlasSuperPoD超节点系列持续演进:A3(384卡昇腾910C)→A5(2026年,8192卡昇腾950DT)→A6(2027年,15488卡昇腾960)。中科曙光发布全球首款单机柜640卡超节点scaleX640,算力密度提升20倍,大模型训练周期缩短至45天。3.3.2原因分析推理场景需求特性:推理对内存容量和互联带宽极度敏感,超节点架构通过高速互联实现大内存池化,恰好满足需求。国产芯片单卡性能差距:国产芯片单卡算力仍低于英伟达旗舰,但通过超节点架构的规模化互联,可在系统层面实现竞争力。液冷技术成熟:PUE降至1.04,支撑高密度算力长期稳定运行。3.3.3影响判断超节点架构可能成为国产算力在推理场景的核心差异化竞争力。TPU等专用架构在特定场景(如推荐系统、搜索排序)可能超越GPU。3.3.4机会与风险机会:超节点和TPU架构为国产算力提供了"换道超车"的可能。风险:专用架构的软件生态更窄,通用性不足可能限制应用场景。3.3.5建议对算力需求方:根据业务场景选择架构,推理场景优先考虑超节点和TPU,训练场景仍建议GPU。对架构厂商:平衡专用优化与通用性,避免过度特化导致生态孤岛。4.云厂商竞争格局4.1现象描述2025年中国公有云IaaS市场规模突破1200亿元,智算需求成为核心增长点。头部厂商分化明显:厂商IaaS市场份额核心战略本月关键动作阿里云26.8%AI+云全面转型一个月内三次调价,DDoS高防上调50%华为云12.9%政企+信创+昇腾生态昇腾超节点全系列支持DeepSeek-V4天翼云12.3%算网融合+政企信任智算领域高投入、高增长移动云9.4%国产化基石+云网融合ECS产品在政务、国企行业快速崛起腾讯云7.9%音视频+游戏+社交生态AI算力、容器服务价格上调5%火山引擎跃居前列线上算力能力凭借字节生态实现跳跃式增长4.2原因分析阿里云:连续五个季度份额上涨,战略全面转向"AI+云",依托百炼大模型平台和算力调度优势,在政企市场形成壁垒。未来三年投入3800亿元用于AI和云计算基础设施。华为云:凭借昇腾AI芯片、鲲鹏CPU的软硬件协同,在政企和信创市场深耕。昇腾超节点架构成为差异化竞争力。运营商云(天翼云、移动云):依托"算网融合"与政企信任,在智算领域高投入、高增长。移动云凭借国产化基石和本地化服务在政务、国企行业快速崛起。腾讯云:份额面临互联网厂商与运营商的双重挤压,需通过差异化服务(行业解决方案)突围。火山引擎:凭借字节跳动线上算力能力和抖音生态,实现跳跃式增长,成为智算时代"黑马"。4.3影响判断市场集中度提升。阿里云、华为云、运营商云合计份额超60%,中小云厂商生存空间收窄。智算成为竞争焦点。通算IaaS投资增速放缓,资本向智算产业链(GPU、AI芯片、光模块)集中。生态战争升级。全栈AI能力(IaaS+PaaS+MaaS)成为竞争关键,独立云厂商必须选边站队或深耕垂直领域。4.4机会与风险机会:智算需求爆发为云厂商带来"量价齐升"机遇。国产化生态加速,华为云、百度智能云等推动硬件供给多元化。政企市场数字化需求旺盛,运营商云凭借本地化服务优势获益。风险:价格战风险。2025年算力租赁市场曾陷入价格战,H100租赁价格从13美元/小时暴跌至5美元/小时,需警惕周期性波动。客户流失风险。涨价可能导致客户转向自建算力或竞争对手。盈利压力。国内云厂商盈利能力仍低于海外(IDC带宽成本占比高达30-40%),持续高投入可能拖累利润。4.5建议对头部云厂商:从"算力供给"向"模型+行业解决方案"升级,提升客户粘性和客单价。对中小云厂商:聚焦垂直行业(如金融、医疗、制造)或特定场景(如渲染、仿真),避免与巨头正面竞争。对企业客户:评估多云策略,分散供应商风险;优先考虑提供全栈AI能力和国产化选项的云厂商。5.推理与训练需求拆分5.1现象描述AI算力需求结构正发生根本性转变:训练需求占比下降:2023-2024年,大模型训练是算力需求主力,单次训练需数千张GPU连续运行数周。推理需求占比跃升:2026年推理计算需求已达训练需求的4-5倍。IDC预计到2028年,推理工作负载占比将达73%。需求特性差异显著:维度训练需求推理需求核心指标算力密度、显存带宽能效比、批处理吞吐、低延迟硬件偏好高端GPU(H100/H200)中端GPU、国产芯片、TPU使用模式集中式、长时间分布式、高并发、实时性成本敏感度低(研发预算)高(运营成本)国产替代难度高(生态依赖深)低(场景适配易)5.2原因分析大模型训练进入相对稳定期。头部模型(GPT-4、DeepSeek-V4)已发布,训练需求从"探索性训练"转向"迭代优化",单次训练规模增长放缓。应用落地爆发。ChatBot、Agent、AI搜索、AI视频生成等应用用户量激增,推理调用量呈指数级增长。模型效率提升。模型压缩、量化、蒸馏等技术降低单次推理算力消耗,但调用量增长远超效率提升,总需求仍大幅上升。实时交互场景增多。语音对话、实时翻译、直播互动等场景对低延迟推理的需求,推动推理算力基础设施升级。5.3影响判断对芯片厂商:推理需求特性(低延迟、高并发、成本敏感)更适合国产芯片和专用架构,国产替代节奏在推理端显著快于训练端。对云厂商:推理算力需要分布式部署和弹性调度,推动边缘计算和CDN升级。对算力租赁商:推理需求的高并发特性要求更灵活的租赁模式(按Token计费、按QPS计费),传统按卡时计费模式面临变革。对AI应用企业:推理成本成为主要运营成本,优化推理效率(模型量化、缓存机制、批处理)成为核心竞争力。5.4机会与风险机会:推理算力市场增速高于训练,为国产芯片和专用架构提供更大替代空间。推理优化技术(量化、剪枝、蒸馏、speculativedecoding)成为新赛道。边缘推理需求增长,推动端侧AI芯片和边缘计算基础设施发展。风险:推理需求波动大,高峰期算力不足(如Kimi频繁出现"高峰期算力不足"提示),低谷期资源闲置。推理价格战可能重演。若推理算力供给快速释放,价格可能快速下降。5.5建议对芯片厂商:优先优化推理性能(INT8/FP8量化吞吐、低延迟响应),针对推荐系统、搜索排序、对话生成等高频场景定制优化。对云厂商:建设弹性推理基础设施,支持自动扩缩容;探索按Token/QPS计费新模式。对AI应用企业:投资推理优化技术,降低单位Token成本;建立缓存和预计算机制,减少重复推理。6.算力租赁与交易模式6.1现象描述2026年算力租赁市场呈现"高端紧缺、中低端过剩、国产现货化"的分化格局:高端算力(H100/H200/昇腾910B/C):供应紧张,价格坚挺。H100一年期租赁价格半年涨近40%,现货市场流动性枯竭。主要用于大模型训练、高端推理、科研计算。2026年市场规模约1400亿元。中低端算力(A100/A20/阉割版H20/部分国产芯片):出现过剩,价格难涨。A10080G八卡裸金属月费维持28,000元,H100八卡裸金属75,000元。主要用于通用推理、中小模型训练、图形渲染。2026年市场规模约900亿元。国产算力:从"PPT"走向"现货"。华为昇腾910B64GB八卡裸金属月费25,000元,ILuvatarBI-V150云容器时租2元。信创项目不再"无卡可用",但软件生态适配仍需时间。交易模式变化:裸金属直租成为主力交付形态,超售问题在核心用户群中已近透明。RTX4090从消费卡进化为AI推理主力,时租1.50元、包月1,026元,成为默认启动配置。算力交易平台兴起,支持算力资源的灵活调度和按需分配。6.2原因分析高端紧缺:英伟达禁售导致供给受限,训练需求和大模型推理需求集中释放。中低端过剩:国产算力集中交付、大厂自建产能释放,但通用推理需求增长不及预期。国产现货化:政策推动+产能爬坡,国产芯片从"期货"变为"现货",但客户接受度仍需培育。交易模式进化:客户从"购买硬件"转向"租赁算力",降低CAPEX,提升灵活性。6.3影响判断对算力租赁商:高端卡库存成为核心资产,已锁定长约的企业享受"量价齐升"红利。对算力需求方:租赁模式降低入门门槛,但长期成本可能高于自建。对国产芯片厂商:租赁模式降低了客户试用门槛,有利于国产芯片推广。6.4机会与风险机会:算力租赁进入高景气周期,已布局高端卡库存的企业业绩确定性强。算力交易平台和调度平台成为新赛道,提升资源利用效率。国产算力租赁为信创项目提供灵活选项,降低采购风险。风险:价格周期性波动。2025年曾出现价格战,需警惕供给释放后的价格回落。设备折旧风险。GPU技术迭代快,租赁商面临设备快速贬值风险。电力和运维成本。智算中心电力消耗巨大,PUE优化和运维效率直接影响利润。6.5建议对算力租赁商:优先锁定高端卡长约,分散设备折旧风险;投资液冷和电力优化,降低运营成本。对算力需求方:评估长期租赁vs自建的TCO(总拥有成本),大规模稳定需求建议自建,波动需求建议租赁。对投资人:关注已锁定长约、具备稳定采购渠道和电力资源的算力租赁商,规避纯概念型项目。7.政策与国产替代趋势7.1现象描述2026年,AI算力领域的政策与国产替代呈现以下特征:政策层面:"东数西算"工程持续推进,庆阳、乌兰察布等枢纽建设加速,央企与民企协同参与。国产替代政策加码。政务、金融、电信等关键行业国产芯片采购比例持续提升。数据安全合规要求提升,推动国产化云底座和算力基础设施建设。国产替代进展:2025年中国AI加速卡总交付量400万片,国产厂商交付165万片(占比41%),较两年前翻倍。伯恩斯坦预计:中国AI芯片国产化率将从2023年的17%飙升至2027年的55%。DeepSeekV4与华为昇腾950P全链路深度适配,成为国内首个彻底摆脱英伟达依赖的万亿级大模型。智谱GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配。7.2原因分析供应链安全:中美科技博弈下,高端芯片断供风险倒逼国产替代加速。政策引导:"东数西算"、信创工程、国产替代目录等政策为国产芯片创造市场空间。技术成熟:国产芯片性能从"可用"提升至"好用",Day0适配打破生态壁垒。成本优势:国产芯片在推理场景的性价比优势显现,客户替代动力增强。7.3影响判断对国产芯片厂商:政策红利+技术成熟+市场需求三重驱动,迎来历史性发展机遇。对国际芯片厂商:国内市场份额将逐步下降,但高端训练和科研场景仍保持主导。对下游客户:选择国产芯片的顾虑降低,但软件生态迁移和人员培训成本仍需承担。对产业链:国产芯片崛起带动上下游(封测、材料、设备、软件)协同发展。7.4机会与风险机会:国产芯片在推理场景的替代节奏快于训练,2026-2027年是关键窗口期。超节点架构和TPU等创新架构为国产算力提供差异化竞争力。政策采购红利持续,政务、国企、金融等关键行业市场空间大。风险:先进制程瓶颈。7nm及以下制程依赖外部代工,供应链安全风险仍在。软件生态差距。CUDA生态成熟度领先,国产芯片开发者工具链覆盖度不足。技术迭代风险。国际芯片厂商技术迭代速度快,国产芯片可能持续追赶。7.5建议对国产芯片厂商:优先完善软件生态和开发者工具链,降低客户迁移成本;建立快速维修响应体系。对下游客户:从推理场景开始试点国产芯片,逐步扩展至训练场景;要求芯片厂商提供充分的适配支持。对投资人:关注已实现规模化出货和盈利拐点的厂商,规避纯概念型项目。8.风险与机会8.1核心风险8.1.1需求波动风险现象:AI应用落地速度存在不确定性,若大模型应用普及不及预期,推理需求增速可能放缓。原因:当前Token调用量增长主要由ChatBot和Agent驱动,若用户新鲜感消退或应用场景受限,需求可能回落。影响:算力租赁价格可能从卖方市场快速转向买方市场,2025年价格战可能重演。建议:算力供给方保持产能弹性,避免过度投资;需求方签订灵活合约,保留调整空间。8.1.2供应链安全风险现象:国产芯片先进制程依赖外部代工,7nm及以下制程受地缘政治影响大。原因:国内先进制程产能有限,中芯国际等厂商产能爬坡缓慢。影响:若代工渠道受限,国产芯片产能扩张可能受阻,替代进程延缓。建议:芯片厂商多元化代工渠道,投资成熟制程优化和先进封装技术。8.1.3技术迭代风险现象:英伟达持续推出新一代芯片(RubinCPX、Blackwell系列),技术迭代速度快。原因:国际芯片厂商研发投入大,技术积累深厚。影响:国产芯片可能持续处于追赶状态,高端训练场景替代难度大。建议:国产芯片厂商聚焦差异化场景(推理、超节点、TPU),避免与国际巨头正面竞争。8.1.4电力与能耗瓶颈现象:智算中心电力消耗巨大,单集群功耗可达数十兆瓦,部分地区电网承载能力受限。原因:算力密度提升导致能耗急剧增加,液冷散热和电力配套成本高昂。影响:电力瓶颈可能制约算力扩张,高能耗面临碳中和政策压力。建议:优先布局电力资源充裕地区(如西部"东数西算"枢纽);投资液冷和余热回收技术,降低PUE。8.2核心机会8.2.1推理算力爆发现象:推理需求增速远超训练,2026年推理计算需求已达训练需求的4-5倍。机会:推理场景对国产芯片友好,为国产替代提供结构性机遇。建议:芯片厂商优先优化推理性能,云厂商建设弹性推理基础设施。8.2.2超节点架构差异化现象:华为AtlasSuperPoD超节点内存容量为NVL144的15倍,推理性价比优势显著。机会:超节点架构可能成为国产算力在推理场景的核心竞争力。建议:算力需求方根据业务场景评估超节点架构适用性;架构厂商平衡专用优化与通用性。8.2.3算力租赁高景气现象:H100租赁价格半年涨近40%,算力租赁进入卖方市场。机会:已锁定长约的租赁商享受"量价齐升"红利,长期盈利弹性显著。建议:投资人关注已锁定长约、具备稳定采购渠道的算力租赁商。8.2.4液冷与配套产业链现象:算力密度提升带动液冷需求,PUE优化成为刚需。机会:英维克、高澜股份等液冷方案提供商受益,PUE可降至1.04。建议:算力供给方优先采用液冷方案,降低长期运营成本。9.下月预测9.1三大趋势趋势一:昇腾950系列大规模量产交付判断依据:昇腾950PR已量产交付,950DT计划2026年推出,8192卡超节点架构即将商用。预期变化:6-7月,昇腾950系列可能在头部互联网企业和智算中心大规模部署,客户反馈将验证国产芯片在推理场景的稳定性。影响:若量产交付顺利且客户反馈积极,国产芯片替代节奏将进一步加速。趋势二:云厂商涨价后的客户流失与国产替代判断依据:阿里云、腾讯云、百度云2026年Q1-Q2连续涨价,客户成本压力增大。预期变化:6-7月,部分价格敏感型客户可能转向国产算力或自建算力,云厂商需平衡涨价与留存。影响:涨价可能倒逼国产替代加速,但云厂商短期收入仍将受益。趋势三:推理算力需求持续爆发后的配套瓶颈判断依据:Token调用量持续激增,智算中心电力消耗和散热压力增大。预期变化:6-7月,部分地区可能出现电力供应紧张或液冷设备交付延迟,制约算力扩张。影响:电力和液冷配套可能成为新的行业瓶颈,提前布局者获益。9.2两个可能变化变化一:开源模型引发推理算力价格战判断依据:DeepSeekV4等开源模型降低推理门槛,可能吸引更多玩家进入推理算力市场。预期变化:若推理算力供给快速释放,价格可能从当前高位回落。影响:算力租赁商需警惕价格周期性波动,保持成本优势。变化二:国产芯片厂商并购整合判断依据:国产芯片厂商数量多但规模小,部分厂商面临盈利压力。预期变化:2026年下半年可能出现国产芯片厂商的并购整合,提升行业集中度。影响:头部厂商市场份额提升,但创新活力可能受影响。9.3一个核心判断未来6-12个月,AI算力产业链的竞争将从"芯片性能比拼"转向"系统效率+生态成熟度+服务响应"的综合竞争。单纯依靠单卡性能优势难以持续,超节点架构、软件生态、快速维修、电力配套等系统性能力,将成为决定国产算力能否真正替代国际产品的关键。10.投资与采购建议10.1对芯片厂商建议一:聚焦推理场景,优先实现规模化出货推理场景替代节奏快于训练,是国产芯片当前最现实的突破口。建议:针对推荐系统、搜索排序、对话生成、AI视频等高频推理场景,提供开箱即用的优化方案。建议二:完善软件生态,降低客户迁移成本软件生态是国产芯片的最大短板,Day0适配仅是第一步,持续优化和开发者支持才是关键。建议:投资开发者社区、提供充分的技术文档和示例代码、建立快速响应的技术支持团队。建议三:建立快速维修体系,提升服务竞争力国产芯片MTTR2-5天,远高于英伟达的4小时,严重影响客户信心。建议:与第三方维修服务商合作,建立区域备件库,承诺SLA级别的维修响应时间。10.2对云厂商建议一:从"算力供给"向"模型+行业解决方案"升级纯算力租赁同质化严重,差异化来自行业know-how和解决方案能力。建议:针对金融、医疗、制造、教育等垂直行业,提供预训练模型+行业数据+算力的一体化服务。建议二:平衡涨价与留存,避免客户大规模流失连续涨价虽提升短期收入,但可能加速客户转向国产替代或自建算力。建议:对长期客户提供价格保护机制,通过增值服务(优化、咨询、培训)提升客单价而非单纯涨价。建议三:投资弹性推理基础设施推理需求波动大,高峰期算力不足、低谷期资源闲置。建议:建设自动扩缩容的推理集群,探索按Token/QPS计费新模式,提升资源利用效率。10.3对算力投资人建议一:关注已锁定长约的算力租赁商长约锁定收益,设备折旧后利润阶梯式增长。标的特征:稳定的采购渠道、大额融资支撑、电力资源充裕、液冷配套完善。建议二:关注液冷散热和电力配套企业算力密度提升带动液冷刚需,PUE优化成为核心竞争力。标的特征:技术领先(PUE<1.05)、与头部云厂商深度绑定、产能扩张能力强。建议三:规避纯概念型算力项目警惕以下特征:无实际客户合约、无电力和场地资源、无技术运营团队、仅靠融资扩张。建议四:关注国产芯片盈利拐点企业寒武纪、海光信息已实现盈利,摩尔线程首次季度盈利,验证商业模式可行性。标的特征:规模化出货、客户结构多元、软件生态完善、维修体系健全。10.4对算力采购方建议一:评估国产替代可行性,分散供应链风险从推理场景开始试点国产芯片,逐步扩展至训练场景。建议:要求芯片厂商提供POC(概念验证)测试,充分评估性能和稳定性后再大规模采购。建议二:签订灵活租赁合约,保留调整空间算力价格波动大,长期合约锁定价格但丧失灵活性。建议:采用"基础长约+弹性按需"的混合模式,平衡成本与灵活性。建议三:投资推理优化技术,降低单位Token成本模型量化、缓存机制、批处理优化可显著降低推理成本。建议:建立内部推理优化团队或与云厂商合作,持续优化推理效率。11.总结结论11.1核心结论行业阶段:AI算力产业链正从"训练为王"全面转向"推理主导",2026年推理计算需求已达训练需求的4-5倍,IDC预计到2028年推理工作负载占比将达73%。供需格局:Token调用量两年增长超千倍(从1000亿/日至140万亿/日),算力供需缺口急剧扩大,H100租赁价格半年涨近40%,云厂商集体涨价,行业进入卖方市场。国产替代:2025年国产AI加速卡交付165万片(占比41%),国产化率预计从2023年的17%飙升至2027年的55%。寒武纪Q1营收+159.56%、海光+68.06%、摩尔线程首次季度盈利,国产芯片商业化拐点确立。竞争格局:云厂商分化明显,阿里云26.8%领跑,华为云12.9%依托昇腾生态,运营商云凭借政企信任快速崛起。超节点架构(华为AtlasSuperPoD8192卡)成为国产算力差异化竞争力。商业模式:算力租赁进入高景气周期,裸金属直租成为主力交付形态,国产算力从"PPT"走向"现货"。已锁定长约的租赁商享受"量价齐升"红利。风险警示:需求波动、供应链安全、技术迭代、电力能耗是四大核心风险。价格泡沫、客户流
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 毛皮及毛皮制品加工工岗前工作标准化考核试卷含答案
- 电解槽计算机监控工岗前班组考核考核试卷含答案
- 特种气体生产工岗前安全意识考核试卷含答案
- 膏药剂工操作能力强化考核试卷含答案
- 聚丙烯酰胺装置操作工安全宣传水平考核试卷含答案
- 2026班级小管家面试题及答案
- 2026百盛集团运维面试题及答案
- 2026白酒企业面试题目及答案
- 2026巴斯夫安全员面试题及答案
- 高血压肾病的早期识别与护理
- 【MOOC】大学英语视听导学-湖南大学 中国大学慕课MOOC答案
- 2024年可行性研究报告投资估算及财务分析全套计算表格(含附表-带只更改标红部分-操作简单)
- 《贵州省水利水电工程系列概(估)算编制规定》(2022版 )
- AQ 2002-2018 炼铁安全规程(正式版)
- 木结构设计施工说明
- 建筑施工高处作业安全技术规范JGJ80-201620200805
- 国开2024年《兽医基础》形考任务1-4答案
- 慢性病监测与干预
- Creo-7.0基础教程-配套课件
- 2023年重庆市高考化学试卷(解析版)
- 母联失灵保护、母联死区保护的保护原理及其跳闸方式
评论
0/150
提交评论