版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
证券研究报告请务必阅读正文最后的中国银河证券股份有限公司免责声明热力学熵增定律视角看本轮“AI泡沫”演变————AI泡沫系列研究之计算机行业篇计算机行业首席分析师:吴砚靖分析师:邹文倩、胡天昊2请务必阅读正文最后的中国银河证券股份有限公2热力学熵增定律视角看本轮“AI泡沫”演变——AI泡沫系列研究之计算机行业篇2025年12月29日l当前AI资本市场呈现出一种“非理性繁荣”与“理性泡沫”交织的复杂特征。一方面,以“AI+”为核心的科技革命是确定性产业趋势,巨额资本(Capex)的持续注入既反映了全球对技术突破与未来价值的共识,也构成了泡沫的“理性”基底,即:技术迭代真实发生、应用需求切实存在、产业逻辑清晰可循;另一方面,本轮AI龙头公司英伟达估值屡创新高,产业链各环节资本开支空前高涨,从北美云厂商数千亿美元的年投入,到AI芯片、数据中心等重资产领域的规模扩容,均呈现出“非理性繁荣”的迹象,再叠加当下AI革命呈现的复杂性,如生态溢价的涌现性、技术路径的非线性竞争、商业转化的长周期,使得传统基于线性因果、还原论拆解与均衡假设的分析范式失效,难以真正穿透表象评估其可持续性与潜在风险。l引入热力学“熵增定律”来分析本轮AI泡沫。为破解这一复杂系统的分析困境,我们尝试引入热力学“熵增定律”构建分析框架,将AI资本市场视为一个被巨额资本(能量E)持续注入的开放系统。系统的存续逻辑在于:外部输入的资本能量必须高效转化为有序的价值产出(负熵),包括技术性能的确定性提升、规模化商业收入的落地、正向自由现金流的生成,否则系统无序度(熵S)将不可逆累积,导致估值体系割裂、技术路径分歧加剧、资本效率走低,从而引发泡沫破裂风险。lAI泡沫的熵增判断本质上是对“上游ScalingLaw有效性”与“下游ROI可实现性”的双重检验。这两大问题分别对应产业链的供给端转化效率与需求端价值闭环能力,即:只有上游能将资本高效转为智能供给、下游能将智能高效转为商业回报,整个AI系统才能在高熵环境中维持有序扩张,否则任何环节的熵增失控都可能引发系统性调整。基于此,我们从产业链上中下游熵值分布出发,剖析脆弱性、识别“负熵节点”的逻辑起点,我们认为:当前AI资本市场正处于高熵累积但未达临界点的状态,产业链上中下游因转化效率差异呈现显著熵值分化:l上游(芯片/硬件)处于“高压区”,存在泡沫隐忧。整体来看北美四大云厂商资本性支出预计2026年仍然维持增长态势,需求仍然强劲,整体资本密集度呈下降趋势,上游供需关系的非线性断裂风险暂不明显,但存在泡沫隐忧。截至2025Q3英伟达库存增长158.48%,显著高于微软IntelligentCloud业务收入增速28.25%与GoogleCloud增速33.51%,剪刀差持续扩大;其次面临技术路径竞争(如英伟达GPU与谷歌TPU)、美国电力危机推高成本、以及循环投资下资本回报率可持续性存疑等风险。l中游(云/平台)是“相变震中”,脆弱性最高。作为连接上下游的核心枢纽,中游厂商面临三重熵增压力:大客户依赖与价格战风险凸显(收入/资本支出比率显示资本拉动营收的边际效应减弱,头部厂商AI资本支出对营收的贡献已从高位回落算力租赁市场隐现价格战与空置率攀升(尽管当前H200租赁价格维持高位,但区域空置率分化加剧,北美部分市场空置率虽低但新增容量增速过快且电力将成为制约算力发展的最大物理瓶颈(Nvidia下一代集群推进将使单卡算力提升与电力消耗同步激增开源模型与客户自研冲击生态锁定。三重因素放大了中游的熵增压力,成为脆弱性最高的环节。计算机行业推荐维持评级:wuyanjing@分析师登记编码:S0130519070001:zouwenqian@分析师登记编码:S0130519060003:hutianhao_yj@分析师登记编码:S0130525070004相对沪深300表现图2025-12-291.【银河计算机】2026年计算机行业投资策略:从AI-Enabled到AI-First,拥抱AI应用大蓝海,2025-11-253请务必阅读正文最后的中国银河证券股份有限公3l下游(应用),处于“达尔文式进化”,显性β风险之下存在隐性α价值。虽然面临技术迭代导致资产贬值(模型、算力架构快速迭代使旧技术快速失去市场竞争力)、对上游供应商的高度依赖(API价格波动直接影响成本结构)等显性风险(β风险但其以可变成本为主、低切换成本的运营架构,以及对垂直领域数据和Know-How的深度沉淀(如临床数据、工业缺陷图像专有数据资产,以及嵌入行业规范的专家系统数据)构成了其反脆弱性和隐性价值 (α价值)的来源。2026年Agent模式渗透率将进一步扩大,用户对数据主权的日益重视将推动端侧AI发展(本地存储与多模态缓冲提升硬件配置需求这些趋势正强化下游应用的α价值。l整体判断:总体来看,当前AI资本市场系统正处于从低熵有序向高熵无序转变的关键阶段,宏观失衡风险(如资本回报率覆盖压力、融资结构复杂化)正在累积,但相较于2000年互联网泡沫时期全面的“高熵无序”,当前更接近产业革命早期的“理性泡沫”,技术突破的真实性与应用需求的广泛性为系统提供了“负熵”生成的底层支撑,尚未触及无序出清的临界点。未来的演变节奏,根本上取决于资本向商业价值转化的效率:若技术性能提升与规模化收入增长能持续消化高熵,系统将向新的有序稳态演进;反之,若转化效率持续低迷,熵增突破临界点将引发无序调整。l投资建议,在熵增系统中寻找“负熵”创造者,关注结构性机会。基于熵增框架,我们建议聚焦“负熵”承载者,挖掘结构性机会:其一,规避高熵、脆弱性环节,对资本开支巨大但商业回报路径模糊(如部分依赖融资支撑的算力租赁项目)、竞争格局恶化(如中游大模型及云厂商价格战)、技术护城河可能被颠覆(如单一架构芯片厂商)的领域保持审慎;其二,拥抱“反脆弱”与“负熵”创造者,重点关注几类方向:1)下游AI-First原生应用公司,当下AIAgent正从L2普及级向L3融合级跨越,关注可实现规模化收入的通用AIAgent,以及AIAgent与垂直行业Know-How深度融合(如医疗诊断、金融投研的专家型Agent)等机会;2)AI-First下的端侧AI,重点关注端侧AI上游“铲子型”算法及产业链深度卡位公司,用户对数据主权的需求推动端侧AI硬件繁荣,典型载体如AI眼镜、人形机器人、自动驾驶汽车、AI智能医疗设备等;3)供需剪刀差下的国产算力链替代机遇;4)能源互联网,电力瓶颈将催生虚拟电网、储能及上游的结构性机会。这些既是熵增系统中的“负熵”承载者,也是产业革命早期价值兑现的核心方向。个股层面,建议重点关注A股及港股以下公司:地平线机器人-W、晶泰控股、美图、粉笔、金山办公、恒生电子、合合信息、中科创达、虹软科技、能科科技、金蝶国际、海光信息、中科曙光、曙光数创、拓尔思、软通动力、同花顺、指南针、财富趋势、深信服、达梦数据、国能日新、华大九天等公司。l风险提示:宏观政策与贸易摩擦风险,技术与商业化风险,行业竞争与泡沫风险,供应链与能源风险,法律与监管风险,具体公司特有风险等。重点公司盈利预测与估值EPSPE2025E2026E2027E2025E2026E2027E300496.SZ300033.SZ688111.SH0268.HK688088.SH301162.SZ资料来源:Wind、中国银河证券研究院4请务必阅读正文最后的中国银河证券股份有限公4Catalog一、总论:热力学视角下的AI资本市场 5(一)背景:从AI技术革命到资本热潮 5(二)热力学熵增定律在AI资本市场的映射 6(三)对AI泡沫做熵增指数判断的两个本质问题 8二、产业链熵值分布——基于热力学脆弱性分析 8(一)上游(芯片/硬件高压区下的资本与技术双重熵增分析 9(二)中游(云/平台熵增传导与放大的“相变枢纽” 13(三)下游应用:“达尔文式进化”下的显性风险与隐性价值 19三、投资建议 28四、风险提示 295请务必阅读正文最后的中国银河证券股份有限公5一、总论:热力学视角下的AI资本市场自2022年底ChatGPT横空出世以来,生成式人工智能(AIGC)的技术突破迅速掀起一场全球性的产业与资本巨浪,过去三年,AI技术突破的宏大叙事与巨量资本投入相互作用,呈现出几段比较明显的产业与资本的阶段性特征。第一阶段:技术突破与产业共识的形成(2022年底~2023年上半年)。以ChatGPT为代表的大模型技术展现出的性能跃迁,迅速在产业界确立了“大模型是下一代技术底层基础设施”的全球共识,这一共识重构了全球科技产业的竞争逻辑,也为资本的大规模介入提供了明确的标的和方向,算力(芯片、服务器、智算中心)成为战略资源,大模型能力成为核心竞争力,而基于大模型构建的应用生态被视为未来的价值高地。第二阶段:资本大规模投入与产业快速扩张(2023年上半年~2025年,仍在持续)。技术共识在极短时间内转化为实质性的资本开支(Capex)竞赛。以微软、谷歌、Meta、亚马逊为代表的美国科技巨头,以及中国的头部互联网公司,纷纷宣布并执行了激进的AI投资计划。其核心特征是由拥有强劲现金流的产业巨头主导,投资集中于物理基础设施(如数据中心、AI芯片)和基础模型研发。北美主要云厂商的资本开支从2023年起持续超预期增长,市场预期其2026年总支出可能达到数千亿美元量级,目的是为抢占未来5-10年的技术制高点和市场份额进行的战略性押注。资本市场对此给予了高度响应,美股“七巨头”的市值增长贡献了市场主要涨幅,其估值逻辑从传统的市盈率(PE)更多转向对未来算力规模、用户增长和生态控制力的贴现,A股与港股市场也呈现出围绕算力产业链的强烈结构性行情,投资逻辑从最初的GPU芯片(如英伟达)向光模块、先进封装、液冷、数据中心(AIDC)等全产业链蔓延。图1:ChatGPT发布后美股七巨头走势资料来源:wind,中国银河证券研究院图2:ChatGPT发布后国内AI芯片公司寒武纪涨幅突出资料来源:wind,中国银河证券研究院第三阶段:产业焦点从“训练”转向“推理”,市场关注的焦点从“Capex投入强度”逐步转向“投入回报率”(ROIAI泡沫论开始浮现(2025年上半年至今)。随着基础设施的快速建设,产业焦点正从模型的“训练”阶段转向“推理”阶段。Token调用量取代单纯的模型参数或用户数量,成为衡量AI应用真实活跃度与商业潜力的核心指标。头部科技公司披露的Token消耗量6请务必阅读正文最后的中国银河证券股份有限公6呈现指数级增长,证实了应用端需求的真实存在。企业开始将AI能力深度集成至现有产品(如办公软件、搜索引擎、电商推荐并探索全新的Agent、文生视频等原生应用。巨头们的资本开支绝对值仍在攀升,为上游产业链提供了确定性需求,但市场关注的焦点开始从“Capex投入强度”逐步转向“投入回报率”(ROI)。当下,资本市场需要更加理性地审视这些巨额投资能否转化为可持续的收入和利润增长,以及现金流结构是否健康,能否出现真正的“杀手级应用”并形成清晰的盈利模式(如订阅制、API调用收费这些都将成为产业基本面能否支撑当前高资本开支和估值的核心要素。伴随着资本市场热度不断攀升,关于AI资产是否存在“泡沫”的讨论日益激烈,与此同时,中美在本轮AI主导的科技竞争下,采取的不同的路径,美国路径(以OpenAI、谷歌为代表)追求不计成本的性能领先和AGI突破,而中国路径(如Deepseek、阿里巴巴、腾讯、百度等)则受限于外部约束,更注重在给定算力下的效率优化和应用驱动,因此中美两国AI产业链的泡沫化特征也将有所区别,这也给本轮AI泡沫的分析带来了复杂性和多维度的挑战,既要审视技术信仰的边际衰减、资本回报的兑现压力,还要关注地缘政治约束下不同发展路径的可持续性。如前所述,我们看到当前AI资本市场呈现两个看似矛盾的特征:一方面呈现明显的“非理性繁荣”表现,估值高企、资本巨额涌入且过度集中、市场情绪火热,另一方面其背后又存在真实的技术突破与广泛的应用前景,也就是存在相当程度的“理性基础”,即:技术突破真实、需求确实存在、产业逻辑清晰。因此,对本轮AI泡沫分析的方法论需要能适配这种矛盾性和复杂性。当前主流的AI投资分析仍停留在牛顿力学范式,也就是将市场视为由独立个体组成的机械系统,试图通过线性因果关系进行预测,我们认为,这种范式在分析AI这种复杂适应性系统时将面临三重失灵:首先,还原论失效。传统的分析模式通常将AI产业拆解为芯片、算法、应用等独立环节,分别估值后加总。但AI系统的价值恰在于各环节之间的非线性相互作用。英伟达的估值不仅来自芯片销售,更来自其CUDA生态对整个产业秩序的重塑能力,而生态溢价无法通过还原分析获得。其次,历史类比失效。将当前AI热潮与2000年互联网泡沫简单类比,忽略了两个系统的根本差异:互联网是连接的信息系统,遵循梅特卡夫定律(价值与节点平方成正比AI是智能的生产系统,遵循更复杂的智能密度定律(价值与智能体间的协同效率呈指数关系)。互联网是建立在消费端的新连接,而AI是深入生产端的核心流程改造,其资本、产业和组织结构更具深度和粘性,导致相变过程更长、更复杂。第三,均衡思维失效。传统金融理论建立在市场趋于均衡的假设上。但AI产业正处在远离均衡的相变区,波动不是对均衡的偏离,而是系统探索新稳态的必要过程,如果简单通过用PE、PS等均衡指标评估出于相变中的公司,可能错过AI价值指数级增长的主升浪。我们引入热力学熵增定律,将AI资本市场视为一个被巨额资本持续注入能量的开放系统。根据热力学第二定律,一个开放系统若无法将输入的能量持续、高效地转化为有序的价值产出(负熵其内部的无序度(熵)将不可避免地增加,最终可能导致系统从有序扩张相变为无序出清。通过分析系统的“能量输入”(资本流)、“信息熵”(市场主流共识)和“结构熵”(产业链有序度我们发现,当前的AI资本市场是一个被巨额资本(能量)持续注入的系统,并且正在构建高度有序的AI基础设施和智能(负熵如果这些资本(能量)无法以足够高的效率转化为可持续的商业价值(即技术提升和收入增长跟不上资本消耗的速度系统的熵(无序度)就会累积。当熵值超过某个临界点,依赖外部融资维持的扩张循环将难以为继,系统可能从当前的“高能有序”状态,相变为“低能无序”的调整或出清状态。7请务必阅读正文最后的中国银河证券股份有限公7表1:熵增分析框架vs传统分析框架对比行为(泡沫)不能简单还原为个体之和,而是源于个相变涨落:系统在从一种有序状态(旧范式)转向线性外推与历史类比:如将当前与2000年Transformer架构、CUDA生态)成为主导系统秩序的“序参降低技术熵、组织熵)的组织或技术路径,它们是系观察系统内部正在经历从低熵有序状态向高熵无序状态的转变程度和所处阶段,将可构建一个全新的“非理性繁荣”下的“理性泡沫”热力学熵增定律分析框架。区别于传统分析往往陷入“现在是泡沫吗?”和“泡沫何时破?”的争论,我们构建的热力学熵增定律的分析框架,超越了“泡沫”vs“非泡沫”的二元争论,从热力学视角来看,泡沫是科技产业革命在资本市场投射的必然现象,这其实并非核心问题,核心问题是系统正在形成怎样的新秩序,当下秩序是否稳定,是否具备“脆弱性”或“反脆弱性”。我们将AI资本市场映射为一个开放的热力学系统,其核心要素对应关系如下:表2:AI资本市场热力学分析框架在AI资本市场中的映射全球AI产业链及其关联的金融市场以资本支出(Capex)为核心的流动性注入北美四大云厂商2025年第一季度资本性支出总计711.元,同比增长64.29%;2025年第二季度资本性支出为882.46亿美元,同比增长70.94%;2025年第三季度资本性支出964.04亿美元,同增长67.6%,整体来看北美四大云厂商资本性支出仍ABS、供应商融资激增)。ScalingLaw技术转化效率:ScalingLaw在预训练著放缓。强化学习与基于人类反馈的强化学习(RL/RLHF)等后商业转化效率ROI:微软、谷歌、Meta、苹果、亚马逊2025Q3合计capex1275亿美元,但从回报来看,AI收入主要来自云服8请务必阅读正文最后的中国银河证券股份有限公8端的AI产品,用户量虽然都在亿级以上,商业变现尚不明晰。从热力学熵增框架审视,当前对AI资本市场是否存在“泡沫”的争论,本质上可归结为两个必须回答的核心问题,分别对应产业链上游与下游的能量转化效率与有序价值输出能力,也是判断系统是否会从“高能有序”滑向“低能无序”的关键阈值。第一个问题:ScalingLaw是否继续有效,决定上游算力资本开支能否转化为更高智能、更高效的算力供给。ScalingLaw作为大模型性能与算力投入的幂律关系,在过去三年是驱动上游芯片、数据中心等重资产投入的核心信仰。然而,从2025年开始,预训练阶段的性能提升边际递减已显现,业界开始将算力与智能的突破寄望于后训练(Post-Training)与推理阶段的强化学习、思维链等算法创新。这意味着,单纯依靠堆砌算力换取智能提升的路径正逼近物理与经济的双重极限。若ScalingLaw在预训练之外的扩展(如Mid-Training、Test-timeCompute)仍能保持高ROI,则上游巨额的Capex可转化为持续升级的模型智能与算力效率,系统的负熵流充足,上游“高压区”只是成长中的阶段性现象;反之,若扩展路径的边际收益快速衰减,则会出现资本投入无法有效转化为智能提升的熵增,供给端将堆积大量低效算力,形成“算力通胀”与资源闲置,上游泡沫风险陡增。第二个问题:下游AI应用是否产生正向ROI,决定算力供给能否在产业末端被有效消纳并形成商业闭环。熵增定律告诉我们,一个开放系统的存续依赖于持续将输入能量转化为有序产出。放到AI产业,就是下游应用必须将中游提供的算力与模型能力,转化为可量化的商业价值(营收、利润、现金流否则系统只在做“无效循环”消耗。当前,尽管AI在企业级渗透率提升,但大量算力仍在中游环节空转。如果下游应用能通过AIAgent、垂直行业解决方案等形态,实现AI-First的原生价值创造(如按效果分成、嵌入核心业务流程并维持高毛利率、复购率与数据飞轮,则算力需求将具备内生增长韧性,系统负熵增强,形成良性循环;反之,如果下游持续停留在Demo级应用或仅靠API调用薄利变现,则在开源模型平权与价格战冲击下,ROI难以为正,算力消纳能力不足,将导致中游库存与空置率上升,熵增突破临界点,诱发无序调整。因此,AI泡沫的熵增判断本质上是对“上游ScalingLaw有效性”与“下游ROI可实现性”的双重检验。这两大问题分别对应产业链的供给端转化效率与需求端价值闭环能力,也是我们将在第二章从产业链上中下游熵值分布出发,剖析脆弱性、识别“负熵节点”的逻辑起点:只有上游能将资本高效转为智能供给、下游能将智能高效转为商业回报,整个AI系统才能在高熵环境中维持有序扩张,否则任何环节的熵增失控都可能引发系统性调整。二、产业链熵值分布——基于热力学脆弱性分析 基于上述热力学框架及熵增体系的构建,我们对AI产业链上、中、下游进行脆弱性分析,整体来看,资本能量(Capex)从资本市场系统外部持续注入,主要流向上游(芯片/硬件)和中游(云基础设施并转化为下游AI应用。1、上游(芯片/硬件)处于“高能高压”状态,资本密集但技术路径依赖性强,理论上熵增风9请务必阅读正文最后的中国银河证券股份有限公9险较高,但实际上呈现的是“理性泡沫”特征。全球AI产业链上游头部公司的整体资本密集度呈下降趋势,资本熵增值暂不明显,反而是技术路径依赖与生态锁定的“结构熵”开始浮现;2、中游(云/平台)是熵增传导与放大的“相变枢纽”,面临上游资本效率衰减向下传导与下游整体ROI不及预期向上传导的双重风险和压力;3、下游(应用)则呈现“达尔文式进化”,在显性的高估值β风险下,蕴藏着通过敏捷架构和垂直数据沉淀构建反脆弱α价值的巨大潜力。):上游是资本能量注入的首要入口和高压区,其脆弱性主要源于极高的资本密度与技术路径的不确定性。我们通过分析资本开支/营收比率(%),观察资本密集度与资本回报效率的动态平衡,这是一个关键负熵指标。该比率下降,反映出在资本开支增速逐步回归理性的同时,营收端正实现更高效、更有序的增长,系统的“能量转化效率”正在优化,也就是资本投入(能量输入)的边际增速放缓,而商业产出(有序输出)的加速度提升,推动单位资本创造的营收持续增强,实质上是系统内部“负熵”强化、运营效能提升的积极信号,说明上游产业正从粗放的资本投入驱动,转向更可持续、更注重内在效率的价值创造阶段。1、整体资本密集度呈下降趋势AI产业爆发增速后上游产业链营收增速逐渐趋于稳定。2022年底OpenAI推出ChatGPT后,人工智能产业经历了深刻变革,ChatGPT基于Transformer架构和人类反馈强化学习技术,显著提升了自然语言处理能力,开启了生成式人工智能(AIGC)时代,成功推动了大模型向通用人工智能平台演进,为智能时代提供基础设施。人工智能产业链上游迎来快速爆发,英伟达系列旗舰产品+CUDA生态领衔市场,营收迎来爆发式增长,由于其此前低基数效应,近期营收增速略有下滑,但仍维持50%以上增长。根据英伟达2026财年三季报显示,实现营收570.06亿美元,同比增长62.49%。图3:英伟达、Intel、台积电、AMD、博通五家公司营收增速资料来源:wind,中国银河证券研究院AI上游产业链公司资本开支在2024年增速大增后今年整体已在降速。我们选取AI上游产业链具有代表性的五家公司:英伟达、Intel、台积电、AMD以及博通,资本开支呈现出一定周期性变化,在2023年ChatGPT爆火背景下,2024年整体资本开支大幅增速,并在今年增速有所回落。请务必阅读正文最后的中国银河证券股份有限公图4:英伟达、Intel、台积电、AMD、博通五家公司Capex增速资料来源:wind,中国银河证券研究院AI产业链上游营收增速大幅增长,超越Capex增速,整体资本密集度呈下降趋势。其中上游厂商中台积电与Intel资本密集度较高,主要原因是对于设备与厂房的投入较高,而英伟达、AMD、博通等芯片设计厂商资本密集度较低,整体上游商业链资本密集度呈下降趋势。图5:英伟达、Intel、台积电、AMD、博通五家公司资本密集度(Capex/Revenue)资料来源:wind,中国银河证券研究院2、上游供需关系的非线性断裂风险暂不明显,但存在泡沫隐忧北美CSP云厂商资本开支加速增长,算力产业需求仍然旺盛。整体来看北美四大云厂商25年第一季度资本性支出总计711.38亿美元,同比增长64.29%;25年第二季度资本性支出为882.46亿美元,同比增长70.94%;2025年第三季度资本性支出964.04亿美元,同增长67.6%,整体来看北美四大云厂商资本性支出仍然维持增长态势,需求仍然强劲。图6:北美四大云厂商Capex(亿美元)及增速(亚马逊、微软、谷歌、Meta)资料来源:wind,中国银河证券研究院请务必阅读正文最后的中国银河证券股份有限公受AI驱动,微软、谷歌云业务收入呈现良性增长态势。图7:微软IntelligentCloud收入(百万美元)及增长率资料来源:Bloomberg,中国银河证券研究院图8:GoogleCloud云业务(百万美元)收入及增速资料来源:Bloomberg,中国银河证券研究院英伟达库存维持高位水平,库存周转率小幅下滑。截至25Q3(26财年第三季度)英伟达库存为197.84亿美元,同比大幅增长158.48%,库存周期为89.1天,小幅提升,库存周转率为409%,同比小幅降低,主要是由于BlackwellUltra芯片的量产准备,英伟达存货当前创出历史新高。图9:英伟达季度库存(百万美元)及库存周转率资料来源:Bloomberg,中国银河证券研究院AMD库存维持高位水平,库存周转率逐渐稳定。截至25Q3(26财年第三季度)AMD库存为73.13亿美元,同比大幅增长36.08%,库存周期为139.4天,小幅降低,库存周转率为261%,同比小幅提升,AMD库存持续创出新高,但库存周转率逐渐保持稳定水平。图10:AMD季度库存(百万美元)及库存周转率资料来源:Bloomberg,中国银河证券研究院请务必阅读正文最后的中国银河证券股份有限公泡沫隐现,北美大厂云业务增长率与上游芯片厂商库存增长率存在剪刀差,且剪刀差持续扩大。截至25Q3英伟达库存增长幅度为158.48%,显著高于微软IntelligentCloud业务收入增速(28.25%)与GoogleCloud增速(33.51%北美云厂商云业务收入增速与上游芯片大厂库存增速出现较大剪刀差,且目前来看仍然有扩大趋势。图11:上游芯片厂商库存增长率快于下游厂商云业务收入增长率资料来源:Bloomberg,中国银河证券研究院3、技术路径依赖与生态锁定的“结构熵”开始浮现英伟达的估值不仅来自芯片带来的收入高增长,更来自其CUDA生态对整个产业秩序的塑造能力,这种生态溢价构成了强大的“有序结构”,但同时也意味着极高的转换成本和技术熵,未来一旦出现颠覆性架构(如Extropic基于概率熵测量的芯片或谷歌TPU路线大行其道,抑或我国的国产替代因地缘政治加速,现有生态的有序可能迅速瓦解,转化为巨大的无序,即熵增。从目前来看,技术路线的“结构熵”已开始浮现。芯片架构有CPU、GPU、ASIC、FPGA等,其中DPU(DataProcessingUnit,数据处理单元)、NPU(NeuralProcessingUnit,神经网络处理单元)以及TPU(TensorProcessingUnit,张量处理单元)也属于ASIC芯片。表3:不同架构芯片对比峰值算力(TFLOPS)GPU19.5-312TFLOPS(A100)1.6TB/s(HBM3)400W高FPGA10-20TFLOPS100GB/s1TB/s10-50WASIC4-1000TOPS(varies)20PB/s(WSE-2)2W-23kW专用AI、加密TPU275TOPS(v4)1.2TB/s(HBM3)100W-500kWNPU15.8TOPS(M2)50-100GB/s1-5W低资料来源:DeepHubIMBA,中国银河证券研究院通用型GPU具有先天劣势,在当前美国缺电背景下,GPU比ASIC、TPU等消耗更多功耗,并且具有更高延迟。传统芯片公司设计ASIC芯片实现最高效率,但过往经验来看开发成本较高,谷歌自2016年以来长期积累了丰富的TPU设计经验,从2016年谷歌推出第一款TPUv1开始到现2025年谷歌推出第七代TPU芯片Ironwood,经过漫长的积累,谷歌TPU已经可以在性能上与英伟达系列旗舰产品正面对抗,更凭借低功耗、低成本的优势冲击英伟达GPU一家独大的竞争格局。请务必阅读正文最后的中国银河证券股份有限公谷歌TPU单卡算力逐渐缩小代际差,更多架构高性能芯片逐渐进入市场视野。根据SemiAnalysis的数据显示,谷歌TPUv4和v5的单卡算力(BF16浮点运算)远低于当时英伟达系列的旗舰产品,TUPv6的单卡算力性能已经非常接近H100/H200,但比H100落后了两年发布,TPUv7更加缩小了这一差距,谷歌TPUv7发布时间仅仅比GB200晚了几个季度,但峰值理论算力性能基本上接近GB200,谷歌TPU与英伟达GPU之间的代际差正逐渐缩小,英伟达面临更多高性能其他架构芯片的市场冲击。谷歌TPUv7在成本效率上对英伟达构成碾压优势。根据SemiAnalysis的数据显示,谷歌TPUv7服务器的TCUH(TotalCostperUnitperHour)为2.28美元,相对英伟达GB200服务器的1.28美元低约44%,在成本效率上相对英伟达GPU节约了将近一半。图12:谷歌TPUv7正逐渐缩小与英伟达系列旗舰产品的代际差资料来源:SemiAnalysis,中国银河证券研究院图13:谷歌TPUv7服务器TCO低于英伟达GB20资料来源:SemiAnalysis,中国银河证券研究院未来AI芯片的竞争格局面临诸多不确定性,技术护城河脆弱性逐渐暴露,一旦以谷歌TPU为代表的专用芯片或将快速渗透,AI芯片或将迎来“双轨时代”。谷歌十年磨一剑凭借专用TPU芯片的超高能效比和成本优势,正在不断挑战英伟达系列旗舰产品的垄断地位,但英伟达凭借CUDA生态的统治地位和GPU的通用性仍然是其最大优势,两种不同技术路线之间的鸿沟正逐渐缩小,技术壁垒上的脆弱性开始显现,未来或将形成英伟达GPU与谷歌TPU的双寡头格局。1、平台竞争的脆弱平衡:大客户依赖与价格战风险我们引入一个指标,即“收入/资本支出比率”,来衡量AI云厂商的资本支出投入对营收的拉动作用,从而来评估AI云业务的增长前景。该比率的“收入”是基于过去12个月的营收增量(主要由AI拉动“资本支出”是基于滞后一个季度的过去12个月的资本支出(考虑到新数据中心开始运营存在1个季度的滞后)。通过对亚马逊、谷歌、微软的“收入/资本支出比率”进行计算对比,我们可以看到,头部AI云厂商的营收增速仍处于较高水平(20%-40%但是AI资本支出对营收的拉动从季度上看整体在减弱,意味着AI的货币化能力当下未及预期。请务必阅读正文最后的中国银河证券股份有限公图14:“收入/资本支出比率”的计算方法图15:2024-2025Q3亚马逊、谷歌、微软的“收入/资本支出比率”趋势资料来源:Wind,中国银河证券研究院表4:主要云平台AI服务商业化进度称AI相关业务板块1、智能云(Azure)2、AI应用与平台:Microsoft365Copilot、GitHubCopilot、AzureAIStudio1、Azure营收增速:FY26Q1为+39%,Q2指引为+37%。2、AI对Azure增速贡献:在FY26Q1达到16个3、GitHubCopilot用户:FY26Q1拥有2600万用4、资本开支:FY26Q1为349亿美元,预计全年保1、OpenAI:核心合作伙伴,微软持有其27%股权,并签订了2500亿美元的长期Azure云服务2、Oracle、CoreWeave:OpenAI的算力供应1、谷歌云(GCP)2、AI应用与平台AI搜索(AIOverviews/AIMode)GeminiAPI及助手AI视频工具VeoVertexAI平台1、谷歌云营收:FY25Q3为152亿美元,同比增长33.5%。2、AI搜索:AIOverviews月活用户超20亿;AIMode在北美拥有7500万日活用户(DAU)。3、GeminiAPI调用量:每分钟处理700亿Tokens(即每月超300万亿Tokens)。4、AI视频工具Veo:已累积生成超2.3亿个视频。5、资本开支:2025全年指引上修至910-930亿美1、Anthropic:核心云服务客户,谷歌是其股东2、OpenAI、META:已与谷歌云达成服务协议。亚马逊1、AWS云服务AmazonBedrockAmazonSageMaker2、AI芯片Trainium2/33、AI应用电商AI助手Rufus企业AI助手AmazonQ1、AWS营收:FY25Q3为330亿美元,同比增长20.2%,为11个季度以来最快增速。2、自研芯片Trainium2:已成为数十亿美元业务,Q3收入环比增长150%。Trainium2芯片,年底将达100万颗。4、资本开支:2025全年预计达1250亿美元。1、Anthropic:核心合作伙伴与股东,使用AWS及Trainium芯片构建和部署其模型。META1、AI推荐系统2、METAAI助手3、AI创作工具(如Vibes)4、AI硬件(Ray-BanMeta眼镜)率提升3%;Runtime模型提升2%。2、METAAI助手月活用户:达到10亿。3、AI创作:用户已创建超200亿张图像;AI视频2、开发者/用户:使用开源模型(如Llama)和AI工具。请务必阅读正文最后的中国银河证券股份有限公4、资本开支:2025全年指引上修至700-720亿美阿里巴AI计算平台AI云平台2、AI消费应用高德地图AI1、云收入增长:2026财年Q2同比增长34%,AI2、市场份额:据Omdia,在中国AI云企业市场中份额为35.8%,排名第一。3、模型调用:据IDC,2025上半年中国公有云大模型Token调用总量中,阿里云占比27%。1、企业客户:服务于全球企业市场,提供全栈AI解决方案。2、生态开发者:通过开源模型(如Qwen)赋能客户开发AI应用。(二)中游算力租赁的脆弱性,关注价格走势与空置率全球数据中心市场在AI需求的强劲驱动下,呈现出空置率历史性走低、租赁价格持续上涨的繁荣景象。然而,作为连接上游基础设施与下游应用的关键环节,中游算力租赁业务的商业模式正暴露出日益显著的结构性脆弱性,尤其是面临上游供应链与下游需求的双重不确定性。在上游,算力租赁商严重依赖英伟达等芯片供应商,面临地缘政治导致的供应波动和成本压力。在下游,其需求完全依赖于AI产业的发展。AI的价值兑现是一个漫长过程,短期内对全社会生产力的提升有限。若AI应用商业化受阻或云服务支出放缓,算力需求将骤然降温。这种需求的高度不确定性与重资产投入的刚性形成了巨大风险。从H200租赁价格走势来看,目前算力租赁价格仍维持在较高水平,说明推理需求旺盛。根据CBREResearch,2025Q1全球数据中心平均价格同比上涨3.3%,达到每月每千瓦217.30美元。关于空置率,2025Q1全球加权平均数据中心空置率同比下降2.1个百分点,降至6.6%。巴黎的下降幅度最为显著,空置率从16.1%降至7.7%。但是各区域的空置率区别较大:1、北美数据中心的空置率仍然是整体最低,尽管美国四大数据中心的容量同比增长了43%,但北弗吉尼亚州仍是最紧张的市场,空置率为0.76%。亚特兰大降至3.6%,菲尼克斯降至1.7%,而芝加哥小幅上升至3.1%。2、2025Q1欧洲四大数据中心的整体空置率同比下降3.2个百分点,降至7.4%的历史低点,主要是受到新增规模的限制。3、2025Q1拉丁美洲各地的空置率大幅下降,其中圣保罗的同比降幅最为显著,从14.2%降至9.5%。圣保罗、圣地亚哥和克雷塔罗等主要市场的空置率接近历史低点。4、2025Q1亚太地区的整体空置率仍保持在14%的较高水平。由于需求略有疲软,香港的空置率相对较高,为28%。新加坡的空置率最低,为2%。需要注意的是,今年上半年的低空置率和高价格,很大程度上是由科技巨头的大规模预租行为所驱动,而非完全由终端AI应用产生的实时消耗所支撑,而这种基于预期的投资掩盖了真实需求的能见度,未来依然存在下游AI应用的商业化进程不及预期,导致空置率下降的可能性。请务必阅读正文最后的中国银河证券股份有限公图16:NVIDIAH200租赁价格走势资料来源:GPUs.io,中国银河证券研究院图17:2025Q1全球按市场划分的数据中心空置率资料来源:CBREResearch,中国银河证券研究院(三)开源模型与客户自研可能带来对中游平台的冲击企业级大模型的竞争也非常激烈,“三足鼎立”格局初现。2025年Anthropic超越OpenAI,成为企业领域大模型市占率第一,基础模型格局发生了决定性转变。Anthropic目前占到企业级LLMAPI使用量的40%,高于去年的24%和2023年的12%。OpenAI损失了近一半的份额,从2023年的50%下降到27%。Google的份额也有显著增长,从2023年的7%增长到2025年的21%。这三家公司合计占企业级LLMAPI使用量的88%,其余12%分散在Meta的Llama、Cohere、Mistral以及众多小型供应商手中。开源模型(OSS)的迅猛发展,正在通过技术供给侧的效率平权冲击原有性能垄断的商业模式。市场的鲶鱼效应正在不断深化,根据OpenRouter和a16z联合发布的深度调查2025年12月最新发布报告《State-of-AI》对超过100万亿Token的真实世界交互数据分析,开源模型的市场份额演变揭示了深刻的趋势。截至2025年底,开源模型已占据全球Token使用总量的约三分之一,更具颠覆性的是其内部动态,以DeepSeek、Qwen为代表的中国开源模型,其市场份额从2024年底的不足2%,在一年内飙升至占据所有开源模型使用量的近30%,这一“鲶鱼效应”不仅体现在总量增长,更体现在对市场结构的冲击——它迫使整个行业的价格锚点发生位移。OpenAI等闭源巨头被迫进行史无前例的大幅降价(如o1系列降价80%)并发布自己的开源模型系列(GPT-OSS)以应对竞争,这直接证明了开源力量已从边缘挑战者变为定价规则的重塑者。图18:开源模型与闭源模型的占比分布资料来源:OpenRouter《StateofAI》,中国银河证券研究院图19:2025年中国开源模型所使用token比例呈逐渐上升趋势资料来源:OpenRouter《StateofAI》,中国银河证券研究院首先,开源模型通过极致性价比,直接冲击了中游平台的定价权和利润空间。以DeepSeek为请务必阅读正文最后的中国银河证券股份有限公代表的开源模型,其开发成本仅为闭源模型的零头(如DeepSeek-R1成本600万美元,对比OpenAIo1约5亿美元API价格更是低至行业均值的5%。这种数量级的成本优势,迫使闭源模型提供商(如OpenAI)大幅降价(如o3模型降价80%直接挤压了中游模型API服务的利润。其次,开源生态的繁荣和客户自研能力的增强,削弱了中游平台的生态控制力,并推动其价值定位发生根本性转变。开源战略催生了去中心化的开发者社区,使开发者和企业可以绕过大型平台,直接基于开源模型进行创新。同时,企业为追求更贴合自身业务、更低成本或避免供应商锁定,正转向更多定制构建AI应用。这使得中游平台的角色从“模型和算力的垄断性提供者”,被迫降级为“工具链与集成服务的赋能者”。其价值创造点,必须从提供通用资源,转向提供更高效的微调工具、部署方案和数据管理等差异化服务。再次,地缘政治和“主权AI”需求,加速了基于国产开源模型和算力的替代进程,对国际和国内中游平台都构成了结构性挑战与机遇。中国企业出于数据安全和供应链自主的考虑,对国产开源模型和国产算力平台的需求日益迫切,一方面给国内平台(如阿里云、腾讯云)带来了服务国产生态的机遇,另一方面,全球性的平台可能由于路线的割裂而带来生态裂变的不确定性。(四)电力成本的不可控风险:能源价格波动对利润的直接侵蚀美国正在陷入缺电危机,电力荒逼迫全球算力节能降耗。据美国能源研究所(IER)估算,OpenAIOrion模型进行一次训练所消耗的电量约达110亿kWh,这一耗电量相当于约100万美国家庭一整年的用电量。根据EIA报告显示到2030年,全球数据中心电力需求将达945太瓦时(等于10亿千瓦时即10亿度电占全球用电量近3%,较2024年增幅超一倍。在美国,仅OpenAI一家计划到2033年部署的算力中心,新增负荷就超过美国当前全国最高用电负荷的四分之一。相比之下,美国电网却显得捉襟见肘:345kV变电站交付周期长达128周,输变电工程师缺口达20万人,根本无力支撑算力中心的电力需求。图20:美国数据中心总用电量及趋势预测资料来源:《2024UnitedStatesDataCenterEnergyUsageReport》,劳伦斯伯克利国家实验室(LawrenceBerkeleyNationalLaboratory),中图21:2000-2025美国电价趋势资料来源:美国劳工统计局、FRED,中国银河证券研究院美国老旧电力系统亟待升级,全球PUE水平有望进一步优化。2024年,全球的平均PUE是1.56,表明全球数据中心大约有三分之二的电能都用在GPU计算上,剩下三分之一的电能消耗在冷却、供电、照明等系统,能耗结构仍有优化空间。美国电价在GPT加大训练投入后飙升,居民用电出现挤兑。美国很多老旧的电力系统较为落后,根据美国劳工统计局数据,2021年到2022年期间在OpenAI大规模投入训练GPT的同时,电价飙升曾导致正常居民用电挤兑。结合对芯片性能的估算,SemiAnalysis预计到2030年,AI数据中心消耗的能源占全球总能源产量的4.5%,整体处于可控范围。SemiAnalysis通过分析北美地区1100多家数据中心的情况来预测未来AI数据中心的电力需求。在未来几年内,数据中心的电力容量增长速度将会加快,其复合年增长率将从12%-15%上升到25%。全球数据中心对关键IT系统的电力需求也将大幅增加,请务必阅读正文最后的中国银河证券股份有限公从2023年的49吉瓦增加到2026年的96吉瓦,其中AI相关应用将消耗约40吉瓦的电力。AI时代对能源的挑战主要在两方面,一方面要求能源价格低且波动小,另一方面要求能源结构具有较低的碳强度。这非常适合大规模使用成本经济的可再生能源。然而,目前全球各区域的电力供应水平和价格差异巨大:1、美国的工业电价当前依然属于全球低水平,平均仅为0.087美元/千瓦时。此外,美国的天然气资源也非常丰富。其问题是土地、许可等限制导致新数据中心交付缓慢以及并网排队时间长(如德克萨斯州达11年)。2、中国的工业用电电价为0.092美元/千瓦时,这一水平属于较低的范围。但中国约61%的电力是由煤炭产生的,控制碳排放是一个难点。3、欧洲由于政治和地缘因素,电力生产量一直在缓慢下降,2022年欧洲的平均工业用电电价达到了0.18-0.235美元/千瓦时,因此在全球AI数据中心规模里欧洲所占的比例不足4%。表5:美国的数据中心电力使用情况指标202020212022202320242025E2026E2027E2028EAI数据中心关键IT电力兆瓦(MW)318640非AI数据中心关键IT电力兆瓦(MW)兆瓦(MW)%65%66%66%67%70%72%73%74%75%兆瓦(MW)电力使用效率(PUE)兆瓦(MW)太瓦时(TWh)133152172196241318429548672%3.30%3.70%4.00%4.50%5.50%7.10%9.50%12.00%14.60%资料来源:SemiAnalysis,中国银河证券研究院我们以微软AI云服务为例,对于一个H200GPU,若电力成本翻倍(从约0.087增长到0.18美元/kWh,接近欧洲水平会导致其每小时运营成本增长约20%,在给定其他成本结构下,这大致对应EBITDA利润率下降约4个百分点,表明电力成本是影响云厂商盈利能力的关键敏感变量。表6:以微软AI云服务为例,若电力成本+100%对EBITDA利润率的影响层次H200若电力成本+100%USDper8GPU$246,391$246,391年44折旧费用/GPUUSD/hr/GPUUSD/kW/mth$110$110USD/kWh单个GPU运营成本USD/hr/GPU单个GPU收入USD/hr/GPU单个GPU耗电量(利用率80%)kWh/GPU11单个GPU的电力成本USD/hr/GPU单个GPU的EBITUSD/hr/GPU单个GPU的EBIT利润率%35.26%31.58%请务必阅读正文最后的中国银河证券股份有限公单个GPU的EBITDAUSD/hr/GPU单个GPU的EBITDA利润率%81.58%77.89%电力成本/EBITDAUSD/hr/GPU5.61%12.16%资料来源:SemiAnalysis,中国银河证券研究院当前AI产业链的核心矛盾,已从上游资本开支(Capex)的军备竞赛期,转向下游应用层商业价值兑现期。市场正以投资回报率(ROI)为标尺,对前期巨量资本投入进行残酷的“达尔文式”筛选。一方面,开源模型的崛起和成本曲线的陡峭下滑,正在瓦解传统闭源模型的定价权,暴露出应用层普遍的“轻资产”模式在资本高估值下的脆弱性(β风险)。另一方面,在激烈的竞争与快速的技术迭代中,真正能够深度嵌入业务流程、创造独特数据资产和领域知识壁垒的应用,正在沉淀出远超市场当前定价的韧性、多样性和反脆弱性(α价值)。我们认为,下游应用层的发展,本质是资本能量(负熵流)能否高效、可持续地转化为可度量的商业价值(有序输出)的过程。这一过程正经历三个结构性转变,其成败将直接决定整个AI资本市场是会走向“理性繁荣”还是“无序出清”。2022年11月30日,ChatGPT发布以来,计算机行业估值PE(TTM)进入震荡上升通道,当前PE值处于过去十年高点,显著高于sd(+1)水位。当前行业整体估值较高,下游AI应用企业通常采用的“轻资产”模式,这种优势常常伴生一些“达尔文式进化”下群体性的显性风险(β风险但从应用层面来看,随着技术的不断成熟和应用场景的持续拓展,隐性价值(α价值)的韧性、多样性和反脆弱性远高于市场当前的定价,并在市场价格校准后打开由“量变”带来的增量空间,进而逐步消化高估值。图22:ChatGPT发布后计算机行业PE(TTM)进入震荡上升通道资料来源:WIND,中国银河证券研究院图23:ChatGPT发布以来计算机行业PS(TTM)情况资料来源:WIND,中国银河证券研究院麦肯锡2025年11月调研显示,88%的受访组织已在至少一个业务职能中定期使用AI。行业采纳差异显著,IT、金融领跑:AI采纳呈现明显的行业集中性。信息科技、专业与科技服务、教育服务、金融与保险是采用率最高的行业。这与其工作内容的知识密集度高、流程相对标准化、数据电子化程度好密切相关,符合AI自动化暴露度与采纳率正相关的规律。大规模价值创造尚在初期:尽管渗透率提升,但麦肯锡报告指出,近三分之二(约66%)的已采纳组织尚未开始在企业范围内规模化推广AI,多数仍处于实验或试点阶段。仅有39%的受访者20请务必阅读正文最后的中国银河证券股份有限公20报告AI对息税前利润(EBIT)产生了影响,且其中多数贡献率低于5%,表明AI从“使用”到“创造价值”之间仍存在巨大鸿沟。1、下游AIAgent当下落地困局:技术精度不足、Token成本高、治理与协同等首先,当前主流大模型泛化能力依然不足。IFBench于2025年7月在《GeneralizingVerifiableInstructionFollowing》论文中正式发布,IFBench主要评测模型对新颖、复杂约束的泛化表现,该基准旨在揭示模型在未见指令下的精确执行水平,基于58个可验证的单轮任务进行评估。根据DataLearner报告显示,IFBench针对以下核心问题:一是模型对未见约束的泛化不足;二是缺乏可自动验证的评估标准;三是现有基准任务的分布偏差,导致高分模型在实际应用中表现不稳。据ArtificialAnalysis的IFBench测试,OpenAI发布的大模型包括GPT-5、GPT-5.1和o3领跑,KimiK2Thinking大模型仅得分68%,DeepSeekV3.2Exp得分54%,Qwen3Max得分44%,底层国产大模型泛化能力不占优。τ²-BenchTelecom测试主要针对AIAgent在特定领域程序化使用工具时,完成真实的多回合任务的表现。τ²-BenchTelecom测试支持双控制环境,分别为:单人模式:Agent拥有完全控制权,执行所有操作。互动模式:Agent与其自身数据库交互的同时,引导用户完成操作。图24:τ²-BenchTelecom测试双控制环境资料来源:《τ2-Bench:EvaluatingConversationalAgentsinaDual-ControlEnvironment》,VictorBarres、HonghuaDong、SohamRay等,中国使用τ²-bench测试多个基于LLM的AIAgent比较其单人和交互模式的表现,结果显示,当代理从单人模式切换到交互模式时,任务成功率下降了25分,虽然这些AIAgent在单一模式中看似智能,但在管理复杂的协作任务的能力有限。其次,成本层面:虽然推理成本持续下降,短期内成本问题依然凸显tokens是AI智能涌现的基石。LLM领域的核心范式是ScalingLaw,模型的性能(智能化程度)与其训练和推理过程中消耗的计算资源(通常以FLOPs衡量)存在可预测的幂律关系。而Token是计算资源消耗的最直接且可量化的载体。因此,模型实现其智能化必然伴随着tokens消耗的增加。1)训练阶段:数据规模决定智能上限。模型的智能化是通过对海量、高质量token数据序列进行概率分布学习而来,复杂的推理、指令遵循和创造性等高阶能力,仅在模型参数量和tokens超越某个临界点后才会出现。2)推理阶段:上下文长度决定任务复杂度。模型的“思考过程”体现在其对上下文窗口内tokens的处理上。每一步推理都会产生中间步骤(outputtokens),整个过程消耗的tokens数量与任务的复杂度和模型的思考深度直接相关。21请务必阅读正文最后的中国银河证券股份有限公21全球大模型推理成本持续下降。根据斯坦福大学人工智能研究所(HAI)2025年4月发布的《斯坦福2025年人工智能指数报告》,在MMLU测试(评估语言模型性能的常用比较基准)中达到GPT-3.5水平(64.8分)的模型,其推理成本从2022年11月的每百万tokens20美元降至2024年10月的0.07美元(Gemini-1.5-Flash-8B),约1.5年内下降超280倍。在GPQA(比MMLU更具挑战性的比较基准)上得分超过50%的模型的成本也呈现出类似的趋势,其推理成本从2024年5月的每百万tokens15美元降至同年12月的0.12美元(Phi4)。EpochAI估计,根据任务不同,大语言模型的推理成本正以每年9至900倍的速度下降。根据ArtificialAnalysis给出的ArtificialAnalysisIntelligenceIndex(大模型智能化指数)标准测算主流大模型,在给定指数任务中,观测主流大模型的outputtokens消耗量和总运行成本。若以此作为定量假设进行测算,可得出在给定任务中,不同大模型所需的单位运行成本。据我们测算,目前主流大模型的输出成本大部分集中在2美元/百万tokens至25美元/百万tokens区间内,国产大模型具有成本优势。以GPT-5.1为例,在给定指数测算过程中,outputtokens约为80.9百万tokens,总运行成本约为859.06美元,因此估算GPT-5.1单位运行成本约为10.62美元/百万tokens。而KimiK2Thinking大模型在同给定指数测算过程中,outputtokens约为138百万tokens,对应总运行成本约为380.47美元,因此估算KimiK2Thinking大模型单位运行成本约为2.76美元/百万tokens。图25:主流大模型单位运行成本测算图26:EpochAI2022–2024年选定的比较基准的推理成本模型高智能化短期暂时还无法规避成本高问题。基于上述模型,进行其智能化指数与模型运行人工智能指数时产生成本的关系,散点基本分布在“高智能-高运行成本”或“低智能-低运行成本”象限,可见模型实现“高智能化”暂时无法与“低运行成本”同时兼得。22请务必阅读正文最后的中国银河证券股份有限公22图27:主流大模型智能化指数vs运行大模型智能化指数所需成本对数关系图28:主流大模型智能化指数vs.价格——对数关系(图由左至右为价格由高到低)最后,从需求端来看,AIAgent商业化落地面临企业治理与协同等问题尽管企业应用程序中内置的Agent功能开始逐渐普及,例如提供见解、更新记录、回答问题等简单任务,但还没有完全转化为日常化使用,当下,AIAgent整体的采用率仍受限,AIAgent商业化落地面临一些挑战。部署情况方面,根据毕马威人工智能季度报告数据,2025年第三季度AIAgent部署量相较一季度几乎翻了两番,当前42%的组织已部署了至少部分Agent,相较一季度的部署比例11%大幅提升;但同时,AIAgent试点情况相较2025年二季度下降了2个百分点,2025年三季度试点比例下降至55%。采用率方面,根据普华永道于2025年5月的调查显示,在300名高级管理人员中,完全采用AIAgent的比例仅占总数的17%;AIAgent广泛采用的比例仅有35%。图29:企业AIAgent应用程度分为五个等级资料来源:KPMG,中国银河证券研究院图30:AIAgent采用率情况(2025年5月统计)资料来源:PWC,中国银河证券研究院可信治理框架缺位:Agent还是Copilot,责任主体悬而未决在医疗、金融、法律等高风险场景中,AIAgent的“自主执行”特征使传统软件责任边界失效。当Agent因模型幻觉给出错误诊断、错误交易信号或合同条款时,企业面临“三重责任真空”:1、模型提供方以“技术中立”免责;2、集成方以“仅调用API”推脱;3、使用方因“未直接编写代码”而主张无过错。国内现行《数据安全法》《个人信息保护法》尚未对Agent责任主体做出明示。为对冲风险,头部机构普遍采用“人工在环”折中模式——将Agent降格为Copilot,所有关键操作必须人工复核,结果是把效率提升幅度大幅压缩,Agent的“自主价值”名存实亡。23请务必阅读正文最后的中国银河证券股份有限公23组织内耗:数据、权限、流程的三墙围堵Agent要真正跑通企业流程,需同时穿透数据、权限、流程三层组织边界。现实却是:1、数据口径不一,同一客户在CRM、ERP、OA中ID格式各异,Agent调用结果相互冲突;2、权限模型呈“烟囱式”,财务、运营、法务系统各自独立,跨系统SSO尚未打通,Agent无法获得连续会话令牌;3、KPI目标错位,技术部门和业务部门考核导向不同,导致POC阶段一旦短期ROI不显著,项目可能被业务方叫停。合规成本外溢:本地化部署高门槛比如对于金融、医疗、能源等高敏感行业,数据出境与第三方云API调用被严格限制,企业只能选择私有化或行业云部署。然而,本地化方案需一次性投入GPU集群、知识图谱构建、运维团队,初期成本高企,且模型更新、漏洞修复需自行承担,年度运维费用高企。在高成本与不确定收益的双重挤压下,需求方常陷入预算困境,形成Agent商业化的难题之一。2、虽有困境,但趋势仍在加速,企业级AIAgent正迈向“L3融合级”尽管AIAgent暂时面临落地困境,但其产业发展势头良好的趋势依然不变。我国企业AIAgent应用的整体成熟度正处于从“L2普及级”向“L3融合级”过渡的阶段,头部企业已进入“L3融合级”并探索“L4驱动级”,但绝大多数企业仍处于“L1萌芽级”和“L2普及级”。图31:企业AIAgent应用程度分为五个等级图32:AIAgent五个应用等级的tokens特征伴随着AIAgent从“被动工具”迈向“自主决策体”,并且从个体走向协作,AIAgent的商业模式也将发生变革,AIAgent应用的竞争点正从“提供工具”向“交付价值”转变。能真正提升下游企业利润的AIAgent应用将会胜出,从这个角度来说,对应垂直行业knowhow型卡位公司的投资机会相对提升,能融入智能体能力的SAAS企业有望迎来价值重估的机会。3、中国开源模型冲击带来成本-价值曲线重构,可能隐含群体性β风险成本-价值曲线的重构下,“高性能-低成本”组合普及,隐含群体性β风险。《State-of-AI》报告中的市场地图分析揭示了全新的竞争逻辑,在成本(每百万Token价格)与使用量的二维坐标系中,市场清晰地分化为两个阵营,即:以OpenAIGPT系列、AnthropicClaude系列为代表的闭源模型,凭借其顶尖的性能、可靠性和企业级支持,占据了“高成本、中高使用量”的象限,其商业模式依赖于为“任务关键型”应用创造不可替代的溢价价值。而与之形成鲜明对比的是,以DeepSeek、QwenMax等为代表的开源模型,则密集分布在“低成本、极高使用量”的“效率巨人”(Efficientgiants)区域,其单位成本可能低至闭源模型的十分之一甚至更低,却驱动了海量的Token消耗。这一现象表明市场并非单一同质的,而是由“价值敏感型”和“成本敏感型”两类需求共同构成。开源模型通过极致的性价比,正在快速将“成本敏感型”这一类规模巨大但此前未被充分满足的市场彻底激活和占领。24请务必阅读正文最后的中国银河证券股份有限公24图33:全球开源模型与闭源模型的对比(成本与使用量的对数关系)资料来源:OpenRouter《StateofAI》,中国银河证券研究院图34:全球AI大模型市场分布图(成本与使用量之间的对数坐标)资料来源:OpenRouter《StateofAI》,中国银河证券研究院以上形势对AI应用层货币化产生了直接冲击,这种“高性能-低成本”组合的普及,对下游应用企业的商业模式构成了根本性挑战,表面上看上游大模型平权带来下游成本下降,但实际上,下游AI应用企业采用“轻资产”模式,当其底层模型的调用成本因开源竞争而急剧下降时,应用层的价值捕获能力可能会受到双重挤压:一方面,它们难以将成本下降的全部红利转化为利润,因为竞争会迫使终端服务价格同步下降;另一方面,其技术壁垒部分被削弱,因为竞争对手可以基于相同的低成本技术底座,快速复制和迭代相似的服务,导致市场竞争加剧,产品同质化风险上升。这导致我们前面所述行业整体估值(PE/TTM)处于历史高位,但许多企业的营收增长和盈利路径尚不清晰,存在“达尔文式进化”下的群体性β风险。4、基于推理的token快速提升,需求增长引擎正从北门向亚洲特别是中国转移2025年,通过推理模型进行处理的总token数量所占的比例急剧上升,在2025Q1在第一季度初期,这一比例还几乎可以忽略不计,而现在已经超过了50%,这一变化反映了随着GPT-5、Claude4.5、Gemini3、Deepseek等头部大模型功能日益强大,AI应用已经开始呈现高速发展特征,用户更倾向于使用能够管理任务状态、遵循多步骤逻辑、并支持类似AIAgent的工作流程的模型。其中,亚洲在全球AI推理Token消费中的份额,已从2024年底的约13%,增长至2025年底的约31%,近一年亚洲的份额增长超过一倍,成为全球AI需求增长最强劲的区域,这不仅仅是因为中国是一个巨大的消费市场,更是因为中国已成为全球AI技术供给(开源模型)和需求创造(创新应用)的双重中心。图35:基于推理的token使用占比快速提升资料来源:OpenRouter《StateofAI》,中国银河证券研究院图36:亚洲在全球token总支出占比从快速增长资料来源:OpenRouter《StateofAI》,中国银河证券研究院25请务必阅读正文最后的中国银河证券股份有限公25在开源浪潮的全球性冲击下,中美AI产业基于其不同的市场环境、资本结构和用户基础,演化出截然不同的投资回报(ROI)实现路径。美国AI生态的基石仍是由OpenAI、Anthropic、Google等巨头构建的闭源模型体系为主导,。其ROI逻辑根植于“性能信仰”,即相信在AGI(通用人工智能)的终极竞赛中,绝对的技术领先能够创造最高的商业壁垒。因此,其下游应用多聚焦于构建高价值、高复杂度的企业工作流解决方案。例如,将ClaudeSonnet或GPT-5深度集成到金融分析、法律文档审查、复杂代码生成等场景中。用户为此支付的溢价,购买的是可靠性、安全性、极致的输出质量以及“任务零失败”的保障。《State-of-AI》的数据也支持了这一点,尽管价格高昂,ClaudeSonnet、GPT-4/5等模型依然维持着可观的使用量,表明存在一个庞大的、对价格不敏感但对性能极度敏感的企业市场。其价值闭环在于:通过解决此前无法自动化的高价值问题,成为企业核心业务流程中“不可卸载”的组件,从而实现高客单价和长期的生态锁定。中国下游应用的ROI路径更侧重于“场景驱动”和“规模变现”,利用开源模型的低成本优势,快速进行产品迭代和场景验证,在角色扮演、轻量级编程辅助、社交娱乐、内容生成等领域实现了用户规模的指数级增长。OpenRouter数据显示,中国团队开发的开源模型的崛起,不仅体现了它们在质量上的竞争力,也反映了它们快速迭代、频繁发布新模型的发展模式,这些模型的市场份额从2024年底时每周的使用比例仅为1.2%,升至2025年在整一年的时间中平均每周使用量约为13.0%。其价值创造不在于单次调用获取高额利润,而在于通过极低的边际成本触达亿级用户,形成流量入口和平台效应,再通过增值服务、广告或生态系统进行变现。这条路径更敏捷,试错成本更低,但也更依赖于持续的用户增长和活跃度。5、Token消耗趋势正从“内容生成”到“复杂任务解决”的价值密度跃迁自2024年底OpenAI发布o1推理模型以来,行业发生了根本性转向。到2025年底,推理模型处理的Token已超过总量的50%,且平均请求的输入Token长度增长了近4倍,与推理范式崛起同步的是交互深度的急剧增加,平均每次请求的输入Token长度自2024年初增长了近4倍,从约1.5K增长至超过6K,意味着AI应用的核心价值正从简单的内容生成转向复杂的AIAgent演进,其价值密度显著提升。比如:从“帮我写一篇邮件”升级为“帮我分析这份财报并给出投资建议”、“帮我调试这段代码并优化性能”、“基于这些客户反馈制定一个产品迭代方案”。AI应用的价值不再取决于生成了多少文字,而在于解决了多复杂的问题。6、隐性α价值的孕育,下游应用层的熵增指数判断与投资判断我们构建了AI应用的熵增指数公式:熵增指数=(资本估值热度/商业价值转化效率)×市场碎片化程度分子:高企的资本估值热度。当前资本市场对AI应用叙事给予了极高溢价,行业估值处于历史峰值,许多企业的“轻资产”模式和高增长预期背后,是营收模型尚未经过完整经济周期检验的不确定性,这种估值与基本面之间的张力,构成了系统主要的能量输入,也是无序度的潜在来源。分母:分化加剧的商业价值转化效率。这是区分“泡沫”与“价值”的关键。低效转化(高熵大量应用停留在“技术消费”层面,即简单封装大模型API提供同质化服务。面对开源模型的成本冲击,其货币化能力脆弱,用户留存率低,无法沉淀专有数据或工作流。它们消耗资本,但未能创造坚实的价值闭环。高效转化(低熵,即隐性价值所在):少数应用成功实现了价值沉淀,体现在数据资产沉淀、领域知识编码与工作流嵌入、用户高留存率。乘数:极高的市场碎片化程度。开源技术极大地降低了模型获取和应用开发门槛,导致市场参与者数量激增。同时,模型能力本身也高度碎片化,没有单一模型能在所有场景领先。这种碎片化加剧了竞争,分散了用户注意力和资本,使得建立可持续竞争优势的难度呈指数级增加,显著推高了整个系统的“熵”。26请务必阅读正文最后的中国银河证券股份有限公26图37:AI-First收入曲线的乘法效应图38:AI-First应用基因三维评估框架当前AI应用层处于“高资本热度”与“高市场碎片化”并存,但“商业价值转化效率”严重分化的阶段。因此,系统整体“熵增指数”偏高,存在显性的泡沫化风险。大量缺乏深度场景结合和独特价值捕获能力的应用将在“达尔文式进化”中被淘汰。然而,与上游重资产、高固定成本、技术路径依赖强的模式相比,下游应用层在熵增分析框架中呈现出独特的“反脆弱性”:成本结构灵活:以OPEx(运营支出)为主,可随业务需求快速调整研发和云资源投入,在经济下行或技术路线变更时具备更强的生存韧性。价值捕获直接:其商业模式越接近“价值分成”,就越能与客户的成功深度绑定,分享增长红利,形成更健康的收入曲线。壁垒在于深度而非广度:其护城河是垂直领域的数据闭环、深度嵌入的业务流程以及由此积累的专属知识,而非通用的算力规模或模型参数。这种“反脆弱性”决定了真正的隐性价值(α价值)正孕育于这场进化之中,未来真正的AI应用价值导向不属于“AIEnabled”公司,而属于能够实现“AIFirst”深度转型的组织。我们认为:在投资视角下,筛选下游AI应用标的应聚焦于“AI-First”三维验证体系:(1)定性(AI基因产品核心价值是否由AI驱动?移除AI后产品是否无法成立?研发投入是否重度倾斜AI?(2)定量(业务健康度AI相关收
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 文化艺术交流策划咨询公司经营管理办法
- 2025-2026年济南历城区九年级中考物理一模考试试题以及含答案
- 2026年高职(广告设计基础)海报创意设计专项测试题及答案
- 设计思维基础 课件全套 第1-7章 设计思维概述-设计思维训练课题及相关设计案例
- 高中语文必修上册第三单元整体教学设计
- 广西大学钢结构考试试题及答案
- 2026年中医人文素养考试试题及答案
- 2026年火星课堂推理试卷及答案
- 武汉东湖风景名胜区发展控制区:保护与发展的协同路径探索
- 武侯高级中学高中体育小组合作学习的困境剖析与优化策略
- 2026及未来5年中国黄柏行业市场研究分析及前景战略研判报告
- 《安全工程专业实验》课件全套 第1-8章 实验室安全-安全检测实验
- 社会组织业务培训课件
- 印刷企安全教育培训制度
- 双高集团人才测评题
- 2026年细胞免疫学实验计划
- 铁路货车课件
- 2026年公安机关理论考试题库300道及参考答案(满分必刷)
- 2025年黑龙江省纪委监委遴选笔试真题及答案解析
- 2025年10月自考14475新闻道德与媒介法规.试题及答案
- 深层肌肉刺激仪临床应用
评论
0/150
提交评论