计算机行业2026年中期投资策略报告:雾里看花日益清晰迎接奇点时刻_第1页
计算机行业2026年中期投资策略报告:雾里看花日益清晰迎接奇点时刻_第2页
计算机行业2026年中期投资策略报告:雾里看花日益清晰迎接奇点时刻_第3页
计算机行业2026年中期投资策略报告:雾里看花日益清晰迎接奇点时刻_第4页
计算机行业2026年中期投资策略报告:雾里看花日益清晰迎接奇点时刻_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录一、计算机板块2025年年报和一季度复盘 1行情表现 1业绩回顾 1持仓与估值 52026年下半年计算机行业展望 10二、大模型迭代暂无上限,持续引领全球AI发展 10海外模型三足鼎立,商业化战略分层 11国内模型崛起,多模态场景反超 17大模型能力增强提升渗透率,推动Token指数级增长 23三、国内算力需求陡增,AIInfra走入新阶段 26ROI导向时代AIInfra价值持续凸显 26CPU:AgenticAI重塑通用计算价值 30四、CLAW引领Agent新形式,2B赛道重视产品力 31类Claw产品加速消耗 31AI4S正演进为战略级科研基础设施,远期空间潜力巨大 35AI漫剧成为AIGC确定性最高的“破圈赛道”,市场呈现爆发增长态势 39东风已来,AI重塑电力交易新蓝海 42制造业是Agent落地最佳试验场之一 46五、数字人民币2.0正式开启,催生百亿级金融基建市场 51国际形势不确定性加剧,人民币国际化有望迎来战略窗口期 51数字人民币基础建设日益成熟,有望成为替代SWIFT体系主流路径 53数字人民币2.0催生金融基础设施升级改造市场需求,潜在空间达百亿 54六、推荐标的 57风险分析 58一、计算机板块2025年年报和一季度复盘行情表现截至2026年4月30日收盘,计算机(申万)指数年内涨跌幅为-4.11%,跑输沪深300指数(+1.90%)6.01个百分点:1)1月,宏观方面财政与货币政策相对积极,市场预期经济回暖带动股市整体上行,计算机作为高弹性成长板块受益,且月初CES举办、国产大模型陆续上市进一步推动软件板块上行。后半月由于海外SaaS调整向A股传导,软件板块有所回调,算力板块上行,整体呈现细分板块分化行情。2AI资本开支,字节、阿里等国内厂商相继推进大模型和多模态产品迭代,强化AI应用商业化和国产生态演进预期。市场围绕AI应用、模型平台等方向展开轮动。3GTC大会等继续催化科技情绪,但国际局势动荡背G端和B端客户为主的计算机行业业绩承压,计算机板块整体走弱,且相较大盘录得负超额收益。4)4月,计算机板块震荡上行,与大盘走势趋近。受益于算力产业链各环节涨价提振,服务器、算力租赁ROIAgentG端业务的细分板块因业绩承压表现较弱。图1:年初至今申万计算机指数及沪深300指数涨跌幅115%110%105%100%计算机(申万) 沪深行情数据截至2026.4.30收盘)业绩回顾20252026年第一季度计算机板块业绩回顾2025年全年计算机板块收入实现稳健增长,利润端显著修复;2026Q1趋势延续,扣非净利润扭亏且大幅增长。截至2026年4月30日,申万计算机行业共计334家上市企业(剔除北交所、B股),均已发布2025年年2026202513352.548.01%;合计实现278.5557.42149.65102.29%,利润端显著修复。2026年第一季度,上述公司合计实现营业收入2923.71亿元,同比增长4.91%;合计实现归母净53.18122.7330.01图2:2025年&2026Q1计算机(申万)营收及增速 图3:2025全年计算(申万归母净利润及增速2025年与2026年第一季度多数企业收入端实现稳健增长。从收入分布结构看,2025年全年334家上市公司总共有176家实现正增长,较2025年三季报表现略降。天亿马、城地香江、亚信安全收入实现翻倍以上增长,2026年第一季度,家公司收入同比增长,收入增速翻倍以上公司达到11图4:2025年全年计算机(申万)营收增速分布 图5:2026Q1计算机(申万)营收增速分布2025年计算机企业盈利能力持续改善,2026年第一季度利润修复加速。从利润分布结构看,2025年全年受益于收入端持续修复,超5成公司实现盈利,160家公司实现利润同比正增长,利润修复基本同步于收入修复,其中盈利扩大、亏损缩小、扭亏为盈的企业分别71、56、33家。2026年第一季度188家公司实现利润同比正增长,扭亏公司数量显著增长,其中盈利扩大、亏损缩小、扭亏为盈的企业分别65、56、67家。图6:2025全年计算机(申万)利润增速分布 图7:2026Q1计算机(申万)利润增速分布毛利率承压,收入增长与降本增效驱动期间费用率降低。2025年全年计算机行业整体毛利率为23.98%,同比下滑1.60pp;整体销售/管理/研发/财务费用率分别为7.28%/4.79%/8.43%/0.20%,分别同比变动-0.50/-0.40/-0.68/0.06pp,费控持续推进下除财务费用率外均保持下行,整体期间费用率下降1.53pp,期间费用率降幅基本持平毛利率降幅。2026年第一季度,计算机行业整体毛利率为22.69%,同比回升0.36pp;整体销售/管理/研发/财务费用率分别为7.20%/5.08%/8.94%/0.55%,分别同比变动-0.43/-0.24/-0.43/0.56pp,期间费用率下降同时毛利率回暖,带动行业企业整体盈利能力较大改善。表1:计算机行业2025年全年&2026Q1毛利率与四费情况20232024202526Q125Q1毛利率27.5625.5823.9822.6922.32销售费用率8.287.787.287.207.63管理费用率5.375.194.795.085.31研发费用率9.699.118.438.949.38财务费用率0.000.150.200.55-0.01期间费用率23.3422.2320.7021.7722.31202520257.74%,同比回暖1.53pp26.00%,同比改善3.50pp,板块内公司加强项目回款,经营活动现0.60pp18.72%,存货与营业收入比达到21.91%,同比提升0.34pp,行业备货力度较中报相对减弱,但下游整体需求仍保持积极。总体看,计算机行业2025年经营质量整体改善,2026年第一季度由于行业多数公司收入占全年比例较低,上述经营数据与营收比例参考意义有限,应收账款与营收占比改善明显。表2:计算机行业2025全年及2026Q1盈利质量情况20232024202526Q125Q1经营活动现金净流量与营业收入比6.07%6.21%7.74%-19.20%-12.63%应收账款与营业收入比29.72%29.50%26.00%116.94%127.50%应付账款与营业收入比17.99%19.32%18.72%80.34%81.84%存货与营业收入比19.98%21.57%21.91%111.22%104.46%2025全年&2026Q1计算机分板块业绩表现分析大型企业业绩稳定性强,中小企业2025年全年减亏明显,硬件板块保持高速增长。截至2026年3月31日,申万计算机中市值超过500亿的企业共有14家,分别为海康威视、同花顺、中科曙光、金山办公、科大讯飞、浪潮信息、南网数字、三六零、紫光股份、德赛西威、指南针、大华股份、宝信软件、岩山科技。2025年全年计算机行业营收整体同比上涨8.01%,其中上述大市值企业营收同比增长18.79%,其他中小市值企业营收小幅增长2.29%;从利润端看,2025年全年全行业利润增速57.42%,大市值企业归母净利润增速22.53%,其他中小市值企业利润端减亏,由去年同期合计净利润-119.96亿元增长至-85.26亿元。此外,我们选取海康威视、大华股份、紫光股份、中科曙光、浪潮信息、中国长城、电科数字、神州数码等以计算机硬件为主要业务的公司作为硬件板块,2025年全年合计营收增长18.02%,合计利润增速为22.66%,收入增速高于行业整体水平,反映基础设施景气度较高,与海外趋同。表3:计算机行业2025年大市值企业/硬件行业营收利润与归母净利润营业收入(亿元)归母净利润(亿元)20242025同比增速20242025同比增速全行业12371.0813362.528.01%176.94278.5557.42%大市值企业4288.985095.0118.79%296.91363.8022.53%其他8082.108267.502.29%-119.96-85.2628.93%硬件4846.905720.4518.02%204.83251.2422.66%2025年全年及2026年第一季度板块经营分化,互联网金融持续强势。2025年全年及2026年第一季度,多30AI产业发展同样取得较快收入增长;网络安全板块营收基本持平,利润则受益于控费效果亏损同比显著缩窄;教育信息化、建筑信息化、金融IT、能源信息化等板块收入整体相对稳图8:2025全年及2026年第一季度计算机行业各子板块营收同比增长率(%)120%100%80%60%40%20%0%-20%26Q126Q140.93%-3.52%1.64%-2.07%21.14%13.18%-4.55%2.59%-7.12%-4.61%94.13%-15.89-6.96%-30.48-18.08-7.86%-9.75%0.56%-4.39%-2.33%2.23%-1.63%5.56%9.89%7.73%14.44%25.10%37.51%2025军工及卫星遥感应用工业互联网及工业软件国产化能源电力信息化医疗信息化建筑信息化IT智慧城市及政务教育信息化企业级服务网络安全智能汽车云计算互联网金融图9:2025全年及2026年第一季度计算机行业各子板块利润同比增长率(%)400%300%200%100%0%-100%-200%-300%建筑信息化互联网金融军工及卫星遥感应用教育信息化软件企业级服务医疗信息化400%300%200%100%0%-100%-200%-300%建筑信息化互联网金融军工及卫星遥感应用教育信息化软件企业级服务医疗信息化智慧能源城市智能网络云计金融电力国产及政汽车安全算IT信息化务化2025-107.2263.4761.42%33.31%20.72%6.90%-30.0565.29%-4.55%53.69%-38.3091.69%-47.36-100.826Q1-69.37-42.05-57.9225.17%-447.3-234.7持仓与估值2025年第四季度基金持仓情况25Q4计算机机构重仓持股比例环比下降0.44pct,连续八季度低配,低于近三年历史平均水平(以申万计算机为基准)。针对各基金机构发布的2025年四季度报告,我们对其前十大持仓股中计算机板块(申万2021一级行业分类)的数据进行了整理。2025Q4期末,基金持股总市值中计算机的占比为2.33%,较2025Q3环比下降0.44pct,低于历史3年平均水平3.72%,低于计算机板块市值占申万一级行业分类总市值的比重4.37%,连续八季度低配。2025Q4,计算机板块市值占比环比下降0.40pct,市值占比与计算机板块重仓持股比例同步下行,主要系宏观环境弱势下计算机板块业绩承压,叠加“模型吞噬软件”等论调,市场对计算机板块偏好有所降低。图10:1Q18-4Q25基金对计算机板块重仓持股比例7%6%5%4%3%2%1%1Q182Q181Q182Q183Q184Q181Q192Q193Q194Q191Q202Q203Q204Q201Q212Q213Q214Q211Q222Q223Q224Q221Q232Q233Q234Q231Q242Q243Q244Q241Q252Q253Q254Q25-1%-2%-3%持股比例 计算机市值占比 超配比例ind就个股情况而言,持有基金数最多的计算机公司前十名分别为金山办公、海康威视、同花顺、科大讯飞、浪潮信息、中科曙光、深信服、恒生电子、中科星图、合合信息。基金持股总市值最高的计算机公司前十名分别为金山办公、科大讯飞、海康威视、商汤-W、浪潮信息、金蝶国际、同花顺、中科曙光、深信服、大华股份。表4:25Q4计算机板块持有基金数最多&基金持股总市值最高&基金话语权最重持有基金数多 基金持股总值最高 基金话语权重股票简称持有基金数(家)股票简称基金持股总市值(亿元)股票简称基金持股占流通股比例金山办公262金山办公138.78金蝶国际10.61%海康威视184科大讯飞108.27星图测控10.03%同花顺140海康威视56.82科大讯飞9.83%科大讯飞108商汤-W48.66金山办公9.76%浪潮信息108浪潮信息48.27深信服8.36%中科曙光87金蝶国际45.19并行科技7.31%深信服87同花顺42.20国能日新6.70%恒生电子63中科曙光33.57中国民航信息网络6.29%中科星图52深信服26.67开普云6.24%合合信息52大华股份22.05商汤-W6.15%indW、金蝶国际、科大讯飞、-U。表5:25Q4计算机板块持基金加仓股数最多&基金减仓股数最多&基金持仓市值增加最多&基金持仓市值减少最多基金加仓股最多 基金减仓股最多 基金持仓市增加多 基金持仓市减少多股票简称持股变动股票简称持股变动股票简称持股变动股票简称持股变动(万股)(万股)(亿元)(亿元)商汤-W37,895.00广联达-6,917.86中科星图15.78中科曙光-62.44金蝶国际11,894.91中国长城-4,637.83科大讯飞12.83指南针-22.02科大讯飞4,501.59纳思达-4,141.65金山办公12.79德赛西威-14.62中科星图2,427.93中科曙光-4,132.39淳中科技6.73云天励飞-U-14.25大华股份1,759.75大智慧-2,901.25合合信息5.52纳思达-10.67拓维信息1,590.42朗新科技-2,689.05开普云5.18广联达-10.54金山云1,573.65紫光股份-1,617.76拓维信息4.79同花顺-9.56超图软件1,342.78海康威视-1,500.67金蝶国际3.98中国长城-7.95明源云1,205.14云天励飞-U-1,485.09星图测控3.44海康威视-7.93三六零1,038.51捷顺科技-1,300.37星环科技-U2.75浪潮信息-7.09行业及子板块估值情况2016年至今,申万计算机指数PE(TTM)均值为60x,其中历次与大盘共振上行的起涨点均处于估值低位,当前(2026.4.30)申万计算机指数PE(TTM)为81x,达到历史89.8%分位:1)2016年1月28日至2018年1月26日:申万计算机指数在上证指数上涨的过程中保持下行,系其估值仍处于相对高位,持续向下调整,PE(TTM)由68x下降至59x,且后续仍保持下行;2)2019年1月3日至2021年2月19日:申万计算机指数和上证指数共振上行,且小幅跑赢上证指数,申万计算机指数PE(TTM)从低点37x上涨至70x;3)2022年10月31日至2023年5月8日:申万计算机指数和上证指数共振上行,且跑赢上证指数,申万计算机指数PE(TTM)从低点46x上涨至70x;4)2024年2月5日至2024年5月20日:申万计算机指数与上证指数共同反弹,且在反弹过程中略微跑输上证指数,申万计算机指数PE(TTM)从43x反弹至56x;5)2024年8月27日至2026年1月14日:申万计算机指数与上证指数同步上行,且大幅跑赢上证指数,申万计算机指数PE(TTM)从40x反弹至96x;总体而言,估值处于低位是计算机板块底部反弹的特征之一。而计算机板块本轮上涨过程中,估值从202482740X202611496X81X90%分位水平,一AIAgentOpenClaw以G端和大B端客户为主的计算机企业业绩相对承压,分母端下滑致使板块估值相对较高。图11:过去十年申万计算机指数PE(TTM)行情数据截至2026.04.30收盘)计算机板块当前PE估值相对较高,但PS估值在TMT板块中仍具性价比。从估值看,计算机/通信/电子/传媒PE(TTM)分别为81x/61x/77x/45x,对应十年90%/94%/100%/82%分位数,计算机板块估值相对较高,在TMT板块中分位数相对偏低,主因计算机公司以大B/G端客户为主,受宏观经济影响过去一年计算机板块业绩仍处于由历史低位逐步修复阶段;但计算机/通信/电子/传媒PS(TTM)分别为3.4x/2.7x/4.0x/3.2x,对应十年52%/100%/94%/64%分位数,此时计算机板块估值分位数属TMT板块最低。图12:过去十年申万TMT各板块PE(TTM)情况(x)8060402002016/052017/052018/052019/052020/052021/052022/052023/052024/052025/05计算机(申万) 通信(申万) 电子(申万) 传媒(申万)行情数据截至2026.04.30收盘)图13:过去十年申万TMT各板块PS(TTM)情况(x)8765432102016/052017/052018/052019/052020/052021/052022/052023/052024/052025/05计算机(申万) 通信(申万) 电子(申万) 传媒(申万)行情数据截至2026.04.30收盘)智能汽车板块估值相对较低,多数板块受宏观影响P(TM估值处于5-1x我们采取P(TT)估值分析计算机各子板块估值情况,其中智能汽车PS(TTM)仅3.8x,AI产业驱动行业收入快速增长,估值处PS(TTM)位于5-10x区间,上述板块多与宏观经济相关性高,收入承压背景下估值亦处于中等水平,其中云计算板块收入与市值同步较快增长;金融IT、军工及卫星遥感应用板块PS(TTM)位于10-15x区间,主要因下游行业客户景气度较弱,收入端表现承压;国产化以及金融互联网板块PS(TTM)板块估值相对较高,因国产化中芯片公司PS较高、互金板块历史整体PS水平处于高位。图14:计算机各子板块PS(TTM)(x)302520151050PS(TTM)行情数据截至2026.04.30收盘)2026模型能力的持续性增强和以Claw为代表的应用渗透率大幅提升,共同促进了AI产业的快速发展。当前时点,我们没有看到模型能力的迭代上限,亦没有看到AI应用的终局形态,因而对于AI的整体的发展速度,我们认为仍应该以产业发展初期的积极乐观心态去选择投资机会和相关方向。对于大模型和应用的演变路径在当前应该投以更多的精力关注,以需求变化的维度出发对供给侧和算力端进行投资判断。总结来看,对于下半年的板块投资,我们认为非为AI产业链和非AI产业链两个维度。AI产业的投资逻辑与相关方向:从需求维度出发,关注涨价、缺货的算力方向、提效的infra与云产业、部分景气度高的应用方向。需求维度看模型迭代带来的训练需求仍在持续,应用加速渗透下的推理需求倍数增加。算力产业链端capex2026AI2000(300),160025Token消万亿/4120万亿/天,视频生成、智能体、长文档等场景带动Token消耗量大幅提升。因此,整体国内算力需求有望超预期的增长,带动产业链采购金额同比加速。我们看好以国产云厂商为采购方的相关算力产业环节,尤其是国产比例大幅度提升的环节,如CPU、GPU、AISC等国产芯片侧和IDC、算力租赁为代表的算力服务侧。云与infra有望享受需求上升带来的提价与产业链地位的重新定义。下游需求旺盛带动算力产业链通9AI算力、、。伴随需求和成本的双重变化,云和infra有望优化,建议围绕产业链的核心价值节点进行全面布局,重点关注模型厂商、云服务商、边缘推理领域及CDN、数据平台与数据库、安全领域的相关标的。大模型与应用抓住主要矛盾,寻找高景气度和可测算RIIfr4S、漫剧等可带来收入增加的方向。需求骤升是这轮AI产业供给失衡的核心原因,考虑推理成本始终存在的背景下,可通过AI工具提升收入的细分赛道方向值得重点关注。目前看到,1)政策支持Agent在算法与电力交易结合,可以明确提高储能站点和电站的月均收益;3)漫剧等内容制造产业受益多模态模型和AI制造工具的发展,成本下降的同时保持内容精品化,产业规模快速扩大;4)AIfor4SAI非AI产业的投资我们建议关注政策催化下的景气度方向:1)数字人民币2.0时代下的金融IT相关产业机会;2)“国七”标准出台后,智驾与技术服务相关产业机会;3)商业航天相关产业机会。二、大模型迭代暂无上限,持续引领全球AI发展海外大模型格局已基本集中于OpenAI、Anthropic和Google,三者在底层模型的迭代方向上已呈现出一定程度的分层:OpenAIBAgentOpenAIAGI,但面对另外两家竞对尤其是AnthropicARRB端适配倾斜。其中,GPT-5.5深化长周期复杂任务执行能力为基础,更试图借助全面升级的Codex实现对终端操作系统的底层接管与自动化调度。同时,原2的推出,也标志着其在多模态领域全面补齐短板。Anthropic:巩固B端壁垒,冲击模型智能上界。凭借早期在代码及合规方面的布局,Anthropic已成功在金融、医疗等高门槛企业级市场建立用户粘性与商业化壁垒。在确立B端基本盘后,Anthropic也开始探索智能边界。顶级模型Mythos在网络漏洞挖掘等复杂场景中展现出颠覆性能力,验证了模型能力的加速突破,更通过极高的溢价策略证明了顶尖智能的价值。oogeouTube等高质量视频数据生态,始终保持着最完善的模型矩阵enieoanoananaema及世界模型,谷歌已完成全赛道的覆盖。通过算力统筹与技术降本,谷歌有望凭借性价比优势,加速AI能力在千行百业基础设施中的全面渗透。OpenAI:GPT系列逐步优化B端场景应用,Image-2补齐多模态能力。OpenAI4GPT-5.5。作为全新旗舰模型,GPT-5.5在推理精度、复杂任务规划及Terminal-Bench测试82.7%GPT-5.47ClaudeOpus69.4;在GDPval测试中,GPT-5.584.9%的成绩,超越了垂直行业专家基线。此外,OSWorld-Verified78.7%,标志着其在跨应用协同操作能力上亦已追平Opus。图15:GPT-5.5与各竞品在Terminal-Bench2.0、GDPval、OSWorld-Verified等核心基准测试中的对比penAI,腾讯科长上下文与复杂任务执行能力大幅跃升,自我优化潜力显现。3D(如WebGL/Three.js应用重构)及高难度数学证明(如在纯数学领域协作发现拉姆齐数的新证明路径)等复杂任务展现出较好的表现。在超长上下文处400K-1M上下文,在MRCR长度74.0%,显著优于ClaudeOpus。此外,OpenAI在技术披露中指出,GPT-5.5Codex系统已能够分析底层数据中心的生产流量日志,并自主编写负载均衡启发式分区算法,使系统Token生成速度提升逾20%,已反应模型自我优化潜力。商业化路径逐步清晰,高Token效率+Agent能力突破助力B端部署。API输入与5TokenToken利用效率,其完成单次复杂任务的实际TokenArtificialAnalysis的智能指数,GPT-5.5在成绩最高的同时,其成本仅为同类前沿编码模型的一半;在内部benchmark测试中,GPT-5.5较GPT-5.4在相同表现下消耗Token数同样更低。此外,GPT-5.5的Agent能力同样得到了大幅突破,在官方测试中,GPT-5.5可以在真实终端环境中连续运行接近10小时,完成从任务拆解、执行到调试交付的完整流程,有望更好助力B端场景落地。图16:GPT定价策略penAI,智东图17:GPT-5.5在相同的表现下Token输出数更低penAI,智东Image2重塑视觉生成范式,原生推理架构建立断层式技术优势。OpenAI4月21日推出全新视觉基座模型GPTImage2,上线即以创纪录的241分优势绝对登顶Text-to-ImageArena等核心榜单。在底层架构上,该模型打破传统扩散模型路径依赖,首次引入原生推理机制,使模型在渲染前具备自主检索、推演布局与内容自检能,并具备生成复杂几何证明图解、3840像素动态分辨率重构的极强工程水准。图18:Image2在文生图模型榜单断层领先 图19:Image-2生成线代解释图示例智 智Anthrpi:Caude系列持续迭代,Myhos探索智能上界。Opus4.7实现视觉与Agent4月16日,Anhrpic商业级旗舰模型ClaudeOpus4.7。在核心能力上,Opus4.7SWE-benchPro得分从前代的53.4%跃升至64.3(超越GPT-5.4的57.7%GPT-5.5的58.6在AgentFinanceAgentevaluationSOTA,更在衡量金融、法律等高实际经济价值知识工作能力的第三方评测基准GDPval-AA中达到业界顶尖水平。此外,模型视觉感知能力实现代际飞跃,支2576(3753),XBOW54.598.5 图20:ClaudeOpus4.7Benchmark得分nthropic,AGIHun加码企业级长周期任务,精细化Token控制优化商用ROI。定价方面,Opus4.7维持了前代Opus模型每百万Token5美元/25美元的输入/输出价格。为匹配日益复杂的B端工作流,Opus4.7引入了“自我验证”机制,能够在长周期任务交付前自主审阅与纠错。同时,Opusultrareview功能,并将支持无间断执行的AutoModeMAXNotionOpus后其整体性能提升,工具调用出错率下降约三分之一。为应对新Tokenizer(相同的输入内容,token数量会比以前多出约0%推理档位带来的潜在Token消耗增长,Anthropic在长任务中精细化管理TokenB端商业化的成本可控性。 21:Claude定价策略编程能力跃升突破,展现颠覆性网络安全漏洞挖掘能力。区别于常规商业迭代,Anthropic于4月7ClaudeMythosPreview,且在以编程能力为代表的基准测试中呈现出突破式跃升。其中,E-benchOpus13.1,OpusE-benchOpusOpus64.3%),82.0%(OpusOpus69.4%)。更为关键的是,Mythos展现0day27年之久的OpenBSD远程崩年前的FFmpeg10倍。成立ProjectGlasswing联盟,极高定价印证顶尖算力的极高商业价值。鉴于Mythos带来的系统级网络安Anthropic亦选择暂缓向公众开放,转而联合AWS40余家关键基础设施组织成立ProjectGlasswing联盟,旨在为防个月的安全加固窗口期。在定价侧,MythosPreview向受邀机构开出了每百万Token美元/125美元的输入/Opus5倍,持续验证了模型智能上界突破带来的价格上行趋势。图22:ProjectGlasswing联盟成员nthropic,华尔街见Google:模型矩阵丰富,全面布局各类场景。3.1Pro核心推理能力升级,稳固全模态与复杂任务解决优势。2日发布新一代旗舰模ProARC-AGI-277.1%的准确率大幅领先竞品,相实现翻倍跃升。在代码与AgentLiveCodeBenchMCPAtlas的成绩领先。此外,Gemini空间推理与复杂图形生成方面取得突破,仅需文本指令即可快速生成高质量、带交互的SVG动态图形,且原生支持百万ken超MRv2大海捞针准确率达4%自然语言编程与应用生成能力较强。通过VibeCodingGemini3.1ProAPIToken212美元,展现出较高的性价比优势。目前该模型已全面接入GoogleAIStudio、VertexAIGeminiAppNotebookLM,图23:Gemini3.1Probenchmark得分oogle,APPSO模型布局全面:多模态、端侧小模型与世界模型构建护城河。除系列外,谷歌全面布局模型矩阵。图像生成领域发布anoanana148秒的连贯视频延展,进一步打通AImma4系列并全面切入Apache26BMoE与Dense版本性能比肩千亿级闭源模型,极小参数版本原生支持边缘设备完全离线运行,有望打开端侧AI的Genie,率先落地生成式交互环境,从底层颠覆传统游戏化编码至渲染的开发逻辑,提前卡位游戏、工业等场景AI需求。通用模型:进入密集发布期,迭代加速国产大模型步入密集爆发期,能力高位收敛,全线挺进全球第一梯队。据ArtificialAnalysis统计,今年以DeepSeekKimiMiniMa、小米、智谱等的模型迭代速度显著加快,并在多模态输入、长上下文窗口、长周期复杂任务执行、代码能力上补齐短板。同时,通过压缩方式、注意力机制等底层架构方面的创新,国产模型在SWE-BenchProGPT-5.4与ClaudeOpus等海外头部模型的同时,亦展现出相当程度的Token性价比。能力性价比有望构成国产模型在AI商业化落地下半场中的技术壁垒。图24:中国部分大厂模型发布历程trificialAnalysi图25:各模型在ClawEval的Pass^3tokenEfficiencyMiniMax:3月18日推出M2.7模型,核心聚焦于“模型的自我进化”。通过创新引入AgentHarness与AgentGDPval-AA1495Office套件(Excel/PPT/Word)个复杂技能调用(>2000Token)。此外,模型在端到端项目交付及复杂系统深层理解(TerminalBench2中均达到行业前沿水平。图26:MiniMaxM2.7benchmark表现iniMa智谱:488小时的纯自主闭环工作流,且首次解锁开源模型与当时全球顶尖闭源模型ClaudeOpus的全面对齐。其中代码能力方面,在业内最具代表性的三个代码评测基准(衡量模型专业软件开发工作的SWE-BenchPro、操作命令行解决问题的Terminal-Bench、从零构建完整代码仓库的SWE-Bench基准测试中,GLM-5.158.4ClaudeOpusGPT-54的57.7分。图27:GLM-5.1在编程benchmark上的平均表现 图28:GLM-5.1在SWE-BenchPro上的得分 Kimi:4K2.6Agent能力上,模SWE-Bench榜首;在集群协同上,K2.6300Agent并行完成5天的持续自主运行。依托官方自研的M3Max大模型推理引擎,K2.6深度重构1.23MT/s2.86MT/s全栈自建水平上展现出显著优势,在专门创建的前端开发设计基准测评KimiDesignBenchmini3.1Pro。图29:KimiK2.6Benchmark得分im阿里巴巴:4月日通义千问发布新一代旗舰模型早期预览版Qwen3.6-Max-Preview,重点提升了智能体编程能力(和前代相比,SkillsBenchSciCodeNL2Repo+Terminal-Bench、世界知识(QwenChineseBench+(和前代相比,llFormatIFBenchAtfcalAnayssGM5.1、等模型。在工程化部署侧,阿里云百炼API同步首发了preserve_thinking功能,允许在消息流中保留前序轮次的思维内容,专门针对复杂的智能体多步连续执行任务进行了底层状态维护与可靠性增强。图30:Qwen3.6Max(Preview)Benchmark得分里巴小米:4月23日,小米正式发布MiMo-V2.5系列基座大模型。其中MiMo-V2.5-Pro专为长难Agent任务打ClaudeOpus4.6、等全球顶尖AgentiMo-V2.5-ProSysYEDA设计等重度测试中表现优异,综合实力逼近全球顶尖闭源模型。此外,该系列在全模态感知实现TokenAgentClawEval分数情况下,Kimi42%Token,MiMo-V2.5相比MuseSpark%Token;配合夜间专属优惠及不区分上下文窗口的API统一定价策略,大幅优化了企业级客户的商业化调用成本。图31:MiMo-V2.5-ProBenchmark表现DeepSeek:4日,DeepSeek-V4284B,两个版本,原生支持上下文长度。在公开测评集表现上,DeepSeek-V4确立开源新标杆,紧逼顶尖闭源模型。在知识与推理维度,V4-Pro在MMLU-Pro87.5%Codeforces中获的RatingGPT-5.4(3168分)miniMRCR1M(百万上下文多海捞针)83.5%。在Agent复杂任务基准中,在SWETerminalBench54分)评测中,展现出极强的端到端执行与工具调用能力,稳居全球第一梯队。核心技术方面,DeepSeek-V4CSA、KVCache节省Token计算量的同时,保证了模型训练的稳定性。此外,在后训练阶段,V4放弃了传统的RLHF,转而采用多教师同策略蒸馏与生成式奖励模型,有效避免了传统强化学习导致的对齐税(对齐带来的模型降智)及模型通用能力退化现象,实现了模型多维能力的高度均一化。图32:DeepSeek-V4benchmark表现eepSee多模态模型:工程化产物,国内产品后来居上字节跳动与MiniMax原生多模态矩阵布局完整。作为国内最早在多模态领域完整布局的厂商,字节跳动与MiniMax212日正式更新Seed2.0Seedance2.0,前者深度融合与AgentSOTA水平;后者则依托原生统一架构,实现音、画、文本的深度协同生成,支持多镜头长叙事与原生级声音画同步,在动作一致性与物理规律遵循上展MiniMaxHailuoSpeechMusic构建了完整的多模态布局。其中,在肢体动作呈现与人物微表情方面实现显著提升;Speech将端到端延迟降低Fluent音色复刻;Music则在乐理结构理解与指令控制上取得突破,全面支持、Key及段落结构的精细化编排;三者协同配合,极大降低了复杂多模态内容的创作门槛。图33:Seedance2.0生视频案例 图34:HailuoMediaAgentiniMa大厂全面补齐多模态能力。国内其他大厂通用在多模态发展浪潮下加速补齐能力版图。其中,智谱AI联合华为开源了首个基于国产算力底座(昇腾800TA2+昇思MindSpore)训练的多模态SOTA模型GLM-Image,采用自回归+扩散解码器架构,在复杂文字渲染(CVTG-2K)榜单取得开源第一,验证了国产全栈算力在多模态大规模训练上的可行性。阿里巴巴ATH创新事业部推出原生多模态视频生成模型HappyHorse,不仅实现电影级的叙事质感与极强的指令遵循,更以720P低至0.44元/秒的价格彰显极致性价比。DeepSeek(模型难以精准指出画面的中的物体问题,DeepSeek首创将边界框与空间坐标点作为视觉原语离散化,并直接嵌入大语言284B参数/13B激活的MoE主干,创新性引入压缩稀疏注意力机制(CSA),Token7056倍的(756×75681KVCache条目线策略蒸馏及针对性设计的GRPO强化学习机制,使模型在拓扑推理及细粒度计数等基准测试中,对GPT5.4与ClaudeSonnet等顶尖闭源模型形成断层式领先。图35:DeepSeek模型多模态理解能力领先海外头部模型eepSeek,51CTO技术多模态赛道竞争白热化,国内视频生成模型实现霸榜反超。据OpenAIGPT-Image-2Gemini系列包揽了双榜单的前五名,而国内9名)Seedream名)Top阵Seedance2.0与阿里的HappyHorse1.0凭借原生多模态架构的优势,强势包揽了文生视频、图生视频以及视频编辑三大核心榜单的全球冠亚军,将谷歌Veo3.1、OpenAISora2Pro及xAI的Grok均压制在其后;此外,快手Kling系列在视频编辑榜单中亦稳居前列(第4与第6名)。图36:文生图模型排行榜图37:图象编辑模型排行榜lmlm图38:文生视频/图生视频/视频编辑模型Top10lmArena大模型能力增强提升渗透率,推动Token全球大模型智能水平呈陡峭上升,中美双模型能力差距持续缩小。正如2.1和2,2中提及的,中美大厂模型均快速迭代,对应模型能力加速跃升。参考ArtificialAnalysis大模型智能指数,自2022年底以来,美国模型智能指数持续增长,且呈现加速趋势,重大能力迭代的时间窗口持续缩短。同时,国内大模型则自2023年下半年起加速,在短时间内大幅缩小了与美国头部模型的差距。随着时间推移,中国开源模型能力有望持续逼近海外头部模型能力。图39:中美前沿模型迭代情况rtificialAnalysi模型密度法则显现,算力向能力转化的效率步入指数级爆发阶段。模型能力跃升不仅依赖算力堆叠,底层算法效率的突破同样推动模型智能上界突破。清华大学团队最新研究揭示,大模型领域已呈现出显著的密度法则(DensingLaw),即模型能力密度随时间呈指数级增长,开源大模型的最大能力密度约每3.5个月即可实现翻倍。此外,自ChatGPT发布以来,受资本密集投入与高质量数据工程驱动,模型能力密度的增长斜率较此前大幅提升约50%。这意味着,在同等参数规模及算力消耗下,模型性能上限正以前所未有的速度被打破。算法效率的极速提升不仅实质性优化了端侧部署与推理成本,更为下游大规模调用Agent工作流及执行复杂长周期任务提供了充足的底层支撑。图40:模型密度法则ensinglawofLLMs基于模型密度法则,研究团队进一步揭示了算力效能提升在商业化应用端的两大方向:)模型推理成本将呈断崖式下降趋势,为AI高频调用提供基础。模型能力密度快速上升,达到特定智能所需的实际参数量呈现指数级缩减。反映在商业端,同等性能大模型的API调用价格呈现出比模型能力更陡峭的下降斜率(但智能上界模型则价格或将提升)。实证数据显示,跑赢GPT-3.5性能基准的模型API价格约每2.5个月即可实现折半。例如,Gemini-1.5-Flash每百万Token定价较2022年底已累计暴降逾266倍。)密度法则+摩尔定律共振,算力普惠向端侧延伸。密度法则反映了软件算法层面的效率迭代,而摩尔定律(同价位芯片算力约2年翻倍)则框定了硬件的物理进步。两者叠加产生的乘数效应,使得在同等价格消费88AIPCAIIoT图41:表现优于的的价格 图42:摩尔定律和密度法则曲线交汇 ensinglawofLLMs I前全球大模型应用Token调用量陡峭上行。应用token消耗量加速上行,主要系模型能力的持续提升拓宽了多模态处理与长文本能力边界,同时Agent工作流的普及使得单次指令转化为模型内数十次复杂循环调用。以谷歌为例,20244月谷歌月token9.72025450x至79801300万亿;月,谷歌第一方模型在通过客户直接API100亿4320万亿TokenzureAI100万亿Token202553月单月的Token调token调用量增长同样陡峭,51200亿,20252025516.4200%;20263tokens使20251263Token消耗飙升标志着AI应用正从低频的单次辅助交互向高频复杂工作流发展。图43:谷歌月均token调用量 图44:豆包日均token调用量oogle 国内大模型调用量爆发,官方定名“词元”推动产业渗透提速。随着国产大模型能力的突破与推理成本的断崖式下降,中国生成式AI2025年底,我国生成式AI6.02亿42.8%Token调20251003万亿次。2026年3月正式将Token的中文标准定名为词元,底层技术语言的本土化确立,有望Token消耗量的增长。图45:中国日均词元(Token)调用量增长曲线 图46:中国生成式用户规模变化解局,国发展革委新华 解局第互联发展况统建投三、国内算力需求陡增,AIInfra走入新阶段ROI导向时代价值持续凸显导向时代价值持续凸显,能够量化证明成本节省的软件层将获得最高溢价。用户最终业务产出硬件投入×软件乘数效应,软件层通过提升算力效率,降低AI开发技术壁垒、以及直接和间接的成本优化,AI(TCO)的至,其ROI潜力最为突出。与此同时,企业须建立完善的成本可观测性体系,通过部署算力监控、FinOpsAI支出均可追溯、可审计。在平台选型上,优先考虑能够“算清账”的端到端一站式平台,从源头降低工具链整合成本。此外,技术路线的选择应与业务场景ROI敏感度相匹配:通用场景优先采用成熟开源方案以控制许可成本,核心竞争力场景则应针对性投资商业产品以获取差异化能力。表6:ROI导向时代,Infra价值持续放大价值提升细分维度核心问题软件解决方案量化效果受益角色硬件利用率 GPU空闲、显存浪

连续批处理PagedAttention

吞吐提14-24x Infra团队提升效率

训练加速 多卡扩展效率低 分布式并行策略 线性效率>90% 算法团队推理优化 延迟高、成本高 量化、编译优化、缓存 延迟降低3-5x 业务团队开发迭代实验周期长实验追踪、自动调参周期缩短60%算法团队分布式训练需掌握NCCL/通信高层API封装代码改动<10行算法工程师降低门槛GPU编程需掌握CUDAPython原生语法无需C++经验算法工程师集群运维GPU调度复杂K8s原生调度器运维人力减半运维团队模型管理版本混乱、难复现模型注册中心100%可复现全团队硬件成本大模型需多卡量化+蒸馏需求降50-90%财务/采购优化成本云资源成本推理成本按需付费贵调用量大Spot实例调度语义缓存、批处理60-70%30-50%FinOps业务团队人力成本Infra人才贵自动化工具链人效提升2-3xHR/管理层里云,里云,ADFeed,通义千问,蚂蚁,夸产业栈形成了“应用层—基础设施层—算力层”的三层结构。AIInfraAIInfra可细分为数据层、模型层、工具层、平台层四个维度,每个维度下又包含多个组件。这表明AI基础设施绝非简单的模型+GPU,而是一个涉及数据工程、模型工程、开发工具、运维治理等多领域的复杂系统。这种复杂性既是创业公司的机会(可以在细分领域深耕),也是大厂的护城河(可以提供一站式解决方案)。图53:AI技术设施全景图明创进入2025年及以后,AI产业正式迈入Agent落地阶段。这一阶段的核心标志是AI应用从基于检索增强(Agent)工作流。上一阶段解决的是“如何让模型高效、准确地回答问题”,当前阶段的核心诉求则是“如何让Agent在真实业务场景中可靠地执行复杂Agent开始具备了更强的任务分解与执行能力,逐步从早期的概念炒作走向实际落地,成为连接底层算力基础设施与顶层企业级应用价值的最后一公里。表7:AIInfra发展进入Agent落地时代领域训练基础设施时代规模化训练时代推理基础设施爆发时代Agent落地时代时间2017-20202020-20222023-20242025-未来核心问如何让ML工程师更高效如何训练更大的模型(算如何高效推理?如何快速构如何让LLM在企业环境中安题训练和管理模型力、内存、通信)建LLM应用?全、可靠、可控地运行?技术焦训练框架易用性、实验管分布式训练、模型并行、混推理优化、应用编排、知识评估、安全、可观测性、数点理、模型版本控制合精度、梯度检查点检索增强据质量、Agent可靠性典型规单机或小规模分布式,模数百到数千GPU集群,模型API调用、RAG应用、聊天企业级部署、合规场景、复模型参数百万到数亿级参数百亿到千亿级机器人杂工作流自动化户

ML研究员、数据学家 大模型公司的训练团队 应用开发者、企业

CTO团队

2017:Transformer架构发

2020:DeepSpeed开源(微

2023.01:LangChain

2024.06:Agent从炒作走向实术 明软)用2018:BERT发布,预训练2021:Megatron-LM成熟2023.03:llama发布,开源推2024.11:AnthropicMCP发-微调范式确立(NVIDIA)理兴起布,试图标准化工具调用2019:PyTorch1.0稳定,成2021:FSDP发布(PyTorch原2023.06:vLLM开源,推理效2024.12:AI安全监管压力上为研究首选生支持)率革命升(EUAIAct生效)2020:HuggingFace生态形2022:各种训练优化技术2023.06:向量数据库融资热潮2025H1:企业开始关注LLM成(ZeRO、3D并行等)成熟(Pinecone等)的TCO和ROI2023.11:OpenAIAssistants2025H1:云厂商ServerlessAPI推理成熟2024.01:RAG成企业应用标准范式2024.06:推理引擎高度成熟VP,德勤,MicrosofAgent的爆发式落地催生了对全新组件的迫切需求,并将彻底重塑软件的交互形态与价值分配。传统的模型推理和微调平台已经无法满足Agent在复杂规划、记忆留存、工具调用和多智能体协同等维度的要求。因此,围绕Agent的工具链和平台层正迎来系统性的重构。行业头部厂商推出MCP(模型上下文协议)以标准化工具及数据源的连接;各类安全沙盒环境被广泛部署以保障Agent自动执行代码的安全边界;而针对AgentAIInfra领域最具确定性的产CopilotAutopilot”模式演变。客户的关注点从单纯的“降低基础设施成本”转移到了“采购能够直接替代或增强生产力的Agent员工”。这种高度复杂的系统级工程,不AI巨头加速构建一站式开发平台,以此来抢占下一代软件生态的入口并加固自身护城河。表8:对话式AIvsAgenticAI维度对话式AI(Chat)AgenticAI(Agent)执行范围只生成文本调用工具、操作外部系统交互模式人类发起→AI响应→人类验证人类定目标→AI自主规划+执行推理次数单轮对话=1次推理单个任务=10-100次推理价值创造信息获取、内容生成任务完成、流程自动化基础设施需求模型API+简单前端编排框架+工具调用+记忆+可观测性商业模式按Token收费按任务/成果收费(更高客单价)reshworks,Nexus,sprinklr,中信建投证券表9:Agent需要一整套新的基础设施技术栈基础设施层为什么Agent需要代表产品/公司编排框架协调多步推理、条件分支、循环执行LangGraph,CrewAI,AutoGen工具调用/MCPAgent需要与外部世界交互(API、数据库、浏览器)AnthropicMCP,LangChainTools记忆系统跨会话的状态保持、长期知识积累MemGPT,Letta,向量数据库可观测性追踪多步执行链路、定位失败节点LangSmith,AgentOps,Arize评估测试Agent行为不确定性高,需要系统性测试Braintrust,LMQL,AgentEval安全防护Agent有执行权限,需防止越权/被注入Lakera,PromptSecurityadrona,datacamp,中信建投证券AI基础设施赛道的投资价值呈现显著的梯次分化。边缘推理与企业级数据平台依托不可逾越的物理基础设施与严格的数据合规要求,确立了极强的业务防御属性,其按需计费模式赋予了收入端类似底层算力硬件的指数级增长弹性。网络安全与可观测性领域凭借高度标准化的产品矩阵维持着优异的盈利质量与现金流,但在底层模型功能逐步延伸的趋势下,其长期核心逻辑将深度锚定于跨平台协同与独立第三方优势。相较之下,本地化交付与专业数据标注虽受制于重人力投入导致的较低毛利率,却凭借线下物理部署的刚性需求与人类认知逻辑的绝对主导地位,有效规避了技术快速迭代带来的产业侵蚀风险,具备高度的业绩确定性。表10:AIInfra细分赛道投资价值分层矩阵细分细分业 商业辑 AI侵险 行业性

存算分离/

能解决Agent中心化算力成本墙与物理延迟的方案极低Agent需求越大,边缘分发越贵。企业AI的运行环境低锁定了数据就锁定了分成权虽面临模型内化安全功能的冲击中但第三方安全的中立性地位无法撼动。数据标注

按Token/人力密集型按项目或数据条数计费。

多模型时代的裁判员中,但跨云、跨链路的深度治理仍是独立厂商的天下。大厂商业模式不匹配,私有云落地的最后一公里极低虽然规模化难,但确定性极强。极低 大模。eloitte,Mckinsey,中信建投证券建议围绕AICDN、数据平台与数据库、安全领域的相关标的。CPU:Agentic重塑通用计算价值从预训练到强化学习与AgenticAI,人工智能的范式演进推动了CPU需求量的显著提升。在Agent场景中,CPU的并发处理能力、内存带宽与任务调度效率直接决定了Agent的端到端响应延迟与任务吞吐效率。当Agent并发量超过传统成为系统性能的核心制约因素。过去在算力产业链中的价值分配上CPU被持续边缘化,而随着AgenticAI带来的CPUArmCEOHaas指出,传统AI3000CPU核心,而在AgenticAI时代CPU核心Intel2026Q1CPUGPU配比将从现1:1。图47:AgenticAI带来CPU需求量的显著提升RM在不同类型智能体任务中,在运行耗时、能耗、吞吐效率上相较于均占据了较高比重。Tech与Intel11月联合发布的研究成果:1)、Web增强、重度科研任务这三类Agent80AgentCPU耗时来源有所不RAGWebAgentI/OBound占据较高耗时比重,而在科研任务重,主要耗时来自于数据分析、分子模拟、物理仿真等任务;同时所有任务在更和配置下,CPU耗时占比反而进一步提升;能耗占比:在中大批量情况下,RAG、联网搜Agent61%、57%、60%;3)CPU并行化策略的效率较低。当Agent(Batch128时,GPULLM推理CPU200%。图48:AgenticAI带来CPU需求量的显著提升TowardsUnderstanding,Analyzing,andOptimizingAgenticAIExecution:ACPU-CentricPerspective从产业的角度看CPU的投资逻辑总结如下:随着人工智能范式向智能体和强化学习演进,CPU必须高频执行代码编译、验证、解释和工具调用等CPU需求瓶颈。在信创叠加AICPU厂商将率先受益。(RCDMDDR5模组在超高频运行下对信号完整性、供电精度及热管理存在极高要求,单根内存条所刚性绑定的配套器件——包括电源管理芯片、串行检测芯片(SPDHub)以及温度传感器(TS)等器件单机用量也将随之实现同比例爆发。同时,为了突破主板物理空间对内存总容量的绝对限制,CXL协议及相应的内存扩展控制器成为实现内存池化与横向扩展的必然路径。需求增加将拉动本土服务器OEM/ODM厂商的出货量。尤其是在当前全球CPU产能出现错配、面临持续缺货及涨价周期的背景下,具备强大供应链备货能力及规模优势的龙头厂商有望获取更高的市场份额。四、CLAW引领Agent新形式,2B赛道重视产品力类Claw产品加速消耗AI推动第四次工业革命,自主化Agent重塑生产活动范式。信息技术时代被认为是第三次工业革命,但严格意义上的传统互联网时代并未改变人类生产活动的基本模式,其核心仅是大幅提升了信息的传输效率。而过去几年的人工智能虽被寄予第四次工业革命的厚望,但早期的对话式大模型仍局限于辅助工具的形态,未能与传统应用拉开代际差距,也未衍生出全新的流量/服务分发方式。OpenClawAgent自主化得到了市场的关注。Agent的核心突破在于其不再是单纯的信息处理器,而是可以成为具备自主规划、工具调用、纠错迭代和完整执行工作流能力的数字员工。从辅助人的副驾驶(Copilot)到替代人力,Agent有望突破人类自身处理复杂任务的物理限制,使得AI真正具备了推动第四次工业革命的底层要素。而据Anthropic研究发现,ClaudeCode99925分钟增长到超过45AI自主化的发展趋势。AI安全研究机构也发现,7个月翻一番——2024年底,最强模型只能处理人类需2025年底,GPT-5、ClaudeOpus已能完成人类需要数小时的工作。图49:人工智能时代被誉为第四次工业革命 图50:ClaudeCode最长操作的时间逐步提升业4.0研究 GIHun图51:LLM能独立完成的软件工程任务时长ETR,连享Agent工作流驱动Token消耗井喷。随着大模型技术从参数扩张向强化学习与推理侧扩展,AI应用正向AgentAgent协同使得底层TokenOpenClawClaw产品出圈使Agent自主化得到了市场的关注。此时,AgentToken消耗量,RouterToken调用量持续激增(16.42T24.52T)。图52:OpenRouter平台模型token调用量(截至2026年5月3日)penRouteToken消耗快速增长背景下国产模型核心竞争力提升。的复杂任务执行能力同时带来了对token消耗token一是多轮自我修正,二是上下文无限膨胀Agent“记三是工具链级联,Agent5-10次API调用,每次都背着完整上下文。在此背景下,token的成本敏感度被快速放大,国产模型的成本优势凸显。以每日1亿输出token测算,若采用ClaudeSonnet4.6GPT-5.21400token消耗下,MiniMax、GLM-5的成本分别在140320300美元,显著低于海外模型。且国内开源模型在低成本之外,还针对Agent场景进行了原生适配,包括MiniMaxForge强化学习框架、Kimi对Agent图53:MiniMax系统设计 图54:KimiK2.5/K2.6智能体集群iniMa imToken需求增长带动全产业链提价。Token消耗的增长除了利好模型API以外,随着产业链持续传导至云、等全链条环节。今年以来,国内外云服务商持续上调服务价格,海外AWS、谷歌云实施或宣布未来实施涨价措施,最高涨幅达100%Coding均宣布不同程度涨价。随着Caw对硬件端的需求不仅仅体现在PUCPU、内存、存储、安全审计、边缘节点等多个环节。表11:云相关涨价情况公司 公告时间 涨价幅度 主要调整内容亚马逊 2026年1月22日 约15% 上调EC2机器学习容量块价格,其中p5e.48xlarge实例每小时费用从34.61美元涨至39.80美元北美100%、欧洲60%、数据传输服务价格调整:北美从0.04美元/GiB涨至0.08美元谷歌 2026年1月27日

亚洲42%

/GiB,欧洲从0.05美元涨至0.08美元,亚洲从0.06美元涨至0.085美元。2026年5月1日起生效。网宿科技 2026年2月5日

CDN35%即日起,CDN35%,40%、对象存储40%,40%。40%优刻得2026年2月11日对续签及新签用户的全线产品与服务进行价格上浮调整。2026全线产品上浮调整年3月1日起生效。智谱2026年2月12日30% GLMCodingPlan消首购优惠云服务器平均涨幅达到25%-37%,部分机型涨幅可能会更高;独立服务器平均涨幅14%-20%,部分型号例如拍卖服务器价格Hetzner2026年2月25日全线产品上浮调整+3%;高端机型例如SX系列服务器价格涨幅在20%-30%;对象4.996.4930%。2026年4月1日起生效。自3月13日起调整部分模型计费策略,其中混元系列模型TencentHY2.0Instruct0.0008/tokens腾讯云2026年3月11日463%0.004505/tokens,463%。同时,腾讯云GLM-5、MiniMax2.5、Kimi2.5免费公测阿里云2026年3月18日AI算力、存储等产品平头哥真武810E等算力卡产品上涨5%—34%,文件存储产品最高涨价34% CPFS(智算版)上涨30%。2026年3月18日起生效。百度云2026年3月18日5%-30%AI相关基础设施成本出现显著上涨,为保障平台长期稳定运行与服务质量,418,AI5%至30%,30%。202659AITKE-原生腾讯云2026年4月9日5% MapReduce(EMR)相关产品的刊例价将统一上调5%。阿里云2026年4月13日DataWorksAPI免费额度,并支持按量付费。DataWorksAPI- 10/月,超出部分按量付费;专业版免费额度为50/月,超出同样按量付费。2026414-423逐步生效。阿里云2026年4月15日DDoS2.0(包年包月)、DDoS(中国内地)以20%-50% DDoS(非中国内地)95整。其中,DDoS(中国内地)95100/Mbps/月调整为150元/Mbps/月。2026年7月15日起生效。腾讯云 2026年4月28日 100%-154%讯网,StartupRise,IT桔子,阿里

AICodeBuddyWorkBuddy51578/人198/人/154%;158人/316/人/100%。国内大厂快速跟进Claw产品布局,争夺Agent生态入口。目前,国内大厂正加速布局Claw产品,从最初支持OpenClaw部署转向自有Claw产品和相关生态融合发展。截至本周五,包含阿里、字节、腾讯在内的多家大厂均上线了自有Claw产品,加速争夺用户。大厂Claw产品主要围绕两个方向布局,一方面是便捷化接入OpenClaw,凭借低门槛快速吸引用户;另一方面是自研产品,与自身应用或硬件生态深度绑定,提供更便捷与安全的用户体验。当前,Claw类产品仍处于发展初期,大厂发力争夺Agent场景入口,随着未来商业模式逐步跑通,相关的Token、云服务、安全服务以及SaaS软件订阅付费等有望带来增量市场。表12:国内厂商claw产品发布情况时间 厂商 产品/动作 部署方式 生态/模型特征2026年211

网易有道LobsterAI正式发布 本地部署 全场景个人助理Agent,融合OpenClaw执行能力与GUI界面。2026年216

月之暗面KimiClawBeta版上线

云端托管 基于KimiK2.5模型,集成在Kimi平台内,面向付会员开放。2026年218

月之暗面 KimiClaw正式推出 云端托管 基于开源框架OpenClaw的云端托管服务,需Kimi高级会员。2026年226

MiniMax MaxClaw博发布

云端SaaS 基于OpenClaw构建,直接集成在MiniMaxAgent网端。2026年33

阿里巴巴QoderWork全面开放 本地部署 阿里旗下桌面Agent,从代码编写向日常办公场景扩展。2026年33

MiniMax MaxClawApp端全球上线

云端SaaS 支持iOS及安卓,用户可在手机端运行,数据与网端同步。3月6日并开启小范围封测3月6日并开启小范围封测(系统级) 系列。2026年字节跳动3月9日ArkClaw正式上线火山引擎推出的开箱即用云上SaaS版,深度适配飞云端SaaS书。2026年 腾讯3月9日WorkBuddy正式上线云端/本地 腾讯云推出的全场景AI智能体桌面工作台,无缝接企业微信、QQ等。2026年 智谱AI3月10日AutoClaw正式上线本地部署 国内首个“一键安装”本地版,预置50+Skills,持一键接入飞书。2026年 腾讯3月10日QClaw开启内测本地部署 腾讯电脑管家团队开发的本地AI助手,主打微信扫即用。2026年 百度3月11日DuClaw正式发布零部署云服务百度智能云推出,深度集成百度搜索、百科、学术等核心能力。

小米 Xiaomimiclaw发布

移动端

国内首个手机端类OpenClaw应用,首批支持小米172026年3月11日 华为

小艺ClawBeta版上线 系统内置 华为基于鸿蒙系统推出的AI智能体,支持一键唤醒。2026年3月12日 阶跃星辰

StepClaw云端版本发布 云端部署

支持一键部署,搭载专为Agent优化的Step3.5Flash模型。讯网,StartupRise,IT桔从辅助工具演进为战略级科研基础设施科学研究是驱动经济长期增长的核心内生动力,其投入正成为国家竞争力的结构性变量,并呈现出“高强(AIforScience,简称AI4S)是指科研人员基于科学激励,运用深度学习、机器学习等人工智能技术,高效处理多维、多模态的大规模数据并构建准确的科学模型、工具或产品,可为生物医药、材料科学、能源科学、环境科学等领域的科技创新提供支AI4S发展主要分为以下三个阶段:辅助分析(1960-2011年。支持向量机开始规模化应用,催生了生物信息学并实现了星系自动分类。AI在此时主要扮演“辅助工具”,协助人类从海量观测中提取初步规律。深度突破(2012-2022年)AI方面,以AlphaFold2物学界年的蛋白质折叠难题。生成验证(2023年至今)AI与自动化实验室联手开启了“生成—验证—迭代”的科研闭AIMatterGen合A-Lab等自动化实验室的快速实验验证,AI已由辅助工具蜕变为主动参与科研全流程的合作伙伴,极大地缩短了从科学假设到实体发现的周期。图55:AI4S发展阶段通当前,全球科研正由“单点实验”向“系统集成”跨代跃迁,AI4S已从辅助工具演进为战略级科研基础设施。各国通过顶层设计,整合算力、数据与自动化实验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论