版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
证券研究报
告从百舸争流到自成畦径——2026年中国AI投资策略主要内容算力:国产架构元年模型:性能差距拐点应用:商业化突破10%重点标的与估值3108.2139.9273.5190.629%96%110%0%20%40%60%80%100%120%0.050.0100.0150.0200.0250.0300.02022A2023A 2024A国内AI芯片出货量(万片)2025H1yoy86%85%70%62%10%9%24%17%1%
0%
1%3%100%90%80%70%60%50%40%30%20%10%0%2025H12023A寒武纪2022A英伟达 华为平头哥天数智芯 燧原科技2024A昆仑芯 海光沐曦股份 摩尔线程40
AI芯片,需求放量,国产加速迭代国内自2024H2进入算力需求爆发期,AI芯片出货量高增2025H1,国内AI芯片出货量191万片,yoy+110%外部环境下,国产化趋势明确,份额快速提升2025H1,国产芯片市场份额约38%,2023年仅为15%,2年实现翻倍以上增长国内AI芯片格局明晰,华为、寒武纪、海光+大厂ASIC凸显趋势一:出货高增,训推双驱动趋势二:国产份额快速提升IDC(国际数据公司),申万宏源研究50
AI芯片,需求放量,国产加速迭代品牌英伟达具体型号GB200H100MI350XFP8(TFLOPS)/INT8(TOPS)2000002000296-性能达到国内领先水平200560-4614FP16(TFLOPS)100001000148800100280-2309.6FP32(TFLOPS)1606044-2536-144.2显存容量48
GB64GBHBM2e8TB/s96GBHBM2e700GB/s372GBHBM3e显存带宽 16TB/s互联带宽 3.6TB/s功耗80
GBHBM33TB/s900GB/s700W96GBHBM34TB/s900GB/s400W128GBHBM2e3.2TB/s784GB/s700W768
GB/s~800GB/s450W350W 400W288GBHBM3e8TB/s1075.21000W超节点形态 NVL无无384卡超节点开发中640卡超节点ShanghaiC暂无 ube
卡 暂无超节点暂无趋势三:国产产品迭代加速,国产AI芯片性能接近英伟达H100华为 寒武纪 海光信息 摩尔线程 沐曦股份
阿里平头哥 AMDH20 昇腾910C MLU590 DCU
3号 S4000 C550 810各公司官网,各公司公告,申万宏源研究61
超节点:趋势明确,Scale-up国产化优势显著节点内GPU数量
少
多侧重协议开放节点内GPU数量
少
多英伟达NVLink
Fusion华为CM384(Unified
Bus)阿里磐久128(ALink
System)腾讯等ETH64(ETH-X
RoCE)侧重生态闭环 谷歌TPUv4
4096(ICI、OCS)英伟达GB300
NVL72
~NVL144
~
Rubin
NVL576代表:多机柜多xPU代表:单柜高密高电UALinkAMDHelios
UALoE72(UALink)博通等SUEESUN曙光scaleX640申万宏源研究算力集群扩容的两个维度:Scale-up
&Scale-outScale-up是全球算力网络发展的重心:xPU在“超节点”内部性能扩充,原因是大模型的张量并行、专家并行等,需要放在超高带宽、超低时延的网络中进行处理。海外NVLink、SUE、UALink等格局逐步清晰,国产华为基于UB网络的CM384、阿里磐久、腾讯等ETH-X、海光、摩尔等方案具备较强竞争力。国产超节点Scale-up分化为:“单柜高密高电多xPU”和“多机柜多xPU”两大路径不同路径超节点总览71
超节点:Scale-out从设备到芯片,国产化提速注:图表折线代表交换机设备的发货规模市场份额,%。IDC(国际数据公司),申万宏源研究0%我国交换机出货规模中,华为/新华三/锐捷/中兴占比领先,国产芯片替代大有可为45%40%35%30%25%20%15%10%5%RuijieSangforOthersAristaHuaweiZTENVIDIAH3CCiscoDigital
China盛科通信为代表,国产以太网芯片具备全球对标能力各公司官网,各公司公告,IDC(国际数据公司),申万宏源研究Scale-out代表xPU在节点外部的性能扩充,协议与设备相对成熟,往往借助InfiniBand、以太网等网络协议。海外基本形成IB网络、基于以太网的AI
演进两大生态阵营,博通链的高速成长代表了以太网市场的景气。我们认为,本土Scale-out方案在设备端已经具备规模优势,未来芯片端国产替代(围绕以太网生态)是重点。高端市场Arctic系列(在研)中低端市场盛科通信25.6Tbps数据中心博通Tomahawk
5Tomahawk
4Tbps数据中心,AI25.6Tbps数据中心Jericho
3-AIJericho
2c+14.4Tbps14.4TbpsAI优化MarvellTeralynx
10Teralynx
825.6Tbps数据中心瑞昱TsingMa.MX2.4Tbps(IDC(国际数据司)、汇聚)TsingMa400Gbps(接入汇聚)GoldenGateTbpsTrident3-X7Trident-X3.2Tbps244GbpsPrestera270GbpsRTL9311216GbpsTbps数据中心,AI81
超节点:光电混合,光、铜共进中际旭创OCP演讲材料,Light
Counting(光通信市场机构),申万宏源研究光通信的降本需求长期持续光与铜连接在距离、成本、功耗等方面的对比,影响了超节点Scale-up的设计市场普遍关心:超节点趋势下,算力网络光信号、电信号应用趋势,分别对应光通信以及PCB、背板、铜缆等铜连接的成长空间。通信方案在距离、速率、成本上的不可能三角,决定了较长时间内,Scale-up将是光电混合、光铜共进的格局。由于超节点在两个方向的发展并不收敛,尤其对于国产算力,光、铜不同方案都有较佳空间和成长性。英伟达技术文档,申万宏源研究92
生态:短期类CUDA,长期CANN开源厂商软件平台 AI
训推框架适配程度
核心工具丰富度
是否类CUDA是否支持Triton华为CANN深度适配
PyTorch、TensorFlow,PyTorch
适配版本与社区同步演进,自有框架MindSporeAscend
Profiler)、模型转换工具等提供算子开发工具、性能分析工具(如
全栈自研,支持端边云协同,算子性能优化深入,生态适 是配广泛寒武纪TensorFlow
等NeuWare
全面兼容
PyTorch(2.1-
2.8
版本)、
拥有
CNNL
算子库、CNCL
通信库、
云边端一体、训推一体架构,CNSantizer
调试工具等
移工具便捷CNPerf-GUI
性能分析工具、
大模型适配速度快,GPU
迁
是海光信息DTK兼容
ROCm
生态,原生支持TensorFlow、PyTorch、PaddlePaddle
等,覆盖多精度训练推理结合海光
DCU
的通用架构和全精度优势,集成超过2000个算子,对
CUDA的算子覆盖度超过
99%“类CUDA”环境/深度适配
PyTorch(支持至
2.5.0+),
提供
Torch-MUSA
扩展库、MUSA摩尔线程 MUSA 支持
FSDP2、AOTInductor、Triton
DK(含
muDNN、MUSA-X计算库)、后端等 性能分析工具等无缝替代
CUDA,提供Musify迁移工具是沐曦股份MXMACA适配
PyTorch、TensorFlow
等主流框
包含高性能算子库、编译工具、调试分架,支持混合精度训练 析工具等类CUDA,算子优化针对性强,适配多种
AI
场景是各公司官网,海光信息公告,申万宏源研究国产AI芯片软件工具两条腿走路:多家厂商类CUDA,华为CANN开源走独立路线类CUDA:海光信息、摩尔线程、沐曦股份等25.9月华为CANN开源,不类CUDA;寒武纪NeuWare多家国产AI芯片类CUDA,华为、寒武纪为独立路线103
2026年是供给侧突破的一年资料来源:
TrendForce(集邦咨询),申万宏源研究7/6nm1Q232Q233Q234Q231Q242Q243Q244Q241Q252Q253Q25
4Q25F1Q26F2Q26F3Q26F4Q26F中国台湾95.5%95.5%89.8%
89.8%92.6%92.6%92.6%
92.6%89.8%89.8%89.8%
89.3%87.2%84.7%80.2%
80.2%韩国3%3%2%2%2%2%2%2%2%2%2% 2%2%1%1%1%中国大陆3.2%3.2%9.0%9.0%6.2%6.2%6.2%6.2%9.0%9.0%9.0% 9.5%16%14.1%18.7%
18.7%5/4nm1Q232Q233Q234Q231Q242Q243Q244Q241Q252Q253Q25
4Q25F1Q26F2Q26F3Q26F
4Q26F中国台湾70.3%71%71%7
1%67.5%67.5%65.8%
63.9%69.4%78%73.2%
75.6%73.9%73.9%73.9%
73.9%韩国29.7%28.9%28.9%
28.9%30.0%30.0%36%
33.3%27.8%25.6%24.4%
22.2%23.9%23.9%23.9%
23.9%中国大陆.%.%.%.%.%.%.%.%.%.%.% .%.%.%.%.%供给扩张进度超预期,国产供应链逐步佐证寒武纪预告2025年营收50-70亿(华为昇腾外的算力芯片公司开始起量);沐曦下一代国产供应链产品曦云C600正式推出并稳步启动量产(第二代的国产芯片逐步采用本土供应链);华为全联接大会2025上,华为预计2026Q1推出昇腾950PR,2026Q4推出昇腾950DT,2027Q4推出昇腾960,2028Q4推出昇腾970;阿里平头哥自研AI芯片PPU。全球晶圆代工市场6/7nm及5/4nm节点份额变化(按K/M计算)0%-100%100%200%300%400%500%QAQAQAQAQAQAQAQAQAQAQAQAQAQAQAQAQAQAQA阿里腾讯4
需求:大厂更具弹性,“双飞轮”驱动算力需求算力-模型/应用闭环,模型+应用推理Token指数性增长,驱动Capex上行吴泳铭在阿里云栖大会上的发言:Token消耗量每2-3月翻番;今年全球AI的投资总额超过4000亿美元,未来五年预计全球AI投入超4万亿美元。模型应用:2B
API调用Token增长迅速国内互联网大厂Capex同比增速显著提升模型:豆包模型Token消耗量一年翻二十倍(单位:万亿)能力提升0.53416.412.73005
0.12353025201510各公司财报,字节跳动AI
Force大会,OpenRouter(AI
Tokens统计网站),中国新闻网,申万宏源研
11究124
需求:运营商和智算稳健算力作为国家战略,是运营商、地方近年产业发展的战略重点算力投资在运营商Capex占比不断提高;中国智算算力规模至2028年较当前翻100%以上,对应投资规模翻倍100%以上。3353913713730%5%10%15%20%25%30%20001800160014001200100080060040020002025E2022算力连接2023能力2024基础算力占比(右轴)2713563273180%10%20%30%40%0400200600800100012002025E2024宽带网产业数字化2022 2023运营系统与基础设施移动网产业数字化占比(右轴)2025年,中国移动算力Capex计划373亿元,占比不断提升(单位:亿元)中国电信资本开支及产业数字化占比(左轴单位:亿元,右轴单位:%)中国智能算力规模未来稳步上升(单位:EFLOPS)资料来源:IDC(国际数据公司),中国移动、中国电信公司公告,申万宏源研究75155.2259.9416.7725.31037.31460.32019.9278
95001000150020002500300002020 2021 2022 2023 20242025E2026E2027E
2028E134
需求:多模态、Agent成熟后,指数级增长应用形态的变化带来算力需求的剧变:Agent>多模态>Chatbot火山引擎总裁谭待:一个Agent任务的Token消耗可能与用户和模型聊一小时天的量级相当;一次Agent任务运行,算力成本达到几十元的水准。应用形态算力需求Agent时代算力需求指数增长Chatbot 多模态 Agent各类任务消耗Token、费用对比单轮对话生成一张中等
生成1分钟视
Agent:制作质量图片 频 个人网站消耗Token数
几百到几千 几百到几千 - -算力费用 0.00219美金
约0.039美金 约21美金 约6美金使用模型GoogleDeepseekR1Gemini
2.5Flash
ImageVeo
2.0ManusDeepseek官网,Manus官网,Hrefgo
AI(AI调用模型平台),申万宏源研究145
电源:定制化趋势下转向直流的架构变革带来增量机遇由UPS到HVDC到SST的方案演进示意Sidecar:通过边柜将交流电转为800V直流,再在服务器柜内将800V直流转为12V直流为减少高密度大容量数据中心的供配电转换损耗,供电架构正从传统UPS向HVDC(高压直流)与更前沿的SST(固态变压器)演进UPS/HVDC主要产品代际差小,增量需求或主要由与核心客户定制关系驱动;SST暂未出现适配数据中心的成熟方案,UPS/HVDC、变压器、上游部件等环节预计都将深度参与。英伟达800VDC白皮书,申万宏源研究156
液冷:从1到10的渗透率奇点,2026年规模化放量元年一次侧 二次侧管路 管路机柜manifold快接头服务器冷板室外冷源 CDU系冷统板示式意液图冷价值量约1000-1500元/kW(两路冗余备份)约400-500元/kW(In-row
CDU)manifold约400-500元/kW快接头约300-400元/对冷板约3000-5000元/kW产业链标的传统冷机厂商为主Vertiv,英维克等中航光电,Vertiv,英维克等英维克、飞荣达、银轮股份等IDC(国际数据公司),申万宏源研究多家国产厂商方案落地,
2026年为规模化放量元年据IDC数据,24年国内液冷服务器出货量约为23万台,渗透率5.2%;预计2024-2029年,中国液冷服务器市场年复合增长率将达到46.8%,2029年市场规模将达到162亿美元。华为、曙光等超节点方案落地,将进一步推动液冷在智算中心建设配置中成为必选项。液冷产业链条中的冷、热环节与ICT理解紧密耦合,中国制造业优势是本土液冷各环节核心竞争力。冷板式液冷方案示意图167
IDC:供需有望借国产算力东风迎来“第二次拐点”本土IDC供需格局显著边际改善,行业经历由NV芯片主导到国产算力初步导入的转型期国产算力迭代与部署接近“破局”,行业将迎来第二次拐点科智咨询,政府公告,工信部,申万宏源研究177
IDC:存量资源持续去化,供给侧边际改善显著在建工程转固(约等于数据中心交付)增速24年迎来转折点,25H1进一步加速廊坊地区作为核心区位,
25Q1
IDC上架率显著回升(单位:MW,%)-100%-50%0%50%100%150%200%250%奥飞数据2017 2018 2019 2020 2021 2022 2023 2024 25H1万国数据宝信软件世纪互联光环新网润泽科技数据港64%66%68%70%72%74%76%78%80%82%84%02004006008001000120014002020202120222023202425Q1供给规模需求规模上架率量:25年加速消化21-23年存量有效供给,而核心区位资源紧缺,新增供给显著下降在建工程转固作为后验指标,已清晰体现24年以来需求回升与第三方IDC存量资源的快速响应,预计25-26年这一趋势进一步放大。上架率:核心区位整体上架率持续回升,交付与上架周期相较历史显著缩短至约6个月价:供需关系改善以来逐步企稳,需求集中节点核心区位边际定价小幅回升IDC(国际数据公司),公司公告,申万宏源研究主要内容算力:国产架构元年模型:性能差距拐点应用:商业化突破10%重点标的与估值182025/12025/22025/3DeepSeek-R1OpenAI
o3-miniClaude3.7OpenAI
o3及o4-mini阿里Qwen-3字节豆包5深度思考谷歌Gemini2.5
Flash谷歌Gemini2.5
Pro字节豆包
6月之暗面KimiK2xAIGrok4推理能
代码和力提升,
工具使高性价
用能力比 提升Oai中最智能模型、工具使用能力提升代码、推理、多模态能力提升OpenAIGPT-4.1编码、指令跟踪、长上下文能力提升Gemini系列最强版本推理能力提升10倍推理、数学能力提升,API价格大幅下降性能媲美DeepSeekR1,继续降本深度思考赶上,视觉理解技术融合复杂推理、竞赛数学、多轮对话提升,降本代码、Agent、工具调用能力出圈,价格仅Claude1/5AI编程需求推动Anthropic
年化达30亿美元OpenAI
年化达120亿美元Cursor
年化达5亿美元豆包日均tokens超16.4万亿Anthropic
年化到10亿美元阿里发布全系列大模型,包括万亿参数基座Max、原生多模态大模型Omni等国内:开源涌现,推理能力赶上,性价比高。海外:闭源为主,核心是提高推理能力、重视代码能力和工具调用能力。原生多模态提升迅速。2025/4 2025/5 2025/6 2025/7 2025/82025/9谷歌Genie3ClaudeOpus4.1GPT5世界模型、推理代码能力提升智谱GLM-4.5VDeepSeek
V3.1谷歌NanoBanana媲美P图级别的生图模型全模态推理、Agent阿里Qwen3-Max万亿参数代码、智能、体推理、多语言提升阿里原生多模态Omni媲美NanoBanana2.0
2025年大模型主要变化:货币化、AI编程、多模态2025年大模型复盘大模型货币化加速,AI编码、多模态为重点场景InfoQ(计算机资讯网站),36氪,reuters(路透社),IT之家,cursor(海外AI大模型公司),新浪
19网,申万宏源研究202.0
中美主流大模型效果逐渐不分伯仲地 主要模型 厂商 参数量(十亿)
输入价格(美金/百万
输出价格(美金/百万
MMLU(通用MMMU(多模
AIME(数学
SWE-bench(
LMArena(人类真实区 tokens) tokens) 语言) 理解推理) 推理) 编程) 偏好)GPT-5 OpenAI未公开2510.0087.0%8
5%93.4%68.8%1425海Gemini
2.5 谷歌未公开0.302.5083.7%79.5%49.8%53.6%1404外Claude4.5
Anthropic未公开3.0015.0087.3%79.3%88.5%69.8%1445Grok-4 xAI17003.0015.0085.3%76.3%90.6%58.6%1413DeepSeek 深度求索6850.280.4285.0%-89.3%67.8%1408Qwen3-Max 阿里>10000.863.4483.5%-60.7%55.4%1434内豆包
6 字节2300.1112--86.3%--GLM-4.5智谱3550.110.2882%-86.7%54.2%1406Kimi
K2月之暗面10000.562.2489.5%-62.7%43.8%1417FlashSonnetV3.2国语言能力持平,多模态、数学、编程仍有差距但缩小,人类真实偏好反馈国内模型不落后于海外LMSYS
Chatbot
Arena美国和中国模型性能逐渐接近中美顶级模型在主要基准上结果逐渐接近《2025年人工智能指数报告》,各公司官网,Vals.AI(模型测试网站),swebench(模型测试网站),腾讯新闻,CSDN(中国开发者网络),火山引擎,LMArena(模型测试网站),申万宏源研究2.1
算力创新:算力耦合的架构、范式创新模型:不仅追求Scaling,通过一系列创新,在性能、效率与成本之间寻求更优的平衡算力与模型耦合:国产最新方向,例如UE8M0精度、各类算子新算子出现低精度MoE改造注意力机制Feed-ForwardNetworkRMS
NormAttentionRMS
Norm架构创新训练范式创新Deepseekwen3QMoE
-NextMLA混合注意力线性注意力推理创新强化学习长短思维链混合精度训练……模型量化分布式推理适配新框架W4A4MX-FP8MX-FP4Sparse
AttentionLinear
AttentionDLMVLMDiTDeepseek官网,寒武纪官网,申万宏源研究2122◼
2025为效率转化年:全球216家科技公司累计裁员近10万人,结构上传统职能、中层管理为重灾区,AI研发、云计算等仍在扩招地区 公司 公司自身AI进展描述美国部分代表公司亚马逊••宣布启动新一轮裁员,裁减约
4万名,占总数4%,内部会议强调AI重塑公司运营模式,部分岗位消失是技术进步的必然。业绩强势增长,25FYQ2销售额达1677亿美元,yoy+13%,营运利润192亿美元,yoy+31%。ServiceNow••25年5月以来平台Assist使用次数增长55倍,ACV计划年底超5亿美元,主要来自于订阅。72%自助服务请求AI自动支持、37%的案例工作流程AI代理完成、60%的知识文章AI生成。Salesforce••2025年不再招聘新软件工程师,重心转向销售岗位帮客户更好理解和应用AI技术。Agentforce让工程团队工作效率提升30%。国内部分代表公司字节海外TikTok全球裁员数百人,重点转向使用AI进行内容审核,80%违规内容由AI自动化删除。字节巨量引擎AI广告治理实现90%广告素材10分钟内完成审核,相较传统方式提升75%。阿里26年招聘3000岗位中AI相关占比近5成,高德部门AI相关岗位占比65%,阿里云超80%。25FYQ2阿里云业务收入同比增长26%,AI相关产品收入连续个季度保持三位数增长。模型能力提升→AI落地加速、对传统工作和人力替代→效率提升→业绩表现012345672025年大模型tokens使用量持续上升(单位:T)19.2%16.4%8.4%7.0%6.6%4.1%3.0%2.0%5.7%0.0%5.0%10.0%15.0%20.0%25.0%30.0%251026-251102的周调用量市场份额显示国内多家占据重要地位27.7%OpenRouter(AI
Tokens统计网站),钛媒体,ServiceNow(海外SaaS公司),博客园,IT之家,新浪网,申万宏源研究2.2
直观行业变化:使用量快速上升,人力替代效应出现232.3
模型迭代方向预测一:突破长上下文瓶颈、效率提升论文《DeepSeek-OCR:
Contexts
Optical
Compression》,申万宏源研究93.8%83.8%85.8%79.3%76.3%59.1%96.5%
98.5%97.3%96.8%96.8%9
5%89.8%87.1%10.51
813.215.116.517.719.76.77.58.59.710.61
312.60x5x10x15x20x25x0%20%40%60%80%100%120%600-700700-8001100-12001200-1300compression(x)precision(%)800-900 900-1000 1000-1100TextTokensinPer
Page(Ground-truth)CompressiononFox
benchmarkDeepSeek提供创新性光学上下文压缩新思路:视觉模态作为文本高效压缩媒介,文本→图像→视觉token处理效率大幅提升:压缩比<10倍时,精度达97%;压缩比20倍时,精度~60%。实际应用中单张A100-40G
GPU可支持20万页数据处理每日。视觉输入模拟人类记忆衰减:久远上下文压缩为低分辨率图像实现自然遗忘,实现优化长上下文管理。压缩比<10倍时,OCR解码精度可达97%64
vistoks(left) 100
vistoks(left) 64
vistoks(right) 100vis
toks(right)242.3
模型迭代方向预测一:突破长上下文瓶颈、效率提升核心架构设计是编码器、压缩、解码器DeepEncoder编码器:80M
SAM-base(窗口注意力主导,局部特征提取)、16倍卷积压缩、300M
Clip-large(密集全局注意力,全局语义理解)三级串联。DeepSeek-3B-MoE解码器:3B参数规模(570激活参数),将视觉token重建为原始文本表征。DeepEncoder是核心创新:例如1024x1024输入图像,先分割成4096patch
token,前半部分80M产数量激活内存消耗可接受,进入全局注意力之前先压缩至256个,使整体激活内存有效控制。文字transformer计算复杂度O(n^2),DS-OCR在Clip以前为O(n)。处理高分辨率能力、高分辨率下低激活内存、少量视觉token、支持多分辨率输入、适中参数量。DeepSeek
OCR核心架构论文《DeepSeek-OCR:
Contexts
Optical
Compression》,申万宏源研究252.3
模型迭代方向预测二:多模态的细节与控制海外核心进展 国内核心进展OpenAI
GPT-4o、Google
Gemini、Meta
Llama4
阿里、字节等均发布原生融合多模态大模型。视觉技术理念和架构 等采用端到端原生多模态架构,强调统一模型处理多
理解能力媲美海外,中文内容准确性更高。具备多种信息,指令跟随加强、响应快、一致性强。 模态长思维链推理和多模态强化学习。商业化与落地落地主要来自图像、视频生成,例如可灵、midjourney等收入增速较快图像、视频生成出海:快手、可灵、美图;具身智能:机器人、自动驾驶阿里Omni内置ControlNet,细节控制能力提升海外、国内均重视多模态大模型Qwen(千问),申万宏源研究未来趋势:更细节可控的多模态能力例如谷歌Nano
Banana媲美P图级别的效果262.3
模型迭代方向预测二:多模态、世界模型腾讯新闻、Genie3官网、英伟达官网、Meta官网、申万宏源研究模型名称核心共性模型目标技术侧重是否需要3D建模核心优势局限性实时及丰富性物理规律工程价值语义能力Meta
V-JEPA
2英伟达Cosmos谷歌Genie31)自监督学习框架:均通过分析海量视频
/交互数据隐式学习物理规律,避免过多的显式公式建模;2)多模态数据驱动:支持视觉、语言、传感器等多模态输入;3)动态预测能力:可预测物体运动轨迹、因果关系及环境变化视觉
-
语言联合表征与机器人规划联合嵌入预测架构(JEPA),通过时空注意力机制学习跨模态语义对齐无需预先建模推理速度极快:规划用时仅为Cosmos
的
1/30,成功率更高缺乏实时交互能力★☆★☆★★★★★零样本泛化:无需特定训练即可完成机器人抓取、放置等任务(成功率
65-80%)工业级准确性:在PhyGenBench
测试中对浮力、摩擦力等现象的模拟具有较好表现极端条件支持:可精确模拟车辆在暴雨、地震等极端环境下的动力学响应物理推理局限于视觉可观测范围,无法处理多体动力学实时交互能力较弱,更适合离线训练部分依赖预训练
3D物理引擎(如NVIDIA
PhysX),较高的成本规模化高精度物理仿真扩散+自回归模型结合部分依赖建模★★★★★★★★★实时交互的动态
3D
场景生成自回归+空间时间变换器完全隐式生成沉浸式交互:720p
分辨率、24帧
/
秒生成可探索环境,物理一致性维持长达数分钟复杂物理现象模拟存在缺陷★★★★★★☆★★创意生成能力:支持天气变化、
文本物体添加等动态修改,如
“在暴风雨中添加摩托艇”渲染质量待提升,场景持久性有限◼
未来趋势:从多模态理解走向世界模型,核心是能模拟物理规则、预测未来状态272.3
模型迭代方向预测三:Mid-training效率优化 更少高质量数据实现显著性能提升通过动作抽象压缩决策空间,降低Agent学习复杂任
务的难度和成本 中期训练作为桥梁,提升预训练模型专业能力,为后训练提供关键过渡和热身通过中期训练,能将Llama改造成与RL可比的推理模型,在数学推理上与Qwen媲美论文《A
Survey
on
LLM
Mid-Training》,《OctoThinker:Mid-TrainingIncentivizesReinforcement
Learning
Scaling》申万宏源研究从过去的“预训练+后训练”两阶段变为“预训练-中期训练-后训练”三阶段:预训练:接触大规模多样化语料库奠定基础能力(类比通识教育阶段);中期训练:通过部分高质量、特定领域数据系统性增强模型核心能力(类比专业深造阶段);后训练:微调和对齐(类比岗前培训)。标志大模型开发从相对粗放的规模扩张进入精细化的系统工程阶段Mid-training对模型效果、成本压缩、Agent能力提升皆有重要意义对大模型效果的关键影响 对AIAgent效果的关键影响核心价值
输出紧致先验/世界表征/高层动作库从源头缩小搜索空间、缩短有
将复杂原子动作抽象为高层推理、调用工具等技能,效视界,增强RL性能 压缩后续RL动作空间性能提升 系统性增强推理、代码、数学等认知能力 提高RL起点质量,提升训练样本效率和稳定性282.4
模型是否吞噬软件?中国软件有定制化需求乙方定制化是中国软件行业特色,特别是To
B的软件公司软件供应商普遍以铺设大量人员方式为企业做定制开发;定制化程度高,压制利润率和人效。中国AI范式为人机共驾,决定了模型难以取代软件过去10年中美典型软件公司毛利率复盘292.4
模型是否吞噬软件?本质是行业的know-how的积累中国大模型与软件的边界更清晰,行业know-how形成壁垒,大模型无法完全取代应用软件供应商与客户深度绑定,开展定制化的过程中积累了大量行业know-how。AI应用真正落地依靠行业know-how,路径上由软件公司实现可能性更大大模型缺乏行业know-how,无法完全取代应用申万宏源研究全行业各场景金融风控、估值、交易医疗诊断、病理、流程制造供应链、生产工艺各行业领域不同场景+专业流程基于客户私有的行业Know-how结构/非结构的数据积累行业数据库 流程代码、算法、小模型(机器学习、深度学习算法)产品化To
B-各类行业IT产品/服务金融IT医疗IT工业IT(ERP、CAM…)To
C-各类软件工具类社交类内容类交易类…………游戏类传统软件公司大模型厂商基于公开信息大模型
模型替换软件?更可能的路径
大模型+小模型+人
机共驾主要内容算力:国产架构元年模型:性能差距拐点应用:商业化突破10%重点标的与估值302000300050004000600070008000900010000110001200002004006008001,0001,200广联达总市值(亿元)申万计算机指数(右轴)313.0
软件行业击球点:新业务占比10%时,市值快速提升◼
特点:趋势确定(云化为软件厂商必然路径),节奏不确定、可跟踪性不高(低频数据)。◼广联达17年首次公布云收入4500万元,17-18年股价逆势增长47%;19-20年主升:云收入占比13%→26%→41%,涨幅300%+。2017年,年报首次提及云转型,云
收入0.45亿元(占总营收2%)2018年云收入3.7亿元(占总营收13%);2017年初-2018年末计算机整体振荡向下,广联达逆势而上,涨幅47%。2019-2020年,云收入分别为9.2
亿元、16.2亿元YoY+149%、76%;
占总营收26%、41%;广联达迎来主升浪,大幅跑赢计算机行业,涨幅300%+。YoY+58%、+28%、+17%;
占总营收46%、50%、58%;下游宏观环境承压,云收入、云合同增幅放缓导致股价承压。2021-2023年,云收入分别为25.6、32.8、38.2亿元;
2024年云合同增速转负,但股价已提前反应,随着下游市场企稳,以及工地智慧化、新产品等推出,进入估值修复阶段。2000250030003500400045005000550060006500700002004006008001,0001,2001,4001,6001,800201720182019202420252020 2021用友网络总市值(亿元)2022 2023申万计算机指数(右轴)32用友网络17年首次公布云业务收入4.1亿元,占总营收6%。股价与云收入占比演绎与广联达类似,超过10%时行情启动,在超过40%后股价趋缓。3.0
软件行业击球点:新业务占比10%时,市值快速提升2017年,首次公布云收入4.1亿元
(占总营收6%);2018年云收入8.5亿元(占总营收11%);2017年初-2018年末用友整体波动不大,2018年初行情主要受到业绩预告驱动,涨幅~96%。
占总营收23%、40%;用友网络迎来主升浪,涨幅142%。行业竞争加剧导致公司净利润从2020年开始下滑,2020-2024年,归母净利润分别为9.9亿元、7.1亿元、2.2亿元、-9.7亿元、-20.6亿元。2019-2020年,云收入分别为19.7
2021-2024年,云收入分别为53.2、63.5、70.9、68.50亿元;
2025,亿元、34.2亿元YoY+132%、74%;
YoY+55%、+19%、+12%、-3%;占总营收60%、69%、72%、75%;困境反转厂商 产品 发布时间 核心特点OpenAI Deep
Research2025.2
由o3-mini模型驱动,可投入30分钟以上进行多步骤探索及动态调整搜索策略,在HLE测试中取得突出成绩谷歌Gemini
DeepResearch2024.12
引用来源可靠性高,免费用户每月可免费体验数次Perplexity.aiDeep
Search2025.2
Pro用户支持每天500次查询,报告
生成速度更快,大多在3分钟内完成AnthropicClaude
DeepResearch2025.6
基于Multi-Agent实现,更适合处理开放、动态的研究任务月之暗面 KimiResearcher
2025.6
基于端到端自主强化学习训练的agent模型,转为深度研究任务字节跳动 eerFlow(开源)
2025.5
采用Multi-Agent架构设计,支持深度研究、报告生成、播客生成等阿里通义 支持多种推理形式,包括原生ReAct和上下文管理模式,多项测评上拿DeepResearch 2025.9
到SOTA智谱AI AutoGLM沉思 . 集深度研究和实际操作能力于一体25年海外和国内争相发布Deep
Research央广网,IT之家,搜狐网,CSDN(中国开发者网络),DeerFlow(开源深度研究框架),飞书云,申
33万宏源研究3.1
AI应用爆款之一:Deep
Research34AI应用达到5亿美金ARR的速度,cursor位居前列从代码库或文档中获取引用一键应用模型生成的代码Cursor的部分核心功能,也是现在AI
IDE产品方向Cursor(海外大模型厂商),reddit(AI在线社区),申万宏源研究3.2
AI应用爆款之二:AI代码+IDECursor:ARR提升至5亿,已吸引超过3万家付费企业客户Cursor通过以下能力显著提升开发效率:1)智能预测与补全:精准预测开发者意图,自动生成或编辑代码;2)自然语言交互:开发者可直接用自然语言提示(如高亮代码后要求解释功能)进行操作;3)无缝集成与纠错:深度融入现有工作流,高效发现并修复错误。推出了40美元/月的企业许可模式,此前大部分收入来自个人用户的20美元/月专业版订阅。TRAE是字节跳动于2025年1月19日推出的AI编程工具,旨在提升开发效率,目前有国际版和国内版智能代码操作:通过自然语言输入生成代码片段,提供优化建议,支持从零构建项目,可通过对话获取编程帮助。集成多种模型:集成Claude
3.5+3.7和GPT-4o,国内版搭载doubao- 5-pro,支持切换DeepSeek-R1&V3。项目上下文同步:构建完整“项目语义图谱”,可进行跳转函数定义、生成组件调用代码等操作TRAE与Cursor的区别模型与费用:Trae国际版可免费使用Claude等;国内版免费且无需复杂配置。Cursor需付费使用部分高级功能,接入了DeepSeek、GPT和Claude等模型。功能细节:TRAE的Builder模式目前不如Cursor的Agent模式智能,代码生成准确度有待提高。但TRAE代码回滚更方便,有二次确认机制。用户体验:TRAE界面更符合中文开发者习惯,操作更简洁,新手更友好、端到端;Cursor界面类似VSCode,功能丰富但操作相对复杂。353.2
AI应用爆款之二:AI代码+IDE36图片生成美图RoboNeo订阅制+点数制25年7月上线,1月左右MAU达100万;25H1影像与设计产品收入13.51亿,yoy+45.2%,成为收入支柱。Midjourney订阅制25H1
ARR接近5亿美元。赛道 代表公司/产品 核心变现模式 商业化成效视频生成快手可灵会员订阅+积分制+API调用•25Q1可灵收入超
5亿元,3月ARR突破1亿美元,截止25年6月,全球用户突破2200万;70%来自C端,30%来自B端;70%来自海外市场,30%来自国内。Minimax海螺AI订阅Runway订阅制+企业定制上线后连续6月全球榜单中位居视频生成产品第一,截止25年1月海螺AI海外版访问量达1635万,为国内6倍多。截止25年6月,ARR超过9000万美元。视频生成/图片生成为多模态AI应用变现较快路径之一1)高频刚需场景;2)多元变现路径:个人创作者/中小企业采用订阅制,特定行业大型企业采用API调用和定制化;3)技术成熟度支撑商用:模型语义理解、生成质量、时长等方面持续进步,进入可商用阶段。全球多模态AI商业化进展加速,可灵进展突出36氪,新浪网,金灵Gilin,钛媒体,CSDN(中国开发者网络),申万宏源研究3.3
AI应用爆款之三:多模态37维度可灵2.1Veo
3核心技术物理动态渲染(3D时空注意力机制)原生音视频同步(V2A音频引辈)生成质量全球图生视频榜首(Artificial
Analysis)文生视频真实性全球第一视频长度最长支持2分钟(大师版)限制8秒生成速度5秒视频≈30秒(标准模式)8秒视频≈2分钟(完整版)单帧成本5秒视频≈¥2(标准版)8秒视频≈¥23(Veo3标准版)使用场景商业短剧、高定制广告创意短片、多语言教育内容分析可灵商业化快速原因:1)技术领先:20+次迭代领跑;2)成本优势:相较于海外主流模型具有显著成本优势;3)快手生态:商业短剧、广告等需求量高。对比谷歌Veo3,可灵更具成本优势Artificial
Analysis(AI测评网站),虎嗅网,可灵AI,智源社区,Google
AI
for
Developers(谷歌AI开发者社区),36氪,申万宏源研究3.3
AI应用爆款之三:多模态383.4
AI应用爆款之四:各项技术组合之Agent重要的技术进展模型任务规划和反思能力提升 • Deep
Research:具备深度思考与任务规划能力,通过思考-规划-执行闭环动态调整策略持久化记忆从简单注意力机制转向复杂多层记忆管理2025年4月发布Mem0:独立于上下文窗口外的持久化知识库,较低API费用下维持长期对话自动构建知识图谱、在过去错误中学习;2025年10月DeepSeek
OCR:通过视觉输入模拟人类记忆衰减;多模态与世界模型Agent能看懂图像和视频,通过世界模型在内部模拟物理动态预测行为后果,为具身智能和实体AI奠定基础高效的工具使用2024年11月MCP:解决智能体与工具集成的复杂度;年月MCP执行代码:解决大量MCP工具带来的上下文窗口重载、中间工具额外消耗tokens问题。GAIA 74.55% - 58.18% 32.73% 30.30% -通用AI
Agent基准测试,450个答案明确的题目,测试推理、多模态处理、网页浏览和工具使用熟练度。WebArena68%-58.10%7.12%-7.14%通过系列自然语言描述的高级任务测试模型Web交互能力评估完成度
OSWorld 62.90% 53.10% 23% - - 4
60%真实计算机环境中对多模态Agent进行开放式任务测试 Agent在技术实现性上仍有较大提升空间:单步骤成功率在多步复合下,成功率大幅降低各类复杂任务Benchmark中得分较低,尤其是无正确答案的开放式任务。几类较常见的Agent测评榜单(选择厂商得分最高的模型分数比较)Anthropic 字节 OpenAI 谷歌 DeepSeek 阿里千问 测评简介◼
2025逐渐显现的发展方向:通过构建多层次架构解决Agent瓶颈,分层&多智能体、多步搜索+自我纠错、记忆持久化等2025年出现的对Agent渗透提升的重要技术进展论文《Mem0:Building
Production-Ready
AI
Agents
with
Scalable
Long-Term
Memory》,Github(海外编程社区),Anthropic(海外大模型公司),Gaia(AI评测网站),WebArena(AI
Agent网站),OS
World(AI评测网站),申万宏源研究39重点方向 具体进展预测MAS多Agent系统•••2025年CrewAI、AutoGen、LangGraph等框架的热门证明MAS可行性和优越性;字节、Anthropic的Deep
Research都采用MAS架构;2026年有望从开发者社区扩展到企业架构。人-机劳动力重组•••AI
Agent从任务自动化到角色自动化;2025年软件开发Agent平台开始内置产品经理、开发、测试等角色;HCM平台或将提供数字员工管理能力,包括访问权限、绩效评估等。慢思考+端侧操作2025年Deep
Research进展看到模型规划-执行-反思能力的增强;智谱AutoGLM等已探索结合多模态、实际操作的端侧通用助手。具身智能 • 基于世界模型的实体Agent代表最终的专业化,在机器人、供应链和自动驾驶等物理世界应用中展现价值。2026年AI
Agent重要方向预测一个常见的MAS示例——拆分为分析助手和文本写作两步智谱AutoGLM端侧Agent助手——打印机接入Agent实现缺墨自动购买Medium(AI资讯网站),申万宏源研究3.4
AI应用爆款之四:各项技术组合之Agent403.5
AI4S:助力科研突破的重要应用领域AI4S涉及领域:生命科学、地球科学、物质科学,包括生物医学、新材料、新能源、半导体、农业等。核心模式:AI4S领域通常缺乏数据,AI赋能:1)自动数据生成(量子第一性原理、自动化实验室);2)原子级别建模,模拟物质微观行为;3)预测结构筛选。AI4S涉及多空间、时间尺度计算科学研究论文《How
tobuild
thevirtualcellwith
artificial
intelligence:
Priorities
andopportunities》,北京科学智能研究院,晶泰科技官网,申万宏源研究413.6
营销AI:更早商业化Marketing领域能够较大程度发挥AI大模型价值,AI接受度和渗透率高。数据驱动:利用大数据和AI模型优化营销和销售策略。容错率高:营销策略落实的机会成本低,亏损可控,投流策略和合规风险引入人工审核,包容、鼓励大模型“试错”以发现更多优秀的营销方案。ROI可量化:营销策略的每一步都有明确的日志和财务记录,货币化模型简单,便于成本控制和效果评估。美国受访调查,Marketing从业人员使用大模型的比例最高数据驱动容错率高ROI可量化营销AI工具广告投流内容营销用户运营&转化AIGC内容千人千面扩大供给效率提升粘性提升77%71%67%40%38%33%90%80%70%60%50%40%30%20%10%0%营销AI工具赋能三大板块各公司财报,HR
Dive(海外新闻网站),申万宏源研究423.6
营销AI:更早商业化AI
Agent在营销领域的核心价值贡献在于客户交互、内容生成和数据分析客户交互:被动应答→主动服务,如预测用户需求、动态策略调整。内容生成:静态工具→动态创作引擎,实时数据反馈与生成式模型结合。数据分析:分析结果→即时行动指令,提升广告投放ROI。国内迈富时收入2024年增速开始上行海外APPLOVIN收入也在高速增长100%90%80%70%60%50%40%30%20%10%0%50454035302520151050收入(亿美元)yoy各公司财报,HR
Dive(海外新闻网站),申万宏源研究0%20%40%60%80%100%120%1816141210864202020A2021A2022A2023A2024A2025H1收入(亿元人民币)yoy433.7
办公:标准化软件壁垒明确,AI迭代效果直观办公软件存在高壁垒,大模型厂商是赋能而不是颠覆生态复杂:形成协同办公平台,其项目管理、沟通协作等形成办公软件生态粘性;交付载体:工作流程围绕特定办公软件,是成果交付的主要载体,使用习惯形成依赖。标准化SaaS迭代迅速,效果直观迭代快:产品标准化程度高,在AI应用整体较前期阶段,实现AI功能的快速迭代推广。变现快:市场不需要教育,效果呈现直观,用户基数大,商业化变现效果好。金山WPS已经集成多种AI功能,月活快速提升 合合信息将AI嵌入到产品各条线AI阅读AI文档问答通过问答精准总结段落,精准定位相关章节精读AI全文总结总结全文提炼要点AI划词翻译、专业术语释义AI条件格式 输入目标,自动调用表格指令(例如将F列低于5000的单元格进行加粗并标黄)AI数据AI数据分析 直接对已有数据,按照文字指令进行分析,数据检查、关联性分析等AI写公式 按照文字指令自动生成公式;并且可以对已经有的多层嵌套的公式进行文字解读类别 功能 具体效果AI写作AI伴写 主动根据正在编辑的内容,理解前文写出下一句AI帮写 输入主题直接生成大纲或全文(文档形式呈现),并以对话形式进行修改AI帮改 智能优化文本内容,并可更改文本风格(更正式/口语化等)灵感市集 已经成
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全培训44号令课件
- 员工培训我能行
- 神经精神疾病诊断学
- 2.3.2YARN服务工作流程
- 云南企业安全负责人培训课件
- 个人形象提升培训课件
- 2025 小学一年级数学下册基础巩固(数的读写)课件
- 测试技术与传感器课件:电感式传感器
- 2026年商标变更专员岗位面试题库含答案
- 2026年部门副经理工作考核标准及方法
- 选词填空(试题)外研版英语五年级上册
- 露地胡萝卜秋季栽培
- 海水淡化PX能量回收装置维护说明书
- 历年天津理工大学高数期末考试试卷及答案
- 妇产科学(第9版)第二章女性生殖系统解剖
- 中医经络之-特定穴课件
- GB/T 9122-2000翻边环板式松套钢制管法兰
- GB/T 16895.6-2014低压电气装置第5-52部分:电气设备的选择和安装布线系统
- 江苏省学业水平合格性考试复习课件:中外历史纲要上册主要考点线索梳理
- 煤矿岗位安全风险辨识评估
- 小提琴协奏曲《梁祝》音乐欣赏(33)课件
评论
0/150
提交评论