大模型行业GenAI系列报告之71:从智谱IPO看当前大模型进展和投资机遇_第1页
大模型行业GenAI系列报告之71:从智谱IPO看当前大模型进展和投资机遇_第2页
大模型行业GenAI系列报告之71:从智谱IPO看当前大模型进展和投资机遇_第3页
大模型行业GenAI系列报告之71:从智谱IPO看当前大模型进展和投资机遇_第4页
大模型行业GenAI系列报告之71:从智谱IPO看当前大模型进展和投资机遇_第5页
已阅读5页,还剩27页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

证券研究报

从智谱IPO看当前大模型进展和投资机遇——GenAI系列报告之71主要内容大模型:范式收敛,应用深化智谱:原生大模型公司突围IPO重点标的与估值31

大模型:当前技术范式逐渐收敛关键环节早期探索阶段

(2022-2023)当前收敛范式

(2024H2-2026)收敛核心技术预训练

(Pre-training)路径分歧:存在

Encoder-Decoder

(T5)、Dense

(GPT-3)等多种架构之争。路径高度收敛:全面转向

Decoder-only

架构,并普及MoE

(混合专家)稀疏架构。MoE

+

MLA

(潜在注意力):在保持超大规模参数的同时,大幅降低计算成本与显存占用。中训练

(Mid-training)早期未引入:

预训练结束后直接进入微调,缺乏针对性能力打磨。24H2开始在行业广泛普及,依托优质数据针对性优化:利用高质量合成数据进行特定能力(代码、长文本)注入。数据筛选+合成数据:在预训练末期通过精准的数据配比提升模型“智商”上限。后训练

(Post-training)偏好对齐:

依赖大量人工标注,侧重于让模型对齐

(RLHF)。逻辑进化:

转向大规模强化学习(RL),侧重于自我反思与推理逻辑的涌现。GRPO

+

过程监督(PRM):不再教模型答案,而是通过强化学习让模型自发学会“思维链”。推理

(Inference)静态输出:

一次性生成,推理阶段在整体算力消耗占比较低。慢思考系统:

引入思维链(CoT)等方式,模型在回答前进行自我博弈与搜索。System

2思考+

投机采样:通过增加推理时长换取极高准确率,并用量化技术压低成本。◼

大模型的技术竞争或从“寻找正确路径”转向“在主流路径上卷效率”。基座模型(预训练阶段)范式已摒弃Dense架构、Encoder-Decoder等路径,收敛至Decoder-Only+

MoE架构,核心工作逐渐趋向在中训练、后训练、推理侧进行数据、算法工程优化,进一步提升模型能力上限。表:大模型技术路径有所收敛《HarnessingthePowerofLLMsinPractice:ASurveyonChatGPTandBeyond》,申万宏源研究52

大模型货币化加速,代码、多模态、Agent为核心点2025年大模型进展复盘:1)由AI编程引领的货币化加速;2)巨头竞争加剧,重点迭代代码、多模态、Agent,从模型参数竞争到比拼Agent执行能力、落地效率、商业化。

3)国内开源模型性能向海外闭源模型靠近。2026年大模型展望:高效架构、Agent执行力、多模态和世界模型、安全合规。表:2025年大模型发展复盘及2026年展望腾讯云,新浪网,搜狐网,澎湃新闻,36氪,IT之家,路透社,cursor官网,沙利文,申万宏源研究时间国内海外重点影响2025.1DeepSeek

R1推理、数学能力提升,API价格大幅下降OpenAIo3

mini推理能力提升,高性价比DeepSeek

R1:中美竞争格局;Anthropic:ARR10亿美元;Anthropic:ARR30亿美元;OpenAI:ARR120亿美元;Cursor:ARR5亿美元;豆包日均tokens超16.4万亿;谷歌Gemini3

Pro:多模态融合跃升;豆包:日均tokens超50万亿Cursor:ARR破10亿美元;Meta收购Manus:AI应用里程碑;OpenClaw:个人Agent热度Claude

Cowork:企业协作Agent;大模型初创公司IPO高热度;Anthropic:ARR超90亿美元中国企业大模型日均tokens37万亿,前三为Qwen豆包和DeepSeek;2025.2AnthropicClaude

3.7代码和工具使用能力提升字节豆包5深度思深度思考赶上,视觉理解技术融合OpenAI

o3及o4

mini智能性增强,工具使用能力提升2025.4考阿里Qwen

3性能媲美DeepSeek

R1OpenAIGPT

4.1编码、指令跟踪、长上下文能力提升谷歌Gemini2.5

Flash代码、推理、多模态能力提升2025.5Anthropic

ClaudeOpus

4和编程、推理、Agent提升Sonnet

42025.6字节豆包6复杂推理、竞赛数学、多轮对话提升、降本谷歌Gemini2.5

ProGemini系列升级2025.7月之暗面Kimi

K2代码、Agent、工具调用能力出圈,价格仅xAI

Grok4推理能力提升10倍Claude

4的1/5智谱GLM

4.5V全模型推理Agent谷歌Genie

3世界模型突破性进展2025.8DeepSeek

V3.1混合推理、高效、Agent能力提升AnthropicClaude

Opus4.1代码、Agent能力提升OpenAIGPT

5代码能力提升、更低幻觉率谷歌Nano

Banana媲美P图级别的生图模型阿里Qwen3

Max万代码、Agent推理、多语言提升重要发布历程2025.9亿参数阿里原生多模态媲美Nano

BananaOmni2025.11谷歌Gemini

3

Pro标志多模态融合的跃升DeepSeek

V3.2重提DSA架构有效性OpenAIGPT

5.2巨头竞争加剧,加速迭代2025.12字节豆包8端侧Agent、长序列文本处理智谱GLM

4.7提升Agent、代码能力Minimax

M2.1提升Agent、代码能力2026.1月之暗面KimiK2.5多Agent协作、复杂任务拆解、多步推理、工具调用智谱GLM

5代码能力对标Claude

Opus4.5GPT5.3

Codex编程能力登顶Minimax

M2.5Agent任务执行效率显著提升Anthropic

ClaudeOpus

4.6及1M上下文,推理、代码、长文本升级Sonnet

4.6字节豆包2.0全系列强化多模态理解、Agent执行力,轻量级模谷歌Gemini

3.1

Pro多模理解、推理继续提升2026.2型降低定价阿里Qwen.Plus小参数量激活,多模态、Agent提升6在代码领域冲刺较快发布公司大模型名称Arena

ScoreAnthropicclaudeopus

4.61561Anthropicclaudeopus4.6

thinking1551Anthropicclaudesonnet

4.61524Anthropicclaudeopus4.520251101thinking

32k1501OpenAIgpt5.2

high1471Anthropicclaudeopus4.5

202511011469谷歌gemini3.1pro

preview1461智谱glm

51456谷歌gemini3

pro1444Minimaxminimax

m2.51443智谱glm

4.71440谷歌gemini3

flash1440月之暗面kimik2.5

thinking1439月之暗面kimik2.5

instant1424Minimaxminimaxm2.1

preview1402谷歌gemini3flash(thinking

minimal)1402OpenAIgpt5.21395OpenAIgpt5

medium1393Anthropicclaudesonnet4.520250929thinking

32k1390Anthropicclaudeopus4.1

202509291386Anthropicclaudeopus

4.61561Anthropicclaudeopus.

thinkingAnthropicclaudesonnet

.Anthropicclaudeopus4.520251101thinking

32k1501Arena官网,申万宏源研究注:分数来自Arena

Leaderboard,时间截止2026年2月24日,分数仅供参考Anthropic

Claude耕耘编程领域、代码能力出色(代码准确度、质量更好),编程领域市占率较高,更受益编程领域爆发浪潮;谷歌Gemini在多模态等领域底蕴更深;两者与OpenAI在多个领域形成交替领先。彼此间能力差距较小,营收增长将与其擅长赛道的商业化进展息息相关。囿于算力等限制因素,国产模型在文本、编程等能力上相对海外有一定差距,但距离不远。当前智谱、Minimax、月之暗面等在代码领域接近海外顶尖模型。表:大模型文本模态能力排名 表:大模型编程能力排名发布公司大模型名称Arena

ScoreAnthropicclaudeopus

4.61504Anthropicclaudeopus4.6

Thinking1504谷歌gemini3.1pro

preview1500谷歌gemini3

pro1486OpenAIgpt5.2chatlatest

202602101480字节dolaseed2.0

preview1474xAIgrok4.1

thinking1473谷歌gemini3

flash1473Anthropicclaudeopus4.520251101thinking

32k1472Anthropicclaudeopus4.5

202511011467xAIgrok

4.11463谷歌gemini3flash(thinking

minimal)1462OpenAIgpt5.1

high1458Anthropicclaudesonnet

4.61457智谱glm

51453百度ernie5.0

01101452月之暗面kimik2.5

thinking1451Anthropicclaudesonnet4.5

202509291450阿里qwen3.5397b

a17b1450Anthropicclaudesonnet4.520250929thinking

32k1450Anthropicclaudeopus

.Anthropicclaudeopus4.6

Thinking15043

大模型竞争:各具禀赋,海外闭源、国内开源公司核心模型系列模型能力强项

(Specialty)算力投入与资源商业化开源/闭源策略OpenAIGPT-5.2/o3/

Sora逻辑推理

(o系列)、原生全模态、物理世界模拟能力。GPU为主,与微软、Oracle等深度合作拥有庞大GPU资源。C端:ChatGPT已实现数十亿美元ARR;B端:Agent

平台生态。闭源GoogleGemini

3.1超长上下文

(2M+)、原生多模态、生态闭环能力。TPU为主,自研TPU具备性价比,足够满足Gemini训推需求。C端:安卓/AI搜索原生集成;B端:Google

Cloud

Vertex

AI平台。闭源(部分轻量级开源AnthropicClaude

4/4.5编程能力、安全性、长文本逻辑、电脑控制能力。TPU/Tranium/GPU均用,亚马逊+谷歌算力支持,使用Tranium/TPU等云厂自研芯片。C端:C端开发者/专业用户;B端:B端开发者;AWSBedrock

核心模型。闭源MetaLlama

4系列通用性较强、生态兼容性。GPU为主,算力投入激进,拥有庞大自建算力资源。C端:Meta系列社媒集成;B端:构建开源生态护城河。此前开源,潜在向闭源转变xAIGrok-4实时性

(X平台数据)、逻辑推理(Heavy模式)、Tesla

具身智能集成。GPU为主,Colossus巨型集群拥有百万卡级别能力。C端:X平台、Tesla车载语音;B端:Grok

Enterprise混合/开放权重

(通常滞后

6

个月开源)字节跳动Doubao/

Seed-Video低延迟、原生音视频交互、强大的中文语义理解。英伟达GPU/国产算力,资本开支庞大,

在国内拥有算力优势。C端:豆包App

(国内流量第一);B端:火山引擎

(低价策略)。闭源智谱AIGLM-5/CogVideo

/AutoGLM科研、代码、长文本及Agent自动控制

(AutoGLM)。国产芯片适配领先;2026年初香港上市。B端:企业私有化部署标杆;C端:智谱清言

(生产力助手)。混合

(旗舰闭源,轻量级开源)DeepSeekDeepSeek-V3/R1系列算力效率优化出色、极强的逻辑推理、MoE

架构创新引领者。算法在成本侧优化出色。B端:极低成本API;C端:深度搜索。开源/开放权重MiniMaxMinimax

M2.5/hailuo情感计算

(EQ)、角色扮演、视频生成能力、语音感染力。阿里/腾讯/红杉注资,研发投入较高;2026年初香港上市。C端:Talkie/星野/海螺AI;B端:音视频生成API。闭源阿里巴巴通义千问

2.5/3多语言处理、数学与代码能力、商业落地广度。英伟达GPU/自研芯片,阿里云底层支撑,国内最大的云端算力基础设施。B端:阿里云全家桶深度集成;C端:通义APP。混合

(旗舰闭源,轻量级开源)月之暗面Kimi/Kimi

k2.5长文本管理

(Long

Context)、搜索增强、文件深度解析。算力集中于推理侧优化。C端:Kimi

AI助手;B端:开放长文本API。开源各公司官网,申万宏源研究◼

商业化进展:目前OpenAI、谷歌Gemini、Anthropic已实现较为可观的收入,实现方式主要以Chatbot订阅、编程工具订阅、API收入为主。国内商业化进展相对缓慢。开闭源策略:海外闭源为主,国内模型逐渐开始主导开源生态。表:主要大模型公司产品及进展8厂商 产品 发布时间 核心特点OpenAI Deep

Research2025.2

由o3-mini模型驱动,可投入30分钟以上进行多步骤探索及动态调整搜索策略,在HLE测试中取得突出成绩谷歌Gemini

DeepResearch2024.12

引用来源可靠性高,免费用户每月可免费体验数次Perplexity.aiDeep

Search2025.2

Pro用户支持每天500次查询,报告

生成速度更快,大多在3分钟内完成AnthropicClaude

DeepResearch2025.6

基于Multi-Agent实现,更适合处理开放、动态的研究任务月之暗面 KimiResearcher 2025.6

基于端到端自主强化学习训练的agent模型,转为深度研究任务字节跳动 DeerFlow(开源) 2025.5

采用Multi-Agent架构设计,支持深度研究、报告生成、播客生成等阿里通义 支持多种推理形式,包括原生ReAct和上下文管理模式,多项测评上DeepResearch 2025.9

拿到SOTA智谱AI AutoGLM沉思 . 深度研究和实际操作能力于一体25年海外和国内争相发布Deep

Research央广网,IT之家,搜狐网,CSDN(中国开发者网络),DeerFlow(开源深度研究框架),飞书云,申万宏源研究4

AI应用爆款之一:Deep

Research9Cursor(海外大模型厂商),Anthropic(海外大模型厂商),搜狐网,腾讯新闻,contrary(某美国科技公司分析网站),CSDN(中国开发者网络),美国劳工部,36氪,阿里云,福布斯中国,Jetbrains官网,申万宏源研究5

AI应用爆款之二:AI代码+IDE维度CursorClaude

Code中国美国说明开发者规模(万人)平均年薪(美元)AI

Coding当前月平均花费(美元)AI

Coding当前年平均花费(美元)AI效率增益率(保守)AI保守价值(美元/人)AI效率增益率(中期预估)AI中期价值(美元/人)中期总市场价值(亿美元)企业可承受的中期年定价(美元)AI

Coding平均价格提升空间(倍)7003120067225%780050%1560010924685.51901314502024025%3286350%65725124519727.22024工信部、美劳工部口径JetBrains2024开发者生态口径、美劳工部口径阿里云Coding

Plan

Pro、Claude

Pro订阅费代码工作25%由AI生成25%的AI人力成本预估中期代码工作50%由AI生成50%的AI人力成本中期AI

Coding市场价值假设企业按AI价值付费3%*按Jetbrians

IntelliJ

IDEAROI测算类比,开发工具投资占其创造价值约3%企业可承受的中期人均定价对比当前价格产品形态原生AI

IDE大模型代码专项能力产品优势对本地项目结构有感知,贴合实际工程强超长代码生成能力,生成后需适配ARR(亿美元)1025估值(亿美元)2933800(Anthropic整体)适用场景开发者主导,完全掌控代码AI自主执行,高自动化、少干预;适合企业级内部开发用户情况截止2025年底日活跃用户100万无单独披露,自2026年1月1日-2026年2月12日周活跃用户翻倍免费使用限制有限免费订阅/API调用定价模式基础订阅+弹性额度claude全局订阅+API计费Cursor与Claude

Code:ARR提升迅速,适用场景覆盖团队与企业ARR增长迅速:截止2025年底cursor实现9900%的ARR同比增长,达10亿美元,估值迅速攀升为293亿美元,claude

code自2025年5月上线至2026年2月ARR已超25亿美元。代表AI代码2种产品模式:集成式IDE和代理式CLI。cursor更符合普适开发者的习惯即通过GUI编辑器,claudecode强大但更适合于习惯使用command

line的开发者。表:cursor和claude

code的多维度对比 表:AI

Coding市场价值与可提价逻辑测算TRAE是字节跳动于2025年1月19日推出的AI编程工具,旨在提升开发效率,目前有国际版和国内版智能代码操作:通过自然语言输入生成代码片段,提供优化建议,支持从零构建项目,可通过对话获取编程帮助。集成多种模型:集成Claude

3.5+3.7和GPT-4o,国内版搭载doubao-

5-pro,支持切换DeepSeek-R1&V3。项目上下文同步:构建完整“项目语义图谱”,可进行跳转函数定义、生成组件调用代码等操作TRAE与Cursor的区别模型与费用:Trae国际版可免费使用Claude等;国内版免费且无需复杂配置。Cursor需付费使用部分高级功能,接入了DeepSeek、GPT和Claude等模型。功能细节:TRAE的Builder模式目前不如Cursor的Agent模式智能,代码生成准确度有待提高。但TRAE代码回滚更方便,有二次确认机制。用户体验:TRAE界面更符合中文开发者习惯,操作更简洁,新手更友好、端到端;Cursor界面类似VSCode,功能丰富但操作相对复杂。105

AI应用爆款之二:AI代码+IDECSDN(中国开发者网络),TRAE官网,申万宏源研究11图片生成美图RoboNeo订阅制+点数制25年7月上线,1月左右MAU达100万;25H1影像与设计产品收入13.51亿,yoy+45.2%,成为收入支柱。Midjourney订阅制25H1

ARR接近5亿美元。赛道 代表公司/产品 核心变现模式 商业化成效视频生成快手可灵会员订阅+积分制+API调用•25Q1可灵收入超

5亿元,3月ARR突破1亿美元,截止25年6月,全球用户突破2200万;70%来自C端,30%来自B端;70%来自海外市场,30%来自国内。Minimax海螺AI订阅Runway订阅制+企业定制上线后连续6月全球榜单中位居视频生成产品第一,截止25年1月海螺AI海外版访问量达1635万,为国内6倍多。截止25年6月,ARR超过9000万美元。视频生成/图片生成为多模态AI应用变现较快路径之一1)高频刚需场景;2)多元变现路径:个人创作者/中小企业采用订阅制,特定行业大型企业采用API调用和定制化;3)技术成熟度支撑商用:模型语义理解、生成质量、时长等方面持续进步,进入可商用阶段。全球多模态AI商业化进展加速,可灵进展突出36氪,新浪网,金灵Gilin,钛媒体,CSDN(中国开发者网络),申万宏源研究6

AI应用爆款之三:多模态12维度可灵2.1Veo

3核心技术物理动态渲染(3D时空注意力机制)原生音视频同步(V2A音频引辈)生成质量全球图生视频榜首(Artificial

Analysis)文生视频真实性全球第一视频长度最长支持2分钟(大师版)限制8秒生成速度5秒视频≈30秒(标准模式)8秒视频≈2分钟(完整版)单帧成本5秒视频≈¥2(标准版)8秒视频≈¥23(Veo3标准版)使用场景商业短剧、高定制广告创意短片、多语言教育内容分析可灵商业化快速原因:1)技术领先:20+次迭代领跑;2)成本优势:相较于海外主流模型具有显著成本优势;3)快手生态:商业短剧、广告等需求量高。对比谷歌Veo3,可灵更具成本优势Artificial

Analysis(AI测评网站),虎嗅网,可灵AI,智源社区,Google

AI

for

Developers(谷歌AI开发者社区),36氪,申万宏源研究6

AI应用爆款之三:多模态137

AI应用爆款之四:各项技术组合之Agent重要的技术进展模型任务规划和反思能力提升 • Deep

Research:具备深度思考与任务规划能力,通过思考-规划-执行闭环动态调整策略持久化记忆从简单注意力机制转向复杂多层记忆管理2025年4月发布Mem0:独立于上下文窗口外的持久化知识库,较低API费用下维持长期对话自动构建知识图谱、在过去错误中学习;2025年10月DeepSeek

OCR:通过视觉输入模拟人类记忆衰减;多模态与世界模型Agent能看懂图像和视频,通过世界模型在内部模拟物理动态预测行为后果,为具身智能和实体AI奠定基础高效的工具使用2024年11月MCP:解决智能体与工具集成的复杂度;年月MCP执行代码:解决大量 MCP工具带来的上下文窗口重载、中间工具额外消耗tokens问题。GAIA 74.55% - 58.18% 32.73% 30.30% -通用AI

Agent基准测试,450个答案明确的题目,测试推理、多模态处理、网页浏览和工具使用熟练度。WebArena68%-58.10%7.12%-7.14%通过系列自然语言描述的高级任务测试模型Web交互能力评估完成度

OSWorld 62.90% 53.10% 23% - - 4

60%真实计算机环境中对多模态Agent进行开放式任务测试 Agent在技术实现性上仍有较大提升空间:单步骤成功率在多步复合下,成功率大幅降低各类复杂任务Benchmark中得分较低,尤其是无正确答案的开放式任务。几类较常见的Agent测评榜单(选择厂商得分最高的模型分数比较)Anthropic 字节 OpenAI 谷歌 DeepSeek 阿里千问 测评简介◼

2025逐渐显现的发展方向:通过构建多层次架构解决Agent瓶颈,分层&多智能体、多步搜索+自我纠错、记忆持久化等2025年出现的对Agent渗透提升的重要技术进展论文《Mem0:Building

Production-Ready

AI

Agents

with

Scalable

Long-Term

Memory》,Github(海外编程社区),Anthropic(海外大模型公司),Gaia(AI评测网站),WebArena(AI

Agent网站),OS

World(AI评测网站),申万宏源研究14重点方向 具体进展预测MAS多Agent系统•••2025年CrewAI、AutoGen、LangGraph等框架的热门证明MAS可行性和优越性;字节、Anthropic的Deep

Research都采用MAS架构;2026年有望从开发者社区扩展到企业架构。人-机劳动力重组•••AI

Agent从任务自动化到角色自动化;2025年软件开发Agent平台开始内置产品经理、开发、测试等角色;HCM平台或将提供数字员工管理能力,包括访问权限、绩效评估等。慢思考+端侧操作2025年Deep

Research进展看到模型规划-执行-反思能力的增强;智谱AutoGLM等已探索结合多模态、实际操作的端侧通用助手。具身智能 • 基于世界模型的实体Agent代表最终的专业化,在机器人、供应链和自动驾驶等物理世界应用中展现价值。2026年AI

Agent重要方向预测一个常见的MAS示例——拆分为分析助手和文本写作两步智谱AutoGLM端侧Agent助手——打印机接入Agent实现缺墨自动购买Medium(AI资讯网站),申万宏源研究7

AI应用爆款之四:各项技术组合之Agent主要内容大模型:范式收敛,应用深化智谱:原生大模型公司突围IPO重点标的与估值15162.1

智谱华章:大模型B端初创公司代表国内领先的通用大模型开发商:20年即启动预训练框架通用语言模型开发,21年发布首个百亿参数预训练大模型GLM-10B。目前按收入计为国内最大独立通用大模型开发商、国内第二大整体通用大模型开发商。截止25H1,客户规模8000+,赋能端侧设备~8000万。核心优势:背靠清华+全系列基座模型+前沿端侧智能体+较高毛利率商业化:B端为核心,主要为提供MaaS平台服务,当前本地化部署占主要收入来源。当前正处于收入高增、高投入期,亏损仍较高,24-25H1收入分别为3.1、 9亿,经调净利润分别为-24.7、-17.5亿。出海:24-25年逐步拓展至中国香港、东南亚等地区。95.5%90.4%84.5%59.7%84.8%4.5%9.6%15.5%40.3%15.2%20%0%40%60%80%100%120%20222023202424H125H1本地化部署云端部署MaaS平台为核心产品:全面模型组合、可扩展的应用、便捷 主要收入来自于本地化部署基础设施适配公司招股书,申万宏源研究14.631

71552.8603.21145.125.5%497.0%1343.2%599.9%0%200%400%600%800%1600%1400%1200%1000%1,8001,6001,4001,2001,00080060040020002022250.3%2023 2024 24H1 25H1研发算力服务费(百万元)研发算力服务费占收入比12.030.28.535.89.6%9.7%05

0.0%10152025303520222023 2024 24H1 25H1计算服务费-营业成本(百万元)营业成本计算服务费占收入比172.1

当前处于高增长、高投入阶段,利润端仍承压57.4312.444.9190.9116.9%150.9%50 50%100 100%150 124.5 150%200 200%300 300%250 250%350 350%-62

0-2465.6-1030.2-1752.0(3,000)(2,500)(2,000)(1,500)(1,000)(500)02022 2023 2024 24H1 25H1-97.453.6%68.2%66.0%62.6%59.1%3

0%3.4%28.6%54.6%64.6%56.3%48.9%50.0%80%70%60%50%40%30%20%10%0%2022 202320240.4%24H1 25H1云端部署毛利率本地化部署毛利率总毛利率424.7%702.7%1913.2%835.4%147.0%26.4%8

3%124.0%32

1%109.3%0%500%1000%1500%2000%2500%20222023202424H125H1研发费用率销售费用率管理费用率图:收入处于高速增长期(单位:百万元)图:经调净利润亏损仍较高(单位:百万元)图:本地化部署保持较高毛利率76.1%0 0%2022 2023 2024 24H1 25H1收入 yoy图:仍处于高投入阶段图:收入相关算力支出占收入比升高(左轴:百万元)40 18.8% 18.8%

20%18%16%14%12%10%8%6%4%2%0%图:保持模型领先性仍需较高训练算力投入(左轴:百万元)公司招股书,申万宏源研究182.1

当前核心收入来自于本地化部署,云端处于发展初期20222023202425H1总收入(百万元)57.4124.5312.4190.9yoy116.9%150.9%云端部署收入(百万元)2.61 948.529.1yoy359.7%306.6%云端部署客户数(个)0281252573061yoy86.9%平均收入(元)4240.49222.89506.7yoy117.5%收入占比4.5%9.6%15.5%15.2%本地化部署收入(百万元)54.8112.6263.916 8yoy105.4%134.4%本地化部署客户数(个)486112395yoy27.1%10 6%平均收入(万元)114.2184.6214.6170.3yoy6 7%16.2%收入占比.%.%.%.%◼

本地化部署收入主要来自客户数的增长,云端部署客户数、平均收入均处于高增时期。表:智谱收入拆分公司招股书,申万宏源研究192.2

源于清华,具备深厚研发实力职位 人名 背景人联合创始

唐杰曾任清华大学计算机系教授、计算机系副主任、清华-工程院知识智能联合实验室主任、杰青。领导建立Aminer科技情报大数据挖掘与服务系统平台,及国内首个超大规模智能模型悟道。联合创始人、CEO

张鹏清华大学2018创新领军工程博士,曾任中国新闻信息标准化分会委员,电子学会标准化工作委员会机器人技术委员会委员。联合创始

李涓人 子领导KEG实验室,清华大学计算机系教授,博士生导师,为语义内容管理及文本与社交网络挖掘领域顶尖专家。联合创始

王绍人、副总

兰清华大学创新领军工程博士。曾任清华大学数据科学研究院科技大数据研究中心副主任,NASDAQ上市公司凹凸科技北京公司总经理长联合创始

刘德人、董事

兵中科院计算所博士,师从中国工程院院士高文,曾任清华数据科学研究院科技大数据研究中心副主任、

经理年份 里程碑事件2019年 公司成立2020年 启动预训练框架通用语言模型

(GLM)

的开发2021年发布首个百亿参数预训练大模型

GLM-10B推出模型即服务

(MaaS)

产品开发及商业化平台2022年发布开源大模型

GLM-130B9月发布高性能代码模型

CodeGeeX2023年于3月发布十亿参数基座对话模型

ChatGLM,并于3月发布开源

ChatGLM-6B发布中国首批通过监管备案的大模型产品之一智谱清言2024年发布具备智能体编排协同能力的基座模型

GLM-4发布视觉理解基座模型

GLM-4V发布下一代视频生成模型

CogVideoX

和移动应用程序智谱清影发布

GLM-4系列中最新、最先进的基座模型

GLM-4-Plus,并在智谱清言上线

AI视频通话功能发布端到端情感语音生成模型

GLM-4-Voice

及用于自主设备操作的基座智能体模型

AutoGLM发布处理高级推理任务的反思模型

GLM-Z12025年发布端到端模型

GLM-Realtime,支持实时视听互动、哼唱2分钟记忆保留及函数调用功能发布首个集深度研究和操作执行于一体的

AI

AgentAutoGLM

Rumination,可实现自主多步骤推理和行动发布

GLM-4.5、GLM-4.5V、AutoGLM

的更新版本(亦称为“AutoGLM

.”)及

GLM-.表:创始团队多源于清华表:智谱华章发展历程公司招股书,申万宏源研究2.2

股权结构呈现学术+国资产业基金特点图:智谱股权架构领航投资人:君联资本、社保中关村创新基金、天津三快(美团)其他主要投资者:财务投资:启明创投等。国资及产业基金:海河富新(武清国资委)、中关村科学城(海淀国资委)、珠海华发(珠海国资委)、智慧领航(浦东国资委)、人工智能基金(北京国资委)、杭州城投产业基金(杭州国资委)、大兴产业基金(大兴国资委)、高新策源(成都高新投资集团)、清华资产管理等。互联网:蚂蚁、腾讯等。海外资本:Prosperity7(沙特)等。公司招股书,申万宏源研究 20212.3

保持前沿,一站式MaaS平台应用于多个行业、预训练教会机器理解、书写并使用人类语言交流对齐及推理人类意图对齐,会推理与规划,提升安全减少幻觉、实现多模态和行动的对齐自主学习自我批评、自我反思及沉思自我认知无人类监督下,机器自我观察和解读形成自主态度和情感意识智能对自身内部和外部环境感知,表现出类人意识特征创新性:一直处于AGI路线前沿,国内首个专有预训练大模型框架GLM、率先发布端侧智能体应用、率先发布深度思考结合Agent的应用。领先的商业化:21年开始商业化,比国内大部分大模型商业化早2年,目前已超8000家客户。表:智谱的AGI定义,前3阶段已实现图:以基模为核心,覆盖从模型能力、开发部署工具到场景解决方案的全方位需求一站式MaaS平台,支持灵活部署和应用开发,支持云端/本地化部署。区别于传统项目制,

智能体工具如场景模版和插件库,

支持快速定制化和应用开发。应用于端侧、科技、互联网、金融等行业。公司招股书,申万宏源研究222.3

互联网科技和公共服务为当前主要落地行业表:落地多行业领域,优先消费电子及物联网,计划进军教育和医疗等案例行业任务类型AI赋能内容案例一技术及互联网消费电子AI

AgentAgent集成至智能手机,实现端侧AI音视频通话、长上下文记忆、社交媒体内容生成等案例二技术及互联网金山办公WPS

AI助力WPS

AI生成大纲、PPT内容、演讲稿和自主格式化内容等案例三技术及互联网智联招聘AI助手了解招聘需求、建立筛选、建议提供、面试评估、简历生成等案例四技术及互联网捏Ta多模态内容创作智能短视频生成Agent案例五传统行业汽车制造和智能座舱使智能座舱交互更自然和个性化案例六零售行业蒙牛乳业AI营养师提供专家级、个性化营养与健康服务案例七传统行业金融服务企业大模型集成提升内部管理效能,包括财务资本管理、交通运输与物流管理、办公协同系统智能升级案例八公共服务Aminer学者研究助手学术检索、学者画像分析、AI辅助文献分析、文献综述撰写辅助等49.6%43.3%38.3%50.0%40.0%30.0%20.0%10.0%0.0%60.0%

55.2%80.0%70.0%2022202320242024H12025H1互联网科技 公共服务 电信 传统企业 消费电子 其他图:日均token消耗量迅速提升(亿)图:本地部署客户中互联网科技企业接近半数,其次是公共服务67.6%公司招股书,申万宏源研究521200046000500004500040000350003000025000200001500010000500002022202320242025H1232.4

全系列模型覆盖各场景,多模态融合赋能端侧Agent人类能力深度思考认知世界模型及智能体基座模型GLM-4.7主要模型模型核心能力专攻确定性问题,提供精确、准确的解决方案专攻不确定性命题,迭代收集处理外部信息解决开放性探索问题CogView-4是首个支持汉字生成的开源文生图模型,复杂语义对齐和指令遵循方面表现力强多模态融合,解决如视觉定位、网页还原、图像推理、复杂多图表文档理解等任务支持4K高清分辨率、10s时长生成、60帧/秒的4K视频支持AI眼镜、陪伴机器人等端侧的结合,提供实时AI音视频通话直接音频token建模语音生成,理解与生成中英文语音,支持实时语音对话交互反思及沉思模型多模态模型GLM-Z1(反思)GLM-Z1-Rumination(沉思)CogView(图片生成)GLM-4.5V(视觉理解及推理)CogVideoX(视频生成)GLM-Realtime(实时视频通话)GLM-4-Voice(端到端语音模型)工具使用AI

AgentAutoGLM(自主任务完成智能体)从对话到执行,通过GUI路径自主控制端侧的智能体AutoGLM-Rumination(具备深度思考的自主任务完成智能体)从推理到执行,通过多轮迭代思考结合自主决策解决开放式深度问题CoCo(企业级智能体)为企业提供安全访问及自主编排系列关键资源的能力,如企业软件、知识库与数据库等代码模型CodeGeeX(代码编写)基于自然语言描述自动生成代码或补全代码行和代码块,提升生产效率表:智谱全系列模型,覆盖深度思考、多模态理解和生成、智能体和代码全场景端侧智能体AutoGLM

:从对话到执行GUI路径解决长尾问题场景;支持云端完成任务;结合反思能力,适合处理复杂任务;开源以促进AI端侧生态。图:通过GUI方式在手机端实现任务自动化公司招股书,申万宏源研究242.5

GLM-5:不仅是更强的模型,而是更自主的工程师核心突破:解决Agent长周期复杂任务的真实环境适应和算力成本问题。1)MoE+DSA稀疏注意力机制:推理成本降低 5-2倍,模型参数规模扩至744B;2)异步RL基础设施:生成与训练解耦,提高GPU利用率;3)异步Agent

RL算法:长周期交互学习、自我纠错能力优化;4)适配国产算力生态:兼容华为、摩尔、海光、寒武纪等7大国产主流芯片平台。重点提升推理、编程和Agent能力:在代表上述能力的多个测评集中表现和

Claude Opus 4.5、

GPT-5.2(xhigh)相当;在LM

Arena的Code排行榜中,截止2026年2月25日,GLM5位列国内模型第一,仅次于Anthropic、OpenAI、谷歌。图:GLM5在推理、编程、Agent相关测试集中表现与海外顶尖模型相当图:GLM5在推理、编程、Agent相关测试集中表现与海外顶尖模型相当智谱公众号,Arena官网,申万宏源研究252.5

议价能力证明模型性能的提升未公开5.00、6.25、10.0025.0089.1%83.9%95.6%79.2%15041560-17003.0015.0085.3%76.3%90.6%58.6%1422115211826850.280.4284.9%-84.6%67.2%14241370-地区主要模型 厂商参数量(十亿)输入价格(美金/百万输出价格(美金/百万MMLU(通用

MMMU(通

AIME(数学

SWE-benchtokens) tokens) 语言) 用推理) 推理) (编程)LMArena

TextCodeLMArenaLMArena

Vision海外GPT-5.2OpenAIGemini

3.1Pro谷歌Claude AnthroOpus

4.6 picGrok-4 xAI国内DeepSeek

深度求V3.2 索M2.5MinimaxKimi

K2.5月之暗面0.50.824032818302520151050输入(元/百万tokens)输出(元/百万tokens)50010015020025030035025年7月发布4.526年2月发布GLM5

6表:GLM

5文字、代码能力均出色,LM

Arena

Code榜中位列国内大模型第一图:GLM

系列模型逐步提价(单位:元/百万tokens)28图:根据openrouter智谱模型日均调用量看,GLM

5

发布后调用量显著提升(单位:十亿)各公司官网,Vals.AI(模型测试网站),腾讯新闻,CSDN(中国开发者网络),IT之家,新浪新闻,Arena官网,Openrouter(大模型聚合网站),申万宏源研究未公开 75 14.00 86.2% 86.7% 96.9% 75.4%1481 1471 1267未公开2.00、4.0012.00、18.0090%88.2%98.1%70.2%150014611288Qwen3-Max阿里>10000.385084.4%- 80%62.4%143412801217豆包2.0字节10000.48、0.72、442.4、3.6、7.2-85.4%-76.5%1472-1259GLM

5智谱7440.6、0.92.7、3.386.0%- 97%67.8%14541452-2300.322680.1%-88.8%70.4%13991438-10000.113.15-84.3%95.6%68.6%145014361247262.6

ToB奠定业务基石,云API开启长效增长空间考虑商业利益冲突、数据隐私、成本,部分互联网厂,以及能源、金融、政务、医疗等核心领域企业更青睐于独立大模型公司及本地化部署模式。中国邮储银行x智谱华章:联合创立实验室,将智谱GLM大模型底座部署在银行私有算力集群。2025年通用大模型厂商中标排行榜中,排名依次为科大讯飞(210家,23亿)

、百度(110家,8.9亿)、火山引擎(83家,5.2亿)、阿里云(69家,4.0亿)、智谱(57家,2.5亿)、腾讯云(44家, 2亿)。本地化部署在应用爆发初期具备商业化优势,API调用在应用爆发后期具备更高空间。图:对企业而言,本地化部署初期成本较高,随着使用时长增加,本地化部署远期具备成本效益《A

Cost-Benefit

Analysis

ofOn-Premise

Large

LanguageModel

Deployment:Breaking

Even

with

Commercial

LLM

Services》,搜狐网,新浪网,申万宏源研究主要内容大模型:范式收敛,应用深化智谱:原生大模型公司突围IPO重点标的与估值27283.1

ToB场景需求明确,模型+行业Know-How是关键大模型ToB落地领域行业落地特点大模型应用场景发展趋势代表性公司AI+办公较早落地,渗透率最高办公协同、企业流程自动化从简单的办公辅助向企业深度流程自动化渗透金山办公、税友股份、合合信息等AI+金融付费能力较强,对准确性要求较高智能投研/投顾、合规与审计、反欺诈与营销等尝试将AI接入交易决策和核心风控的深水区第四范式、宇信科技等AI+医疗专业壁垒较高流程提效、临床辅助决策、慢病管理、AI4S等从管理提效到辅助诊断跨越讯飞医疗、医渡科技等AI+工业制造高潜力,强调实时性与闭环预测性维护、生产工艺优化、智能排产等与现有DCS、PLC等系统深度耦合中控技术等AI+教育较早落地,快速增长1对1虚拟辅导、教师提效等从通用转向个性化因材施教科大讯飞等AI+法律合规试水阶段法律法规检索、案件研判支持、证据链梳理等从搜索工具向法律助理探索金桥信息等为什么大模型在ToB场景能够率先落地?1)痛点具象,付费逻辑明确:企业需求通常结构化,落地场景ROI能够较好计量。且通常有较成熟的IT预算和数智化转型考核,相比个人付费,企业更愿意为确定性效率提升买单。2)门槛适中,看重业务深度和工程落地:不需要全能AGI,只需解决特定工作流痛点。封闭场景+专有数据能够极大降低幻觉风险。3)具备行业Know-How的公司能够快速结合落地:垂类领域软件公司过往积累大量行业Know-How,结合模型能力更能直击行业痛点。图:大模型ToB场景已开始渗透爆发,逐渐从简单任务向深度决策拓展申万宏源研究293.2

重点关注AI应用:关注商业化节奏智谱:大模型初创公司ToB代表,率先突围IPOMinimax:大模型初创公司ToC代表,率先突围IPO金山办公:AI落地核心应用,WPS365带领AI+协同落地范式,业绩边际向上税友股份:财税AI卡位稀缺,AI收入持续兑现虹软科技:智能手机/汽车AI算法业绩稳健,AI眼镜多催化鼎捷数智:AI

Agent产品加速放量,下游客户景气度向上合合信息:产品化出色+C端商业化落地+持续创新的工具型AI公司京东健康:核心受益于线上药品渗透率提升,AI医疗赋能德赛西威:端到端方案普及有望大幅拉升单车ASP,出海+无人物流打开第三成长曲线海康威视:创新业务收入占比持续提升,EBG挖掘AI视觉在工业能源等行业深度应用新大陆:低PE阿里链,AI营销有望推动增值服务收入高增,出海可期范式智能:B端AI应用平台提供商,下游是各行各业,2026年收入增速指引乐观福昕软件:订阅+渠道转型成功,数据持续验证,抢占Adobe市场索辰科技:物理AI逐步落地,国产CAE行业整合加速申万宏源研究303.2

其他关键标的关注景气向上/反转方向、关注行业格局优化领军公司迈富时:高增速营销AI玩家,能力边界拓展金蝶国际:企业级AI

Agent实践,AI+SaaS迎业绩关键兑现期同花顺:APP用户基础广泛,市场交投活跃核心受益,ETF基金代销、B端有增量博思软件:医疗+政务AI订单稳中有升,26年拐点将现科大讯飞:AI收入订单领军,学习机和企业AI服务高增顶点软件:核心系统信创进度行业领先,信创加速核心受益晶泰控股:AI4S核心标的,陆续披露多项AI制药标杆订单万兴科技:AI收入占比提升,Filmora等核心产品接入ChatGPT后推送更多新功能恒生电子:证券IT

B端市占率较高,受益信创、证券AI应用加速能科科技:AI模型产业化落地核心,特种行业AI收入加速卓易信息:AI

IDE/代码Agent核心标的,股权激励目标明确申万宏源研究313.3

AI应用重点标的及估值;注:1)所有港股标的市值及财务数据均换算为人民币;2)Minimax、致远互联、金山办公、福昕软件、合合信息、京东健康、海康威视、卓易信息、虹软科技、德赛西威2025年净利润为实际值,金蝶国际、用友网络、万兴科技、晶泰控股、科大讯飞、博思软件、恒生电子、同花顺按2025年净利润按业绩预告取中值,其他公司盈利预测取 一致预期。股票代码股票简称2026/3/6归母净利润(亿元)PE总市值(亿元)2024A2025E2026E2027E2024A2025E2026E2027E2513.HK智谱2,093(29.6)(35.8)(40.3)(39.5)----0100.HKMinimax2,230(13

6)(34.8)(35.9)----0268.HK金蝶国际3030.84.57.9-3786738600588.SH用友网络463(33.4)(

4)(20.6)(13.5)2.27.1--20965300378.SZ鼎捷数智120682.22.8776554442556.HK迈富时77(8.8)0.10.76-67910749603859.SH能科科技10692.42.93.656443630688369.SH致远互联27(2.4)(2.2)(0.3)0.2---129000997.SZ新大陆23510.112.715.418.123181513300624.SZ万兴科技148(

6)(0.8)0.84--1831076682.HK范式智能176(2.7)0.62.86.1-316632968811

SH金山办公1,32516.518.422.928.081725847688095.SH福昕软件730.30

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论