智谱：专注基模迭代打造顶尖Coding与Agent能力

上传人：策*** IP属地：山西上传时间：2026-06-04 格式：DOCX 页数：81 大小：1.95MB 积分：19.9 举报 版权申诉

已阅读5页，还剩76页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

谱已形成多模态模型、AIAgent和代码模型等丰富的模型矩阵，并采token也将成为AI时代的“水电煤”。平以及幻觉率上具备优势。得益于模型优异的性能表现，智谱已率先2,7276,408276.582.3-2,466-3,182-3,878-2,587-1,103-397.0-129.1-121.9-66.7-42.7-149.5-115.9-95.1-142.5-334.12024A2025A2026E2027E2028E52存货000012024A2025A2026E2027E2028E00000000000000000002024A2025A2026E2027E2028E销售费用金融资产减值亏损000002024A2025A2026E2027E2028E每股收益(最新摊薄)每股经营现金流(最新摊薄)每股净资产(最新摊薄) 6 6 7 8 2.2应用突破：AI形态从Chatbot到Agent 40 42 45 46 6 7 7 8 9 机系知识工程实验室的技术成果转化而来，凭借团队的学术严谨性和创新精神索AI领域的前沿发展。公司已形成基于GLM基机系知识工程实验室技术成果转化。2020年公司启动GLM品及商业化平台于2021年正式发布。语音模型GLM-4-Voice等的推出标志着智谱多模态模型矩阵从2024年1月发布的GLM-4迭代至最新的GLM-5，推理、编程以及Agent能力持续升级，稳居国内外大模型第一梯队。在编程领域，GLM-5使用体感已持续探索AI在手机端侧及企业场景的落地。2026年3月发布了面向OpenClaw场模型第一。lll公司北京研究所，最后职位为研究工程师。此后在清华大学lll担任中国中文信息学会语言与知识计算专业委员会能中心主任。李博士亦担任清华大学计算机科学与技王绍兰联合创始人、副总经理王绍兰联合创始人、副总经理l的股权，慧惠与智登是公司的员工持股平台。智谱的一致行动人包括北京链湃、在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能方面实现全面提升。在公开基准与真实编程任务中，GLM-4.6的代码能力已对齐ClaudeSonnet4。程任务规划与工具协同，在编程、推理与智能体三个维度实现突破。在全球百万用28.5T。在Coding与Agent能力上，取得开源SOTA表现，在真实编程场景的使用体感逼近ClaudeOpus4.5，擅长复杂系统工程与长程Agent任务。在ArtificialAnalysis榜单中，GLM-5户和开发者可以通过平台访问公司最新的模型和智能体产品。全面的模型组合赋能客户解决各类通用任务的基础能力，广泛的智能体工具（如场景模板和插件库）进一步推动模型的快速定制化和应用开发，客户可根据特定领域或场景构建专属模型和解决方还支持无缝接入部署多种Agent功能以解决独特需求、优化工作流程、满足求，助力企业和开发者全面实现人工智能转型。强大的模型能力施环境中，支持客户基于其专有或敏感数据构建私域专属模型。该模式下，客户对模型性能调优及基础设施配置具有较高自主权，适用于对安全性、稳定性及专业化程度要求较高的应用场景。本地化部署定价通过模型类型与规模、纳入的计算资源量及实施成本厘定。该套餐价格可按一次性计费或按年计费，收入在大模型及相关为客户提供标准化模型服务。该模式有助于降低客户前期基础设施投入，周期，适用于对部署效率及灵活性要求较高的应用场景。云端部署提供客户根据token消耗量计费、以及定价由订阅定的基于订阅的合约。在收入确认方面，订阅制合同根据合同期内履约进度按比例确认收入，按使用量计费的合同则根据客户实际资源使用情况在服务提供-落地节奏匹配。具体来看，2025年本地化部署与云端部署收入分别为5.3/1.9亿元，占总收入的比例为74%/26%。收入结构表明公司收入当前主要来自品在企业级应用场景中具备更明确的需求和更强的商业落地能力。根据公4.04.0于低毛利的云端收入占比提高以及本地化部署毛利的阶段性下降。公司源于高毛利的本地化部署业务，但随着推理效率、算力规模扩张署毛利率的下滑，主要受行业竞争加剧和通过价格策略加速市场渗透、抢占客l研发费用：研发是大模型厂商的立足之本，智谱在研发团队、基座模型迭代以及算71.8%。展望未来，公司将通过优化模型训练与推理流程、协同合作伙伴设计基础0销售及营销费用率销售及营销费用率研发费用率算力服务算力服务工资成本折旧及摊销技术服务及咨询费其他70.7%71.8%202240%47.2亿元，剔除股权激励费用及金融工具公允价值变动等非经常性因素后，Non-GAAP口径下归母净亏损为31.8亿元。亏损扩大主要由于公司仍处于战略投入与业务扩张阶段，一方面持续加大研发投入，研发团队扩张及模型训练对算力资源的高强度成本；另一方面，为把握新兴市场机遇，公司同步加强销售与营销团队建设，带动销售yoyNon-Non-GAAP归母净利润（亿元）yoy学、代码、数学等复杂领域。索DeepSeek发布并开源了R1模型，模型采用纯深度学习的方法，并发现AI自发涌现通过构建“深度推理、探索与反思”的整合框架，确保每个逻辑环节在复杂结构严密执行，并鼓励模型挖掘非显性的潜在路径，同时引入迭代分析机制对结论进重估与修正。这种从线性到演进式逻辑的转变，使得长思维链在处理高难度问题具调用前都会进行思考，提高了指令遵循和生成质量。保留式思考更侧重编程智能体场模型需要处理的不再只是原始问题，还包括任务所处的阶段、已完成的步骤、待解决的子任务，以及工具执行返回的环境反馈。与此同时，模型往往需要借助外部工具来获取Anthropic提出AIAgent上下文工程的三大核心准则。鉴于大语言模型受限于有限的新知识去完成任务。CL-bench将上下文学习能力的不足分为忽略、误用以及格不遵守三大类型，研究结果表示主流模型的错误比例都很高。例如，GPT-5.1在压缩、记忆系统来解决上下文的问题，在特定场景下有效，但本质上都是在回避核心问DeepSeek提出条件记忆，增强上下文能力的同时降低计算成本。条件记忆的重点在所所Learning）的新型学习范式，将深度学习架构重新定义为一套由不同更新频率驱动的嵌套、并行优化问题系统，每个组件本质上都是通过压缩自身上下文流来工作的关联存储验表明，HOPE在语言建模、常识推理和长上下文记忆等任务中展现出显著优势，为实每个专家本身是一个独立的神经网络。而门控网络或路由用于决定t家方向。MoE实现了在相同的计算预算条练阶段，MoE相较于稠密模型能够更快地达到相同的质量水平。在推块间两部分，块内用传统注意力计算，块间用线性注意力的核技巧，避免了累积求和操作拖慢速度。LightningAttention还采用存使用更高效，训练速度不随序列长度增加而变慢。在架构中，每隔七个使用线性注意力的Transformer块插入一个使用标准softmax注意理论可以让推理长度扩展到数十万个token。从而达到AGI。中国的大模型厂商也逐步从追随者转变为主要竞争者，在开源技术、模型优化算法和产题能力的AI推理能力的提升使得Agent能够有效解决任务规划、错误识别等核心难题。Agent与传过程执行任务，具备更强的任务执行力。Agent通常由四个核心模块组成：大脑（大语将API调用转化为具备上下文感知的协作指令集，实现从自然是一种约定标准，本质上是一个包含元数据、脚本、模板、参考指令等的Agent能力的提升将AI应用扩展至生产力领域，编程场景最为明显。典型的产品如293亿美元。Manus是由中国团队推出的一款通用型AIAgent产品，通过调用多个第三的沙盒环境中运行，具备互联网访问、持久文件系统、安装软件、创建自定义工具OpenClaw火爆出圈，其将大模型的能力与用户的本台、需要系统级权限且带有自动化性质的任务，如邮件管理、网页自动化、开发者效率中国大语言模型市场处于高速增长期，以企业级客户为主导。根据弗若斯特沙利文及机构客户贡献人民币47亿元、个人客户贡献约人民币能力、推理效率及落地成本等方面持续优化，同时机构与个人应用需求加速释904亿元，2024-2030年复合年增长率为63.7%，占整体市场规模的比例为89.4%。占比较低。展望未来，随着企业对部署效率及模型迭代能力需求提升，云端部署元，本地化部署市场规模约人民币691亿模在2024年达到490.3亿美元，其中北美、欧洲与亚太地区为三大主图表35：2024-2034年AIAPI市场规模2024-2034年AIAPI市场规模（十亿美元）02024年AIAPI各地区市场份额在B端，企业的AI应用率与支出均持续上升。根据RampAIIndex，企业A图表38：B端-美国企业的AI应用率2025年中国AIGC行业核心市场规模为805.8亿元，同比增长70.8%，预计2028年将AIGC市场规模（亿元）AIGC市场规模（亿元）805.8471.7yoy2767.42317.60析）时，需进行多步推理、反思及工具调用，所以运行一次Agent的token消耗量，将会达到称单对话的十倍以上。IDC预计，Agent数量与任务执行量将会爆炸深度嵌入企业的业务流中。预计Agent的年度token消耗将从2025年的0.0005根据我们测算，预计2030年全球AICoding市场规模将在691-3840亿美元区间内，具虑到未来算力成本会有所下降，但预计相同的订阅套餐-472.3.3付费方式：主要为API调用和订阅制直接挂钩，考验大模型厂商模型服务与价格的综合能力。成本端则需要从算法、架构、除了覆盖后期推理的成本外，token的价格也需要以智谱为例，其GLMCodingLite/Pro/公司模型矩阵llllVeo（视频生成）tokenlAPI调用l合llll广llllll腾讯llAPI调用lll亿API调用lStep-asr（语音识别）力API调用公司订阅价格-原价（每月）$8/20/200$20/100腾讯-40/200元40/200元GLM-5.1AutoClawPlan：35/160/900/1800元普通版本：29/49/119元极速版本：98/199/899元-计算机系知识工程实验室的技术成果转化而来，实验室技术积淀深厚。公司研发人员密科学家张钹博士及多位核心技术负责人共同领导，始终引领着AI前沿共同学术背景确保技术路线的连续性。同时，公司也在积极拓展与其他顶尖高校核心技术人员中国科学院院士，张钹博士在模式识别、知识出的问题求解商空间理论具有开创性意义，提出的多粒度推理与计算复杂度优化创新方法已成为心理论。张博士发表论文400余篇，出版多部获奖专著，曾获刘博士在大语言模型、机器学习与数据挖掘领域拥有深厚的专业知识院等机构合作开展的30余项重大科研项目。刘博士师从首席执行官，张博士是中国实用型AI创新模型系列研发中发挥核心作用。其于国际机器学习大会（ICML）及国际语义网大会（ISWC）等顶级会议发表论文十余篇，致力于推动“知识+数据”双据分析、智能问答及决策支持系统等领域的实践专长，使其成为将人工智能研究转化为具有影响力的实际应郑先生拥有卡内基梅隆大学的硕士学位，此前曾在谷歌担任高级研发工程师。彼获得美国伊利诺伊大学香槟分校博士学位及获得清华大学学士学位。顾博士为中国一家大型科技公挖掘以及大语言模型方面的专家，彼于NLP开发以及大语言杜博士在清华大学完成了计算机科学的本科和博士学习。杜博士专注于机器学习算法在现实用，包括信息检索、知识图谱及预训练语言模型。彼亦专注于机器学习及强化学习李博士是语义内容管理及文本与社交网络挖掘领域的顶尖专家。其主一，该标准已被国内主流通讯社采用。李博士在顶级学术会议发表黄博士担任多项重要会议核心职务。其曾获得吴文俊人工智能科学技术奖及钱伟长中文黄博士担任多项重要会议核心职务。其曾获得吴文俊人工智能科学技术奖及钱伟长中文知识库向主动问题求解器演进，计算成本与现实适应性已成为制约规模化应用料库，并在训练初期即重点引入代码与推理数据，为后续的Agent能进行训练，以保障模型在复杂工作流中的执行稳定性。后训练阶段则引入序列DSA可基于上下文内容动态判别token重要性并分配计算资源，实现算力效率的质的飞token以上；针对编程与Agent任务构建大创新性地保留轨迹中的错误片段但对其进行损失掩码，使模型学习纠错行推向极致。该系统支持训练过程中的大规模Agent轨迹探索，显著缓训练方法，使模型能够在多样化、长时间尺度的交互中持续学习，并针对动态场对于其的需求也会更高。此外，平台的可靠性及稳健性、定价模式、为用等能力也会影响到MaaS平台的表现。0的要求更加严格，模型在关键业务决策、合规风险上出错，会给企业带来严重业造成的损失高达674亿美元。我们认为，除了优GLM-5.1GLM-5Qwen3.6-GLM-5.1GLM-5Qwen3.6-MiniMax-M2.7KimiK2Gemini-3.1-ProGSWE-BenchProNL2普通单月价格（不包含优惠）分别为49/149/469元。CodingPlan动，且能够无缝适配ClaudeCode、态。这不仅体现出模型在开发者中的认可度及付费意愿较高，也进一步反映了智谱对发自我反馈和自我提升。在AndroidLab评测基准上，AutoGLM显著超越了GPT-4o和来升级，进化成在云端完成多样化任务的执行助手。在生活场景下，能够操作美团、京东、小红书、抖音等几十个高频应用。在办公场景下，能跨网站执行全流程工作，操作网页版的飞书、网易邮箱等，并完成从信息检索到内容撰写，再到小红书、抖音等社交授权的完整代码库、模型训练脚本、应用适配接口及50+场景Demo。此外，智谱在HuggingFace开放AutoGLM-Phone-9B轻量量激增。在智谱AgentOpenDay理、PC+AI将会成为全新生产力工具、汽车+A费用户数量已达40万。签约联合实验室战略合作，将在面向复杂场景的任务智能体、UI理解与交互根据模型智能与价格绘制的四象限图，GLM-5.1特点为GPT-5.4特点是高智能与高价格。结合前文Anthropic在编程具，只要模型带来的边际收益高于边际成本，用户便愿意为性能顶尖的模型支付高额溢队但价格优势明显的厂商可能无法取代顶尖模型在关键场景的地位，但能在价格敏感型需要的计算资源及实施成本而定，因为不涉及硬件算力的费模型（元/Mtoken）GLM-5.1输入[0,32k）6输入[32k+）8GLM-5-Turbo输入[0,32k）5输入[32k+）7GLM-5输入[0,32k）4输入[32k+）6已在国产芯片寒武纪上实现FP8+Int4混合量化部署，实现了首次在国产芯片投产的为昇腾、摩尔线程、寒武纪、昆仑芯等国产算力平台的深度推理适配。通过底设备和昇思MindSporeAI框架的全流程训练及推理适配，验证了在国产算力上训练出SOTA模型的可行性。在复杂视觉文本生成及长文本渲染上，模型位列开源第一。处于每年约10倍的快速下降通道之中。我们认为，模型与国率，叠加行业硬件升级带来的低成本，将对智谱形成双重利好。随着商业化规模效应的定模型进行专有优化。目前智谱已在推进“芯算一体”工作，通过将模型与算力芯

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

智谱：专注基模迭代打造顶尖Coding与Agent能力

文档简介

温馨提示

最新文档

评论

智谱：专注基模迭代打造顶尖Coding与Agent能力

文档简介

温馨提示

最新文档

评论

相关文档