腾讯-企业级智能体效能管理指南_第1页
腾讯-企业级智能体效能管理指南_第2页
腾讯-企业级智能体效能管理指南_第3页
腾讯-企业级智能体效能管理指南_第4页
腾讯-企业级智能体效能管理指南_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

企业级智能体效能管理指南第一章:从生成式AI工具到企业智能体效能体系pg.2第二章:企业级智能体框架:先分清“谁负责什么”,再分清“系统怎么搭”第三章:智能体效能评估框架:先统一“看什么”在过去两年中,大模型与各类Copilot工具快速进入企业日常工作场景。从市场宣传到内部推动,不少企业已经完成了「从零到一」的技术尝鲜。然而,在与众多中国及全球客户的对话中,我们有一个共同的感受:真正能够稳定创造可量化业务价值、并被一线广泛采用的智能体,仍然是少数。越来越多的管理者意识到,问题的关键已经不在于「能不能做出一个智能体」,而在于「能不能搭建一套系统性的智能在特定任务上给出更优的预测和分类结果;最近两三年爆发的生成式AI,则让机器首次具备了大规模生成自然语言和多模态内容的能力,大幅提升了知识工作者的效率。在这一演进脉络中,智能体式AI正在成为新一轮范式变革的代表。我们的研究和实践表明,相比于传统AI和单纯的生成式AI,智能体式AI更像是把AI从「会回答」推向「会办事」:它不再只关注如何生成一个内容,而是聚焦如何围绕一个业务目标,自动规划多步行动,并通过调用各种工具和系统,在预设的安全与治理框架下完成复杂任务。智能体式AI代表了AI创新的最新浪潮 例如回答常见问题分析病史和症状,提出 例如回答常见问题分析病史和症状,提出AI推理模型的更广泛应用仍处于早期阶段交互并直接操作内部系统(如计费软件)来解则升级转交给人工客服通过对研究和结果数据进行全面分析,开发出一种新的皮肤癌疗法人干预的情况下,全面管理采购、仓储和配送等供应链工作流程 OOOO >当前市场演进:对话式AI(如聊天机器人)快速普及,AI推理同时,能够执行更具体操作的早期AI智能体正在涌现来源:OpenAI的AI演进框架;文献检索在本白皮书中,我们将企业级AI智能体聚焦定义为:基于大模型,能够理解业务目标、规划多步行动、调用多种工具与系统,并在预设治理框架内自主决策与传统AI/生成式AI相比,智能体式AI至少在三个维度呈现出本质差异。第一,是更强的自主性。传统的AI系统通常是在「单次请求–单次输出」的模式下运行,例如根据一个输入样本输出一个评分或一个预测结果;多数生成式AI应用也停留在「用户提问–模型回答」的范式。「完成一批报销审核」。我们在实践中看到,高效的智能体通常会自动拆解任务、规划步骤,按需调用不同工具,并在必要时主动与人类或其他系统交互,而不是简单地「被动等待下一条指令」。第二,是更高的决策智能。传统机器学习模型在多数场景中只解决「算分」问题,即在给定输入的前提下输出一个概率或评分,最终决策往往由人工或规则引擎来完成。生成式AI在内容生成上具备优势,但默认仍是「一次性回答」。相比之下,智能体必须在多源数据和复杂约束条件下持续权衡,并在任务执行而是通过「规划–执行–反馈–调整」的闭环,在动态环境中保持合理、稳健的行为。第三,是与工具和系统的深度集成。在传统生成式AI应用中,模型的输出往往是文本、代码或图片,真正落地到业务动作仍需要人来点击、粘贴、录入或调用系统。智能体式AI则通过与企业现有的API、RPA、业务系统以及外部服务深度集成,让智能体可以真正变成「会办事的角色」:它可以在工单系统中创建和更新工单,在CRM中记录和调整客户信息,在ERP中触发采购与库存调整,在财务系统中生成与提交凭证。腾讯的多行业项目中已经出现越来越多类似的场景:从「帮我写一封邮件」走向「帮我生从这个意义上讲,智能体式AI是企业从「智能问答」走向「智能行动」的关键一跃。它既继承了大模型在理解与生成上的能力,又通过规划、工具调用与治理机制,让AI真正嵌入企业核心工作流,成为团队01030103更高的决策智能021.2从“能不能做一个智能体”到“智能体效能体系”尽管技术演进令人兴奋,但我们在对大量企业项目的复盘中观察到一个共同现象:PoC和Demo层出不穷,真正进入生产、产生稳定价值的智能体却寥寥无几。这背后反映的,往往不是技术能力欠缺,而是缺少一套系统性的方法论和治理体系。我们在与客户沟通中,经常听到类似的反馈:·技术与安全团队则担心:「这些可以自动执行动作的智能体,到底会不会做出超出预期甚至违规的操作?我们是否有足够的控制力?」进一步拆解这些困惑,我们可以看到三个典型症状:其一,价值难以量化。大量生成式AI和智能体试点在用户体验上获得好评,但缺乏统一、可复用的指标难以与P&L建立直接联系,导致在预算和资源分配上总是处于「说服力不够」的弱势。等项目由不同部门分别推动,各自选择模型、搭建环境、接入系统,缺乏统一的分类体系和技术栈。我复用和风险管理带来巨大挑战。其三,安全与合规掣肘生产级落地。一旦智能体不再只输出自然语言内容,而是能够触发资金划转、信息修改、审批通过等关键动作,安全和合规团队的要求自因此,我们认为,对于今天的大部分企业而言,关键问题已经从「能不能做出一个智能体」转变为:「企业是否具备一套系统管理智能体效能与风险的体系?」这一「智能体效能体系」至少要在三个层面给出系统性答案:·在业务与财务层面:用怎样统一的指标框架来判断一个智能体是否「值钱」?如何让业务结果成为智·在工程与治理层面:如何确保智能体在复杂的IT和安全环境中是「可观测、可控、可审计」的,而不·在复制与扩展层面:如何在统一的架构和方法论之上,高效地将智能体从单点试验推广到全企业、多从第二章节开始,我们将聚焦于构建这样的智能体效能体系:聚焦企业级智能体框架,先分清「谁负责什么」再分清提炼提升智能体效能的三大抓手,为企业推进智能体规进一步讨论组织与推进路径聚焦企业级智能体框架,先分清「谁负责什么」再分清提炼提升智能体效能的三大抓手,为企业推进智能体规进一步讨论组织与推进路径,帮助企业从试点智能体演进为真正的「智能体驱动型术细节泥潭」,而忽略了更基础的问题——我们到底在设计什么样的智能体体系。我们的共识是:企业要先搞清楚智能体在组织中的角色分工,再谈技术架构与落地路径。2.1智能体角色分工:统一智能体“物种分类”·这些智能体在运行上是否存在重叠、空白或冲突?为此,结合全球智能体式AI项目的经验与「场景–技能–连接器」的架构实践,我们建议采用一套简明而通用的企业级智能体分类体系,将智能体按角色分为四大类:第一类:总入口智能体(Super智能体)总入口智能体面向员工或客户提供统一入口,是用户感知层的「门面」。常见形态包括嵌入企业微信或办Super智能体的职责主要是识别用户意图与上下文,进行初步理解和澄清,并将需求路由给合适的下游调度或领域智能体。同时,它还负责统一的对话体验和结果呈现,是企业构建「统一智能体品牌」的重第二类:调度智能体(Orchestrator智能体)调度智能体可以被视为多智能体系统中的「项目经理」或「调度中心」。当总入口智能体或后台系统触发一个复杂目标时,它负责将目标拆解为一系列子任务,决定这些任务由哪些领域智能体和工具智能体来执行,以及如何处理异常与回退。我们观察到,在跨系统、跨部门的复杂工作流中,调度的设计质量往往直接决定了智能体方案的稳健性第三类:领域智能体(Domain智能体)领域智能体专注于某条具体业务流程或职能领域,例如「客服智能体」「财务关账智能体」「供应链调度·能够理解本领域的业务语境和专业术语;·能够调用多个系统和数据源,完成端到端任务,而不仅是回答问题;·能够对任务结果负责,成为该业务环节中的一个「责任主体」。在腾讯的实践中,一个复杂场景往往由多个协同的领域智能体组成,它们共同对某条价值链承担职责。第四类:工具与连接器(Tool/Connector)工具与连接器主要负责将企业内部和外部的系统能力以「受管控的动作」方式暴露给上层智能体。它并腾讯实践表明,将高风险或关键操作集中封装在工具层进行统一治理,而不是在每个领域智能体中各自实现,不仅显著降低了安全风险,也大幅提升了复用效率和系统演进的灵活性。Tool/Tool/Connector入口与体验把内外部系统能力,以「受管控的动作」暴露给上层智能体把内外部系统能力,以「受管控的动作」暴露给上层智能体统一治理高风险操作流程设计与任务编排逐层向下逐层向下这四类构件之间形成了清晰的责任分工:总入口智能体负责入口与体验,调度智能体负责流程设计与任务编排,领域智能体负责业务结果,工具与连接器负责系统操作与安全边界。前三类是模型驱动、自主决策的智能体,工具与连接器则是被它们调用的能力封装。这一统一分类体系可在企业实践中反复使用,帮助企业在纷繁复杂的行业场景中保持清晰的认知坐标。2.2企业级智能体技术栈:从“入口—运行—底座”三层在厘清了「谁负责什么」之后,第二个关键问题是「系统怎么搭」。我们观察到,如果每个智能体项目都从头搭建自己的运行时、连接器和日志系统,不仅成本极高,也会在治理和安全上留下隐患。因此,我们主张企业构建一个分层清晰、可持续演进的智能体技术栈。从实践经验出发,我们建议企业将技术栈抽象为三大层:分层清晰、可持续演进的智能体技术栈智能体能否在复杂企业环境中稳定可靠运行的关键模型与数据底座层模型能力和知识从哪里来用户从哪里进入、在什么场景下使用智能体,以及如何与之交互第一层:场景与体验层这一层面向最终用户,解决的问题是「用户从哪里进入、在什么场景下使用智能体,以及如何与之交互」。在员工侧,这通常意味着将智能体无缝嵌入企业微信、协同办公平台或业务工作台,而不是额外搭建一个孤立的系统;在客户侧,则可能是小程序、App、网页或线下终端等。企业的智能体落地,通常分为两种路径:直接采购(通用智能体、垂类智能体)、或基于自身场景需求自建智能体并统一管理。-通用智能体:面向全行业企业客户,针对通用企业级场景提供服务,提升员工工作效率-垂类智能体:面向具体需求场景/行业客户,可完成特定领域复杂专业任务-企业原生智能体:理解业务知识、连接企业系统、进入业务流程、并接受企业治理,从企业内原生生长的定制智能体一个设计良好的场景与体验层,能够让用户「几乎忘记自己在和智能体交互」,而只是自然地完成工作和第二层:运行与治理层运行与治理层是智能体能否在复杂企业环境中稳定可靠运行的关键。这一层通常包括:·运行时(Runtime提供沙箱、网关、记忆、观测、Skill管理等能力,让Agent可托管、可运维、·安全:覆盖Agent资产盘点、权限管控、运行防护、行为审计和高危拦截,让企业敢·知识库:将企业分散知识、lT架构上下文、业务资源关系沉淀为Agent可理解、可调用、可追溯的知腾讯在实践中逐步形成了一套「平台级运行与治理底座」,通过统一运行时与连接器层,大幅降低了单个项目的工程复杂度,让业务团队可以更多关注场景创新本身,而不是重复处理底层技术问题。第三层:模型与基础设施(AgentInfra)层·MaaS:实现模型供给、智能路由、成本管控,并保障数据隐私安全·Allnfra:异构计算、存储底座,以提升训练、部署、推理、安全和数据检索效率,为Agent规模化运行提供稳定基础设施。我们观察到,在很多成功案例中,真正决定智能体有效性的往往不是单一模型的性能,而是「合适的模型+高质量的知识与数据+稳健的运行机制+全栈安全防护」的整体行业的项目中,也不断通过与多种本地模型生态(包括自研与合作模型)结合,形成最贴合客户需求的通过上述三层架构,企业可以清晰地区分:·哪些能力应该交给业务团队自由创新。2.3统一的“场景方案卡”模板:从「有想法」到「有蓝图」在与企业共创智能体场景时,我们经常遇到这样的情况:业务团队有很多灵感,「这个可以做智能体,那也可以做智能体」,但一旦需要落地,就发现缺乏统一的表达方式和决策标准。为此,我们提炼出一套实践中证明行之有效的「场景方案卡」模板,帮助企业从「有想法」走向「有蓝图」。业务环节和痛点业务环节和痛点预期价值场景方案示意图涉及智能体类型每一个智能体场景,无论是新构想还是既有项目的复盘,至少应该在一张卡上清晰回答六个问题:不仅要说明这是「客服场景」还是「供应链场景」,更要具体到价值链中的哪一个环节,例如「从工单创还是跨部门协作效率低。对应本白皮书提出的四维智能体效能框架,从业务结果、效率、体验和可靠性几个维度,明确希望改善哪些指标,以及目标幅度大致是多少。我们观察到,那些在立项阶段就绑定清晰KPI的智能体项目,后续更容易获得持续投入和组织支持。同时,列出关键系统与外部服务,为技术团队锁定集成范围。从系统与数据的角度,列出必须打通的数据源和业务系统,并初步评估数据质量与权限状态。腾讯实践表明,很多智能体项目的「落差」并不来自模型,而是来自底层数据与系统的准备度。明确当前阶段希望赋予智能体多高的自治等级:是仅限「建议与草稿」,还是允许其在低风险场景中自动执行动作?在哪些门槛(如金额、权限、风险级别)之上必须有人审查?这些决策直接影响到安全策略最后,场景卡应当以业务领导能听懂的方式,简明概括预期价值:包括对成本、收入、客户体验以及员工体验的定性与定量影响预判,为后续的商业论证和优先级排序提供依据。我们观察到,那些在早期就坚持用统一「场景方案卡」来管理智能体需求的企业,往往能够更快从「灵感清单」收敛到「高价值、高可行的落地组合」,并形成可持续演进的场景组合路线图。“怎么看到业务价值”在很多企业内部,关于智能体项目的讨论常常分化为两种声音:技术团队强调调用量、成功率、模型评如果不搭建一套统一的智能体效能评估框架,技术和业务之间往往很难形成真正的共识。结合跨行业实践,我们建议企业围绕四个核心维度来衡量智能体效能:可度量的业务与财务回报(EBITDA杠杆)可度量的业务与财务回报(EBITDA杠杆)让人和流程变得更高效让人和流程变得更高效进入核心流程的前置门槛第一维度:业务结果这一维度关注智能体是否为企业带来了可度量的业务与财务结果,例如:·在收入端,是否提升了销售转化率、客单价、复购率或交叉销售成功率;·在成本端,是否降低了运营成本、人工成本或外包费用;·在风险端,是否减少了坏账、欺诈事件或合规罚款;·在客户价值端,是否提升了客户生命周期价值并降低流失率。我们的研究显示,那些把智能体项目视为「EBITDA杠杆」而非单纯「技术尝鲜」的企业,往往在业务结果维度取得更显著的回报。第二维度:生产力与效率这一维度关注智能体是否让人和流程变得更高效,典型指标包括:·人均处理任务数、单位时间内处理量;腾讯在客服与运营场景的实践表明,将生成式AI从简单的「对话问答」升级为端到端工作流智能体后,不少企业在处理时长和人均处理量上实现了双位数甚至更高幅度的改善。第三维度:体验与质量这一维度考察的是客户和员工在实际使用智能体时的主观感受与客观质量。例如:·错误率和投诉率,包括答非所问、建议不合理、流程卡壳等;·在专业场景中的内容与决策质量,例如法律审阅、医疗建议、投研分析等。我们观察到,在联络中心和开发者支持类场景中,一旦智能体真正稳定落地,企业往往可以在NPS提升和FCR提升上取得亮眼进展,并以此作为进一步扩展智能体范围的重要信心来源。第四维度:可靠性与合规最后一个维度则聚焦在系统是否稳定可控,以及智能体是否在合规边界之内安全运行。典型指标包括:·系统可用性、故障率、超时率和峰值吞吐能力;·人工接管率和回退次数,在多大比例的执行中需要人类「救场」;·安全与合规事件的数量和严重程度,包括越权操作、敏感数据泄露和不当输出等;·审计与追踪能力,能否在事后完整还原智能体的行为路径并定位责任。腾讯的实践表明,在监管要求高的行业(如金融、医疗、公用事业等可靠性与合规维度往往是决定智能体是否能进入核心流程的前置门槛,而非后置考虑。四个维度解决了「看什么」的问题,但在实际管理中,如果所有指标堆叠在一起,既不便于日常运营,也难以进行清晰的责任划分。为此,我们建议将智能体相关指标组织成一座「指标金字塔」,自下而上分底层:行为与技术层数据——记录智能体在做什么、怎么做Token成本等。腾讯在内部平台实践中,通过统一日志和Trace,把这些底层数据抽象为可视化的「智中层:流程级表现——判断智能体是否真正推动业务流程改善这一层则跨越业务与技术,关注端到端工作流的表现,例如某个关键流程的成功率、重试率、人工介入点和瓶颈环节。我们观察到,通过这类指标,企业往往可以很快识别出「智能体在哪一步频繁失败或被顶层:业务与财务结果——衡量智能体是否「值钱」金字塔顶层则直接对应业务与财务指标,包括成本率、净收入、利润率、客诉率、坏账率等。这一层的指标通常是BU和职能部门的核心KPI,也是管理层关注和资源配置的关键依据。这种分层结构的价值在于:每个层级都有清晰的「主人」。技术平台团队对底层指标负责,业务线对中层和顶层指标负责,管理层则以顶层指标作为决策参考,并通过中底层指标理解「为什么会好或不好」。我们在项目中观察到,那些真正把「指标金字塔」落到日常管理中的企业,通常能在较短时间内建立起一套可持续的智能体投入—产出闭环。判断智能体是否真正推动业务流程改善行为与技术层数据记录智能体在做什么、怎么做衡量智能体是否「值钱」3.3可观测性:避免智能体成为“黑盒子”要真正用好指标金字塔,可观测性是不可或缺的基础设施。如果企业看不到智能体在执行过程中的关键步骤和决策链条,就很难回答以下问题:·某次失败是由于模型输出不佳、数据缺失、连接器故障,还是业务规则冲突?·某个智能体是否已经达到可以提升自治等级的成熟度?为此,我们建议企业在智能体上线之初,就把可观测性作为架构中「不可删减的一层」,至少从三个方面其一,统一日志与标准ID。为每一次智能体执行分配唯一ID,并在会话、工作流和系统调用三个层级上完整记录输入、关键决策、中间状态、工具调用与输出结果。这一机制不仅支撑故障排查,也为后续评估和治理提供了客观依据。其二,多层级的可观测视图。技术团队需要系统级Trace来定位性能瓶颈与故障点;业务团队则需要流程级视图来理解智能体对业务指标的贡献;运营与客服团队则更关注用户会话层的行为与反馈。腾讯在实践中通过构建统一的「智能体观测平面」,将这三类视图统一在一个平台上,显著提升了跨团队的问题其三,评估与实验框架。在记录事实之外,企业还需要建立一套标准化的Evals体系,对智能体的行为和例如,在高自治的「自动执行」场景中,评估框架往往需要特殊关注智能体对关键阈值的处理逻辑和异常情况下的回退策略。从我们的实践来看,那些在早期就投入建设可观测性和评估能力的企业,往往能更快建立起对智能体的信任,也更有底气在关键流程中逐步提升智能体的自治比例。在前面章节中,我们讨论了智能体的角色与技术栈,以及如何衡量它们是否有效。下一步,企业普遍会腾讯在各行业项目中的实践表明,单纯增加算力或更换模型,往往无法从根本上解决问题。真正决定智能体成败的,是场景连接、工程驾驭与模型使用三者的综合能力。·模型驱动力:用对模型,而不是一味「加大杯工具/连接器运维平台模型分层路由策略本地模型生态4.1场景连接力:让智能体真正“进日常”力很强」的智能体,在一线业务人员眼中却只是一个「新系统」「新入口」。这种落差往往来自场景连接力不足,而非模型性能不够。我们观察到,当场景连接力不足时,常见症状包括:·场景边界模糊,用户不知道智能体能做什么、不能做什么,不敢把关键任务交给它;·任务执行不连贯,在中途频繁要求用户在不同系统之间切换,或频繁回到人工处理。第一,把入口做「对」。也就是说,把总入口智能体嵌入用户已经高度熟悉、频繁使用的触点:员工侧往将智能体深度嵌入企业微信工作台和业务系统首页,比单独提供一个新的链接或应用,有更高的使用率和复访率,通过微信、企微、QQ、元宝、浏览器、小程序等国民级入口,把Agent嵌入员工和客户已经高频使用的触点,避免再造一个孤立的新系统。第二,选择适合自身的效率工具。企业需求场景深度、使用规模、建设成本、IT储备等各不相同,应筛选合适的实施路径。腾讯打造的效率智能体组合,覆盖通用、定制智能体、行业与职能场景的垂类智能体三类智能体应用,以解决差异化应用场景:通用智能体解决企业共性应用场景,构建管理平台解决更复杂的业务工作流,垂类智能体解决专精场景。智能体构建智能体构建在通用智能体侧,WorkBuddy企业版面向全行业客户,提供包含行业专家、数字员工、智能空间于一体的企业级智能体解决方案,把单兵作战的「超级个体」升级为协同生产的「超级团队」;CodeBuddyAI原生开发工作台:产品形态上由Plugin,IDE,CLI组成,完整覆盖企业开发场景,并为技术管理者提供统一的管理后台,让任何人随时随地专注创造,实现效率极致飞跃。在智能体构建与管理侧,智能体开发平台ADP提供企业级AgentOps全生命周期管理服务,打通构建开发-效果评测-安全治理-应用发布-权限管控-观测-运营优化的全流程,解决智能体在企业级场景落地时遇到的治理难、集成壁垒高、数据安全风险、规模化成本高等共性痛点。在垂类智能体侧,无论是设计、营销、运维、风控等职能场景,以及金融、传媒、医疗、出行等行业场景持续推出场景化Agent(如设计协作平台Ardot与创意工作室Miora、营销交易一体化Magic让客户既能直接选用,也能在统一平台上做二次构建。第三,兼顾能力生态(技能–连接器等」建设。而不是单从技术出发。也就是说,从真实业务旅程出发,明确用户在什么时刻、出于什么目的接触智能体,围绕这一目标拆解出可复用的功能,再通过连接器层映射到底层系统。这样的设计路径,比从「我有一个强模型」出发更有利于确保业务相关性和复用性。同时,腾讯提供基于丰富的技能Skill、连接器Connector、Plugins能力生态,帮助效率智能体完善能4.2工程驾驭力:让业务“敢用、用得稳”如果说场景连接力解决的是「有没有人用、用不用的起来」的问题,那么工程驾驭力解决的则是「业务敢不敢把关键流程交给智能体」的问题。我们观察到,很多智能体在PoC阶段的效果令人惊艳,但在进入生产时却被安全、合规或运维团队「按下暂停键」。这并不是技术团队不努力,而是在工程层面缺乏一从我们的实践来看,构建工程驾驭力至少包括三个关键支柱。其一,是「可理解/可调用/可追溯」的知识体系,把企业分散的知识、IT架构上下文与业务资源关系沉淀为Agent可调用、可追溯的知识底座。腾讯乐享的Agentic知识中台,面向企业知识管理团队及各类Agent应用方,推出智能知识治理、自动让agent拥有可理解、可调用、可进化的知识体系。支撑营销Agent持续优化洞察、触达与转化。可以避免每个项目都重新实现任务队列、重试逻辑和异常恢复;同时,通过统一记忆系统层,可以在保证安全隔离的前提下,支持不同智能体在合规范畴内共享必要的上下文与历史信息。这不仅提升了稳定性和可维护性,也为上层可观测与评估提供了关键数据来源。让Agent可托管、可运维、可观测、可持续进化。AgentMemory以四层渐进式记忆金字塔自动完成写入、提炼、召回与注入,降低复杂长任务中的上下文成本与噪音,控制对话链路、避免跨会话记忆断裂,解决Agent只能短对话、无法持续学习与长期协EdgeOnePages一站式Web全栈+AIAgent托管平台,开发者与SMB只需专注业务逻辑,平台提供从开发、测试到全球部署的完整托管环境,实现分钟级上线与稳定可靠的运行体验。其三,是「可盘点/可管控/可审计」的安全体系,让企业敢把Agent放进真实业务环境。腾讯推出整系统化解决Agent资产看不清、权限控不住、风险难追溯的问题。对内,安全能力同步支撑Lighthouse、ClawPro、CodeBuddy、WorkBuddy、SkillHub、元宝、Qclaw、HAI可信推理集群、iWiki等腾讯系智能体产品,确保客户使用的腾讯智能体本身即默认安全可信。统一的运行时与记忆系统能力一旦工程驾驭力到位,业务才会真正敢于把越来越多的流程交给智能体去「代办」,也才有可能讨论自治4.3模型驱动力:用对模型及基础设施,而不是一味“加大杯”我们在实践中看到的典型痛点包括:成本失控、模型锁定、算力资源难管等。企业出于对体验的追求,在所有场景中一律使用最强大模型,短期效果看似不错,但很快就会在成本和延迟上遇到天花板。同时,团队也很难解释「为什么要花这么多钱来驱动这些场景」,从而在预算周期中面临被削减的风险。在市场讨论中,「用哪个模型」经常被过度放大,甚至被视为决定智能体成败的唯一因素。但我们的研究显示:在绝大多数企业场景中,真正关键的不是「是不是用最大的模型」,而是「是否为具体场景构建了腾讯对模型驱动力的解法,是以混元大模型及多款第三方大模型的开放混合策略为基础,像管理云资源第二层,第二层,MaaS服务第一层,模型进化——加大投入、多模态、强推理。腾讯在Al领域加速投入,混元加速团队、预训练与强化学习基础设施重建,模型迭代节奏明显加快。语言模型方面,Hy3preview总参数295B、激活参数21B,兼具实用性与性价比,在复杂推理、指令遵循、上下文学习、代码与智能体场景上提升明显;支持多模型智能路由与成本管理,系统性缓解模型接入碎片化、厂商锁定与Token成本失控问题。部署、推理、安全与数据检索效率,为Agent规模化运行提供稳定算力底座。对于中国市场而言,本地生态的特殊性也使得模型驱动力尤为重要。由于访问和合规方面的原因,很多国际主流模型难以直接用于生产环境,企业必须在腾讯等本地云和模型生态中,综合考虑性能、成本、安全与可持续性。腾讯的云与混元大模型实践,为构建符合本地监管与生态环境的模型组合提供了重要企业知识库|企业知识库|腾讯乐享、日志服务CLS资源图谱、CDP、RAG全生命周期安全|AIAgent安全中心、AIAgent安全网关、腾讯iOA、腾讯电脑Agent运行|AgentRuntime:Sandbox、CBS、Bucket、Memory、Gateway;EdgeOneMakers;oneIDTokenHub大模型服务平台多元模型供给>自研、行业、开源模型统一供给统一接入调度>标准API、网关计费、智能路由Agent场景优化>面向任务链路的模型选择与调度优化腾讯混元大模型:Hy3preview、HyImage3.0、HyWorld2.0第三方大模型异构计算存储LighthouseTI平台ClawPro个人提效Qclaw:个人AI助手效率智能体ima:AI工作台元宝:全能AI助手企业提效金融天御反诈Agent传媒AI全能赛事制播Agent教育LearningBuddy出行腾讯出行全场景AgentMAGICAgent2.0全栈风控引擎TCDataAgentDataBuddyHarness模型服务产品skill腾讯文档腾讯会议腾讯新闻腾讯电子签企业微信TAPD腾讯文档WorkBuddyCodeBudavArdotMiora微信元宝QQ浏览器小程序搜狗输入法企业微信CloudQAndonQMigraQDatabaseClawWorkBuddy企业版ADP4.0垂类智能体腾讯效率智能体工具集高级开发工程师投资银行专家腾讯问卷腾讯地图腾讯乐享QQ邮箱报告解读skill车载娱乐场景智能体选址拓展分析skill连接器Connector技能Skill应用矩阵腾讯文档腾讯会议腾讯乐享技能Skill行业skill私募股权专家学习规划skill股票分析skill7.7万+Skills高速镜像、零代码原生构建、企业级安全审计腾讯网盘TAPD企业提效企业提效型企业”最终,智能体式AI的成败不仅取决于技术方案,更取决于企业的组织能力与推进路径。我们在跨行业项目实践中反复验证了一个结论:那些把智能体化看作「一场组织与运营模式变革」的企业,更有可能将早期试点转化为可持续的规模化价值。在正式启动智能体化转型之前,我们建议管理层围绕以下五个关键维度达成共识。其一,目标与雄心(Ambition)。企业需要回答的问题包括:我们希望在三年内,通过智能体和生成式AI在收入、成本、风险和体验上看到怎样的量级变化?我们的主要发力点是降本,还是提质增效、创新业务模式?智能体在整体数字化和AI战略中的地位,是锦上添花的辅助工具,还是撬动业务和组织重构其二,平台与架构(Architecture)。企业需要决定,是重点投资于一个统一的AI/智能体平台,还是先在若干业务线搭建轻量栈,再逐步整合?如何处理多模型、多云、多供应商和多数据源共存的现实?腾讯实践表明,越早在架构上确立「统一底座、多样创新」的方向,越能够避免后期「拆东墙补西墙」的哪些数据可以被智能体访问,哪些数据必须进行脱敏或边界划分?哪些场景允许自动执行,哪些场景必须有人在环审查?如何设计从低自治到高自治的「EarnedAutonomy」路径?我们观察到,那些把治理与风险视为「创新加速器」而非「创新阻碍」的企业,往往能在满足监管要求的前提下保持快速试错。其四,节奏与路线图(Sequencing)。企业需要思考:第一波应该选择哪些场景,是在一条业务线上纵向深挖多个流程,还是跨多条业务线横向布局高价值单点?如何设计从PoC到生产的升级路径,明确每一阶段的成功标准与退出机制?在不同阶段,如何平衡「创新速度」与「稳定性」的取舍?螃蟹的人」?他们需要怎样的培训、工具和激励?如何在绩效考核中体现对智能体使用与价值创造的认可?如何处理因为自动化和智能化带来的角色变迁与能力要求变化?我们的实践表明,那些从一开始就把「人」放在核心位置的项目,更容易形成规模化应用,而不仅仅停留在技术部门的试验。围绕这五个维度达成一致,将为后续的三阶段路线图和组织设计提供坚实的决策框架,也有助于在内部形成清晰的叙事:我们为什么要做智能体,我们打算怎么做,我们希望从中获得什么。第20页AI的有效部署需要围绕战略目标、技术架构、治理机制、落地执行进行系统化决策架构定得越早,后期返还是先在业务线轻量试如何应对多模型、多云多供应商、多数据源并什么”,再决定投什么架构定得越早,后期返还是先在业务线轻量试如何应对多模型、多云多供应商、多数据源并什么”,再决定投什么成本、风险与体验上实发力重点是降本,还是提质增效、体验升级与智能体在整体数字化与第一波应纵向深挖单条业务线,还是横向布局扩展条件与退出机制是治理不是刹车,而是规哪些数据可访问,哪些必须脱敏、隔离或设边哪些必须保留人在环?如何建立从低自治到高 技术能否放大价值,最谁是第一批试点用户?需要怎样的培训、工具如何在绩效中体现对智能体使用与价值创造的如何应对自动化带来的在实践中,我们总结出一条通用性较高的智能体推进路线图,可以概括为三个阶段:打地基、连系统、在阶段1:打地基阶段,企业的重点应放在夯实基础能力和验证整体架构可行性上。包括:搭建必要的云与算力基础,为大模型推理与数据处理提供稳定环境;打通代表性业务线的核心数据与上下文接入,构建最小可用的运行时与记忆系统能力;建立初步的可观测性与所有权(Ownership)机制,为每个智能体明确负责人、记录目的和使用范围。在场景选择上,推荐围绕1–2条业务线,优先落地数量有限但价值较高且相对可控的智能体场景,以「旗舰项目」的方式验证从技术栈到组织协同的整体骨架。在阶段2:连系统阶段,重点从「点状创新」升级为「链条优化」。企业需要引入多智能体编排框架,建设领域智能体库,在架构上真正把前述分类体系落在一个可复用的平台之上。同时,要系统性扩充工具在阶段3:规模化阶段,企业的重点转向在多个BU和地区复制成功经验,并建立一套可持续的创新与治理机制。通常包括搭建企业级智能体平台,统一管理智能体的注册、版本、评估与下线;形成清晰的生命周期管理和组合治理框架,避免「野生智能体」泛滥;在多个业务单元复制成熟场景的同时,支持业务团队在统一平台上自助设计轻量级智能体以覆盖长尾需求。腾讯

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论