腾讯《企业级智能体效能管理指南》_第1页
腾讯《企业级智能体效能管理指南》_第2页
腾讯《企业级智能体效能管理指南》_第3页
腾讯《企业级智能体效能管理指南》_第4页
腾讯《企业级智能体效能管理指南》_第5页
已阅读5页,还剩18页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

企业级智能体效能管理指南建设 评估 组织 最佳实践目录第一部分:AI智能体效能体系第一章:从生成式AI工具到企业智能体效能体系第二章:企业级智能体框架:先分清“谁负责什么”,再分清“系统怎么搭”

pg.2pg.5第三章:pg.10第四章:提升智能体效能的三大抓手,为企业推进智能体规模化落地提供实践指引pg.13第二部分:行业Agent效能实战方法及最佳实践案例第六章:快消行业Agent效能实战方法及最佳实践 pg.24第二部分:行业Agent效能实战方法及最佳实践案例第六章:快消行业Agent效能实战方法及最佳实践 pg.24第七章:传媒行业Agent效能实战方法及最佳实践 pg.27第八章:出行行业Agent效能实战方法及最佳实践 pg.32第九章:消费电子行业Agent效能实战方法及最佳实践 pg.35第十章:医疗行业Agent效能实战方法及最佳实践 pg.38第十一章:文旅行业Agent效能实战方法及最佳实践 pg.41第十二章:企业服务行业Agent效能实战方法及最佳实践 pg.44第一章:从生成式AI工具到企业智能体效能体系在过去两年中,大模型与各类Copilot工具快速进入企业日常工作场景。从市场宣传到内部推动,不少企业已经完成了「从零到一」的技术尝鲜。然而,在与众多中国及全球客户的对话中,我们有一个共同的感受:真正能够稳定创造可量化业务价值、并被一线广泛采用的智能体,仍然是少数。越来越多的管AI(AgenticAI),AI回顾人工智能60在特定任务上给出更优的预测和分类结果;最近两三年爆发的生成式AI,则让机器首次具备了大规模生成自然语言和多模态内容的能力,大幅提升了知识工作者的效率。在这一演进脉络中,智能体式AI正在成为新一轮范式变革的代表。我们的研究和实践表明,相比于传统AI和单纯的生成式AI,智能体式AI更像是把AI从「会回答」推向「会办事」:它不再只关注如何生成一个内容,而是聚焦如何围绕一个业务目标,自动规划多步行动,并通过调用各种工具和系统,在预设的安全与治理框架下完成复杂任务。智能体式AI代表了AI创新的最新浪潮智能体式AI代表了AI创新的最新浪潮第一波第二波第三波第四波第五波对话式AI以对话方式进行交互AI推理器帮助解决复杂问题AI智能体代表用户独立执行任务AI创新者创造新的科学知识AI组织运营整个组织客户聊天机器人可借助 医生副手(AI助手)可知识库处理简单问询, 分析病史和症状,提例如回答常见问题 潜在诊断或治疗建议AI推理模型的更广泛应用仍处于早期阶段客服智能体通过与用户交互并直接操作内部系统(如计费软件)来解则升级转交给人工客服AI驱动的药物发现工具, 自主化物料部门可在无通过对研究和结果数据 人干预的情况下,全进行全面分析,开发出 管理采购、仓储和配一种新的皮肤癌疗法 等供应链工作流程当前市场演进:对话式AI(如聊天机器人)快速普及,AI推理器(如副驾助手)开始早期应用;同时,能够执行更具体操作的早期AI智能体正在涌现来源:OpenAI的AI演进框架;文献检索在本白皮书中,我们将企业级AI智能体聚焦定义为:基于大模型,能够理解业务目标、规划多步行动、调用多种工具与系统,并在预设治理框架内自主决策和执行的人机协同单元。与传统AI/生成式AI相比,智能体式AI至少在三个维度呈现出本质差异。第一,是更强的自主性。传统的AI系统通常是在「单次请求–单次输出」的模式下运行,例如根据一个输入样本输出一个评分或一个预测结果;多数生成式AI应用也停留在「用户提问–模型回答」的范式。而企业级智能体的设计起点是业务目标同工具,并在必要时主动与人类或其他系统交互,而不是简单地「被动等待下一条指令」。第二,是更高的决策智能。传统机器学习模型在多数场景中只解决「算分」问题,即在给定输入的前提下输出一个概率或评分,最终决策往往由人工或规则引擎来完成。生成式AI在内容生成上具备优势,但第三,是与工具和系统的深度集成。在传统生成式AI应用中,模型的输出往往是文本、代码或图片,真正落地到业务动作仍需要人来点击、粘贴、录入或调用系统。智能体式AI则通过与企业现有的API、RPA、业务系统以及外部服务深度集成,让智能体可以真正变成「会办事的角色」:它可以在工单系统中创建和更新工单,在CRM中记录和调整客户信息,在ERP中触发采购与库存调整,在财务系统中生成与提交凭证。腾讯的多行业项目中已经出现越来越多类似的场景:从「帮我写一封邮件」走向「帮我生成邮件草稿并直接在系统中创建后续任务」。更强的自主性02更高的决策智能与工具和系统的深度集成从这个意义上讲,更强的自主性02更高的决策智能与工具和系统的深度集成从“能不能做一个智能体”到“智能体效能体系”和Demo层出不穷,真正进入生产、产生稳定价值的智能体却寥寥无几。这背后反映的,往往不是技术能力欠缺,而是缺少一套系统性的方法论和治理体系。我们在与客户沟通中,经常听到类似的反馈:/做出超出预期甚至违规的操作?我们是否有足够的控制力?」进一步拆解这些困惑,我们可以看到三个典型症状:其一,价值难以量化。大量生成式AI和智能体试点在用户体验上获得好评,但缺乏统一、可复用的指标P&L建立直接联系,导致在预算和资源分配上总是处于「说服力不够」的弱势。项目与架构高度碎片化。在不少企业内部Copilot等项目由不同部门分别推动,各自选择模型、搭建环境、接入系统,缺乏统一的分类体系和技术栈。我其三,安全与合规掣肘生产级落地。一旦智能体不再只输出自然语言内容,而是能够触发资金划转、信息修改、审批通过等关键动作,安全和合规团队的要求自然会显著提高。如果没有一套清晰的权限模型、因此,我们认为,对于今天的大部分企业而言,关键问题已经从「能不能做出一个智能体」转变为:「企业是否具备一套系统管理智能体效能与风险的体系?」这一「智能体效能体系」至少要在三个层面给出系统性答案:在业务与财务层面:用怎样统一的指标框架来判断一个智能体是否「值钱」?如何让业务结果成为智能体投入与扩展的首要依据?在工程与治理层面:如何确保智能体在复杂的IT和安全环境中是「可观测、可控、可审计」的,而不是变成新的黑盒?在复制与扩展层面:如何在统一的架构和方法论之上,高效地将智能体从单点试验推广到全企业、多业务、多行业场景,而不是每一个新场景都从零开始?从第二章节开始,我们将聚焦于构建这样的智能体效能体系:聚焦企业级智能体框架,先分清「谁负责什么」再分清「系统怎么搭」;

搭建统一的智能体效能评估与可观测框架,先统一「看什么」再统一「怎么看到业务价值」;

提炼提升智能体效能的三大抓手,为企业推进智能体规模化落地提供实践指引;

进一步讨论组织与推进路径,帮助企业从试点智能体演进为真正的「智能体驱动型企业」。第二章:企业级智能体框架:先分清“谁负责什么”,再分清“系统怎么搭我们到底在设计什么样的智能体体系。我们的共识是:企业要先搞清楚智能体在组织中的角色分工,再谈技术架构与落地路径。智能体角色分工:统一智能体“物种分类”BU与团队就会各自给自己的产品贴上「助手Copilot」等标签。在这种情况下,管理层无法回答以下问题:我们公司到底有多少个智能体?它们分别负责哪些业务范围?这些智能体在运行上是否存在重叠、空白或冲突?为此,结合全球智能体式AI项目的经验与「场景–技能–连接器」的架构实践,我们建议采用一套简明而通用的企业级智能体分类体系,将智能体按角色分为四大类:第一类:总入口智能体(Super智能体)公门户中的「企业总CopilotSuper智能体的职责主要是识别用户意图与上下文,进行初步理解和澄清,并将需求路由给合适的下游调度或领域智能体。同时,它还负责统一的对话体验和结果呈现,是企业构建「统一智能体品牌」的重要抓手。第二类:调度智能体(Orchestrator智能体)一个复杂目标时,它负责将目标拆解为一系列子任务,决定这些任务由哪些领域智能体和工具智能体来执行,以及如何处理异常与回退。我们观察到,在跨系统、跨部门的复杂工作流中,调度的设计质量往往直接决定了智能体方案的稳健性和可维护性。第三类:领域智能体(Domain智能体)领域智能体专注于某条具体业务流程或职能领域,例如「客服智能体」「财务关账智能体」「供应链调度智能体」「销售线索培育智能体」等。与传统的「单点机器人」不同,成熟的领域智能体一般具备以下特征:能够理解本领域的业务语境和专业术语;能够调用多个系统和数据源,完成端到端任务,而不仅是回答问题;在腾讯的实践中,一个复杂场景往往由多个协同的领域智能体组成,它们共同对某条价值链承担职责。第四类:工具与连接器(Tool/Connector)工具与连接器主要负责将企业内部和外部的系统能力以「受管控的动作」方式暴露给上层智能体。它并腾讯实践表明,将高风险或关键操作集中封装在工具层进行统一治理,而不是在每个领域智能体中各自实现,不仅显著降低了安全风险,也大幅提升了复用效率和系统演进的灵活性。智能体层智能体层能力层总入口智能体入口与体验工具与连接器Tool/Connector被调用·不决策、不规划调度智能体流程设计与任务编排把内外部系统能力,以「受管控的动作」暴露给上层智能体逐层向下·创建订单·触发支付·更新客户信息·查询库存领域智能体业务结果 统一治理高风险操作这四类构件之间形成了清晰的责任分工:总入口智能体负责入口与体验,调度智能体负责流程设计与任务编排,领域智能体负责业务结果,工具与连接器负责系统操作与安全边界。前三类是模型驱动、自主决策的智能体,工具与连接器则是被它们调用的能力封装。这一统一分类体系可在企业实践中反复使用,帮助企业在纷繁复杂的行业场景中保持清晰的认知坐标。企业级智能体技术栈:从“入口—运行—底座”三层思考在厘清了「谁负责什么」之后,第二个关键问题是「系统怎么搭」。我们观察到,如果每个智能体项目都从头搭建自己的运行时、连接器和日志系统,不仅成本极高,也会在治理和安全上留下隐患。因此,我们主张企业构建一个分层清晰、可持续演进的智能体技术栈。从实践经验出发,我们建议企业将技术栈抽象为三大层:分层清晰、可持续演进的智能体技术栈分层清晰、可持续演进的智能体技术栈场景与体验层用户从哪里进入、在什么场景下使用智能体,以及如何与之交互运行与治理层智能体能否在复杂企业环境中稳定可靠运行的关键模型与数据底座层模型能力和知识从哪里来第一层:场景与体验层这一层面向最终用户,解决的问题是「用户从哪里进入、在什么场景下使用智能体,以及如何与之交互」。在员工侧,这通常意味着将智能体无缝嵌入企业微信、协同办公平台或业务工作台,而不是额外搭建一个孤立的系统;在客户侧,则可能是小程序、App、网页或线下终端等。企业的智能体落地,通常分为两种路径:直接采购(通用智能体、垂类智能体、或基于自身场景需求自建智能体并统一管理。【直接采购】通用智能体:面向全行业企业客户,针对通用企业级场景提供服务,提升员工工作效率垂类智能体:面向具体需求场景/行业客户,可完成特定领域复杂专业任务【自建】企业原生智能体:理解业务知识、连接企业系统、进入业务流程、并接受企业治理,从企业内原生生长的定制智能体一个设计良好的场景与体验层,能够让用户「几乎忘记自己在和智能体交互」,而只是自然地完成工作和服务。第二层:运行与治理层运行与治理层是智能体能否在复杂企业环境中稳定可靠运行的关键。这一层通常包括:运行时(Runtime:提供沙箱、网关、记忆、观测、Skill管理等能力,让Agent可托管、可运维、可观测、可持续协作。AgentAgent实业务环境。知识库:将企业分散知识、IT架构上下文、业务资源关系沉淀为Agent可理解、可调用、可追溯的知识底座。腾讯在实践中逐步形成了一套「平台级运行与治理底座」,通过统一运行时与连接器层,大幅降低了单个项目的工程复杂度,让业务团队可以更多关注场景创新本身,而不是重复处理底层技术问题。第三层:模型与基础设施(AgentInfra)层底座层则回答「模型能力的供给、管理,及底层计算-存储-网络保障」,通常包含:MaaS:实现模型供给、智能路由、成本管控,并保障数据隐私安全AIInfra:异构计算、存储底座,以提升训练、部署、推理、安全和数据检索效率,为Agent规模化运行提供稳定基础设施。我们观察到,在很多成功案例中,真正决定智能体有效性的往往不是单一模型的性能,而是「合适的模」的整体组合。腾讯在金融、零售、制造等行业的项目中,也不断通过与多种本地模型生态(包括自研与合作模型)结合,形成最贴合客户需求的底座方案。通过上述三层架构,企业可以清晰地区分:哪些能力应该是行业/哪些能力应该交给业务团队自由创新。统一的“场景方案卡”模板:从「有想法」到「有蓝图」在与企业共创智能体场景时,我们经常遇到这样的情况:业务团队有很多灵感,「这个可以做智能体,那践中证明行之有效的「场景方案卡」模板,帮助企业从「有想法」走向「有蓝图」。场景方案示意图场景方案示意图业务环节和痛点涉及智能体类型预期价值场景方案目标KPI自治等级 系统和数据连接每一个智能体场景,无论是新构想还是既有项目的复盘,至少应该在一张卡上清晰回答六个问题:业务环节与痛点是什么?KPI对应本白皮书提出的四维智能体效能框架,从业务结果、效率、体验和可靠性几个维度,明确希望改善哪些指标,以及目标幅度大致是多少。我们观察到,那些在立项阶段就绑定清晰KPI的智能体项目,后续更容易获得持续投入和组织支持。由哪些智能体和系统能力配合完成?/调度/领域/需要连接哪些系统、数据和工具?从系统与数据的角度,列出必须打通的数据源和业务系统,并初步评估数据质量与权限状态。腾讯实践表明,很多智能体项目的「落差」并不来自模型,而是来自底层数据与系统的准备度。执行动作?在哪些门槛(如金额、权限、风险级别)之上必须有人审查?这些决策直接影响到安全策略与评估要求。预期会带来什么价值?最后,场景卡应当以业务领导能听懂的方式,简明概括预期价值:包括对成本、收入、客户体验以及员工体验的定性与定量影响预判,为后续的商业论证和优先级排序提供依据。我们观察到,那些在早期就坚持用统一「场景方案卡」来管理智能体需求的企业,往往能够更快从「灵感清单」收敛到「高价值、高可行的落地组合」,并形成可持续演进的场景组合路线图。第三章:智能体效能评估框架:先统一“看什么”,再统一“怎么看到业务价值”在很多企业内部,关于智能体项目的讨论常常分化为两种声音:技术团队强调调用量、成功率、模型评四维度智能体效能指标体系结合跨行业实践,我们建议企业围绕四个核心维度来衡量智能体效能:四维度智能体效能指标体系四维度智能体效能指标体系(围绕四个核心维度,全面衡量智能体落地成效)业务结果可度量的业务与财务回报(EBITDA杠杆)生产力与效率让人和流程变得更高效·收入端:转化率/客单价/复购/交叉销售·成本端:运营/人工/外包成本下降·风险端:坏账/欺诈/合规罚款减少·客户价值:LTV提升/流失率下降·人均处理任务数/单位时间处理量·平均处理时长AHT/等待/交付周期·自动化率(无需人工干预比例)·返工率/重试率体验与质量主观感受+客观质量可靠性与合规进入核心流程的前置门槛·满意度CSAT/NPS、一次解决率FCR·错误率/投诉率(答非所问、卡壳等)·专业场景内容与决策质量(法律审阅/医疗建议/投研分析)·可用性/故障率/超时率/峰值吞吐·人工接管率/回退次数·安全合规事件数量与严重程度·审计与行为路径可追溯第一维度:业务结果这一维度关注智能体是否为企业带来了可度量的业务与财务结果,例如:在收入端,是否提升了销售转化率、客单价、复购率或交叉销售成功率;在成本端,是否降低了运营成本、人工成本或外包费用;在风险端,是否减少了坏账、欺诈事件或合规罚款;在客户价值端,是否提升了客户生命周期价值并降低流失率。我们的研究显示,那些把智能体项目视为「EBITDA杠杆」而非单纯「技术尝鲜」的企业,往往在业务结果维度取得更显著的回报。第二维度:生产力与效率这一维度关注智能体是否让人和流程变得更高效,典型指标包括:人均处理任务数、单位时间内处理量;平均处理时长(AHT、等待时间、端到端交付周期;自动化率(无需人工干预的流程比例、返工率和重试率。腾讯在客服与运营场景的实践表明,将生成式AI从简单的「对话问答」升级为端到端工作流智能体后,不少企业在处理时长和人均处理量上实现了双位数甚至更高幅度的改善。第三维度:体验与质量这一维度考察的是客户和员工在实际使用智能体时的主观感受与客观质量。例如:客户或员工的满意度(CSAT/NPS、一次解决率(FCR;错误率和投诉率,包括答非所问、建议不合理、流程卡壳等;在专业场景中的内容与决策质量,例如法律审阅、医疗建议、投研分析等。我们观察到,在联络中心和开发者支持类场景中,一旦智能体真正稳定落地,企业往往可以在NPS提升和FCR提升上取得亮眼进展,并以此作为进一步扩展智能体范围的重要信心来源。第四维度:可靠性与合规最后一个维度则聚焦在系统是否稳定可控,以及智能体是否在合规边界之内安全运行。典型指标包括:系统可用性、故障率、超时率和峰值吞吐能力;安全与合规事件的数量和严重程度,包括越权操作、敏感数据泄露和不当输出等;审计与追踪能力,能否在事后完整还原智能体的行为路径并定位责任。腾讯的实践表明,在监管要求高的行业(如金融、医疗、公用事业等,可靠性与合规维度往往是决定智能体是否能进入核心流程的前置门槛,而非后置考虑。指标金字塔:从智能体行为到业务结果四个维度解决了「看什么」的问题,但在实际管理中,如果所有指标堆叠在一起,既不便于日常运营,也难以进行清晰的责任划分。为此,我们建议将智能体相关指标组织成一座「指标金字塔」,自下而上分为三个管理层级。底层:行为与技术层数据——记录智能体在做什么、怎么做/Token成本等。腾讯在内部平台实践中,通过统一日志和Trace,把这些底层数据抽象为可视化的「智中层:流程级表现——判断智能体是否真正推动业务流程改善这一层则跨越业务与技术,关注端到端工作流的表现,例如某个关键流程的成功率、重试率、人工介入点和瓶颈环节。我们观察到,通过这类指标,企业往往可以很快识别出「智能体在哪一步频繁失败或被人接管」,从而针对性优化工作流设计、数据质量或特定智能体的逻辑。顶层:业务与财务结果——衡量智能体是否「值钱」金字塔顶层则直接对应业务与财务指标,包括成本率、净收入、利润率、客诉率、坏账率等。这一层的指标通常是BU和职能部门的核心KPI,也是管理层关注和资源配置的关键依据。这种分层结构的价值在于:每个层级都有清晰的「主人」。技术平台团队对底层指标负责,业务线对中层和顶层指标负责,管理层则以顶层指标作为决策参考,并通过中底层指标理解「为什么会好或不好」。我们在项目中观察到,那些真正把「指标金字塔」落到日常管理中的企业,通常能在较短时间内建立起一套可持续的智能体投入—产出闭环。业务与财务结果业务与财务结果衡量智能体是否「值钱」流程级表现判断智能体是否真正推动业务流程改善行为与技术层数据记录智能体在做什么、怎么做可观测性:避免智能体成为“黑盒子”要真正用好指标金字塔,可观测性是不可或缺的基础设施。如果企业看不到智能体在执行过程中的关键步骤和决策链条,就很难回答以下问题:某次失败是由于模型输出不佳、数据缺失、连接器故障,还是业务规则冲突?某个智能体是否已经达到可以提升自治等级的成熟度?为此,我们建议企业在智能体上线之初,就把可观测性作为架构中「不可删减的一层」,至少从三个方面着手:其一,统一日志与标准ID。为每一次智能体执行分配唯一ID,并在会话、工作流和系统调用三个层级上完整记录输入、关键决策、中间状态、工具调用与输出结果。这一机制不仅支撑故障排查,也为后续评估和治理提供了客观依据。其二,多层级的可观测视图。技术团队需要系统级Trace来定位性能瓶颈与故障点;业务团队则需要流程级视图来理解智能体对业务指标的贡献;运营与客服团队则更关注用户会话层的行为与反馈。腾讯在协同效率。其三,评估与实验框架。在记录事实之外,企业还需要建立一套标准化的Evals体系,对智能体的行为和例如,在高自治的「自动执行」场景中,评估框架往往需要特殊关注智能体对关键阈值的处理逻辑和异常情况下的回退策略。从我们的实践来看,那些在早期就投入建设可观测性和评估能力的企业,往往能更快建立起对智能体的信任,也更有底气在关键流程中逐步提升智能体的自治比例。第四章:提升智能体效能的三大抓手,为企业推进智能体规模化落地提供实践指引在前面章节中,我们讨论了智能体的角色与技术栈,以及如何衡量它们是否有效。下一步,企业普遍会发出这样一个问题:「如果现有智能体表现‘一般般’,我们应该从哪里下手把它变好?」腾讯在各行业项目中的实践表明,单纯增加算力或更换模型,往往无法从根本上解决问题。真正决定智能体成败的,是场景连接、工程驾驭与模型使用三者的综合能力。场景连接力场景连接力工具/连接器模型驱动力模型分层路由策略成本-性能权衡工程驾驭力本地模型生态运行时,治理与约束机制运维平台场景连接力:让智能体真正“进日常”力不足,而非模型性能不够。我们观察到,当场景连接力不足时,常见症状包括:智能体入口与日常工具割裂,用户需要特地打开一个新的界面或系统;场景边界模糊,用户不知道智能体能做什么、不能做什么,不敢把关键任务交给它;任务执行不连贯,在中途频繁要求用户在不同系统之间切换,或频繁回到人工处理。要让智能体真正「进日常」,企业需要在三个方面下功夫。App或Web入口。腾讯实践表明,将智能体深度嵌入企业微信工作台和业务系统首页,比单独提供一个新的链接或应用,有更高的使用率和复访率,通过微信、企微、QQ、元宝、浏览器、小程序等国民级入口,把Agent嵌入员工和客户已经高频使用的触点,避免再造一个孤立的新系统。第二,选择适合自身的效率工具。企业需求场景深度、使用规模、建设成本、IT储备等各不相同,应筛选合适的实施路径。腾讯打造的效率智能体组合,覆盖通用、定制智能体、行业与职能场景的垂类智能体三类智能体应用,以解决差异化应用场景:通用智能体解决企业共性应用场景,构建管理平台解决更复杂的业务工作流,垂类智能体解决专精场景。通用通用智能体侧智能体构建与管理侧垂类智能体侧效率智能体组合在通用智能体侧,WorkBuddy企业版面向全行业客户,提供包含行业专家、数字员工、智能空间于一体的企业级智能体解决方案,把单兵作战的「超级个体」升级为协同生产的「超级团队」;CodeBuddyAI原生开发工作台:产品形态上由Plugin,IDE,CLI组成,完整覆盖企业开发场景,并为技术管理者提供统一的管理后台,让任何人随时随地专注创造,实现效率极致飞跃。在智能体构建与管理侧,智能体开发平台ADP提供企业级AgentOps全生命周期管理服务,打通构建开发-效果评测-安全治理-应用发布-权限管控-观测-运营优化的全流程,解决智能体在企业级场景落地时遇到的治理难、集成壁垒高、数据安全风险、规模化成本高等共性痛点。在垂类智能体侧,无论是设计、营销、运维、风控等职能场景,以及金融、传媒、医疗、出行等行业场景持续推出场景化Agent(如设计协作平台Ardot与创意工作室Miora、营销交易一体化MagicAgent2.0TencentDBDatabaseClawAI全能赛事制播Agent等,让客户既能直接选用,也能在统一平台上做二次构建。第三,兼顾能力生态(技能–连接器等」建设。而不是单从技术出发。也就是说,从真实业务旅程出发,明确用户在什么时刻、出于什么目的接触智能体,围绕这一目标拆解出可复用的功能,再通过连接器层映射到底层系统。这样的设计路径,比从「我有一个强模型」出发更有利于确保业务相关性和复用性。同时,腾讯提供基于丰富的技能Skill、连接器Connector、Plugins能力生态,帮助效率智能体完善能力拓展,让Agent「随需进化」。工程驾驭力:让业务“敢用、用得稳”如果说场景连接力解决的是「有没有人用、用不用的起来」的问题,那么工程驾驭力解决的则是「业务敢不敢把关键流程交给智能体」的问题。我们观察到,很多智能体在PoC阶段的效果令人惊艳,但在进从我们的实践来看,构建工程驾驭力至少包括三个关键支柱。其一,是「可理解/可调用/可追溯」的知识体系,把企业分散的知识、IT架构上下文与业务资源关系沉淀为Agent可调用、可追溯的知识底座。腾讯乐享的Agentic知识中台,面向企业知识管理团队及各类Agent应用方,推出智能知识治理、自动Skill让agent拥有可理解、可调用、可进化的知识体系。而像CDPAgent持续优化洞察、触达与转化。可以避免每个项目都重新实现任务队列、重试逻辑和异常恢复;同时,通过统一记忆系统层,可以在保证安全隔离的前提下,支持不同智能体在合规范畴内共享必要的上下文与历史信息。这不仅提升了稳定性和可维护性,也为上层可观测与评估提供了关键数据来源。AgentRuntimeAgentSkill管理能力,让Agent可托管、可运维、可观测、可持续进化。AgentMemory以四层渐进式记忆金字塔自动完成写入、提炼、召回与注入,降低复杂长任务中的上下文成本与噪音,控制对话链路、避免跨会话记忆断裂,解决Agent只能短对话、无法持续学习与长期协作的痛点。EdgeOnePages一站式Web全栈+AIAgent托管平台,开发者与SMB只需专注业务逻辑,平台提供从开发、测试到全球部署的完整托管环境,实现分钟级上线与稳定可靠的运行体验。其三,是「可盘点/可管控/可审计」的安全体系,让企业敢把Agent放进真实业务环境。腾讯推出整AgentAgent安全网关与iOAAI监管要求与标准体系:从SkillsMCP系统化解决Agent资产看不清、权限控不住、风险难追溯的问题。对内,安全能力同步支撑Lighthouse、ClawPro、CodeBuddy、WorkBuddy、SkillHub、元宝、Qclaw、HAI可信推理集群、iWiki等腾讯系智能体产品,确保客户使用的腾讯智能体本身即默认安全可信。统一的运行时与记忆系统能力可理解、可调用、可追溯的知识底座

三个关键支柱

可盘点、可管控、可审计的安全体系知识体系解决的是「Agent看得懂业务」,运行体系解决的是「Agent跑得住业务」,安全体系解决的是「Agent进得了核心业务」。三者合力,工程驾驭力才能真正成为业务从Demo走向生产的通行证;一旦工程驾驭力到位,业务才会真正敢于把越来越多的流程交给智能体去「代办」,也才有可能讨论自治等级的逐步提升。模型驱动力:用对模型及基础设施,而不是一味“加大杯”我们在实践中看到的典型痛点包括:成本失控、模型锁定、算力资源难管等。企业出于对体验的追求,在所有场景中一律使用最强大模型,短期效果看似不错,但很快就会在成本和延迟上遇到天花板。同时,团队也很难解释「为什么要花这么多钱来驱动这些场景」,从而在预算周期中面临被削减的风险。显示:agent。腾讯对模型驱动力的解法,是以混元大模型及多款第三方大模型的开放混合策略为基础,像管理云资源第三层,基础设施第三层,基础设施训练/部署/推理/安全/检索一体化第二层,MaaS服务统一接入、智能路由、成本管理第一层,模型进化加大投入、多模态、强推理第一层,模型进化——加大投入、多模态、强推理。腾讯在AI领域加速投入,混元加速团队、预训练与强化学习基础设施重建,模型迭代节奏明显加快。语言模型方面,Hy3preview总参数295B、激活参数21B,兼具实用性与性价比,在复杂推理、指令遵循、上下文学习、代码与智能体场景上提升明显;MaaSTokenHubToken成本失控问题。/部署/推理/安全/Agent规模化运行提供稳定算力底座。对于中国市场而言,本地生态的特殊性也使得模型驱动力尤为重要。由于访问和合规方面的原因,很多国际主流模型难以直接用于生产环境,企业必须在腾讯等本地云和模型生态中,综合考虑性能、成本、安全与可持续性。腾讯的云与混元大模型实践,为构建符合本地监管与生态环境的模型组合提供了重要基础。腾讯效率智能体工具集腾讯效率智能体工具集用户连接QQ微信元宝QQ浏览器小程序搜狗输入法企业微信企业提效个人提效企业提效企业提效营销MAGICAgent2.0CloudQ金融天御反诈AgentQclaw:个人AI助手WorkBuddyWorkBuddy企业版效率智能体风控全栈风控引擎AndonQ传媒AI全能赛事制播Agentima:AI工作台CodeBudavADP4.0研发运维ArdotMigraQTCDataAgent教育LearningBuddy出行腾讯出行全场景Agent元宝:全能AI助手Miora垂类智能体数据分析DataBuddyDatabaseClaw医疗AI健康管理助手医保智能助手技能Skill连接器Connector技能Skill产品skill行业skill应用矩阵套件腾讯文档腾讯会议腾讯问卷腾讯地图医疗报告解读skill医疗学习规划skill生态互联 腾讯文档ima QQ邮箱 高级开发工程师内容创作专家腾讯新闻腾讯电子签腾讯乐享QQ邮箱出行车载娱乐场景智能体企业微信TAPD...零售选址拓展分析skill出行股票分析skill...腾讯会议TAPD腾讯乐享电子签腾讯网盘...投资银行专家UI设计师私募股权专家...腾讯文档7.7万+Skills高速镜像、零代码原生构建、企业级安全审计Harness引擎企业知识库|腾讯乐享、日志服务CLS资源图谱、CDP、RAG全生命周期安全|AIAgent安全中心、AIAgent安全网关、腾讯iOA、腾讯电脑管家Agent运行|AgentRuntime:Sandbox、CBS、Bucket、Memory、Gateway;EdgeOneMakers;oneID模型服务多元模型供给>自研、行业、开源模型统一供给TokenHub大模型服务平台统一接入调度>标准API、网关计费、智能路由Agent场景优化>面向任务链路的模型选择与调度优化腾讯混元大模型:Hy3preview、HyImage3.0、HyWorld2.0… 第三方大模型:GLM、Kimi、DeepSeek…Infra异构计算存储LighthouseTI平台ClawPro第五章:组织与推进路径——从试点智能体到“智能体驱动型企业”最终,智能体式AI的成败不仅取决于技术方案,更取决于企业的组织能力与推进路径。我们在跨行业项目实践中反复验证了一个结论:那些把智能体化看作「一场组织与运营模式变革」的企业,更有可能将早期试点转化为可持续的规模化价值。五个关键决策维度在正式启动智能体化转型之前,我们建议管理层围绕以下五个关键维度达成共识。其一,目标与雄心(Ambition。企业需要回答的问题包括:我们希望在三年内,通过智能体和生成式AI在收入、成本、风险和体验上看到怎样的量级变化?我们的主要发力点是降本,还是提质增效、创新业务模式?智能体在整体数字化和AI战略中的地位,是锦上添花的辅助工具,还是撬动业务和组织重构的核心引擎?其二,平台与架构(Architecture。企业需要决定,是重点投资于一个统一的AI/智能体平台,还是先在若干业务线搭建轻量栈,再逐步整合?如何处理多模型、多云、多供应商和多数据源共存的现实?腾讯实践表明,越早在架构上确立「统一底座、多样创新」的方向,越能够避免后期「拆东墙补西墙」的高昂代价。治理与风险(Governance哪些数据可以被智能体访问,哪些数据必须进行脱敏或边界划分?哪些场景允许自动执行,哪些场景必须有人在环审查?如何设计从低自治到高自治的「EarnedAutonomy」路径?我们观察到,那些把治理与风险视为「创新加速器」而非「创新阻碍」的企业,往往能在满足监管要求的前提下保持快速试错。其四,节奏与路线图(Sequencing。企业需要思考:第一波应该选择哪些场景,是在一条业务线上纵向深挖多个流程,还是跨多条业务线横向布局高价值单点?如何设计从PoC到生产的升级路径,明确每一阶段的成功标准与退出机制?在不同阶段,如何平衡「创新速度」与「稳定性」的取舍?(Adoption螃蟹的人」?他们需要怎样的培训、工具和激励?如何在绩效考核中体现对智能体使用与价值创造的认可?如何处理因为自动化和智能化带来的角色变迁与能力要求变化?我们的实践表明,那些从一开始就把「人」放在核心位置的项目,更容易形成规模化应用,而不仅仅停留在技术部门的试验。围绕这五个维度达成一致,将为后续的三阶段路线图和组织设计提供坚实的决策框架,也有助于在内部形成清晰的叙事:我们为什么要做智能体,我们打算怎么做,我们希望从中获得什么。AI的有效部署需要围绕战略目标、技术架构、治理机制、落地执行AI的有效部署需要围绕战略目标、技术架构、治理机制、落地执行进行系统化决策目标与雄心治理与风险组织与变革平台与架构节奏路线图先回答“想用智能体赢什么”,再决定投什么治理不是刹车,而是规模化的护栏技术能否放大价值,最终取决于人和组织架构定得越早,后期返 先打透一批高价值场景,工成本越低 再考虑规模复制三年内,希望在收入、成本、风险与体验上实现多大变化?发力重点是降本,还是提质增效、体验升级与新增长?智能体在整体数字化与AI战略中,是辅助工具还是核心引擎?哪些数据可访问,哪些必须脱敏、隔离或设边界?哪些场景允许自动执行,哪些必须保留人在环?如何建立从低自治到高自治的EarnedAutonomy路径?谁是第一批试点用户?需要怎样的培训、工具与激励?如何在绩效中体现对智能体使用与价值创造的认可?如何应对自动化带来的角色迁移与能力重构?是优先建设统一平台, 第一波应纵向深挖单条还是先在业务线轻量试 业务线,还是横向布点、逐步整合? 多个高价值单点?如何应对多模型、多云 如何设计从PoC到多供应商、多数据源并 产的升级路径?存? 每一阶段的成功标准扩展条件与退出机制什么?在实践中,我们总结出一条通用性较高的智能体推进路线图,可以概括为三个阶段:打地基、连系统、规模化。在阶段1:打地基阶段,企业的重点应放在夯实基础能力和验证整体架构可行性上。包括:搭建必要的云与算力基础,为大模型推理与数据处理提供稳定环境;打通代表性业务线的核心数据与上下文接入,构建最小可用的运行时与记忆系统能力;建立初步的可观测性与所有权(Ownership)机制,为每个智能体明确负责人、记录目的和使用范围。在场景选择上,推荐围绕1–2条业务线,优先落地数量有限但价值较高且相对可控的智能体场景,以「旗舰项目」的方式验证从技术栈到组织协同的整体骨架。在阶段2:连系统设领域智能体库,在架构上真正把前述分类体系落在一个可复用的平台之上。同时,要系统性扩充工具在阶段3:规模化阶段,企业的重点转向在多个BU和地区复制成功经验,并建立一套可持续的创新与治理机制。通常包括搭建企业级智能体平台,统一管理智能体的注册、版本、评估与下线;形成清晰的生命

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论