2025 AI智能体的实践应用:评估与治理基础框架白皮书(中文)_第1页
2025 AI智能体的实践应用:评估与治理基础框架白皮书(中文)_第2页
2025 AI智能体的实践应用:评估与治理基础框架白皮书(中文)_第3页
2025 AI智能体的实践应用:评估与治理基础框架白皮书(中文)_第4页
2025 AI智能体的实践应用:评估与治理基础框架白皮书(中文)_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

与CapgeminiAI智能体的实践应用:图片:AdobeStock导言.6免责声明本文件由世界经济论坛作为一个项目,洞察力领域或互动的贡献本报告所述的调查结果、解释和结论是世界经济论坛推动和认可的合作进程的不代表世界经济论坛的观点,也不代表其全体成员、合作伙伴或其他利益相关者的2025年世界经济论坛Allrightsreserved.本出版物的任何部分均不得以任何形式或通过任何手段(包括影印和记录)或通过任何信息存储和检索系统进行复制或传播AIAgentsinAction:评估和治理的基础2AIAgentsinAction:评估和治理的基础3二〇二五年十一月AIAgentsinAction:评估和治理的基础前言罗尚·嘉CapgeminiInvent首席执行官本文旨在帮助回答这些问题。通过绘制代理系李嘉欣世界经济论坛人工智能卓越中心主任、执行委员会AIAgentsinAction:评估和治理的基础4介绍图1负责任地采用AI代理的基础1技术基础奠定基础3评价和治理2功能分类定义代理AIAgents1技术基础奠定基础3评价和治理2功能分类定义代理AIAgentsinAction:评估和治理的基础5AIAgentsinAction:评估和治理的基础6),AIAgentsinAction:评估和治理的基础7构建代理不仅需要工程,还需要模型,工具,数据源和人类之间的协调和协调。AI代理的技术基础构建代理不仅需要工程,还需要模型,工具,数据源和人类之间的协调和协调。1AIAgent的软件体系结构1AIAgent的软件体系结构为了实现这一转变,人工智能代理借鉴了四种技术范式:调了解这种架构是预测代理如何与用户和系统互了解这种架构是预测代理如何与用户和系统互动、协调工作流程和做出上下文感知决策的关键点图2AI代理的软件架构内部组织资源第三方资源内部组织资源环境人工智能边界人工智能边界行动知觉对象行动铝剂铝剂输入/输出输入/输出消息接发数据库铝剂应用应用应用编排生成非生成机制构造格架编排规划存储器工具工作流程模型应用编排生成非生成机制构造格架编排规划存储器工具工作流程模型AIAgentsinAction:评估和治理的基础1.2通信协议和互操作性MCP在主流代理框架中获得了广泛的支持,并越来越多地被视为核心机制。MCP在主流代理框架中获得了广泛的支持,并越来越多地被视为核心机制。图3基于MCP的代理通信示意图MCP概述AIagent1AIagent2客户端消息客户端数客户端数据库服务器消息服务器数据库4承认更新32更新数据库MCP概述AIagent1AIagent2客户端消息客户端数客户端数据库服务器消息服务器数据库4承认更新32更新数据库证实消息传递AIAgentsinAction:评估和治理的基础图4代理到代理通信协议的图示代理代理代理框架代理框架代理框架代理框架MCPA2A器MCPA2A器影处理API和企业应用程序API和企业应用程序MCP和A2A侧重于数据交换和任务协调,而AP2则处理复杂的财务操作。尽管取得了这些进展,但互操作性仍然是一个关键挑战。技术兼容性本身并不能保证协AIAgentsinAction:评估和治理的基础本报告来源于三个皮革制造商报告站(),由用户Id:349网络安全考虑因素),安全战略已从周安全战略已从周边防御发展到分层“纵深防御”,最近又发展到零信任模式。AIAgentsinAction:评估和治理11AIAgentsinAction:评估和治理12的基础2系统分类很重要,因为它为比较代理人、预测风险和将评价与治理联2系统分类很重要,因为它为比较代理人、预测风险和将评价与治理联系起来提供了共同基础。),据AIAgentsinAction:评估和治理13的基础图5AI代理评估和治理的基础↓分类维度↓风险评估生命周期分类分类界定了代理人的特征和运作背景,以指导评价、风险评估和治理。建立自治级别可以帮助组织设定对功能的明确期望,并实施相应的治理机制。建立自治级别可以帮助组织设定对功能的明确期望,并实施相应的治理机制。图6分类维度Agent特性Agent特性1.功能6.1.功能代理人是做什么的代理人是做什么的代理执行其功能的应用程序域和环境专家通才简单复杂3.预测性确定性非确定性4.自治低高5.权威低高人工智能代理人在行动:评估和治理的基础 田专家通才简单复杂3.预测性确定性非确定性4.自治低高5.权威低高人工智能代理人在行动:评估和治理的基础 田2.角色7.环境AIAgentsinAction:评估和治理15的基础对于采用人工智能的组织,了解明确界定行动范围对确保实际部署的有效性至关重要AIAgentsinAction:评估和治理16的基础机器人吸尘器Agent特性案例研机器人吸尘器Agent特性案例研究1机器人真空吸尘器.分类1.1.功能通才非确定性高低高低田5.权威2作用专家3.预测性确定性通才非确定性高低高低田5.权威2作用专家3.预测性确定性机器人真空吸尘器.分类操作上下文自主室内导航和清洁地板6.用例7.环境简单复杂7.环境简单复杂家用真空机器人在家庭服务领域中操作,自主地在住宅环境中导航AIAgentsinAction:评估和治理17的基础图7–支助评估:评估在其环境中部署特定制剂所AI代理评估和治理的基础-分类维度访问控制可解释性溯源标识监测日志合法合规人工冗余长效管理人类监督试验确认和更多...定义用分类维度评价标准风险评估生命周定义用途期途功能可预测性能力工具调用成功评估风险作用用例任务成功率边缘情况鲁棒性识别风险管理风险环境任务完成时间信任指标分析风险权威错误类型和更多.AIAgentsinAction:评估和治理18的基础评价强大的评估是至关重要的评估代理的性能和限制在不同的情况下。一项以提供者为重点的有效评价应首先从技术上筛选推理、规划和工具使用等基线能力。一项以提供者为重点的有效评价应首先从技术上筛选推理、规划和工具使用等基线能力。图8AI代理评估和治理的基础-评估标准渐进式治理做法溯源标识监测日志合法合规人工冗余长效管理人类监督溯源标识监测日志合法合规人工冗余长效管理人类监督试验确认和更多...制可解释性定义用分类维度评价标准风险评估生命周期定义用途功能可预测性能力工具调用成功评估风险作用用例任务成功率边缘情况鲁棒性识别风险管理风险自治环境任务完成时间信任指标分析风险权威错误类型和更多.人工智能行动者:评估和治理的基础AIAgentsinAction:评估和治理的基础编码副驾驶Agent特性案例研编码副驾驶Agent特性案例研究2编码副驾驶员评估1.1.功能专业通才3.预测性确定性非确定性高低高低5.权威2专业通才3.预测性确定性非确定性高低高低5.权威2作用编码副驾驶员评估–性能:测量任务成功率、完成时间和错误频率,以及工–鲁棒性:将代理暴露给模糊或冲突的代码,以评帮助开发人员进行代码生成和调试6.用例7.环境简单复杂7.环境简单复杂编码副驾驶员在软件开发领域工作图9风险评估风险评估识别和分析潜在危害,将评估结果与监督联系起来。AI代理评估和治理的基础-风险评估生命周期为了使这个过程可操作,组织可以遵循五步生命周渐进式治理做法访问控制可解释性溯源标识监测日志合法合规人工冗余长效管理人类监督试验确认和更多...定义用分类维度评价标准估生定义用途功能可预测性能力工具调用成功评估风险作用用例任务成功率边缘情况鲁棒性识别风险管理风险自治环境任务完成时间信任指标分析风险权威错误类型和更多.人工智能行动者:评估和治理的基础21表1AI代理的风险评估生命周期步骤目的示例活动示例输出2.识别风险),征价实施风险应对措施(避免、缓控在实践中织能够等因素如何AIAgentsinAction:评估和治理22AIAgentsinAction:评估和治理23的基础案例研究3自动驾驶汽车案例研究3自动驾驶汽车-风险评估自主车辆Agent特性Agent特性1.功能非确定性高低高低2作用专业通才3.预测性确定性5.权威非确定性高低高低2作用专业通才3.预测性确定性5.权威自动驾驶汽车-风险评估在没有人为控制的情况下执行完整的驾驶任务6.用例7.环境简单复杂7.环境简单复杂自动驾驶车辆在运输领域中运行,在公共或私人道路环境中导航,以安全有效地运输乘客或货物,而无需直接的人类控制。AIAgentsinAction:评估和治理24的基础治理级别由风险评估结果提供信息,确保控制措施的规模与已证明的自主性、权威性和背景复杂性相符。AI代理的治理考虑渐进式治理方法根据代理人的自主权、权威和复杂性来扩大监督和保障。AIAgentsinAction:评估和治理25的基础案例研究4个人助理-治理考虑因素Agent特性Agent特性操作上下文1.功能通过组织时间表,管理沟通和协调来帮助用户2.作用专家通才3.预测性确定性非确定性低高5.权威低高个人助理-治理考虑因素6.用例它在个人生产力领域运行,管理用户数字环境中的任务,通信和信息,以支持日常协调和决策。7.环境简单复杂AIAgentsinAction:评估和治理26的基础表2表2访问控制访问控制法律与合规测试和验证测试和验证监控和记录人类监督可追溯性和身份长效管理长效管理可信度和可解释性人工冗余人工冗余AIAgentsinAction:评估和治理27的基础图10人工智能主体评估和治理的基础:渐进式治理实践渐进式治理做法溯源标识监测日志合法合规人工冗余长效管理溯源标识监测日志合法合规人工冗余长效管理人类监督试验确认和更多...制可解释性定义用分类维度评价标准风险评估生命周期定义用途工具调能力任务成功率任务完成时间工具调能力任务成功率任务完成时间错误类型评估风险识别风险管理风险分析风险用成功边缘情况用例作用边缘情况用例鲁棒性信任指标和更多信任指标和更多.权威在部署之前,代理应使用非生产数据进行沙箱或受控试点测试,以验证预期行为。在部署之前,代理应使用非生产数据进行沙箱或受控试点测试,以验证预期行为。AIAgentsinAction:评估和治理28的基础3随着组织开始跨部门、系统和网络部3随着组织开始跨部门、系统和网络部署多个代理,出现了一类新的故障模式。系统未来的互动代理生态系统会带来新的风险,需要可互操作的标准和监督。–代理人对代理人的商务:代理人可以发起交数据与其他代理人,形成了一个新的互联网–代理互联网:除了孤立的交互,大规模的代理AIAgentsinAction:评估和治理29的基础结论AIAgentsinAction:评估和治理30的基础贡献者世界经济论坛本杰明·塞德里克·拉森确认阿米尔·巴尼法特米威廉·巴塞洛缪皮特·伯纳德法比奥·卡萨蒂凯捷杰森·德佩罗凯茜·科贝本·科尔曼莫娜·迪亚卜珍·甘布尔AIAgentsinAction:评估和治理31的基础彼得·哈利南贝纳特·希伦布兰德巴巴克·霍贾特罗伯特·卡茨迈克尔·卡恩斯亚历克斯·勒布伦斯特凡·莱希瑙尔斯科特·利肯斯理查德·马拉皮拉

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论