2025⼈⼯智能代理技术_第1页
2025⼈⼯智能代理技术_第2页
2025⼈⼯智能代理技术_第3页
2025⼈⼯智能代理技术_第4页
2025⼈⼯智能代理技术_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025人工智能代理

什么是AIAgent

*使用人工智能(LLM)来像人类一样设定目标、解决问题和做出决策的智能系统。

状态(ENV)

人工智能代理

观察(数据)

行动(解决方案)

2

什么是AIAgent

*AIAgent的作用

/article/10.1007/s11704‑024‑40231‑1 3

AAI2024

摘要与引言

对模型进行微调以适应特定任务需要耗费大量资源,降低泛化能力,并且对于GPT和Claude等现代模型来说很困难。

人们需要一种无需更新参数就能从经验中学习的新方法。

5

摘要与引言

Few‑Shot有望带来性能提升,但Context‑Length存在限制

通过反复试验收集经验并提取见解检索成功经验

用作小样本

6

ExpeL框架

7

ExpeL框架

*收集经验 收集各种经验来提取信息

LLM通过少量尝试、规划和自我反思来创造行动

以这种方式积累的经验用于洞察力的提取和检索。

8

ExpeL框架

*从经验中学习

累积的经验存储在经验池中,可以在类似情况下在Few‑Shot中额外使用。

比较成功和失败来确定正确和错误的行为压力

识别成功集合中的模式以揭示常见的成功实践

9

ExpeL框架

*任务推理

提取的见解总是以相同的方式出现

经验池中存储的先前经验通过RAG方法为任务带来类似的经验。

10

ExpeL框架

*迁移学习

从源任务中提取的洞察用于目标

可以通过Few‑Shot和LLM任务(上下文学习)进行微调

仅使用之前提取的洞察即可实现目标任务

它可以⾼效地执行并且成功率很⾼。

11

实验

*实验环境

HotpotQA‑

探索多个文档并通过多步推理推断出正确答案

Alfworld‑

一个基于语言的模拟环境,用于探索环境并实现目标,例如在厨房里找一个锅,然后把它端到桌子上

WebShop‑

在网上购物环境中搜索产品并做出购买决定,例如)找到评分最⾼的扬声器并购买

12

结果

*实验环境

十三

结果

*实验环境

14

结论与局限性

缺乏多样化的实验,需要在复杂环境中进一步验证

开放AIAPI依赖项

证明LLMAgent能够通过体验式学习和数据重用进行学习。

15

ICLR2024

摘要与引言

随着任务范围的扩大和复杂性的增加,Agent的性能需要提⾼。

1.LLM接受反馈并可以通过对话进行合作。2.

使用正确的提示时,可以完成各种任务。3.当复杂的

任务被分解成简单的子任务时,解决问题的能力就会提⾼。

=>多代理系统

17

AutoGen框架

18

AutoGen框架

*健谈的代理‑管理员

在进行对话或执行任务时呼叫代理或工具

问题解决是按照预先确定的规则和模式进行的。

为了解决复杂的问题,我们需要能够超越基于规则的对话,实现多代理对话。

19

AutoGen框架

*对话编程 由法学硕士、编程控制

基于自然语言或通过编程进行动态对话

即使代码出现错误,也可以积极讨论并改正。

20

AutoGen框架

*对话编程 以对话为中心的计算

座席根据对话自动相互响应,对话持续进行,直到满足终止条件。

用户无需控制模块即可干预对话并自主推进

21

实验

*示例

22

实验

*示例 数学问题解决

23

实验

*示例‑检索增强聊天

24

实验

*示例 多代理编码

二十五

结论与局限性

当对话持续变长时,就会出现长上下文问题。

没有使用各种模型进行实验

通过多代理系统提⾼生产力和效率

二十六

谈判AI代理

*现有谈判流程存在的问题

耗时‑>谈判条

件复杂,需要很长时间

缺乏客观性‑

>由于情绪判断而难以获得最佳结果

处理复杂情况的问题

‑>难以协调多个利益相关者之间的条件

各种数据利用率低‑>无

法利用过去的谈判数据,导致效率低下

=>使用LLM的AI代理进行最佳谈判

二十七

谈判AI代理

*谈判AI代理的重要性及利用潜力

提⾼效率

‑>通过自动化复杂的谈判节省时间和资源

提供客观

性‑>摆脱情绪判断,产生客观公正的结果

复杂条件处理的最优化

‑>利用信息不对称提出最佳收益

数据驱动的决策

‑>通过过去的数据提出最优策略

=>AI代理使谈判更加⾼效和公平

二十八

我们的方法

*谈判AI代理的成就目标

从简单的谈判转变为利用各种数据的动态谈判

最大限度地发挥评论员的作用,充分发挥法学硕士的口语能力

保存对方的数据,以便下次谈判朝着更有利的方向进行。

通过提取见解,即使在简短的上下文中也能增强口语能力

通过混合使用开源KULLM和超大型语言模型GPT,降低API费用和GPU过载

=>通过多代理系统最大化谈判的成功率和收益

二十九

我们的方法

辅助Agent功能,细致的目标自我反思,以及目标协商的洞察

提取

记忆

自我记忆财务

状况、目标、选择限制、洞,

察力等。

世界记忆

每个客户的文化、财务状况、谈,

判模式、要求等。

是否数据

数据

评估

行政

评估器

数据请求

谈判

数据存储

谈判

进展

详情

目标

点火

洞察力

记忆‑Crtl 谈判者

长期

记忆

财务

演讲内容总结、中场演讲、最终评估

信息

请求 数据

谈判点火

检索 客户

三十

实验

*谈判AI代理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论