版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025人工智能代理
什么是AIAgent
*使用人工智能(LLM)来像人类一样设定目标、解决问题和做出决策的智能系统。
状态(ENV)
人工智能代理
观察(数据)
行动(解决方案)
2
什么是AIAgent
*AIAgent的作用
/article/10.1007/s11704‑024‑40231‑1 3
AAI2024
摘要与引言
对模型进行微调以适应特定任务需要耗费大量资源,降低泛化能力,并且对于GPT和Claude等现代模型来说很困难。
人们需要一种无需更新参数就能从经验中学习的新方法。
5
摘要与引言
Few‑Shot有望带来性能提升,但Context‑Length存在限制
通过反复试验收集经验并提取见解检索成功经验
用作小样本
6
ExpeL框架
7
ExpeL框架
*收集经验 收集各种经验来提取信息
LLM通过少量尝试、规划和自我反思来创造行动
以这种方式积累的经验用于洞察力的提取和检索。
8
ExpeL框架
*从经验中学习
累积的经验存储在经验池中,可以在类似情况下在Few‑Shot中额外使用。
比较成功和失败来确定正确和错误的行为压力
识别成功集合中的模式以揭示常见的成功实践
9
ExpeL框架
*任务推理
提取的见解总是以相同的方式出现
经验池中存储的先前经验通过RAG方法为任务带来类似的经验。
10
ExpeL框架
*迁移学习
从源任务中提取的洞察用于目标
可以通过Few‑Shot和LLM任务(上下文学习)进行微调
仅使用之前提取的洞察即可实现目标任务
它可以⾼效地执行并且成功率很⾼。
11
实验
*实验环境
HotpotQA‑
探索多个文档并通过多步推理推断出正确答案
Alfworld‑
一个基于语言的模拟环境,用于探索环境并实现目标,例如在厨房里找一个锅,然后把它端到桌子上
WebShop‑
在网上购物环境中搜索产品并做出购买决定,例如)找到评分最⾼的扬声器并购买
12
结果
*实验环境
十三
结果
*实验环境
14
结论与局限性
缺乏多样化的实验,需要在复杂环境中进一步验证
开放AIAPI依赖项
证明LLMAgent能够通过体验式学习和数据重用进行学习。
15
ICLR2024
摘要与引言
随着任务范围的扩大和复杂性的增加,Agent的性能需要提⾼。
1.LLM接受反馈并可以通过对话进行合作。2.
使用正确的提示时,可以完成各种任务。3.当复杂的
任务被分解成简单的子任务时,解决问题的能力就会提⾼。
=>多代理系统
17
AutoGen框架
18
AutoGen框架
*健谈的代理‑管理员
在进行对话或执行任务时呼叫代理或工具
问题解决是按照预先确定的规则和模式进行的。
为了解决复杂的问题,我们需要能够超越基于规则的对话,实现多代理对话。
19
AutoGen框架
*对话编程 由法学硕士、编程控制
基于自然语言或通过编程进行动态对话
即使代码出现错误,也可以积极讨论并改正。
20
AutoGen框架
*对话编程 以对话为中心的计算
座席根据对话自动相互响应,对话持续进行,直到满足终止条件。
用户无需控制模块即可干预对话并自主推进
21
实验
*示例
22
实验
*示例 数学问题解决
23
实验
*示例‑检索增强聊天
24
实验
*示例 多代理编码
二十五
结论与局限性
当对话持续变长时,就会出现长上下文问题。
没有使用各种模型进行实验
通过多代理系统提⾼生产力和效率
二十六
谈判AI代理
*现有谈判流程存在的问题
耗时‑>谈判条
件复杂,需要很长时间
缺乏客观性‑
>由于情绪判断而难以获得最佳结果
处理复杂情况的问题
‑>难以协调多个利益相关者之间的条件
各种数据利用率低‑>无
法利用过去的谈判数据,导致效率低下
=>使用LLM的AI代理进行最佳谈判
二十七
谈判AI代理
*谈判AI代理的重要性及利用潜力
提⾼效率
‑>通过自动化复杂的谈判节省时间和资源
提供客观
性‑>摆脱情绪判断,产生客观公正的结果
复杂条件处理的最优化
‑>利用信息不对称提出最佳收益
数据驱动的决策
‑>通过过去的数据提出最优策略
=>AI代理使谈判更加⾼效和公平
二十八
我们的方法
*谈判AI代理的成就目标
从简单的谈判转变为利用各种数据的动态谈判
最大限度地发挥评论员的作用,充分发挥法学硕士的口语能力
保存对方的数据,以便下次谈判朝着更有利的方向进行。
通过提取见解,即使在简短的上下文中也能增强口语能力
通过混合使用开源KULLM和超大型语言模型GPT,降低API费用和GPU过载
=>通过多代理系统最大化谈判的成功率和收益
二十九
我们的方法
辅助Agent功能,细致的目标自我反思,以及目标协商的洞察
提取
记忆
自我记忆财务
状况、目标、选择限制、洞,
察力等。
世界记忆
每个客户的文化、财务状况、谈,
判模式、要求等。
是否数据
数据
评估
行政
评估器
数据请求
,
谈判
数据存储
谈判
进展
详情
目标
,
点火
洞察力
记忆‑Crtl 谈判者
长期
记忆
财务
演讲内容总结、中场演讲、最终评估
信息
请求 数据
谈判点火
检索 客户
三十
实验
*谈判AI代理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年呼吸道传染病相关知识培训试题
- 2026年儿科常见传染病诊断与防治模拟考试试题及答案解析
- 2026年常见传染病防治知识试题及答案
- 2025年下半年中学教师资格证《教育知识与能力》真题及答案(完整版)
- 2025年上半年中小学教师资格证笔试教育教学知识与能力(小学)含答案
- 技术革新及合规性承诺书(5篇)
- 林业相关知识测试试题及答案
- 人行桥干粉灭火系统施工方案
- 2025湖北东风资产管理有限公司招聘2人笔试历年参考题库附带答案详解
- 2025浙江金华市轨道交通控股集团运营有限公司应届生招聘170人笔试历年参考题库附带答案详解
- 锂电行业铜锌镍禁令标准
- 2025年二级风力发电运维值班员职业技能鉴定考试题库(浓缩500题)
- 血液透析不同抗凝剂的应用及护理
- 语文教师书写《识字写字教学》教育教研讲座教学培训课件
- 《铁路信号与通信设备》课件
- DB43T 876.2-2014 高标准农田建设 第2部分:土地平整
- 2024年咨询服务协议书范文
- 中医内科临床诊疗指南-肺动脉高压
- DL∕T 5372-2017 水电水利工程金属结构与机电设备安装安全技术规程
- 2022管理学试题库(马工程)
- 形式发票模板范文
评论
0/150
提交评论