大模型前沿技术及未来应用展望_第1页
大模型前沿技术及未来应用展望_第2页
大模型前沿技术及未来应用展望_第3页
大模型前沿技术及未来应用展望_第4页
大模型前沿技术及未来应用展望_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智周万物: 迈向通用人工智能大模型前沿技术及未来应用展望面壁智能@2024人工智能发展1956达特茅斯会议1957感知器发明低谷1970-1980机器翻译项目失败证明感知器无法完成复杂任务1980年代多层神经网络五代机项目1986BP、

PDP算法低谷1990-2000五代机失败政府投入缩减深度学习2010至今人脸识别AlphaGo等人工智能核心命题

让机器掌握完成复杂任务的知识AI诞生 专家系统专家规则库/知识库、Noam

Chomsky(语言学巨擘)20世纪50年代后,词法句法、语法规则被广泛应用于自然语言理解Edward

Feigenbaum(图灵奖获得者)专家系统由知识库与推理机构成,知识库存储事实和规则,推理机则基于知识库进行推理19601980问:青蒿素抑制什么?答:疟原虫问:疟疾是什么?答:疾病问:疟原虫是什么?答:无法回答符号知识手工总结符号智能:专家手工构建规则库和知识库,以规则库和知识库解决具体问题局限:规则与知识难以穷尽式枚举,无法解决规则库和知识库未覆盖的任务人工智能发展路线——符号智能神经网络参数结构问:计算机英文是什么?答:Computer问:计算机法文是什么?答:Ordinateur问:1+2=?答:无法回答特定任务带标注数据Judea

Pearl(图灵奖获得者)概率与统计方法被引入自然语言处理,模型从符号系统推演转变为数据驱动学习,Yann

LeCun(图灵奖获得者)2010年后神经网络兴起将数据驱动的效果推到新高位,成为当前自然语言处理主要范式19902010专用知识机器学习中文:中国首都是北京English:ThecapitalofChinaisBeijingFrançaise:LacapitaledelaChineest

Pékin…中国首都BeijingPékin北京任务专用小模型专用智能:利用数据驱动机器学习从特定任务带标注数据之中自动学习知识,以小模型参数存储知识局限:要针对特定任务标注数据,标注代价高,无法解决标注数据未能覆盖的任务人工智能发展路线——专用智能通用域无标注数据问:计算机英文是什么?答:Computer.问:如何治疗疟疾?答:青蒿素。问:1+2=?答:3通用知识自监督预训练学习通用大模型书籍新闻论文报告通用智能:采用自监督预训练方法从海量通用域无标注数据中自动学习知识,以大模型参数存储知识优势:无标注数据廉价易得近乎无限;大模型有力支持知识的学习和存储2020年1750亿参数大模型GPT-3

发布,具备解决数十种文本任务的能力,人工智能进入通用智能时代LLM2023年发布

的ChatGPT和GPT-4具有通用认知能力,可通过文字、视觉、语音信号与人类交互,可使用人类工具处理复杂任务,已被用于政务、商务等众多领域进行智慧赋能人工智能发展路线——通用智能数据管理接口抽象高效数据索引信息治理接口抽象分布式计算知识获取接口抽象预训练、微调、推理Map-Reduce

分析系统大模型系统用户逻辑层物理执行层数据

DataSQL数据库信息

Information知识

Knowledge智慧 Wisdom数据管理(1970s)信息管理(2010s)知识管理(2020s)归纳智能(2023后)Russell

Ackoff(工程系统巨擘)“FromDatato

Wisdom”通用人工智能大模型将成为智能时代基础设施W

E MOD

E

L T

H

E BESTWORL

D02

组织孪生——基于AI

Agent技术的应用落地框架大模型:第一次智能涌现能算:高效的大脑思考世界;能看:敏锐的感官感知世界能用工具:灵活的双手操作工具;能协作:有效的沟通形成文明AI

Agent

智能体:大模型的专业教育大模型通过预训练完成通识教育,需要进一步学习专业知识实现专业教育赋能行业应用专业教育:知识图谱与检索增强生成智能检索增强生成(RAG)技术让智能体掌握事实性知识,是实现专业智能体的基础专业教育:工具智能工具学习技术让智能体学会使用搜索引擎等认知工具,拓展智能体能力边界工具智能——实现路径模仿学习:通过记录人类使用工具行为数据,大模型模仿人类行为习得工具学习能力教程学习:通过让模型阅读工具使用手册(教程),理解工具功能及其调用方式强化学习:模型能够通过自主探索,基于强化学习,根据环境反馈纠正错误1.

模仿学习 2.教程学习3.

强化学习人类监督逐渐减少,模型自主化程度逐渐提高(用户点击序列:下翻页面、点击、键入等)(API手册、工具文档等)(API调用成功率,用户反馈等)13新型人机协作Docker执行环境统一智能体语言超强工具调用无需专家知识动态双循环机制XAgent

vs.AutoGPTXAgent

在基准能力测试中全面超越

AutoGPTData

AnalysisMathSearch&

ReportLife

AssistantCoding&

Developing20406080100WinRate(%)

020406080100FreshQAHotPotQAInterCodeMBPPMATHALFWorldWinRate(%)

0单体智能

|

自主解决复杂任务的智能体框架

XAgent,能力全面超越

AutoGPT双循环机

制与人类协

作超强工具调

用结构化通

信14双循环机制:规划(外循环)和执行(内循环)XAgent通过双循环机制协调决策制定和任务执行过程外循环处理任务的高级管理和分配,内循环专注每个子任务的低级执行和优化XAgent:大模型驱动到自主智能体框架外循环:

动态规划和迭代优化将复杂任务拆分成若干子任务在执行完每个子任务后,会对执行结果进行反思,并依次修订规划Subtask

SplitSubtask

DeletionSubtask

ModificationSubtask

AdditionXAgent:大模型驱动到自主智能体框架内循环:

推理与执行根据子任务目标,贯序调用工具支持的工具包括FileSystemEnv:文件读写PythonNotebook:编程WebEnv:搜索引擎,网页浏览ExecuteShell:Shell命令执行RapidAPIEnv:16000+的真实API对任务完成结果进行reflexion,反馈给外循环XAgent:大模型驱动到自主智能体框架AskHumanForHelp:可以自主与用户进行交互,并向人类发出干预和指导的请求用户可以直接修改XAgent制定的计划,从而将

AI效率与人类的直觉和专业知识有效结合。XAgent

具备AskHumanForHelp能力,它会向用户征求实时反馈、建议或指导,确保即使在不确定的领域,智能体也能发挥出最佳作用XAgent:大模型驱动到自主智能体框架工具智能——利用工具提升智能水平ToolLLM:

大模型能够学习掌握

16000+

真实API,通过多轮多工具调用解决复杂问题Yujia

Qin,

et

al.

ToolLLM:

Facilitating

Large

Language

Models

to

Master

16000+

Real-world

APIs.

PreprintXAgent:

/+搜

索引擎+做饭机器人+扩散模型回复以下为推荐书籍:.

《优秀的投资人》.

《简单致富》3.

…回复这是根据您的要求绘制的埃菲尔铁塔水彩画作,由扩散模型生成。规划/

剥香蕉。/

搅拌香蕉和酸奶。稳定扩散模型Stable

Diffusion提示词:

埃菲尔铁塔,水彩w

w

w

.投资类书籍基础模型请帮我做一碗香蕉酸奶。请给我推荐一些适合理财小白的理财相关书籍。请帮我画一幅水彩风格的埃菲尔铁塔图片。搜索使用扩散模型执行XAgent:

大模型智能体实现通用复杂任务处理(例如自动数据分析)专业教育:工作流与流程自动化流程自动化技术让智能体掌握工作流程,高效执行复杂多步骤任务ProAgent:结构知识驱动的智能体工具智能——赋能业务自动化工作流通过自动化执行提高工作效率,但工作流的构建需要花费大量人力物力财力工作流的本质是固化的工具使用过程,可以基于大模型自动化设计构建工作流自动构建工作流业务流程自动化群体智能:第二次智能涌现个体智能涌现群体智能涌现神经元数量增加带来生物个体的智能涌现参数增加带来单个大模型的智能涌现生物体群聚带来生物群体智能涌现AI群聚带来AI群体智能涌现(大脑神经元数量

十亿)0204060801001000000100000100001000100101BERT

GPT-2GPT-3

PaLM(模型参数量

百万)群体智能—前沿研究方向实现多智能体间的方案提议、决策研讨、分工执行在协同编程、数据库运维等场景验证效果双智能体三智能体多智能体议题辩论信息互验第三方裁判社会群体协同工作群体智能:划分为社会模拟型与任务完成型两类形式实现“人类-环境-机器”

无缝链接,孕育并引领下一代人机协作范式社会模拟型斯坦福的SmallVille小镇:基于层次规划的智能体社会小镇,实现人类社群行为的可信模拟任务完成型清华NLP的ChatDev数字团队:基于语言交互的智能体软件开发,实现群体交互协作式任务完成群体智能——智能时代协同创新引擎26Chen,Weize,etal."Agentverse:Facilitatingmulti-agentcollaborationandexploringemergentbehaviorsinagents."arXivpreprintarXiv:2308.10848

(2023).AgentVerse:群体智能框架/OpenBMB/AgentVerse提出大模型群体协作的通用流程,包含“智能体招募”、“协同决策”、“动作执行”与“检验评估”四个阶段由大语言模型驱动的多角色智能群体协同进行需求分析、系统设计、程序编码、集成测试、文档编制组织管理:交流链将软件开发分解为原子任务组成的“生产线”通过角色扮演交流实现智能体间的方案提议和决策研讨过程Chen

Qian,

et

al.

Communicative

Agents

for

Software

Development.

arXiv

preprint

arXiv:2307.07924.

2023.ChatDev:

智能群体交互式软件开发/OpenBMB/ChatDevW

E MOD

E

L T

H

E BESTWORL

D03

知易行难——面壁智能大模型落地框架和案例智能客服投顾/营销运营智能客服投顾助手舆情分析NL2SQL研报撰写金融助手投顾话术推荐舆情检索NL2报表研报检索智能培训投资建议报告撰写事件标签合同信息抽取研报标签NL2SQL营销内容撰写事件抽取合同撰写智能外呼法规抽取表单识别信息检索风控投研案例1:泛金融场景AI能力案例1:泛金融场景——某大型股份制银行对外上线产品服务终端客户通过CPM大模型为客户带来专业、实时、可交互的会话功能,针对客户可能遇到的财务分析、选品策略、市场观点、收益剖析等真实场景需求提供咨询问答服务。财务分析选品策略 市场观点 收益剖析案例1:泛金融场景——投研智能体提升信息收集能力卖方研究买方研究投决流程风控流程打通信息壁垒,解放生产力,提升合规性案例1:泛金融场景——事件驱动智能体辅助业务推进金融事件发生启动会议预约流程自动判断参会者自动分别邀请参会者,预约时间OA预约会议室邮件发送会议通知自动会议纪要金融事件突发,需要快速召开走姿决策会议,事件驱动智能体会自动进行判断,并通过工具调用、自动与人交流的方式,完成会议预约并纪要的工作案例1:泛金融场景——数据分析智能体提升数据分析能力案例1:泛金融场景——研报解读智能体提升信息处理能力模型completeness(平均)React+Note0.6793ActiveRAG0.5849RAG0.4816基于React+Note框架,整体提升研报解读RAG、总结等能力案例2:跨境电商智能体——实际场景贸易线索海外展厅采洽会…“询盘质量不高”“有询盘没转化”“只是来比价格的”“骗样品骗邀请函的”…参差不齐,经验遴选付员工纽约大学研究生商二代,集团员工张老板星宝伞业老板娘语言好熟悉行业询盘回复通过客户对自己的介绍及留下的信息做真实性判断询盘里询问的内容,总结提炼,一个不落地回答专业报价客户没有询问到的基本信息也要体现出来如:产品图片、产品名称、货号、参数规格、认证信息、单价、数量、付款方式、包装、发货期限、运输时间等不管价格可否接受,都要拿到回复,因为这有助于使你明白你是否还有地方需要改进沟通明确对方目的(要点)发询盘的客户一定是有目的花心思拿到他目的小商品知识库工具插件CDP+MA报价制表网络检索IM&邮件一盘好货也好一盘好商也好都是要给经营户增量…托管托管监督案例2:跨境电商智能体——需求分析让市场持续繁荣本质是要给经营户提升获得感,经营户很简单要赚更多的钱(更多的订单,退一步更多的流量)公司黄页独立站线上店铺品牌or口碑曝光平台公司:机构公司:KOL

or

品牌:MCN公会社区代运营代投放…跨境电商智能体AI全托管的智能体生成器全部的网红KOC都由AI自动生成相较于传统机构公司人员成本,管理成本AI全托管公司的成本是电费和网费案例2:跨境电商智能体——虚拟员工为企业提供AI-powered

Virtual

Employees,结合客户自身行业经验叠加社交媒体多模态数据(视频,图文)建立数字员工,自生产社媒内容,通过RLHF(人类反馈强化学习)模型进行互动规划Characters

Traits[人设]FashionOutgoingAmbitiousHandicraftsBeauty

bloggerTarget[工作地&工作目标]纽约迪拜河内孟买品牌曝光商机发现大号引粉Knowledge&Data[知识&数据]多模态:分析视频图文数据执行高级指令…RlHF(人类反馈强化学习)精细互动规划

……工作&社交平台目标用户互动内容生产发布…AI-poweredVirtualEmployees训练AIAgent数字员工,为某小商品城集团8万跨境电商商户提供引流能力KOC人设方向热点话题池化标签对用户建立Tag标签模型内容方向:滑雪教程;装备搭配;新手教学;极限运动;花样滑雪AI-poweredVirtual

Employees数字员工:KEN人设:滑雪爱好者工作时间:6小时/天工作地点:美国工作目标:三区商铺引流,新品推荐关联标签:#Burton、#Salomon、#Libtech6小时工作成果总计浏览3695条数据观看423条视频阅读2570条评论互动次数48次KOL/KOC

132条关注相关用户

8位社交内容制作及发布&用户实时动态互动自动营销获客,维护精准粉丝池,每日过亿次精准触达,让中国商品更好地卖向全球打造KOC矩阵,每个经营户启动100个虚拟员工,每位员工每月线上发掘1000客户,每天产品亿次曝光,官方账号快速冷启动,让经营户用心做服务,让贸易更简单案例2:跨境电商智能体提升贸易效能案例3:「大模型+Agent」汽车营销落地实践常态监控目标客群与事件,

多渠道和多模态分析,

提供定制化竞品和用户报告。行业大模型+

专业工具,

促进高质量内容生产,

预置提示词简化创作,

自动发布与数据管理提高效能。粉丝运营、潜客运营、保客运营三大场景,

高时效、个性化的用户互动,

全渠道响应与自动优化,

便捷人机协同管理提升用户运营效能。实时定制舆情报告,口碑情绪精准提炼,自然语言人机交互,达人账号动态监控,平台热点实况扫描等。对标集约D

C

C

最佳实践,

1

0

0

%

执行业务S

O

P

有效保障品牌一致性,

7

×

24

高并发作业,

个性化语音&

情绪策略,

自动化数据分析洞察。业务分析师

Agent数据分析师

Agent数据工程师

Agent......直播运营

Agent视频剪辑

Agent创意设计

Agent广告投手

Agent......运营主管

Agent客户分析

Agent客户运营

Agent......报道搜集

Agent舆情整理

Agent回复评论

Agent......DDC经理

AgentDDC邀约

Agent网站维护

Agent......数智研究院新媒体运营用户运营舆情运营集约DDC汽车营销五大落地场景案例3:「大模型+Agent

」汽车营销落地实践

——

以集约DCC为例传统人工邀约获客效率低工作过程繁琐、对沟通能力要求高、质检困难人员成长性低人员业务素质往往难以量化、人员成长性低,培训成本高,故难以积累形成有效的改善方法论提升了D

C

C

场景的经营效能例:本月外呼目标“10%的客户到店率”快速理解用户“心有灵犀”个性化反馈“灵活应对”全流程迭代“战略激活”「大模型+Agent」汽车营销落地实践

——

以新媒体运营为例新媒体运营是品牌建立的有效途径群体智能的目标基于Agents的专业创意团队高效高质量的内容产出例:新媒体运营目标“本周新媒体账号增加

500

名粉丝”1、运营经理Agent:拆解任务第一项任务:本周策划

2

场直播,旨在强化品牌信息的传播和用户的互动;第二项任务:制作并发布

5

个精准定位品牌价值观的短视频,分发至抖音、快手、小红书等平台,以提升品牌影响力;第三项任务是保持平台账号的活跃运营,及时回复用户评论,增进用户参与感。2、文案策划+海报策划Agent将基于品牌价值观创作有吸引力的文案和宣传海报;吸引目标用户群,同时负责内容生产、信息的传递和交付。3、运营专员Agent将内容上传至各个内容平台确保市场部经理对内容进行人工确认,确保品牌形象的一致性和专业性。4、运营经理Agent:数据分析为后续的内容运营和用户运营决策提供数据支持大模型+Agent 汽车营销落地实践

——

以新媒体运营为例案例4:合规智能体赋能合同审核通过自然语言处理(NLP)技术,以及大量的数据训练,实现对合同文本信息的精准识别和抽取,并依据专业法律知识图谱和风险审查清单智能识别出合同中的风险,为公司法务部门和业务部门赋能。对于上传至系统的合同,智能合同审查算法将自动进行分析,能立即看到审查点风险提示、修改建议、推荐条款、参考法条案例。同时,条款和审查记录都将自动保存为数据,将合同信息变成企业数据资产。打造合同审核智能体,帮助客户在自动针对合同进行审核,提升当前合同审核的准确性,同时大幅降低合同审核成本构建合规专家Agent“外规内化”结合企业需求优化合规能力构建企业专有合规Agent人机结合通过反馈不断提升智能体准确性案例4:合规智能体赋能合同审核45,打造合同审核智能体,帮助客户在自动针对合同进行审核提升当前合同审核的准确性,同时大幅降低合同审核成本审查清单自动化:根据合同类型生成审查清单审查逻辑自动化:根据审查点进行审查步骤自动拆解、构建审查推理引擎闭环优化:人机交互和环境反馈优化审查流程,如规划、提示语、工作流等上传合同这是“商铺租赁类合同”,下面是生成的审查清单:Step3:判断xxx

xxx针对1.审查点“保证金合理性审查”生成审查逻辑如下:Step1:找到合同中所有保证金Step2:找到合同总金额反馈优化1.

审查点:保证金合理性审查描述:判断合同中的保证金是否合理...30.

审查点:收尾部主体一致性审查描述:判断首尾主体是否一致反馈优化针对“保证金合理性审查”合规专家Agent审查逻辑流程,自动创建审查逻辑Workflow输入LLM节点LLM节点判断节点审查输出反馈优化案例4:合规智能体赋能合同审核案例5:运维智能体——业务需求系统运维⽂档多: 单⼀数据库产品对外提供的

管理员指南、运维调优、故障定位⼿册等达到1w多⻚,普通管理⼈员很难完全掌握;云上运维压⼒⼤: 云数据库实例数巨⼤,运维⼯程师(DBA)短缺;复杂问题诊断难: 紧急问题多层连环,运维⼈员难以快速响应,造成经济损失案例5:运维智能体——构建目标思考:

高内存使用率似乎是由于查询的连接性能不佳、大量非活动内存造成。推理:

可以通过查询计划优化来加速连接操作的执行。行动:

查询计划优化。专家系统等难以在相似例⼦上复⽤品 查询计划优化自然语言查询接口自动配置调优DBAgent…文档知识目标:

利用大模型训练“智能运维助手”,学习人类运维经验、诊断根因好处:

节省人力;提升运维工具使用能力;提升运维知识泛化能力案例5:运维智能体——方案架构可观测体系构建:日志、视图、指标等数据的原始值和加工值;运维知识抽取:分割文本块、生成摘要索引、抽取形式化知识;外部工具学习:学习API调用方式、基于树搜索提高工具的使用能力;协同诊断优化:DBA主管(诊断调度、总结发言);⼦领域专家(如:资源异常专家、查询优化专家等);对话摘要员;用户(有效性反馈)D-Bot在11类测试场景中的诊断正确率达81.8%,远高于GPT4(36.4%),在典型问题上的诊断水平接近人类DBA针对二十余种题材的政务公文,提供智能公文撰写AI

Agent,大幅提升公文写作效率及整体质量自动生成:

根据用户特定意图自动生成(主旨/大纲/参考范围等)智能修改:

生成作品,可按用户意图,即时修订完善专业度高:达到公文作品高专业度要求,语言规范、表达精炼、主旨明确、结构清晰、价值观正等安全可信:文章内容可信、关键内容可溯源,避免产生幻觉智能提纲:根据标题自动生成提纲,且用户可自行修改智能写作:根据文章主旨或者提纲自动生成公文案例6:公文智能体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论