2025 GOPS 全球运维大会暨研运数智化技术峰会·北京站:智能运维 2.0:大模型 Agent 驱动的效率革命_第1页
2025 GOPS 全球运维大会暨研运数智化技术峰会·北京站:智能运维 2.0:大模型 Agent 驱动的效率革命_第2页
2025 GOPS 全球运维大会暨研运数智化技术峰会·北京站:智能运维 2.0:大模型 Agent 驱动的效率革命_第3页
2025 GOPS 全球运维大会暨研运数智化技术峰会·北京站:智能运维 2.0:大模型 Agent 驱动的效率革命_第4页
2025 GOPS 全球运维大会暨研运数智化技术峰会·北京站:智能运维 2.0:大模型 Agent 驱动的效率革命_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智能运维

2

.0:

大模型

Agent驱动的效率革命汇报人

风向

2025.6.28运维领域挑战

1大模型与Agent技术

0

2Agent智能运维体应用实践

0

3后续规划与展望

0

4目录·运维领域挑战X

O

p

s

标故障管理故障手册、脚本、API处理问题具演进重要度评级影响面分析传统AI聚焦于在传统运维场景中,

提供更好更智能的工具,但是复杂场景中仍然需要由人熟练掌握工具,

组合解决具体问题

传统AI在Ops领域的使用方向告警接收问题定界定位恢复和复盘识别故障分析告警、

资产、指标数据分析拓扑、日志、

数据告警降噪故障收敛根因分析故障诊断异常检测故障预测AIOps带来工故障自动化规则通知阈值告警1.跨知识领域3.精准定位2.风险预防

运维中痛点问题分析知识泛化能力自我批判自

然语言理解长、

短期记忆库主动学习超广泛的知识学习面向不确定的、

多组合的复杂场景操作及变更风险运维跨众多知识快速定位解决大模型的能力1.

强领域知识:判断对错门槛高、

标注门槛高、

可解释性要强、

要有据可依2.

多样化的场景:

预防、

发现、

定位、

恢复、

改进等3.

多模态

(结构化、

半结构化、

非结构化)

数据、

实时数据、

数据关系复杂

运维需要大模型大模型与Agent技术X

O

p

s

大模型将成为颠覆式的技术创新AI

里程碑AI发展波次大模型驱动的多模型/多任务协同系统多模态大模型认知、

生成、

创造1956199720152020202220235~

10

Years~

10YearsAGI将创造知识工作的边际成本降至零,

产生巨大的劳动生产率和经济价值通用人工智能AGI通用人工智能大模型100万亿个参数感知、

理解具备与人类同等甚至超越人类的智能执行人类无法处理的任务VS100万亿个人类大脑突触行业数据+基础大模型“无中生有

”海量数据+深度学习对物理世界客观反馈模式识别系统,

推荐系统自动化人的规则+机器执行自动生成系统单模态大模型专家系统AI等级智能范式特点示例L1Tool人类完成所有工作,

没有任何显性的AI辅助,

以流程自动化为主目前绝大多数软件产品L2Chatbot人类完成绝大部分工作。人类向AI询问意见,了解信息,

AI提供信息和建议但

不直接处理工作初代ChatGPT等ChatbotL3Copilot人类和AI进行协作,

工作量相当。AI根据人类prompt完成工作初稿,

人类进行

目标设定、修改调整,

最后确认GitHubCopilot、Midjourney、Jasper等L4AgentAI完成绝大部分工作,

人类负责设定目标、提供资源和监督结果。AI完成任务

拆分,

工具选择,

进度控制,

实现目标后自主结束工作AutoGPT、AgentGPT等L5Species完全无需人类监督,

AI自主拆解目标、

寻找资源、

选择并使用工具、

完成全部

工作,

人类只需给出目标类人机器人、硅基物种AI

Agent是人机协同的L4阶段,

人类只负责设下达任务,

AI自主完成任务规划到执行 AI能力等级分类

Agent

Chain/Flow

Prompt

ModelPrompt模式是把大模型当做工具来调用:大模型的最初兴起的时候,Prompt工程,

把大模型当成一种编程语言来看待

人们通过描述角

色技能

任务关键词

任务目标及任务背景,

告知大模型需要输出的格式,并调用大模型进行输出。Prompt工程的万能公式:角

色+角色技能+任务核心

关键词+任务目标+任务背景+任务范围+

任务解决与否判定+任务限制条件+输出格式/形式+输出量。因此在2023年,

全球AIGC关注者发展了多种Prompt工程的玩法,

如角色扮演、

零样本提示和少样本提示,

希望将Prompt工程发挥到极致。例如一个澳大利亚少年编写了一个15000个字符的提示词,

成功地让他变身为人类的导师,教授各种知识。这种方式就像能直接构建软件一样。uAI

Agent是Prompt工程的一种升级,

Agent的核心在于自主性的增强,

可有效完成某一个工作点或工作单元,

尽量减少人的干预;u评价一个AIAgent的核心逻辑:

在流程上的节点上完成了什么程度的自动化。Agent的核心在于自主性的增强,

这种增强的核心要义是可以去独立完成一个工作节点,

在某个工作节点几乎可以减少人类的审核。让整个事件的流程在此刻完成闭环——成本降到最低(包括时间成本和金钱成本);评价一个Agent的逻辑:

在流程上的节点上完成了什么程度的自动化。

自主性的增强,

自动化完成连续行动

AIAgent与Prompt工程Muti-Agent挑战解决思路运维对错误容忍度低检索增强知识工程生成策略:

通过

有据可依

”提供可解释性运维要求高可解释性标注运维数据门槛高,

严肃语料量不大训练策略:

课程学习,由易到难运维要求低开销私有部署模型分层在公域做预训练

微调

提示工程私有部署时避免预训练

微调外挂私域知识库通过降低模型精度降低私有部署推理开销私有运维语料数量不足融合大量已有结构化运维知识构建多模态数据基础模型群融合大量存量工具基础模型编程框架,

基于智能体融合小模型运维工具通识大语言模型更新迭代快与通识大语言模型底座尽量解耦运维大语言模型(“懂运维的大语言模型

)运维大模型执行(

工具选择

、使用)

关键能力规划Agent智能运维体应用实践X

O

p

s

标01

能干什么,和现有智能运维的关系?02

每个人都要会么?会到什么程度?03

处理简单重复的问题,还是沉淀专家经验?04

一本正经的胡说八道,怎么办?

使用大模型的能力象限及问题

故障预防:

提前干预,

闭环跟踪变更后巡检在每次发布、变更后对关联的业务进行全量巡检,分析指标异常,通过大模型自动生成询价分析报告。故障报告生成故障和演练以统一标准复盘,获取流程、监控等平台数据,结合业务影响综合分析报告。通过大模型进行总结分析。通过大模型自动匹配符合风险特征的SQL示例:对执行时间超过相应环境阈值的sql,且where子句中包含timestamp

'...'关键字高风险SQL

大模型智能运维实践告警输入报警内容通过消息队列或接口递至AI分析引擎AI初步分析提示词包含报警类型

、系统架构

、历史案例

、业务场景等关键信息迭代分析与增量推理AI模拟资深运维专家的行为,在每次查询后分析新增数据

,更新假设,

并决定下一步查询方向动态工具选择AI根据初步分析生成的排查方案

,动态选择合适的MCP工具

大模型智能运维实践总结与输出AI综合分析结果

,生成结构化报告输出排查方案生成初步假设生成对应的排查方案可观测平台......MCP工具集后续规划与展望X

O

p

s

全量微调FFT

局部微调PEFT

PromptTuning

PrefixTuning

LoRA

QLoRA

模型部署

模型加速

系统加速

集成

向量数据库

IM/OA

基座大模型训练到Agent应用大模型训练

应用开发需要丰富的数据集,

考虑配比X%X%X%X%X%学会具体任务的大模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论