版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Shanghai2015-2025O化技术峰会上海站2025年10月17日-18日指导单位:品AOAPS主办单位高效运维社区aBizDevOps承办单位:华估科技ANNIVERSARYShanghai2015-2025Shanghai从工具到大脑:大模型如何重塑传姓名:杜颖君◎时间:2025/10/18个人简介自2015年起,开始探索自动化运维领域,带领团队从0到1构建了台。并成功落地告警收敛、故障定界、智能观测等智能运维场景,目前,正专注于探索运维工具与大模型结合的前沿场景,致力于通过技术创新推动运维智能化的进一步发展。GOPSGOPS2025Shanghai2015-2025GOPSGOPS全球运维大会暨研运数智化技术峰会2025·上海站GOPS全球运维大会暨研运数智化技术峰会2025·上海站GOPS2025ShanghaiANNIVERSARY2015-2025公司介绍与面临的挑战大模型如何重塑现有工具使用的场景与价值衡量后续的规划与展望ANNIVERSARYGOPS全球运维大会暨研运数智化技术峰会2025·上海站GOPS2025Shanghai公司介绍与面临的挑战ANNIVERSARY2015-2025太保科技于2022年2月正式成立,服务于与太平洋保险集团内部的全资子公司。主要包含数据中心、Al中台、数据中台、集团业务开发等技术服务。承接全集团数据中心的管理和运维服务,包含系统、网络、数据库、机房等团队。负责提供大模型通用能力;以及图像识别、RPA服务等常规AI能力提供。负责提供业务数据服务,数据集中存储、分析、展示等能力提供。太保科技大模型整体规划AI+管理AI+销售字动应数劳力字动应数劳力用消保智审合规智审审计数字劳动力AI+营运智能语音客服智能在线客服坐席助手智能外呼AI+理赔海豚IC-健康险理赔车险智能理赔定损Al+投研智能文档助手智能信息提取投研助手智能舆情Shanghai2015-2025Al+运维智能运维助手智能故障诊断变更方案助手AI服务AI能力模型十知识基础设施A专项技术平台-原子能力编排传统AI-解决特定任务的原子API认知推理感应识别知识检索认知推理训推平台模型生命周期管理数据采集模型模型生命周期管理数据采集模型混合算力管理和调度平台私有化异构算力外购算力Agent应用开发平台AI统一服务网关数据工程平台数据清洗数据数据清洗数据增强大模型能力API知识平台RAG平台知识管理平台算力引入和场景接入评审机制GOPS全球运维大会暨研运数智化技术峰会2025·上海站运维工具的建设历程诞生2016~2017自动化运维体系建设完毕,达到全域操作前台化的目标,正式开启智能运维建设历程。一生二GOPS2025ShanghaiANNIVERSARY2015-2025三生万物三生万物2022~2023构建多元化的监控告警体系,将常规运维工具能力与智能化能力进行融合。实现全域告警统一处理智能告警中心,达到观测、处置快速衔接的目标。道生一演进2018~2021开始构建整体运维数据服务能力,启动数据治理工作。使用机器学习机制进行监控指标预测等智能方式,提升监控告警能力。2024~2026建设基于业务视角一体化监控平台,将智能分析与处置深度结合,目标实现发现、定位、处置一站式处理智能运维平台。GOPS全球运维大会暨研运数智化技术峰会2025·上海站GOPS全球运维大会暨研运数智化技术峰会2025·上海站发现5分钟处置故障的定义:造成业务影响!故障的原因:告警未及时处理1.处理速度不够(人-赋能)2.未及时发现(系统-完善)3.没有足够的时间(架构-发现)Shanghai2015-2025告警:需要发出工单动化处理工单:收敛剩GOPS全球运维大会暨研运数智化技术峰会2025·上海站重新定义1-5-10,处置时效通过低效SQL、发布前后分析等方式在隐患阶段干预。5-10分钟知识库已覆盖且有成熟的处理方案,一线团队可直接处理,或二线团队快速定位处置。小于2.19小时可通过标准自动化工具恢复,由监控平台直接触发自愈。业务连续性大于10分钟不可抗力(硬件故障、高可用失效)、超出运维人员经验覆盖范围。大模型驱动的智能运维体系建设目标降低业务影响发布前后运行数据风险评估大模型提升恢复时效预警诊断、日常巡检情况总结后生发布前后运行数据风险评估大模型成报告。控提前发现时间和准确度。处理。大模型·人机协同的智能告警指挥中心,自动建群及同步故障信息,方案的覆盖度,提高一线解决率。混沌工程模拟问题□建立数据驱动的故障复盘机制,自动生成演练报告大模型言进行能力编排和分析结果总结。大模型大模型诊断定界。GOPS全球运维大会暨研运数智化技术峰会2025·上海站GOPS全球运维大会暨研运数智化技术峰会2025·上海站GOPS2025ShanghaiANNIVERSARY2015-2025GOPSGOPS2025Shanghai2015-2025大模型如何重塑现有工具GOPS全球运维大会暨研运数智化技术峰会2025·上海站使用大模型的能力象限及问题传入大模型的信息传入大模型的信息简单RAG(检索增强)涉及文案召回等技术,模型能力结合外部文案总结提炼模型训练、微调内部知识、专有规则等融入模型,形成运维专属模型提示工程通过提示词内容,引导大模型处理各类问题Agent(智能体)综合文案、工具、提示词,可根据前置任务记过判定后续步骤01能干什么,和现有智能运维的关系?02每个人都要会么?会到什么程度?03处理简单重复的问题,还是沉淀专家经验?04一本正经的胡说八道,怎么办?一般人员技能与大模型的算力要求高需要持续解决的问题慢慢漏网络网络系统系统数据库可观测数据库知识库GOPS全球运维大会暨研运数智化技术峰会2025·上海站运维大模型的整体框架智能运维体系AI中台服服务层模型层力层运维场景模型服务运维通义通义GPU资源统一管理Al云底座知识、工具、模型、用户的关系所有运维工作所需要的经验及操作步骤Q工具+知识通过自然语言快速检索和执行运维指令前期已沉淀至各类工具平台运维GOPS全球运维大会暨研运数智化技术峰会2025·上海站大模型重塑现有工具的实施路径单智能体通过对现有运维工具平台的封装及改造,形成工作流、对话流形式的专属智能体和MCP市场。上GOPS2025Shanghai垂域模型将外挂的专家经验、任务拆解记录形成训练数据,微调后形成运维垂直领域模型。ANNIVERSARY2015-2025对话问答使用大模型基本能力结合RAG、提示词,将外部知识与模型能力结合形成对话式问答。将对话模型与单智能能力整合,通过沉淀专家经验,让模型自主分解运维任务,形成多智能体协同工作的模式。GOPS全球运维大会暨研运数智化技术峰会2025·上海站GOPS2025ShanghaiANNIVERSARY2015-2025GOPSGOPS2025Shanghai2015-2025使用的场景与价值衡量大模型赋能的三大场景类型阶段目标:实现基于大模型的问答能力框架,包括MCP工具,RAG知识管理等。达到通过自然语言查询知识文案和常用运维数据。阶段目标:通过智能体实现精准的工具调用和各类诊断场景的编排,将诊断结果交由模型分析后生成诊断报告并推荐处置方案。协同处置型场景协同处置型场景阶段目标:进一步强化智能体能力,实现自主规划型智能体,实现多智能体协同能力,达到故障期间可自动召集人员,并向群内推送初步诊断结果自然语言问答知识检索增强AI工具调用AI能力编排多智能体协同推理任务拆分GOPS全球运维大会暨研运数智化技术峰会2025·上海站GOPS全球运维大会暨研运数智化技术峰会2025·上海站协助型场景1:RAG赋能知识库GOPS2025ShanghaiANNIVERSARY2015-2025精准召回通过自研算法,梯度筛选文案匹配度,未命中文档及工具时会有明确提示。逐一分析召回多篇文档时,实现逐一分析文档内容,后给出建议,有效降低知识混用。工具绑定知识文案支持直接绑定各类工具,可在文案查看过程中直接触发。GOPS全球运维大会暨研运数智化技术峰会2025·上海站协助型场景2:基于MCP的运维数据查询低代码+提示词双显示GOPS2025Shanghai工具封装通过低代码方式实现SQL语句直接生成API接口,结合提示词配置成模型可识别的工具。服务注册工具通过审核后注册到统一的MCP服务中心,统一实现权限管控及流量限制等功能。双显示模式工具查询的结果交由大模型分析的同时,可以支持在页面展示明细数据。ANNIVERSARY2015-2025诊断型场景1:诊断巡检智能体数据驱动:告警触发数据驱动:告警触发请使用以下步骤进行系统检查:1.使用系统对象查询工具获取所有对象信息。2.使用告警查询工具检查是否存在告警。3.使用权重分析工具分析告警情况。4.如果没有任何告警,分别使用Redis工具、数据库工具检查异常信息。(阈值降低20%)6.把情况进行总结后发送诊断报告可编排智能体在原有流程引擎中,追加大模型、意图决策等AI能力节点,同步实现流式返回功能,快速迭代为智能体编排工具。工具市场将拓扑接口、对象查询、日志、指标等运维日常配置所需的能力全部封装生成诊断报告结束成模型可识别的工具,同时也支持直接配置现有常规工具。GOPS全球运维大会暨研运数智化技术峰会2025·上海站诊断型场景2:告警处置智能体告警、预警业务影响派单规则根源收敛根源收敛告警工单升级工单意图识别识别告警分类,判定是否有精确匹配的诊断智能体。启动诊断将智能体返回结果同步至工单解决方案中。知识匹配没有匹配到诊断智能体的告警,通过标签或内容,寻找对应知识,并将总结内容和知识链接同步到工单解决方案中。规则与模型结合:形成告警、派单、处置全自动的一站式响应机制。规则与模型结合:形成告警、派单、处置全自动的一站式响应机制。GOPS全球运维大会暨研运数智化技术峰会2025·上海站协同处置型场景1:应急指挥智能体出现高等故障时自动进行初步排查,创建e钉群并同步呼叫值班诊断定界触发各个专业团队排障三板斧,快速分析诊断,将排查数据及分析结果推送至群内。决策处置根据诊断情况,推荐处置方案,自动申请操作账号、创建恢复任务等动作,审批后执行。GOPS全球运维大会暨研运数智化技术峰会2025·上海站GOPS全球运维大会暨研运数智化技术峰会2025·上海站协同处置型场景2:变更方案生成(文案生成)双智能体1、选择变更类型及对象3、选择数据填充工具2、匹配方案模版4、填充数据生成方案GOPS2025Shanghai1、输入变更方案3、检查变更要素2、匹配验证规则4、输出验证结果ANNIVERSARY2015-2025GOPS全球运维大会暨研运数智化技术峰会2025·上海站充分利用现有平台能力,快速迭代出自研运维智能体编排工具;有效提升现有工具使用率。增效打破经验和数据壁垒,全方位提升日常巡检、排障、变更、告警处置等运维工作效率。GOPS2025ShanghaiANNIVERSARY2015-2025快速赋能新进员工、一线团队及部门服务对象,价值衡量方式跨域处置一线处置成功率值班岗位处置率跨领域数据查询数量告警处置方案推荐率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026岚图区域市场岗位社会招聘备考题库带答案详解(综合卷)
- 2026甘肃兰州工业学院高层次人才引进98人备考题库(第一批)带答案详解(综合卷)
- 2026上海师范大学附属官渡实验学校招聘1人备考题库及答案详解【网校专用】
- 2026重庆奉节县教育事业单位招聘25人备考题库及完整答案详解1套
- 2026济钢集团招聘112人备考题库附参考答案详解(培优b卷)
- 2026黑龙江省大庆市“庆蓝优引·社会招引”市属学校人才招聘14人备考题库附答案详解(典型题)
- 2026新疆得仁水务发展有限公司市场化选聘公司及子公司管理人员6人备考题库及1套完整答案详解
- 2026福建福州职业技术学院诚聘高层次人才备考题库含答案详解(考试直接用)
- 2026年上半年长信保险经纪(四川)有限公司第二批人员招聘1人备考题库及答案详解(必刷)
- 2026福建泉州市晋江市社会组织综合党委招聘专职人员2人备考题库附答案详解(完整版)
- 《民营经济促进法》解读与案例分析课件
- 宠物疾病诊疗技术课件
- 2024年交通标志大全:课件详解
- 《监察法》教学大纲
- 意识形态分析研判制度
- 光伏板智能清扫机器人结构设计
- 2024年四川省绵阳市高考语文一诊试卷
- GB/T 43917.3-2024焊接烟尘捕集和分离设备第3部分:焊枪上烟尘吸气装置捕集效率的测定
- 建筑工程行业的建筑科技与科技创新
- 电源用导热有机硅灌封胶
- 2023年铜陵市社区工作者招聘考试真题
评论
0/150
提交评论