版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
从架构到场景:基于大模型的智能运维实践2025.6.272025.6.27 汇报人联想罗进目目录联想智能云智能运维发展历程2017-未来云化+智能化2005-2016服务导向,以客户为中心一全球化+数字化服务导向,以客户为中心一1998-2004信息化1998-2004信息化应用平台基础架构————————————————运维管理“双态”IT混合云运维架构支持全球双态业务发展mm稳态敏态联想关键业务系统 电子商务销售及市场供应链服务财税/法务/HR产品开发产品生命周期联想官网记账服务交付配件管理合同管理订单履行排产管理排产PC产品包新联想官网成本管理中国区电商采购流水线管理DCG生产制造服务交付服务器产品供给销售订单PCSD生产制造租用税务服务电商mm稳态敏态联想关键业务系统 电子商务销售及市场供应链服务财税/法务/HR产品开发产品生命周期联想官网记账服务交付配件管理合同管理订单履行排产管理排产PC产品包新联想官网成本管理中国区电商采购流水线管理DCG生产制造服务交付服务器产品供给销售订单PCSD生产制造租用税务服务电商合规折扣管理MBG服务交付市场管理服务供应链供应商集合统一运维管理与支持跨云安全网络连接业务单元ITISV应用开发ISV应用开发系统负责人运维人员运维人员基础架构运维负责人自开发应用开发运维人员敏态运维速度,灵活,迭代统一服务门户快速交付快速部署DevOpsAPM/云原生监控运维管理人员稳态运维可靠,安全,准确端到端自服务联想的智能运维演进路线以客户为中心智能化转型服务导向AIforall标准化运维脚本编辑,人工执行•统一技术标准,降低操作复杂性•自服务,提高客户体验和交付效率•减少工作量和人为错误使用多个独立工具快速响应快速诊断DevOps自动化工具链运维服务化运维大数据数据驱动运维运维数据挖掘运维大数据自动化工具链系统数字化可视化智能化运维AIOps智能分析自动化运维平台认知交互大模型驱动的智能运维•集成孤立的运维数据,基于数据分析和洞察来持续优化运维操作•数据驱动决策数据驱动•云底座增强基础设施的弹性、恢复和智能能力•端到端的全栈智能•AI赋能主动运维AIOps大模型驱动的智能运维架构智能运维整体架构服务目录管理中心租户管理产品管理授权管理权限管理通知管理审计日志统一IT服务门户单据管理在线报障单据管理智能可视化平台审批中心自动化平台(AWP)补丁管理日常配置巡检中心备份&恢复资源&认证管理知识查询知识ITSM平台工作台场景集市数据源管理低代码引擎页面管理可观测性平台(Hubble)运维数据湖平台故障管理变更管理问题管理服务请求任务管理知识库管理数据管理数字体验监控数据管理数据洞察应用性能监控数据洞察数据模型管理统一数据模型管理数据存储基础设施监控数据存储……文件中心管理……脚本管理编排管理RPA日志监控监控&告警集成数据抽取数据访问录屏审计设备远程安全访问流程管理密码管理服务SLA管理CMDB配置信息建模自动发现配置项数据管理数据集成及调和数据质量管理资产生命周期管理数据中心管理DCIM数据中心设备管理3D数据中心数据中心监控告警数据中心运维流程数据中心运营报表通用算力AI算力信创公有云HPC大模型驱动智能可观测性智能IT服务管理智能运营驾驶舱智能运维自动化智能运营驾驶舱…逐步升级判别式AI驱动异常检测根因分析容量预测告警降噪…边缘业务价值全栈监控、智能监控&告警,及时主动运维自动化、标准化和智能化的运行与维护,效率提高70%基于判别式AI的智能分析平台联想智能分析平台(AIAnalysis)基于判别式AI技术,旨在为联想智能云(LenovoxCloud)AIOps产品提供传统算法服务支持,涵盖算法及模型管理AIOps分析服务算法及模型管理服务目录服务编排数据准备故障预测服务目录服务编排数据准备故障预测度优化关联关系分析数据库资源调度优化成本控制根因分析告警压缩异常检测设备资源优化磁盘异常预测趋势异常检测智能扩缩容成本预测容量预测构建模型通用操作分析服务构建模型训练训练&调优指标数据分析事件单据分析故障知识图谱健康度分析日志解析…部署&部署&管理时序数据预测文本语义分析时序数据预测文本语义分析文本实体识别降维压缩分类聚类…算法框架智能运维领域专利10+LenovoxSpark–基于大模型的IT运营智能体平台联想智小星(LenovoxSpark)是基于生成式AI的IT运营智能体,可嵌入或集成AIOps产品中。全面提升IT运维效率和用户交互体验。运维脚本生成运维脚本生成异常分析总结知识自动生成数据报告智能生成…整合企业IT运营知识和工具,为企业提供一体化的智能运营解决方案保障数据安全•支持内部部署,确保企业数据安全•与第三方系统开放式集成提升运营效率根因分析效率提升运维研发效能任务执行效率41%IT运营智能体集任务自动化执行工作流编排IT运营工具集成基于领域知识的智能问答IT运营知识库集成工具调用(MCP)多模型管理集成提示词工程代码生成xSpark你通义开源大模型大模型内置集成,开箱即用Lenovoxcloud行业运维应用集成支持,简单配置高级配置(API、Python)运维工具库内置集成,开箱即用Lenovoxcloud行业知识管理产品集成支持,简单配置客户自研产品高级配置(文件、API导入)运维知识库典型业务场景与AI落地成果智能运维场景洞察-Gartner•结合大模型技术,应更多关注对运维自动化平台(AWP)智能组件智能识图异常检测智能巡检智能提单智能编排智能派单智能主题健康度分析故障解决推荐开发助手自动数据总结告警压缩异常登录识别问题解决推荐对话式分析容量预测故障自愈故障智能分析 运维数据湖(OpsDataLake)故障自愈变更风险分析智能查询助手根因分析知识查重解决推荐知识图谱数据洞察运维自动化平台(AWP)智能组件智能识图异常检测智能巡检智能提单智能编排智能派单智能主题健康度分析故障解决推荐开发助手自动数据总结告警压缩异常登录识别问题解决推荐对话式分析容量预测故障自愈故障智能分析 运维数据湖(OpsDataLake)故障自愈变更风险分析智能查询助手根因分析知识查重解决推荐知识图谱数据洞察关联关系推荐智能拓扑资产智能规划智能数据治理资源数据洞察设备上架推荐DC运维助手设备规划与预警巡检路线规划温湿度预测联想智能云(LenovoxCloud)AIOps秉承“AIasaService,AIEverywhere”的理念,全面整合判别式AI和生成式AI算法,提升智能运维大模型驱动大模型驱动判别式AI领域知识助手统一服务门户智能运维助手开发助手任务执行助手知识助手异常检测回归算法聚类算法开发助手任务执行助手知识助手异常检测回归算法聚类算法时间序列预测关联分析文本处理……故障解决方案推荐解决方案解决方案日志智能分析监控告警分析与解决推荐痛点及挑战•传统的事件诊断通常严重依赖专家领域知识。•通常需要从各种来源提取不同的数据,导致在识别和解决问题日志智能分析监控告警分析与解决推荐痛点及挑战•传统的事件诊断通常严重依赖专家领域知识。•通常需要从各种来源提取不同的数据,导致在识别和解决问题输入信息故障单据告警单据……知识图谱知识图谱文本块 图片 数据解析器OCR布局分析切片…重排过滤上下文拼接重排过滤上下文拼接运维知识运维知识运维规范解决方案API解决方案解决方案解决方案•在常规运维任务执行中提高了22%的效率。工具获取记忆控制任务计划工具调用API执行结果返回痛点及挑战工具获取记忆控制任务计划工具调用API执行结果返回痛点及挑战•操作人员通常需要执行跨平台查询以满足一个简单的用户请求。……解决方案解决方案痛点及挑战•手动开发脚本大量占用人力开发资源。Code+Prompt操作脚本编写Code+LogCode+Prompt操作脚本编写Code+Log+Prompt运维代码助手deepseek代码解释代码解释代码生成代码生成代码优化代码优化日志分析日志分析解决建议智能可观测性解决方案解决方案痛点及挑战痛点及挑战•多样化且分散的监控工具,缺乏端到端的监控视图和自助监控。•多样化且分散的监控工具,缺乏端到端的监控视图和自助监控。•利用混合AI策略,涵盖事件事前、事中和事后不同阶段,提升运维处置告警收敛告警收敛↓监控工具基础设施监控云原生监控应用性能监控事前:健康度评估、指标趋势预测等辅助IT运营风险防控、容量预测辅助资源精准规划、IT运营成本控制,降低故障发生数量;事中:告警智能收敛及解决方案智能推荐等提升IT资源可观测性及告警效率,运维人员实时响应和处理,减少故障持续时间;事后:根因分析、故障定位、影响面分析等辅助运维人员深入了解问题根因,提升运维质量及效率。AIAIAI智能检测/预测AIAI告警自动化AIAI数据集成数据关联告警处理AIAI指标链路AIAIGADCBF运营数据智能分析解决方案解决方案痛点及挑战痛点及挑战•大量的数据分散在数据孤岛中,需要快速进行数据挖掘与展示,数据探索性分析数据分析数据数据探索性分析数据分析数据ETL通过拖拉拽配置方式,即可完成数据接入与建模。配置数据查询助手,自动生成查询SQL。仅需勾选字段,AI引擎自动推荐字段组合和聚合方式,并用合适的图表进行展示,快速构建图表。推荐图表加入备选后,可一键生成大屏。借助智能主题可进行配色、布局、边框元素的优化。基于决策式AI,对数据进行趋势、对比分析等。利用生成式AI,对话式交互,生成分析报告。智能运维场景演示实践经验分享和未来展望实践经验–工程落地和持续运营•提供统一入口、可扩展、可复用、可组装的一体化架构动一体化:包括体验一体化、数据一体化、架构一体数据一体化架构一体化体验一体化性数据一体化架构一体化体验一体化性验流程一体化实践经验–RAG挑战与解决方案解决方案文档处理文档切片和解析策略•循环定长切割方法无法保证文档语义完整性,导致后续检索不准确•表格数据采用HTML/CSV存储时,在小模型上下文有限场景下易导致数据串行、检索误差•使用分级标题分割策略切割长文档,确保语义完整性,优化检索精准度。•表格数据统一转JSON结构化存储,提升专有数据检索准确性。文本处理图片内容理解困难•图片涉及复杂运维信息(如日志截图、运维流程图难统一理解•解析图片所在上下文文本,并作为切片元数据存储•通过OCR识别图片文本,并利用VLEmbedding统一图片与文本语义空间,提升跨模态检索效果。检索用户问题质量差•由于用户问题质量问题如关联性差、指东问西等问题导致输出结果质量差•利用LLM优化用户问题,如生成2~3相似问题进行综合检索•设置问答对,•提供用户指南,培训提升用户prompt能力检索术语理解准确性差•单纯使用语义相似检索无法精准识别专有名词和专业术语•运维领域专有名词和专业术语检索准确性不足•开发一个针对运维专业术语和缩写的领域词汇表,作为全局知识,以提高模型在输入和检索中的理解能力•采用稀疏与稠密向量混合检索,辅以运维知识图谱增强专业术语识别和多文档关联检索能力检索多模态检索能力不足•模型对运维场景图片(如流程图、日志截图)的理解与检索精度有限•利用VLEmbedding模型结合图片元数据辅助,增强图片内容检索精确度,优化图片语义检索能力输出检索结果精度问题•单纯的语义排序不足以精准体现运维故障诊断所需知识关联性•故障诊断涉及跨文档知识,检索结果分散,难以综合输出•结合Rerank模型判断用户查询和知识文本关联程度•应用Small2Big策略,当召回知识分片时,结合分片前后的其他分片扩展上下文,确保运维故障诊断所需信息完整呈现•基于知识图谱对混合检索结果做多文档实体关系查询,形成完整闭环的运维知识输出输出敏感话题•对公司品牌、形象和高管话题的不准确回应可能导致危机•其他敏感话题易触发危机•设置敏感话题问答对,并具备检索最高优先级•在模型输入和输出阶段增加安全护栏机制实践经验–灵活应用小模型小模型在运维知识问答中的应用小模型在运维知识问答中的应用Coding小模型在自动化和数据分析领域的应用不同领域的不同领域的SLMMode
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三江学院《编译原理》2025-2026学年期末试卷
- 石家庄农林职业学院《模拟导游》2025-2026学年期末试卷
- 石家庄幼儿师范高等专科学校《环境与自然资源经济学》2025-2026学年期末试卷
- 上海师范大学《领导科学》2025-2026学年期末试卷
- 齐齐哈尔理工职业学院《电机学》2025-2026学年期末试卷
- 石家庄农林职业学院《金匮要略》2025-2026学年期末试卷
- 上海欧华职业技术学院《中西医结合外科学》2025-2026学年期末试卷
- 山西医科大学《涉外礼仪》2025-2026学年期末试卷
- 山西晋中理工学院《大学生劳动教育教程》2025-2026学年期末试卷
- 山西警官职业学院《当代英国概况》2025-2026学年期末试卷
- 食品生产通用卫生规范宣贯培训课件
- GB/T 25153-2010化工压力容器用磁浮子液位计
- GB/T 17614.1-2015工业过程控制系统用变送器第1部分:性能评定方法
- 《高等数学》练习题库
- 《大学信息技术》教学课件-大学信息技术第一章
- 肝性脑病的疾病查房课件
- 超声科晋升副高(正高)职称病例分析专题报告(超声诊断胎儿隔离肺病例分析)
- 参观监狱心得体会(10篇)精选
- DB32∕T 1005-2006 大中型泵站主机组检修技术规程
- 水利明渠土石方开挖及填筑施工组织设计方案
- 斩控式单相交流调压电路设计..
评论
0/150
提交评论