




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
OneAPM智能运维平台解决方案 用人工智能点亮您的IT数据 2 议题 3 议题 4 当前运维和业务团队面临的困境 不是没有数据 而是数据太多不是不想分析 而是无从下手 5 从人工到人工智能 挖掘海量数据的业务价值统一大数据分布式处理技术智能算法与机器学习业务系统将要发生什么 主动响应的预防预测性管理 降低系统低效对业务的影响多种分散独立监控工具专业化专家型人才业务系统已经发生了什么 被动响应的故障恢复性管理 人工运维 AIOps 6 什么是AIOps AIOps 即基于人工智能的IT运维 ArtificialIntelligenceforITOperations 是由Gartner定义的IT运维管理新类别 AIOps将服务管理 性能监测 自动化结合在一起 以实现持续洞察和改进的目标 并由大数据和机器学习技术进行支撑 机器学习 大数据 平台 AIOps 商业价值 监测 观察 服务管理 交互 自动化 行动 FromGartner sReport 7 AIOps的四个核心能力 对海量数据进行高效访问 8 AIOps的技术栈 可视化 机器学习 算法 分析 计算 大数据 数据源 事件 日志 监控 工单 任务 全量 海量 多样性 复杂性IT数据 集中统一管理 历史数据存储 实时数据存储 数据建模 模式识别 趋势识别 故障隔离 智能化选择 异常检测 异常定位 根因分析 算法自我修改演进 新算法创建 多维度 个性化 角色化 场景化展示 数据清洗 去重 过滤 关联 生成新数据 9 AIOps的核心价值 故障发现 故障规避 故障止损 故障修复 异常检测 异常定位 根因分析 异常预测 10 AIOps将在5 10年内成为ITOM的主流技术 FromGartner sReport 11 议题 2 用人工智能点亮您的IT数据 12 OneAPM智能运维平台解决方案 服务器数据 存储数据 网络数据 应用数据 用户体验数据 流量数据 日志数据 交易数据 任意IT数据 OneAPMAIOps 大数据实时多维分析 机器学习 大规模事务处理 海量数据实时接入 服务分析 深度挖掘 场景可视化 多维指标告警 数据建模 13 OneAPM智能运维平台的五个能力层次 发现接入 存储整合 梳理关联 智能分析 多维展示 从哪里来 到哪里去 IT数据 14 全栈IT数据发现与接入篇 15 全栈IT数据的采集范围 监控对象 采集数据 IT系统 客户端 数据库 虚拟化 中间件 SaaS 传统架构 业务层 应用软件层 基础设施层 业务系统 云架构 硬件设备 PaaS IaaS 交易 业务流程 浏览器 移动APP 应用 微服务 应用代码 数据库服务 中间件服务 网络流量包 日志 虚拟化 网络 主机 机房环境 交易量交易金额交易成功率 页面加载时间浏览器类型用户IP页面加载错误率CDN质量应用响应时间应用吞吐量应用错误率单个服务响应时间单个服务吞吐量单个服务错误率 交易错误率交易处理时间 APP页面响应时间APP崩溃率APP网络请求时间APPH5页面性能JVM内存利用率服务器时延SQL语句执行时间连接池数量缓冲区命中率告警 虚拟机数量主机数量CPU利用率内存利用率丢包率平均建链时间 网络流量磁盘可用容量电源处理器配置项 业务逻辑 IT资产库 CMDB 16 全栈IT数据的采集方式 IT数据 SNMP IPMI WMI SMI S JMX GlassFish JDBC SSH Telnet等 Java Net PHP Python Ruby Node js Andriod iOS等 Rsyslog NXlog Kafka SDK RestfulAPI等 SFLOW NETFLOW IPFIX SPAN RSPAN ERSPAN等 StatsD WebService JSON等 URL Host Port HTTP RTSP RTMP等 17 IT数据采集方式的选择 18 与已有ITOM工具的对接 JDBC SNMPTRAP WebService OneAPMAIOps 19 海量数据处理与存储篇 20 海量IT数据处理的挑战 数据规模 高并发总量大种类多样格式各异 毫秒级延时秒级处理响应逻辑复杂 实效 21 海量IT数据处理平台 指标 交易 详情 指标 事件 历史大数据服务 API网关 搜索服务 消息服务 交易关联 拼接服务 异常检测服务等 历史数据处理 实时数据处理 数据采集器 数据采集器 数据采集器 指标 事件 日志 交易 详情 流量 业务交易 指标 告警 详情 时间序列实时数据服务 指标 事件 日志 交易 详情 流量 业务交易 指标 告警 详情 数据接入 数据处理 数据存储 开发 运维 业务 22 海量IT数据处理平台的能力 OneAPMAIOps 实时数据管理Streamingdatamanagement 历史数据管理Historicaldatamanagement 指标数据管理Metricdataingestion 文本数据管理Documenttextingestion 日志数据管理Logdataingestion 流量数据管理Wiredataingestion 通过NLP 自然语言处理 技术 对人类可读文档进行解析 从网络上直接捕获的数据包 兼容多种网络协议 任何软硬件设备生成的日志数据 并为访问分析建立索引 对实时数据进行标准化和索引化 以时间尺度实时展示数据 吸纳海量多样化历史数据 并进行索引和持久存储 直接捕获和使用数值型数据 例如时间序列数据 23 IT数据梳理与关联篇 24 通过数据模型 DataModule 梳理IT数据 CPU利用率 数据库服务错误数 数据库服务请求数 数据库平均响应时间 数据库死锁率 内存空闲率 存储空闲率 数据库连接池利用率 数据库服务健康指数 JDBC SNMP 数据库实例 操作系统 主机 应用 指标及阈值 接口 协议 依赖关系 拓扑 数据模型DataModule 25 开箱即用的数据模型和自定义扩展 应用服务器 关系型数据库 存储 操作系统 Web服务器 虚拟化 应用性能管理 用户体验管理 开箱即用 扩展 自定义 新增指标及阈值 新增接口 协议 修改依赖关系 拓扑 自定义指标及阈值 自定义接口 协议 自定义依赖关系 拓扑 数据模型DataModule 26 深度挖掘多个指标对于服务质量的影响 服务分析 深度挖掘 27 如何从IT数据中获得洞察 人工智能算法与分析篇 28 结合领域知识的人工智能算法 人工智能算法 聚类 决策树 随机森林 卷积神经网络 运维领域知识 异常检测 多维分析 根因分析 故障预测 行业运维经验 金融 运营商 互联网 政府 大型企业 AIOps 29 OneAPM人工智能算法与分析平台 基础数据层 机器学习算法层 RMDB 事件 指标 日志 工单 作业 监控 MQ NoSQL TSDB HDFS MPPDB ARIMA 卡尔曼 时序数据分解 Holt Winters 奇异谱变换 SST DiD DBSCAN Pearson关联分析 J Measure Two sampletest Apriori FP Growth 分类 聚类 决策树 逻辑回归 DNN CNN LSTM RNN NLP AIOps算法层 指标分布预测 指标聚类 KPI联动分析 KPI事件关联 日志事件序列提取 日志事件模板提取 技术能力层 数据源异常标记 单指标异常检测 多指标异常检测 关联分析 故障拓扑图 故障树 根因分析 调用链 告警压缩 单故障止损 灰度版本止损 配置优化 成本分析 容量规划 资源调度 发现问题 定位问题 解决问题 其他 应用层 自适应异常检测 多维异常问题定位 故障根因分析 异常预测 30 什么是KPI异常检测 KPI KeyPerformanceIndicator 用于反映服务的健康程度 如 服务请求数 拒绝数 响应时间 流 订单等如 服务CPU 内存 络 磁盘等KPI异常行为 潜在的风险 故障 bugs 攻击 KPI异常检测 用于识别KPI时序曲线上的异常行为 及早发现风险 防止其发展为故障及时发现故障 进行止损 诊断和修复运维的重要基础 31 OneAPM自适应KPI异常检测的特点 普适性检测算法 动态基带算法 适用更多不同特点曲线 基于迁移算法学习 自动适配场景变化 依据反馈 对算法和参数进行优选 减少人工干预 对比14种常用检测算法 准确度排名第一 算法自我容错 场景动态适配 异常精准检测 32 OneAPM自适应KPI异常检测结果展示 某大型互联网公司的KPI检测效果 33 什么是多维分析 交易时间 失败率 闪退率 销售额 订单数 PV 转化率 用户数 用户增速 留存率 投诉率 运营商 省份 城市 移动设备类型 软件版本号 移动端模块 浏览器版本 无线网络参数 服务器端模块 后台负载 用户年龄 用户性别 发现业务 关键指标KPI 瓶颈 为正确决策提供依据 例 响应时间 在什么条件下会慢 34 OneAPM多维异常问题分析的特点 自动识别瓶颈条件 基于决策树分析 从大量多维度数据中 自动确定影响属性 基于历史数据的AB测试 在历史数据中对比实验组和对照组的性能差别 预测可能的优化方案效果 预测优化效果 便捷的可视化系统 人员可对过程和结果进行核对 排除可能的干扰数据 重新分析 得到正确结果 过程和结果可视化 35 OneAPM多维异常问题分析结果展示 36 如何从IT数据中获得洞察 多维数据场景展示篇 37 面向场景的多维数据分析和可视化 场景化和可视化封装 什么人什么时间什么问题如何处理 38 面向不同场景的多维仪表盘 39 面向不同场景的多维指标告警 40 面向不同人员的场景可视化示例 41 OneAPM智能运维平台解决方案的特点 AllITData OneAnalyticsPlatform MoreIntelligence 42 议题 3 迈出AIOps的第一步 43 如果您认同以下问题 那么AIOps将非常适合您 您已在使用一些运维工具 但它们分散独立 您总是需要在不同工具间来回操作您期望在更短的时间 如 30分钟 内定位故障发生根因您期望拥有自己的工作台 将职责范围内的信息聚焦在一个界面您总被不准确的告警信息所干扰 急切希望提升告警的准确度您觉得您的应用系统存在优化空间 却找不到优化的切入点您期望在故障发生前尽早发现系统潜在问题您期望能灵活的生成工作报表 并通过炫酷的大屏幕展示IT运维成果您期望通过更加智能便捷的工具 代替日常繁琐重复的基础工作 44 自上而下的方法解决自下而上的问题 要监控的服
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高科技果园综合管理服务及品牌授权合同
- 2025年度工业智能化升级综合能源供应合同
- 2025年新型互动广告创意策划与执行合同
- 2025高端商务办公楼智能化系统集成与装饰装修工程合同
- 2025年环保型电动车电池包定制研发与采购合同
- 2025年环保技术研发项目贷款担保协议范本
- 商业地产项目2025年城市综合体技术创新研究报告
- 医院信息化建设2025年电子病历系统与患者健康档案融合报告
- 绿色装配式木结构建筑项目在建筑节能中的应用与效果研究报告
- 生物质能源在分布式能源系统中的生物质气化技术应用报告
- TCTBA 005-2024 TCECA-G 0326-2024 合同能源管理招标规范 轨道交通
- 中国职业教育发展前景
- 中小企业数字化转型路径与实施指南
- 上海市闵行区2024-2025学年八年级上学期期末语文试题(含答案)
- 2025-2030年中国石灰行业运营动态及发展策略分析报告
- 2024年中级会计师《中级会计实务》《财务管理》《经济法》真题及答案解析【完整版】
- 2025年成都东部集团有限公司招聘笔试参考题库含答案解析
- 《水产品加工车间设计标准》
- 废铅酸蓄电池回收处置项目可行性研究报告立项计划书
- 《网络传播概论》考试复习题库(重点160题)
- AO 史密斯热水器EES系列说明书
评论
0/150
提交评论