可视化智能IT运维系统统一运维大数据分析管理平台建设方案智慧运维大数据分析平台建设方案_第1页
可视化智能IT运维系统统一运维大数据分析管理平台建设方案智慧运维大数据分析平台建设方案_第2页
可视化智能IT运维系统统一运维大数据分析管理平台建设方案智慧运维大数据分析平台建设方案_第3页
可视化智能IT运维系统统一运维大数据分析管理平台建设方案智慧运维大数据分析平台建设方案_第4页
可视化智能IT运维系统统一运维大数据分析管理平台建设方案智慧运维大数据分析平台建设方案_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

可视化智能运维监控管理平台

信息系统健康守护使者

可视化分析&展现

提纲

现状与痛点&IT运维管理诉求

对未来IT运维的期待

智能化IT运维平台介绍

智能化IT运维平台带来的改变

可视化运维系统优势

案例分享六一

现状与痛点&IT运维管理诉求

客户场景之NIT资源管理

主机

数据库

中间件

动力环境

存储

网络设备

…..

用户体验管理

IT运维部门

业务部门

天花板

用户体验指标

用户访问响应时间

用户满意指数

系统吞吐量

系统错误率

用户来源地

系统需求执行时长

网络传输时长

数据库SQL执行时长

功能使用是否方便

系统访问是否缓慢

系统故障响应和排除是否及时

…..

现状与痛点:IT监控运维密室的内与外

业务应用

中间件

数据库

虚拟化

服务器

存储

网络

基础设施

密室之内痛

IT设备规模大且分散、管IT环境异构、业务系统繁人员能力层次不齐,服务理困难

范围广

缺少可视化管理&自动化

无法快速适应复杂环境设缺少规范的、自动的流程管理手段

备的监管

化管理

密室之外痛

业务负载逐年增加,无法确定功能完整可用

云技术的成熟,一定程度上减少了企业自建性

运维团队的需求

业务形态更加多种多样,部署环境愈加复杂

技术的快速演进,对运维团队提出了更高的

为了适应发展的需求,业务调整日趋频繁

要求

可视化对人类思维的重要性

人类思考的过程,就是

建立

思维“心灵没有意象就永远不能思考”-

Αριστοτλη

视图的过程

可视化

采用计算机技术,将数据和概念转化为图形,将复杂信息传递给受众,使其快速消化和理解。

可视化

利用人类眼睛通往心灵深处的广阔带宽优势,使人们能目睹、探索以至立即理解大量的信息。

可视化运维的特点

对未来IT运维的期待

应用场景

运维主管

资源总览

运行统计

容量规划

应用系统运维工程师

流程优化

性能监测

健康检查

自动巡检

业绩考核

决策分析

IT基础设施运维工程师

设备监管

瓶颈定位

故障处理

根源分析

用户体验

预测分析

业务系统

流量分析

运行报告

告警通知

数据中心

对智能化IT监控运维的期待(岗位)

战略决策支撑数据

部门运转分析支撑数据

业务优化支撑数据

SLA遵守情况

工作量统计

持续优化的支撑数据

配置/资产管理

业务可用性

流程运转情况

运维

主管

故障预测/主动预警

故障快照/自动处理

应用性能监控预警

运维知识库

IT设施自动巡检

故障精准定位

IT运维

工程师

应用体验分析

应用运维

工程师

应用潜在风险预测

应用可用性巡检

对智能化IT监控运维的期待(管理)

智能管理方式

传统管理方式

一体化

信息展现

离散

信息处理

人工

信息提取

信息

信息采集

被动

E更好地进行业务保障

业务的稳定性、可靠性要求越来越高,业务系统对IT支撑的依赖性越来越强。

S切实地提高服务质量

IT架构的复杂度不断加深;IT运维部门工作职责越来越重

V真正地降低系统风险

IT运维人员不足难以应对繁重的运维要求;IT事故将直接影响业务,责任重大

对智能化IT监控运维的期待(效果)

可视

运维可视化展示

运维大数据分析

运维门户

协作

服务流程管理

运维即时协同

远程桌面协助

运维知识库

度量中心

流程中心

配置管理

资产管理

监控中心

智能

资源集中监控

网络/应用拓扑应用性能监控

应用体验分析

操作中心

自动

业务系统自动巡检

应用自动交付部署

基础设施自动体检

智能化IT运维平台介绍

智能化IT监控运维平台技术架构

自动化巡检平台

业务巡检

自动盲检

巡检定义

巡检调度

巡检告警

巡检报告

统一访问门户Paladin统一用户管理

应用性能监控模块

统一配置管理

统一权限管理

统一菜单管理

机器数据分析

大屏展示系统

三维仿真

运维管理

JAVA应用

.Net应用

PHP应用

应用性能分析

预测

分析

用户体验监控

代码级监控

安全合规

业务分析

事件管理

工单管理

IT基础设施监控模块

操作系统监控

网络设备监控

基础设施监控模块

数据库监控

应用中间件监控

存储设备监控

网络拓扑展现

应用拓扑展现

采集策略框架

告警通知框架

统计分析报表

问题管理

配置管理

变更管理

基础设施巡检

基础设施

巡检

容量状况

巡检

性能状况

巡检

信息安全

巡检

容量管理

计算

规划

分析

推荐及模拟

第三方

监控系统

能耗管理

PUEWUE能耗可视化

节能策略

发布管理

消防报警

气体消防

消防喷淋

多功能

电量仪

ATS发电

机组

UPS蓄电池

PDU制

冷机

精密新风漏冷

冷塔

空调

排风

温湿度

CO2

微环境

视入全

频门侵防

监禁

报护

排班管理

知识库管理

IT资产管理系统

资产模型维护

出入库与分发

资产统计分析

资产配置变更

配置管理

资产申请

资产盘点

变更管理

资产规划

变更管理

配置更新

配置审计

配置模型维护

资源分配

维保管理

库存管理

报废管理

配置统计分析

配置管理

智能化IT监控运维平台逻辑功能

应用系统自动化测试

凌乱的测试任务和报告

难于管理庞大的配置文件

自动化测试,从目标系统真实操作环境中创建测试用例,有效降低开发和测试成本。

可视化用例录制,轻松录制创建测试用例。

高昂的日常维护成本

低效地手动构造测试数据

繁重的环境搭建工作

参数化测试数据,保证测试覆盖度。

零编码断言配置,配置选项方式设置断言。

无污染事务提交,自动清理测试过程垃圾数据。

自动化测试任务,自动化执行定制测试任务。

通过自动化测试手段来有效提高开发效率和降低测试成本

接口测试

边界测试

回归测试

冒烟测试

覆盖率测试

恢复测试

安全测试

压力测试

性能测试

部署测试

系统测试

确认测试准则

配置评审

A/B测试

图形化测试报告,按需发布测试报告。

单元测试

集成测试

确认测试

网络拓扑及流量追踪

网络拓扑手动设置

拓扑自动发现及故障预警基于ICMP(ping)、CDP、LLDP以及SNMP协议的网络自动发现

Request监管Response流量分析

设Syslog备

Trap基于SNMP(MIB)协议的网络设备监控

数据中心资源

网络设备监控

IT软硬件资源监控

从动环基础设施—>IT基础设施硬件—>数据库中间件—>自定义脚本,快速满足不同客户实际的IT监控需求

IT运维工程师

基础设施监控

采集周期:1min采集周期:2min采集周期:3minCSSPluginPlatformCSSPluginPlatformCSSPluginPlatformSNMP/ModbusSNMPSNMP/SMI-SSNMPHypervisorAdaptorJMX/JDBCRest/WebserviceHypervisor动力环境

PDUUPSATS空调

服务器

WindowsLinuxSolarisAIX存储

NetAPP

EMC

网络

防火墙

负载均衡

路由器

交换机

虚拟化

中间件

应用

新资源

插件开发支持新类型资源监控

XenServerVmwareKVMXENRHEVPowerVM

数据库(DB2、MySQL、

行业应用

Oracle、SqlServer)

第三方应用

应用服务器(Tomcat、WebSphere、Weblogic、JBoss)

消息中间件(ActiveMQ)业务应用性能监控

一站解决应用性能管理问题

全面监控核心业务,实现自动化的业务系统异常监控、风险检测,以及应用性能优化。

应用系统健康体检

业务状态分析

业务流程巡检

巡检脚本录制

巡检脚本导入

交互数据管理

业务流程执行

业务可用性

客户端性能分析

僵尸门户监测

敏感词监测

坏死链检查

业务可用性体检

业务检查点设置

巡检流程编排

移动应用巡检

安装启动监测

巡检脚本录制

兼容性适配

跨设备巡检执行

应用安全分析

系统状态报告

系统日志分析

系统遍历巡检

遍历规则配置

标准遍历执行

遍历检查项设置

深度遍历执行

业务办理量分析

主机访问量分析

HTTP请求分析

业务跳出率分析

区域用户量分析

安全合规检查

预处理建立关实时联模型

操作系统-日志

业务应用系统

采集处理

即席统数实查计时仪询

报据表

挖掘

告表警

日志数据分析平台

实时中间件数据库

采集处理

索引存储PB级日志数据管理能力

实时基于业务系统的多层次机器数据,采集实现完善的安全合规审计保障

操作系统

处理

定期安全审计

自动化威胁检查

网络攻击分析

告警分析

页面告警

邮件告警

短信告警

微信告警

声音告警

应用故障根源分析

根据请求自动拓扑

可用并发连接数

HTTP线程池

性能

用户会话

设置告警策略

应用发生故障告警

故障分析模型

实际故障点

故障定位

故障分析算法

分析结果

通知

页面告警

短信

邮件

应用故障快速定位

应用访问预测分析

业务价值:变被动解决风险告警为主动发现预防,提前规避问题及风险。

历史|实时|未来

未来负载变化趋势预测

潜在风险及问题分析定位

应用

性能

计算

存储

网络

资源配置策略预测分析

容量分析性能分析趋势分析可靠性分析流量分析数据透视与分析功能总览流量分析从互联网出口流量、网域间流量、业务流量等不同维度对数据通信流量进行统计,设置平均数据流量、累计数据流量、超限次数、超限时长等指标,评估当前链路及业务流量负载,并预测未来流量变化趋势,进行总出口流量分析,对外通道流量分析。根据不同存储对象的容量空间、使用情况以及变化趋势,预测未来的容量需求,为用户对数据的存档整理和存储扩容提供决策依据。容量分析1、磁盘容量分析2、数据库容量分析3、文件系统容量分析4、内存容量分析。。。对业务系统下的端口带宽利用率、服务器的CPU平均利用率、I/O读写速率、内存利用率、内存页交换速率、网络收发包率等26项重要性能指标进行TopN的对比分析,帮助用户确认所需重点关注的设备和基础架构的性能瓶颈,预测OLT等工作质量,收发信号强度预测ONU链路质量。通过分析历史数据的周期变化和运行趋势,预测设备未来的性能消耗曲线,为整个业务系统的优化、升级、扩容等提供有效的理论依据。性能分析趋势分析对前端设备(例如网络摄像机)运行状态进行趋势分析,根据设备负载、运行状态指标、流量数据等,通过分析历史数据的周期变化和运行趋势,提炼规律,提供决策辅助。

从设备、网络、数据库、业务等多个维度分析服务的可用性及故障率,预测未来发生故障的概率,为用户制定的升级、报废、备份等策略提供决策依据。可靠性分析可视化分析&展现

监控大屏展示面向决策者的领导全局视图四

智能化IT运维平台带来的改变

从分散粗放到统一精细

不同类型资源不同单一管理工具

操作系统

网络流量

vCenterNagios流量分析

Cacti虚拟化监控

PRTG自身管理端

硬件监控

Zabbix存储监控

……

……

统一展现

统一策略

统一告警

统一操作

一体化集中平台

AgentSNMPSNMP/SMI-SSNMPSDKJMX/CLIJDBC协议

Hypervisor服务器

存储

网络

虚拟化

中间件

数据库

新资源

业务聚合指标实现故障根源追踪

负载

设备

形成业务拓扑

中间件

业务weblogic发现业务异常

应用响应时间突然增大

Appwebear2webear1webserver数据库

主机

App-host网卡

NIC1磁盘

/opt/data交换机

端口

G/0/2serverApp追踪故障根源

进程

java被动告警到主动式巡检

负载

设备

中间件

业务巡检

硬件巡检

serverAppApp数据库

自动巡检

进程

磁盘

交换机

主机

网卡

端口

发现问题

告警通知

业务拓扑钻取

智能故障分析

快速修复

解决告警

业务可用性自动巡检保障、追溯故障影响范围

重复运维工作自动化

枯燥、重复、不及时运维工作

提取脚本

发送邮件.sh清理磁盘.sh重启服务.sh关闭服务.sh数据备份.sh…….

任务

自动巡检

计划报表

计划维护

计划备份

…….

自动化

触发器

传统监控转向智能分析

IT监控

操作系统磁盘使用率过高

服务器磁盘损坏

数据库表空间使用率过高

交换机端口流量异常

虚拟化资源池容量不足

HDFS磁盘使用率不足

…….

应用性能监控

请求响应时间过长

SQL执行时间过长

代码执行效率低下

系统软件配置失当

…….

硬件故障率分析

虚拟化资源池分析

服务器性能分析

Top服务器硬盘故障分析

Top剩余量存储分析

TopCPU使用率机器分析

Top服务器电源故障分析

Top停机时长vm分析

Top存储控制器故障分析

Top磁盘消耗vm分析

Top内存使用率机器分析Top磁盘使用率机器分析

Top存储硬盘故障分析

Top磁盘日均增长vm分析

Top磁盘读写效率vm分析Top性能故障告警分析

Top内存使用vm分析

Top磁盘读写速率分析

数据库性能分析

网络流量分析

Top表空间剩余量分析

Top会话流量排行分析

TopSQL性能分析

Top源IP流量排行分析

Top缓存命中率分析

Top源端口流量排行分析

Top日志日均增长分析

Top目标IP流量排行分析

Top磁盘读写速率分析

Top目标端口流量排行分析

Top协议流量排行分析

提升运维能力积累

针对不同资源(服务器性能、硬件健康、日志状态、日志关键字、进程性能、数据库性能等)的告警处理,通过知识

库可以实现运维方案的知识积累,方便知识的传递与故障的快速解决。

提升故障处理效率

知识积累

知识共享

知识转化

告警事件

告警资源

告警时间

告警类别

原因分析

处理方案

处理结果

处理人

知识关键字

附件信息

总结

智能化

构建智能化运维体系

预防

查找潜在风险,提供预防策略

以大数据分析能力支撑的智能化IT监控运维平台

预测

构建模型,预测未来趋势

分析

分析历史数据辅助根源问题分析

一体化

统计

整合历史监控数据,辅助IT系统综合管理

效率提升

机器数据分析

监控

监控当前IT系统整体运行状态

支撑运维智能化升级

传统

ITSM、

APM、

NPM、

SOC、

CloudManagement五

可视化运维系统优势

可视化平台建设

S采用国内外先进的虚拟现实三维动态仿真技术,具有适用性强、操作简单、功能强大、高度可视化、高度仿真等特点,已成功应用于政府机关大楼、IDC数据中心、现代化农业产业区、灾备机房数据中心、通讯基站联网监控、气象基站联网监控、电力变电站联网监控等行业领域,以极高的性能,完美的用户体验和数据展示获得客户的高度肯定。

标准化管理标准化管理。以国际上通用的ITIL管理、ITSS、ISO20000质量管理体系为标准,通过构建标准化IT服务管理体系,促进运维工作高效展开。推动运维工作流程规范化,提升工作效率。建立知识共享机制和主动查询、关联,为系统管理人员开展运维工作提供便利。友好的展示界面视图在一个平台上,把物理层、数据层、应用层、用户层所关注的监控对象和监控指标进行统一管理和展示,对告警信息进行统一处理、综合呈现,能够有效提高事件管理水平。智能化自动化机房值班管理电子化。便于后续管理及查询。范围包括但不限于目前的早晚班工作内容列表、交接班记录、会员签到等功能。巡检盘点电子化,对所有生产设备进行唯一标识,通过手机APP扫描等方式自动核验资产信息,记录巡检、盘点过程。事件自动提醒。事件工单按照预定义流程进行流转,由服务台、一线运维、二线运维、三线运维等角色人员处理,系统将事件通知以短信、邮件或桌面等方式发送处理人,提醒及时处理。系统可对工单流转的全过程进行监控和考核。知识库积累。完成对事件的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论