运维监控平台建设技术需求_第1页
运维监控平台建设技术需求_第2页
运维监控平台建设技术需求_第3页
免费预览已结束,剩余27页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、运维监控平台建设技术需求一、投标人要求1、投标人必须具有计算机信息系统集成二级或以上的 资质,具有履行合同所必需的设备和专业技术能力,投标时 提供相关证明文件。2、所投产品必须具有软件著作权,投标时提供相关证 明文件。3、投标人所投产品厂商须驻合肥或在合肥设有技术支 持能力的分支机构,具有一定的本地技术支持队伍,投标文 件中须附公司或分支机构证明。试运行期间投标方及原厂必 须驻场配合运维,根据招标方需求统计出具各种运维报告4 、投标人应就服务期内的所有服务项目分项报价,报 价项目包括设备费用、设备运输、安装费用和五年软、硬件 产品质保、升级和维护等。5、提供五年原厂商售后服务,供货时提供相关证

2、明文 件原件给采购人及采购中心。、建设需求:序号名 称技术参数需求1总体平台基于.NET或J2EE技术开要求发,可跨平台部署,系统支持多级 部署模式,以满足后期全省运维体 系大集中的需求。整个系统为一体化服务综合管理平台,要求所有功 能模块必须为同一丿商统一设计 规划开发而并非简单集成;系统采 用 SmartClient ( B/S 登陆、C/S 操作)或B/S技术架构,客户端免 维护,全中文管理界面。支持统一 Portal门户管理,需有完善的用户 管理功能,不同角色的用户拥有不 同的管理监控权限及相应界面, 所 见即所得,支持分级权限管理。系 统可以呈现不同管理视角,如:机 房试图、设备视图

3、及自定义视图 等。平台主要包括监控管理和运 维管理两大部分,其中:监控管理主要包括:网络系 统监控、服务器监控、操 作系统监控、数据库监 控、中间件监控、应用监控等。运维管理主要包括:IT资 产管理、配置管理、变更管理、事件管理、问题管 理、知识库管理、任务管 理等。平台软件应包括对100台服务 器、50台网络设备、50台安全设 备、20个数据库、20个中间件的 监控及相关功能,还包括应用可用 性监控(web/ftp/email 等)30 个节点。整个平台为一体化服务综 合管理平台,要求所有功能模块必 须为同一丿商统一设计规划开发 而并非简单集成;平台必须支持开 放接口及二次定制开发功能。2监

4、控管理1、监控管理总体要求监控管理要求必须实现省局 整个数据中心的IT基础设施全局 监控,包括网络系统监控、服务器 监控、操作系统监控、数据库监控、 中间件监控、应用监控等;监控采集需支持 SNMPSYSLOGTR JDBC TELNET SSH Age nt脚本等多种主 动轮询及被动接收方式,监控采集 过程要求必须不影响设备及业务 系统的正常运行;系统能够从多种 角度展现监控视图,包括网络拓 扑、设备分类展现、分不同区域关 联展现,从业务角度关联展现,机 房机架展现、服务器驾驶舱展现 等;告警管理支持性能告警管理、 关联告警分析、故障分析处理、告 警事件与服务流程工单联动触发、 统一报表展现

5、、系统管理、工具集 等模块;整个监控管理可方便、清 晰的展现整个IT系统的健康运行 状态和相应告警。2、网络系统监控网络系统监控主要对路由器、 交换机、防火墙、IDS/IPS/网闸等 设备进行监控和管理,实现网络拓 扑管理、网络性能管理、网络配置 管理、网络故障管理等功能,支持 主流网络和安全设备厂商。支持网络中可基于SNM协议的网络设备监控管理需实现网络 拓扑管理、网络性能管理、网络故 障管理、网络配置管理等。系统能 够统一进行用户全网拓扑展现,提 供全网网络设备性能监控、并提供 pi ng、tracert 、tel net、网络设 备配置文件自动定期备份等一系 列自动化管理手段。(1) 网

6、络拓扑视图支持网络节点的自动发现,网 络拓扑结构的自动生成及实时更 新。对于自动发现的网络设备的不 同平台的主机以不同的图标显示, 对于无法自动识别生产厂家及产 品类型的网络和主机设备,提供手 工方式加以定义;可方便、直观的定制网络监控 策略、发现过滤策略;提供网络物理拓扑图、逻辑分 类视图,各视图层次清晰,可编辑视图。(2) 网络性能管理可根据被管理的类型及其属 性,定时采集性能数据,如CPU利 用率、内存利用率、端口利用率、 端口错误率、端口丢包率、端口流 量,并将数据保存在数据库中供统 计、分析使用;对每一个被管理对名,可针对 不同的性能指标进行阈值设置,设 置阈值检查和告警,提供相应的

7、阈 值管理和溢出告警机制;支持对监 测阀值和监测平率的统一修改;网络性能数据要可保存到数 据库中,进行分析,统计和整理, 按照不同的时间粒度生成性能趋 势曲线,以直观的图形反映性能分 析的结果,能够监测网络设备的温 度、风扇、电源运转情况。(3) 网络故障管理可监控网络中发生的各种事件,对于不同的故障等级给予不同 的显示,可提供多种报警方式,如: 短信、电子邮件,声音,界面等。对网络流量异常情况进行监 控;支持对 STR VTP OSPF BGP等协议的分析和识别;支持对非法主机接入的自动 发现,并可发现MA(和口 IP的对应 情况及其连接的交换机和接口;支持对VLAN及所属VLAN设备 的管

8、理,能够直观的呈现网络中的 VLAN言息及其所属设备;能够定位广播风暴,具有对广 播风暴监控的功能,能够统计分析 广播风暴的根源设备;能够实时监测网络线路的丢 包;可按照预先设置,自动抑制重 复事件;对于故障点,能在管理视图中 以特定方式与正常节点加以区分, 并能依据故障的严重程度给予不同显示;可提供连通性故障定位功能, 对于故障事件能进行自动关联,给 出最直接的故障原因,帮助管理员 在最短的时间内解决问题;提供故 障诊断功能;对于发生的故障事件,可自动 进行统计汇总。(4)网络配置管理能够实现网络设备的配置文 件的备份和恢复;可以方便的对网 络设备的配置文件进行下载和上 传;能够自动发现上述

9、网络设备 的型号、IP地址列表、各接口列表、 CPU内存、硬盘,并可以自动更 新自动发现的结构;支持基于设备面板的管理,可 以在设备面板上真实、实时的显示 设备各端口连接状态和性能信息。3、服务器及操作系统监控支持IBM、HP小型机、主流PC服务器的监控和管理,包括 AIX、HP-UNIX LINUX windows 操作系统的监控和管理,同时也必须支持虚拟化主机的监控管理,包括物理 实体主机及虚机的性能指标。可基 于 SNMP syslog、ssh、telnet 等 多种米集指标方式。(1)服务器系统监控管理CPU性能管理:可监视系统CPU 利用率,可按照占用cpu勺情况给 出系统所运行的进

10、程列表;内存使用情况管理:可监视系 统内存的利用率以及虚拟内存的 使用率;硬盘利用情况管理:可显示硬 盘或磁盘阵列的使用率;可显示用 于文件读或写操作的磁盘I/O利用 率;系统进程管理:可实时监视系 统进程的运行状况,并能在系统进 程出现异常时给出告警;性能管理:可监控系统资源的实时变化,可设置门限值,当正监 测的系统性能参数达到门限时产 生报警,并可生成系统资源的历史 性能报表;(2)服务器系统文件系统管理 可实时监视文件系统空间的使用情况,并在文件系统达到一定 的阈值时给出告警。(3)服务器操作系统应用进程管 理监控应用系统进程的运行状 态,可在应用系统进程出现异常时 给出告警,并能在主要

11、用系统的进 程终止时给予自动重启该进程的 操作,同时发送告警到控制台;对关键进程占用系统资源的 情况进行管理;可实时检测应用系统的可用 性;可针对应用系统运行中生成 的记录文件进行监测,从而判断应 用中的重要错误、警告以及性能等问题;(4) 服务器操作系统运行日志管 理要求可自动对系统syslog日志内 容进行分析,判断系统中的重要错 误、警告以及性能等问题,并给出 相应的告警;对主机系统及其外设的硬件 故障可通过对其相应的故障日志 的分析,做出及时的告警;(5) 服务器硬件监测能够监测IBM、HP等服务器的 硬件状态,如温度、风扇和磁盘运 转情况,同时能够支持对常见 Vmware等虚拟机的监

12、测。4、数据库监控支持对系统中的ORACLESYBASE SQLSERVER DB2 MySQL 等主流数据库进行监控及管理。能 够数据库的实时性能运行状况、 各种性能指标进行监控,以保证数据 库的正常运作。(1)运行监控服务器实例的可用性,监控数 据库实例的状态,登陆的用户数等;空间监控:监控数据库表空 间、日志的使用情况,碎片情况, 超过指定阈值则报警;显示和过滤数据库告警信息 和数据库日志中的报警。(2)性能监控锁资源监控,对阻塞了其它会 话的锁进进行街区,以及监控可用 的锁;对数据库事务的监控,包括提 交的事务,回滚的事务百分比等;监控缓冲区,磁盘I/O等相关 的性能数据;监控数据库会

13、话的数量,包括 会话中当前活动和最近活动的 SQL 语句会话的资源消耗、会话等待的 事件,会话的锁活动等;可对正在执行的SQL进行扫描,分析出占资源较大的SQL吾句;监控数据库进程情况,包括进 程占CPU事件,内存大小。5、中间件及应用监控监控中间件及WEBHTTPFTP 关键的运行状态和性能。涉及的产 品 WEBLOGICTUXEDOWEBSPHERE MQ TOMCATJBOSS EXCHANGE(1) 可用性监控当中间件服务器实例或其他 被监控组件出现异常事件时报警;可集成中间件管理软件的管 理能力,可启动、关闭、锁和解锁 服务器,具有强制垃圾惧能力,创 建,优化和摧毁JDBC连接池,发

14、 布应用等功能;(2) 性能监控监控中间件服务器占用资源CPU内存占有情况;监控中间件应用服务器打开 连接数;监控中间件应用服务器Sockets 数;监控中间件应用服务器总交 易数;退出交易数和提交交易数;对中间件应用服务器JSP/SERVLE监控:最大执行时间, 平均执行时间,重新加载累计值, 重新加载累计值比率;对中间件应用服务器EJB的监 控:事务提交,回滚,事务命中;对监控中间件应用服务器连 接池的监控:当前活动,等待连接, 活动数,等待连接最高数,等待秒 数最高值。(3)应用监控支持 web、ftp、email等应用 的正常运行、连通性等监控管理(4)MQ监控支持对MQ工作状态的监测

15、。支持对MQ队列最大深度、队 列当前深度、每秒平均输入/输出 次数的监控支持对MQ通道状态、当前事 物个数、每秒平均接收发送字节的 监测6、存储系统监控能监测主流存储设备的状态 信息、磁盘状态、盘阵CACHE勺读 写命中率、盘阵通道状态、盘整内 I/O性能分布等。7、告警模块接受监测范围内的故障告警 信息,系统能自动接受来自系统自 动巡检和被管系统主动发出的告 警信号,并对告警事件进行过滤和 归类处理;支持告警定义、过滤、压缩、 关联、升级等多种告警处理方式;告警触发必须支持文字、声 音、短信等方式告警,需提供与短 信平台接口,并提供与用户现有短 信网关互通,实现告警手机触发功 能;确保告警的

16、高度准确性,提供故障信息的事件关联处理,避免重 复报警和误报,在发现系统异常 后,可以根据用户的设定发送报 警;需实现重要告警自动触发故障 事件管理流程工单下发功能。发现 被监测的监视项故障,系统可进行 重复检查验证,且可配置对故障的 检查验证次数。支持按照时段设置 预警和报警策略,可在非工作时间 报警。提供短信发送设备和通信卡, 5年服务期内满足每月1000条短 信发送容量。1、IT资产管理运维3管理建立配置管理信息库CMDB, 资产管理配置包括资产的范围、来 源、状态、资产责任人等配置属性, 使管理人员对整个数据中心的资 产状况有全面的了解,动态管理信 息系统内部的IT资产情况。可以 按照

17、用户的要求对资产进行分类 和统计。2、配置管理可以自动识别IT组件的类别、 厂商、功能,并识别IT组件之间 的关系,例如、连接关系、使用关 系、组成关系、涉及关系。支持对IT组件的完整生命周期 管理,具体包括:采购中,使用中, 维修中等。可按照IT业务应用的角度和 IT基础架构的角度,对IT组件进 行可视化管理。通过配置管理实现自动化的 将IT运维信息传递给指定的人员 角色和流程。通过配置管理可实现对IT组 件的故障历史信息、变更历史信 息、知识信息、发布信息、资产信 息、硬件配置信息、软件设置信息 的管理。IT组件可以由运维人员根据 需要进行设定。3、变更管理对变更审批和变更实施过程进 行正

18、确记录,并提供后续的审核和 历史信息统计。可按照变更的类型进行统计。合理定义变更的类别和优先 级,实现变更的高效执行和有效分 析统计。可以由用户申请产生变更请 求,在变更请求中记录变更申请 人、变更请求状态以及详细的信息 描述,包括实现变更必须完成的特 定活动,该变更对业务的影响程度 等。变更可按照严格的审批流程 进行,没有通过审批的变更请求, 能够自动禁止变更工单的派发。利用管理信息统计等手段对 流程的执行提供统计、分析和查询 等功能。4、事件管理事件的提父应具有通过监测 自动生成事件、用户通过 Web方式提父事件、管理员手动提父事件 三种方式。事件在提父后,系统可自动匹配知识库及以往同类事

19、件中的处 理过程,保证并提高事件的处理效 率。事件处理的基本工作流程应 该包括故障确认与记录、归类和初 步支持、故障调查与分析、解决故 障、关闭。对于复杂或重大故障, 解决故障的步骤多、过程相对复 杂,还要求提供更为灵活的工作流 程支持。事件记录至少包括以下内容: 事件编号(唯一性)、事件类别、 故障日期与时间、事件申告人信 息、事件记录人、事件描述、事件 紧急程度与处理优先级、事件状态 (待处理、处理中和终止)、相关 配置项、事件原因、事件解决方案、 配置变更情况、事件处理人员、解 决日期与时间、事件终止日期。事件管理信息应及时更新,经 过一定的分析、归纳和整理的过程 后形成针对该类事件的解

20、决方案, 便于指导以后事件的解决。设置明确的管理角色和执行 角色,完成事件的处理。可按照事件的持续时间、开始 时间、事件的类别等条件进行统 计。可根据流程状态、来源、类型、 摘要、责任角色、IT组件、持续时 间等条件对事件进行查询。支持即时报表和定时报表两 种形式,支持定时报表的后台处理 及报表生成后的通知功能。提供与其他系统的对外接口, 保证所有的事件均被有效地收集 和处理。定期生成事件报表,对一段时 间内的事件进行汇总,包括总的事 件统计、等待状态的事件统计、关 闭状态的事件统计、按角色分类的事件统计等事件管理流程支持通过对流 程的监测和KPI策略的设定,进行 事件管理流程的测量。5、问题管理及知识库管理提供图形

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论