河南农信招标技术规范书-revised-by-all-new_第1页
河南农信招标技术规范书-revised-by-all-new_第2页
河南农信招标技术规范书-revised-by-all-new_第3页
河南农信招标技术规范书-revised-by-all-new_第4页
河南农信招标技术规范书-revised-by-all-new_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据中心IT监控及运维管理平台建设项目招标技术需求书TIME\@"yyyy'年'M'月'd'日'"2015年2月28日 数据中心监控及IT运维管理平台建设项目招标技术需求书 第35页共36页目录TOC\o"1-3"\h\z1 项目目标和采购内容 41.1 项目目标 41.2 采购内容 42 IT监控管理平台技术要求 52.1 监控总体要求 52.2 监控平台管理要求 62.2.1 告警数据处理要求 62.2.2 监控展现要求 62.3 主机系统监控要求 72.4 存储监控要求 82.5 网络监控要求 122.6 服务器虚拟化监控要求 142.7 数据库监控要求 182.8 中间件监控要求 212.9 系统定制和配置能力要求 252.10 与其他系统的集成要求 252.11 易操作性和可维护性要求 253 IT运维管理平台技术要求 273.1 基本技术要求 273.2 服务台 273.3 事件管理 283.4 问题管理 283.5 变更管理 293.6 配置及资产管理(初步) 303.7 知识库管理 303.8 报表系统 313.9 与其他系统集成 313.10 系统定制和配置能力 314 软件实施与集成服务要求 334.1 服务内容 334.2 实施方案架构设计 334.3 技术资料要求 334.4 项目技术服务支持计划 335 培训与知识转移服务要求 346 投标公司及人员资质要求 356.1 投标公司资质要求 356.2 人员资质要求 35项目目标和采购内容项目目标通过针对数据中心IT系统建设统一的监控平台和IT运维管理平台,提升河南农信数据中心的运维管理水平,适应业务的发展需求,通过本项目的建设应达到以下目标:可视化:有效监控数据中心IT系统的运行状态以及性能,为分析IT系统的运行情况提供有效的数据和信息自动化:主动、及时的抓取IT系统的有效告警信息,并可通过合理的技术手段通知相关系统管理人员,缩短故障或隐患的解决时间统一化:通过标准的技术协议进行IT系统的监控,不受厂商品牌的技术限制,支持市场上各种主流设备和系统的软硬件监控规范化:参考业界最佳实践(ITIL),建设具备服务台、事件管理、问题管理和知识库管理功能的IT运维管理平台,规范现有IT运维管理工作,提升IT运维管理工作的质量集成化:有效集成监控管理平台与IT运维管理平台,将监控管理平台发现的事件集成到IT运维管理平台中进行有效的管理,实现统一集成,有效提升河南农信数据中心整体IT运维管理水平采购内容本项目采购内容包括:数据中心IT系统监控平台软件、IT运维管理平台软件(包括服务台、事件管理、问题管理、知识管理等功能模块)、IT系统监控平台软件和IT运维管理平台软件实施与集成服务IT监控管理平台技术要求监控总体要求要求支持管理的多种操作系统类型:Windows、AIX、HPUX、Linux、SCOUNIX等要求支持多种环境:数据库支持Oracle,Sybase,DB2,SQLServer等主流品牌,邮件系统支持Exchange、Domino等,中间件应用服务器支持WebLogic,Tuxedo,Websphere,MQSeries,等。支持CheckPonit、F5、Radius、UDDIServer、要求支持多种数据采集手段包括:HTTP、SNMP、JMX、SSH、NetBios、Telnet、脚本、JDBC等。要求内置性能监控器。所有监控器都提供商用化监控模板,监控指标已经定制完备,只需要配置,无需开发定制。可以通过通用的XML定义、修改、部署监控模板。要求支持设定不同的时间段,在系统系统可用性高峰期和非高峰期时,执行不同的动作。要求支持监控URL的可用性和响应时间,并能做页面内容的匹配检查。能够提供对于不同URL和业务关键交易的监控,可以模仿业务用户来填写Web内容(如表单)。要求能够模拟一定的业务流程顺序的访问一组页面,获得数据,以实时的了解的基于WEB的应用系统的性能问题。支持虚拟环境VMwareESX、SolarisZone的监控。能精确定位故障点,特别是多个故障同时发生时,能利用根原因查找功能,以排除次要告警,找出根源告警;对采集的事件能按来源、类型、级别等指标进行分析;对收集到的事件具有自动处理功能,做出各种响应动作,如调用脚本程序等;支持事件分类,采集到的事件按严重程度分类,能够对事件分组,以表示不同的事件类型;支持多级操作员分权管理,不同操作员分别管理不同的任务,管理员可以按业务类别、地域等方面划分。支持通过Telnet/SNMP/WMI等多种方式综合监控各类主流的操作系统、数据库、中间件,范围必须包含本次项目覆盖的类型(见后表)并需考虑未来的扩展性。能够采集主机设备、操作系统、数据库、应用程序的性能、日志与事件等;各种Unix程序、脚本产生的信息;各种设备发生的SNMPTrap。对于事件的告警支持多种方式,如调用脚本程序,以电子邮件,有声报警,短信、SNMPtraps,Scripts,Database,Log等方式通知管理人员。支持在一个警报之后,能够实施一系列自动的应急措施,在管理员到达现场之前,尽量避免down机等重大损失。系统性能管理应可以兼顾到基于历史信息的分析和实时性能状况的监视,可自动连续收集系统(操作系统,数据库,中间件)的运行性能信息并对这些信息进行分析处理,所有数据可提供给用户进行历史性分析,以定位系统瓶颈和故障。实时的监视系统性能的即时变化,特别是在压力情况下、性能瓶颈诊断时实时监视到系统资源使用状况的变化,实时性应小于等于30秒。监控平台管理要求告警数据处理要求告警数据处理告警故障定位告警故障定位应与配置数据和应用逻辑相结合,参考设备厂商或应用软件开发商提供的最小粒度进行定位,如:主机、CPU、网络接口卡、硬盘等。告警过滤按维护要求和管理部门的要求及实际管理情况,针对单位时间内发生大量告警或者已知告警,设置过滤规则,过滤从底层产生的告警信息中不重要的信息,减少轻微告警的干扰,以提高监控与处理的效率。告警前转系统提供告警前转功能,将告警信息以各种手段(手机短信、EMAIL等)转至指定的维护人员。告警清除对于系统中已经处理完毕的告警信息,需要设置相关的标志,标记为清除,退出告警处理流程。监控展现要求故障监控故障监控应该对不同的用户应有能力提供不同的监控视图,显示不同的监测内容。便于具体维护人员及时发现问题和处理问题。故障监控应能够提供列表形式的告警监视视图,使维护人员可以监视到被管资源的实时告警事件和处理后的告警事件,并对相关告警进行告警确认、清除等操作。告警事件显示过滤对单位时间内发生的大量告警,能按定制的条目(可包含告警元素、告警级别、告警类别或告警节点等)进行过滤。告警显示过滤用于过滤掉从底层提取的告警信息中监控人员认为不重要的信息,只显示监控人员关心的告警信息,从而减少轻微告警的干扰,以提高监控与处理的效率。告警处理功能能够进行告警确认、清除、派工单、短信前转等处理;能够将用户不需要关心的告警设置为可忽略告警。主机系统监控要求统一监控管理平台需要具备采集以下列表指标的能力,具体监控指标需要需求调研明确:被管对象指标AIXHPUXLINUXSolarisScounixCPU利用率Cache状态磁盘错误磁盘分区信息文件系统状态索引节点缓冲网络状态statsKMA状态平均负载内存利用率物理磁盘信息处理器信息队列长度索引文件表状态系统调用信息存储监控要求存储监控需要能通过主流的监控协议(如:SMI_S、SNMP等)及时准确上报存储的故障信息、状态信息、预失败报警等以及容量监控管理,性能监控管理等能力。SAN磁盘阵列设备配置信息监控允许录入和编辑设备的管理信息,包括所在机房、机架位置、设备用途(生产、测试、灾备等)、负责人员、所属部门等。能够自动采集存储型号、序列号、微码版本、前端口类型、前端口速率、处理器信息、CACHE大小、后端口速率、磁盘配置、厚/精简配置等信息。能够自动采集存储设备磁盘的配置信息,包括磁盘型号、厂商、序列号、容量、配置状态、冗余状态等。提供列表方式展现,可多条件组合查询,统计和比较。能够自动采集RAID组(对于特定厂商的特定型号的设备,其RAID方式有所不同)的容量、条带长度、所关联磁盘等信息。并能计算RAID组的已使用容量、未使用容量等信息。提供列表方式展现,可多条件组合查询,统计和比较。能够自动采集LUN的配置信息,包括容量、LUN唯一标识、是否分配等信息。提供列表方式展现,可多条件组合查询,统计和比较。能够自动采集接口盘以及前端FC端口的基本信息,包括WWN、端口名称、速率、运行状态、是否安装SFP等信息。同时能够自动识别通过此端口进行Masking&Mapping的LUN列表。提供列表方式展现,可多条件组合查询,统计和比较。能够自动采集卷的Masking&Mapping信息,包括前端服务器的端口组、卷与磁盘阵列前端端口的映射关系等。提供列表方式展现,可多条件组合查询,统计和比较。能够采集磁盘阵列的电源、电池、风扇、磁盘等关键部件的信息,包括位置、名称、运行状态等。提供列表方式展现,可多条件组合查询,统计和比较。能够以图形化的方式展现机柜、磁盘柜、磁盘的位置和组织关系,并实时展现其运行状态,要求直观简洁。能够实现对数据中心存储环境中所使用的IBM、HDS、EMC、HP各型号高、中、低端磁盘阵列的集中管理,并提供一致的管理功能。对于采用特殊技术的存储设备,例如HP3Par系列,IBMXIV系列,在提供通用管理功能的同时,需要对其不同的RAID技术提供管理和分析功能。能够自动发现磁盘阵列中无效的LUN分配信息,并以直观的方式展示。故障管理对磁盘阵列的关键部件,包括磁盘、电源、电池、风扇、端口等,其运行状态和健康状态能够周期性自动更新,并且周期可调整。能够集中的展示有故障的部件,方便管理人员快速定位。对于磁盘、端口等关键部件,能够快速定位其影响的业务,以作影响性分析的依据。性能监控管理提供需提供周期性的性能采集机制,对磁盘阵列的关键对象,包括磁盘、RAID组、卷、端口、盘阵级别的关键指标数据进行采集。采集周期灵活可调。能够灵活查询性能数据,并以图形和列表的形式,以日、周、月、年的方式汇总和展现性能曲线,提供平均值和最大值的查询方式。能够对指定对象的指定指标设置门限,对于越门限事件,可以以特定的策略,例如连续超门限N次,上报越门限告警。支持通用的指标,例如IOPS、数据传输率、缓存命中率必须支持,对于特定设备的特定指标,可进行采集并提供用户选择查询。容量监控管理能够统计磁盘阵列的物理总容量、可用容量、已分配容量、未分配容量、未配置容量等容量指标,并提供多维度的统计方式,例如按设备、按用途、按机房、按级别等。对于单个磁盘阵列,对其从磁盘到LUN的容量配置方式做详尽的分析和展现。通过分析磁盘阵列的Masking&Mapping数据,自动发现和分析容量的分配路径,包括分配的前端主机、主机组甚至NAS设备的数量、容量、WWN等信息。可快速查询磁盘阵列的可用容量,包括未配置的磁盘的容量、未分配的LUN容量,或者RAID组中未划分LUN的容量等,以方便部署新业务系统或者扩容使用。NAS设备监控管理配置管理允许录入和编辑设备的管理信息,包括所在机房、机架位置、设备用途、负责人员、所属部门等。对于EMC、HDS的NAS设备,后端使用SAN磁盘阵列的,对SAN磁盘阵列提供1.1的管理功能。自动采集NAS文件系统的信息,包括名称、位置、格式、容量、利用率等,并自动分析文件系统的组成方式,与后端磁盘阵列或本地磁盘的映射关系。自动采集和分析文件系统与机头的挂载关系,以及机头的IP地址资源的使用情况。支持EMC、NetApp、IBM等厂商主流NAS设备的管理兼容性。故障管理对磁盘阵列的关键部件,包括磁盘、电源、电池、风扇、端口等,其运行状态和健康状态能够周期性自动更新,并且周期可调整。能够集中的展示有故障的部件,方便管理人员快速定位。对于磁盘、端口等关键部件,能够快速定位其影响的业务,以作影响性分析的依据。容量管理统计文件系统的容量利用率,并通过文件系统与后端Block容量的映射关系,推算NAS设备整体的容量利用率。追踪并记录每个FS的日容量变化情况,进而汇总NAS设备整体的日消耗曲线。对于文件系统利用率高于指定门限,以及日消耗速度超过指定门限的,以及剩余可用天数低于某一门限的,系统予以告警提示。光纤交换机监控管理配置管理允许录入和编辑设备的管理信息,包括所在机房、机架位置、设备用途、负责人员、所属部门等。能够自动采集交换机的端口信息,包括WWN、端口序号、端口状态、端口速率、是否安装SFP等,并周期性同步。提供图形化方式展现交换机的端口、端口盘的位置。能够自动采集FABRIC中的ZONE信息,包括ZONE名称、包含端口或WWN等,并周期性同步。链路管理能够自动采集端口对端的WWN信息,并与系统的数据库中的WWN相匹配,自动发现该WWN归属的设备类型、名称、端口位置信息,并自动同步。性能管理提供需提供周期性的性能采集机制,对交换机的关键对象,包括端口、设备级别的关键指标数据进行采集。采集周期灵活可调。能够灵活查询性能数据,并以图形和列表的形式,以日、周、月、年的方式汇总和展现性能曲线,提供平均值和最大值的查询方式。能够对指定对象的指定指标设置门限,对于越门限事件,可以以特定的策略,例如连续超门限N次,上报越门限告警。支持通用的指标,例如入出流量、总流量、带宽利用率必须支持,对于特定设备的特定指标,可进行采集并提供用户选择查询。追踪并记录每个FS的日容量变化情况,进而汇总出磁盘阵列提供容量的日消耗曲线。对于文件系统利用率高于指定门限,以及日消耗速度超过指定门限的,以及剩余可用天数低于某一门限的,系统予以告警提示。告警集中接收磁盘阵列告警接收以SNMP的方式接收来自于磁盘阵列的告警信息并解析、分类、保存数据库,告警信息中包含告警描述、上报时间、告警级别、告警类别、事件源名称、位置等信息。光纤交换机告警接收以SNMP的方式接收来自于光纤交换机的告警信息并解析、分类、保存数据库,告警信息中包含告警描述、上报时间、告警级别、告警类别、事件源名称、位置等信息。容量告警接收系统自动跟踪服务器文件系统容量利用率,当超过指定门限时,系统自动生成一条告警信息并保存到数据库中。性能告警接收系统自动跟踪指定对象的指定性能指标的性能曲线变化情况,当超过指定门限时,系统自动生成一条告警信息并保存到数据库中。告警趋势分析对于特定的告警,监视其上报频率,当频率达到或超过指定的门限时,系统以明显的方式提示管理员,以作预警分析。自定义告警解析规则对于新的告警,或者当前解析规则不支持的告警信息,系统不能丢弃,而是以“未解析规则”的方式保存和查询,并提供“自定义解析规则”的功能,针对特定的告警定义解析规则,或通过二次开发定义解析规则。容量统计磁盘阵列容量统计提供多个维度(按设备、按机房、按用途、按级别、按网络)组合的统计方式,统计磁盘阵列的总物理容量、可用容量、已分配容量、未使用容量、未配置容量指标。磁盘阵列容量配置分析从磁盘阵列磁盘配置率、RAID组使用率、LUN分配率三个维度统计各个磁盘阵列的容量配置情况,以作扩容、优化的依据。容量分配分析数据路径查询集中展示所有的数据路径,展示从服务器文件系统到磁盘阵列磁盘的详细的路径信息,以及基于此路径的容量利用率分析。容量消耗分析服务器容量消耗以列表形式展现服务器的日均、周均、月均的容量消耗速度,以及以该速度下剩余容量的使用天数。主机组容量消耗以列表形式展现主机组的日均、周均、月均的容量消耗速度,以及以该速度下剩余容量的使用天数。可用容量查询磁盘阵列可用容量查询查询系统中的所有磁盘阵列的可用容量,包括未配置的容量、RAID组中未划分LUN的容量以及未分配的LUN的容量等,以作扩容参考。容量回收分析按路径回收容量查询系统中各磁盘阵列中无效配置的LUN(磁盘阵列中有LUN的分配数据但是光纤路径不可达的情况),以供回收参考。网络监控要求网络监控不但要求能够监控到网络设备状态信息(实时流量、up状态等),配置信息以及故障报警和log等类别名称KPI名称(英文)KPI网络设备监控sysName设备名称sysObjectID设备型号sysDescr设备软件版本ifIndex端口索引ifName端口名称ifAlias端口别名ifType端口类型ifSpeed端口带宽ifPhysAddress端口物理地址ipAdEntAddr端口IPipAdEntNetMask子网掩码ifDescr端口描述ifOutOctets分端口出流量ifInOctets分端口入流量coldStart冷启动warmStart热启动linkDown通信链路失败linkUp通信链路恢复authenticationFailure授权失败egpNeighborLossEGP邻居丢失Others其他故障报警信息服务器虚拟化监控要求虚拟化监控要能监控到host物理机以及guest虚拟化的详细指标,如下以vmware指标为例:类别名称KPI名称(英文)KPI名称(中文)单位001-VCENTER_主机CPUcpu.usage.AVERAGECPU平均使用率(百分比)%001-VCENTER_主机CPUcpu.ready.SUMMATIONCPUREADY状态累计时间ms001-VCENTER_主机CPUcpu.wait.SUMMATIONCPUWAIT状态累计时间ms002-VCENTER-主机内存mem.swapused.AVERAGESWAP空间使用量kb002-VCENTER-主机内存mem.usage.AVERAGE内存使用率(百分比)%002-VCENTER-主机内存mem.granted.AVERAGE已分配给虚拟机的内存容量(KB)kb002-VCENTER-主机内存mem.consumed.AVERAGE虚拟机所占用的内存容量(KB)kb002-VCENTER-主机内存mem.active.AVERAGE虚拟机真实使用的内存容量(KB)kb002-VCENTER-主机内存mem.swapout.AVERAGE通过气球算法交换出的内存容量(KB)kb003-VCENTER-主机主机磁盘disk.usage.AVERAGE主机磁盘使用量(KBps)kbps003-VCENTER-主机主机磁盘disk.write.AVERAGE主机磁盘写入速率(KBps)kbps003-VCENTER-主机主机磁盘disk.read.AVERAGE主机磁盘读取速率(KBps)kbps004-VCENTER-主机Datastoredatastore.totalWriteLatency.AVERAGEDatastore平均写入延迟(毫秒)ms004-VCENTER-主机Datastoredatastore.totalReadLatency.AVERAGEDatastore平均读取延迟(毫秒)ms004-VCENTER-主机Datastoredatastore.write.AVERAGEDatastore平均写入速度(KBps)kbps004-VCENTER-主机Datastoredatastore.read.AVERAGEDatastore平均读取速度(KBps)kbps005-VCENTER-主机网络net.usage.AVERAGE网络平均使用量(KBps)kbps005-VCENTER-主机网络net.received.AVERAGE网络平均接收速率(KBps)kbps005-VCENTER-主机网络net.transmitted.AVERAGE网络平均发送速率(KBps)kbps005-VCENTER-主机网络net.errorsRx.SUMMATION网络接收错误包数量number005-VCENTER-主机网络net.errorsTx.SUMMATION网络发送错误包数量number006-VCENTER-主机HBA卡storageAdapter.write.AVERAGEHBA卡平均写入速率(KBps)kbps006-VCENTER-主机HBA卡storageAdapter.totalWriteLatency.AVERAGEHBA卡平均写入延迟(ms)ms006-VCENTER-主机HBA卡storageAdapter.read.AVERAGEHBA卡平均读取速率(KBps)kbps006-VCENTER-主机HBA卡storageAdapter.totalReadLatency.AVERAGEHBA卡平均读取延迟(ms)ms001-VCENTER_虚拟机CPUcpu.usage.AVERAGECPU平均使用率(百分比)%001-VCENTER_虚拟机CPUcpu.ready.SUMMATIONCPUREADY状态累计时间ms001-VCENTER_虚拟机CPUcpu.wait.SUMMATIONCPUWAIT状态累计时间ms002-VCENTER_虚拟机内存mem.swapped.AVERAGE虚拟机SWAP空间使用量kb002-VCENTER_虚拟机内存mem.usage.AVERAGE内存使用率(百分比)%002-VCENTER_虚拟机内存mem.granted.AVERAGE已分配给虚拟机的内存容量(KB)kb002-VCENTER_虚拟机内存mem.consumed.AVERAGE虚拟机所占用的内存容量(KB)kb002-VCENTER_虚拟机内存mem.active.AVERAGE虚拟机真实使用的内存容量(KB)kb002-VCENTER_虚拟机内存mem.swapout.AVERAGE虚拟机通过气球算法交换出的内存容量(KB)kb003-VCENTER_虚拟机磁盘virtualDisk.write.AVERAGE虚拟磁盘平均写入速度(KBps)kbps003-VCENTER_虚拟机磁盘virtualDisk.read.AVERAGE虚拟磁盘平均读取速度(KBps)kbps003-VCENTER_虚拟机磁盘disk.usage.AVERAGE虚拟机磁盘使用量(KBps)kbps004-VCENTER_虚拟机Datastoredatastore.totalWriteLatency.AVERAGEDatastore平均写入延迟(毫秒)ms004-VCENTER_虚拟机Datastoredatastore.totalReadLatency.AVERAGEDatastore平均读取延迟(毫秒)ms004-VCENTER_虚拟机Datastoredatastore.write.AVERAGEDatastore平均写入速度(KBps)kbps004-VCENTER_虚拟机Datastoredatastore.read.AVERAGEDatastore平均读取速度(KBps)kbps005-VCENTER_虚拟机网络net.usage.AVERAGE虚拟机网络平均使用量(KBps)kbps005-VCENTER_虚拟机网络net.received.AVERAGE虚拟机网络平均接收速率(KBps)kbps005-VCENTER_虚拟机网络net.transmitted.AVERAGE虚拟机网络平均发送速率(KBps)kbps007-VCENTER-主机配置信息name主机名称unit007-VCENTER-主机配置信息summary.hardware.cpuMhz主机CPU平均频率(MHz)mhz007-VCENTER-主机配置信息summary.hardware.numCpuCoresnumCpuCoresnumber007-VCENTER-主机配置信息summary.hardware.cpuModel主机CPUMODELunit007-VCENTER-主机配置信息summary.hardware.memorySize主机内存大小(Mb)mb007-VCENTER-主机配置信息summary.hardware.numHBAs主机HBA数量number007-VCENTER-主机配置信息summary.hardware.numNics主机网卡数量number007-VCENTER-主机配置信息summary.hardware.vendor主机厂商unit007-VCENTER-主机配置信息summary.runtime.bootTime主机运行时间hh007-VCENTER-主机配置信息summary.runtime.powerState主机电源状态unit007-VCENTER-主机配置信息summary.runtime.connectionState主机连接ESXSERVER状态unit007-VCENTER-主机配置信息datastore主机关联的Datastoreunit007-VCENTER-主机配置信息network主机关联的NETWORKunit007-VCENTER-主机配置信息vm主机关联的VMunit006-VCENTER_虚拟机配置信息name虚拟机名称unit006-VCENTER_虚拟机配置信息summary.guest.guestId虚拟机guest标识unit006-VCENTER_虚拟机配置信息summary.guest.guestFullName虚拟机guest全称unit006-VCENTER_虚拟机配置信息summary.guest.hostName虚拟机主机名称unit006-VCENTER_虚拟机配置信息summary.guest.ipAddress虚拟机guestIPunit006-VCENTER_虚拟机配置信息summary.runtime.bootTime虚拟机运行时间(小时)hh006-VCENTER_虚拟机配置信息summary.runtime.powerState虚拟机运行状态unit006-VCENTER_虚拟机配置信息summary.config.memorySizeMB虚拟机内存大小(Mb)mb006-VCENTER_虚拟机配置信息summary.config.numCpu虚拟机CPU个数number006-VCENTER_虚拟机配置信息summary.config.numEthernetCards虚拟机网卡个数number006-VCENTER_虚拟机配置信息summary.config.numVirtualDisks虚拟机虚拟磁盘个数number006-VCENTER_虚拟机配置信息summary.config.cpuReservation虚拟机CPU预留大小mhz006-VCENTER_虚拟机配置信息datastore虚拟机所用DATASTOREunit006-VCENTER_虚拟机配置信息network虚拟机所用网络unit006-VCENTER_虚拟机配置信息resourcePool虚拟机所用资源池unit006-VCENTER_虚拟机配置信息runtime.host虚拟机运行主机unit000-VCENTER-D资源池名称unit000-VCENTER-DatapoolresourcePool子资源池unit000-VCENTER-Datapoolvm资源池中的虚拟机unit000-VCENTER-D数据源名称unit000-VCENTER-Datastorevm使用这个数据源的虚拟机unit000-VCENTER-Datastoresummary.capacity数据源大小(Mb)unit000-VCENTER-Datastoresummary.freeSpace数据源剩余空间(Mb)unit000-VCENTER-Datastoresummary.type数据源文件类型unit000-VCENTER-Datastoresummary.url数据源URLunit000-VCENTER-N网络名称unit000-VCENTER-Networkhost网络中的主机unit000-VCENTER-Networkvm网络中的虚拟机unit数据库监控要求统一监控管理平台需要具备采集以下列表指标的能力,具体监控指标需要需求调研明确:被管对象指标Oracle数据库缓冲区忙等待率缓冲区忙等待缓冲命中率缓冲区缓存锁立即丢失缓冲区缓存锁丢失数据一致性变更数据一致性获取数据块变更数据块获取数据写缓存DBWR检查点DBWR缓存剩余lru扫描次数要求缓冲剩余所收信息DBWR扫描深度数据字典高速缓存获取数据字典高速缓存丢失率数据字典高速缓存丢失分发繁忙率分发进程队列反映全表扫描锁获取锁命中率锁丢失锁睡眠库命中率库缓存锁立即丢失库缓存锁丢失物理数据块读取物理数据块写入物理读取时间物理读取物理写入时间物理写入递归调用重做分配锁立即丢失重做分配锁丢失重做缓存分配重试重做拷贝锁立即丢失重做拷贝锁丢失重做实体重做log空间请求重做同步写入段头等待分类(硬盘)分类(内存)使用ROWID返回表继续ROW返回表得到的表扫描块得到的表扫描列表扫描(长)表扫描(短)表空间剩余扩展表空间剩余回滚头等待回滚段获取回滚段等待用户调用用户commit用户回滚informixInformix性能Informix表空间Informix数据库性能共享内存命中率Informix用户Informix的容量信息Log空间使用的百分比Onbar活动状态PDQ内存使用百分比VP使用CPU百分比临时表空间的某个chunk页面读的次数实例状态已使用的所有数据库空间的百分比并行查询当前VP列表最大的VP数目死锁超时的次数活动锁的百分比物理日志缓冲区的大小等待检查点的次数等待缓冲区的次数被监控用户写日志记录的次数被监控用户磁盘排序的次数被监控表空间的删除次数被监控表空间的死锁次数DB2DB2数据库状态DB2表空间DB2锁已使用的页面数总页面数数据库信息池命中率中间件监控要求统一监控管理平台需要具备采集以下列表指标的能力,具体监控指标需要需求调研明确:被管对象指标WebLogicServlet类型高执行时间Servlet类型低执行时间EJB类型池销毁计数EJB类型当前等待线程计数EJB类型失败计数EJB类型超时计数EJB类型交易回滚计数EJB类型交易超时计数EJB类型缓存丢失计数(证据)EJB类型缓存丢失计数(队列)EJB类型缓存丢失超时Execution队列:最大等待时间Execution队列:搁置请求Execution队列:等待时间JMS当前生产暂停状态JMS当前插入暂停状态JMS当前消耗暂停状态线程池悬起线程池搁置用户请求线程池执行空余时间占用线程池线程池队列长度例外WebSphere实例数实例销毁并发数Method调用Method接收活跃Method并发数排水渠移除返回丢弃获取发现销毁数池获取池返回Method调用实例数活动Method排水渠池大小创建数销毁数返回数分配数池大小并发等待等待时间错误使用率最大率PrepStmt缓存丢弃总内存内存剩余内存使用创建session无效sessionsession生命周期活动session当前运行session线程创建线程销毁活动线程池大小最大率线程创建线程销毁活动线程池大小最大率全局交易开始全局交易引入本地交易开始活动全局交易活动本地交易全局交易时间段本地交易时间段全局完成交易时间段全局准备交易时间段全局Commit交易时间段本地准备交易时间段本地Commit交易时间段优化数全局交易Commit数本地交易Commit数全局交易回滚本地交易回滚全局交易超时本地交易超时Servlets加载数加载数请求并发请求反映时间错误数请求错误数并发请求反映时间系统定制和配置能力要求统一监控平台应提供产品的客户化定制,采用所见即所得的基于第4代语言(面向对象的)的开发环境。软件系统应采用多层架构设计,逻辑结构清晰,具备负载均衡和故障恢复能力。系统采用分布式的结构,不同的应用模块可以在相互独立的硬件平台上单独运行。提供快捷的管理、开发平台,提供开发所用的API和相关的技术支持,保证基于运行服务管理平台进行特定功能需求的二次开发。当需要增加被管理对象时,只需增加采集设备或者采集代理即可实现。运行服务管理平台在设计上要具有灵活性和可扩展性,采用松耦合的设计模式,实现功能模块间的“可拆可合”,以保证功能易于扩展。与其他系统的集成要求统一监控管理平台应该与以下系统集成,使监控管理信息的有效整合,提高数据中心整体运维管理工作的效率:与主流的IT运维管理软件有双向的成熟接口,可以实现信息的双向集成。与短信平台的集成,实现告警短信通知;与邮件平台的集成,实现告警邮件通知。易操作性和可维护性要求要遵循易操作性设计原则;用户界面采用中文界面,提示信息通俗易懂,操作及选择键(热键、菜单选择等)的功能定义在全系统保持一致;系统对于查询界面,应提供跳页和滚动显示功能;要求采用模块化结构,提供开放的接口,有二次开发能力,并且便于扩容。对于系统相关的数据存储可以进行增量定期备份和移出,以使保证系统出现问题时可以完整恢复。对于系统功能和页面错误,以明白、易懂的中文提示做出说明,不出现空白、乱码、英文等提示页面,便于维护人员查找原因,及时解决问题。系统上线时,必须提交易于安装的标准安装程序(如:主要软件包可放置于光盘)。提供必要的操作维护手册及技术手册、必要的培训。当进行版本升级时,提供版本差异的详细说明。IT运维管理平台技术要求基本技术要求应采用成熟的、商用的IT运维管理平台软件作为本项目的基本建设平台。所提供的产品必须首先具备如下基本特性:所提供的应该是IT运维管理软件产品领域的主流产品,并符合ITILV3标准。产品应该是企业级的解决方案,产品提供应用级可分布的、可伸缩的体系结构。支持主流的操作系统和硬件平台,支持浏览器/服务器结构。提供图形化的工作流设计器,支持流程图直接导入,支持以拖拽控件的图形化方式自定义业务流程任务、角色、规则和流转条件。管理人员可以动态地定制或修改流程并及时启用,不需要重新部署。可以人工、自动、半自动方式,定义流程的节点、流向和实现功能。产品自身应该包含ITILv3的最佳实践内容,不应该仅有工作流引擎。事件、问题、变更流程既可按不同的业务系统独立运行,又能实现集中式运转。(各应用系统有自己的流程,建单后按各系统定制的流程运行)总部有统一的服务台,受理各系统事件时,通过选择不同业务类型,跳转到各系统定制的流程运行,完成后回到总部服务台结束,两者使用的表单界面一致。即做到在一套流程中既要坚持流程的标准化又兼顾各个应用系统运维的特点。具有详细的流程流转记录,提供流程跟踪功能。除公共属性外,各流程都可定制表单界面。各应用系统可以在流程的后台配置中按照要求实现数据相互隔离,做到各应用系统在流程定制时互不影响。每个流程工单状态的图形化展示。支持上传附件的功能,附件应能够自动关联相关对象,以便用户在创建事务请求时同步粘贴必要的文件。事件单、问题单、变更单和配置项之间应该具有相互关联的能力,从任何一张工单都能够看到与之相关联的其他事件单、问题单、变更单和配置项。流程间实现无缝整合以便提高处理效率,所有实现的流程都应自动与知识库系统实现关联。统一的用户权限管理,提供基于角色的权限分配和控制功能。可基于表单字段和模块定义用户各类权限。服务台服务台作为统一的服务窗口,为公司内部IT客户提供统一的IT服务,所有客户服务请求(无论是通过电话、电子邮件还是自助式服务界面发出的)均在服务台汇集,是IT服务的单一联系点。服务台提供的基本管理功能包括:提供个人仪表板功能,人员可以根据自己的需求定制仪表板的实时报表,并可以在登录后浏览自己的仪表板详细记录下每一件提交到服务台的服务请求,并按服务类别生成相应工单,对请求信息做出初步的分类和级别判断支持多种请求方式,可以通过邮件、web、监控系统报警和呼叫中心自动创建工单完成记录、分派、跟踪和回复功能,必要时启动后台的事件、问题和变更处理流程。可以方便的访问知识库,并可以自动的将有用的知识信息记录为服务请求的解决方案。与事件管理关联,可以将服务请求升级为事件单,而无需再次输入服务请求的信息。支持对工单处理过程的跟踪,确保所有的服务申请能够以闭环方式结束,允许服务台对服务申请的干预(更换处理人、流程跳转、强制流程结束)。提供公告板:可以进行内部信息发布和交流。提供编辑和发送邮件、短信的快捷工具。服务台可以与呼叫中心集成.应具备成功集成的案例。与主流的监控软件有双向的成熟接口,可以实现信息的双向集成。事件管理事件模块主要是实现事件管理流程的管理功能,完成事件生命周期的管理,包括事件的登记、事件的分配、事件的方案记录、事件的升级和事件关闭等,为的ITSM事件管理提供坚实的技术支撑。事件模块的基本功能如下:支持通过邮件、web、监控系统报警自动创建事件支持对事件进行分类和优先级分级支持方便的定义自动升级处理的时间阈值支持重复事件的关联处理支持从事件单中对知识库的查询支持从事件管理流程创建问题单应该可以根据应用系统的不同按照不同的流程流转工单可以支持对事件数据进行趋势分析提供对所有事件记录更新日志和解决活动的历史审计日志与服务水平管理关联,可以根据服务级别规则确定违规的事件工单对于不明原因的事件可以自动提交进入问题管理流程,无须重复录入,或者标记为问题管理需要关注的工单对于成功的解决方案可以提交如知识库形成知识草案,或者标记为知识的候选工单问题管理问题模块主要是实现问题管理流程的管理功能,找出问题重复发生的根本原因,完成问题生命周期的管理,包括问题的登记、问题的审核、问题的分配、问题的方案记录、问题关闭和问题的监控等。问题模块的基本功能如下:可以手工创建问题工单,或者通过事件单,服务请求单创建问题单根据对事件分析,找到问题根本原因,提出解决方案,并提交知识库。支持复杂的问题协作关系,在流程中可以包含多个任务,任务可以并行或者串行。支持方便的定义自动升级处理的时间阈值支持重复问题的关联处理支持从问题单中对知识库的查询和知识创建,对于不能解决的问题根源可以标记为已知错误(KnownError)问题单应该关联与之相关的其他工单。变更管理投标人提供的IT运维管理(ITSM)变更管理管理应包括添加、修改或删除已批准的对象,如应用程序、相关文档、硬件等,其中变更管理应支持但不限于以下基本要求:制定合适的变更管理模式,涵盖到IT系统所涉及到的应用,网络和系统运营等的变更,实现统一变更管理;与其他IT服务流程,包括问题管理,事件管理和配置管理等的有机集成,可以方便的查询与该变更相关的所有信息,包括人员信息,实现对整体IT系统的有效管控;对变更审批和变更实施过程得到正确记录,并提供后续的审核和历史信息统计;确定符合我社具体情况的变更评估和审核机制,使得变更对业务的影响降到最小;合理定义变更的类别和优先级,实现变更的高效执行和有效分析统计;用户可以申请产生变更请求,在变更请求中记录变更申请人、变更请求状态以及详细的信息描述,包括实现变更必须完成的特定活动,该变更对业务的影响程度等;变更计划阶段要定义变更失败后的恢复和回退计划,并作为审核的依据;变更可按照审批流程进行,没有通过审批的变更请求,能够自动禁止变更工单的派发;支持对常规变更请求或计划内维护变更统计分析的过滤功能;对一般变更、重大变更和紧急的变更分别设置独立的流程;制定合理的人员角色和职责及考核机制;设计考核指标,利用管理信息统计等手段对流程的执行提供统计、分析和查询等功能;通过在变更的生命周期中严格遵循流程,变更管理应减少由于变更引起影响业务效率的突发事件,降低变更的安全风险。配置及资产管理投标人提供的IT运维管理(ITSM)资产管理应支持以下基本要求:为其他服务管理流程提供有关IT基础架构配置的准确信息;为事件管理、问题管理、变更管理和发布管理的运作提供支持;提供录入界面和导入资产及配置信息;支持资产设置各种分类及不同分类对象属性模板;提供多样化的配置及资产统计与分析报告;设计资产管理中涉及到的各类人员的岗位和具体职责;设计配置及资产流程中涉及到的各类人员的绩效考核指标;提供事件管理、问题管理、变更管理、发布管理、服务级别管理等模块的关联知识库管理作为一个独立的管理模块,知识库管理提供了对知识的各类管理功能,包括:知识的收集、知识审核、知识分类、知识存储、知识更新、知识搜索、知识的发布等。具体功能要求包括:支持知识录入、审核、修订、停用等功能为各流程管理模块提供主题相关的知识查询功能。可根据数据库条目的字段如类别、提出者、提出时间等内容进行模糊查询。支持关键字查询。支持对知识库附件的全文检索功能,搜索支持中英文混合搜索允许服务台人员及后台支持人员提交经验和知识、检索知识,并允许用户通过WEB方式查询知识库信息。具备从其他流程创建新知识的入口,可以将事件和问题等解决方案纳入知识库。提供问题解决方案的记录与维护功能,具备权限的知识库管理员可以定制、维护知识库记录。知识库能按照用户角色(组)进行权限控制,使得用户只能查看与所对应的角色相关的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论