版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、某某公司技术建议书中国惠普中国惠普起草日期:2007年12月04日版 权 说 明本文件中出现的任何文字表达、文档格式、插图、照片、方法、过程等内容,除另有特别注明,版权均属中国惠普所有,受到有关产权及版权法保护。任何个人、机构未经中国惠普的书面授权许可,不得复制或引用本文件的任何片断,无论通过电子形式或非电子形式。本建议方案由中国惠普根据某某公司以下简称“某某公司的需求编制,其使用范围仅限于客户为满足自身工程的需要而进行的方案选型。任何超出本范围的使用需事先得到中国惠普的书面授权许可。目 录 TOC o 1-3 h z u HYPERLINK l _Toc184617466 第一章总述 PAG
2、EREF _Toc184617466 h 4 HYPERLINK l _Toc184617467 第二章方案总体架构 PAGEREF _Toc184617467 h 5 HYPERLINK l _Toc184617468 2.1.总体设计思路 PAGEREF _Toc184617468 h 5 HYPERLINK l _Toc184617469 2.2.建设原那么 PAGEREF _Toc184617469 h 6 HYPERLINK l _Toc184617470 2.3.方案总体架构 PAGEREF _Toc184617470 h 8 HYPERLINK l _Toc184617471 第
3、三章监控管理平台 PAGEREF _Toc184617471 h 10 HYPERLINK l _Toc184617472 3.1.监控管理平台架构 PAGEREF _Toc184617472 h 10 HYPERLINK l _Toc184617473 3.2.监控管理平台产品推荐 PAGEREF _Toc184617473 h 12 HYPERLINK l _Toc184617474 3.3.网络性能和故障监控 PAGEREF _Toc184617474 h 13 HYPERLINK l _Toc184617475 3.3.系统监控有代理方式 PAGEREF _Toc184617475 h
4、 17 HYPERLINK l _Toc184617476 3.3.1.系统管理 PAGEREF _Toc184617476 h 17 HYPERLINK l _Toc184617477 3.3.2.数据库监控 PAGEREF _Toc184617477 h 22 HYPERLINK l _Toc184617478 3.3.3.中间件监控 PAGEREF _Toc184617478 h 24 HYPERLINK l _Toc184617479 3.3.4.相关产品的特点 PAGEREF _Toc184617479 h 25 HYPERLINK l _Toc184617480 3.4.系统监控无
5、代理方式 PAGEREF _Toc184617480 h 29 HYPERLINK l _Toc184617481 3.4.1.主要功能特点 PAGEREF _Toc184617481 h 29 HYPERLINK l _Toc184617482 3.4.2.小结 PAGEREF _Toc184617482 h 35 HYPERLINK l _Toc184617483 3.5.统一事件处理平台 PAGEREF _Toc184617483 h 35 HYPERLINK l _Toc184617484 3.6.第三方集成和功能扩展 PAGEREF _Toc184617484 h 38 HYPERL
6、INK l _Toc184617485 3.7.统计报表 PAGEREF _Toc184617485 h 39 HYPERLINK l _Toc184617486 第四章与效劳管理平台集成 PAGEREF _Toc184617486 h 42第一章总述HP公司一直活泼在国内外的IT运行管理市场,并以其许多重要的成功案例享有美誉和相当高的市场占有率。在技术迅猛开展的今天,交通行业的IT化也在飞速开展,整个IT系统的综合利用正逐步走向一体化,HP的硬件、软件和实施经验,必然有助于商务电子化进程的开展壮大。本建议书将针对某某公司以下简称“某某公司应用系统管理建设的需求进行相应分析,并在此根底上,介绍
7、基于HP管理平台的解决方案,旨在通过HP及合作伙伴在国内外相关领域内的成功经验,为某某公司应用系统管理建设一个功能完整、灵活可靠、平安和可扩展的IT系统管理监控平台。第二章方案总体架构总体设计思路随着计算机技术的不断开展,某某公司的IT根底架构也随之不断开展。目前,某某公司已经建立在全国乃至全球的网络根底上建设了各种电子业务系统。随着乘坐飞机的乘客人数的不断增多,IT根底架构和系统规模也不断膨胀。目前,对于某某公司,IT对业务的支撑力度已经是越来越强大;而另一方面,业务也愈来愈依赖于IT。IT系统的稳定性有效性可靠性将对业务造成直接的影响。因此,如何对IT进行有效监控管理,如何对故障进行及时有
8、效地排除故障,如何及时发现IT的各种潜在隐患,也已提上日程。单纯依赖人工方式已经很难有效及时地掌握如此庞大的IT系统的全面状况;对故障的及时处理和发现潜在隐患就更加困难了。而且,业务部门对于IT部门的定位正在转为效劳的使用与效劳的提供之间的关系。业务部门对IT提供的效劳要求越来越高,对于系统的可用性实时性都提出了更高的需求,目前的管理模式和人工方式已经无法满足。这些都已经对某某公司的IT建设提出了新的要求。本次工程的主要目标之就是通过实施电子化的监控工具以对系统及各应用软件进行有效监控,实现对故障的及时发现和对性能状况的准确把握;当然,监控的最终目的仍然是为了解决问题和防止问题;所以,我们同时
9、也通过IT效劳管理流程来实现对故障的及时有效处理,对潜在隐患的及时排除,通过量化指标来确保所提供的IT效劳的持续性和质量标准。事件管理流程的建立和效劳台的实施将使IT运维人员从无序、被动的、疲于奔命的救火队员的角色转换为有序、主动的和积极的IT效劳提供者。由于,某某公司已经实施了惠普公司的OpenView Service Desk作为IT效劳台,那么就存在和现有的IT效劳管理平台的功能集成。因此,对于某某公司的系统管理需求,惠普公司认为它不但是系统硬件、网络环境、应用软件平台等方面建设,还应同时兼顾与之相配套系统运作管理,效劳台热线, IT组织及管理流程等的建设,从而确保系统的稳定性, 可靠性
10、以及满意的客户效劳,使IT能够对政务的连续性提供保障。惠普提供的IT监控效劳解决方案不仅是一个软件安装、实施的过程,而且是针对IT运维体系的全面解决方案。我们提供的设计方案包含监控部署设计,系统管理软件、应用管理软件等运营工具系统的设计实施,惠普公司希望通过这个工程的成功实施,帮助某某公司作到:建立统一的系统管理平台,监控、管理某某公司现有的各种效劳器、数据库、中间;建立统一的应用管理平台,监控、管理某某公司现有的关键业务应用系统;及时掌握各种资源现状和运行信息,为信息分析、系统优化、决策提供支持,实现管理信息和经验的共享;与现有的IT效劳管理平台集成,实现通过有效的管理组织和流程,保障业务的
11、稳定、高效、持续的运行。建设原那么开放性和标准化原那么以HP OpenView为平台建立起的IT监控效劳管理平台具有很好的开放性。HP公司很早就公布了Openview丰富的应用开发接口API。被众多的合作伙伴看好,并将HP OpenView作为其网络设备管理的平台软件,如Cisco公司的Cisco WORKS,3COM公司的Transcend,BAY Networks公司的Optivity等。这些厂商的网络设备管理软件均可透过HP OpenView界面进行调用,监控、配置和管理,网络事件的报警及事件的记录均可反映到HP OpenView环境中,充分表达了良好的集成性。HP OpenView解决
12、方案的API接口是基于C语言的,提供了功能强大的可调用的管理函数和公共效劳。通过这种方式支持用户及第三方合作伙伴开发多平台的、可扩展的分布式网络管理应用软件。HP公司是网管论坛的成员之一,同时HP Sevice Desk 网管流程管理模块又是全球少数几个通过国际ITIL组织标准认证的产品之一。先进性和可扩展性原那么HP Openview 整体解决方案在满足国际网管组织的标准同时,采用了先进的专利技术,例如在系统管理中,使用了独特的智能代理技术,从而到达智能的高效管理,又实现了管理信息的低开销;特别是结合先进的IT管理理念和管理流程的设计符合国际ITIL标准,使得IT监控效劳管理平台到达了整体的
13、先进性,同时Openview模块化的产品结构和分级管理的优势,使得随着未来的业务提升,管理系统具有良好的可扩展性。经济和实用性相结合的原那么此次IT监控效劳管理平台的设计面向某某公司的需求,在核心功能保证的同时,可以附加针对性的二次定制开发,所以具有很强的实用性,可以满足监控不同系统的实际需要,也使性价比得到大幅提升。可靠性和稳定性原那么Openview管理模块已在中国市场上销售十余年,核心模块已到了8.0版本,所以功能使用已非常可靠、稳定。高可用性和高可管理性原那么Openview 的功能模块都为HP公司开发,故HP OpenView各模块间可以保持统一的应用界面,方便使用和管理,也节约了对
14、管理人员的培训时间。系统管理员可通过简单易用的图形界面,用鼠标拖拉对象就可完成各种系统资源的复杂管理工作,不必去记不同平台、不同系统上的复杂操作命令,同时支持WEB形式的远程操作,降低管理难度和管理工作量。同时简单易用的图形界面使用户易于掌握,能快速实施系统管理任务。这样使IT监控效劳管理平台具有较高的可用性、可管理性和可维护性,使管理人员易于维护,并且能通过相应的功能模块对效劳器、数据库、中间件、应用等进行实时监控和管理。方案总体架构我们为某某公司设计的方案功能逻辑分为两大层:IT 监控管理平台层和IT效劳管理平台层。如下列图所示:一、IT监控管理平台我们针对某某公司系统管理需求,从用户的实
15、际需要出发,提供一套全面的综合的运行维护管理系统,包括:系统管理:收集主机、网络,数据库的故障,并可通过定制的过滤策略实现对故障的管理,同时,可形成历史记录供今后管理员参考故障再次发生时的解决方法。实时监控主机、数据库和中间件的各性能状态,并形成历史记录,供分析和上报使用。数据库、中间件管理: 监控数据库、中间件的故障和相关的性能参数,从而管理企业内部的关键的业务应用运行状况。与第三方集成: 与存储管理软件等第三方软件集成,实现统一的事件管理。二、IT效劳管理平台 在本次方案中,由于IT效劳管理平台在某某公司已经实施,那么主要工作是与IT效劳管理平台的集成,包括包括如下几方面。可以将故障事件传
16、给IT效劳管理平台,形成票单。如果有需要,监控管理平台还可以接受IT效劳管理平台输出的事件,在监控管理平台主控台执行脚本和命令行等。 还可以进行局部配置项信息的传递。第三章监控管理平台监控管理平台架构为了满足某某公司对于应用系统综合管理的要求,我们推荐HP公司的业界最先进的IT系统综合管理解决方案:企业级的统一的事件管理平台,先进的系统、数据库、中间件监控解决方案,业务流程监控解决方案,如下列图所示。在本建议书中,根据HP对IT管理系统的深刻认识和成功经验,为了实现对硬件设备和软件系统的监控进行管理,我们推荐采用HP OpenView Operations/Performance作为核心的故障
17、/性能监控管理平台。配合网络管理软件HP OpenView Network Node Manager和针对各种应用的智能插件(Smart Plug-Ins)实现对网络、系统、数据库、中间件的集中监控和事件处理中心。同时,由于某某公司的效劳器数量大,种类多,我们在这里也推荐局部效劳器使用无代理方式进行监控。何谓无代理监控?即通过远程进行监控,而不需要在被监控系统上安装任何程序或Agent,通常监控通过标准协议和登录完成,例如对于Tuxedo的监控将通过Tuxedo客户端来进行通讯。为什么推荐局部采用无代理的监控方式呢?因为它有如下的优点:更为便捷的部署:由于不需要在被管系统中安装代理,部署通常就
18、更为便捷;变更管理的复杂性低:由于只需要升级中央效劳器,升级流程通常就更为简单;数据权限的一致性:通常一个机构的多个部门都需要使用数据,而标准的技术(如SNMP或WBEM) 可以让多个部门和工具方便地使用同一数据;被管系统所使用的资源更少:一般来说,在一个系统中,无代理监控是基于代理监控的一个子集,因此需要的资源就较少;由于没有代理本钱,被认为是更经济的解决方案。但也由于技术的限制,一般适合在非关键的效劳器。对于具备以下条件的效劳器,我们还是建议采用传统的Agent监控:需要获取大量深度监控数据用于分析,例如想通过监控数据库获取大量信息来分析数据库性能。对于有些关键监控数据无法从远程获取。用户
19、网络条件特别不理想。需要非常复杂的性能监控,获取大量历史数据并分析。总而言之,使用惠普公司的产品SiteScope用于无代理远程监控,OVO作为监控管理平台,完成事件关联、处理及报警功能。监控管理平台产品推荐因此,产品推荐如下:HP OpenView Operations 和HP OpenView Network Node Manager 搭建网络、系统综合管理平台,实现对重要主机效劳器的管理,包括主机的故障管理和性能管理,同时完成对网络拓扑、网络故障、网络性能;网络和系统事件的统一监控,将主机管理与网络管理纳入到Openview的统一管理平台中。HP OpenView Performance
20、 Manager 实现对重要主机系统的性能管理,包括性能监控、告警、报告等。HP OpenView OVOP Agent 安装在重要被管主机上,实现对被管主机的效劳器系统的故障和性能管理,每台被管主机上安装一套。HP OpenView Smart Plug-In for Database 数据库管理插件,实现对重要Oracle和SQL Server数据库运行状态的实时监控及故障与性能管理。HP SiteScope实现无代理管理,实现对一般效劳器的故障管理、性能管理和之上的应用管理。HP OpenView Reporter报表工具,实现对故障数据和性能数据的统计分析功能。OpenView Ope
21、rations将为某某公司提供一个公共的企业级管理控制台,从一个地点就可以管理某某公司的所有软、硬件。采用OpenView Operations 作为统一事件处理平台,统一对IT的事件进行处理。以统一界面集中管理事件。用户可以在事件主控台上看到所收到得事件的发送源系统名,事件类型,事件产生的时间等。事件主控台的设置有很强的灵活性,可根据用户的不同要求而改变,以适应用户业务的需要。通过OpenView Operations的控制台上对事件的自动触发,可以和效劳管理平台集成,生成各种票单,传入流程处理环节。网络性能和故障监控对于网络通信系统的监控,我们推荐采用以HP OpenView Networ
22、k Node Manager 为核心的网络管理解决方案来实现对于配置,故障,性能及平安的管理。HP OpenView Network Node ManagerNNM是领先的网络管理解决方案,它以直观的图形方式提供了深入的网络视图。Network Node Manager能够发现网络设备,并提供显示网络实际状况的视图。多层次映射图显示了哪些设备和网络分段工作正常,而哪些局部需要引起注意。当报警浏览器上显示出主要设备的故障事件时,Network Node Manager功能强大的关联引擎(correlation engine)就能够分析事件流并找到故障的根本原因。趋势分析、阈值和数据仓库等功能实现
23、了防患于未然的网络管理。Network Node Manager是基于SNMP管理协议的平台,它提供了业界最为广泛的SNMP协议的支持,从SNMP v1到SNMP v2以及基于partition认证的SNMP v3都提供了广泛的支持。随着当代IP网络技术的飞速开展,围绕Network Node Manager之上,OpenView提供了更多的技术手段来拓展IP网络管理的手段来超越传统基于SNMP管理的局限性。同时OpenView Network Node Manager作为管理平台,提供了大量的第三方管理软件的集成,如应用广泛的CiscoWorks2000设备管理软件。网络配置管理在网络配置管
24、理的方面,主要通过OpenView Network Node Manager 采用SNMP采集的方式来实现。NNM的自动发现和监控机制能够发现网络节点包括路由器,交换机和第二层的交换设备如网桥等,检测网络连接,生成和保持TCP/IP网络图,通过色彩确定网络设备的运行状态,使用OpenView Windows的Pan和Zoom的功能在保持总图象的同时将视点着重于大型子图的关键区域。通过MIB浏览器了解外围设备的工作状况,对不能监视的外设,可通过在被管节点上扩展SNMP子代理,在管理站上装载其MIB的方式对其进行监视。使用预定义的MIB应用或创立MIB查询应用监视网络连接的通信速率,信息流量等。N
25、NM的这种特点使得具有多厂家系统平台、网络、计算机等复杂环境的管理变得更加真实、直观和简便。Network Node Manager可以发现网络上的TCP/IP、IPX(在Windows NT操作系统上被Network Node Manager支持)和Level2设备,支持DHCP动态主机配置协议,并将这些信息以直观的图形格式表示出来(Level2发现功能包括支持Bridge、或者MAU MIBs的设备)。Network Node Manager持续地监控网络上新的设备和网络设备状态。发现和监控功能还可以探测到位于广域网上的设备。Network Node Manager自动发现的网络拓扑图除了
26、可以自动得发现网络配置结构之外,NNM还可以动态地自动更新网络拓扑图和事件信息。网络拓扑是以图形或者表格的格式表现的,提供了最大程度的灵活性。另外,SNMP Data Presenter令用户可以查询网络的SNMP数据,例如接口流量、CPU负荷或者通讯路由(traffic routing)等,以帮助进行网络诊断和方案。NNM对于所搜集到的信息具有简化功能,提供发现过滤,拓扑过滤,图象过滤功能,使企业可以根据自己的需要,选择要发现监控的对象,定制MAP的显示内容,通过这些功能可以减少网络流量的负担,更能让管理人员集中注意力于重要和密切关心的网络局部。NNM支持Cisco Discovery Pr
27、otocol(CDP View),可以形成针对Cisco设备的拓扑结构图。并可方便的查询Cisco设备的配置信息,包括Cisco设备中的VLAN设置,以及和此设备连接的设备信息。网络故障管理对于网络故障的管理,这里分别从故障数据的采集,故障信息的处理,以及故障信息的展现三个不同的阶段来阐述。故障数据的采集:对于IP网络故障数据的采集,传统上主要采用的是周期性通过ICMP ECHO来了解某一IP节点的状态以及SNMP协议的状态轮询、MIB采集和网络设备主动发送的SNMP Trap(Inform)来实现,OpenView Network Node Manager正是采取以上方法的IP 管理平台,通
28、过合理的设置轮询的周期来有效的监控网络故障,同时通过图形化的手段直观地展现故障及对于运行的影响。除了以上提到的snmp方式之外,某些网络设备,例如 CISCO设备,可以将运行日志syslog写在某台主机上,所以可以通过分析syslog的方法来了解网络设备的运行状况。OpenView Smart-Plug-In for Data Network Devices通过对于常见的数据网络设备的运行日志文件定制管理模板,从中提取故障事件。故障事件数据处理:由于网络管理涉及的管理对象分布广泛,如何在大量的故障信息中获取有价值的信息将会是网关系统的重要工作,所以作为一个网管系统,事件信息的过滤和关联是相当重
29、要的一个功能。本方案中所有的重大网络故障信息将统一的集成到OpenView Operation Manager的综合处理平台上,OpenView Operation Manager提供了完善的事件过滤功能,例如对于通过显示该事件的始发时间,最终发生时间以及重复次数将大量的重复事件压缩到一条;与此同时,OpenView Network Node Manager和Operation Manager提供的事件关联引擎有效的关联处理一些常见的网络故障,例如:连接设备失效,定期的维护,重复的网络报警、成对的报警事件等关联逻辑。故障信息的展现:这里包括了多级别报警,故障在图形化界面上的显示以及由故障触发一
30、些通知的手段组成。OpenView 提供了基于Java的故障管理客户端,使得操作员可以通过远程登录了解到目前的运行状况,同时OpenView也提供了事件触发的手段,例如可通过配置在重大事件发生时拨打呼机、email或短消息需短信网关支持通知网络管理员。对于性能管理的方面,建议以OpenView Network Node Manager为采集平台,通过NNM的Data collection & Threshold Alarming进行snmp数据采集和在此根底上的阈值报警,其snmp数据采集可定时倒入其数据仓库(通用关系型数据库,可以是NNM内置数据库,Oracle或SQL Server),这些
31、数据将被汇总和调整。事实上,包括端口流量,误码率,路由表,帧和字节数的统计等等都可通过SNMP的采集取得,而且Network Node Manager事先已经配置好了一系列的Data Collection,包括端口利用率、节点响应时间等等。OpenView Network Node Manager数据仓库包括了一个开放的结构,允许报告和数据精简工具的存取,历史数据的分析功能使得网络经理们可以防患于未然地维护网络的正常运行。同时数据仓库中的数据可以在NNM中以图表的方式显示,以供管理者分析网络的状态和趋势。系统监控有代理方式系统管理系统故障管理建议采用OpenView Operations实现系
32、统故障管理。利用OpenView Operations可以对某某公司的系统中主机的运行状况进行监控,使系统管理人员及时了解效劳器的重要资源和参数运行状况,出现故障时迅速报警,并可自动采取措施排除故障,保证关键效劳器的可用性和可靠性。OpenView Operations是Manager/Agent管理结构:管理中心安装OpenView Operations Manager,被管理系统上安装OpenView Operations Agent,其中Agent(代理)是智能型的和主动的,能够实施策略并协调与Manager的关系:它们监控事件和状态,提供配置、管理效劳的接口。OVO的agent是智能的
33、即在网络不通或者是管理站down机的情况下,可以不经上报管理站,直接在本地自动采取相应的行动解决故障。在管理中心安装好Operations Manager后,Agent可通过网络自动分发到被管理系统。OpenView Operations对系统资源及日志的管理功能包括:监控操作系统运行参数可实时监控所有安装该模块的被管理系统的以下运行参数:CPU利用率,显示系统、用户、空闲时间的百分比;交换空间利用率;文件系统使用情况,如:磁盘空间利用率、文件大小等;I/O的使用情况并可根据需要定义参数的报警门限,当某参数超过门限值时,Agent向管理中心产生报警信息,并自动执行用户预定义的动作。监控用户自定
34、义的性能参数用户可以利用OpenView Operations定义自己感兴趣的一些性能参数,如:效劳器上某-网卡端口速率在7M以上的时间,并可根据自己的需要定义参数的报警门限,当某参数超过门限值时,Agent向管理中心产生报警信息,并自动执行用户预定义的动作。监控操作系统关键日志文件通过OpenView Operations Agent,可实时跟踪所有安装该模块的被管理系统的任意日志文件的变化情况,利用该功能,可跟踪操作系统、数据库及用户应用系统的日志文件,当日志文件中出现的用户所需的特定信息,判断目前系统的运行状况,自动执行用户预定义的动作,从而实现对操作系统、数据库及应用系统运行的动态监控
35、。同时向管理中心产生报警信息。监控用户自定义日志文件OpenView Operations Agent不但可监控操作系统的特定日志文件,用户还可以在被管理系统上自己定义并生成一些自己感兴趣的日志文件,如:某些特定操作记录、某些应用程序输出结果等。通过OpenView Operations Agent跟踪所有被管理系统上的这些日志文件的变化情况,当日志文件中出现的用户所需的信息时,自动执行用户预定义的动作,同时向管理中心产生报警信息。这样一来用户可灵活定制用户自己的管理策略。监控主要的配置文件可对客户指定的配置文件进行监控,当配置文件被修改后,产生告警,并且可将修改的局部记录下来,如增加了哪些还
36、是删除了那些。监控用户指定的进程通过OpenView Operations Agent,可实时跟踪所有安装该模块的被管理系统的任意关键进程和效劳的运行状态,利用该功能,可跟踪操作系统、数据库及用户应用系统的进程和效劳,当这些进程和效劳出现故障或停止时,那么立即向管理中心产生报警信息并自动执行预定义的动作,如自动恢复进程和效劳的运行。例如:当某台WEB效劳器上的 进程突然停止了,Agent监控到这一信息后,自动向管理中心报警,并执行系统命令重起 进程。系统性能管理对于某某公司中的关键效劳器系统资源,如CPU,DISK,MEMORY,NETWORK的使用情况、性能参数如何,是否满足业务开展需要等,
37、也是管理所实现的重要内容。OpenView Performance软件模块,提供应某某公司一个端到端性能管理的强有力解决方案。其中OpenView Performance Manager安装在管理中心,是一个集中的性能管理控制台。它提供一个统一的图形界面和一个公用的方法,用于集中监视、分析、比拟、预测系统资源利用情况测量数据即性能数据。OpenView Performance Agent安装在被管理系统上,系统资源利用情况的测量数据性能数据就是由Agent收集的。同时通过OVPM可以对将来的数据进行预测:即根据原来的历史数据可以粗步预测将来的性能走势。OpenView Performance在
38、以下两个主要领域提供功能强大的性能管理能力:IT资源规划和效劳管理OpenView Performance解决方案,提供了IT资源运行情况的历史性能数据,这些性能数据是IT方案活动之关键。Performance Agent带有专利智能收集技术,安装在分布式IT环境的具体系统上。它从应用软件、数据库、网络和操作系统,收集广泛的资源和性能测量数据。Performance Agent对这些数据进行汇总,为这些数据打上时间标记,并将这些数据记录到Performance Agent所在的本地系统上。Performance Agent还提供一条途径,来跟踪端到端应用软件响应时间:它可利用Applicati
39、on Response Measurement(ARM*,应用程序响应时间测量)标准,来进行应用程序响应时间测量,监控关键客户机/效劳器应用程序的性能。使用Performance Agent历史性能数据,Performance Manager管理控制台使得对资源使用率和性能趋势的检测和了解成为可能。通过这种检测和了解,你可以发现导致性能缺乏的瓶颈问题,并且你可以对你的IT资源进行规划,以确保业务的性能要求得到满足。通过比拟系统活动级别,可以平衡工作负载,以使现有设备得到最优使用。Performance Agent数据还可以被输出,以用于容量方案capacity planning、统计分析和电子
40、表格应用。IT可用性管理和问题解决Performance Agent不断地监视其数据,以探测意外性能情况。意外性能情况可能基于某个推测,或基于假设干准那么的结合,可以使用阈值和持续时间来定义。例如可以定义,当一个客户/效劳器应用程序的响应时间超过了一个预先定义的域值或者当CPU使用率保持在75以上,而等待队列长度大于3,且持续5分钟以上,就发生一个意外性能情况。每当Performance Agent探查到一个意外情况,就产生一个报警消息。Performance Manager管理控台接收并维护Performance Agent报警信息列表,这些消息可发生于网络的任何地方。要获知关于某个报警的更
41、多信息,选中该报警信息,Performance Manager就会自动给出描述该意外性能情况的一张图和数值数据。这为你提供了对有关IT性能计量的一个与时间相关的管理信息视图,从而提供对慢速响应时间的原因诊断。同时当收到警报信息时,Performance Manager可自动启动预定义的本地动作,如发电传或电子邮件信息等。OpenView Performance所监控的性能参数包括:CPU性能相关管理参数CPU使用率以及用户活动CPU中运行的队列长度、系统呼叫次数CPU运行在用户态的百分比CPU处于空闲状态的百分比磁盘性能相关管理参数硬盘的忙碌程度硬盘忙碌期间的平均队列长度可以进行页面交换的空闲
42、磁盘块文件系统容量及文件系统空间利用率磁盘使用率与用户、虚拟内存每逻辑卷的读写、次数与I/O速率内存性能相关管理参数每秒钟页面调入和调出数量系统与用户进程对可用物理内存的使用率物理、可用内存调入和调出错误、交换I/O、虚拟内存读写与高速缓存容量进程性能相关管理参数进程与主进程识别号码、进程运行优先选项、用户名、进程的CPU使用率、磁盘I/O速率、内存使用情况进程驻留集大小与进程等待的资源等待运行进程队列长度、可运行态进程运行队列长度用户程序运行状况管理参数应用的CPU、I/O与虚拟内存使用率应用的进程数量、进程等待状态以及总体进程运行周期应用活动进程数量与主要错误应用的交易名称、次数、平均响应
43、时间、响应时间参数分布与失败交易数网络流量主机网络的I/0主机网络的收包率主机网络的发包率主机网络的冲突率主机网络的错误率NFS调用率数据库监控对数据库的采集,Openview有专门针对数据库的智能插件DBSPI来完成对数据库的管理。它也是预先就做好了对各种数据库采集和监控的模板,简化管理员的工作。DBSPI插件安装后即可投入使用,只需要极少的配置,通过分散在各处的IT人员的协同努力就可提供效劳。管理应用或数据库的数据收集需求将会预定义,而更正操作操作员激活或自动激活可以预先设置。此外,OVO提供的诊断报告和图表用于提供故障发生时的状态信息,同时为未来的分析提供趋势和历史数据。这些缺省设置可由
44、IT工作人员进行设置,以提供满足该机构特定需求的特定信息。对于缺省DBSPI没有提供的KPI,可以通过简单的二次开发实现,DBSPI可以通过标准的SQL语句进行扩展,不需要用户掌握另外的私有开发语言。我们推荐采用HP OpenView SMART Plug In for Oracle/DB2/Informix实现对数据库的管理功能。它是网络系统管理平台HP OpenView Operations上的插接件,提供对分布在企业范围的、多厂商环境的Oracle/DB2/Informix数据库集中的监视、控制与管理。其主要功能有:监视数据库的状态、CPU利用率、数据库空间使用率、数据进程数目、数据库连
45、接数目、缓冲区命中率、锁状态、数据库日志等。如果状态出现问题,可以给数据库操作员报警并关联预定义的校正或预防动作。这些动作包括:启动和停止数据库效劳器;输入/输出数据;归档/存储数据;执行SQL的启动,停止,状态,和日志文件工具;配置参数文件等。采集,分析,过滤,监视数据库的表空间,碎片情况。连续监控数据库表剩余空间并与预定义的阈值比拟。以图和报表的方式显示任何数据库实例和相关的可用资源的历史和实时信息,包括:显示数据库用户,交易,共享内存,和其它的实例的摘要信息;显示分配的表空间,自由空间和碎片;计和缓冲区效率统计;会话和SQL活动;等待状况;优化器效率。可对数据库的资源状况进行分析:为数据
46、库提供不间断的监测。其中包括自动发现环境,在监测到潜在的问题或错误时发生警告和警报,在适当的情况下执行自动纠正例程,当需要立即管理时,与先进的通知系统接口以获取远程消息。在被授权的情况下,通过分配最大的可用空间来调整增长的数据库对象的大小,从而防止空间缺乏的问题影响用户生产率。为有关恢复或用户定义操作的报告提供解释数据点。管理员可以通过一个本地数据点快速地检索关于参数值、历史和警报的更详细的上下文数据。自动测量档案目的设备上的可用自由空间量,并确定适合于剩余空间的档案日志数量。为维护充足的档案容量提供有价值的管理效率。跟踪在为效劳器实例指定的时间段内发生的存取连锁行的次数。跟踪在每个轮询期间等
47、待阻塞恢复的比率,它为数据库性能提供了一个关键的基准数据。高的等待率说明存在潜在的表冲突问题。监测缓冲区命中率,显示了读取数据缓存的操作与全部读操作的比率。中间件监控对中间件的采集,Openview有专门针对中间件的智能插件来完成对中间件的管理。它也是预先就做好了对各种中间件采集和监控的模板,简化管理员的工作。HP OpenView Smart-Plug-in for Websphere 管理套件实现对于Websphere中间件系统的数据采集和管理。具体监控的参数主要有以下几方面:可用性包括:应用效劳器状态、管理效劳器状态应用效劳器的性能包括: JVM内存使用情况、缓冲区线程请况等EJB包括:
48、 EJB Pool使用请况包括命中率、EJB的平均响应时间、EJB的调用情况包括从数据库导入导出的频率等Servlets包括: Session的平均存活时间、Session接入和有效的情况Web Application包括: 每秒Servlet的请求、Servlet的平均响应时间、每秒Servlet的错误、Web Application每分钟导入或重新导入Servlet的数量JDBC包括: JDBC连接池的连接数、等待连接的线程数、客户等待连接的平均时间、连接池使用情况、客户等待连接超时数、连接池的处理量事务Transaction包括: 全局和本地事务的期限、本地事务提交的平均期限、全局和本地
49、事务的回滚、超时和提交数等。相关产品的特点数据采集方面OVO主要通过Agent实现IT系统网管系统的数据采集功能,其中包括对主机、数据库、中间件、业务应用对象,实现告警数据、和性能数据的采集。通过OVO agent及其扩展功能,OVO的数据采集具有一下特点: 高效性所有的数据采集都通过OVO的agent进行,其中对主机和网络的采集是系统缺省的功能,根据HP公司长期研发操作系统的经验,所有的采集都是发生在系统内核级的,因此能够保证其高效性。对主机系统的采集500多个参数,占用CPU资源可以保持在1以下。同时对于采集对象,OVO会合理安排采集时间,例如有100个指标是要求5分钟采集一次的,OVO会
50、计算将这100个采集任务分布在5分钟的时间间隔中,而不会到一个时间点统一采集,这样可以防止对系统造成不必要的压力。完备性通过OVO的agent可以采集所有被管设备的信息,包括系统缺省的和二次开发的,并且支持对业务性能数据的补采和重采机制。同时Agent和网管效劳器之间的通信机制采用平安加密的 s协议,杜绝了SNMP协议可能造成的数据丧失SNMP采用UDP协议,是一种不建立连接的协议,不能发现数据丧失,当数据传输错误时,系统会主动要求重新发送。实时性对于告警数据,要求很高的实时性,以保证能够尽快的发现故障,对于网络设备,我们要求所有的网元将Trap地址指向网管效劳器以到达实时处理的目的。在OVO
51、内部,对告警信息和性能信息采用不同的处理流程,告警的所有信息都是先处理、后入库的,对告警的过滤、关联、匹配等都是在内存中进行的。开放性和标准化OVO的采集可以使用被管平台支持的任意语言进行能力的扩展,具有开放的SDK,用户可以使用任何语言扩展其功能,而不局限于网管厂家所提供的私有语言,Openview具有专门的开发人员论坛,所有系统都是完全开放的,最典型的是HP开放所有的数据库模式,用户可以任意进行二次开发,目前Openview在世界上有3000多家合作伙伴在其上开发应用。Openview内部使用完全标准化的协议 s、使用标准的开放数据库,遵从国际电联告警格式的标准化。告警展示与操作方面在OV
52、O中,可以将告警分配给属于不同角色MessageGroup的人员,当维护人员查看告警列表时,只是显示分配给他的告警消息。对管理人员显示对业务影响较为严重的告警和告警处理记录。故障监控提供图形化的管理界面,实现对业务支撑系统和网管系统自身的统一监测和集中展现,保障业务支撑系统和网管系统的正常运行。图形界面主要包括:告警列表Alarm Browser:以滚动列表的方式动态的显示当前活动告警消息。告警面板Dashboard:以饼图、直方图等方式统计显示当前所有的活动告警。业务拓扑图和综合树图:通过将告警消息映射到业务拓扑图上的节点,可以直观、综合的、全局的了解告警影响的范围和告警的根原因。显示的告警
53、字段可以用户自定义,系统默认的为严重级别、重复次数、接收到的时间、告警源、接收消息组、消息产生对象,消息正文。用户可以增减字段,操作完成后可以立即生效。告警监视界面应能显示所有的活动告警事件,每条告警事件以不同的颜色标识相应的告警级别。告警事件的颜色标识与业务拓扑图显示保持一致。并以适当的颜色表示。拓扑应用方面OVO针对运维人员对浏览、监控的不同的侧重层次以及被管理对象本身所具有的不同自然属性,使用应用拓扑视图,被管理的对象在视图中用一个对应该对象类型的图标显示出来,随着该被管对象的状态改变,图标的颜色也随之改变,用户可以一目了然的发现出故障的节点。HP 效劳模型系统中使用HP OpenVie
54、w Service Navigator进行应用拓扑的展示。HP OpenView Service Navigator 是 HP OpenView Operations 基于Java 操作员GUI 的一个外接组件。当Operations 检测、解决和阻止您IT 工作环境中的网络、系统和应用程序中出现的问题时, Service Navigator 会带您采取进一步的行动。 Service Navigator 会让您把 OVO 发现的问题映射给您要监视的IT 效劳。您无须专注于复杂的IT 工作环境中的单个元素,只要通过专注于您负责的IT 效劳就可管理IT 工作环境。Service Navigator
55、 基于 OVO 并依赖于 OVO 提供的监视、消息和动作能力。如果OVO 管理的一个对象上出现了问题,就会生成关于这个问题的消息并发送给负责相关区域的用户。安装和配置了Service Navigator 之后,该信息就映射给受到问题影响的效劳,然后发送给负责那项效劳的用户。问题的严重级别状态也会改变效劳的严重级别状态,因此用户能容易地识别出有问题的效劳。为解决与效劳相关的问题, OVO 的问题解决能力已进一步扩展到包括特定效劳分析操作和动作。可以根据效劳节点间的依赖关系,有助于您在效劳性能损坏之前快速识别并解决影响效劳程序的最关键问题。使用Service Navigator 处理问题有两种方法
56、:传统的方法是观察进入消息浏览器的信息,然后突出显示受到影响的效劳并做受影响效劳分析以找出是哪个效劳程序受到了影响。遵循效劳导向的自上而下的方法:翻开Service Graph 并监视显示的效劳程序的状态;当效劳程序的状态改变了,做根原因分析以找出产生问题的根源所在。受影响效劳分析功能:通过自下而上的分析,给出底层效劳节点发生故障情况下,所有受影响的效劳情况。该功能可以帮助操作人员决定解决问题的优先次序。根原因定位功能:该功能帮助操作人员在一个复杂的含有多个级别的效劳层次中快速定位出影响效劳正常运行的根源,是因为该效劳自身的故障还是一个重要的子效劳或是几个子效劳出现故障。“根原因分析执行自上而
57、下的检查,它停在问题产生的效劳层次级。业务视图角色权限控制功能:Service Navigator中展现的业务视图是根据用户的角色或权限范围的不同而只展示用户关注局部的业务视图。这让用户既无须专注于被管理系统中的单一对象,也无须为被管系统中众多的业务而分心,而只要专注于其所负责的局部就可以有效的进行管理。动态效劳标签功能:业务视图中的每个效劳都通过一个标签来识别。通常这个标签就是效劳的名称。Service Navigator中为了方便用户监视效劳的重要信息关键性能指标等,可以附加文本或图像标签在效劳图标下方实时动态的显示。例如:效劳动作功能:Service Naviagtor不仅提供了强大的监
58、控功能,还提供了方便的扩展管理接口效劳动作扩展接口。可以把效劳的管理工具直接集成到业务视图中。这样可以从业务视图中直接启动效劳的管理工具比方相应业务厂商提供的管理工具软件,查看/修改效劳的配置信息,浏览性能指标,管理活动/历史故障记录等。可以被集成的效劳管理工具,不仅可以在效劳运行节点上运行,也可以在管理效劳器节点上运行,甚至在任意一个指定的节点上运行。例如,直接在业务视图中执行“效劳重启动作后的结果输出窗口。该动作在效劳运行节点上运行。效劳可用性报表:该功能被启用,系统可以生成效劳的可用性报表。系统监控无代理方式SiteScope是由HP公司所提供的系统管理软件。SiteScope可以实施于
59、Windows PC 效劳器,Sun Solaris平台或是Linux之上,在统一的平台上集中式地管理各种不同的操作系统的效劳器,WEB效劳器,数据库系统,邮件效劳器,网络设备,应用效劳器等等资源。它的显著的无代理方式监控技术的应用,尤其适用于多变的系统环境之中,再加上SiteScope的远端管理方式和极其灵活的配置方式,将为用户的管理和效劳助一臂之力。主要功能特点Agentless方式的系统监控和性能管理在传统的网络系统管理软件中,大局部都采用Manager-Agent的体系结构。Agent是指安装在被管理的生产系统机上的一个或是多个代理程序,它负责采集被管理机上的一系列性能数据,并把数据传
60、递给Manager一端。尽管许多厂商宣称这些代理程序Agent将以较低的优先级和较少的资源消耗运作,我们还是无法防止这样一个问题。就是当我们的关键的生产应用系统发生性能危机时,我们无法排除代理软件Agent对生产系统的或多或少的影响。换言之,管理软件的代理程序的存在,干扰了我们对生产系统的维护和性能问题的诊断。尤其是在有众多效劳器的环境中,为了保障用户的托管效劳器的绝对的平安和无干扰,我们在此推荐SiteScope所采用的先进的Agentless系统管理和性能管理技术,它将防止在生产系统中安装任何不必要的代理程序。没有代理程序,被管理机的资源消耗和影响也减到最小。由于在SiteScope管理系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年高考数学信息必刷卷02(江苏专用)(试题版)
- 构件弹性伸缩策略-洞察与解读
- 焊材智能化发展-洞察与解读
- 可持续性设施设计策略-洞察与解读
- 可再生能源企业责任框架-洞察与解读
- 水土流失预测模型-第3篇-洞察与解读
- 2025 九年级道德与法治下册抗挫折心理韧性训练课件
- 2026年上海电力大学单招职业技能考试题库附参考答案详解(b卷)
- 2026年乐山职业技术学院单招职业技能考试题库及一套参考答案详解
- 2026年云南省昭通地区单招职业适应性测试题库含答案详解(预热题)
- 2026年山东潍坊市高三一模高考生物模拟试卷(含答案详解)
- 2026年工程质量安全管理试题及答案
- 长郡中学2026届高三月考试卷(六)物理+答案
- 建筑企业节后工地复工安全课件
- 山东济南市2025-2026学年秋季学期高一期末考试英语试题(试卷+解析)
- 碎片化运动在慢性病患者中的应用进展2026
- 2026年智能医疗手术报告
- 律师理论考试试题及答案
- 2026秋招:神州数码集团笔试题及答案
- 中医体重管理科普
- 英语-湖北省荆州2026届高三年级元月质量检测(荆州宜昌荆门元调)
评论
0/150
提交评论