




免费预览已结束,剩余5页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1. ITM集中监控管理解决方案概述IBM Tivoli Monitoring可以帮助监测和管理关键的 IT 服务和资源,其中包括操作系统、数据库、应用程序和异构环境。ITM建立在一个轻便、高度可扩展的体系结构基础之上,并且已经完全全球化。它通过一个称为 Tivoli Enterprise Portal (Tivoli Enterprise Portal TEP) 的新型门户界面将不同平台(包括分布式、主机和应用程序系统)的视图合并到一起。TEP 使您可以在单个视图中集成并利用多个可用性管理产品,包括 ITM 5.1、ITM 6.1、IBM Tivoli Composite Application Management、IBM Tivoli Enterprise Console 和 IBM Tivoli OMEGAMON XE 产品。为了保证应用正常运行的同时实现对重要参数的监控必须考虑管理信息对资源占用情况, Tivoli Monitoring对服务器的监控采用本地代理程序进行数据采集的方式(见下图),这种操作方式解决了传统的SNMP管理协议在进行系统管理时,由于可靠性和资源占用的问题会表现出力不从心。Tivoli Monitoring采用的是本地代理程序的方式,管理员将需要检查的信息传送给被监测的终端,安装在终端的代理程序就按照所定义的监控周期和门限值定义进行检查。如果正常,就不需要向管理服务器进行汇报,只有设备出现问题时,才将数据传递给管理服务器,并采用声音、警告窗口等多种方式报警,从而大大减少网络上的管理信息。IBM Tivoli Monitoring 的优点:l通过一个屏幕了解您的整个企业。l使用内置的复杂警报处理功能对问题划分优先级。lIBM Tivoli Monitoring 解决方案通过工作负载、网络和风险信息以及系统日志实时检测失控流程和资源消耗情况。“采取措施”(Take Action) 功能通过运行现有的脚本和从提供的模板创建的脚本来解决重复发生的问题,这样,您就可以把精力集中在其它关键领域上。 l“警报”功能不仅仅是设置一个简单的阈值。内置的情形编辑器使您可以创建复杂的阈值、情形和警报无需编写任何代码。这个功能使您可以通过图表方式合并许多衡量标准,以消除错误的警报。可用动态图表和表格来自定义工作区,这些图表和表格可即时正确地放置情形。l“专家建议”为如何解决已发生的问题提供建议。除了产品提供的情形,您还可以编辑“专家建议”,使之包含专门针对您的环境的解决方案,并为所有人员保留此知识。l IBM Tivoli Monitoring 解决方案使您可以将分散的操作系统信息合并到一个全企业系统性能视图中。这种完整的系统管理方法可以帮助管理不同的操作系统,例如 Windows、Linux、UNIX、中型服务器和主机。l 因为 IBM Tivoli Monitoring 解决方案为您提供一个可扩展、可自动化、可定制的解决方案,这样,您就可以妥善进行增长规划。实时报告给您提供有关分布式环境的即时性能信息,而历史报告功能向您显示一段时间里操作系统的性能情况。通过对实时和历史报告进行合并,您可以确定趋势、预测系统行为并制定明智的管理决策来指导未来增长。IBM Tivoli Monitoring 是一个真正的端到端的可用性管理解决方案,可以有效地管理 Microsoft、Linux、UNIX 甚至I/OS, z/OS 之间的性能和可用性。ITM 还包含一个新的 Tivoli Data Warehouse,“现成地”提供前所未有的报告灵活性,而且易于配置和适于使用。系统架构和方案在该平台架构中,我们分为三个层次:第一层:基础资源采集层,例如服务器、数据库、存储、备份系统、中间件、网络系统监控、应用监控等,我们使用专业的监控产品进行实现,并且将监控数据储存在数据库中,以便历史数据查询;第二层:功能层,功能层主要包括两大部分数据集中处理层和流程管理服务台,其中数据集中处理层我们主要通过Tivoli Netcool Object Server实现,包括压缩,事件关联,自动化处理等工作,并通过Netcool将事件信息传入历史数据库进行存储。通过统一的事件管理平台来整合基础资源与业务系统之间的逻辑关系,同时由Webtop实现综合监控呈现; 第三层:统一视图:统一视图需要实现以下功能,包括业务服务管理,系统管理,报表分析等。根据功能架构设计及IBM Tivoli相应产品的功能特点,以下是此次项目的技术实现路线:系统监控的范围服务器系统监控服务器管理针对整个系统中的大量运行关键业务的UNIX,Linux和Windows服务器,帮助提高其整体的对外服务可靠性。IBM Tivoli Monitoring可以将管理人员日常关注的资源对象、故障概率相对较高的资源对象、对应用影响较大的资源对象纳入到它的监控范围,管理人员通过制订监控策略并分发到管理对象上,从而获得对关键资源的7*24的监控能力。IBM Tivoli Provisioning Manager for Software可以实现跨平台环境的管理体系,这既包含Windows桌面机,也包含Unix、Linux服务器。TPM实现对这些不同系统服务器的硬件资产,软件资产扫描,为管理员提供全面,准确的系统软硬件配置信息,便于企业的资产管理。Tivoli Monitoring可以提供的监控包括:l监控操作系统的主要参数,如CPU利用率、显示系统、用户、空闲时间的比例;交换空间的利用率、虚拟内存的利用率、消息队列的情况等。l监控特定的文件系统,包括文件系统磁盘使用情况、使用率、监控重要的文件的大小等。l监控特定的进程,监控任意关键进程的运行情况和状态变化情况,利用该功能可跟踪操作系统、数据库及用户应用系统的进程,并这些重要进程因意外原因终止时,可根据需要自动重启,并将报警信息写入事件日志。 另外对于IBM System p 服务器提供基于硬件的监控,包括服务器的运行状态和可用性,在同一控制台提供关于AIX,LPAR,CEC和VIOS资源的丰富图形化视图,查看虚拟资源与物理硬件如何映射,实现强大的监控能力和快速体现价值的目的。数据库监控数据库监控是整个系统的关键之一,为了加强对这一资源的管理工作,IBM Tivoli Monitoring for Databses(ITM for DB) 提供了大量的数据库监控和管理能力,其中包括Oracle,DB2,Sybase,MSSQLSERVER,Lotus Domino等。Tivoli Monitoring for Database提供了一组预先定义的数据库监控器,可以监控所有的关键数据库性能比例,从简单的数据库状态到复杂的数据锁、客户端访问情况等的监控,以保证数据库的高可用性和性能。该功能基于IBM Tivoli Monitoring技术,允许用户为每个监控器定义多个事件阈值和自动维护操作。ITM for DB支持历史性能数据的分析,通过内置的Tivoli Data Warehouse,管理员可以按时间顺序将多个数据库服务器的历史性能信息存储到压缩的历史性能数据库中。这些信息将帮助用户获得资源使用的趋势和模式。这样,用户可对潜在的问题或空间需求心中有数。在整体分布式系统管理方案中,管理数据库资源十分重要。为了充分了解数据库的状态和性能,分析数据库之下的操作和为了资源也极其关键。Tivoli Monitoring for Database可以将这些系统资源的管理完美地集成于事件管理平台。Object server作为事件处理中心,能够收集所有被管理计算资源的警报和事件,包括数据库、网络和操作系统。Object server的分组和过滤功能显著减少了需要显示和人工干预的事件数。因此管理员就可以高效、有效地将精力集中于最重要的事件。通过IBM Tivoli的数据库管理软件,可以为数据网系统中的所有数据库系统提供统一的管理和监控功能。通过应用最佳做法,消除了数据管理员 (DBA) 面临的确定监测什么、何时监测以及如何解释和处理监测结果的两难局面,从而为集中精力执行更复杂的关键业务任务留出更多时间。IBM Tivoli Monitoring for Databases 提供始终如一的例行监测在数据库性能以及客户信心降低之前预见并纠正问题。IBM Tivoli Monitoring for Databases 的特性l提供带有预设阈值和自动纠正措施的监测程序。l提供自动的“现成”值,特别适用于下面这样的新客户:他们需要为确保其数据库的健康状况而捕获的关键指标方面的指导。允许自动处理例行任务,使高级 IT 人员和数据库管理员可以集中精力处理更复杂的问题。l提供单个产品,该产品具有一个一致的体系结构,用来管理不同平台之间的多个数据库。l能够将数据馈送到一个中央存储库,以便跟踪一致性,并预测服务水平协议的违背情况。l在不同 IT 规则之间整合管理系统, 易于集成到一个端到端的管理解决方案中。l提供历史报告和实时报告IBM Tivoli Monitoring for Databases 的益处l最大限度地提高 IT 人员的生产率和利用率。提供主动确定最重要且相 关的性能问题和事件的能力。l减少对 IT 和 DBA 人员的培训要求。提供针对 IT 资源的集中视图和控制能力,而不考虑其位置。l提供趋势分析数据,以便更好地规划和预测资源利用情况。l消除了使用多家供应商提供的不同产品管理企业的必要。网络故障监控Tivoli网络故障监控具有如下特点:4多渠道采集网络故障,典型的包括SNMP trap 、Syslog等4采集模块分布部署,面向未来扩展4采集模块具备健壮性能力,保障数据采集可靠性4长期以来积累的各厂商策略知识库(节省需求分析和定制时间)网络故障采集到统一事件平台后,可以进一步综合分析处理。网络拓扑、资产、基于拓扑故障根源分析Tivoli /Network Manager将实时报警与物理及逻辑网络设施联系在了一起,并将所有可能的数据路径映射到有关的最有可能引发该报警或故障的原因和根位置上。Tivoli /Network Manager的这种独特设计最大限度地扩展了系统的伸缩性和技术效率。Tivoli /Network Manager由两个基本软件部件组成:一个可能故障引擎和一个带网络发现引擎的2、3层拓扑服务器。拓扑服务器则从设备的物理位置直接收集大量的网络信息,并将其记录在该设备相应的逻辑标识下,从而将定义网段的物理拓扑与逻辑拓扑唯一地结合在一起。通过网络发现引擎,该服务器可以实际提供2、3层的信息。它首先发现网络部件,并通过可用的MAC和IP地址指出它们在网络中的位置。然后,它对2、3层网络拓扑与每一个部件的标识、它的物理位置以及MAC和IP地址实现映射。可能性故障引擎也接收来自拓扑服务器的信息。它首先计算出两个节点之间所有可能的路径以及可能的网关,并以每秒250,000个事件的速度对所有相关事件进行分析,最终确定数据的物理路径。网络分片技术可以自动识别PFE所考虑的实际物理路径的端口顺序。通过定义,路径数据结构可以包括“上行流”和“下行流”信息。这样,专门用于识别下行流报警的复杂相关算法就可以被省去了。可能故障引擎位于网络的物理数据路径之上,它可以识别数据的收敛点。当网络的某个位置显示的收敛点最多时,该点很有可能就是故障的始发点。因此,Network Manager真正是重新定义了根原因分析的概念。两个子系统的数据路径定义、相关事件定义以及可能原因的确定工作是共享的,但它们可以运行在不同的服务器上,以便最大限度地保证整个系统的伸缩能力。每个子系统还可以直接与NETCOOL Object Server、SQL数据库以及为NETCOOL/Network Manager收集事件数据和设备信息的其他数据收集器配合工作。Tivoli Object Server通过NETCOOL的探测器和监视器主机几乎可以收集每一台设备、部件以及由语音、数据、互联网和无线网组成的系统的事件管理数据,这些数据在经过去除冗余和处理之后被送到NETCOOL/Network Manager。以下是Precesion的网络分片方法区别于传统网络发现算法的几点理由:1.网络分片方法可以从多个层次收集相关数据,而不只是单纯的路由(逻辑)拓扑或MAC层数据;2.网络分片方法对设备的移动、增加和变化进行监测,并在计算物理路径定义时进行相应的补偿;3.网络分片方法可以理解和考虑不同厂商2层设备(集线器、交换机)在组织数据创建虚拟专网(VPN)或虚拟LAN(VLAN)时采用的方法;4.网络分片方法可以确定非管理设备所在的位置。网络设备、应用性能监控对关键网络服务,利用ISM进行服务水平管理,目前构成Netcool ISM系列产品的18种协议可以支持网络的核心服务,包括电子信函、文件传输、Web网页传输、新闻、目录服务、电子商务和网络安全等。这些服务对于衡量网络服务的水平和质量是至关重要的。Netcool ISM收集响应时间和可用性数据采用的是预先定义的默认时间间隔。以Web可以访问的格式加以存储。这些采集的数据以日为单位循环,随时保持24小时数据,可以提供即时的趋势分析和能力规划。对ISM监控的网络服务,可以根据服务本身的特性进行服务水平衡量的标准,以HTTP协议为例,会分析HTTP协议的Lookup、Connect、Response、Download时间,根据HTTP协议的各个性能指标,可以定义SLA的监控指标,如Lookup时间不能超过1ms,Response时间不能超过2ms等,并统计超过指标占总情况的百分比,如超过预定的比例则认为服务水平失效。通过ISM提供的监控界面,可以实时查看服务当前的服务水平和每天、每月等历史服务水平报告。ISM提供的监控器包括:SNMP监视器:对SNMP设备的SNMP服务进行监视,提供阈值报告和历史基线查阅,从而确保对系统状况的把握,实现系统的综合能力规划。SNMP监视器可以用来对类似指定机器的剩余磁盘空间、特定网络接口数据包丢包等质量状况进行检查。该监视器的配置支持SNMP对象标识(OID)的分组,这些对象标识可以随后用于具有相同类型的设备。SNMP监视器支持对网络设备的端口、CPU、内存和服务器的CPU、内存等性能数据的监测.RPING监视器:报告路由器的响应。RPING监视器利用SNMP对Precesion路由器进行配置,然后通过远程网段发送ping数据包。RPING监视器可以对Ping数据包的各种参数(如ping的发送频率、数据包大小等)进行设置,并对诸如最大/最小/平均响应时间进行报告。另外,它还可以对诸如延迟时间、达到能力、往复时间和数据包丢失率等参数进行测量。HTTP监视器:监视HTTP Web服务器的可用性和响应时间。HTTP监视器的配置可以细化到每一个网页,它可以与CGI bin界面进行交
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 知识产权归属及保密标准协议(适用于文化创意产业)
- 无子女离婚经济补偿及子女教育基金协议范本
- 2025年生物化学与分子生物学实验设计简答题考试卷答案及解析
- 2025年机关遴选考试题目及答案
- 2025-2030动力总成系统轻量化材料选择与碰撞安全性评估报告
- 2025-2030动力总成电动化转型对传统零部件企业影响研究报告
- 2025-2030功能性食品原料市场需求变化及供应链优化报告
- 2025-2030功能性面料研发突破与品牌溢价能力分析研究报告
- 2025-2030功能性辣椒饮品在运动营养市场的定位与推广策略报告
- 2025-2030功能性护肤品市场规模增长潜力与渠道变革专项调研报告
- GB/T 45743-2025生物样本细胞运输通用要求
- GB/T 15180-2025重交通道路石油沥青
- 双姿培训课件
- GB/Z 41082.2-2023轮椅车第2部分:按GB/Z 18029.5测得的尺寸、质量和操作空间的典型值和推荐限制值
- 实施项目经理岗位的工作职责描述
- 中频操作评分标准
- 生活中的理财原理知到章节答案智慧树2023年暨南大学
- GB/T 22588-2008闪光法测量热扩散系数或导热系数
- GB/T 22237-2008表面活性剂表面张力的测定
- GB/T 13298-1991金属显微组织检验方法
- 《绿色建筑概论》整套教学课件
评论
0/150
提交评论