CA系统运维建议书.doc_第1页
CA系统运维建议书.doc_第2页
CA系统运维建议书.doc_第3页
CA系统运维建议书.doc_第4页
CA系统运维建议书.doc_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ca系统运维建议书冠群电脑(中国)有限公司2009年4月nsm and insigh r11 proposal1 网络管理1.1 概述网络管理是spectrum产品的基本功能。spectrum在全球的企业环境中得到广泛的应用。现在spectrum可以提供包括端对端服务状况,以及系统响应和网络应用的测量和管理能力。如下部分将介绍网络管理解决方案和该方案为您带来一些主要的益处。1.2 架构管理ca spectrum是一个业界领先的基础架构和故障管理解决方案,一方面它通过内嵌的适配模块集成第三方管理产品,同时它具有强大的根源分析引擎和统一用户界面来管理所有用户事件,并将经过优化并同问题相关的少数告警体现出来。无论主机、客户服务器、分布式系统及web服务计算均离不开网络环境,spectrum已成功地在多厂商、多技术的网络中进行了大量的实施;它不仅告诉你出现了问题,同时告诉你是什么导致了该问题、有哪些影响因素、怎么发现和解决问题。这些结论每年为用户节省数百万美元;在全球范围内,spectrum提供了完整的2层和3层网络视图,详细到每个端口和电路,其中包括局域网和广域网、有线和无线、物理网和虚拟网络。spectrum同样提供独特的应用模块深入监控和分析atm、frame relay、ip multicast、mpls、qos和vpn网络。 除此之外,spectrum 解决方案的核心是对业务服务it架构之间关系和影响的理解能力,该方法称为业务服务智能(bsi);bsi方法提供了关联映射、影响分析和根源分析能力,从而使我们的用户能够将其it架构从基于策略的被动响应发展到基于战略的提前优化, 从而从客户角度和战略远景方面提升it服务质量。 spectrum的分析模块能够利用基于模式、规则和策略的关联引擎,对数以千计的不同厂商、不同技术的设备来识别、检验和解决复杂的问题。 这样,业务服务的管理和日常问题维护通过自动化的操作变得轻松,其中包括了资产、可用性、容量规划、变更管理、性能和趋势分析并最终实现有效的服务等级评估。 附图1. 丰富的评估分析报表1.3 人工智能spectrum的基础是专利的感应模型技术(inductive modeling technology -imt),它由多个人工智能领域开发的概念和技术所形成,例如语言学、知识表示、问题解决等。尽管可以按语义网络或基于模型的系统进行分类,但imt将其集成为统一的概念和技术。imt的核心是一个任何spectrum模型的知识库。该知识库由存储在数据库中的预定义概念和可由spectroserver处理的过程性知识组成。spectroserver提供访问这些信息的界面。知识库由这些概念、关系和它们实例组成,包括表示管理结点的实例。spectrum可以管理任何使用简单无论管理协议和互联网控制管理协议 (icmp)的结点。如果结点不使用这些协议,可以使用 spectrum外部协议api来开发一个协议转换器进行协议转换。模型类型、关系构成了spectrum知识库的基石。模型和关系是从真实世界对象中抽象的,通过规则和逻辑限制将这些抽象互相联系起来。spectrum 知识库中的概念和关系通过不同的视图进行可视表示。例如,某些视图描述管理结点之间的逻辑连接,并显示其物理位置。某些视图使用分级结构,允许用户通过点击下拉的方式显示明细子视图。其他视图是通用的,包含监控管理结点活动的测量标尺、图形和图表。 在spectrum知识库中的概念实例在不同的视图中显示为图标,每个图标其实就是模型的活动“图片”,某些包含状态字段的图标还会根据知识库中的数据实时的变化颜色。1.4 故障管理网络中可能出现的故障多种多样,往往解决一个复杂的网络故障需要广泛的网络知识与丰富的工作经验。这也是为什么一个成熟的网络管理机构制订有一整套完备的故障管理日志记录机制,同时人们也率先把专家系统和人工智能技术引进到网络故障管理中来的原因。另一方面,由于网络故障的多样性和复杂性,网络故障分类方法也不尽相同。我们可以根据网络故障的性质把故障分为物理故障与逻辑故障,也可以根据网络故障的对象把故障分为线路故障、路由器故障和主机故障。对于一个优秀的网管系统而言,提供足够的灵活性以向管理人员提供相应的故障视图和管理手段是非常重要的。幸运的是,spectrum是业界极少能够提供这种能力的网管系统之一。首先,千里之行,始于足下。一个好的故障处理模型是进行故障管理的基础。spectrum采用面向对象的建模 自适应建模技术(imt)可以为所有网络设备建立软件模型。即使平台事实上不能与某一设备通讯,此模型也能了解到网络中的各个实体间的关系,从而使系统做出准确判断,加速网络的诊断过程。通过spectrum,可以方便地查询设备、自动发现此设备所支持的mib,并将所发现的mib与spectrum的“建模目录”中的公共mib相比较,从而动态地汇编出spectrum设备模型,并为客户应用显示出完整的设备模型视图,这是目前世界上最先进的故障诊断模型。其次,spectrum是目前所有网络管理软件中唯一具备处理网络对象相关性能力的系统。spectrum采用的归纳模型可以使它检查不同的网络对象与事件,从而找到其中的共同点,以归纳出同一本质的事件或故障。比如,许多同时发生的故障实际上都可最终归结为一个同一路由器的故障,这种能力减少了故障卡片的数量,也减少了网络的开销。第三,故障隔离和报警抑制 一旦发现问题,企业管理系统可以推断出故障设备的状态并帮助诊断问题,通过spectrum的精确定位功能,可迅速找出出错设备并抑制不必要的报警,并且利用企业报警管理视图,用户可在网络的任何地点以浏览器方式观察网络报警,这为用户提供了快速了解网络报警及网络状况的方法,有利于节约维护费用。当然,也可以将事件前向到其他网管软件,进行报警。1.4.1 关键特性 事件关联spectrum的事件关联功能将业界的人工智能和故障解决方式进行充分结合;首先于1991年提出了基于模型的智能技术;在2000年,又开发出新的基于规则的智能引擎。 该引擎能够很好地支持多种复杂的关联方式,如事件频率、事件持续时间和事件并发条件等。将两种智能技术完美地结合在一起后,spectrum的事件关联引擎一方面可以分钟自动适应it环境的变化进行匹配,同时可以满足用户快速灵活地添加自定义的新的规则。 问题根源分析spectrum的问题根源分析已经被证明可以降低70%的网络中断时间、将mttr从小时降低到分钟,同时将故障问题单数量降低50%;spectrum提供的问题根源分析专家能够同异构企业环境中已部署的管理工具集成,从而为复杂的网络环境提供端对端的完整管理视图。1.4.2 智能规则spectrum故障管理提供了大量的预定义智能规则来消除重复的告警和trap,同时在故障发生前发现潜在的问题。为了达到上述的功能,spectrum提供了不同的智能算法和管理方式。在故障发生之前或者刚刚发生的时候,可以配置spectrum以不同的形式通知给相关的人员,如邮件,前转trap,或者短信(sms),传真(pager),甚至可以运行一些必要的程序来执行需要的修补行为。1.5 资产管理通过自动的discovery工具,设备发现过程可以每天进行,或按设置的时间表进行,或互动式进行。在每一次扫描网络的过程中,会自动发现新的或变化的设备信息。并通过让按类或ip地址分组对网络单元分类,方便了识别网络设备的过程。然后,它执行发现过程,在网络找到这些设备。通过对企业网络环境的发现和信息收集,spectrum将所有信息集中存储到中心数据库中,从而通过智能的分析引擎灵活地进行资产分析、变更分析和资产统计报表。附图2. 网络资产管理报表相关资产属性包括: device and sub components vendor device type ip address firmware version last time rebooted last time patched sys uptime contact location mac address1.6 审计安全管理spectrum对于网络管理和设备访问具有完善的安全保障,主要包括以下层面:在管理服务器上,spectrum提供分权的用户管理机制,每个用户具有不同的管理视图,同时通过管理日志提供完善的审计功能。对于网络设备的主要事件,如配置更改,设备访问和状态变更提供审计管理能力。1.7 性能管理1.7.1 功能概述ca ehealth通过snmp轮询或者外部元素和其他网管系统数据的导入接收性能信息。它也通过snmp trap接收网络设备的信息。 请参见如下关于性能数据和网络设备信息如何收集和报考的图示如图,性能和故障信息存储在ehealth数据库中以备长期的分析和交给报告引擎进行处理。这些引擎为ehealth提供了一个具有竞争性的特点:“标准化”数据,用一种统一的发生向用户提供信息。ehealth支持现有来自上百个厂商的技术,如atm,帧中继,dsl,光纤,voip,san,路由器,交换机,防火墙,服务器、应用程序和数据库等。ehealth允许操作员将所管理的设备,系统和应用程序划分为不同的逻辑组以便更精确的反映被管环境的情况。分组能够反映被管设备的地域分布,设备和特定用户关系,同时也能聚合一些特殊类型的设备。ehealth可以按照预定的要求或者用户的即时需求提交相应的报告,这些报告不仅针对某个特定的设备可以针对一个分组。报告可能包括特殊性能指标的统计信息,如显示超出给定基准线的性能统计的历史平均情况。这些信息可以帮助操作员理解近期性能和历史性能的关联,以便确定发展的趋势。除此之外,报告提供针对不同用户的可定制的性能信息,并且使用pdf或者ascii等格式发布在互联网上。如下图示反映了数据如何被实时采集和分析:ehealthlive health是ehealth提供的一个故障管理产品。它通过专用的算法来分析存储在ehealth数据库中的性能数据,当发现性能指标违反了用户定义的阈值时,将发送snmp trap。依靠设置建立在历史性能数据上的阈值,操作员能够在性能指标偏离期望行为的时候关注到它,同时能够在性能降低到临界点之前采取相应的措施。live health通过综合性能管理的数据来提供了不同于其他软件包的一个主动故障管理。 用户可以使用ehealth来进行预警管理,轻松的故障维护,定制容量规划和服务等级管理。1.7.2 性能预警管理ehealthlive health故障管理的live exception browser提供了大量的预定义智能规则来消除重复的告警和trap,同时在故障发生前发现潜在的问题。为了达到上述的功能,live health提供了不同的智能算法:主要告警方式: 超过门限时间(time over threshold):识别被管对象在较长的时间内出现了较多的错误 偏离正常时间(deviation from normal):使用的动态的阈值和常规行为进行比较从而检测出异常的性能行为trap管理: 事件状态(event state):在被管设备出现故障的时候仅仅通知一次事件比率(event rate):用来识别接受到了过多的trap。 事件超过门限时间(event time over threshold):用来识别被管对象在较长的时间内出现较多的错误。在故障发生之前或者刚刚发生的时候,可以配置live health以不同的形式通知给相关的人员,如邮件,前转trap,或者短信(sms),传真(pager),甚至可以运行一些必要的程序来执行需要的修补行为。用户能够通过各种报告来实现主动管理: exception summary of health report提供被管元素产生问题和导致异常的详细报告。 situation to watchof health report在关键业务出现问题前,表示出迫切需要解决的问题所在。 my health report允许用户定制被选关键统计信息的多形式的视图,来反映被管服务的质量1.7.3 轻松的故障维护如下图示描述了故障维护的工作流程.不同的人员会得到不同的视图.您将非常方便的通过简单的点击就可以展开详细视图,同时,生成不同的报告以便以后进行分析。live status diagram提供了一个业务界面来反映被管元素当前的状态。在live status中使用不同的颜色来标示元素状态,同时高亮显示业务拓扑。这样用户能够方便的发现问题所在之处。当确定问题后,用户能很快的深入了解详细信息以便了解问题的本质。live exception browser能够呈现全局或者特定主题下的trap/告警/异常信息。live exception browser会保持告警信息,一直到问题被解决或者人为的被清除。通过它,用户能很快的深入了解详细信息以便了解问题的本质。用户能够通过各种报告来实现轻松的故障维护。 health report 的summary section和 element details section提供如健康指数,利用率分布,变化导向等详细的信息,以用来分析问题。 top n report按照用户定义的规则显示出最适合的元素列表 at-a-glance report 能够为发生问题的元素提供一份相关联的关键参数的详细报告 trend report报告一组关联参数的变化趋势1.7.4 容量规划ehealth提供用户监控每周每月的趋势的能力。通过这些趋势分析报告,你可以很轻松的建设你的基础设施以便来支持业务量这些周期性变化。用户能够通过以下的报告来实现容量规划: health report 的补充部分提供了未充分利用元素的详细信息 capacity projection of health report 提供了未来所需的估计容量值的详细信息。 capacity provisioning of health report, 容量建议提供哪些元素在建议的时间范围需要进行升级。 what-if report 提供一个假设情况来调整容量参数并且决定在问题发生之前怎么改变。1.7.5 等级管理ehealth服务等级报告为管理sla提供了一个重要的工具。通过采用ehealth的历史数据,该报告为企业,部门和业务提供分析和呈现sla信息的手段。服务等级报告的数据来源主要来自ehealth console采集的来自驻留在工作站,服务器和网络设备上的各类代理的关键数据。service level report 提供重要参数的可视信息,如下: 可用性-活动和运行情况的百分比 延时传输的延时,通常使用ping来度量 带宽利用率-通讯量占用元素速率的百分比 线路利用率-每个接口的链路利用率总和除以接口数 cpu利用率-每个cpu利用率总和除以cpu个数 健康指数和健康异常一组分配给元素的基于关键性能的度量值。当健康指数超出最小的范围时,一个相关的异常就生成了。service level report 提供非常易于理解的品质信息, 该报告为各主要的管理者提供所需的精确的格式和等级状况,如下: 操作者报告executive report该报告为高级管理人员设计,提供精炼的概述性服务等级性能报告。 网络经理报告 network manager report该报告为网络管理人员设计,提供日常的设备或应用的服务性能与趋势预测。 服务客户报告service customer report该报告为为最终用户设计,提供特定区域或站点的服务等级报告。 业务单元报告business unit report此多技术集成的报告为业务管理员设计,提供全面的到特定业务应用流程的设备或相关应用的性能等级报告。1.8 软件配置服务器名称硬件类型操作系统/应用数量ca产品、模块spectrum infrastructure manager 9.1.2pc服务器2个3g至强cpu。4g内存。150g硬盘空间以上u windows server 2003 sp2u 英文版 1spectrum infrastructure manager device based suite * 1000;spectrum infrastructure manager device based suite server * 1;ehealth performance manager 6.2pc服务器2个3g至强cpu。4g内存。250g硬盘空间以上u windows server 2003 sp2u 英文版 1ehealth performance manager device based suite * 1000;ehealth performance manager device based suite server * 1;2 系统监控2.1 概述unicenter nsm r11为企业it提供了不断创新、安全、平台独立的管理方案,允许企业轻松的在单一或跨异构平台上部署管理方案。支持企业业务优化、按需计算的it管理要求,满足企业it投资的最优化。unicenter nsm是ca公司企业it管理蓝图(eim)按需计算战略的重要组成部分。unicenter nsm帮助企业在复杂的环境下安全可靠的部署和维护基础架构以支持企业整体业务开展。确保关键基础设施能够连续、可靠和高效的运行。通过不断创新的智能技术帮助企业在灵活的适应业务变化需求的同时能够有效的控制运维成本。同时能够同ca其他管理解决方案使用通用数据存储库共享信息,满足管理以及信息使用的最佳化要求。2.1.1 平台级管理技术同ca其他管理组件以及第三方管理产品能够共享标注和技术以期达到减小实施风险、方便灵活管理、技术快速学习的能力。如下特征提供这个关键策略:u mdb配置管理数据库利用ca公司产品解决方案允许利用通用的数据结构作为单一一致的定义和访问策略管理所有ca产品解决方案设计的数据。以资产为核心的mdb是一个共享的实体,以便知识集合能够方便的被不同管理职能使用。u common transport mechanism通用传输机制单一和安全的通信模式在复杂的网络环境下可以大大简化通信的配置和管理。所有通信都可以利用标准的模式进行,如安全套接字secure socket,加密,端口整合,动态配置等。u 标准用户接口针对所有ca管理解决方案产品的管理都采用通用的用户管理接口,即用户接口使用标准的颜色和图形。u 连续发现实时连续发现机制使用户拥有一个不断更新的it资源管理库,unicenter nsm可以在此连续发现的基础上自动生成拓扑管理视图。u snmp v3的支持unicenter nsm以及相关选件对snmp的支持得到了升级,目前完全支持snmpv3标准。u web reporting server (wrs)对管理对象的可用性和性能实现了基于web的报告定制、执行以及查看功能。参考下图:wrs提供了如下的优势:u 报告内容以图表格式显示report presentations are composed of table and chart views.u 允许用户动态定制报告内容,通过点击满足用户从高级别的报告查看到细节报告的查看需求。u 报告支持html, csv, pdf格式2.1.2 异构环境的管控unicenter nsm 对目前存在的厂商以及相关平台具有广泛的支持性,可以有效的减少业务风险。其特点表现在:u 自动监控和响应服务器架构下所有组件的健康状态和性能信息以自管理的模式进行收集。管理员可以精确方便的对可能导致末端用户服务异常的情况进行标识、通告和响应。为了减少故障解决时间,允许管理员进行组、个体以及包含的关系定义和裁减升级、通告策略。u 事件关联unicenter nsm允许管理员对网络、系统和应用事件以drill-down的方式在一系列的相关事件中分析标识真正的问题。u 基于策略的事件通知policy-based event notification在企业中,管理员可以将特定响应信息定位给特定的角色。通过控制台视图、管理员可以方便的接收客户化的事件集合。u 全面的平台支持comprehensive platform supportit管理系统可以从不同的系统平台上采集数据,这些平台涵盖windows、unix、linux、as/400、z/os和openvms,对网络的支持包括tcp/ip、sna、和decnet,针对所有企业it管理对象提供单一的控制和操作点。u remote management远程管理针对特定的业务部门或广域网环境,可能存在特定的代理难于部署问题,远程管理可以帮助管理员快速获取网络以及系统的主要工作状态信息,为监控提供了灵活的应对策略。2.1.3 智能可视化通常在类似数据中心的日常运维环境中需要实现基于角色的管理,ca公司为此提供了丰富的用户接口管理能力,可以针对不同的用户提供特定的可裁减的用户管理接口。采用基于角色的管理方法,管理员可以轻松的定义管理范围和个性化管理视图以满足管理人员管理复杂it环境的要求。支持的具体功能如下所示:u unicenter management command center (unicenter mcc)为了提高管理员的管理效率,unicenter nsm 为系统管理员以及it管理者提供了直观的基于树状结构的图形化管理视图。u unicenter management portal (unicenter mp)管理门户unicenter mp提供了基于web的管理视图,满足管理员可以进行安全可靠、基于角色动态的个性化管理工作。同unicenter mp的集成,允许管理员在单一的管理视图中对大量分散存在的数据源进行集成统一的分析、查询、报告和展示。u unicenter classic经典管理视图基于windows视窗的管理界面为it管理员及时响应本地化的系统问题提供了灵活的管理手段。u real-time and historical views实时和历史管理视图相关性和可视化信息帮助管理员迅速定位、分析和响应问题。这些视图提供了丰富的展现格式供分析人员灵活的预置各种性能分析报告。u business process views and smart business process view (smartbpv)业务视图从业务应用视角管理和监控基础单元可以帮助it管理更加适应业务优先级管理要求。通过分析网络活动,smartbpv可以标识支撑特定业务和应用单元的it基础架构组件,自动搭建和不断更新具有针对性的业务相关性的监控管理视图。2.2 系统结构unicenter nsm作为企业it监控的核心解决方案,其架构分为:u worldview交互层u managing layer管理层u monitoring layer监控层附图3. unicenter体系架构2.2.1 worldview展现层该层将监控信息通过二维视图worldview 2d和管理控制中心management command center两个管理逻辑组件进行表达,通过该层管理员可以查看被监控对象以及对象间的关系。worldview由如下组件构成:u worldview管理接口u management database(mdb)管理数据存储库u worldview application programming interface(api)2.2.2 managing管理层该层主要通过分布式状态机dsm(distributed state machine)实现agent的管控,支持运行的平台包括windows、unix或linux。dsm实际上是由dsm和一系列支持组件构成。管理层包含的组件如下:u distributed services bus (aws_orb)u distributed state machine (aws_dsm)u dsm monitor (dsmmonitor)u dsm store (aws_nsm)u object store (aws_store)u service control manager (awservices)u snmp / dia gateways (aws_snmp and aws_agtgate)u trapmux (catrapmuxd)u worldview gateway (aws_wvgate)上述组件以后台服务的方式构造了管理层,允许单独的进行启动和停止。2.2.3 monitoring layer监控层监控层又称代理层,采集监控对象基础信息。管理员可以通过不同的管理接口,如mib browser、agent view browser、dashboad、mcc等查看监控资源的当前状态。通过service control manager(awservices)可以对监控层的服务进行独立的启停操作。监控层包含如下组件:u distributed services bus (aws_orb)u agents (agentname)u service control manager (awservices)u snmp / dia administrator (aws_sadmin and aws_agtgate)监控层组件间的交互如下图所示:2.3 软件配置n unicenter network and system r11.2 x 1n unicenter network and system r11.2 managed resources x 1202.4 硬件配置服务器名称硬件类型操作系统/应用数量ca产品系统管理服务器pc服务器2个3g至强cpu。4g内存。150g硬盘空间以上u windows 2003 r2u ms sql 2005u excel 20031u unicenter network and system r11.23 数据库性能监控3.1 概述ca 推荐使用insight 管理贵公司的业务关键数据库。ca insight database performance monitor for distributed databases 是一个多数据库的监控、诊断及性能管理的方案。insight 为浏览器界面,支持实时及历史数据库监控、诊断、处理和全面的性能管理,包括数据库内部配置、状态、sql捕获、cpu利用率、内存利用率和i/o访问。可扩展的监控范围无论要监控数据库的个数、体积或者所运行的系统,insight先进的技术可确保它们发挥最大效率,共享内存架构可以处理大型和复杂的多数据库环境,你可以扩大监视范围而不过分干扰被监控的主机。数据库发现和自动监视数据库发现技术可以选择性的监视目标数据库并自动实例化。这意味着当数据库目标被添加或删除时,不需要改变配置。当改变发生时,它会自动确认并响应。数据库、操作系统和i/o 信息数据库的性能监控可以实时的进行,伴以图表和统计数值。因为性能数据依赖于与数据库之外的交互,insight会同时监控操作系统和i/o活动。有了ca insight dpm for distributed databases,数据会在单一的控制台被采集和呈现;管理员能够同时在界面上掌握性能信息和关联的故障,这样问题就能尽早诊断和修复。采集过程对系统的影响极小。先进的通知和事件管理通过检查用户定义的性能分组、扫描参数,ca insight dpm 为超过门限后的动作测量和报告条件。同时它还可以基于很多条件触发告警,如空间不足、长期运行的进程、高cpu利用率、交换空间不足等。用户可以采取措施来确保数据库可用。 交互式的实时及长期历史性能分析ca insight dpm 可以在单一界面同时为实时及历史分析总结性能趋势和诊断信息,这样就保证了快速的解决问题能力。insight 还能提供: 数据库质量指数 帮助客户排出需要关注的数据库的优先级 sql 捕获和存储 趋势及负载分析历史重现性能信息以压缩方式按时间序列储存。客户能够监视数据库的当前状态,并基于负载指标与其历史基线比较,决定采集数据的粒度及存储的时间跨度。速查以及详细性能信息关键的性能指标被分组、汇总以及展示在统一的控制台中,所以客户可以快速的发现性能异常、趋势以及约束条件。如想进一步了解,insight dpm 也可以提供直接访问的性能扫描和统计数据钻取。内建的专家顾问在控制台界面中,advisor 按钮随处可见,它为各种数据库系统提供了性能参数解析:ms sql & oracle database等等。这帮助客户 优化数据库性能并且解决问题。集成的方案ca insight 可ca nsm、wily、service desk和spectrum service assurance等产品完全集成。3.2 系统架构ca insight dpm由ca insight for distributed databases,ca database command center,ca tsreorg,ca fast unload 4个部分组成,如下图所示:l ca dcc是一个统一的数据库管理监控界面系统。n 支持统一的浏览器界面,一站式监控所有数据库系统。n 可以灵活地定制界面层次和内容n 自动发现环境中的数据库系统l ca insight for distributed databases - 该部件安装在数据库服务器端,用于收集数据库的实时性能,并将性能归档保存。l ca tsreorg 优化提高数据库的性能n 回收废弃表空间,数据存储优化,索引优化n 优化期间,保证数据库正常访问性能和可用性n 检查可能的失败并恢复n 支持优化作业的定时调度l ca fast upload提高业务数据的可用性n 快速的数据抽取n 支持多种格式输出n 支持大表分解输出到多个文件n 支持数据的快速重加载n 支持加载作业的定时调度进一步深入dcc和insight,它们的架构如下图:l 门户和web服务器基于ca的cleverpath产品,完全符合j2ee标准。门户基于java,是用户操作的主要界面,具备高度个性化的工作区。浏览器访问的后端是一个apache tomcat的web服务器。在生产环境中,tomcat服务器应该具有足够的带宽并良好的性能以处理并发用户请求。 管理数据库 mdbca产品使用的通用数据库,用来存储运维数据。例如,存储的数据可能是主机名、域名和在特定的服务器安装的组件。目前,ca支持sql server和oracle以及ingres,使用后者客户不需要购单独付费了。与mdb的通信是通过odbc驱动的sql调用完成的,这作为安装的一部分。 客户端和基础服务数据库客户端库文件 - odbc驱动程序被集成安装后,即负责与mdb通信,同时也负责远程管理oracle、db2和ingres的引擎,避免了安装远程代理的麻烦。由数据库厂商提供的连接工具也同时需要在 dcc上安装,以连接到你想管理的数据库(如oracle的sql*net或db2 connect.)。 mdb的客户端进程o iigcn:为用户进程提供信息,使用户进程接受到本地服务器的连接。o iigcc:监视本地到远程服务器发出的通信以及远程应用程序到本地服务器的通信。o iigcd:将jdbc驱动和.net data provider转换为mdb的内部格式,并转发请求到适当的服务器。 数据库任务管理服务进程mitjasag进程负责监视任务参数进入到图形界面的过程,同时在mdb中检查要执行的动作,然后把参数传递到负责执行的相应产品。工作可以立即执行或推迟到预定的时间执行。 rtserverinsight共有2个通信层,其中一个叫做“pec”。 dcc和其组件在与客户端和代理通信时,pec负责传送消息。最少也会有一个rtserver运行在服务器端上(通常是dcc portal服务器)。在其他服务器上安装的insight代理将有一个或多个rtclient进程,借助pec连接到rtserver,与其他rtclient进程通信。例如,使用pec来调度:在远程主机执行一个任务,或者重组或卸载一个表。另外的通信层是dcc用来连接和浏览数据库的odbc驱动。3.3 软件配置n ca database command center r11.3 x 1n ca insight for distributed database x ? 3.4 硬件配置服务器名称硬件类型操作系统/应用数量ca产品数据库管理服务器pc服务器2个3g至强cpu。4g内存。150g硬盘空间以上u windows 2003 r2u ms sql 20051u ca database command center r11.34 业务保障管理4.1 概述ca spectrum service assurance manager通过创新、智能的业务建模,分析技术和根本原因手段来提高服务的可预测性、质量和效率。它可分析许多数据源的资料,计算it服务的质量和风险,通过灵活的服务仪表板为业务提供实时和历史数据。 您可能已经有若干个管理方案,支持包括it基础设施或最终用户体验的各个方面。您可能会发现,这些单项方案都无法可以为您提供真正完整的、端到端的服务的健康和可用性管理。服务往往依赖于您的基础设施,跨越许多不同的领域,如网络、系统、数据库和应用程序。如果没有整合工具,提供业务透视、集中告警、跨域的根源分析,操作人员必须经常猜测是什么故障或性能问题影响了关键的it服务,降低了服务质量,或增加停机的风险。同样,服务利益相关者可能无法完全查看他们的服务构成,结果就是不能完全了解他们是否能够实现其业务目标。 ca spectrum service assurance manager可以帮助克服以上的挑战,原因在于它能够统一来自所有域管理器的健康和可用性数据,整合it服务和业务战略。该产品引入了一种新的服务管理层,并通过一个开放和可扩展的集成框架,提升你现有的管理技术投资的价值。ca spectrum service assurance manager天然的与几乎所有ca的监控产品集成,同时支持第三方的应用程序。此外,您可以添加自定义的集成模块来进一步扩展解决方案。 0创新、智能的服务建模是服务质量和风险管理的基础,而且 ca spectrum service assurance manager 可简化和促进端对端、实时的统一服务模型的构建任务。智能服务建模可从直接管理基础架构和应用程序的 it 工具、以及包括由其创建的整个服务模型在内的配置管理数据库中导入 it 组件(即基础架构配置项、应用程序和交易)。0 服务的影响和风险分析根据服务模型组件状态或服务模型结构本身的变化,促进服务交付质量和风险的动态计算。组件状态由基础域管理程序(即网络、数据库、系统和应用程序性能管理工具)进行监测。状态信息随后由 ca spectrum service assurance manager 使用,其根本原因分析可确定服务质量影响的来源和服务交付的风险。 服务质量指示消费者对it服务的体验的质量水平,无论是其他it服务,客户或最终用户。例如,ca wily cem则可能表明报警服务质量退化,因为它们可以说明在应用交易的问题,可能影响到最终用户体验的质量。 服务风险指示提供的服务质量在支持业务目标过程中发生的总体风险。增加风险的例子可能是冗余网络服务器失效,或是一个数据库集群发生了故障切换。ca spectrum service assurance manager具有在组件服务区分内收到报警类型的质量和风险的影响的能力。组件的状态由域管理器进行监测,如网络,数据库,系统和应用性能管理工具。状态和报警信息会被传递到ca spectrum service assurance manager,它利用根本原因分析,找准影响服务交付退化的来源,如服务质量和风险。0 基于 soa的集成架构采用 ca 产品实现即装即用的集成,面向基础架构、应用程序性能管理、工作负荷、安全、合规和服务台管理,以及第三方 it 管理产品。此外,还提供集成 sdk 用于定制集成。 基于角色的服务仪表板和服务控制台ca spectrum service assurance manager提供了一个统一的中央控制台,关联域告警和资源服务。ca spectrum service assurance manager的告警包括诸如域管理警报的严重级别、告警所影响服务的数量,告警状态对服务的影响,以及对这些服务的报警条件的影响。您可以确认、分配、批注和清除告警,并且可以发送通知消息,触发升级的策略,例如生成故障单、发送电子邮件或调用自定义脚本。4.2 组件概述ca spectrum service assurance manager 包括以下的组件,共同来完成服务和资源的监控: 集成框架集成框架(ifw)是整个的通信架构,ca spectrum service assurance manager用来连接到域管理器以及收集配置项(ci)、服务、拓扑和状态信息。它使用了apache activemq消息代理,后者充分利用了java消息服务(jms)进行通信。 连接器连接器是一个网关,ca spectrum service assurance manager通过它收集各个的数据。连接器收集有关服务、独联体、拓扑和状态信息。每一个已集成的产品都有自己的连接器,您可以使用通用连接器集成未预定义的产品。转换器的策略将收集的数据标准化为spectrum service assurance manager的格式。每个连接器需要获得其连接的域管理器的具体资料。系统会提示您在安装过程中指定,您也可以在以后使用管理用户界面更改。以下是部分connector的说明:ca nsm connector: worldview (wv) connector n wv 监控对象创建为cin wv bpvs和dbpvs 创建为服务n wv 监控对象状态转移作为告警发送 dsm connector n dsm 对象创建为ci ca spectrum im connector:spectrum 模型创建为cispectrum 服务创建为服务spectrum 告警作为告警发送 必须安装在spectroserver上 ca ehealth connector:ehealth 元素创建为ciehealth 组/组列表创建为服务状态转移trap作为告警发送 支持本地和远程安装 ca wily cem connector:业务过程创建为服务 业务过程创建为cicem alarms 作为告警发送支持本地和远程安装 ca wily introscope connectorintroscope management models 创建为服务 introscope agent metrics 创建为ciintroscope alerts 作为告警发送 支持本地和远程安装 ca cmdb connector:导入 cmdb ci 和 services. 不转发状态转移告警 支持本地和远程安装 通用连接器(universal connector )从ca和第三方产品处检索服务、ci、状态事件 提供web services 界面,定期检索事件 将事件格式标准化然后交给sa manager在tomcat服务器上以web service运行,名字为genericconnectorservice sa managersa manager是spectrum service assurance manager的主要管理组件。它监测管理资源的健康和可用性,处理来自域管理器的事件,并执行服务的影响和风险分析。sa manager还更新sa store中存储的分析结果和状态变化,并提供数据到其他ca spectrum service assurance manager组件。sa manager为报警条件提供了以下功能: 自动通过电子邮件通知,基础设施或服务的警报已创建 自动基于时间的警报升级,根据策略,例如通知技术人员或运行命令 建立在ca服务台的故障单,并关联报警和故障单 ui server 界面服务器是承载用户界面应用程序服务器。用户界面服务器托管在web服务器中,单一的ca spectrum service assurance manager支持多个用户界面服务器,以满足负载平衡。ca spectrum service assurance manager 拥有以下用户界面: service console 支持所有管理功能,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论