已阅读5页,还剩56页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Industryspecificcoverimage,数据中心运维管理,1,-,议程,数据中心运维管理面临的问题与挑战,数据中心运维管理探讨数据中心运维管理的能力框架及建设演进业务驱动IT管理完整的平台管理全生命周期管理总结,2,2,-,IT越来越复杂,带来的典型IT运营问题,架构复杂复杂,多厂商难扩展需要多领域专家消除I/O瓶颈很复杂多厂商集成方案成本高、耗时,整体性能难保证异构的数据库、Java层、消息层和Web层很难整体调优尤其在通常虚拟环境中,整体性能不高、,整体可用性难保证异构环境可用性管理复杂在通常的虚拟环境中,应用可用性更难管理不同厂商产品的可用性可以大大影响整体可用性,运,维管理复杂运维不好界解决过的升复杂,不可预测,异构环境增加,复杂度,职责定问题诊断、程复杂,不同厂商产品,级、补丁过程,3,-,“稳定”和“安全”是IT运营的基本目标运维人员在多个环境里进行手工配置和操作,难以避免人为操作风险,日常监控服务响应工作调度数据备份,系统变更执行,事故报告灾备操作机房管理访问授权健康检查,应用系统中间件数据库,开发,测试,生产,灾备,服务器与存储,问题变更事件配置版本可用性容量管理管理管理管理管理管理管理,网络,变更影响分析通常凭经验,也难以充分测试,怎样控制和验证?,怎样确定问题的根源?可以从业务影响发现问题吗?怎样避免问题的再次发生?,真的了解运行状态吗?预警和主动监控能做到什么程度?健康检查是否有效?,如何快速定位和恢复故障?应急演练是否有效?备份的数据真的可用吗?,怎样判断架构的高可用性?当前的性能容量能否支撑下阶段业务发展?,4,-,基础架构和运维的驱动,性能提升资源利用率提升弹性扩展弹性/可靠性/性价比快速应用部署压缩环境准备和应用安装部署时间提高工作效率节能减排机房空间效率电力供应平均CPU/存储利用率追求更低的TCO和高ROI降低软件、硬件、服务成本简化运维工作,降低维护成本,集中管控监控预警,实现主动管理故障诊断和性能优化可视化管理,面向服务质量风险控制降低操作风险系统安全提升数据中心不能成为问题中心,5,-,来自业务的挑战,CIO办公室,对最终用户体验缺乏可见性,业务要求IT可靠和透明,业务经理要求以业务的语言来描述IT服务水平,客户对服务中断和性能问题毫无耐心,IT性能指标与业务毫不相干,不能有效控制服务中断和性能下降,缺乏通用语言,基础关注点不一致,IT运营“像业务一样经营IT”是CIO共同目标,目的是保障服务质量,提高IT对业务的贡献。,6,-,IT服务管理最佳实践的新要求,ITILv3帮助用户从业务角度完成整体设计、实施和持续优化IT服务管理,并通过IT服务管理将企业的业务需求和IT管理实现量化对接,ISO20000:2011供应商和客户之间的实质关系将影响服务管理过程如何实施,业务战略指导落地,业务需求量化考核,7,-,问题与挑战的总结思考,来自业务的挑战灵活的支持业务发展;对业务量持续以及爆发性增长的需求;对于最终用户体验具备可见性;业务需求和IT管理实现量化对接运维的驱动具有面对服务需求峰值而不需要额外投入的能力;可提供724小时高水平服务等级的能力;需要具有丰富经验的资源;80%的企业软件费用花费在安装与维护;服务器对管理员的比例还维持在20-30:1的水平;部署新的应用时间太长。,IT基础架构与基础设施的驱动数据中心空间优化与地点的选择;不断增长的数据中心基础架构的复杂度服务器的利用率介于10%15%;数据中心往往需要耗费上千万的资金去建设,而且不能在现有设施上去扩展。IT的变革与创新IT基础架构集中与标准化;虚拟化、网格计算;自动化与持续可用;云计算/绿色IT。,;,日常监控服务响应工作调度数据备份系统变更执行事故报告灾备操作机房管理访问授权健康检查,应用系统,中间件,数据库,服务器与存储,网络,8,保障稳定和安全业务连续性和高可用性建设;潜在问题的分析和规避;主动的客户体验监控;问题快速定位和解决。,-,议程,数据中心运维管理面临的问题与挑战,数据中心运维管理探讨数据中心运维管理的能力框架及建设演进业务驱动IT管理完整的平台管理全生命周期管理总结,9,-,通过架构整合和简化、提升运营管理能力来解决面临的IT运营问题与挑战,构建完整平台管理,完善运营基础管理能力,同时帮助用户从业务角度优化IT服务管理,将企业的业务需求和IT管理实现量化对接,提升运营管理能力,10,-,OracleIT运营能力框架模型,ITILv3.0COBITUSMBOKISO20000TOGAFOracleUnifiedMethodSAS70TypeIandII,业务,11,IT,-,提升IT运营能力:技术成熟度模型,有感知的,标准化程度低架构与运维无法共享只对关键资产使用状况有了解6周部署普遍的单点故障基本的监控,集中与整合技术现代化,阶段1,认可的关键的硬件/软件,标准化,对于75%资产的使,用状况了解,25%已经整合,2周部署,N+1设计,基本的管理,阶段2,主动的硬件/软件标准化,共享的架构与运维运维资产,75%整合、部分虚拟化,100%了解资产使用,状况,数天内部署,关键系统可靠性设IT服务工具,计,运维管理工具集,虚拟化,阶段3,集成的架构,75%虚拟化,数小时分配资源持续的可用性,服务型的,自动化,阶段4,业务合作伙伴,高扩展、弹性的架,构,新技术使用90%虚拟化整体的架构与运维动态资源分配灾难下的持续可用,性,业务服务工具,云计算,阶段5,我们在哪里?,12,-,提升IT运营能力:人员成熟度模型,有感知的,人员按技术分类离散的个人主义较低的客户信心非正式的审查,组织型个人型,阶段1,认可的分级支持,角色按流程定义,正式的职业发展,规划培训,员工KPI,阶段2,主动的以流程为中心,与HR的流程相结合信任的服务,能力中心预防模式趋势分析,以流程为中心,阶段3,服务为中心,新的角色,供应商技能管理以服务质量为目标,参照行业最,佳实践,服务型的,以服务为中心,阶段4,业务合作伙伴,成为业务部门虚拟团队注重业务高效的外包技能业务与IT轮岗创建行业最佳实践,以业务为中心,13,阶段5,我们在哪里?,-,提升IT运营能力:流程成熟度模型,有感知的,救火队模式工具定义流程备件备份,以工具作为标准没有流程文档,运维流程工具使用,阶段1,认可的事件管理,变更与问题管理,标准化,灾备管理,项目管理,较少的流程集成,阶段2,主动的分析趋势阀值设置,应用可用性监控自动化,大部分ITIL流程已,成熟,服务交付流程,阶段3,IT作为服务供应商服务分类与定价保证的SLA服务可用性监控集成的流程,容量管理,服务型的,服务与客户管理,阶段4,业务合作伙伴,IT作为战略业务伙,伴,IT与业务KPI关联提升业务流程协作实时架构业务变革,以业务为中心,阶段5,我们在哪里?,14,-,数据中心运维管理的能力建设演进,完善运营管理基础能力主动端到端监控快速定位问题集中配置管理有效控制变更和发布自动化生命周期管理有效的应急和安全措施,15,实现业务驱动用户体验业务监控业务指标,云管理全生命周期管理,-,用户体验管理,业,产品目录务服,订单管理务管,理,业务交易管理,网络门户,.其它业务服务,客户与业务用户,业务驱动IT管理,完整的平台管理,全生命周期云管理,业务驱动IT管理以业务视角管理IT资源创建应用感知云,能够理解和适应实际业务需求,完整的平台管理应用、中间件、数据库、硬件一体机(Exalogic,Exadata),全生命周期云管理建立敏捷的IT管理以适应不断变化的业务需求使用同一软件进行统一的云服务全生命周期管理,应用,中间件数据库OS,VM,Servers存储,网络,Oracle支持服务,云服务Apps,PaaS,DBaaS,IaaS.,数据中心运维管理解决方案,16,-,议程,数据中心运维管理面临的问题与挑战,数据中心运维管理探讨数据中心运维管理的能力框架及建设演进业务驱动IT管理完整的平台管理全生命周期管理总结,17,-,业务驱动型应用管理与能力框架的映射,网络门户产品目录业务服务管理,订单管理,.其它业务服务,客户与业务用户用户体验管理业务交易管理,业务驱动型应用管理,完整的云平台管理,全生命周期云管理,应用,中间件数据库OS,VM,Servers存储,网络,Oracle支持服务,云服务Apps,PaaS,DBaaS,IaaS.,18,-,JVM和DB诊断业务交易管理真实用户体验管理,用户满意度怎么样?,他的录入快速吗?下单情况怎么样?,下单为什么卡住?为什么慢?怎么老超时?,根本原因是什么?是核心的问题还是ECIF问题?,19,业务驱动的端到端应用管理,19,-,用户体验管理,实时监测用户的“真实的”活动,优化业务响应率和转化率,Executivedashboard,BusinessReporting,TransactionPerformance,SLA管理与行政驾驶舱,实时错误报告与分析,KPI实时监控与报警,定制业务服务实时监控,实时交易漏斗监控,整体页面浏览性能-绿色=满意-橙色=容忍-蓝色=失望,用户满意度实时趋势分析,实时用户体验跟踪,用户出错页面重放,实时系统性能分析,20,-,持续监控关键事务,通过一系列的事务/操作序列来定义”业务交易”典型“业务交易”问题业务上定义的逻辑错误,比如”信用额度不足”,“库存少于10件”,“审批周期超时”,“定单金额超过预定义金额”失控流程(Stalledprocesses),不正常跳转,非正常中断的交易流程等失控结果,定义范围以外的结果技术层面的问题,比如延时和EM其他模块互动,告警并解决问题,RejectedOrderAlert,WebLogic,ServiceBus,Appliance,DBMS,Web,PartnerandCloud,业务交易管理,21,-,22,1服务水平协议ServiceLevelObjective(SLO)ForPlatinumcustomers:Ave.Responsetimeperhour6sec,Warningthreshold=4sec-Action:alerts,利用率跟踪和分类譬如:白金卡,金卡,银卡等,2,3,面向目标的性能监控,5为白金客户提供稳定的响应时间,4在白金客户违规错误发生之前自动告警,Gold,面向客户可定制业务驱动的服务质量(QoS)交付,22,-,议程,数据中心运维管理面临的问题与挑战,数据中心运维管理探讨数据中心运维管理的能力框架及建设演进业务驱动IT管理完整的平台管理全生命周期管理总结,23,23,-,完整平台管理与能力框架的映射,网络门户产品目录业务服务管理,订单管理,.其它业务服务,客户与业务用户用户体验管理业务交易管理,业务驱动型应用管理,完整的云平台管理,全生命周期云管理,应用中间件数据库OS,VM,Servers存储,网络,Oracle支持服务,云服务Apps,PaaS,DBaaS,IaaS.,24,-,服务器与存储告警服务器故障管理物理层与虚拟基础设施层的依赖关系分析,完整的、深度数据库监控数据库自服务管理(ADDM,AWR,ASH)自动化SQL优化,监控Weblogic,SOA,CoherenceJVM诊断服务拓扑与依赖关系分析,用户体验管理业务交易管理EBS,Siebel,PeopleSoft建模与监控,25,为云提供业务驱动型应用监控,完整的、从应用到磁盘的资源监控,-,26,类型(根本原因)RootCause(事故多发区),交易线,针对交易线上每个环节,分析系统间接口、系统内资源使用、应用的复杂逻辑处理、以及部署、维护环节的实现机制与参数配置,可以深入分析问题的原因所在。问题现象/当前系统数据,一体化的优化考虑、一站式的问题“会诊”,-,用户体验监控,通过综合检测比对服务实际运行响应水平和预定义SLA的要求,采用模型驱动的方法对应用进行基于上下文的下,钻.,支持Servlet/JSP,EJB,JDBC下钻,Java代码级的诊断,跨层追踪至Oracle数据库内存泄漏分析,复合应用管理,JVM诊断,数据库管理,监控和优化数据库提供关于数据库问题的建议,27,全面覆盖用户级/应用级/系统级等问题,-,数据库管理,事件,策略,管理数据,配置变更管理,集中管理,数据遮蔽,集中监控,ORACLE,性能诊断与优化,业务服务与SLA管理,28,-,集中的数据库监控管理,29,-,自动性能诊断通过数据库自管理获得最佳性能,通过数据库自管理保持最佳性能使用自动负载信息库快照进行自上而下的分析使用自动数据库诊断监视器进行实时性能分析通过深入的根源分析加速解决性能问题基于性能调优经验的分类树性能专家,提高管理员的工作效率,消除性能瓶颈,降低IT管理成本RAC问题,提高服务质量,自动负载信息库快照,性能与管理顾问程序,高负载SQL,IO/CPU问题,自诊断引擎,30,-,应用程序调优自动SQL调优,可定制的应用程序+索引和MV+分区应用程序自动调整优化程序自动SQL调优捕获高负载SQL使用SQL配置文件调优SQL实施极大改进的SQL计划(可选)提供的建议带来的性能改进通过SQLProfiling无需更改SQL代码即可调优执行计划对打包的应用程序启用透明调优,打包的应用程序+SQL配置文件高负载,可定制的应用程序+SQL建议,已调优的SQL,31,-,深入了解SQL执行情况自动监视长时间运行的SQL即取即用且不影响性能监视每个SQL执行展示监视统计信息全局执行级别计划运行级别并行执行级别指导调优工作作为活动报告增强以监视PL/SQL,实时SQL监视,32,-,针对RAC/HA设置的配置级汇总视图(内含图表)对MAA实施提供建议单实例最小停机时间自动化实现MAA显示全部配置中与可用性有关的事件管理基于角色的备用数据库,如将物理备用数据库转为ActiveDataGuard,高可用性,33,-,管理整体设计的系统,集成的硬件和软件管理硬件示意图和警报集成和深入的软件管理硬件和软件拓扑、配置管理主动式支持“呼叫总部”健康检查补丁和最佳实践顾问程序,数据库云服务器(Exadata)和中间件云服务器(Exalogic),34,-,怎样做到数据保护的深度防御?,如何做到:敏感数据“看不见”核心数据“拿不走”运维操作“能审计”,加密和屏蔽访问控制审计和监视阻止和记录,35,-,数据安全架构,数据库审计,鉴机HR权密Re认公ba证开tes,备份加密传输加密,数据加密,数据伪装,审敏计感,应用服务器,网络SQL监控和阻止,非法DBA行为,多因素鉴权和认证,整合DB安全,36,-,构建实时业务数据中心,数据中心,数据中心数据库,数据库1,数据库2,数据库N,实时、高性能:从日志中实时获取最新变化数据,由于不直接访问数据库本身、对生产数据库附加压力很小,日志,日志,日志,高安全性:非侵入式方式,无需业务数据的用户密码,确保业务数据的安全性,数据实时集中OracleGoldenGate,高可靠性:支持断点续传,高兼容性:支持在各种类型数据库之间交换数据,招商证券齐鲁证券红塔证券,安信证券平安证券,OracleGoldenGate案例,37,-,一技多用保证业务不间断和实时报表/BI兼得。,高扩展性快速部署更低总拥有成本(TCO),更高投资回报率(ROI),满足整个数据中心的实时数据需求,基于Log的实时变化数据捕获(CDC),异构源系统,企业数据仓库(EDW),ODS,EDW,容灾,数据保护备用库(处于打开&活动状态),零停机迁移或升级,业务报表,实时BI,报表库,OGG,ETL,ETL,分担查询负载,数据分发,38,-,议程,数据中心运维管理面临的问题与挑战,数据中心运维管理探讨数据中心运维管理的能力框架及建设演进业务驱动IT管理完整的平台管理全生命周期管理总结,39,39,-,全生命周期管理与能力框架的映射,网络门户产品目录业务服务管理,订单管理,.其它业务服务,客户与业务用户用户体验管理业务交易管理,业务驱动型应用管理,完整的云平台管理,全生命周期云管理,应用中间件数据库OS,VM,Servers存储,网络,Oracle支持服务,云服务Apps,PaaS,DBaaS,IaaS.,40,-,应用程序和业务服务,平台即服务,基础架构即服务,规划,预配,构建,测试,部署,监视,管理,计量和计费,优化,DBaaS,MWaaS,全面的生命周期管理,41,41,-,利用IP扫描技术发现资源选中被找到的主机后,可将代理部署以及对象发现等工作集成实现将目标状态从“未管理”标记为“已管理”可识别已被管理的资产,自动发现资源,42,-,规划整合,规划整合消除了资源过剩或不足导致的对资源的低效使用高使用成本管理维护费用能源与机房空间的开销数据中心的扩展产生的安保开销EnterpriseManager提供了多样化的选择:将数据中心里的物理服务器进行整合(P2P)从物理主机迁移到虚拟主机上(P2V)迁移到Exadata(P2E),43,-,打包多层企业应用程序OracleVirtualAssemblyBuilder,捕获完整的应用程序拓扑,打包成一个组件,部署自助服务,元数据,OVM,HTTP,OVM,HTTP,WLSOVM数据库OVM,OracleEnterpriseManager,上载到软件库,44,-,端到端的应用程序测试实现应用程序、中间件和数据库自动化测试,测试应用程序更改,测试基础架构更改,测试数据和实验室管理,OracleFunctionalTesting,OracleLoadTesting,OracleTestManager,SQLPerformanceAnalyzer,应用程序重放,数据发现和建模,创建数据子集,数据库重放,数据屏蔽,生产负载,合成负载,测试数据管理,45,-,部署安全的测试系统OracleDataMasking,通过屏蔽敏感数据部署安全的测试系统敏感数据永不离开数据库用于自动化的可扩展模板库和策略高级屏蔽:基于条件的屏蔽、混合屏蔽、确定性屏蔽集成的屏蔽和克隆针对常见数据类型利用屏蔽模板利用Gateways实现异构数据库的数据遮蔽数据屏蔽操作支持命令行(EMCLI),生产,测试,SALARY40,00060,000,46,-,SQL计划+统计更改后的试验测试并预测系统更改对SQL查询性能的影响分析性能更改(提高或降低)情况全面的性能分析和报告在测试环境中重新执行SQL查询端到端的解决方案:STS、SQLPlanBaselines、SQLTuningAdvisor,OracleRealApplicationTestingSQLPerformanceAnalyzer,SQL负载STS,SQL计划+统计更改前的试验,分析报告,比较SQL性能,47,-,降低数据库更改的成本和风险完全自动化的工作流提供对以下的更改保证数据库和O/S升级,如迁移到Exadata配置更改,如从单个实例到RAC的转换存储更改O/S迁移,如从Windows到Linux支持从Oracle9iR2升级到10gR2和11g!,测试重放驱动程序,捕获,处理,重放,分析与报告,生产客户端,存储,存储,OracleRealApplicationTesting数据库重放,48,-,自助式访问自由、专业的自助式控制,基础架构即服务(IaaS)x86和SPARC平台即服务(PaaS)数据库(DBaaS)、Java,物理和虚拟环境支持现成的门户和API,49,-,监视和管理运营,跟踪资源流动、承租方、策略违规等监视请求和故障管理资源和容量利用率自动、策略驱动的灵活性,50,-,服务的计量、计费和优化,从应用程序到磁盘的资源计量计费OracleBillingandRevenueManagement(BRM)集成优化性能、容量、QoS、成本,51,-,了解现状,资产发现自动化的库存硬件/软件配置操作系统硬件数据库打包的应用程序配置搜索关系,实时监视实时检测什么人于什么时间做了哪些更改合规性框架SOX、PCI、CoBIT更改调节授权的或未授权的,规范配置,配置合规性,偏差分析配置比较跨整个系统跨整个生命周期基准和黄金标准一对一、一对多偏差调节,主动检查策略管理现成的策略用户自定义策略用户自定义组合规性信息板,检测配置更改,集中式配置与变更管理,52,52,-,自动配置收集,自动收集主机、操作系统、数据库、中间件、应用的指定信息允许用户自定义配置收集项图形化设置界面和开箱即用的语法可以修改已定义的所有配置收集项拓扑视图,显示相互关系从系统层面管理依存分析影响分析定制化视图和关系,53,-,根据目标或者与目标相关的对象的配置属性设定灵活的检索条件可以将常用的搜索条件保存为预定义的搜索,配置检索快速回答复杂的问题,54,-,资产跟踪详
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海南湖职业技术学院《中医临床护理学》2025-2026学年期末试卷
- 中枢神经系统感染监测指南
- 2026年成人高考经济与管理类财务管理真题单套试卷
- 2026年成人高考高起专语文(综合)冲刺单套试卷
- 浅析事业单位档案的规范化管理和优化策略
- COPD 患者呼吸困难的典型特征
- 2026年5月注册安全工程师执业资格考试案例分析单套试卷
- GE 德鲁克传感器:压力测量领域的卓越典范
- 造价工程师真题及答案
- 员工综合素质题目及答案
- 第5课《大自然的语言》课件++2023-2024学年统编版八年级语文下册
- 有创血压测量操作评分标准
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验
- 数据排序课件浙教版高中信息技术选修1
- 对外投资合作国别(地区)指南 -印度尼西亚-20230619-00348
- 《公共政策学-政策分析的理论方法和技术》重点解析讲述
- python课件第三章基本数据类型:数字类型及math库的应用
- GB/T 5782-2016六角头螺栓
- GB/T 5023.5-2008额定电压450/750 V及以下聚氯乙烯绝缘电缆第5部分:软电缆(软线)
- GB/T 34940.2-2017静态切换系统(STS)第2部分:电磁兼容性(EMC)要求
- GB/T 14056.2-2011表面污染测定第2部分:氚表面污染
评论
0/150
提交评论