vm日常维护.doc_第1页
vm日常维护.doc_第2页
vm日常维护.doc_第3页
vm日常维护.doc_第4页
vm日常维护.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

VMware vSphere 5虚拟化日常管理目 录1虚拟化监控和性能管理21.1使用vCenter监控21.1.1主机及系统类事件31.1.2网络类事件51.1.3存储类事件61.1.4虚拟机类事件71.2使用vCops监控72虚拟化架构日常维护8111 虚拟化监控和性能管理.1 使用vCenter监控借助事件监控和报警系统,在vSphere、vCenter中将被配置以便监控所有核心虚拟架构的健康和性能内容,包括esxi主机、HA、虚拟机操作如VMotion和vCenter自身的健康。本项目中主要使用vCenter作为操作控制中心,同时根据需求拟定的监控主要的对象包括以下四个方面: 1. 主机及系统类事件; 2. 网络类事件; 3. 存储类事件; 4. 虚拟机类事件; 1.1.1 主机及系统类事件事件对象事件描述触发条件警告等级 事件响应事件处理事件通知vCenter Server监控vCenter服务运行状况更改监控vCenter Server服务运行状态状态,如果运行状态出现问题,则进行报警高虚拟化平台系统管理员vCenter Server运行状态进行报警,需要检查vCenter运行情况发送陷阱通知,如未解决则每5分钟重复发送一次 主机 监控主机连接和启动状况的警报主机连接状况为无响应,并且主机电源状态不等于无则产生黄色警告, 主机连接状况为无响应,并且主机电源状况不等于待机则产生红色警告高虚拟化平台系统管理员监控到主连接状况异常,可能主机发生意外宕机,需要检查主机连接及加电情况,可能造成生产问题。发出vCenter告警信息,如果无人响应则每5分钟告警一次。主机 监控处理器的默认警报监控到主机硬件处理器健康状态转为警告产生黄色告警 监控到主机硬件处理器健康状态转为警示产生红色告警高虚拟化平台系统管理员监测到ESX主机处理器产生状态告警,需要及时检查主机物理CPU,否则影响到主机系统正常运行。发送陷阱通知,每次健康状态变化发送一次。主机 监控内存的默认警报ESX服务器硬件内存健康情况发生告警高虚拟化平台系统管理员ESX服务器内存故障,需及时检查主机物理内存,否则会影响系统正常运行。发送陷阱通知,每次发生状态变化发送一次。主机监控主机连接故障的警报无法连接主机-ccagent不正确 无法连接主机-网络错误 无法连接主机-超时 主机连接丢失高虚拟化平台系统管理员vCenter无法连接到被管理主机,检查是否发生管理代理agent错误、网络连接问题、连接到主机超时、与主机连接丢失等情况,需尽快处理,可能存在隐患。发送陷阱通知,如未解决则每5分钟重复发送虚拟机监控虚拟机错误和警告事件的默认警报监控到虚拟机发生错误或产生告警高虚拟化平台系统管理员虚拟机运行过程中发生警告或发现错误,需尽快检查报错虚拟机,否则会影响虚拟机正常运行。发送陷阱通知,如未解决则每5分钟重复发送一次虚拟机监控虚拟机无法迁移或重定位,或者是否处于孤立状态的默认警报发生无法迁移虚拟机事件 发生迁移错误 发生迁移主机错误事件 无法重新定位虚拟机 已孤立虚拟机高虚拟化平台系统管理员当出现如下情况则进行报警:发生虚拟机无法迁移的情况、在迁移中出现错误、迁移主机发生错误、无法对迁移后的虚拟机进行重新定位、所迁移虚拟机被孤立,需要检查迁移中出现的错误,否则影响到系统正常迁移。发送陷阱通知,如未解决则每5分钟重复发送一次。虚拟机监控虚拟机上的高可用性错误的默认警报无法重置启用HA的虚拟机已经重置启用HA的虚拟机 硬件重置启用了HA的虚拟机并保存屏幕截图高虚拟化平台系统管理员虚拟机运行过程中发生错误,并出现以下情况: HA发现虚拟机错误但无法重新启动该虚拟机、HA发现虚拟机错误并重新启动了该虚拟机、HA通过直接直接关闭虚拟机电源方式硬件重置了HA虚拟机并保存了该屏幕截图,需尽快检查发生错误虚拟机及集群,否则有潜在威胁影响正常运行。发送陷阱通知,如未解决则每5分钟重复发送一次。1.1.2 网络类事件事件对象事件描述触发条件警告等级 事件响应事件处理事件通知网络监控虚拟交换机上的网络连接的警报网络连接丢失高虚拟化平台网络管理员虚拟交换机上的网络连接丢失,虚拟机无法连接到网络造成生产问题,需立即检查虚拟交换机的网络连接情况。发送陷阱通知,如未解决则每5分钟发送一次主机监控虚拟交换机上网络上行链路冗余丢失的警报网络冗余丢失中虚拟化平台网络管理员虚拟交换机上网络上行链路发生故障,导致冗余丢失,需立即检查虚拟交换机上连链路的通讯情况,否则会产生单点故障。发送陷阱通知,如未解决则每5分钟发送一次主机未正确配置 VMKernel NIC 的默认警报/Migrate/Vmknic中指定的 vmknic 无效高虚拟化平台网络管理员VMKernel的网络配置有错误,指定的网卡无效,需立即检查vmkernl网络配置,否则会影响VMOTION功能的正常运行。发送陷阱通知,如未解决则每5分钟重复发送一次1.1.3 存储类事件事件对象事件描述触发条件警告等级 事件响应事件处理事件通知数据存储监控主机与存储设备的连接的默认警报主机与存储的连接丢失 主机与存储的冗余路径丢失 主机与存储的部分冗余路径丢失,导致冗余已经降级 高虚拟化平台系统管理员监测到ESX主机与存储的连接异常,需要检查主机与存储设备的连接情况,否则影响到系统正常运行。发送陷阱通知,如未解决则每5分钟发送一次数据存储监控数据存储发生外部I/O负载 监控数据存储所连接ESX主机未全部支持I/O Control 监控数据存储所连接ESX主机未纳入vCenter管理范围 所使用存储阵列由非vSphere的I/O发生,如存储阵列的复制中虚拟化平台系统管理员检查该数据存储所连接的ESX主机是否全部支持I/O Control,同时在存储阵列上是否有例外的非vSphere I/O发生。发出vCenter告警信息,如果无人响应则每5分钟告警一次。1.1.4 虚拟机类事件事件对象事件描述触发条件警告等级 事件响应事件处理事件通知虚拟机监控虚拟机内存使用情况的默认报警虚拟机内存使用情况高于85%持续10分钟以上黄色告警 虚拟机内存使用情况高于95%持续10分钟以上红色告警高虚拟机管理员虚拟机内存利用率过高,需尽快检查虚拟机内存使用情况或增加虚拟机内存资源,否则会影响虚拟机正常运行。发出vCenter告警信息,如果无人响应则每5分钟告警一次。主机监控虚拟机CPU使用情况的警报虚拟机CPU使用情况高于75%超过5分钟为黄色告警,虚拟机CPU使用情况高于90%超过5分钟为红色告警,如果无人在VMAWARE vCenter平台中确认该告警,则每隔5分钟再产生一次该警报中虚拟机管理员虚拟机CPU使用率过高,需尽快检查虚拟机内部CPU使用情况或增加虚拟机CPU资源,否则使用会影响系统运行效率发出vCenter告警信息,如果无人响应则每5分钟告警一次。当以上警告触发以后,vCenter Server上的警报栏里会有相应的信息显示。同时我们在这些默认的警报基础上,还可以根据实际的环境需求进行警报的自定义设置。1.2 使用vCops监控为了使用vCenter Operation Management进行监控,我们推荐使用默认的动态监测指标完成监控,可以在系统运行一段时间以后根据需求调整各种监测指标。2 虚拟化架构日常维护虚拟化架构日常维护以满足业务连续性为主要目标,我们根据行业客户的虚拟架构运行状况拟定了一下工作表作为参考,以标示日常虚拟架构检查工作内容:序号工作类别工作任务描述工作方法责任角色1故障检查检查集群HA是否存储在故障检查VC中的告警页面是否有集群HA的告警系统管理员监控管理员检查集群DRS是否存在故障检查VC中的告警页面是否有群集DRS告警系统管理员监控管理员检查虚拟机是否发生故障检查VC中的告警页面是否有虚拟机的告警虚拟机管理员检查虚拟网络架构是否发生故障在VC中的网络页查看是否有网络故障网络管理员检查虚拟存储是否发生故障在VC中的存储页查看是否有网络故障系统/存储管理员2容量检查检查存储容量是否发生报警在存储视图中查看各个存储容量是否超过80%系统/存储管理员监控管理员检查vCenter数据库是否接近预设值登陆到数据库查看VC使用的数据库容量可用空间是否低于5%系统管理员3性能检查检查群集、资源池CPU利用率是否接近75%在VC中查看群集和资源池的CPU利用率资源池管理员监控管理员检查主机、虚拟机CPU就绪时间在VC中查看那逐句和虚拟机的就绪时间不超过3000ms虚拟机管理员监控管理员检查群集、资源池内存占用率是否接近85%在VC中查看群集和资源池的内存占用率资源池管理员监控管理员检查虚拟机的虚拟磁盘读写性能在VC中查看各个虚拟机读写延时是否过高虚拟机管理员监控管理员检查虚拟机网络的延时和丢包率是否过高在网络视图中查看那各个虚拟交换及端口组的网络平均时延和丢包率 网路管理员监控管理员4事件日志检查检查最近一个月是否发生位置的登录、控制和配置更改事件在VC中查看系统日志和事件系统管理员监控管理员5备份管理在辈分软件中查看针对虚拟机VMDK文件的备份任务和计划是否正常在备份软件中查看针对虚拟机VMDK文件的备份任务和计划是否正常系统管理员6安全检查查看虚拟架构的安全配置在VC中分别查看每台主机的防火墙配置是否发生未知的变化系统管理员检查虚拟机安全在虚拟机中查看系统日志,检查是否有未授权的登录行为系统管理员虚拟机用户以上内容为虚拟化架构日常维护检查。由于每个企业用户的规模,服务器整合比例不同,对于性能和安全性要求的级别也不同,因此检查内容根据不同的虚拟化环境检查的方向和任务内容也不同。上表中所列内容为使用虚拟化环境的一般检查内容和方法。具体到某个问题或是检查内容,可参考 vmware知识库以上检查工作将告知相应用户角色可能发生的问题,具体解决步骤将参照以下文档和链接: l 数据中心管理指南 -/vsphere-50/topic/com.vmware.ICbase/PDF/vsphere-esxi-vcenter-server-50-host-management-guide.pdf l 可用性指南 -/vsphere-50/topic/com.vmware.ICbase/PDF/vsphere-esxi-vcenter-server-50-availabi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论