版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第8页共12页第2页共12页文档编号XX_3_SYS_系统部日常安全监控管理规范版本号V1.0密级内部公开系统部日常安全监控管理规范XXX信息技术有限公司文档信息发布版本:V1.0最后发布时间:XX编写人:XX审核人:XX版本控制编号修订人修订时间版本号修订内容说明123
目录903第一章目的 426977第二章适用范围 42188第三章职责与分工 423764第四章监控分类 47893第五章监控策略原则 624500第六章机房环境监控策略 632291第七章设备硬件监控策略 824227第八章程序及进程监控策略 911494第九章网络及线路监控策略 1018757第十章监控策略的实施 117011第十一章维护与解释 12
目的为有效保障XXX关键信息系统运行安全,及早发现事故隐患并处理,规范信息系统监控管理,特制定本程序。适用范围监控点是指各系统有可能出现故障的隐患点,包括硬件、软件、以及支持系统运行的基础环境。本程序适用于本公司总部的硬件设备、应用程序,还包括机房环境、网络线路等的日常监控管理。职责与分工职责与分工运营副总裁负责批准本程序。信息安全部负责组织编制、审核本程序,检查并监督本程序执行情况,协调解决相关问题。系统部:网络工程师负责对公司硬件设备包括网络出口设备、核心交换机、路由器进行监控与日常维护;系统工程师与数据库工程师负责对服务器、存储等情况进行监控和维护,同时,还包括对应用程序、机房环境、网络线路等的日常监控管理。监控分类关键系统监控对象可进行如下分类:机房环境监控:包括机房温度监控、机房湿度监控、机房红外监控、机房烟雾监控、机房地面水浸监控、机房出入门禁监控、机房市电输入监控、空调运行情况、UPS运行情况等。备注:本公司核心机房托管于世纪互联,机房环境监测由世纪互联的维护人员负责相关内容的日常监控,具体由IDC托管机房完善此项工作。涉及到对XXX生产应用服务器、数据库服务器以及存储等设备,涵盖如下的重哟啊监控信息指标:设备硬件监控:包括服务器的负载情况、CPU利用率、内存使用率、交换空间的空闲率、硬盘使用率,以及涵盖了对硬件之间的I/O吞吐情况等。涉及到XXX核心的应用程序需要完成如下的实际监控内容与性能指标:根据应用的等级进行划分,大致分为应用服务器JBOSS/CDN服务器/DB服务器等;其中,应用服务器监控需要涵括对应用组JBOSS以下重要指标:HTTP可用数监控、FreeMemory可用内存监控、ThreadBusy现成繁忙情况监控、ActiveThreadCount当前活动线程数监控、maxThreads最大线程数监控、Established建立连接数监控、Time_WAIT等待连接数监控等;包括前端应用程序、DB与后台服务程序需要记录当前DB2DS/DBSTATE的状态,完成数据库系统以及中间件程序的正常工作等。具体本文末尾的附件内部——《XXX运维监控管理列表》网络通信和安全系统监控:包括局域网络、广域网络及互联网的监控,以及广域网线路和互联网接入线路的监控和安全系统监控等。根据监控系统所发挥的监控作用可进行如下分类:状态监控:指对监控点是否运行在正常状态的监控;性能监控:指对监控点的性能和容量是否满足设定指标要求的监控。根据监控系统的工作原理可进行如下分类:应用层监控:指使用应用系统软件进行的监控。该系统一般独立于被监控系统运行,通过检查系统各监控关键点运行状况是否满足设定阀值要求,来实现监控功能;专用工具监控:指针对特定设备、系统使用厂商或第三方的专用工具来进行的监控。监控策略原则系统部及各应用系统负责部门应针对关键和重要系统,确定相应的监控点,并制定相应的监控策略。监控策略制定应遵循以下原则:有效性原则,即应根据系统的特点和在所关注的信息系统整体所发挥的作用制定监控策略,确保监控功能发挥应有的作用;可靠性原则,即监控策略,尤其是关键功能点的监控策略应尽可能采用软件与硬件相结合、自动与人工相结合等方式,以使监控能对影响或可能影响服务的事件准确及时响应;可行性原则,即制定的监控策略应能通过工具、巡查有效执行;开放性原则,即监控策略应具有较好的兼容性和可扩充性,可根据系统的增减和变化不断完善。监控策略制定时,应充分考虑被监控系统的对象分类,根据其系统特点和在信息系统中发挥的作用,来确定相应的监控点和监控策略。监控策略制定时,应对监控点分别考虑监控作用分类,即单一状态监控、单一性能监控、或两者同时监控。监控策略制定时,应充分考虑完成监控功能所需的条件,在技术条件许可的前提下,应尽量采用自动监控策略。机房环境监控策略系统部需对机房的温度湿度进行有效监控,具体要求如下:监控时间:每日应24小时对机房的温度湿度进行探测监控。监控要求:要求监控超出规定范围时能够通过报警声和短信相结合的方式进行预警,具体监控范围参见下表(引自《电子计算机房设计规范》GB50174)监控项目总部主机房和灾备机房各分支机构机房夏季冬季全年温度22±4℃20±4℃16-26℃相对湿度45%-65%40%-70%温度变化率<5℃/h并不得结露<10℃/h并不得结露系统部需对机房人员进出进行有效管理,具体要求如下:监控时间:每日应24小时对机房进行门禁管理、保安值班和人员物品出入登记。监控记录频次:实时记录。监控要求:在机房各出入口,应当配备门禁系统,只有经过授权的人员才能通过门禁系统进出机房,门禁监控系统应当能够详细记录人员进出情况。系统部需对机房的火灾隐患进行有效监控,具体要求如下:监控时间:每日应24小时对机房进行烟感探测。监控记录频次:实时记录。监控要求:机房内应当在每20平米配备至少一个烟感探测设备,烟感探测设备应与机房环境监控系统相连。并能够通过报警声及短信方式进行预警。信息技术中心需对机房的地面水浸进行有效监控,具体要求如下:监控时间:每日应24小时对机房进行水浸探测。监控记录频次:实时记录。监控要求:机房内应当在消防供水管道附近、空调主机附近及空调风口附近配备若干水浸探测设备,水浸探测设备应与机房环境监控系统相连,并能够通过报警声及短信方式进行预警。信息技术中心需对机房的市电输入情况进行有效监控,具体要求如下:监控时间:每日应24小时对机房市电输入进行监控,应采用持续探测监控。监控记录频次:实时记录。监控要求:应对市电输入交流电压监测(按三相考虑)、负载分配交流电流监测(按三相考虑)、直流电压输出配电监测。项目ABC稳态电压偏移范围(%)±2±5+7
-13稳态频率偏移范围(Hz)±0.2±0.5±1电压波形畸变率(%)3-55-88-10允许断电持续时间(ms)0-44-200200-1,500此外有条件的机房,还应对重要机柜中的微环境进行有效监控。设备硬件监控策略系统部及各应用系统负责部门按照关键业务的优先级别,对支持关键和重要业务运行的设备进行有效监控。应通过技术手段对设备的CPU利用率进行监控,如有多个CPU或多内核CPU的,应当对所有CPU或内核进行监控。CPU利用率设定的监控阀值应不超过75%。应通过技术手段对设备的内存使用率进行监控,应监控物理内存的总量、已用量、余量以及虚拟内存的使用情况。内存使用率设定的监控阀值应不超过80%。应通过技术手段对设备的硬盘使用率进行监控,应监控硬盘存储空间的总量、已用量、余量的使用情况。根据对象不同,比如应用服务器设置的阀值不超过80%,数据库的磁盘监控不应该低于20%。应通过技术手段对诸如采用磁盘阵列技术、磁盘柜以及各板卡间的I/O吞吐情况进行监控。以上监控内容的监控间隔应控制在2分钟以内,并通过技术手段对其进行24小时不间断监控,其监控报警应至少包含有声音和邮件方式。机房的空调系统作为重要的硬件设备,应当对其进行重点监控,对其监控的要求如下:监控时间:每日应24小时对机房空调的运行情况进行监控。监控要求:要求监控超出规定范围时能够通过报警声、电话等方式进行报警,具体监控范围包括机房空调制冷量、送风量、空调异常故障、空调断电自启动情况等。如无自动监控系统,可采用人工巡查方式实现空调系统监控。机房的UPS后备电源系统,作为重要的硬件设备,应当对其进行重点监控,对其监控的要求如下:监控时间:每日应24小时对机房UPS的运行情况进行监控。监控要求:要求监控超出规定范围时能够通过报警声、电话等方进行报警,具体监控范围包括市电输入端电压电流变化情况、UPS负载情况、UPS输出电压电流变化情况、UPS电池供电情况、UPS旁路工作状态以及UPS的异常故障及报警状态等。如无自动监控系统,可采用人工巡查方式实现UPS系统监控.程序及进程监控策略系统部及各应用系统负责部门应当根据业务系统的优先级别,对支持关键和重要业务系统运行的程序、进程、后台数据库、消息队列等运行情况采用技术手段进行重点监控。对程序和进程的监控应当对程序或进程的运行个数、窗体的运行个数进行有效监控。对于与重要应用系统密切相关的程序,应当保证在业务服务时间段内进行重点监控,目的是防止重要程序或进程意外关闭或终止。对程序和进程的监控还应当包括对支持程序和进程运行的系统服务的监控,其运行状态也会影响到程序和进程的运行状态。对后台数据库的监控,重点是对数据库死锁现象进行监控。对数据库的监控应当每天24小时进行监控,目的是防止数据库死锁对业务的影响。对数据库的监控还应当包括对表空间和数据的监控,重点是对业务数据进行监控,已确保业务的正常开展。对应用中间组件、DB及消息队列的监控主要是对队列以及队列中具体作业运行状态进行监控。对队列的监控应当保证在业务处理时间段内进行重点监控。网络及线路监控策略网络及线路作为信息系统关键的支持部分,信息技术人员应当对其进行重点监控。对网络及线路的监控应当包括如下内容:关键和重要网络和安全设备的运行日志、异常行为监控、性能监控、性能数据进行连续采样、记录、阀值预警和趋势分析;广域网主备线路通断状态的监控,对流量进行连续采样、记录、阀值预警和趋势分析;在正常情况下,由网络工程师每次例行巡检工作中,巡检主要包括对广域网的主、备线路的状态进行测试评估,并通过结合运用商提供的线路信息,做好对流量的监控处理。局域网链路通断状态的监控,对流量进行连续采样、记录、阀值预警和趋势分析。系统部及各应用系统负责部门应当运用技术手段对网络及安全设备的运行日志进行采集和分析,日志的采集和分析应当每日进行,并每周形成汇总报告。系统部及各应用系统负责部门负责对系统日志的审核。系统部负责对网络及安全设备的性能监控,应当包括信息机房和关键防火墙设备、核心路由器设备、核心交换机设备的CPU利用率监控,各设备的CPU利用率监控阀值应当小于50%。信息技术中心对广域网通信线路的监控应当包括对外部广域网、内部广域网、互联网连接质量、流量、中断情况的监控。系统部对局域网的监控应当包括对各链路通断状态、各端口运行情况、网络异常行为的监控。以上监控内容应当对其采用技术手段进行监控,并在发现异常时能够及时通过报警声或短信、电话等方式及时报警。监控策略的实施系统部应当根据各系统监控策略,按照成本风险平衡原则,对监控系统进行选型和建设工作。系统部及各应用系统负责部门负责人,负责确定监控策略、制定监控技术方案;系统开发负责人或技术支持负责人,对首次开发上线的系统负责提交监控策略和监控方案的建议,并对运行中系统的监控改善提出建议。各系统监控的技术方案中应当包含监控内容、监控点、监控工具、监控方法、监控阀值、监控周期、验证方法等内容。监控的技术方案中,其选择方法为首先查找系统可能存在的单点故障,将其作为最重要的监控点;其次查找对系统可能产生风险的事件,将其列为监控点。最后,根据监控策略对其进行监控阀值的设定。各系统监控的技术方案制定完成后,提交风险委员会负责评估及审批,审批后各系统负责人应按照各监控点的相应要求部署监控系统,并设置相应监控参数。各系统负责人在选用监控工具时,应当确保对各系统的运行影响控制在可接受的范围内。监控系统部属完毕后,应当对其进行相应测试验证。主要是采用通过模拟临界阀值,来验证各监控点的监控有效性,以确保其监控性能、预警要求达到监控策略和监控技术方案的要求。信息技术中心在实际运行过程中,如发现监控系统出现异常问题或者没能够及时对系统异常情况进行预警,应立即对监控策略和监控系统进行相应的梳理和排查,发现不足应当对监控策略、监控技术方案、监控
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 语言学习技巧与教学方法知识框架
- 旅游产品开发与管理策略指南
- 数据分析在早班会中的应用案例
- 轨道交通设施安全预防性维护措施
- 旅游酒店服务合同要点解读
- 社会老龄化背景下养老产业分析
- 研学旅行活动策划书模板
- 工业园区绿色发展实施方案
- 市场营销策略及执行效果评估
- 化学品防护装备使用教程
- 监控设备搬迁合同书范本
- 水电消防安装施工方案
- 四年级上册心理健康课件-第十一课-告别懒惰-积极进取|北师大版-11张课件
- 2024年高考真题读后续写-2025届高三英语二轮复习专项
- 真题解析 -2025年高考地理选择性必修第二册(人教版)
- 2024年高考数学试卷(文科)(全国甲卷)【含解析】
- SMT-外观检验标准
- 人教版八年级数学下册常考点微专题提分精练期末难点特训(三)与平行四边形有关的压轴题(原卷版+解析)
- TD/T 1056-2019 县级国土资源调查生产成本定额(正式版)
- 第2课生涯规划筑梦未来第一框(课件+视频)-【中职专用】高一思想政治《心理健康与职业生涯》高效备课课件(高教版2023·基础模块)
- 嗜酸性细胞的转录调控机制
评论
0/150
提交评论