




免费预览已结束,剩余13页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
IP网设备维护规范第一章 设备维护管理第一节 设备维护管理基本规定湖南有线网络的网络维护规范第1条 互联网设备的维护包括日常维护、定期维护和突发性维护(故障处理):(1) 日常维护是指日常检测等经常性的简单维护工作,包括对设备、系统、电路、网络性能的实时监控。(网络的定义:湖南省有线电视广播通信网骨干光纤技术网、干线网、IP通讯网、城域网、接入网(数字电视信号网、双向通讯网)、维护的内容、定期维护或zhangai处理;整个的维护体系架构:城域网等;)全省的网络维护按照统一规统一平台分期管理分期维护的原理;解释什么叫统一规范统一标准和分期管理等定义;4分省级、市级维护;再分两个部门及其工作内容,各高级公司设置二级网管中心,一级网管中心和维护中心等关系;省级设置维护网络维护高度档;各级维护部门应配备的人员要求根据何原则来定;维护的管理机构、调度机构及其关系区分职责进行定义;(组织机构)一、维护规范:分层来写三、维护流程:区分好维护管理部门与维护调度部门及其下面的关系;跨域流程、本域流程四、维护的质量标准:正常的各级网源的合格值、故障的定级(重大大事故、大事故、一般事故障碍)五、考核标准:各种网源、各种事故的考核标准及责任人六、资源管理:所有的资源进行定义:所有网源、地址(设备、管理、IP、HFC、虚网号)、作出标准规范都是资源;市级公司对集团的对接口要作关于双向数据网的规范关于具体的IP设备传输设备和日常网络维护 数据来源 1日常维护:零检和定检:对于城域网 OSR核心设备 定检,零检是分片检查,进行抽检;代维机构需要定检;2业务割接(放入规章)方案和制定审批程序、准备工作、实时检查工作(2) 定期维护是指按规定期限进行的预检、预修、检测等维护工作。包括对设备、系统、电路的周期性检测,对设备所在机房的巡视和环境维护等;设备的定期维护应有详细记录,并由主管负责人审核、签字。(3) 突发性维护指对设备、系统、电路的故障处理等。第2条 各公司对辖区范围内的所有互联网相关设备、电路等应建立准确、完备的资料档案,对辖区用户的相关资料、接入路由应建立详细、准确的台帐信息,并做到及时更新。第3条 互联网网管和设备维护分工原则。1. 网管部门负责监控网管设备和所辖网络设备的工作情况,负责所辖网络的性能统计、分析;管理相关网络资源,提出网络优化需求及制定优化方案;负责网络业务数据处理,提供节点设备维护技术指导,并负责监督。现场维护部门负责监测属地所有网络设备的运行状态,并负责故障处理、设备硬件维护和返修。2. 对于互联网设备故障,由网管部门主持协调处理,现场维护部门协助配合,并对故障现象和处理过程作详细记录。3. 对于涉及相关设备的中继和用户电路阻断,现场维护部门应积极配合网管部门尽快查找原因,判断故障段落。在确定非本端的问题后,应及时通知传输维护部门,并作好相关情况的记录。第4条 未得到相关维护管理部门的许可,严禁对路由器、高端以太网交换机、宽带接入服务器等重要网络设备执行硬重启、复位和软件或局数据加载等操作。第5条 各级维护部门对所有网络设备应包机到人,实行包机责任制。第6条 新设备启用应执行入网许可证制度及公司的验收测试制度。第7条 新建的互联网设备的业务开放,必须经过工程初验,满足各项技术指标和设计要求,才能入网投入使用。第二节 设备维护具体要求第8条 互联网网络设备维护项目及要求。1. 主要项目:(1) 监测节点板卡运行状态;(2) 监测中继电路状态;(3) 监控设备或系统CPU、内存占用率;(4) 检查是否有严重和致命级别告警;(5) 检查分析系统日志;(6) 统计中继电路利用率(平均和峰值);(7) 统计出口中继电路出入流量;(8) 检查、修改设备各级登录口令,定期进行口令修改;(9) 清洁机房环境和设备。2. 维护要求:(1) 监控设备运行状况,保证网络正常运行;(2) 发现故障后应及时处理,无法排除的故障寻求相关厂家技术支持,并汇报相关领导;(3) 做好相关记录。第9条 互联网主机设备维护项目及要求。1. 主要项目:(1) 监测设备CPU、内存状态;(2) 监测磁盘阵列、存储空间;(3) 监测文件系统;(4) 检查重要进程及数据库存活性、健康性;(5) 监测设备日志及告警信息。2. 维护要求:(1) 监控设备运行状况,保证相关设备正常运行;(2) 发现故障和隐患后应及时处理,并做好记录。第10条 互联网接入设备维护项目及要求。1. 主要项目:(1) 监测节点设备主控板CPU占用率;(2) 监测单板运行状态;(3) 检查节点是否有严重和致命级别告警;(4) 统计端口占用率;(5) 统计分析中继流量、中继占用率情况(平均和峰值)和并发用户数;(6) 检查分析设备系统日志。2. 维护要求:(1) 监控设备运行状况,保证网络正常运行;(2) 发现故障和隐患后应及时处理,并做好记录。第11条 互联网软件(包括网络设备操作系统软件、网管软件、认证计费系统软件、DNS软件, 安全软件等)和配置文件维护项目及要求。1. 主要项目:(1) 软件及配置文件备份;(2) 软件版本升级;(3) 配置数据的增、删、改。2. 维护要求:(1) 设备的配置文件应定期进行备份;(2) 所有设备在作配置修改前,必须对可能受到影响的系统软件、数据库、配置文件进行完整的备份,并做完整性、一致性检查;(3) 设备配置文件的备份必须多于一份,且保存在不同的存储介质上;(4) 对互联网设备的软件版本进行周期性审计和分析的工作,并提出更新、升级建议。第12条 互联网资源数据档案、运维资料的维护管理。1. 资源数据档案、运维资料包括:(1) 网络拓扑结构;(2) 中继电路及用户电路资料;(3) 配置数据、设备局数据资料、维护操作手册;(4) 配置数据修改记录、故障处理记录、值班日志;(5) 设备台账和机历簿;(6) 运维人员通信录。2. 维护要求:(1) 严格管理相关维护资料,建立文档管理体系;(2) 严格遵守公司相关保密制度,未经批准不得擅自向公司以外人员泄露相关资料;(3) 根据网络的变更及时更新资料内容。第二章 网络维护管理第一节 网络运行维护指标第13条 互联网网络及设备的主要运行维护技术指标见附录1。第14条 网络运行质量指标统计项目1. 网络/系统可用率;2. 设备CPU/内存利用率;3. 端口占用率;4. 中继电路利用率(峰值、平均);5. 中继电路可用率;6. 网络中继电路流量(流入、流出);7. 网络时延;8. 网络丢包率;9. 宽带认证平均响应时长;10. 忙时认证成功率;11. 重大故障的次数和历时。第三章 故障管理第一节 故障定义第15条 互联网故障是指由于互联网设备、主机系统等发生故障而导致影响业务正常使用或危及网络安全稳定运行的情况。互联网故障按影响业务的严重程度分类如下:1. 重大故障:(1) 出口、省内骨干网某一汇聚节点全阻,历时30分钟。(2) 互联网骨干网承载的某类产品或业务(如VC/VPN等)无法正常运行,历时60分钟。(3) 由于路由原因或安全原因,导致出口、骨干网流量出现较大异常,网络访问品质严重劣化,互联网骨干网丢包率30%或延时800毫秒,历时60分钟。(4) 城域网脱离骨干网,历时60分钟。(5) 某骨干网接入节点、出口节点全阻,历时60分钟。(6) 网络故障导致业务阻断影响:地级城市宽带用户数*20%*30分钟;县及县级市宽带用户数*50%*30分钟。注:宽带用户数是指网络上实际开通的用户总数,下同。(7) 互联网电话拨号业务阻断影响一千户*小时。(8) 专线接入业务阻断100端口*小时。(9) 域名解析系统或认证系统全阻,历时60分钟。(10) 党政军重要机关、与国计民生和社会安定直接有关的重要企事业单位及具有重大影响的会议、活动等相关通信阻断。2. 严重故障:(1) 骨干网某一核心节点全阻,历时15分钟但30分钟。(2) 骨干网某一方向汇聚节点间电路或出口电路阻断,历时30分钟但60分钟。(3) 互联网骨干网承载的某类产品或业务(如VC/VPN)无法正常运行,历时30分钟但60分钟。(4) 由于路由原因或安全原因,导致骨干网流量出现较大异常,网络访问品质严重劣化,互联网骨干网丢包率30%或延时800毫秒,历时30分钟但60分钟。(5) 骨干网某一方向中继电路(非核心节点间)全阻,历时60分钟。(6) 某骨干网接入节点、市级出口节点全阻,历时30分钟但60分钟; (7) 城域网脱离骨干网,历时30分钟但60分钟。(8) 网络故障导致业务阻断影响:地级城市宽带用户数*10%*30分钟;县及县级市宽带用户数*30%*30分钟。(9) 专线接入业务阻断50端口*小时。(10) 域名服务器或认证服务器或计费服务器中断,历时30分钟但60分钟。(11) 重要大客户中心节点业务全阻,历时60分钟。3. 一般故障:除以上故障外的互联网其它故障。第二节 故障处理第16条 故障处理职责:1. 集团公司网络管理调度部接受各级分公司的故障申告,或通过网管系统发现故障,负责判断并牵头处理互联网骨干网络故障,排查互联网骨干网络全网路由、流量等原因引起的故障,协调互联网骨干网络中继电路故障的排查。2. 对于互联网骨干网设备和电路故障,各分公司现场维护部门应按属地化管理原则,在集团公司的统一指挥下,完成对辖区设备和电路故障的处理工作。3. 集团公司出口由网络管理调度部协调各出口提供商处理,各出口提供商必须无条件配合集团处理器出口障碍,集团网络管理调度部及时做出出口流量调整,保障用户网络的通畅。第17条 故障处理的基本原则:1. 先抢通,后修复;先核心,后边缘;先本端,后对端;先网内,后网外。当两个以上的故障同时发生时,对重大阻断、重要大客户故障等予以优先处理。2. 监测传输电路是否正常,原则上以IP层环测为依据。第三节 故障报告、统计和分析第18条 故障报告要求:各级维护部门应及时处理故障,并根据故障情况逐级向上报告。1. 对于重大故障,直接上报集团网络管理调度部;2. 对于严重故障,各分公司立即进行处理,并上报集团网络管理调度部;3. 故障统计和分析:重大故障处理完毕,恢复通信后(二日内),相关运维管理部门应就故障现象、影响范围和时间、故障原因、解决处理情况等进行整理,形成正式的故障报告上报上级主管部门及领导;4. 对于网络故障,应做好详细记录,并定期对故障及处理情况进行汇总统计;5. 故障记录内容应包括故障现象、故障类型、故障起始时间、故障修复时间、故障历时、原因分析及解决情况、故障处理情况及责任分析等;6. 各级现场维护部门每月应根据故障类型、故障级别,对当月故障进行分析汇总,并上报同级运维管理部门。第四章 互联网网络安全管理第一节 网络设备和主机系统的安全管理第19条 重要网络设备应符合以下性能、安全要求:1. 设备可用率应达到或超过99.99%;原则上,设备的核心处理及交换模块、电源模块必须为1:1 主备模式;设备采用双/多路冗余供电方式;设备的线路卡要求N:1 备份;设备必须支持热插拔功能;设备在故障状态下可以实现一定程度上的故障自恢复,包括主备引擎的切换、不中断业务的转发等。2. 在新设备入网前,必须与现网网络设备进行严格的互通性测试,由新入网设备厂家提供测试报告及测试案例,确保新设备符合相关设备的技术要求。第20条 重要主机系统的安全要求。重要主机系统包括网管服务器、认证计费服务器、邮件服务器、DNS服务器等,应满足以下性能、安全要求:1. 采用负载分担或冗余配置,避免因单台设备故障而影响业务运行;2. 应部署服务器病毒防护系统,减少病毒对系统和应用软件造成破坏的机会,保证服务器的可用性;3. 杜绝对系统的非授权访问;4. 执行严格的审计策略,以增强系统的安全性;5. 采用防火墙、IDS或在路由器配置ACL等方式,对服务器提供保护;6. 严格管理软件版本及其补丁,保证及时进行服务器软件补丁升级、修补漏洞;7. DNS系统应配置递归查询IP源地址限制,只向本省用户提供递归查询服务;8. DNS系统应监测每秒查询数,限制超过设定门限值的源IP地址的访问;9. DNS服务器CPU峰值月平均利用率应小于80;10. 认证/计费系统磁盘占用率应小于80,应定期做好数据备份;11. 应制订DNS系统和认证/计费系统的应急预案。第二节 日常维护的安全管理第21条 网络及设备的日常安全管理:1. 各级维护部门应严格执行维护作业计划,每月定期检查网络设备的安全策略配置,并填写和保留有关记录。2. 每月定期进行设备硬件、系统软件、应用软件、运行状态检查,及时发现设备运行中的安全隐患,并填写和保留有关记录。3. 每月定期检查安全日志(包括系统访问日志、配置更改日志等),及时发现非法访问和异常配置的安全隐患,并填写和保留有关记录。第22条 对网络安全检查中发现的问题,应根据问题的严重性及影响范围制订修补计划,必要时可以寻求专业安全技术厂商的支持并报上级运维管理部门审批,在安全小组成员的监督下,由安全技术厂商进行渗透性测试,以检查安全问题解决的效果。第三节 网络安全防护第23条 远程登录访问控制要求1. 确保在所有登录服务的位置设置口令防护,其中设备登录和认证的通信过程应加密,确保AUX和Console接口设置EXEC口令。2. 严格限定特定的IP地址远程登录网络设备或主机设备。第24条 对设备的远程登录会话最大无响应连接断开时间应设置为不大于10分钟。第25条 应开启路由器、以太网交换机日志功能,同时必须保证日志功能对设备性能的影响较小。第26条 应针对路由器、交换机配置AAA功能,对于核心设备,应采用集中认证系统进行认证并记录设备访问和操作日志。第27条 关闭路由器、以太网交换机、服务器上不必需的服务。发现安全漏洞时,应采取必要的防护措施,并及时升级软件版本或安装补丁。第28条 流量监控要求1. 进行网络流量监控,按月定期采集、分析网络流量数据,了解网络流量的主要组成成份,形成网络流量的一般模型,掌握流量随时间变化的规律,及时发现异常流量。2. 开启网络设备接入访问包过滤控制功能,使用访问控制列表,防止异常流量对网络造成冲击。第29条 病毒防护按照公共分册相关要求执行。第30条 每年至少一次对重要网络设备进行安全审计和评估,形成评估报告,对评估报告中发现的安全隐患,应采取措施予以消除。同时做好相关资料的存档。第五章 维护作业计划第31条 维护作业的执行及记录:1. 维护作业计划应报上级运维管理部门,获批准后认真执行,所列项目和周期未经批准不得删减变动。维护作业计划完成后,必须详细记录完成情况和测试情况,同时将发现的问题摘要记录并做相应处理;测试记录由专人妥善保管。2. 各项计划一经下达应认真严肃对待,不得无故拖延计划的执行。3. 各级维护人员要严格按照维护作业计划的内容和周期认真执行。4. 维护作业应在业务空闲时进行,发现的不正常情况应及时处理和详细记录,对于无法处理的问题,应立即向主管负责人报告。5. 在记录里写明作业执行的结果、具体量化数据(如CPU利用率、磁盘占用率、网络流量等)、发现的问题及处理过程等。6. 遇需调整计划的,经上级运维管理部门批准后,随时下达,各级维护人员要认真执行。第32条 骨干路由器、城域网汇聚层及以上路由器/交换机、IP承载网软交换业务接入系统的三层交换机、防火墙的维护项目及维护周期:表2:骨干路由器、城域网汇聚层及以上路由器/交换机的维护项目及维护周期序号作 业 项 目周期备 注1检查节点路由状态日2监测节点各单板/模块运行状态日3监测中继电路状态日4检查系统资源占用情况(CPU、内存)日5检查是否有严重和致命级别告警日6系统日志检查分析日7忙时中继电路利用率统计周8监测各主要端口的流量是否异常周9出省中继电路出入流量统计周10出口节点间中继电路流量统计周11配置数据检查周12配置数据的备份周13检查设备安全日志月14检查设备安全策略配置月15设备各级登录口令修改季16设备和中继利用率的统计分析月17核心网至各出口及城域网节点忙时时延及忙时丢包率统计月18设备表面清洁,清洁风扇过滤器(双面)月19机房环境清洁月20包机月小结月21检查备用板功能是否正常月22检查带外网管系统是否正常半月23路由器、交换机系统软件版本统计半年第33条 宽带接入服务器的维护项目及维护周期:表3:宽带接入服务器的维护项目及维护周期序号作 业 项 目周期备 注1监测主控板、各单板/模块、端口状态日2检查系统资源占用情况(CPU、内存)日3检查系统日志,分析是否有严重和致命级别告警日4忙时中继电路利用率周5忙时并发用户数统计日6检查IP pool使用情况月7监测上联端口流量是否正常日8配置数据备份周/月数据发生变化时随时备份9各设备、各级登录口令修改季10中继流量的统计分析月11设备表面清洁月12机房环境清洁月13包机月小结月14检查备用板功能是否正常月第34条 重要主机系统的维护项目及维护周期:表5:主机系统的维护项目及维护周期序号作 业 项 目周期备 注1监测CPU利用率日2监测Memory利用率日3监测磁盘利用率日4监测网络连通性日5监测重要进程运行状态日6检查节点是否有严重和致命级别告警日7进行数据备份周8包机月小结月附录1:互联网网络及设备的主要运行维护技术指标指标1 点到点的包时延定义:指互联网上指定标测点网络设备到另一指定标测点网络设备的环回时延。计算方法:点到点的时延=指定标测点网络设备收到测试包时刻-指定标测点网络设备发出测试包时刻。指标: 省内城域网接入节点到省网出口节点的时延值应100ms。指标2 点到点的丢包率定义:指互联网上指定标测点网络设备到另一指定标测点网络设备的丢包率。计算方法:点到点的丢包率=(点到点的丢包数/点到点的总包数)*100%。指标: 省核心节点到出口之间的丢包率以及省内城域网节点之间的丢包率应1%。指标3 中继电路带宽峰值月平均利用率定义:指互联网上指定中继电路在一个月内每日峰值利用率的平均值。计算方法:中继电路带宽峰值月平均利用率=(当月中继电路带宽每日峰值利用率之和/当月的天数)*100%。指标:80%。指标4 中继电路可用率定义:指互联网中继电路在统计时长内可用比率。计算方法:中继电路可用率=(中继电路可用时长/统计时长)*100%。指标:99%。指标5 网络设备可用率定义:指互联网网络设备在统计时长内的可用比率。计算方法:网络设备可用率=(网络设备可用时长/统计时长)*100%。指标:99.9%。指标6 网络设备CPU月平均利用率定义:指互联网上指定的网络设备在一个月内CPU利用率的平均值。计算方法:网络设备CPU月平均利用率=(当月每日CPU平均利用率之和/当月的天数)*100%。指标:50%。指标7 网络设备内存月平均利用率定义:指互联网上指定的网络设备在一个月内内存利用率的平均值。计算方法:网络设备内存月平均利用率=(当月每日内存平均利用率之和/当月的天数)*100%。指标:70%。指标8 互联网主机设备CPU月平均利用率定义:指互联网上指定的主机设备在一个月内CPU利用率的平均值。计算方法:主机设备CPU月平均利用率=(当月每日CPU平均利用率之和/当月的天数)*100%。指标:70%。指标9 互联网主机设备内存月平均利用率定义:指互联网上指定的主机设备在一个月内内存利用率的平均值。计算方法:主机设备内存月平均利用率=(当月每日内存平均利用率之和/当月的天数)*100%。指标:50%。指标10 互联网主机设备硬盘月平均利用率定义:指互联网上指定的主机设备在一个月内硬盘利用率的平均值。计算方法:主机设备硬盘月平均利用率=(当月每日硬盘平均利用率之和/当月的天数)*100%。指标:50%。指标11 宽带认证平均响应时长定义:在指定的统计时期内,宽带上网用户从呼叫建立到呼叫认证响应所需的平均时长。计算方法:宽带认证平均响应时长=(考察的宽带认证响应时长之和/考察个数)*100%。指标:8秒指标12 忙时认证成功率定义:指在指定的忙时统计时期内,上网用户输入认证信息(用户名、密码)后,认证服务器接受认证事务并正确响应(包括正确认证和正确拒绝)的总次数与接入服务器发出的认证请求总次数之比。计算方法:忙时认证成功率=(认证请求正确响应次数/认证请求总次数)*100%。指标:99%。注:本指标包含窄带拨号和宽带拨号。实际指标超标的处理当实际网络运行指标超出上述维护指标要求时,运维部门必须提出相关的网络优化、改造、扩容建议和申请,并予以跟踪、记录和备案。网络运行质量指标,以公司总部下达的最新指标为准。割接调度单XX年XX月XX日XX号 申请单位申请时间申请人:施工单位影响范围工作内容施工单位必须在调度单后附实施方案及应急措施,局方认可后签字确认审核人:部门主管签批人:部门经理基础管理规范一、 台帐管理1.1分级台帐管理制度根据当前集团网络结构,集团网络分为核心层(包括出口设备)、省内骨干层(包含市县汇聚交换机)、城域网
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025南方石油勘探开发有限责任公司春季高校毕业生招聘5人模拟试卷附答案详解(突破训练)
- 2025年郑州枫杨外国语学校招聘教师考前自测高频考点模拟试题及答案详解(夺冠系列)
- 2025辽宁沈阳城市建设投资集团有限公司所属企业沈阳城投新能源集团有限公司招聘7人模拟试卷及一套参考答案详解
- 2025年国家卫生健康委机关服务局社会招聘(2人)模拟试卷附答案详解(完整版)
- 2025年潍坊寿光综合医院(原寿光市人民医院)招聘专业技术人员(23名)考前自测高频考点模拟试题及完整答案详解
- 2025黑龙江帕弗尔能源产业管理有限公司高校毕业生招聘93人(第三期)模拟试卷及1套完整答案详解
- 2025贵州云岩区某行政单位派遣制员工模拟试卷附答案详解(完整版)
- 2025主管护师考试综合能力评价与试题及答案
- 2025年湖南衡阳耒阳市公安局招聘30名警务辅助人员考前自测高频考点模拟试题有完整答案详解
- 2025包头市白云鄂博矿区招聘区属国有企业工作人员考前自测高频考点模拟试题及答案详解(夺冠系列)
- 设备预防维护培训课件
- (2025秋新版)人教版九年级物理上册全册教案
- 2024csco前列腺癌诊疗指南
- 楼宇入驻管理办法
- 结肠息肉患者健康教育
- 核电运营数字化转型探索-中核集团 核电运行研究(上海)有限公司 2025
- Unit2RainorShine词汇与语法特训鲁教版七年级英语上册
- 学堂在线 如何写好科研论文 章节测试答案
- 旅馆顾客财物管理制度
- 交通设施韧性提升-洞察及研究
- CJ/T 340-2016绿化种植土壤
评论
0/150
提交评论