家庭宽带网络质量监控与故障辅助定位系统.doc_第1页
家庭宽带网络质量监控与故障辅助定位系统.doc_第2页
家庭宽带网络质量监控与故障辅助定位系统.doc_第3页
家庭宽带网络质量监控与故障辅助定位系统.doc_第4页
家庭宽带网络质量监控与故障辅助定位系统.doc_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

家庭宽带网络质量监控与故障辅助定位系统一、背景情况目前常州移动针对汇聚层以上的网络质量分析和运维管理已经具备了较好的支撑手段,而接入层网络质量的监控管理还比较粗放,epon设备、城域网接入层设备、校园宽带接入网设备的管理主要通过业界开放的管理工具实现。由于设备规模庞大,我们只能对部分指标进行采集和简单统计,而监控结果的深度分析和展现只能依赖手工完成。同时接入网设备的没有告警统一管理,缺乏故障自动排查手段,是宽带业务服务质量整体保障的薄弱环节。日趋复杂的epon网络结构和不断扩大的用户规模,使得现有的接入管理手段已不能满足精细运维发展要求。接入层网络质量的监控管理已成为宽带服务质量整体保障的薄弱环节,主要挑战如下:1、没有完善的质量监控与评估手段目前接入网设备只能通过solarwinds系统实现管理,由于设备数量较多(总数约1万台),solarwinds只能实现监控数据采集的功能,无法将监控结果直观的反映出来。同时不能将网络性能、设备性能、认证服务等数据进行联动分析,形成综合服务质量评估。2、缺乏故障发现与预警手段当前的宽带故障处理模式,往往是用户投诉,然后派维护人员现场处理,这样维护的效率很低,且会降低客户的满意度。缺乏自动化故障监测手段,对olt设备及下联设备的网络性能下降,不能提前发现。3、epon故障诊断手段匮乏宽带网络本身故障主要集中在接入网层面,而pon用户故障排查涉及onu、olt状况、级联设备情况、异常掉线等多环节排查。当前对故障诊断手段匮乏,对故障进行跟踪处理愈发困难。4、资源精细管理有待提高接入网olt、onu、交换机等设备的数目众多,厂家类型多样。缺乏资源利用率、在网率、故障率等精细管理,没有资源自动确认手段。综上所述,面对快速发展的宽带业务,当前的管理手段已经不能满足接入网精细化运营的要求,家庭宽带网络质量监控与故障辅助定位系统的建设迫在眉睫。基于以上情况,我们需要迫切建立一套“家庭宽带网络质量监控与故障辅助定位系统”,对接入网质量进行统一采集和监控,并通过olt及onu级联关系的自动发现,建立全网接入层设备级联关系的整体视图。直观显示端口流量、流速、错包、设备性能等指标,同时提供epon设备的告警监控功能,及时发现光路异常、断电、掉线等告警。针对宽带用户投诉率高的特点,提供快速排障功能,运维人员可根据投诉帐号对故障onu、olt、交换机等设备快速定位。该项目的建设依据:1、满足宽带业务发展及服务质量提升的客观需要;2、优化epon接入网络优化管理流程,减轻维护压力;二、技术方案家庭宽带网络质量监控与故障辅助定位系统重点解决epon接入层设备及网络性能指标的监控分析,建立从用户侧到接入层网络、汇聚层网络、核心层网络到出口的端到端服务质量监控体系。系统主要实现以下功能:1、采集宽带用户radius认证信息(认证记录、下线记录、异常掉线原因)等,解析radius报文中用户账号、svlan、cvlan、mac等字段信息,作为计算用户账号与onu端口绑定关系算法的依据;2、采集olt、onu等设备的配置信息、端口参数、性能参数,采集结果作为网元性能监控的基础数据。根据用户信息及设备信息,通过程序以一定的算法自动生成olt与onu的关联关系、用户与onu端口、bas端口、olt端口的关联关系;3、接入网故障原因智能判断,直观显示用户上网路径相关端口的流量、端口错包、设备性能等指标,快速定位故障点,提高客服人员、维护人员投诉预处理效率;4、接入网设备状态自动巡检,提供epon设备的告警监控功能,及时发现光路异常、断电、掉线等告警;5、自动实现onu端口利用率统计、小区活跃用户分布状态统计、分小区上网流量统计、epon设备资产实时在线统计等功能;系统部署方案如下所示:家庭宽带网络质量监控与故障辅助定位系统功能必须包含以下功能:数据采集处理、性能及流量分析、onu端口占用分析、epon集中告警管理、宽带辅助排障管理、epon设备管理、综合报表、系统管理等功能模块。1、数据采集处理数据采集主要包括用户信息采集和设备信息采集两部分(含用户账号信息、认证信息、设备流量数据、资源配置信息、告警信息、设备性能数据、测试数据等)。通过定制采集的周期、时间和策略,对需要的信息进行自动的收集、整理和预处理,保证数据采集的完整性。辅助以手工录入和批量导入手段,通过对自动采集和手工录入的数据进行比对稽核,形成用户信息与网元信息的统一维护和管理。2、性能及流量分析系统提供对olt、onu、交换机的性能指标的监测并提供告警,以自定义的周期进行性能数据的采集,提供实时监控和历史变化列表查询和各种波动图形曲线。主要监测内容举例:a.端口流量监测olt设备pon口流量监控olt设备上行口流量监控olt设备pon口错包查询olt设备pon口丢包查询onu设备上行口流量监控onu设备端口错包查询onu设备端口丢包查询交换机设备端口错包查询交换机设备上行口流量监控b.设备性能监测olt设备cpu利用率、内存利用率、环境指标(包括温度、电压等)监控;onu设备cpu利用率、内存利用率、环境指标(包括温度、电压等)监控;交换机设备cpu利用率、内存利用率、环境指标(包括温度、电压等)监控;c.接入网链路性能监控olt、onu、交换机延迟监控olt、onu、交换机丢包监控3、epon集中告警管理系统对采集到的设备性能数据进行解析、分类、汇聚、统计等处理工作,并灵活定义告警门限,及时生成告警信息。告警管理包括“监控指标超限”和“设备主动告警”两个方面,提供对被管理的olt、onu网络设备统一故障及预警管理。系统将不同的告警事件(trap、syslog等方式)按照设备厂家提供的格式进行解析、定义、关联分析的处理,最终将大量复杂的设备故障信息以精简、有效的形式呈现出来。系统对影响业务的严重告警可自动生成待处理工单,以短信方式发送给指定维护人员,维护人员故障处理完成后,可通过短信回单、登陆系统回单的方式实现故障流程的快速闭环。提供割接告警屏蔽功能,系统对“指定设备”的“指定时间段内”的告警记录进行屏蔽,不发送告警短信。告警模块主要功能包括:告警信息采集与呈现、告警过滤功能 、告警查询与统计分析等。主要告警类型举例:a.监测指标违反门限阈值时产生的异常事件:olt不可控告警onu设备上行接口利用率预警上行链路延时预警onu节点户线利用率预警b.通过接来自设备的事件告警:olt、onu、交换机cpu利用率门限超出告警;olt、onu、交换机内存利用率门限超出告警;olt、onu、交换机温度门限超出告警;olt系统冷启动告警olt单板未正常工作告警olt电源异常告警pon信号丢失告警onu掉线告警onu掉电告警onu上行链接比特错误告警单台onu光功率4、onu端口资源占用分析自动采集各onu设备端口配置情况,并结合用户上网端口占用情况,自动统计出一定周期内没有上网记录的端口信息,通过对全网onu设备端口资源的统计分析,查找端口利用率偏低的小区。端口资源分析报表举例:指定周期各区域(区县、安装区域等)端口资源占有率汇总分析各区域(区县、安装区域等)端口资源占用率趋势分析各区域(区县、安装区域等)指定设备的未占用端口明细查询全网onu设备端口资源最大占有率top n查询全网onu设备端口资源最小占有率top n查询5、宽带排障管理该功能主要应用于用户报障的快速处理,可通过输入帐号进定位与用户相关的设备状态信息。可集中显示用户上网相关节设备状态,展现用户最后认证失败原因、最后下线原因及端口信息等内容,方便维护人员快速定位故障并响应处理。自动排障基本功能:系统针对输入账号,集中显示该用户的基本信息,内容包括:用户帐号、最后认证失败原因、最后认证失败时间、最后下线原因、最后下线时间、bas名称、bas端口描述、olt名称、olt端口、onu名称、onu槽位及端口、onu状态、onu端口状态、当前是否在线、实时刷新时间。图形化显示级联信息,提供用户上网级联设备图像显示,可直观展现用户上网所经过主要设备及端口状态。执行实时刷新操作时,系统对该上网用户所级联的设备和端口进行实时扫描,如某个设备链路不可达而无法获知实时信息,则显示最近历史信息。6、epon设备资源管理epon设备资源管理功能可以实现对接入网设备、链路、ip地址等各种有形或无形资源的管理功能。管理功能包括:设备信息管理、链路维护管理、链路群维护管理、区域信息管理、等功能。系统通过对onu设备的进行周期性自动扫描,根据olt关联的onu自动发现新增和变更设备。提供指定周期内各olt设备的pon口下联onu增减数据量情况提供指定周期内新增和减少onu设备的明细报表提供指定周期内onu设备调整信息列表,包括:原上联olt、当前上联olt及其他基本信息7、onu设备信息管理onu设备管理模块通过mac地址区分onu设备唯一性,提供对onu设备信息的集中维护、管理、查询等功能。提供设备端口自动发现功能,支持端口名称、描述、别名、带宽等信息自动获取。同时能够对选定的目标网络设备进行ping和snmp测试,获取该设备的可达性和可管性。系统管理的onu设备信息包括:基本信息:onu设备名称、onu设备别名、所在地市、所在区县、管理区域(钟楼、天宁、东区、南区等)、所在机房、设备类型、onu设备ip地址、mac地址、资产编码、onu版本信息、设备厂商、设备型号、业务类型(驻地网、集团、wlan、营业厅)、网元类型、read_community、write_community、安装位置等、在网状态;板卡信息:板卡索引号、硬件版本号、板卡序列号、槽位数、板卡类型、操作状态、板卡描述等;端口信息:端口索引号、板卡索引号、端口名称、端口描述、端口带宽、ip地址、子网掩码、管理状态等。8、逻辑信息维护vlan维护:设备ip地址、设备端口、vlanid;代维信息维护:代维厂家、代维联系人、代维联系电话等信息;管理区域维护:管理区域id、管理区域名称(钟楼、天宁、东区、南区等);olt与bas级联关系维护:bas设备ip地址、bas端口、下联olt设备ip地址;onu与olt级联关系:系统自动发现onu与olt级联关系,提供查询功能;设备基本信息维护:所在地市、区县、安装区域、所在机房;9、设备远程操作管理对onu设备的远程重启、设备端口复位,根据所辖设备管理权限,客户人员和代维人员可对指定设备分级操作。1、设备远程重启可以远程对onu设备下发命令要求其进行重启。2、设备远程端口复位可以远程对onu设备进行管理,实现端口复位操作。10、综合报表通过综合报表模块统一的管理系统中的相关报表。操作维护人员可以方便的通过统一的界面完成定期报表的查询、打印和导出等功能,主要报表内容包括:每月、每周、每日onu故障数量、占比每月、每周、每日onu停电数量onu流量top排名,可按维度分析onu端口流量top排名,可按维度分析onu故障频次top排名,可按维度分析,用于解决某台onu存在隐患问题onu停电频次top排名,可按维度分析,用于解决某台onu电源隐患问题onu光功率top排名,用于解决光衰耗隐患问题onu端口频繁up/down top排名,用于解决用户故障小区电源稳定性统计onu端口占用统计onu端口错包情况top排名统计onu端口利用率onu端口空闲率三、效果分析1、网络资源自动核查2、系统采用定制的算法,将用户账号与接入设备级联进行关系,自动发现接入网拓扑及沿途设备信息。3、宽带用户故障智能排查系统根据自动生成的网络拓扑图提供全程故障排查手段,提高投诉预处理效率:(1)图形化展示用户上网路径相关端口的流量、端口错包等性能指标,快速定位故障点,提高客服人员、维护人员投诉预处理效率(2)采集olt、onu等设备的配置信息、端口参数、性能参数,采集结果作为网元性能监控的基础数据4、巡检数据深度分析提升网络服务能力5、衡量接入网质量差异并制定针对性的质量提升措施6、驻地网装机质量第一时间自动分析四、本省应用推广情况“家庭宽带网络质量监控与故障辅助定位系统”,对接入网质量进行统一采集和监控,并通过olt及onu级联关系的自动发现,建立全网接入层设备级联关系的整体视图。直观显示端口流量、流速、错包、设备性能等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论