家庭宽带网络质量监控与故障辅助定位系统_第1页
家庭宽带网络质量监控与故障辅助定位系统_第2页
家庭宽带网络质量监控与故障辅助定位系统_第3页
家庭宽带网络质量监控与故障辅助定位系统_第4页
家庭宽带网络质量监控与故障辅助定位系统_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

家庭宽带网络质量监控与故障辅助定位系统 一、背景情况 目前常州移动针对汇聚层以上的网络质量分析和运维管理已经具备了较好的支撑手段,而接入层网络质量的监控管理还比较粗放, EPON设备、城域网接入层设备、校园宽带接入网设备的管理主要通过业界开放的管理工具实现。由于设备规模庞大,我们只能对部分指标进行采集和简单统计,而监控结果的深度分析和展现只能依赖手工完成。同时接入网设备的没有告警统一管理,缺乏故障自动排查手段,是宽带业务服务质量整体保障的薄弱环节。日趋复杂的 EPON 网络结构和不断扩大的用户规模,使得现有的接入 管理手段已不能满足精细运维发展要求。接入层网络质量的监控管理已成为宽带服务质量整体保障的薄弱环节,主要挑战如下: 1、没有完善的质量监控与评估手段 目前接入网设备只能通过 Solarwinds系统实现管理,由于设备数量较多(总数约 1 万台), Solarwinds 只能实现监控数据采集的功能,无法将监控结果直观的反映出来。同时不能将网络性能、设备性能、认证服务等数据进行联动分析,形成综合服务质量评估。 2、缺乏故障发现与预警手段 当前的宽带故障处理模式,往往是用户投诉,然后派维护人员现场处理,这样维护的效率很低,且 会降低客户的满意度。缺乏自动化故障监测手段,对 OLT设备及下联设备的网络性能下降,不能提前发现。 3、 EPON故障诊断手段匮乏 宽带网络本身故障主要集中在接入网层面,而 PON用户故障排查涉及 ONU、OLT状况、级联设备情况、异常掉线等多环节排查。当前对故障诊断手段匮乏,对故障进行跟踪处理愈发困难。 4、资源精细管理有待提高 接入网 OLT、 ONU、交换机等设备的数目众多,厂家类型多样。缺乏资源利用率、在网率、故障率等精细管理,没有资源自动确认手段。 综上所述,面对快速发展的宽带业务,当前的管理手段已经不能满足 接入网精细化运营的要求,家庭宽带网络质量监控与故障辅助定位系统的建设迫在眉睫。 基于以上情况,我们需要迫切建立一套“家庭宽带网络质量监控与故障辅助定位系统”,对接入网质量进行统一采集和监控,并通过 OLT 及 ONU 级联关系的自动发现,建立全网接入层设备级联关系的整体视图。直观显示端口流量、流速、错包、设备性能等指标,同时提供 EPON 设备的告警监控功能,及时发现光路异常、断电、掉线等告警。针对宽带用户投诉率高的特点,提供快速排障功能,运维人员可根据投诉帐号对故障 ONU、 OLT、交换机等设备快速定位。 该项目 的建设依据: 1、满足宽带业务发展及服务质量提升的客观需要; 2、优化 EPON接入网络优化管理流程,减轻维护压力; 二、技术方案 家庭宽带网络质量监控与故障辅助定位系统重点解决 EPON 接入层设备及网络性能指标的监控分析,建立从用户侧到接入层网络、汇聚层网络、核心层网络到出口的端到端服务质量监控体系。 系统主要实现以下功能: 1、采集宽带用户 Radius认证信息(认证记录、下线记录、异常掉线原因)等,解析 Radius 报文中用户账号、 SVLAN、 CVLAN、 MAC等字段信息,作为计算用户账号与 ONU端口绑定关 系算法的依据; 2、采集 OLT、 ONU等设备的配置信息、端口参数、性能参数,采集结果作为网元性能监控的基础数据。根据用户信息及设备信息,通过程序以一定的算法自动生成 OLT与 ONU的关联关系、用户与 ONU端口、 BAS端口、 OLT端口的关联关系; 3、接入网故障原因智能判断,直观显示用户上网路径相关端口的流量、端口错包、设备性能等指标,快速定位故障点,提高客服人员、维护人员投诉预处理效率; 4、接入网设备状态自动巡检,提供 EPON设备的告警监控功能,及时发现光路异常、断电、掉线等告警; 5、自动实现 ONU 端口利 用率统计、小区活跃用户分布状态统计、分小区上网流量统计、 EPON设备资产实时在线统计等功能; 系统部署方案如下所示: 家庭宽带网络质量监控与故障辅助定位系统功能必须包含以下功能:数据采集处理、性能及流量分析、 ONU 端口占用分析、 EPON 集中告警管理、宽带辅助排障管理、 EPON设备管理、综合报表、系统管理 等功能模块。 1、数据采集处理 数据采集主要包括用户信息采集和设备信息采集两部分(含用户账号信息、认证信息、设备流量数据、资源配置信息、告警信息、设备性能数据、测试数据等)。通过定制采集的周期、时间和策 略,对需要的信息进行自动的收集、整理和预处理,保证数据采集的完整性。辅助以手工录入和批量导入手段,通过对自动采集和手工录入的数据进行比对稽核,形成用户信息与网元信息的统一维护和管理。 2、性能及流量分析 系统提供对 OLT、 ONU、交换机的性能指标的监测并提供告警,以自定义的周期进行性能数据的采集,提供实时监控和历史变化列表查询和各种波动图形曲线。 主要监测内容举例: a.端口流量监测 OLT设备 PON口流量监控 OLT设备上行口流量监控 OLT设备 PON口错包查询 OLT设备 PON口丢包查询 ONU设 备上行口流量监控 ONU设备端口错包查询 ONU设备端口丢包查询 交换机设备端口错包查询 交换机设备上行口流量监控 b.设备性能监测 OLT设备 CPU利用率、内存利用率、环境指标(包括温度、电压等)监控; ONU设备 CPU利用率、内存利用率、环境指标(包括温度、电压等)监控; 交换机设备 CPU 利用率、内存利用率、环境指标(包括温度、电压等)监控; c.接入网链路性能监控 OLT、 ONU、交换机延迟监控 OLT、 ONU、交换机丢包监控 3、 EPON集中告警管理 系统对采集到的设备性能数据进行解析、分类、 汇聚、统计等处理工作,并灵活定义告警门限,及时生成告警信息。 告警管理包括“监控指标超限”和“设备主动告警”两个方面,提供对被管理的 OLT、 ONU网络设备统一故障及预警管理。系统将不同的告警事件( trap、syslog等方式)按照设备厂家提供的格式进行解析、定义、关联分析的处理,最终将大量复杂的设备故障信息以精简、有效的形式呈现出来。 系统对影响业务的严重告警可自动生成待处理工单,以短信方式发送给指定维护人员,维护人员故障处理完成后,可通过短信回单、登陆系统回单的方式实现故障流程的快速闭环。提供割接告警屏蔽 功能,系统对“指定设备”的“指定时间段内”的告警记录进行屏蔽,不发送告警短信。 告警模块主要功能包括:告警信息采集与呈现、告警过滤功能 、告警查询与统计分析等。 主要告警类型举例: a.监测指标违反门限阈值时产生的异常事件: OLT不可控告警 ONU设备上行接口利用率预警 上行链路延时预警 ONU节点户线利用率预警 b.通过接来自设备的事件告警 : OLT、 ONU、交换机 CPU利用率门限超出告警; OLT、 ONU、交换机内存利用率门限超出告警; OLT、 ONU、交换机温度门限超出告警; OLT系统冷启动告警 OLT单板未正常工作告警 OLT电源异常告警 PON信号丢失告警 ONU掉线告警 ONU掉电告警 ONU上行链接比特错误告警 单台 ONU光功率 4、 ONU端口资源占用分析 自动采集各 ONU设备端口配置情况,并结合用户上网端口占用情况,自动统计出一定周期内没有上网记录的端口信息,通过对全网 ONU设备端口资源的统计分析,查找端口利用率偏低的小区。 端口资源分析报表举例: 指定周期各区域(区县、安装区域等)端口资源占有率汇总分析 各区域(区县、安装区域等)端口资源占用率趋势分析 各区域(区 县、安装区域等)指定设备的未占用端口明细查询 全网 ONU设备端口资源最大占有率 TOP N查询 全网 ONU设备端口资源最小占有率 TOP N查询 5、宽带排障管理 该功能主要应用于用户报障的快速处理,可通过输入帐号进定位与用户相关的设备状态信息。可集中显示用户上网相关节设备状态,展现用户最后认证失败原因、最后下线原因及端口信息等内容,方便维护人员快速定位故障并响应处理。 自动排障基本功能: 系统针对输入账号,集中显示该用户的基本信息,内容包括:用户帐号、最后认证失败原因、最后认证失败时间、最后下线原因、最后下 线时间、 BAS 名称、 BAS端口描述、 OLT名称、 OLT端口、 ONU名称、 ONU槽位及端口、 ONU状态、 ONU 端口状态、当前是否在线、实时刷新时间。图形化显示级联信息,提供用户上网级联设备图像显示,可直观展现用户上网所经过主要设备及端口状态。执行实时刷新操作时,系统对该上网用户所级联的设备和端口进行实时扫描,如某个设备链路不可达而无法获知实时信息,则显示最近历史信息。 6、 EPON设备资源管理 EPON设备资源管理功能可以实现对接入网设备、链路、 IP 地址等各种有形或无形资源的管理功能。 管理功能包括: 设 备信息管理、链路维护管理、链路群维护管理、区域信息管理、等功能。 系统通过对 ONU设备的进行周期性自动扫描,根据 OLT关联的 ONU自动发现新增和变更设备。 提供指定周期内各 OLT设备的 PON口下联 ONU增减数据量情况 提供指定周期内新增和减少 ONU设备的明细报表 提供指定周期内 ONU 设备调整信息列表,包括:原上联 OLT、当前上联OLT及其他基本信息 7、 ONU设备信息管理 ONU设备管理模块通过 MAC地址区分 ONU设备唯一性,提供对 ONU设备信息的集中维护、管理、查询等功能。提供设备端口自动发现功能,支持 端口名称、描述、别名、带宽等信息自动获取。同时能够对选定的目标网络设备进行PING和 SNMP测试,获取该设备的可达性和可管性。 系统管理的 ONU设备信息包括: 基本信息: ONU设备名称、 ONU设备别名、所在地市、所在区县、管理区域(钟楼、天宁、东区、南区等)、所在机房、设备类型、 ONU 设备 IP 地址、MAC地址、资产编码、 ONU版本信息、设备厂商、设备型号、业务类型(驻地网、集团、 WLAN、营业厅)、网元类型、 read_community、 write_community、安装位置等、在网状态; 板卡信息:板卡 索引号、硬件版本号、板卡序列号、槽位数、板卡类型、操作状态、板卡描述等; 端口信息:端口索引号、板卡索引号、端口名称、端口描述、端口带宽、 IP地址、子网掩码、管理状态等。 8、逻辑信息维护 VLAN维护:设备 IP 地址、设备端口、 VLANID; 代维信息维护:代维厂家、代维联系人、代维联系电话等信息; 管理区域维护:管理区域 ID、管理区域名称(钟楼、天宁、东区、南区等); OLT与 BAS级联关系维护: BAS设备 IP 地址、 BAS端口、下联 OLT设备IP 地址; ONU与 OLT级联关系:系统自动发现 ONU与 OLT级联关系,提供查询功能; 设备基本信息维护:所在地市、区县、安装区域、所在机房; 9、设备远程操作管理 对 ONU设备的远程重启、设备端口复位,根据所辖设备管理权限,客户人员和代维人员可对指定设备分级操作。 1、设备远程重启 可以远程对 ONU设备下发命令要求其进行重启。 2、设备远程端口复位 可以远程对 ONU设备进行管理,实现端口复位操作。 10、综合报表 通过综合报表模块统一的管理系统中的相关报表。操作维护人员可以方便的通过统一的界面完成定期报表的查询、打印和导出等功能,主要报表内容包括: 每月、每周、 每日 ONU故障数量、占比 每月、每周、每日 ONU停电数量 ONU流量 TOP排名 ,可按维度分析 ONU端口流量 TOP排名,可按维度分析 ONU 故障频次 TOP 排名,可按维度分析,用于解决某台 ONU 存在隐患问题 ONU 停电频次 TOP 排名,可按维度分析,用于解决某台 ONU 电源隐患问题 ONU光功率 TOP排名,用于解决光衰耗隐患问题 ONU端口频繁 UP/DOWN TOP排名,用于解决用户故障 小区电源稳定性统计 ONU端口占用统计 ONU端口错包情况 TOP排名统计 ONU端口利用率 ONU端口空闲率 三、效果分析 1、 网络资源自动核查 2、系统采用定制的算法,将用户账号与接入设备级联进行关系,自动发现接入网拓扑及沿途设备信息。 3、宽带用户故障智能排查 系统根据自动生成的网络拓扑图提供全程故障排查手段,提高投诉预处理效率: ( 1)图形化展示用户上网路径相关端口的流量、端口错包等性能指标,快速定位故障点,提高客服人员、维护人员投诉预处理效率 ( 2)采集 OLT、 ONU等设备的配置信息、端口参数、性能参数,采集结果作为网元性能监控的基础数据 4、 巡检数据深度分析提升网络服务能力 5、 衡量接入网质量 差异并制定针对性的质量提升措施 6、驻地网装机质量第一时间自动分析 四、本省应用推广情况 “家庭宽带网络质量监控与故障辅助定位系统”,对接入网质量进行统一采集和监控,并通过 OLT及 ONU级联关系的自动发现,建立全网接入层设备级联关系的整体视图。直观显示端口流量、流速、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论