网管系统设计文档.doc_第1页
网管系统设计文档.doc_第2页
网管系统设计文档.doc_第3页
网管系统设计文档.doc_第4页
网管系统设计文档.doc_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网管系统设计文档文档作者: 贺云鹏 编写时间:_文档审核:_修改历史记录编号日期版本修改页码及条款作者12011-4-51.0初稿贺云鹏一.设计目的网管系统是指监控,组织和控制网络中的各种设备的活动状态。其目标是确保网络中的所有设备工作正常,发生报警时可及时响应并在出现异常时能及时响应和排除故障。二.基本功能 设备管理:对前端设备,路由器,业务服务器等进行统一管理. 配置管理:对设备和系统进行各类网络参数的定义和设置。 报警管理:对前段设备报警或业务报警进行及时响应与联动,并通知用户处理。 故障管理:查找并解决因硬件和软件问题而引起的网络故障。 性能管理:使用特定的代理完成对软件和设备进行效率检测,并将监测数据进行统计分析作为改进与维护依据。三基本要素1.SNMP(简单网络管理协议):专用的通信协议,版本包括V1,V2,V3,其中V2应用最为广泛。通过GET,SET或TRAP操作设备信息库实现设备基本信息的查询与管理。SNMPV1SNMPV2SNMPV3支持的PDUGetrequestGetnextrequestGetresponseSetrequestTrap增加responseGetbulkrequestInformrequest同V2安全性明文传送,安全性低明文传送,安全性低基于用户的安全模型,基于视图的访问控制模型,安全性很高复杂性简单使用广泛简单使用广泛开销大,比较繁琐2.管理信息库(MIB):一个按层次结构组织的树状结构,由管理对象按照模块的形式组织而成。各厂商产品的MIB依据标准化的Internet管理信息结构,所以可以保证第三方网管软件读取和管理设备信息.3.代理软件(Agent):运行在网络设备终端上软件模块,直接操作该设备本地的管理信息库(MIB)或者与系统运行的软件进行交互完成本地设备信息或状态的收集并提交网管服务器统一处理。4.报警采集服务器:通过SDK与前段设备进行交互及时反馈前段设备的报警信息,同时增加接收设备主动上报与主动设备状态轮询功能。5.网管服务器:通过主动监测或被动接收来自报警采集服务器或代理软件提交的信息,管理网络中的所有设备状态与报警信息,并通过级联的模式实现报警或查询命令的上传或分发。6.WEB客户端:与网管服务器进行交互完成对网络信息的查询与处理。三.网络布局四.详细设计Agent代理该进程单独运行在特定的主机上并负责收集主机的运行信息,主要包括主机流量,CPU使用状态,特定进程状态,磁盘运行状态等,同时可以检测特定数据异常闸值报警,如:上载流程过低。Agent采用与其他模块相同的TCP+XML的方式与其他服务程序进行通讯,包括接收来自管理服务器的控制应答;定时向网管服务器发送采集的信息;异常数据闸值报警;与本地服务交互等。主要流程如上图1.配置文件:Agent代理配置信息默认保存在本地ini配置文件中,成功登录网管服务器后需要请求更新本地服务配置信息。2.信息采集:根据配置信息Agent代理需要与监控资源进行TCP+XML信令通讯,并负责定时收集资源运行状态。采集的数据需要根据需要进行本地缓存并集中提交网管服务器。3.数据闸值报警:根据配置信息Agent 将异常的数据流程通知报警采集服务器,如:上传数据过低等。4.设备巡检:主要针对存储等报警采集服务器无法检测的信息。报警采集服务器报警采集服务器主要负责服务器,网络设备,前端设备等硬件设备的报警数据的采集与初步处理,并将报警信息通知网管服务器进行统一写入与处理。主要流程如上图1. 设备列表:报警采集服务器需要请求网管服务器获取到绑定的设备列表,并根据配置SDK或SNMP协议进行通讯,同时接收相应的报警设备更新。2. 集群处理模式:一个系统中可能存在多台报警采集服务器,使用条带划分的模式建立设备与服务器之间的关联并由网管服务器统一管理分配。3. 报警采集:根据配置报警服务器需要通过SDK,SNMP协议等,主动巡检+被动接收的方式检测。例如:设备网络连接断开需要通过主动PING进行检测;SDK设备的探头报警需要被动接受SDK回调等。4. 报警信令封装:采集到的报警信息,需要讲过报警采集服务器的封装成统一信令格式并通知网管服务器进行统一处理。对于底层不同的数据需要5. 闸值报警:报警采集服务器需要处理来自Agent代理的闸值报警。6. 设备巡检:网管服务器将设备进行巡检命令提交至对应的报警采集服务器,由对应服务器完成巡检内容,并返回结果。网管服务器网管服务器是网管系统中的主要业务服务器,主要功能有用户,服务器,设备,报警与故障管理。对于用户,服务器,设备的管理由WEB客户端主动发送请求并由网管服务器进行统一处理并写入数据库,在数据库更新时需要进行防多用户同时操作的现象。报警与故障管理业务主要负责报警过滤与数据记录,报警优先级管理,报警声光联动等,同时包括用户手动提交的设备故障信息。1.用户管理:主要由添加,查询,更新,删除等操作组成,WEB客户端发送此类请求至网管服务器,由服务器进行统一更新操作,避免多用户同时操作造成数据不同步。2.设备管理:类似于用户管理,对于设备与报警采集服务器之间的关联,设备接入方式等需要由用户添加时手动创建关联信息。设备获取可根据条件进行过滤如:WEB客户端需要获取所有设备信息;报警采集服务器仅需要获取与本服务器相关的设备列表。客户端需要查看特定前端设备的实时流是否正常,可以通过网管服务器请求媒体服务器打开此设备流。例如检测:视频遮挡,花屏等。对于NVR,DVR,服务器等设备运行状态需要报警采集服务器提供,而存储磁盘等需要通过Agent代理提供。3.日志管理:主要由查询与删除组成,WEB客户端根据用户选择提交请求至网管服务器,由服务器进行查询后将结果通知WEB客户端。同时对于日志可根据类型不同设置保存时间,由网管服务器定时清理过期日志。4.报警管理:当报警发生时网管服务器根据用户对报警过滤,优先级,联动的配置,实时通知客户端进行处理,对于设置了过滤的报警信息则仅记录数据库不通知客户端。5.故障申报:客户可以将发现的设备故障通过客户端手动提交给网管服务器,由网管服务器单独保存设备故障申报,并根据故障负责人信息,提醒登录的用户有故障需要确认,确认后的申报记录可以通过故障申报记录日志进行检索.五.网络级联对于大型的网管系统可以通过级联的方式将底层的数据或上层的业务请求逐层提交处理,高层的网管系统可以访问等级低于自己的网络信息,反之则非法。报警通知:上层的网管系统通过配置数据库信息将低等级系统内的报警通知上传,方便上层对底层的报警管理。同时对于底层的业务请求可以通过路由的方式逐层提交给对应的系统进行处理,并应答结果。六.数据库设计七.信令设计 Agent代理详细功能分解: 注册认证: 配置设置(INI文件):服务器IP、端口、数据闸值等信息SystemSettingServerIP=0 /IPServerPort=0 /端口DatabrakeVale=0 /数据闸值向网管服务器注册请求:TCP+XML连接通信 JackHelloJack1注册应答返回报警服务器地址:更新本地配置信息 1 /报警服务器IP1 /报警服务器端口1 /报警服务器集群ID1/不能使用TCP通讯的如何处理比如磁盘信息可能需要通过SDK查询或厂商提供的其他方式 信息采集:/理论上只采集本机数据,缺少时间信息 监控资源采用TCP+XML方式上传数据172.1.1.1 /主机IP0 /主机流量Hello /CPU状态1 /特定进程状态1 /磁盘运行状态 本地缓存采集数据方式:typedef struct tag_CollectInfoCString strHostIP;Int nHostFlow;Int nCPUState;Int nProcessState;Int nDiskOperateState;CollectInfo;Std:map 或 std:list 缓存采集数据 信息上报:采用TCP+XML形式与报警服务器通信 172.1.1.1 /主机IP0 /主机流量Hello /CPU状态1 /特定进程状态1 /磁盘运行状态 设备巡检: 各模块结构如下:报警采集服务器详细功能分解: 注册认证:配置设置(INI文件):服务器IP、端口、SDK、SNMP兼容配置等信息SystemSettingServerIP=0 /IPServerPort=0 /端口Compatibletype=1 /兼容类型,0: SDK 1: SNMP向网管服务器注册请求:TCP+XML连接通信 Jack12.2.2.11 注册应答 返回绑定设备信息:11 /集群ID2ec746dbb-717e-4656-be92-17eaf354c86c2513海康DVR11769769100013100000012ec746dbb-717e-4656-be92-17eaf354c86c2172.16.67.1602571640318000admin123451. 设备更新通知: 设备管理: 设备列表缓存:typedef struct tag_DeviceInfoList /设备列表CString strIcmsSign;DWORDdwDeviceID;/设备IDDWORDdwDevType;/前端设备类型DWORDdwDevPlugType;DWORDdwCurSubID;intnPort;CStringstrDevIP;CStringstrUserName;CStringstrUserPWD;DWORDdwSubID;intnSubNumber;/* 子设备号*/DWORDdwIcmsSubID;DWORDdwSubType;/* 子设备类型*/DWORDdwSubExtType;/* 子设备扩展类型*/std:list SubDevInfoList; /子设备列表 DeviceInfo/前端设备登录信息typedef struct tag_DevLoginInfo CStringstrUserName;CStringstrPassword;intnPort;CStringstrMac;CStringstrIPAddr; DevLoginInfo 设备SDK调用管理:/这个地方要详细点.很重要 采用对象化,抽象出统一的调用接口,根据设备类型调用对应的插件DLL,初始化SDK,并将对应的SDK信息保存在链表,以便避免多次重复初始化SDK,析构该SDK时从链表删除。 Std:map mapSdkState 保存SDK初始化状态, 报警信息管理: 报警服务:1:调用前端设备SDK启动报警服务2:使用SNMP对设备发送相应的OID信息,操作MIB库,根据MIB库返回的信息 报警信息缓存:typedef struct tag_AlarmDataInfoWORD wMainType;WORD wSubType;CString strIcmsGuid;DWORD cAlarmDeviceType;DWORD dwDeviceID;DWORD dwAlarmType;SYSTEMTIME sysAlarmBeginTime;CDWordArray arUserID;CStringArray arUserName;CString strAlarmContent;BYTE cAlarmStatus;DWORD dwDataSize;BYTE* pAlarmData; AlarmDataInfo 报警信息上传:前端设备SDK和SNMP通信收集的报警信息通过回调函数上传到上层,由上层统一封装并发送到网管服务器.回调接口如下:typedef int (CALLBACK ALARM_CALLBACK)(AlarmDataInfo *pAlarmData,void* pAppData); 报警信息封装处理及发送:1:报警信息归类手动报警 前端设备报警 其他报警 2:报警信息发送通过SDK和SNMP两种方式采集的报警信息,经过统一封装处理后,用TCP+XML的方式发送到网管服务器进行处理 设备巡检:按照设备巡检请求信息,依次对设备进行ping和调用SDK的OPENDEVICE接口进行巡检 各模块结构关系如下:网管服务器详细功能分解: 注册登录:网管服务器收到客户端的注册登录请求后,直接调用数据库接口模块,进行注册验证,验证成功后,调用客户端管理模块,加注册信息缓存到客户端信息列表中,同时发送注册应答结果。 用户管理: 用户添加、查询、更新、删除:网管服务器收到客户端的添加、查询、更新、删除信令后,调用数据库相关操作接口,对数据库数据进行更新。然后发送应答到客户端。传送方式: TCP+XML 设备添加、查询、删除:网管服务器收到客户端的添加、查询、删除信令后,调用数据库相关操作接口,对数据库数据进行更新。然后发送应答到客户端。传送方式: TCP+XML设备添加:客户端通过 TCP+XML方式发送添加请求到网管服务器,网管服务器收到信令后将对应的设备

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论