华北电力调度数据网网络管理项目技术方案建议书.doc_第1页
华北电力调度数据网网络管理项目技术方案建议书.doc_第2页
华北电力调度数据网网络管理项目技术方案建议书.doc_第3页
华北电力调度数据网网络管理项目技术方案建议书.doc_第4页
华北电力调度数据网网络管理项目技术方案建议书.doc_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 52 技术方案建议书 网络管理项目 华北电力调度数据网 2 52 目目 录录 1 方案建议方案建议 4 1 1 总体方案总体方案 4 1 2 网络拓扑监控网络拓扑监控 7 1 2 1 网络拓扑发现监控 7 1 2 2 深入的网络拓扑监控 9 1 3 网络故障管理网络故障管理 13 1 3 1 事件采集 14 1 3 2 事件过滤及处理 15 1 3 3 事件关联定制 17 1 3 4 事件信息增强 20 1 3 5 事件告警 21 1 3 6 事件管理与其他模块的接口 22 1 4 网络性能管理网络性能管理 23 1 4 1 基本网络性能管理 23 1 4 2 网络性能分析 24 1 4 3 网络设备性能管理 29 1 4 4 网络延时监测 32 1 5 网络流量管理网络流量管理 32 1 5 1 拓扑图增强流量管理 32 1 5 2 网络接口流量管理 34 1 5 3 Netflow 采集分析 35 1 6 对对 PLS VPN 的管理的管理 37 1 6 1 MPLS VPN 的拓扑管理 38 3 52 1 6 2 MPLS VPN 的故障管理 40 1 6 3 MPLS VPN 的性能流量管理 40 1 7 Openview 的扩展性的扩展性 44 1 7 1 管理功能的扩展 44 1 7 2 管理范围的扩展 46 2 网元管理软件 网元管理软件 JUNOSSCOPE 46 3 软硬件配置软硬件配置 50 3 1软件配置软件配置 50 3 2硬件配置硬件配置 51 3 3带宽占用带宽占用 53 4 52 1 方案建议方案建议 1 1 总体方案总体方案 华北电力调度数据网建成后将覆盖华北三个省 山西 河北和山东 一个自治区 内蒙 两个直辖市 北京和天津 以及五个直属地调 唐山 秦皇岛 承德 廊坊 张 家口 的调度中心及所属的直调厂站 本工程网络按三层结构考虑 核心层 骨干层和接入层 华北电力调度数据网核心 层 骨干层采用环形结构 接入层采用星形双归结构 在华北网调设置网管中心 统 一进行全网的网络管理和业务管理 华北电力调度数据网将建立一套网管系统全面负责网络的管理 网管系统应对全网 各种网络设备实现统一管理 网管中心设置在华北网调 华北电力调度数据网网管系统的逻辑架构如下图所示 5 52 根据以上实际情况 本系统通过 HP OpenView JunosScope 实现华北电力调度数据 网基础干线网的管理需求 1 北京总部建立网络综合管理平台 北京总部建立网络综合管理平台 北京总部建立网络综合管理平台 实现对网络的综合管理 包括网络拓扑管理 网络 故障管理 网络性能管理 VPN 管理等管理工作 实现对全国的骨干网络监控 考虑 到其为全国的管理中心 根据标书要求 配置为 SUN 中高端 UNIX 服务器 2 网管平台的容错性 网管平台的容错性 HP OpenView 支持高可靠性的分布式管理工作方式 正常情况下 各省的网管系统 负责采集和监控各省网络设备的状态 并将这些设备的状态上传到北京中心的管理站 上 实现统一监控 当省中心的网管服务器出现故障时 北京中心的网管服务器可以 接管其工作 直接轮训和监控省里的网络设备 6 52 3 分权管理 明确职责分权管理 明确职责 对于各种管理工作和众多的管理设备 需要不同的管理员进行分工合作的管理 为了 满足不同的管理员操作需求 可设置多种权限 管理员 操作员 监控员 多种方式的 客户端设置 仿真终端 JAVA 终端 Web 登录 HP OpenView 支持多种客户端 方式实现监控 主要如下所示 UNIX 管理站直接登录管理 全面管理功能 实现各方面管理设置 X WINDOWS 模拟登录 实现全面管理 便于管理员操作 NT 2000 客户端 网络管理终端 程序运行于本地 读取管理站数据 保证效率 方便操作 JAVA Console 全面事件监控 集中调用不同管理工具 Web 登录 方便管理员远程登录监控 同时 不同管理员可设置不同管理权限 不同管理员登录后 监测到的管理界面不同 实现的管理功能不同 使用的菜单不同 其管理结构如下图所示 6 网网络络管管理理终终端端方方式式监监控控图图 网管工作站 HP OpenView w2k Console 管理员 w2k Console 监控员 Java Console 事件监控 UNIX 模拟终端 WEB 访问及 JAVA 终端 7 52 1 2 网络拓扑监控网络拓扑监控 华北电力调度数据网基础干线网网络是一个复杂的 分布式网络结构 单靠人工进行 管理是很难了解整个网络系统配置及分布的 当前的网络系统中都有哪些节点 它们 运行状态如何 有哪些是新增加的节点 是否有非法节点加入等都是难于解决的问题 NNM 的自动发现和监控机制能够发现网络节点 包括路由器 交换机和第二层的交换 设备等 检测网络设备连接 生成和保持 TCP IP 网络图 通过色彩确定网络设备的 运行状态 实现对网络设备状态 网络连接的直观监控 1 2 1 网络拓扑发现监控网络拓扑发现监控 拓扑管理作为网络管理的基本功能 是网管中最基本的也是最重要的组成部分之一 一般情况下 网络管理系统首先都要进行必要的拓扑发现 拓扑监控 拓扑操作 从 而充分了解网络系统的运行情况 网络管理和其他的监控管理有类似之处 如电网的 监控 交通网的监控 都是把直观的监控界面作为主要的监控手段 提供给监控人员 一个直观 易用的操作平台 NNM 的拓扑发现和监控功能是全面和丰富的 可以满足网络设备的初始发现和网络设备 的监控要求 可以形成多种角度的监控视图 包括 Internet 视图 网络邻居视图 逻 辑监控视图 VLAN 视图 VRRP 视图等 可以方便管理员从多种角度了解网络设备的运 行情况 同时 当网络发生事件时 可以及时更新网络拓扑图 并快速定位故障的发 生点 且能了解故障点和其他设备间的联系 辅助解决问题 8 52 NNM 的拓扑监控界面实际上也是一个操作界面 当管理员要了解网络设备的具体信息时 可以通过方便的调用 查询网络设备的具体信息 包括设备信息 接口信息 VLAN 信 息等 由此 拓扑管理可以方便的实现如下功能 1 发现网络设备及其连接 获取最初的网络信息 作为网络管理的基础 通过 NNM 首先对网络现状提供一个基本的了解 然后对网络进 行有效的管理 2 形成网络监控视图 使管理员可以直观的了解网络当前运行状况 通过多种角度的监控视图 管理员可以从不同视角 不同深度了解网络的运行状况 从而发现潜在问题 了解网络运行情况 3 图形化标识网络故障点 辅助解决网络问题 管理员通过拓扑图中的连接关系 可以更为方便和快速的定位网络问题 从而减少故 障修复时间 4 集中的操作环境 可以从拓扑图中了解网络设备的详细信息 9 52 提供给网管员一个方便的操作环境 可以从统一的 直观的监控界面 对所管辖的网 络设备的详细信息进行了解 从而方便管理员的日常操作 在实际的管理监控过程中 首先大屏幕显示网络拓扑结构 网络当前设备的运行情况 在确定网络管理范围 和对网络接口的定制后 网络正常的时候 全部网络设备应为 绿色 出现问题的设备以不同颜色标识 并进行状态传递 在整体监控视图中 可以 直观的了解到当前哪些地域的设备有异常 哪些网段的设备有异常 哪些网络设备有 异常 哪些端口有异常 如果把网管系统看作一个生产系统 整个网络视图一般情况 下应为绿色显示 只有故障发生时 拓扑才会发生颜色变化 对于管理员 如上所述 可以通过多种角度的监控视图 管理员可以从不同视角 不 同深度了解网络的运行状况 从而发现潜在问题 了解网络运行情况 通过拓扑图中 的连接关系 当故障发生时 可以了解故障设备和其他设备的连接关系 是否有关联 故障 可以更为方便和快速的定位网络问题 从而减少故障修复时间 同时 可以从 统一的 直观的监控界面 对所管辖的网络设备的详细信息进行了解 从而方便管理 员的日常操作 1 2 2 深入的网络拓扑监控深入的网络拓扑监控 同时 NNM 的扩展视图功能提供更多的拓扑视图 对网络环境进行更为细化的拓 扑管理 当网络出现异常时 可以调用详细的网络扩展监控视图 实现网络故障的诊 断 主要包括 网络邻居视图 真实表现网络设备物理连接 动态过滤视图 当前指定设备的动态视图 网络路径视图 端到端网络设备路径视图 VLAN 视图 显示 VLAN 信息视图 VRRP 视图 显示 VRRP 设备组状态视图 等等 10 52 网络邻居视图监控网络邻居视图监控 通过使用 OpenView 网络邻居视图 可以了解网络设备的具体连接关系 包括网络 设备的端口连接信息 网络设备的 PagP trunk 连接信息 网络设备板卡信息 从而深 入了解网络设备的连接状况 并消除隐患 保证网络设备的正常运行 具体监控视图 如下所示 VLAN 视图监控视图监控 对网络层的配置信息管理 仅提供网络拓扑互联信息是远远不够的 在网络中 基于网络安全方面的考虑 在交换机上为不同的应用划分成了不同 VLAN 子网 对网 络的第二层管理来说 除了要知道交换机之间的互联 更主要的要能对 VLAN 进行管 理 对 VLAN 的管理可以通过网络管理平台来实现 11 52 通过网络管理平台 能够发现网络环境中 VLAN 的配置情况 了解网络中 VLAN 的数量和相应的 VLAN 号 并可以看到每个 VLAN 与网络中每个交换机的模块和端口 之间的相互对应和归属关系 对网络中 VLAN 有总体的管理 同时 也可以把 VLAN 与网络设备之间的对应关系以网络拓扑的形式表现 可以看到在网络中有哪几台交换 机配置有同一个 VLAN 看到同一个 VLAN 与网络中相应交换机的对应关系 如下表所示 VRRP 组视图监控组视图监控 对于华北电力调度数据网基础干线网的网络环境 基本上使用的都是 cisco 设备 且配置着大量 VRRP 组 如果 VRRP 组中的设备出现切换或相关 VRRP 组中的设备出 现异常等情况 都是网管人员所需要快速了解的 NNM 提供 VRRP 组监控视图 可以 使管理员方便的了解 VRRP 组的工作状况 具体如图所示 12 52 1 3 网络故障管理网络故障管理 事件管理是网络系统管理中一个重要的组成部分 NNM 提供统一的网络系统管理 平台 可以实现对网络事件的集中处理 包括 syslog 事件 trap 事件 轮训事件等的 集中处理 NNM 本身提丰富的事件管理和处理功能 并配合事件关联分析模块组成了整个网 络管理系统的事件核心 同时还可以通过集中事件处理实现功能模块间的信息传递 与 其它系统管理功能相集成 NNM 服务器在收到事件消息后可以对事件进行进一步的处理 包括压缩 确认 动作 报警 转发等处理 满足网管日常运维的要求 1 3 1 事件采集事件采集 对设备对设备 syslog 及及 Trap 事件进行采集事件进行采集 13 52 网管监控的事件来源主要有 syslog trap 轮训 性能告警等方面 通过 NNM 可以对网络设备的 syslog 事件和 trap 事件进行收集 主要实现功能如下 对被管的所有设备的 syslog 信息进行采集 对被管的所有设备的 trap 信息进行采集 由于网络的 syslog 信息包含 trap 信息 所以可以屏蔽大量的网络设备的 trap 信息 对轮训产生的故障信息进行采集 在实际的管理中 将被管理的设备的 log server 指定为 Syslog 采集器所在机器的 地址 syslog 事件首先存储在系统的 syslog 文件中 然后通过 NNM 的管理代理实现 对 syslog 事件的解析 并发送到管理服务器 同样 将 log server 设置为网络设备 Trap 目的主机 所有的 Trap 事件将由 NNM 的 Trap template 进行解析并送往管理 服务器 通过 NNM 管理代理 可以对网络设备的 syslog Trap 信息进行解析 并发送 到管理服务器 通过 GUI 界面及 JAVA 控制台显示 如果不需要接收 trap 信息 可 以简单的将 trap 模板定义为 disable 即可实现对 trap 信息的屏蔽 通过上述方法通常可以采集到以下事件 网络设备环境相关的事件 电源电压 设备温度 风扇等的异常事件 设备性能事件 设备 CPU 使用率 设备 memory 使用率异常事件 链路层状态信息事件 监控重要端口的状态变化 VRRP 状态事件 VRRP 的状态变化 流量事件 监控通讯流量的异常 设备故障事件 运行中的设备硬件故障信息 设备重启 软件故障信息 网络设备配置事件 配置信息及变更的采集与监控 对节点宕机 性能事件进行采集对节点宕机 性能事件进行采集 syslog 事件和 trap 事件是由网管设备主动发送到网管服务器上的 但有些网络故 障只能通过轮训方式进行监控 如节点宕机事件 性能阈值事件等 所以必须对此类 事件进行监控处理 14 52 所有被管设备的 node down 事件和性能告警事件均有 NNM 通过轮训进行监控 产生 然后通过 NNM 实现对节点宕机和性能告警事件的解析 并发送到管理服务器 1 3 2 事件过滤及处理事件过滤及处理 在采集事件时通过对模板的定义 可以对指定的事件进行过滤 从而提高事件的 处理效率和时效性 按照管理需要对原始事件中包含的信息 进行事件的重定义 其 目的是提高信息的统一化 以方便操作人员的监控和后期进行信息的再加工 同时根 据事件采集的规则 将不需要的事件在采集层直接过滤 可以减少管理服务器的事件 量 事件过滤和处理主要包括以下工作 1 设置事件过滤规则 对指定的事件进行收集 对非匹配事件进行屏蔽 2 通过对模板的修改 对 syslog 事件的级别进行重定义 按照华北电力调度数据 网要求 进行级别设定 3 对事件进行压缩处理 实现相同事件或相关事件的压缩 选择对压缩的事件的 重复事件保留与否 是否添加重复事件到注解 4 信息修改 根据管理需要或事件的关联结果重新定义事件的内容 如级别 故 障类型 描述等 5 事件处理具有缓存的能力 即使在网络事件风暴中 NNM 也不会崩溃 它首先 会将事件放在一个缓存队列中 然后将事件送入到 NNM 的事件关联 ECS 引擎中处 理 根据以往的经验 在单 CPU 服务器上可以达到 300 s 条的处理能力 事件过滤 事件过滤 网络事件中 有大量网管不关心的事件 所以需要对指定的不需要监控的事件进 行过滤 如非 syslog 事件 SYS 5 LOGIN SYS 5 CLOSE 等 对指定的网络设备产生 的接口事件进行过滤屏蔽处理 添加过滤规则进行告警屏蔽 NNM 提供对事件的处理 包括匹配告警 匹配抑制 不匹配抑制三种选项 并且 可以通过匹配的运算符设置复杂的匹配关系 匹配的规则可以通过配置工具实现 匹 15 52 配规则的定义灵活且方便 包括 等匹配规则 le lt ge gt eq ne 等运算规则 等表达式算法 对于 syslog 文件 由于有一些非 syslog 信息 可以简单的通过定义不匹配抑制不匹配抑制规 则实现对非 syslog 事件的过滤 其规则定义为 即如果文件中的信息 不含有 符 合 则进行抑制 在实际的操作环境中 对事件模板进行定义 设置过滤条件 如果事件信息不包 含 syslog 标识符号 则屏蔽不进行处理 设置过滤条件 如果事件信息类型为 SYS 5 LOGIN 或 SYS 5 CLOSE 则屏蔽此类告警 同理 可以对所有不需要监控的事件 通 过模板匹配的方式 方便的实现事件过滤与屏蔽 事件重定义事件重定义 在实际的运维环境中 对于默认的事件级别 并不能和网管的实际要求匹配 所 以需要对事件进行级别的重新定义 在模板中对特定的事件类型添加相关的模板条件 重定义后的事件分为四级 Normal Warning Major Critical 对 Critical 事件需 要实时语音告警并转发 ECC 首先 对华北电力调度数据网需要监控的几十种 syslog 事件进行重定义 根据业 务需要 按照如下规则进行事件定义如下 根据设备及端口不同的业务重要性对默认 Critical 事件进行重定义告警级别 关 联规则如下 1 恢复事件定义为 Normal 级别 由系统自动确认 2 在原来事件级别中没定义的事件为不确定事件 Warning 不作修改 3 对于破坏性事件 原始网管告警级别为 Critical 及端口 Down 进行 CMDB 业务重要性关联 3 1 重要设备的重要端口事件为 Critical 3 2 重要设备的非重要端口为 Major 3 3 非重要设备的重要端口为 Major 3 4 非重要设备的非重要端口为 Normal 自动确认 16 52 4 通过使用 ECS 对破坏性事件进 CMDB 业务级别重新定义 通过以上定义 实现的效果如下 通过以上定义 实现的效果如下 1 恢复事件定义为 Normal 级别 由系统自动确认 2 在原来事件级别中没定义的事件为不确定事件 Warning 不作修改 3 对于破坏性事件 原始网管告警级别为 Critical 及端口 Down 进行 CMDB 业务重要性关联生成 Critical Major Normal 事件 事件按照设定的规则进行显示 输出 事件自动关联事件自动关联 在网络中 经常会出现成对的事件 如节点 down up 事件 端口 down up 事件 管理员可以通过网管系统的自动关联确认功能 在 up 事件产生时 自动确认相 关联的 down 事件 到历史事件中 从而减少手工的处理工作 1 3 3 事件关联定制事件关联定制 在网络故障的处理中 存在大量噪音事件和多源关联事件 这就需要管理员针对具体 的事件管理要求实现事件处理逻辑的定制 NNM 提供功能全面且易于使用的事件关联生 成器 不但提供了默认的事件关联逻辑 同时 客户可以通过自定义的方式 实现客 户化的事件关联处理 默认事件关联举例默认事件关联举例 路由器路由器 交换机运行状况交换机运行状况 路由器 交换机接口节点关联器可以将接口状态报警和与其相关的路由器或交换机的 节点状态报警相关联 路由器或交换机内接口发出的 OV IF Unknown 状态报警和 OV IF Down 状态报警被抑制 并嵌套在节点状态报警之下 多次重新引导路由器多次重新引导路由器 交换机交换机 Multiple Reboot 关联器检测并报告有关路由器和交换机在指定时间窗口内多次重新 17 52 引导的问题 行为当相应的 OV Node Up 报警到达时 ECS PairWise 事件关联会抑制 OV Node Down 报警 该 OV MultipleReboots 关联器检测路由器和交换机内重复出现 的失效 启动状况 并生成一个 OV Multiple Reboots 报警 以警告您这一潜在问题 路由器路由器 交换机的瞬断状态关联交换机的瞬断状态关联 路由器 交换机的瞬断状态关联器可以报告间断性启动 失效状态的路由器或交换机 行为如果接口连续处于先失效 然后又启动的状态 则当 OV IF Up 事件到达时 ECS PairWise 事件关联将取消 OV IF Down 事件 该关联器 OV Connector IntermittentStatus 检测路由器或交换机内重复出现的接口失效 启动状况 并当 OV IF Down 事件在指定时间 Window Period 内发生指定次数 Count 时生成一个 OV Intermittent 报警 事件关联生成器事件关联生成器 NNM 不但提供默认的事件关联规则 同时通过事件关联生成器可以方便的定制用户在实 际环境中的各种事件关联规则 事件关联生成器提供了最常用的事件关联逻辑的模板 使用这些模板 可以很容易地开发出自己的模板 增强模板增强模板 用于触发一个或多个新报警的创建过程或扩充报警的信息量 多源模板多源模板 用于定义任意数目报警之间的关系 这些报警可能来自不同的源 并一起构成了确定 导致问题的逻辑集根源 当整组报警在定义的时间段内到达时 可以放弃 修改这些 报警 或生成一个更有意义的新报警 计数模板计数模板 用于计算在定义的时间段内接收事件的数目 接收到指定数目的事件后 可以选择放 弃报警并生成一个更有意义的新报警 重复模板重复模板 18 52 用于在定义的时间段内放弃重复报警 或在每次接收到附加报警时生成一个新报警 以便可以在报警消息文本中指定当前已接收到的报警的数目 抑制模板抑制模板 当需要放弃特定报警类别时使用 使这些报警并不显示到 NNM 的报警浏览窗口中 瞬断模板瞬断模板 用于检测在定义的时间段内发生的已定义的成对事件的数目 如节点启动 节点失效 可以放弃成对事件并生成一个更有意义的新报警 通过使用以上的这些事件关联模板 用户就可以方便的设计出满足自己需要的事件处 理 从而实现对网络告警的智能处理 并快速定位关键故障 从而恢复网络故障 保 障网络的正常运行 事件关联界面如下图所示 1 3 4 事件信息增强事件信息增强 在网络事件管理中 经常需要对对于事件的原始信息可以相应增加其他的有意义 的事件属性信息 如人员 地域 服务等内容 使管理员更为有效的实现对事件的监 控 文件丰富文件丰富 19 52 在事件中增加节点位置字段 通过 ECS 查询设备位置信息对照文件 将返回值丰 富到节点位置字段中 从而实现直观的告警显示 并辅助事件的解决 事件信息丰富 通过 ECS 调用文件方式 或数据库方式进行扩充 首先 匹配原始告警信息 获取需要关联的事件变量 如 等 如图所示 由此 可以提取原始信息中的变量 对指定变量进行关联丰富处理 通过使用 ECS 增强规则查询设备位置对照表 可以获取相关的设备位置信息 并 丰富事件属性 设备位置 显示在告警窗口中 数据库丰富数据库丰富 实际的工作环境还可以通过数据库进行关联处理 通过 ECS 查询设备位置信息的 数据库 将返回值丰富到节点位置字段中 从而实现直观的告警显示 并辅助事件的 解决 事件信息丰富通过 ECS 调用数据库方式进行扩充 首先 通过数据库查询守护程序 dbread 及其 client 端 testo 运行时 dbread 建立一个对 Oracle 数据库保持长链接的守护进程 ECS 通过并发调用 testo 向 dbread 进程输入查询条件并取回其返回值 这样避免了每次 ECS 事件关联时都需 要链接数据库和关闭数据库的时间和性能损耗 保证在大事件量的压力下 NNM 可以 快速准确的进行 CMDB 事件关联 由此 通过使用 ECS 增强规则在 CMDB 中查询设备位置对照表 可以获取相关 的设备位置信息 并丰富事件属性 设备位置 显示在告警窗口中 20 52 1 3 5 事件告警事件告警 当重要事件产生时 网管系统将触发一些告警功能 以便通知和提醒运维人员及 时处理 包括 弹出告警窗口 本地语音告警 email 短信等 由于此项操作的目的 是对管理员进行通知 所以 程序必须在监控员本地执行 或指定的远端 PC 机上运 行 如当监控到某地市的某节点发生故障时 相关的告警程序需要在地市管理员的的 监控平台启动 多功能故障报警系统 iMessenger 能够帮助 IT 部门有效的解决这些问题 iMessenger 是一个基于硬件产品的故障与信息通知的解决方案 如下图所示 iMessenger 通过不 同的适配器 iMsgAdapter 与安装在服务器上的 OV 管理软件进行集成 获得告警 问题等信息 并通过电子邮件 手机短信 手机铃声 自动拨打电话等远程方式 根 据用户定义的时间 故障条件等策略发送给指定的接受人 同时也支持传统的声音报 警 弹出窗口报警 Windows Messenger 报警 报警精灵等 通过短信指令 还能够远 程查询相关设备和服务的运行状态 及时了解网络运行质量信息 帮助远程诊断问题 系统还支持基于消息接口的编程集成 其他非 IT 管理软件也能够通过 iMessenger 进行消息的统一发送和管理 21 52 1 3 6 事件管理与其他模块的接口事件管理与其他模块的接口 NNM 的事件管理通常使用下面的方法和其他模块进行交互 首先当任何一个事件 到来时 NNM 都可以执行自动的命令 通过这个命令可以将该事件转发出去 另外 NNM 的事件都提供 MSI 接口 即在 NNM 中 具有消息流的概念 MSI 就是消息流 用户可以通过 API 在消息流上打开一个窗口 截获所有实时的消息 对于历史事件 可以通过 NNM 的数据库访问 其他系统要想 NNM 中发送事件 可以通过 SNMP 日志文件 命令行 消息 API 将事件导入到 NNM 中 1 4 网络性能管理网络性能管理 1 4 1 基本网络性能管理基本网络性能管理 网络性能管理是网管系统的一项重要功能 一般情况下 网络性能的各项指标大部分 可通过 SNMP 获得 包括设备的 CPU 内存 缓冲区使用情况 设备的环境参数 如电源 温度 风扇 电压等 对于 SNMP 的基本网络性能数据 NNM 实现功能如下 22 52 1 1 网络性能实时监测 网络性能实时监测 NNM 支持通过 SNMP 协议对网络性能进行管理 NNM 支持 SNMP v1 SNMP v2c 和 SNMPv3 能够管理的内容包括网络设备的性能 如 CPU Memory 等 端口流量 错 误率等 同时 管理员可定制自己的管理菜单 对自己关心的网络性能参数进行菜单定制 实 现方便的调用监测 NNM 提供对网络性能进行实时监测的工具 能够以最小为 1 秒的间隔对网络性能数据进 行收集 并即时生成曲线图 供管理员对网络性能进行观察和分析 NNM 可对网络设备的端口流量进行实时监控和历史采集 包括端口的流入流出量 端口 的错误率 丢包率等一系列网络参数进行统计 同时这些采集数据都可存入相应数据 库中 并可进行计算 得出各项百分比统计 通过对压缩前的流量采集和压缩后的流 量采集的计算即可得到相应的压缩百分比 23 52 1 4 2 网络性能分析网络性能分析 对于网络性能的历史采集主要从以下四个方面体现 1 数据采集 2 数据存储 3 数据管理 4 数据报告 通过 Openview 采集汇总的信息 管理员可了解当前的网络性能状况 并根据此来优化 网络结构 并为将来的网络系统升级提供决策支持 作为一个完整的解决方案 Openview 提供从数据采集到数据报告的所有工具 使管理 员可轻松完成对采集数据的管理和报告 1 1 数据采集数据采集 Openview 支持基于标准 SNMP 来采集 MIB 数据 如 RFC1213 或者设备厂商提供的私有 MIB 用户可以方便的加载不同厂家的 MIB 库到 Openview 系统中 以供管理员对自己 网络中的各种设备进行性能采集 在 OVPI 中 针对不同种类的设备和性能参数 系统提供采集策略的定制 包扩采集的 MIB 值 采集的时间间隔 以及采集的对象 2 2 数据存贮数据存贮 对于采集的历史数据 通常需要保持几个月或几年 甚至更长时间 用来为管理员提 供日报 月报 年报等 这样采集的数据如果不用数据库存储 将会对管理和维护带 24 52 来很大问题 使数据整合 报告生成很难进行 所以 作为一个成熟的性能管理软件 Openview 从一开始就使用数据库对其数据进行存贮和处理 并支持多种开放形式供开 发人员对其数据进行进一步处理 3 3 数据管理数据管理 原始数据采集后 NNM 按小时 天 星期 月对原始数据进行整合处理 对于不同时间 间隔的采集数据自动的存贮在不同的表中 同时包括其统计的最大 最小 平均值等 统计信息都进行相应的存贮 这样在对大量数据生成报表的时候 效率就不会因为数 据量的增大而受到影响 同时也为报告的生成提供了更大的灵活性 可以根据不同的 统计数据生成相应的服务级别报告 同时 数据处理是可预定义并自动完成的 管理员可以选择采集数据进行处理的时间 间隔 数据在数据库中的保留时间等 系统将按管理员定义的时间进行自动处理 对 于采集到的性能数据 系统可以设置阈值告警 既可以对原始数据进行阈值告警 也 可以对聚合数据和统计数据进行阈值告警 25 52 收集原始数据之后 Openview 就会把这些数据整合成为按小时 天 周 以及月 的统计数据 出于效率考虑 每个时间段的信息都保存在单个表格中 Openview 不但 提供各种参数的基本集合 最小值 最大值 平均值 总值 而且还提供深入的统 计数据分析 例如标准偏差 百分比 阈值 预测 以及更多 请参见下面的 Openview 统计数据摘要 小节以获得更多详情 Openview 的数据老化过程是自动的 用户也可以进行配置 用户可以选择数据在 每种数据表格中保留的时间 如果不再需要数据 那么就会自动从数据库中删除它 OVPI 中内置了很多管理和统计的算法 包括 Management Central storage Distributed storage Aging Purging of data Manipulation Roll up time reduction Grouping by variable Rotation of narrow data Analysis Delta calculation Conditional processing Mathematical Expressions SQL Expressions Grade of service indexes Thresholding Stepping Baseline Creation Forecasting Statistics Total of samples Minimum Maximum 26 52 Times OmniStorage Storage Area Management PolicyXpert IT Administrations 目前华北电力调度数据网是只管理网络环境 将来也可以把存储设备 主机 应 用 含数据库 服务等都纳入到 Openview 的管理中 对于各种对象都要进行事件管 理 性能管理和变更管理 在上图中是 Openview 产品对应的管理模块 目前我们配置了一部分 Openview 模块用于华北电力调度数据网的网管系统 当以 后有新的管理需求时 我们可以添加更多的模块来完成新增的管理功能 这些模块间 都具有集成接口 可以完美地集成为一个统一的网管系统 另外 Openview 具有良好的开放性和扩展性 可以集成大约 300 多种其他厂家的 设备管理工具 包括 CiscoWorks 等 最后 Openview 提供有各种开发接口 可以使用这些接口开发一些目前商用软件 所无法完成的功能 44 52 1 7 2 管理范围的扩展管理范围的扩展 当管理范围扩大后 如添加设备 添加服务 可以使用原有软件管理这些设备 对于网络管理 NNM 的节点数是可以扩充的 如果硬件能力不够 可以升级硬件 另外 Openview 支持级联的分布式管理方式 可以在华北电力调度数据网形成一个二级或者 三级的分布式网管系统 其不同的功能组件可以分布在多台服务器上 2 网元管理软件 网元管理软件 JunosScope 采用直观 易于使用的应用和工具来增强效率可以简化管理 由于技术熟练的人员越来越供不应求 所以运营 部门需要利用自动的 集成的 OSS 应用基础设施 该基础设施使服务供应商可以在不大大增加资源库的同时实现 规模经济效益 但是 各种不同应用的集成可能非常复杂 而且很浪费时间 随着 XML 等新技术的开发 OSS 集成也变得更加简单了 这些新技术使用简便 而且能够大大缩短开发时间 Juniper 网络公司推出的 JUNOScript 首次在路由器上实施了嵌入式 XML 界面 从而进一步增强了 Juniper 网络公 司的领导地位 JUNOScope 是一种配置和库存应用 它利用了业界领先的 JUNOScript API JUNOScope 在更高 的网络层中结合了比特连接和传输层的创新 产品概述产品概述 JUNOScope 是一种管理框架 他包括用于管理 M 和 T 系列路由器的 IP 业务的工具 该管理框架很灵活 利用了 使用简便的 XML 技术 可以根据特定运营需求创建基于 JUNOScope 框架的应用 或者在不进行额外开发工作的 情况下部署 现成 的工具 这些工具可支持配置管理 库存管理和系统管理等多种功能 JUNOScope 提供了 3 个预装工具 使网络操作员能够在安装 JUNOScope 之后即可执行维护路由器网络要求的所 有日常任务 JUNOScope 框架 窥镜窥镜 窥镜工具 设计用来从状态和性能的角度 为网络操作员提供详细的路由器运行状况概述 窥镜 工具能够直观显 示路由器上的未确认告警数量以及每个路由器组件的状态 网络操作员还能够迅速调用重要的运营统计数据 如 接口或机箱统计数据 MPLS 统计数据以及包括 BGP 对等体和 BGP 邻居在内的路由协议汇总 这些统计数据对于 网络诊断和故障排除至关重要 窥镜 工具还可提供重要的网络库存信息 包括每台设备的序列号 小到各种板卡的 序列号 这些信息还能够转发到更高的库存系统层 45 52 窥镜 BGP 邻居汇总 配置管理器配置管理器 配置管理器使用户可以利用 M 和 T 系列路由器的运营商级配置文件管理功能 用户能够根据时间和 或基于包含多 台路由器的预定义组将配置文件归档 利用 比较存档文件 功能 可通过直观的图形用户界面很容易地指出不同版 本配置文件之间的差别 配置管理器 显示存档文件结果 管理管理 常见的管理任务可通过管理工具完成 管理工具使网络操作员可以配置用户 超级用户和用户组以及路由器安全访 问权限等 JUNOScope 与 JUNOS 操作系统严格同步 提供了一种可行且经济高效的脚本替代工具 他可以直接使用 CLI 46 52 JUNOScope 的特性和优势的特性和优势 特性特性优势优势 图形用户界面 基于 Web 支持 NetScape 和 IE 浏览器 基于 Java 易于使用 直观 可进行扩展 以支持多种平台 不要求费用高昂的培训即可了解和使用 GUI 最大程度降低运营成本 窥镜 监控并显示路由器功能 运行状态 机箱和接口统计数据 路由协议统计数据 BGP 和 IS IS 汇总 系统信息 无需额外定制即可提供 现成 的功能 通过提供关键路由信息的可视性 使网络工程更为简 便 利用深入的路由器统计数据和性能汇总精简故障排除 程序 配置管理器 支持配置文件管理 存档文件 按需或按计划 按预定义的组存档 恢复文档 显示 对比 充分利用 M 和 T 系列产品中强大的配置文件选项 通过一个 GUI 完成网络范围的配置备份 增强可靠性和可依赖性 系统 安全性管理 支持 SSL 密码鉴权 用户组和用户 时间进度表 集中管理路由器安全性 支持多个并行用户 可帮助促进路由器的部署并最大 限度缩短业务推出时间 JUNOS 操作系统支持操作系统支持 47 52 JUNOS 7 0 JUNOS 6 0 JUNOS 5 7 JUNOS 5 6 系统要求系统要求 操作系统 SUN OS Solaris 2 8 工作站最低配置建议 单 CPU Ultra SPARC III 900 Mhz 或更高 最低存储器要求 1 Gbyte RAM 内存 750 Mbyte 可用磁盘空间 进一步详细信息 请参阅 JUNOScope 技术文档 定价定价 JUNOScope 许可基于网络中的用户和设备数量定价 缩写缩写 API应用编程接口 BGP边界网关协议 CLI命令行界面 IP互联网协议 IS IS中间系统到中间系统 ISO国际标准组织 MIB管理信息库 MPLS多协议标记交换 OSPF开放最短路径优先 PCI外围组件互联 48 52 PIC物理接口卡 RFC请求注解 SDH同步数字体系 SNMP简单网络管理协议 SONET同步光网络 XML可扩展标志语言 3 软硬件配置软硬件配置 3 1 软件配置软件配置 针对华北电力调度数据网网络环境 建议的软硬配置架构如下 1 北京中心针对全国骨干网设备的管理 具体配置的产品具体包括 软件模块 软件模块 安装的模块安装的模块用途用途 HP NNM 1000 节点 作为一级管理中心的网管平台 包含拓扑管 理 事件管理 事件关联 用户权限管理等 HP Openview Openview网络性能分析软件 包括设备 端口等 HP Openview SPI for MPLS VPNMPLS VPN 监控 配置软件 HP Openview iMessager 综合报警机 Juniper JunosScopeJuniper JunosScope 网元管理软件 3 2硬件配置硬件配置 硬件配置情况如下 具体的服务器性能指标的确定是根据惠普公司在网管领域多年实践验证的经验公式来 确定的 以下的推算方法谨供华北电力调度数据网参考 49 52 OpenView 对于网管主机的性能要求主要和管理节点数 采集性能参数量 事件处理量 登录 用户数等参数有关 同时和网管主机所管理的具体环境和网络状态也有一定关系 所以有相关公式 可进行估算 然后再结合具体环境 可得出相应合理的主机配置 对于主机性能的需求 计算公式如下 主机性能需求系数 基本需求系数 节点相关需求系数 性能数据需求系数 事件数据需求参数 用户数需求系数 主机性能需求系数 26 28 节点数 1000 3 采集实例 1000 0 5 采集间隔 分 4 每小时事件量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论