IMS网络容灾备份技术研究.doc_第1页
IMS网络容灾备份技术研究.doc_第2页
IMS网络容灾备份技术研究.doc_第3页
IMS网络容灾备份技术研究.doc_第4页
IMS网络容灾备份技术研究.doc_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

知识水坝(豆丁网pologoogle)为您倾心整理(下载后双击删除) 1 百度一下“知识水坝“ 中国移动通信集团江苏公司网络部中国移动通信集团江苏公司网络部 二二一一年十一月年十一月 imsims 网络容灾备份技术研究网络容灾备份技术研究 知识水坝(豆丁网pologoogle)为您倾心整理(下载后双击删除) 2 百度一下“知识水坝“ 目目 录录 1 概述概述1 2 cm-ims 网络架构及网元介绍网络架构及网元介绍.1 3 故障检测机制故障检测机制3 3.1 基于 sip option 的故障检测3 3.2 基于 diameter的链路检测5 4 enum/dns 容灾备份方案容灾备份方案 .5 4.1 enum/dns 组网方案.5 4.2 enum/dns 数据同步方案.6 4.3 enum/dns 负荷分担方案.7 4.4 倒换/倒回机制8 5 sbc 容灾方案容灾方案.9 5.1 sbc 负荷分担机制 9 5.2 sbc 异本地网容灾方案 12 5.3 固定接入用户对 sbc 的故障恢复机制 .13 5.3.1倒换机制.14 5.3.2倒回机制.14 5.3.3容灾效果分析.15 5.4 ps 域接入用户对 sbc 的故障恢复机制15 5.4.1倒换机制.16 5.4.2倒回机制.16 5.4.3容灾效果分析.16 5.5 对终端和其他网元的要求.17 6 p-cscf 容灾方案容灾方案.17 6.1 p-cscf 负荷分担机制.17 6.2 倒换机制.19 6.3 倒回机制.20 知识水坝(豆丁网pologoogle)为您倾心整理(下载后双击删除) 3 百度一下“知识水坝“ 6.4 容灾效果分析.20 6.5 对终端和其他网元的要求.21 7 i/s /e-cscf/bgcf 容灾方案容灾方案.21 7.1 i/s /e-cscf/bgcf 容灾方案无动态数据备份21 7.1.1i/s /e-cscf/bgcf 负荷分担机制22 7.1.2倒换机制.24 7.1.3倒回机制.25 7.1.4容灾效果分析.26 7.1.5对终端的要求.26 7.2 i/s /e-cscf/bgcf 容灾方案支持动态数据备份27 7.2.1s-cscf 动态数据备份机制.27 7.2.2倒换机制.27 7.2.3倒回机制.29 7.2.4容灾效果分析.30 7.2.5对相关网元和终端的要求.30 7.3 s-cscf 容灾方案比较.31 8 hss 容灾方案容灾方案.32 8.1 hss n+1 非实时备份方案.32 8.1.1方案描述.32 8.1.2数据同步要求.33 8.1.3倒换机制.34 8.1.4倒回机制.34 8.1.5容灾效果分析.35 8.1.6其他网元的要求.35 8.2 hss n+1 实时备份方案.35 8.2.1方案描述.35 8.2.2数据同步.36 8.2.3倒换机制.37 8.2.4倒回机制.38 8.2.5容灾效果分析.38 知识水坝(豆丁网pologoogle)为您倾心整理(下载后双击删除) 4 百度一下“知识水坝“ 8.2.6其他网元的要求.38 9 mgcf 容灾方案容灾方案.38 10业务放通机制业务放通机制39 10.1 基本通话业务的放通39 10.2 被叫一号通业务放通40 ims 网络容灾备份技术研究 cmdi 1 百度一下“知识水坝“ 1概述 本课题研究主要目的是制定 cm-ims 网络容灾方案,cm-ims 重要网元的容灾备 份及倒换恢复的方案,以便能有效的保障中国移动 cm-ims 网络安全、平稳、高效运 行,在核心网元发生故障退出服务的情况下,备用网元或负荷分担设备能够迅速地接 管主用设备承载的业务,使业务尽快恢复。 本课题中研究的容灾备份方案是网元级的容灾方案。备用网元设备整体接管主用 设备承担的业务,不涉及一个独立网元内部不同模块间的容灾备份。为保障网元级容 灾的效果,主备用网元或成对负荷分担设备应设置在不同的局址,而且各自使用独立 的电源和传输资源。 2cm-ims 网络架构及网元介绍网络架构及网元介绍 cm-ims 标准是中国移动结合自身网络特点,将 3gpp 国际标准 ims 进行简化和 创新,提出的更加适用于中国移动现有网络的网络架构,国际标准与现有网络的结合 诞生的网络架构更有利于其在现网的部署和在实际应用中发挥作用。cm-ims 网络架 构示意图如下: i-cscf s-cscf p-cscf mgcf im-mgw /sgw sbc bgcf hssslf sip as mn bicc isup plmn/pstn mw mg cx cx dx dx mi mg ut sh scp ue isc lan wlan xdsl pon td-scdma gm dh gm e-cscf mw mw mrfc cr mj sip as isc sh dh mw mg mrfp mp enum/ dns cg omc sbc/ p-cscf mw mw mw 图 1:cm-ims 网络架构示意图 ims 网络容灾备份技术研究 cmdi 2 百度一下“知识水坝“ 在 cm-ims 网络架构组成中,主要有以下功能网元: cscf: cscf(会话控制)是 ims 系统的呼叫控制核心,它的主要作用是在 ip 传输平台 上实现用户接入及鉴权、会话路由、业务触发等功能。根据功能分工不同分为 p- cscf、i-cscf、s-cscf 和 e-cscf。 p-cscf(代理会话控制)是 ims 终端接入 ims 的入口点,能根据用户接入网的 ip 地址段与接入网类型的对应关系(p-cscf 的本地配置表)来区分用户的接入类型。 p-cscf 提供注册和注销、鉴权和授权、信令压缩、媒体授权、信令路由、数据管理、 紧急呼叫、qos、计费等功能。 i-cscf(查询会话控制)是 ims 归属网络的入口点,在注册过程中,i-cscf 通 过查询 hss,为用户选择一个 s-cscf;在呼叫过程中,去往 ims 网络的呼叫首先路 由到 i-cscf,由 i-cscf 从 hss 获取用户所注册的 s-scscf 地址,将消息路由到 s- cscf。 s-cscf(业务会话控制)在 ims 核心网中处于核心的控制地位,负责对终端的 注册鉴权和会话控制,执行针对主叫端及被叫端 ims 用户的基本会话路由功能,并根 据用户签约的 ims 触发规则,在条件满足时进行到 as 的业务路由触发。 e-cscf 负责紧急呼叫的相关处理。 hss/slf: hss 作为整个网络的用户数据库,存储 ims 用户的鉴权信息、签约信息、业务透 明数据等。其主要功能包括: (1)用户和业务数据存储功能 (2)用户和业务数据管理功能 (3)支持注册/注销等流程 (4)支持鉴权功能 (5)用户/业务位置查询功能 (6)签约定位功能 slf:在域内存在多个 hss 时,由 slf 选择用户存储的 hss。 mgcf/im-mgw: mgcf 和 im-mgw 是 ims 域与 cs 域和 pstn 互通的功能实体,分别负责控制 ims 网络容灾备份技术研究 cmdi 3 百度一下“知识水坝“ 信令和媒体流的互通。 bgcf: bgcf 的功能主要是将用户的会话路由到正确的 plmn/pstn 网络: 与本网用户互通,选择路由至被叫网络的 mgcf,与其他运营商互通,选择与其 他运营商的 bgcf 互通。 mrf(mrfc 和和 mrfp): mrf(媒体资源功能)主要提供铃音与录音通知的播放、会议的媒体流处理(混 音等) 、编解码转换、dtmf 信号处理等功能。 enum/dns: enum/dns 系统在 cm-ims 网络中主要完成用户 e.164 号码与 sip uri 之间的转 换,并且提供用户归属域域名对应 ip 地址的映射,协助 ims 核心网网元完成会话的路 由。 sbc: sbc(会话边界控制器)分为 a-sbc 和 i-sbc:a-sbc(接入)为 ims 的接入点, 完成用户代理、接入控制、nat 穿越、媒体门控等功能;i-sbc(互联)与他网 ims 互通,完成 ibcf,iwf,i-bgf 功能。 3故障检测机制故障检测机制 3.1基于基于 sip option 的故障检测的故障检测 sbc 与 p-cscf 之间、cscf 之间、as 与 s-cscf 之间、mgcf 与 cscf/bgcf 之间采用基于 sip option 的状态检测机制,有如下两种方式: (1)方式一:启发式方式一:启发式 假设网元 b1/b2 为负荷分担的一对网元,网元 a 与网元 b1/b2 之间采用启发式 sip option 监测链路状态。若网元 a 与网元 b1 间正常的信令交互(如 invite 等) 超时,网元 a 确定网元 b1 不可用,将 sip 请求转发网元 b2,并同时启用 sip option 监测网元 b1。若 b1 能正常响应,重新启用 b1。 ims 网络容灾备份技术研究 cmdi 4 百度一下“知识水坝“ 网元a网元b1 1. options (b1) 2. options (b1) . . . n2f. options (b1) 1. invite(a,b) 2. invite(a,b) . . . n. invite(a,b) invite(a,b) b1对端正常 等待临时响应码100超 时,开始检测对端 b1检测对端 sip消息重传 b1对端故障 b1对端正常 1. options (b1) . . . 2. options 200ok n次失败 m次成功 (2)方式二:自发式方式二:自发式 假设网元 b1、b2、b3 为负荷分担的一对网元,网元 a 与网元 b1、b2、b3 之间 采用自发式 sip option 监测链路状态。网元 a 定时(应可配置为 0-20 秒)发 sip option 给网元 b1、b2、b3。若 a 多次(次数应可配置为 1-5 次)未收到网元 b1 的 响应,网元 a 确定网元 b1 不可用。 两种方式的比较如下: 优点优点缺点缺点 方式一: 自发式 流程简单 网元间冗余消息多:例如没有话务量时, 由于多个连接关系也可产生较多的检测 消息流量; 需配置对端网元列表,网络结构调整或 扩容新增网元时需要调整数据配置。 方式二: 启发式 可动态改变检测的对端地址,网元间冗余消 息少:和对方没有业务连接,则不用检测对 方状态;对端网元没有故障,或者故障恢复, 检测消息可停止; 数据管理简单:不用静态配置对方列表,而 是从动态关系中学习,例如漫游关系中p- cscf对s-cscf的地址是从service route学习 而来;s-cscf对p-cscf的地址是从path中学 流程复杂,对设备要求较高。 ims 网络容灾备份技术研究 cmdi 5 百度一下“知识水坝“ 习而来。 option 检测方是为了识别对端网元设备出现故障,不要将业务请求发往该故障 网元。因此,option 检测方的发起机制,应该与如何获取对端网元设备信息的方式 相关,建议按照两种场景分类: (1)由于 cscf 与他省 cscf 存在网状连接关系,且连接关系不固定。如漫游时, 漫游地 p-cscf 和归属 i/s-cscf 之间不是固定的连接关系,同时跨省呼叫时主叫 s- cscf 和被叫 i-cscf 之间的路由也不是固定的连接关系,因此 cscf 故障检测建议采 用启发式,便于维护。 (2)sbc 寻址 p-cscf(从属关系)、mgcf 寻址 i-cscf、as 寻址 i/s- cscf(as 始发呼叫寻址 s-cscf 建议都从 i-cscf 入口)的关系都比较固定,建议采用 自发式检测。 3.2基于基于 diameter 的链路检测的链路检测 i-cscf、s-cscf、as 与 hss/slf 之间采用基于 diameter 的链路监测机制。客户 端(业务网元)在 tcp/sctp 链路上周期性的发送握手心跳消息 device-watchdog- request(dwr)/device-watchdog-answer (dwa)来检测对端服务器是否故障,心跳 消息在 ietf rfc3588 中定义。diameter 链路检测时长应可配置为 0-10 秒。 4enum/dns 容灾备份方案容灾备份方案 4.1enum/dns 组网方案组网方案 北京一级 enum/dns 二级 enum/dns 二级 enum/dns a b cscf boss 广州一级 enum/dns 网管系统 ims 网络容灾备份技术研究 cmdi 6 百度一下“知识水坝“ 若省内分局址设置多套 ims 核心网(cscf),建议 enum/dns 也分局址设置两 套,采用负荷分担的工作方式,两套 enum/dns 存储的数据保持同步。 4.2enum/dns 数据同步方案数据同步方案 boss 和网管系统对 enum/dns 中数据更新机制有如下三种方式: (1)方式一:方式一:enum/dns 主备同步方案。主备同步方案。正常情况下 boss 系统或网管系统向 enum/dns 系统(主)发送数据,由该 enum/dns 系统(主)同步数据给另一套 enum/dns 系统(备)。发生容灾时,boss 系统或网管系统向另一套 enum/dns(备)系统下发数据。两套 enum/dns 之间的数据同步机制和流程遵循 rfc1995 和 rfc1996,采用标准 dns 机制和 ftp 机制进行主备系统之间的数据同步。 当需同步的数据量较小时,采用标准 dns 机制进行同步;当需同步的数据量较大时, 采用 ftp 机制进行同步。 (2)方式二:基于方式二:基于 boss 系统或网管系统的数据同步。系统或网管系统的数据同步。boss 系统或网管系统向两套 enum/dns 同步数据,并支持失败回滚等机制。若厂家配置了业务开通网关,支持由 业务开通网关向两套 enum/dns 同步数据。 (3)方式三:方式三:enum/dns 采用前端采用前端+后端架构,后端数据库后端架构,后端数据库/存储服务器向前端同步存储服务器向前端同步 数据。数据。boss 系统或网管系统向 enum/dns 后端数据库发开通或数据配置指令数据, 由后端数据库向多个前端同步数据。若 enum/dns 的前端+后端设备做为一套完整的 enum/dns 设备,则也需要采用基于 boss 或网管系统向两套 enum/dns 同步。 从各厂家从各厂家 enum/dns 的设备构架看:的设备构架看: 华为、中兴采用 enum/dns 前台处理和后台数据库服务器合设的架构; 爱立信、诺西、上海贝尔均采用前、后端分开的方式,前台负责接受查询处理, 后台负责数据存储和管理,并向前端更新数据。 因此根据各厂家设备实现架构不同,对于 enum/dns 主备设备为同厂家的情况下, 上述三种方式的各厂家支持情况如下表: 方式一:方式一: 主备同步方式主备同步方式 方式二:方式二: 基于支撑系统的基于支撑系统的 同步方式同步方式 方式三:方式三: 前后端同步方式前后端同步方式 华为 中兴 爱立信 ims 网络容灾备份技术研究 cmdi 7 百度一下“知识水坝“ 诺西 上海贝尔 三种方式的比较如下表所示: 方式三:方式三: 前后端同步方式前后端同步方式 方式一:方式一: 主备同步方式主备同步方式 方式二:方式二: 基于支撑系统的基于支撑系统的 同步方式同步方式(后台+前台) 做为一套设备,主 备部署方式 1 后台+2 前台部 署方式 对 boss/网管 的需求 boss/网管只与一 套 enum/dns 有 接口,接口简单 boss/网管需支 持数据同步、失 败回滚等机制 boss/网管需 支持数据同步、失 败回滚等机制 boss/网管只 与 enum/dns 后 台有接口,接口 简单 是否有数据仲 裁机制 存在主备数据, 做为数据仲裁 无主备数据 之分 无主备数据之 分 后台数据库 数据做为仲裁 多厂家 enum/dns 组网的支持 主备 enum/dns 必须 为同厂家 主备 enum/dns 可 为异厂家 主备 enum/dns 可为 异厂家 主备 enum/dns 须为 同厂家 安全性高高高一般,若后台故 障会影响业务开 通 适用场景华为、中兴设备异厂家组网场景爱立信、诺西、上 海贝尔设备,安全 性要求较高时 爱立信、诺 西、上海贝尔设 备,安全性要求 一般时 综上所述,方式一对 boss/网管系统要求较低,且有数据仲裁机制,但异厂家设 备之间较难实现,但部分厂家不支持。对于采用前台+后台架构方式的厂家(爱立信、 诺西、上海贝尔),根据安全性要求不同,可选用方式三的两种组网模式之一。异厂 家组网时,选用方式二。 4.3enum/dns 负荷分担方案负荷分担方案 两套 enum/dns 系统应实现负载均衡,有以下三种方案: (1)方案一:分区域主备方式方案一:分区域主备方式 即在省内划分 2 个 enum/dns 服务区。如划分区域 1、区域 2,在区域 1 内所有 cm-ims 核心网、业务平台设备将 enum/dns1 设置为主用 enum/dns,enum/dns2 为备用 enum/dns;在区域 2 所有 cm-ims 核心网、业 ims 网络容灾备份技术研究 cmdi 8 百度一下“知识水坝“ 务平台设备将 enum/dns2 设置为主用 enum/dns,enum/dns1 为备用 enum/dns。 (2)方案二:方案二:forwarder 方式方式 在 enum/dns 客户端(cm-ims 核心网、业务平台设备)配置多个 enum/dns 服务器地址,且数量无限制。 enum/dns 客户端初次查询时,随机设置一个 rtt 值,小于任何真实的 rtt, 保证得到真实 rtt 之前,能随机、顺序查询多套 enum/dns 服务器; 得到多个真实 rtt 后,则从 enum/dns 列表中选择真实 rtt 最小的服务器,后 续查询请求向该服务器发起。 enum/dns 客户端定时重新向多套 enum/dns 发送查询情况,根据网络情况和 服务器负荷情况 rtt 会发生变化,enum/dns 客户端重新选择 rtt 最小的服务器。 (3)方案方案三:三:anycast 方式方式 anycast 允许源节点向一组目标节点中的一个节点发送数据报,而这个节点由路由 系统选择,对源节点透明;同时,路由系统选择“最近”的节点为源节点提供服务, 从而在一定程度上为源节点提供了更好的服务也减轻了网络负载。 通过配置路由协议和 dns 服务器,在中国移动 ip 专用承载网上采用一个 anycast 地址标识提供 enum/dns 服务,访问该地址的请求可以被 ip 承载网路由到多套 enum/dns 节点中“最近”的一个节点上。最终用户并不知道提供服务的具体是哪一 个节点。 方案比较: 方案一:实现简单,对一级 enum/dns 和二级 enum/dns 都没有额外的功能要 求。但以省或者大区为单位划分的服务区,难以实现完全的负荷分担。并且各省业务 的发展速度不均衡,服务区内的负荷更加难以控制。 方案二:负载均衡效果较好。由于 rtt 值会根据网络情况和服务器负荷情况发生 变化,客户端总能选择最近和相对负荷较小的服务器,实现负载均衡。 方案三:it 领域比较专业的解决方案,目前全球 internet 网里 13 台根 dns 里有 6 台是采用 anycast 技术实现多服务器负荷分担。在节点数量较多的情况下该方案优势 比较大。但该方案存在的问题是对 ip 专网的路由数据配置将会增加,且目前在中国移 动网络内没有应用,运维人员缺乏相关经验。 ims 网络容灾备份技术研究 cmdi 9 百度一下“知识水坝“ 建议采用方案一或方案二。 4.4倒换倒换/倒回机制倒回机制 enum/dns 为无状态设备,不涉及倒换倒回。 5sbc 容灾方案容灾方案 5.1sbc 负荷分担机制负荷分担机制 sbc 的负荷分担主要取决于 ue 注册时对于 sbc 的选择。ue 向 sbc 发起注册时, 先从 dns 获取 sbc 域名对应的 ip 地址或 ip 地址列表,ue 向此 ip 地址或选择 ip 地 址列表中第一个 ip 发起注册。ue 对 sbc 的负荷分担有如下两种种方式: (1)方式一:公网方式一:公网 dns 通过轮询或基于优先级、权重的方式将通过轮询或基于优先级、权重的方式将 ue 接入本地网内接入本地网内 多套多套 sbc 中的一套中的一套 sbc。 用户配置 sbc 设备的 dns 统一域名标识,如:。通过查 询 cmnet dns 获取接入地 sbc 设备地址。 若 ue 支持 srv 查询,则 dns 向 ue 返回带 sbc 优先级、权重的 srv 记录; 若 ue 不支持 srv 查询,则对不同用户的 dns 请求,cmnet dns 通过循环 复用方式,将本地网内多套 sbc 的地址,以不同顺序的 a 记录列表形式返回 给用户。 srv 记录配置举例:记录配置举例: _sip._ in srv 0 50 5060 sbc1.0571.zj. _sip._ in srv 0 50 5060 sbc2.0571.zj. sbc1.0571.zj. in a sbc2.0571.zj. in a 当用户发送 dns 查询以解析域名 时,dns server 返回带多 套 sbc 优先级(priority)和权重(weight)的 srv 记录列表。用户根据 priority 值和 weight 值负荷分担的选择 sbc。 若 priority 数值不同,优先选择 priority 值低的 sbc; 对于 priority 数值相同的 sbc,则根据 weight 值按比例负荷分担选择 sbc(如 选择 sbc1) ,然后对选定的 sbc(如选择 sbc1)进行 a 查询,得到选定的 sbc(如选择 sbc1)的 ip 地址 a 记录配置举例:记录配置举例: ims 网络容灾备份技术研究 cmdi 10 百度一下“知识水坝“ 在 cmnet dns 存储的 区域中, 将多台本地 sbc1,sbc2 的不同 地址均配置指向域名 : in a in a 当用户发送 dns 查询以解析域名 时,dns server 将该列表 按下述顺序循环使用。如: 对于用户 1 发出的 域名 dns 查询请求,返回 和 地址。 对于用户 2 发出的 域名 dns 查询请求,返回 和 地址。 (2)方式二:公网方式二:公网 dns 通过设置通过设置 view 的方式将的方式将 ue 接入区域内的一套接入区域内的一套 sbc,同时,同时 支持故障倒换。支持故障倒换。 用户配置 sbc 设备的 dns 统一域名标识,如:。通过查 询 cmnet dns 获取接入地 sbc 设备地址。 对不同用户的 dns 请求,cmnet dns 根据用户的接入地址,将用户接入地 址所处区域内一套 sbc,并配置另一套 sbc 为备用 sbc。 配置举例:配置举例: 在 cmnet dns 上,为不同的区域,分别配置 view view”viewname1” in match-clientsipaddress-1; recursion yes; zone “sbc.chinamobile,com” type master; file “.zone.1”; ; ; 说明: a)viewname1 是针对 view 的名字,可以根据需求自行更改。 b)ipaddress-1 是需要控制的源 ip 地址段,多个地址段之间用”;”间隔; ims 网络容灾备份技术研究 cmdi 11 百度一下“知识水坝“ c).zone.1 是 的域文件名,可 以根据自己的需求自行更改 view”viewname2” in match-clientsipaddress-2; recursion yes; zone “sbc.chinamobile,com” type master; file “.zone.2”; ; ; 说明: a)配置第二个 viewname、ip 地址段,使用 .zone.2 文 件提供解析。 b)有多个 ip 地址段,可以使用上述方法配置多个 viewname,多个域文件。 view”viewname-last” in match-clientsany; recursion yes; zone “sbc.chinamobile,com” type master; file “.zone.last”; ; ; 说明:配置最后一个 view,匹配剩余所有未匹配 ip 地址段,以免遗漏。 在域文件存放目录,针对上述 view 配置中的各域文件 .zone.*分别进行配置。 在文件 .zone.1 中,配置如下: $ origin. ims 网络容灾备份技术研究 cmdi 12 百度一下“知识水坝“ $ttl 3600 ;60minutes in soa dnsservername.root.dnsservername.( 2009052100 ;serial 10800;refresh(3 hours) 900;retry(15minutes) 604800;expire(1 week) 900;minimum(15 mimutes) ) ns dnsservername. mx5 rg100. dnsservername. $ origin.. a sbcipaddress1 a sbcipaddress2 说明: a) dnsservernme. 是本 dns 服务器的域名。 b)sbcipaddress 相应源 ip 地址段需要解析的 sbc 设备地址。 c) 用同样方法,生成所有 .zone.*域文件。 当用户向 cmet dns 发起 dns 查询,获取 sbc 地址时,dns server 根据 用户地址所在的地址段,判断用户所处的 view。 确定用户所处的 view 后,dns 服务器到该 view 对应的域文件 .zone.*中,获取相应的 sbc 的地址列表,用于 sbc 容灾切 换。 用户优先接入 sbc 列表中的第一个 ip 地址,若第一个地址超时失败后,使用 列表中的第二个地址进行注册。 (3)方案分析方案分析 方式一配置简单,适用于本地网内各区域无法细分用户源 ip 地址段的场景,或 sbc 在本地网内部署较集中,用户从本地网内不同区域接入 sbc 在承载网的路径类似 时。 方式二需要区分本地网内各区域的用户源 ip 地址段,在本地网内 sbc 分散部署 (如部署在不同的区县)时,对于 sbc 的就近接入效果较佳。 ims 网络容灾备份技术研究 cmdi 13 百度一下“知识水坝“ 5.2sbc 异本地网容灾方案异本地网容灾方案 若本地网内只有一套 sbc,可采用 5.1 节方式二的方法进行异本地网容灾。即公网 dns 对应每个本地网配置返回 sbc 的地址列表,其中列表中第一个 ip 地址为该本地 网 sbc 的 ip 地址,列表中第二个 ip 地址为作为容灾的另一个本地网的 sbc ip 地址。 sbc 异地容灾有两种方式: 方式一:各本地网循环容灾,如本地网 1 的 sbc 作为本地网 2 的容灾 sbc,本地 网 2 的 sbc 作为本地网 3 的容灾 sbc本地网 n 的 sbc 作为本地网 1 的容灾 sbc。 方式二:选取某个 sbc(如省会 sbc)做为其他 sbc 的容灾 sbc。 两种方式比较如下: 方式一方式二 实现难度要求每个本地网的 sbc 均 能虚拟成两个虚拟 sbc 要求容灾 sbc 能虚拟能多 个虚拟 sbc 容灾效果多套 sbc 同时故障的情况 下,容灾效果较好 多套 sbc 同时故障的情况 下,容灾 sbc 的接管率较 低,话务损失较大 适用条件适用于省内大部分本地网为 单套 sbc 设置的情况 适用于省内个别本地网为单 套 sbc 设置的情况 上述两种方式均要求 sbc 支持虚拟 sbc 的功能,要求 sbc 根据不同的虚拟 sbc,配置多个 pani(p-access-network-info)和 phonecontext,以支持计费、紧急 呼叫等需求。目前各厂家虚拟 sbc 的实现机制有三种方式: 方式一:华为、中兴、诺西的 sbc 支持配置两套或多套 sbc 设备名和 ip 地址, 如地市 1 的 sbc 配置(设备名 1-1 ip 地址 1-1)和(设备名 1-2 ip 地址 1-2) ,地市 2 的 sbc 配置(设备名 2-1 ip 地址 2-1)和(设备名 2-2 ip 地址 2-2) 。cmnet dns 需 要按一定的规则分组将这些虚拟 sbc 归属在同一个本地网下。如对于本地网 1 用户的 sbc 通用域名解析请求,返回 ip 地址 1-1 和 ip 地址 2-1,用户每次注册/呼叫优先使用 ip 地址 1-1 接入,ip 地址 1-1 不可用时,使用 ip 地址 2-1。 方式二:爱立信的 sbc 支持依据 ue 源地址段的不同配置多个 pani(p-access- network-info)和 phonecontext。sbc 需要配置所在本地网和备份本地网的的源 ip 地 址段信息。 方式三:上海贝尔 sbc 为分布式 sbc,其中信令面在省中心集中设置,媒体面 ims 网络容灾备份技术研究 cmdi 14 百度一下“知识水坝“ bgw 设置在各本地网。bgw 支持虚拟网关功能,如地市 1 的 bgw 上配置虚拟网关 vmg1-1 和 vmg1-2,地市 2 的 bgw 上配置虚拟网关 vmg2-1 和 vmg2-2,其中这些 虚拟网关可以按一定的规则分组注册在 p-cscf/sbc 信令面的同一个 realm(某地市) 下,如 vmg1-1 和 vmg2-1 注册在地市 1 下,vmg1-1 做为主用,vmg2-1 做为备用。 上述三种方式均能满足 sbc 异本地网容灾备份的需求,方式二的数据配置和维护 较复杂,cmnet 公网 ip 地址段信息的更新均要同步更新到 sbc。 5.3固定接入用户对固定接入用户对 sbc 的故障恢复机制的故障恢复机制 固定用户接入 ims 网络示意图如下: 5.3.1倒换机制倒换机制 下述以 ue 的主用 sbc 为 sbc1,备用 sbc 为 sbc2。 (1)对于已注册用户的倒换流程对于已注册用户的倒换流程 ue 已经在 sbc 上注册,并向 sbc1 发送各种请求。 sbc1 不响应,ue 发现 sbc1 掉线。 ue 向 sbc2 发送注册请求,完成在 sbc2 设备上的注册过程, ue 将后续所 有请求消息均发往 sbc2。 ue 将主叫请求消息均发往 sbc2。 因 ue 通过 sbc2 注册,所有被叫请求,均通过 sbc2 发往 ue。 (2)对于正发起注册用户的倒换流程对于正发起注册用户的倒换流程 ims 网络容灾备份技术研究 cmdi 15 百度一下“知识水坝“ sbc1 故障。 终端发起注册。 sbc1 不响应。 终端从 dns 返回的 sbc 列表中,选择其他 sbc2 地址。 终端向 sbc2 发送注册请求。 sbc2 将终端的请求转发给核心网,并将核心网的响应消息,转回给终端。完 成终端在 sbc2 的注册过程。 终端的后续主被叫消息,全部通过 sbc2 转发。 5.3.2倒回机制倒回机制 ue 发起呼叫请求时,从本地 ip 地址列表中选择第一个 ip,向该 sbc 发起呼叫请 求,sbc 向 ue 发送错误码 502,指示 ue 重新注册。 ue 重新发起初始注册时,从本地 ip 地址列表中选择第一个 ip,向该 sbc 发起重 新注册,如果该 sbc 已恢复正常,ue 就注册成功。从而实现 ue 倒回到主用 sbc, 后续由此 sbc 为这个 ue 提供服务。 5.3.3容灾效果分析容灾效果分析 (1)倒换时间倒换时间 已注册用户的倒换最大时间,由终端的注册刷新时间确定。注册刷新时间在核心 网配置,当 sbc 启用注册刷新过滤功能时,终端的注册刷新时间由 sbc 上配置的终端 注册刷新时间确定。 新注册用户不感知倒换过程,对业务、用户感知均无影响。 (2)倒换对业务的影响和用户感知倒换对业务的影响和用户感知 对于已注册用户,在终端发送重注册消息或发起主叫业务之前,被叫业务不能正常 提供。 用户做被叫时,被叫无法响应呼叫请求,主叫用户听不到回铃音,被叫用户不能接 到呼叫。 在用户发送重注册消息或发起主叫业务之后,因故障 sbc 不响应,用户向其他 sbc 发送新的注册请求,完成核心网注册过程,业务恢复正常。 因此被叫业务影响时间理论上最长为终端重注册刷新时间。 (3)倒回倒回 ims 网络容灾备份技术研究 cmdi 16 百度一下“知识水坝“ 倒回由终端发起,用户不感知,不影响业务。 倒回时间取决于 ue 重新初始注册或发起呼叫的时间。 5.4ps 域接入用户对域接入用户对 sbc 的故障恢复机制的故障恢复机制 在现有网络情况下,ps 域做为与其他接入网对等的网络接入 ims,ps 接入用户也 采用基于 sbc 域名解析的 dns 发现方式,因此相应故障恢复机制与固定接入用户相 同,具体见 5.3 节。 若未来对 ggsn 进行改造支持 sbc 发现机制和故障检测机制,可以采用基于 ggsn 的故障恢复机制。 5.4.1倒换机制倒换机制 (1)用户发起接入请求,ggsn/pdg-gw 返回 sbc 的地址列表。 (2)用户选择一个 sbc 注册。 (3)ggsn 监测 sbc 的状态,发现 sbc 故障,ggsn 通知 ue 有两种方式 方式一:ggsn 通过 pdp 上下文更新给用户发送一个新的 sbc 地址列表(将 故障 sbc 地址删除)。ue 收到消息后比对,自身注册的 sbc 是否在新列表中, 若不在列表中,则 ue 从新列表中选择一个 sbc 重新发起注册。 方式二:ggsn 向所有涉及故障 sbc 的 ue 发送 sbc 不可达消息。ue 收到消 息后,从列表中重新选择一个 sbc 发起注册。 5.4.2倒回机制倒回机制 ggsn 监测到 sbc 故障恢复,则在用户发起新接入请求时,在返回的 sbc 列表中 添加已恢复的 sbc ip 地址。 ims 网络容灾备份技术研究 cmdi 17 百度一下“知识水坝“ 5.4.3容灾效果分析容灾效果分析 (1)倒换时间倒换时间 已注册用户的倒换最大时间,取决于 ggsn 与 sbc 之间故障监测的定时器时长。 该时长为秒级,要远短于 5.3 节描述中基于用户重注册时长的倒换时间,容灾效果较优。 新注册用户不感知倒换过程,对业务、用户感知均无影响。 (2)倒换对业务的影响和用户感知倒换对业务的影响和用户感知 对于已注册用户,若用户在 ggsn 检测到 sbc 故障之前,被叫业务不能正常提供。 被叫业务影响时间理论上最长为 ggsn 与 sbc 之间故障监测的定时器时长。 (3)倒回倒回 用户不感知,不影响业务。 5.5对终端和其他网元的要求对终端和其他网元的要求 对终端的要求:对终端的要求: (1) 对于上海贝尔 sbc,由于采用分布式架构,且根据 ip 地址+端口号区分虚拟 sbc,因此要求终端支持 srv 查询。 (2) 为支持终端对主备用 sbc 的故障倒换,要求终端至少能存储 2 个 sbc ip 地址。 (3) 要求终端能多次尝试连接。 (4) 要求终端在重新注册或发起呼叫时,优选主用 sbc,以便主用 sbc 故障恢复 时能倒回主用 sbc。 (5) 为减少 sbc 倒换对用户业务的影响,未来可要求终端支持 sip option 检测来 快速检测 sbc 状态,以实现快速倒换倒回。 对对 cmnet dns 的要求:的要求: (1) 配置数据支持对 sbc 的容灾。 对终端注册刷新时间的建议对终端注册刷新时间的建议 终端注册刷新时间过小会影响核心网性能,过小又会影响业务体验,建议设置为 6003600 秒之间。 ims 网络容灾备份技术研究 cmdi 18 百度一下“知识水坝“ 对对 ggsn 的要求的要求 (1) 要求支持 sbc 发现 (2) 支持与 sbc 之间的故障监测机制 6p-cscf 容灾方案容灾方案 6.1p-cscf 负荷分担机制负荷分担机制 p-cscf 的负荷分担主要取决于 ue 注册时,sbc 对 p-cscf 的选择。sbc 对 p- cscf 的负荷分担选择有如下三种方式: (1)方式一:静态配置主备用方式一:静态配置主备用 p-cscf(同时支持配置主机名和(同时支持配置主机名和 ip 地址两种方式)。地址两种方式)。 sbc 可静态配置其中一个 p-cscf 为主用 p-cscf,其他 p-cscf 为备用 p-cscf,设 置优先级,正常情况下 sbc 选择主用 p-cscf,当链路检测发现主用 p-cscf 不可用时, 选择其他备用 p-cscf。 sbc 配置举例: ,优先级为 1; ,优先级为 2; 对 dns 无配置要求。 (2)方式二:基于方式二:基于 dns 的负荷分担。的负荷分担。 sbc 配置 p-cscf 的统一域名,如 pcscf.ims.省名缩写.,查询 dns,根据 dns 返回的 a 记录或 srv 记录实现对 p-cscf 的负荷分担。 sbc 配置举例: 对 dns 的配置要求:配置 p-cscf 统一域名及对应的权重。配置举例: srv 记录: _sip._ in srv 0 50 5060 _sip._ in srv 0 50 5060 a 记录: in a ip address 1 ims 网络容灾备份技术研究 cmdi 19 百度一下“知识水坝“ in a ip address 2 (3)方式三:方式三:sbc 配置多个配置多个 p-cscf 的主机名和静态权重,根据权重负荷分担选择的主机名和静态权重,根据权重负荷分担选择 p-cscf。 sbc 配置举例: ,权重 50; ,权重 50; 三种方式的比较如下: 优点优点缺点缺点 方式一实现简单。p-cscf的域名或ip地址变化时或新 建p-cscf时,需要修改sbc的本地 配置,运维相对麻烦。 sbc分区域接入p-cscf,可能会有 p-cscf负载不均衡的情况。 方式二可以实现全局p-cscf下的负荷分担,便 于优化网络流量 数据维护简单 方式三可完成简单的轮选。当p-cscf故障时, sbc可以选择其他p-cscf进行负荷分担。 p-cscf的域名或ip地址变化时或新 建p-cscf时,需要修改sbc的本地 配置,运维相对麻烦。 方式二的负荷分担效果较好,且数据维护简单,建议采用方式二。 6.2倒换机制倒换机制 sbc 依赖于和 p-cscf1 之间的保活机制(如 sip option 探测) ,检测到 p-cscf1 无响应,切换到 p-cscf2。 (1)对于正在发起注册用户的倒换流程对于正在发起注册用户的倒换流程 sbc 收到 ue 的注册请求,从 p-cscf 列表中选择第一个可用的 p-cscf,向该 p- cscf 发起注册请求,如果原 p-cscf 已宕机,就不会给 sbc 回响应消息,sbc 就从 p-cscf 地址列表中选择下一个 p-cscf,向新的 p-cscf 发起注册请求。从而实现 ue 倒换到新的可用 p-cscf,后续由此 p-cscf 为这个 ue 提供服务。原理图如下: ims 网络容灾备份技术研究 cmdi 20 百度一下“知识水坝“ sbc1 p-c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论