(计算机系统结构专业论文)voip语音模块软件的设计.pdf_第1页
(计算机系统结构专业论文)voip语音模块软件的设计.pdf_第2页
(计算机系统结构专业论文)voip语音模块软件的设计.pdf_第3页
(计算机系统结构专业论文)voip语音模块软件的设计.pdf_第4页
(计算机系统结构专业论文)voip语音模块软件的设计.pdf_第5页
已阅读5页,还剩78页未读 继续免费阅读

(计算机系统结构专业论文)voip语音模块软件的设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 “v o m 通信系统的硬件由语音模块和管理p c 组成。其中,语音模块是堆 叠了4 片i n f i n e o nv i n e t i c 2 c p ee d s p 语音处理芯片的v o i p 板卡,每个芯片支 持2 路电话通道,v o i p 板卡可支持8 路电话通道;管理p c 的主要功能是对多个 语音模块进行管理。v o i p 语音模块软件不但能实现管理p c 对语音模块的控制, 还能实现板卡内部以及板卡间的语音通信。 本文针对v o i p 语音模块的芯片内部、板卡内芯片问、板卡间和板卡与管理p c 间通信需求,提出了实现语音通信和控制功能的自定义通信协议,并以内核模块 方式在m o n t av i s t al i n u x 内核态下实现。通过修改m o n t av i s t al i n u x 内核源代码 及网卡驱动程序,提供基于网卡驱动程序底层切入的自定义系统调用;在内核模 块中定义回调函数,通过修改v i n e t i c 2 c p e 中断服务程序,在中断服务程序中 调用回调函数。从而,回调函数与自定义系统调用可以进行交互操作,实现了对 实时性要求高的摘挂机检测、拨号检测、语音数据处理等功能,提高了系统整体 性能。该方案已成功实施,相关研究成果已应用于具体工程实践。 关键词:可堆叠v o i p 板卡v o i p 语音模块v i n e t i c 2 c p e 回调函数 a b s t r a c t a b s t r a c t t h eh a r d w a r eo f ”v o i pc o m m u n i c a t i o ns y s t e m ”c o n s i s t so ft h ev o i c em o d u l ea n da m a n a g e m e n tp c t h ev o i c em o d u l ei sav 0 i pc a r d ,i nw h i c ha r es t a c k e df o u rb l o c k s i n f i n e o nv i n e t i c - 2 c p ee d s pv o i c ep r o c e s s i n gc h i p s e a c hv i n e t i c - 2 c p ec h i p s u p p o r t s2 - w a yt e l e p h o n ec h a n n e l s ,a n dt h ev o l pc a r dc a ns u p p o r t8 - w a yt e l e p h o n e c h a n n e l s t h em a i n 如n c t i o no ft h em a n a g e m e n tp ci sm a n a g i n gm u l t i p l ev o i c e m o d u l e s n es o f t w a r eo ft h ev o l pv o i c em o d u l ec a nr e a l i z et h a tt h em a n a g e m e n tp c c o n t r o l sv o i c em o d u l e s ,a l s oi m p l e m e n tv o i c ec o m m u n i c a t i o ni ni n t e r n a lc a r da n d b e t w e e nc a r d s t i l i st h e s i sa i m e da tt h ed e m a n do fc o m m u n i c a t i o nb e t w e e nt w ol i n e so fa ni n t e r n a l c h i p ,c h i p so fa l li n t e r n a lc a r d ,c a r d s ,m a n a g e m e n tp ca n dc a r d s ,b r i n g sf o r w a r dt h e s e l f - d e f i n e dc o m m t m i c a t i o n p r o t o c o l t h a t i m p l e m e n t s t h ef u n c t i o no fv o i c e c o m m u n i c a t i o na n dc o n t r o l l i n g 1 1 坨p r o t o c o li si m p l e m e n t e di nk e r n e lm o d u l eu n d e r m o n t av i s t al i n u xk e r n e lm o d e t h r o u g hm o d i f y i n gt h ek e r n e ls o u r c ec o d eo fm o n t a v i s t al i n u xa n dt h ed r i v e ro fn e t w o r kc a r d ,i tp r o v i d e ss y s t e mc a l lb a s e do nt h ed r i v e r o fn e t w o r k m e a n w h i l e ,c a l l b a c kf u n c t i o ni sd e f i n e di nk e r n e lm o d u l e a f t e rm o d i f y i n g i n t e r r u p ts e r v i c er o u t i n e ( s h o r tf o ri s r ) o fv i n e t i c - 2 c p e ,c a l l b a c kf u n c t i o ni sc a l l e d i ni s r t h e r e b y , c a l l b a c kf u n c t i o na n ds e l f - d e f i n e ds y s t e mc a l lc a nw o r ka l t e r n a t e l y , a n di m p l e m e n tt h ef u n c t i o no fd e t e c t i n go f f - h o o k ,d e t e c t i n gd i a l - u pa n dd i s p o s i n gv o i c e d a t a , w h i c hd e m a n d sr e a l - t i m es t r o n g l y i ti m p r o v e st h ep e r f o r m a n c eo fs y s t e m 1 1 1 e s p e c i a ls c h e m eh a sb e e ns u c c e s s f u l l yi m p l e m e n t e d a n dr e l e v a n tr e s e a r c hr e s u l t sh a v e b e e na p p l i e dt os p e c i f i ce n g i n e e r i n gp r a c t i c e k e y w o r d :s t a e k a b l ev o l pc a r d t h ev o l pv o i c em o d u l ev i n e t i c - 2 c p e c a l l b a c kf u n c t i o n 创新性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或 其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做 的任何贡献均已在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:,歹眩 日期点咝艮监 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕 业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。 学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全 部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密的论文 在解密后遵守此规定) 本人签名:乞重迄 日期塑墨:兰:丝 导师签名: 日期上丝堡兰孕 第一章绪论 第一章绪论 随着i n t e r n e t 的飞速发展,起源于i n t e r n e t 的v o m ( v o i c eo v e r 口) 也在蓬勃 的发展。v o i p 业务的出现大幅度降低了国际长途电话的费用,这是其迅猛发展的 原动力。目前,我国已有中国电信、联通、吉通、网通和中国移动等五家运营商 经营v o 口业务,市场规模不断扩大。 v o 口系统有四个基本组件:网关、终端设备、网守和管理服务器。而网关可 以实现p c t o p h o n e 、p h o n e - t o p c 、p h o n e - t o p h o n e 的通信,是v o i p 系统的核心 与关键设备。本课题将讨论基于可堆叠v o i p 板卡的语音通信模块的软件设计方 案。 1 1 论文背景和意义 v o i p 技术的迅速发展,相关的产品越来越受人们的青睐。这归功于i n t e m e t 发展和市场驱动。 v o i p 的诞生和发展与i n t e m e t 是密不可分的。早期的i n t e r n e t 的主要用于:电 子邮件( e m a i l ) 、远程登录( t e l n e t ) 、文件传输( f t p ) 、现场对话( i r c ) 以及 执行应用检索软件,如g o p h e r 、w a i s 、w w w 等工具。随着i n t e r n e t 的飞速发展 和多媒体技术应用的日益深入和普及,基于i n t e m e t 的多媒体通信已成为当前 i n t e m e t 发展的趋势之一。v 0 i p 是i n t e r n e t 多媒体通信的一个典型业务,也是i n t e m e t 的多媒体通信发展的必然产物。 市场利益的驱动也是i p 电话迅速发展的重要原因。公用交换电话网络( p u b l i c s w i t c h e dt e l e p h o n en e t w o r k ,简称p s t n ) 的语音传输质量和可靠性都没有任何 问题的。但是在p s t n 上打电话,尤其是打国际长途的电话,其费用极高。1 9 9 6 年v o i p 公司开始开发一种称之为网关( g a t e w a y ) 的产品。网关的问世,实现了 w o i p 在p s t n 和i n t e r n e t 之问的互通。这种以p s t n 作为本地用户接入,通过在 i n t e m e t 上传输的方式大大节省了通信线路的成本。成本的降低导致v o i p 资费的 降低,可见v 0 i p 市场潜力巨大。 v o i p 产品在经历了软件时代、硬件接入盒时代之后,现在已步入了硬件网关 时代。v o l p 的关键设备是网关。v o i p 网关在p s t n 和i n t e m e t 之间架起了一座桥 梁,把i p 电话的优越性带给世界上最通用、最便宜、流动性最强、操作最简单的 终端标准电话机。现在的设备厂商多数是通过多个v o l p 网关来实现p s t n 和 i n t e r n e t 互通,从而实现呼叫,并且语音质量也大大改善,能够满足商用的需求。 2 v o l p 语音模块软件的设计 1 2 论文工作 v 0 m 板卡和网守是v o l p 系统中2 个基本组件。v o i p 板卡是采用了分层模块 化结构。可以将其分为硬件层、软件模块层、维护管理层和控制接口层等4 部分。 软件模块层有包括语音信号处理、p s t n 呼叫控制、m 呼叫管理、i p 呼叫控制、 数据传输、d s p 管理软件包等。其中,语音信号处理包含了语音编辑器、回声抵 消( e c h oc a n c e l l e r s ) 和d t m f ( d u a l t o n em u l t if r e q u e n c y ) 检测等。根据分层结构, v o i p 板卡应具备以下基本功能:号码查询、建立通信连接、信号调制、信号解调、 信号压缩、信号解压、路由寻址、信令转换等。网守在本身所管辖的“区域”内, 管理所有的v o 口板卡;并对v 0 m 板卡发来的查询,以适当的v o l p 板卡的m 地 址回答。 本课题采用的是语音模块和管理p c 组成的v o l p 硬件系统。该语音模块的硬 件以i n f i n e o na d m 5 12 0 p 为微处理器和i n f i n e o nv i n e t i c - 2 c p ee d s p 为语音处 理芯片可堆叠v o i p 板卡。该板卡的操作系统选用了高实时性的m o n t a v i s t a l i n u x , 嵌入式技术和l i n u x 操作系统保证了该系统的简便、灵活和可靠。管理p c 的功 能相当于网守,对辖区内的所有v 0 口板卡进行管理。 本文将结合项目中所做的工作详细地介绍,可堆叠v o m 语音模块的硬件、软 件设计;把u b o o t 移植到v o i p 板卡;自定义的板卡间、板卡与管理p c 问的通 信协议;利用该协议设计出了3 套语音通信方案并如何付诸实施。全文重点分析 和设计了这3 种语音通信方案,通过观察效果,找出了一种效率较高的软件实现 方案采用回调函数的自定义内核模块。这种方案的高效性主要体现在对用户 的一些关键操作能及时的响应和处理,如用户摘挂机、拨号以及对语音数据的处 理。这进一步提高v o l p 的服务质量。 1 3 论文结构 本文的结构安排为: 第一章为绪论,主要是本文涉及的技术背景、发展现状、自己的相关项目研 究内容和研究意义 第二章先介绍v o l p 的基本原理和系统组成。随后,又对语音编码压缩、信令、 质量保证( q u a l i t yo f s e r v i c e ,简称q o s ) 和实时传输等v o l p 的关键技术阐述。 第三章介绍了v o l p 语音模块的整体设计方案,描述了v 0 口板卡的硬件设计 以及为实现可堆叠v o l p 语音模块而做的改进。详细介绍了可堆叠v o l p 语音模块 的v i n e t i c 2 c p e 芯片的驱动程序设计及改进,包括底层驱动软件分析、中断服 务程序分析、为支持多芯片堆叠而对驱动程序做的改进。 第四章详细的分析u b o o t 结构和启动过程,介绍了移植u b o o t 程序到本课 第一章绪论 3 题中v o 口板卡需要修改的关键地方。 第五章先介绍了语音通信流程。然后,利用自定义的通信协议,设计出3 套 语音通信方案:方案l 是在用户态下的应用程序中以查询的方式实现,方案2 是 在用户态下的应用程序中以信号的方式实现,方案3 是在内核态下以模块的形式 实现。这些方案都成功地实施了。通过对它们的效果进行观测,方案3 的效果最 好。最后,介绍自定义内核模块的实现、系统的初始化、模块的加载等内容。 4 v 0 口语音模块软件的设计 第二章v o i p 技术概述 本章主要先介绍v o i p 的基本原理和系统组成。随后又对语音编码压缩、信令、 q o s 和实时传输等v o i p 的关键技术进行了阐述。 2 1v o i p 的基本原理 传统的电话n ( p s t n ) 是以电路交换方式来传输语音的,即每一次通话过程 中,主叫方和被叫方一直占据着一条通话线路,直到通话结束,其中一方挂机, 才释放所占用的线路供其他人使用。这种通话方式的语音质量很好,但造成了线 路资源的极大浪费,是不经济的。 v o i p 电话的基本原理是通过语音压缩算法对语音信号进行压缩编码处理,然 后把这些语音数据按i p 标准进行打包,经过网络把数据包发送到接收端【l 】;接收 端把这些语音数据包串起来,经过解码、解压缩处理将其恢复成原来的语音信号, 从而达到由i n t e r n e t 传送语音的目的【2 1 。 v o i p 方面对数字化的话音数据进行了压缩,可以将一路话音数据压缩为 8 k b i t s 或更低,从而大致估算可以使原来只能传输一路话音的6 4 k b i t s 线路可以 传输8 路电话或更多;另一方面,v o i p 采用的是分组交换方式,区别于原来的电 路交换方式,它不是用户独占一条线路资源,而是多用户共享线路资源,从而进 一步提高了线路的利用率p j 。 v o i p 是以分组交换网络为传输平台,对模拟的语音信号进行压缩、打包 等一系列的特殊处理,使之可以采用无连接的传输协议进行传输。最简单形式的 网络由两个语音网关组成,这两个语音网关通过一个i p 网络连接。语音网关设备 的功能是起到一个桥接作用。通话发起方的语音网关把语音信号转换成为i p 数据 流,通过i p 网络把这些数据流传输到被叫方的语音网关,接着被叫方语音网关把 这些数据流转换回语音信号p j 。因此可以简单地将v o i p 的传输过程分为下列5 个阶段。整个过程可以通过图2 1 表示。 用 广l a 用 户 b 图2 1v o i p 的基本传输流程f 3 j 1 模数转换 语音信号是模拟信号,而i p 网络能传送的是数字信号,所以首先要对语音信 第二章v 0 i p 技术概述 5 号进行模数转换,也就是对模拟语音信号进行p c m 编码,编码后把码流送到缓 冲存储区中。许多低比特的编码器是以帧为单位进行编码的,典型帧长为 1 0 m s 一3 0 m s 。考虑到传输过程中的代价,语音包通常由6 0 m s ,1 2 0 m s 或2 4 0 m s 的 语音数据组成。数字化可以使用各种语音编码方案来实现,目前采用的语音编码 标准主要有i t u - t 定义的g 7 1 1 ,g 7 2 9 ,g 7 2 3 1 等。源和目的地的语音编码器必 须实现相同的算法,这样目的地的语音设备才可以还原出语音信号。 2 数据到m 包的转换 一旦语音信号进行数字编码,下一步就是对语音包以特定的帧长进行压缩编 码。大部分的编码器都有特定的帧长,若一个编码器使用1 5 m s 的帧,则把一个 6 0 m s 的包分成4 帧,并按顺序进行编码。每个帧含1 2 0 个语音样点( 抽样频率为 8 k h z ) 。编码后,将4 个压缩的帧合成一个压缩的语音包进入网络处理器。网络处 理器为语音包添加p 包头、级别和其它信息后通过m 网络传送到另一个端点。 i p 网络不像电路交换网络,它不形成连接,它要求把数据放在可变长度的数据包 中,然后给每个数据包附带寻址和控制信息,通过网络发送,一站一站地转发到 目的地。 3 数据传送 我们不关心中间的网络是以何种形式存在的网络,它可以是支持i p 数据流的 任何拓扑结构。把整个网络看成是一个数据通道,在通道的一边输入语音数据包, 然后从通道的另一边输出语音数据包。既然是通道数据传送,必然存在传送时间 t ,同时这个t 也就是网络传输中的抖动时间,它将对话音产生不良的影响,所以 t 应该控制在某一范围内变化。 4 i p 包到数据的转换 目的地v o i p 设备接收到i p 语音包后,在网络层提供一个可变长度的缓冲器, 用来调节网络产生的抖动。该缓冲器可以包容许多语音包,具体的大小可以由用 户调节。解码器将接收的压缩语音包解压,在进行分帧后送入解码缓冲器。在这 个处理过程中,主要进行包的拆分,去掉i p 包头,保留原始的语音信息,然后把 语音数据提供给语音解码器。 5 数模转换 语音解码器将输入的p c m 数据转换成模拟信号,接上电话机或者扬声器就 可以听到声音。简而言之,语音信号要在i p 网络上传送,要经过模数转换、数字 语音封装成i p 包、i p 网络传送、i p 包的分解和数模转换过程【4 】【5 】。 2 2v o i p 系统的组成 目l j ,v o l p 系统有四种实现方式:p c t o p c 、p c t o p h o n e 、p h o n e t o p c 以 v o i p 语音模块软件的设计 及p h o n 争t o - p h o n e ,它们间的主要区别是用户所使用的终端不同以及网关所提供 的功能不同【”。v o l p 电话系统的基本组成如图2 2 所示。v o i p 系统一般由终端设 备( t e r m i n a l ) 、网关、多点控制单元o d c u ,m u l t i p l e c o n t r o l u n i t ) 和网守( g a t c k c c p 盯) 等几部分组成。下面对这些组件介绍。 庸掣 謦 幽22v 0 i p l u 鬲系皱的基本自【成 1 终端 终端设备是v o l p 系统的组成部分,也是直接和用户接触的产品。终端可以是 软件( 如v o c a l t c c 公司的i fp h o n e 、m i c r o s o f t 公司的n e t m t i n g ) 或是硬件( 如 专用的i n t e m e tp h o n e ) ,也可以是直接连在口网上进行实时的语音通信或多媒体 通信。电话是最常见的终端设备,它通过p s t n 网接入i p 电话系统。它的功能比 较简单,主要是在发送端将人的声音信号转换成电信号或在接收端将电信号还 原成声音信号。电话的种类很多,基本上可分为模拟固定电话、数字固定电话、 模拟移动电话和数字移动电话。 2 网荚 网关能在传输格式( t t a n s m i s s i o nf o r m a t s ) 和通讯程序( c o m m u n i c a t i o n s p r o c e d u r e s ) 之间提供适当的转换功能”】。| 嘲关是把v o i p 带入通信主流的关键设 备,它在传统的电话变换网络和i n t e m e t 之间架了一座桥梁嗍。网关作为v o i p 的关键设备,跨接在电路交换网和i p 数据网之间,完成p s t n i s d n 侧与i p 网侧 的呼叫建立,实现传统p c m 语音与l p 数掘包之侧的转换”“。用广的话音经过 p s t n 传送到网关,网关对其进行压缩、分组和一些保证质量的处理,将i p 语音 分组发送到i p 上进行传送,到达对方所在地的网关后,对话音分组进行相反的处 理,形成话音信号经过p s t n 传输到对方的电话机。 每个语音喇关被赋予一个i p 地址其工作流程大致是这样的。当一个电话机 发出“呼出”呼叫信号时,这个信号从用户电话旋出,并通过用户交换机传送。“呼 出”呼叫信号进入网关后,根据进八的数字( 号码) ,i p 网关进行呼叫殴置。i p 的 电哺数据库将目的地号码“映射”成远端i p 刚关的i p 地址,i p 嘲关j 远端网关之 第二章v o 口技术概述 7 间建立通话信道。然后,网关就给这个呼叫分配网络带宽,这样电话就接通了。 在谈话过程中,语音信号经数字化并压缩成数据包,称为数据包。数据包被封装 成为口包。口包从网关出发,到达路由器。如果路由器支持协议r s v p t l 2 】( 资源 预留协议) 或者其它优先权协议,路由器将这些包作为优先顺序的i p 流量处理并 将这些包送到广域网。i p 网关管理上述过程的所有环节。如果电话终止了,口网 关自动回收分配的带宽,并将上述呼叫记载于用户记录中,并准备下一次呼叫。 通过上面对网关的工作流程介绍,我们不难发现网关应具备以下基本功能: 语音分组和号码查询,建立通信连接,信号调制,路由寻址,信令转换。 3 网守 v o 口网关必须根据输入的对方电话号码来决定应该往哪里发送口分组,也 就是通过被叫号码来确定对方的v o i p 网关。确定对方v o 口网关的实现方法随不 同的产品而有所不同。网关又相当于一个智能集线器,把各个网关智能的集合在 一起,进行统一管理、维护、配置和开发。一些被同一个网守所管理的终端、m c u 称为“区域”。简单来说,区域就是一个网守所控制的域。 网守提供四种主要服务:呼叫控制、地址翻译、呼叫授权和带宽管理。如果 网络上存在一个网守,那么每个网关、m c u 和终端都必须而且只能在一个网守 上注册,然后这些实体再与网守通信。网守在任何时候都知道本区域内端点的状 态信息。通常来讲,网守的内部端点数据库保存了一些动态或静态信息,如别名、 i p 地址、访问权限和当前带宽的使用情况等。网守核心包含一些基本的内建策略 来决定如何注册和呼叫,如区域内最多允许的呼叫、区域内能使用的最多带宽以 及每个终端可使用的带宽等。另外,还有一些信息,如计费信息,必须存储在外 部数据库中。其它一些有关处理注册和呼叫的高级策略需要由第三方提供。 4 m c u m c u 的功能在于利用i p 网络实现多点通信,使得i p 电话能够支持诸如网络 会议这样的多点应用。打个比方,有点像一个交换机,其主要作用是对系统中的 视频声音数据等进行收发中转。传统硬件中的网络会议,两个点是不需要m c u 的,可以直接点对点呼叫,三个点以上才需要m c u ,实现多方连接。在软件网 络会议系统里面,一般将m c u 叫视频服务器,实际上其功能大同小异,针对多 点问的视频声音数据进行收发中转,另外可能会支持一些i m ( 实时通讯,i n s t a n t m e s s a g i n g ,像q q m s n 等工具) 等其它一些应用。 除了上述四个基本组件外,i p 电话系统还包括记账服务器、网管服务器等其 它组件。 记账服务器利用网守提供的标准、开放的数据接口,将每一次呼叫产生的详 细记录上传到本地数据库,形成计费数据1 7 j 。 管理服务器是为网络管理人员提供的管理工具,可以实现对i p 电话网络体 v o i p 语音模块软件的设计 系中各种组件的管理。管理服务器提供良好的用户界面,使网管人员可以方便地 控制所有的系统组件,包括网关、网守等。管理服务器的功能包括,设备的控制 及配置、数据配给、拨号方案管理及负载均衡、远程监控等【1 3 1 。 2 3 语音编码压缩技术 语音信号的数字化传输一直是通信发展的主要方向之一,语音数字通信与模 拟通信相比,无疑具有更好的效率和性能,主要体现在:具有更好的语音质量; 具有更强的抗干扰性;可节省带宽,能够有效地利用网络资源;更加易于存储和 处理。最简单的数字化方法就是直接对语音信号进行模数转换。只要满足一定的 采样率和量化要求,就能够得到高质量的数字语音。但这时得到的语音数据量较 大,不宣传输和存储。语音编码的目的就是要在保证语音音质和可懂的条件下, 采用尽可能少的比特数来表示语音。 从采样的编码方法角度可以分为:波形编码、参数编码和混合编码。 ,波形编码是根据语音数据的波形导出相应的数字编码形式,其目的是尽量保 持波形不变,使接收端能够忠实地再现原始语音。波形编码具有抗噪性能、语音 质量好等优点,但有较高的误码率,一般为1 6 k b p s - - - - 6 4 k b p s t 们。参数编码是根据 人的发声机理,以语音信号所产生的数学模型为基础,根据输入语音信号分析出 模型参数( 主要是指表征声门振动的激励参数和表征声道特性的声道参数) ,然后 在解码端,根据这些模型参数代码进行语音合成。参数编码主要是从听觉感知的 角度注重语音重现,而不能保证其波形相同。混合编码将这两者有机的结合,同 时从两方面构造语音编码,音质比较好。 i t u t (i n t e r n a t i o n a lt e l e c o m m u n i c a t i o nu n i o nt e l e c o m m u n i c a t i o n s t a n d a r d i z a t i o ns e c t o r ) 公布了g 系列中的一些语音编码协议标准,采用波形基编 码的方式主要有g 7 1 1 ,g 7 2 1 ,g 7 2 2 ,g 7 2 3 ,g 7 2 6 ,g 7 2 7 ,采用参数基编码方 式的主要有g 7 2 8 , g 7 2 9 , g 7 2 9 a ,g 7 2 3 1 。这些协议采用不同的算法,具有 不同的速率。 电话的语音质量要求每个语音通道的比特率为6 4 k b s 。代码转换器 ( t r a n s e o d e r ) 使用了语音压缩编码器,将采样的6 4 k b s 话音( p c m 编码) 压缩 至8 k b s 甚至更小。它也使用解码器将压缩语音还原成6 4 k b s 。代码转换器的使 用减少了网络拥塞,一个6 4 k b s 线路能传输8 路或更多科d j 。 目前,话音和图像压缩技术发展十分迅速,已经研究开发出很多高效率的压 缩编码技术。如先进的以码本激励线性预澳l j ( c o d ee x c i t e dl i n e a rp r e d i c t i o n ,简称 c e l p ) 原理为基础的g 7 2 9 、g 7 2 3 、( g 7 2 3 1 ) 话音压缩编码技术。以g 7 2 9 为例, 它可将经过采样的6 4 k b s 话音以几乎不失真的质量压缩至8 k b s 。语音压缩编码 第二章v o i p 技术概述 9 技术是m 电话技术的一个重要组成部分。在话音编码方面,近年来的研究得出 g 7 2 9 是一种很好的算法。g 7 2 9 原来是8 k b s 的话音编码标准,现在经进一步的 研究和实践将其工作范围扩展至6 4 - - 1 1 8 k b s ,话音质量也在此范围内有一定的 变化,但即使是6 4 k b s ,话音质量也还不错,因而很适合在v o m 系统中使用。 g 7 2 3 1 采用5 3 6 4 k b s 双速率话音编码【1 6 1 ,其话音质量好,但是处理时延较大, 它是目前已标准化的最低速率的话音编码算法。在目前接入网速度普遍较低的情 况下,g 7 2 3 1 话音编码也大量运用于h 3 2 3 会议系统中【i 。 2 4v o l p 的控制信令技术 i p 电话是利用i n t e r n e t 网络传递语音业务,即在分组交换网上通过i p 协议实 现传统的电话应用。目前涉及v 0 i p 技术的主要协议如图2 3 所示。 ( i - i 2 5 1 m p e g ) 宁一甲中f 八 tcp)( u d p ) 上上, 。 i p v 4 ,i p v 6 丰中中 , 葛高o( a t m )( e t h e m e t ) ( v 3 4 一 图2 3v o m 电话系统的基本组成【7 1 媒体的传输技术保证了话音的传输,而控制信令技术保证电话呼叫的顺利实 现和话音质量,并且可以实现各种高级的电话业务。目前被广泛接受的v o l p 控制 信令体系包括i t u 的h 3 2 3 系列和i e t f ( i n t e r n e te n g i n e e rt a s kf o r c e ,因特网工 程业务组) 的会话初始化协议s i p ( s e s s i o ni n i t i a t i o np r o t o c 0 1 ) 。下面将对这两种协议 介绍。 2 4 1 基于h 3 2 3 协议的v o i p 信令技术 h 3 2 3 是个被用作配置v o i p 网络并为终端用户提供增值( v a l u e d a d d e d ) 服 务协议族【1 8 】。1 9 9 6 年i t u t 通过了h 3 2 3 协议,即局域网上支持可视电话通信的 网络协议。该协议的推出,极大的推动了v o l p 的发展,使之有可能而且已经进入 了公用电话网服务,h 3 2 3 协议已成为v o l p 的公共规范,也成为各厂商设备互通 的技术依据【1 7 1 。h 3 2 3 协议当前在我国国内使用最为普遍,也最为成熟。在h 3 2 3 l o v 0 口语音模块软件的设计 系统中定义了一个关键设备就是网关。按h 3 2 3 系统的规定,网关的主要功能是 负责p s t n 与m 网络的桥梁,实现两个不同的网络系统的信令和语音格式的转换 【l 刎。下面我们将对h 3 2 3 协议族进行介绍。 h 3 2 3 协议栈如图2 4 所示,其中下面三层是低层协议。在口网络中,网络 层就是m 层;传输层包括可靠传输协议( 如t c p t 2 0 】) 和不可靠传输协议( 如 u d p t 2 1 】) ;语音编码采用g 系列建议,视频编码采用h 2 6 0 系列建议,这些媒体 编码信号封装在r 1 r p 协议中,r t c p 提供q o s 监视功能,是r t p 协议的一部分。 会议控制和 数据呼叫信令音频视频 t 1 2 6t 1 2 7 g 7 1 l 木 h 2 4 5 幸 g 7 2 2 t 3 2 4 g 7 2 8 h 2 6 1 h 2 2 5 o g 7 2 3 1 h 2 6 3 t 1 2 4t 1 2 5 g 7 2 9 a r a s t 1 2 3r t c p 幸r t p t c pu d p 网络层( i p ) 链路层 物理层 图2 4h 3 2 3 协议栈【2 2 】【2 3 1 h 3 2 3 系列建议定义了在无业务质量保证的因特网或其它分组网络p b n ( p a c k e tb a s e dn e t w o r k s ) 上多媒体通信的协议及其规程。h 3 2 3 提供设备之间、高 层应用之间和提供商之间的互操作性。它不依赖于网络结构,独立于操作系统和 硬件平台,支持多点功能、组播和带宽管理。h 3 2 3 建议的多媒体会议系统中的 信息流包括音频、视频、数据和控制信息。h 3 2 3 若和其它的i p 技术( 如i e t f 的 r s v p ) 相结合,就可以实现i p 网络的多媒体通信。 图2 4 所示h 3 2 3 是i t u 的一个标准协议栈,其中奉为必选件。下面介绍它所 包含的各个功能单元。 ( 1 ) 系统控制。整个系统的控制是由h 2 4 5 t 2 4 1 ( 多媒体通信控制协议) 控制信 道、h 2 5 5 0 呼叫信令信道以及r a s 信道提供。系统控制功能是h 3 2 3 终端的核 心,它提供了控制h 3 2 3 终端进行正确操作的信令。 ( 2 ) 分组与同步。h 2 2 5 0 标准描述了无q o s 保证的l a n 上媒体流的打包 分组与同步传输机制。h 2 2 5 0 对传输的视频、音频、数据与控制流进行格式化, 以便输出到网络接口,同时从网络接口输入报文中补偿接收到的视频、音频、数 据与控制流。另外,它还完成逻辑帧、顺序编号、纠错与检错功能。 ( 3 ) 音频编解码器标准。音频编解码器对从麦克风输入的音频信息进行编码 第二章v o i p 技术概述 传输,在接收端进行解码以便输出到扬声器。音频信号包含了数字化且压缩的语 音。h 3 2 3 支持的压缩算法符合u 标准。为进行语音压缩,h 3 2 3 终端必须支 持g 7 1l 语音标准,传送和接收a 律和p 律。其它音频编解码器标准如g 7 2 2 、 g 7 2 3 1 、g 7 2 9 a 、m p e g 1 音频则可选择支持。编码器使用的音频算法必须由 h 2 4 5 来确定。h 3 2 3 终端应能对本身所具有的音频编解码能力进行非对称操作, 如以g 7 1 1 发送,以g 7 2 8 接收。 ( 4 ) 视频编解码器标准。视频编解码器在视频源处将视频信息进行编码传输, 在接收端进行解码显示。虽然视频功能可选,但任何具有视频功能的h 3 2 3 终端 必须支持h 2 6 1q c i f 格式、支持h 2 6 1 的其它格式以及可选择支持h 2 6 3 标准。 在分组网络上,使用h 2 6 1 、h 2 6 3 编解码器无需b c h 纠错和纠错帧。 ( 5 ) 数据会议标准。数据会议t 1 2 0 是可选功能。支持数据会议时,数据会 议可实现协同工作,如白板、应用共享、文件传输、静态图像传输、数据库访问、 音频图像会议等。通过h 2 4 5 处理后也可使用其它的数据应用和协议【2 2 】【2 5 】。 大多数h 3 2 3 实现都使用高可靠性的t c p 作为信令传输机制,而使用实时性 较高的u d p 传输语音和视频数据。 2 4 2 基于s i p 协议的v o i p 信令技术 最初,s i p 协议由i e t f 提出的在i p 网络上进行多媒体通信的控制协议,可 用于创建、修改和终止多媒体会话与呼叫【2 6 1 。基于s i p 的v o l p 系统所采用的协 议栈结构如图2 5 所示。 应用层 传输层 网络层 链路层 物理层 媒体 图2 5s i p 协议栈2 7 1 i e t f 坚持采用分层的方法来创建服务,s i p 作为应用层上的一个控制( 信令) 协议,用来建立、修改和终止有多个参与者参加的多媒体会话进程,参与会话的 成员可以通过组播( m u l t i c a s t ) 、单播( u n i c a s t ) 或者两者结合的方式进行通信。s i p 1 2 v o m 语音模块软件的设计 可以用于邀请新的成员加入一个已经存在的会话,也可以用于创建一个全新的会 话。作为s i p 的核心思想之一,它可以用于明确地邀请某一个成员加入或者创建 会话,这一点相对多播、s a p ( 会议通告协议) 等是一个很大的进步。通信双方可以 共同协商使用的媒体参数( 比如是否支持视频) 。s i p 独立于它所处理的多媒体会话 类型和描述会话所使用的机制,能够用一个可扩展的体系结构应用于视频会议、 语音通话、共享白板、游戏会话、应用共享、桌面共享、文件传输等各种情况。 一般情况下,s i p 协议使用r t p 协议传送音频和视频流,使用s d p 协议进行媒体 描述。s i p 通过这样的机制来实现其扩展性:通信双方或多方使用s d p 进行音、 视频的会议描述,如果通信的双方希望在建立的s i p 框架上进行一个游戏会话, 那么只需要使用一个适用于描述游戏会话的协议来取代s d p 协议。使用s i p 协议 可以进行会话的管理,包括发起和终止会话、修改会话参数、调用服务、引入其 他用户、设置转移呼叫、呼叫保持等。s i p 的可扩展性还表现在它可以通过定义 新的消息头( h e a d e r ) 和方法( m e t h o d ) 来增加新的功能,这一点应用在大部分增加新 功能的s i p 扩展r f c 中【2 8 】。 s i p 是一个独立于现行包协议( t c p 、u d p ) 的应用层协议。与h 3 2 3 不同的 是:s i p 是一种基于文本的协议,用s i p 全球资源统一定位符( s i pu n i f o r mr e s o u r c e l o c a t o r s ) 描述,这样易于实现和调试,更重要的是灵活性和扩展性好 2 9 1 。s i p 的 u r l ( u n i f o r mr e s o u r c el o c a t o r ,网页在全球互联网上独一无二的定位点) 甚至可 以嵌入到w e b 页或其它超文本链路中,用户只需用鼠标一点即可发出一个呼叫。 s i p 地址的u r l 形式:用户 主机。用户:姓名,电话,数字。主机:域,数字 式的网络地址( i p ) 。 下面介绍下会话初始协议组件。s i p 系统包括两部分:用户代理和网络服务 器。 用户代理( u s e r a g e n t ,简称u a ) 是形成和接收s i p 呼叫的s i p 的终端。它 的客户机被叫做用户代理客户机( u s e r a g e n tc l i e n t ,简称u a c ) ,它被用来发起 s i p 请求;它为发起请求域的头部插入它的身份认证【3 1 1 。服务器被叫做用户代理 服务器( u s e ra g e n ts e v e r ,简称u a s ) ,它接收从u a c 来的请求并给用户返送 响应。 s i p 系统有4 种类型的网络服务器:代理服务器( p r o x ys e r v e r ) ,重定向服务 器( r e d i r e c t o rs e r v e r ) ,注册服务器( r e g i s t e r ) 和位置服务器( l o c a t i o ns e r v e r ) 。 代理服务器决定请求应该转发给哪一台服务器,并随之转发该请求。实际上, 在到达目的地之前,请求会经过许多服务器。然后,沿着相反的方向传输。代理 服务器既可以做服务器又可以做客户机,既可以发送请求也可以响应请求。 重定向服务器不像代理服务器,他不给其它服务器转发请求;相反,它通知 实际目的地的呼叫方。 第二章v o m 技术概述 注册服务器,主要是接收客户机的注册请求,完成用户地址注册。它应该支 持用户鉴别权。注册服务器一般配置在代理服务器和重定向服务器之中,并且一 般都配有位置服务器的功能。 位置服务器可以不使用s i p 协议,其它s i p 服务器可以通过任何非s i p 协议 ( 如s q l 、l d a p 和c o r b a 等) 来连接位置服务器。位置服务器的主要功能是 提供位置查询服务,主要是由代理服务器或重定向服务器来查询被叫可能的地址 信息。 2 4 3s i p 协议与h 3 2 3 协议的比较 在v o m 技术中,s i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论