(电工理论与新技术专业论文)voip上回声消除算法的研究.pdf_第1页
(电工理论与新技术专业论文)voip上回声消除算法的研究.pdf_第2页
(电工理论与新技术专业论文)voip上回声消除算法的研究.pdf_第3页
(电工理论与新技术专业论文)voip上回声消除算法的研究.pdf_第4页
(电工理论与新技术专业论文)voip上回声消除算法的研究.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(电工理论与新技术专业论文)voip上回声消除算法的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东北大学硕士学位论文 a b s l r a c t t h er e s e a r c ho fe c h o c a n c e l l e d a l g o r i t h mo nv o i p a b s t r a c t a tt h ee n do f t w e n t yc e n t u r y , a l o n gw i t ht h ec o n t i n u o u s l yr a p i dd e v e l o p m e n to fi n t e m e t , t h et r a d i t i o n a lp s t nn e t w o r ki su n d e rt h eh u g ei m p a c t , t h es p e e c hd a t at r a n s f e r st h r o u g ht h e i n t e r a c tt r a n s m i ti n t ot h er e a l i t y , i n e x p e n s i v ei pp h o n eb r i n g su pt h ec h a l l e n g et ot h ep s t n n e t w o r k t h u s ,t h e r ea p p e a r sal l e ws p e e c hd a t ac o m m u n i c a t i o nm e t h o d :v o l p ( v o i c eo v e r i p ) h o w e v e r , b e c a u s eo fc o m p r e s s i o na n de n c r y p td e l a y , t r a n s f e rd e l a yb e c o m e sl o n g e r , s o t h ee c h op a t hc h a n g e sl o n g e ra n dt h ec o r r e s p o n d e n c eq u a l i t yo fs p e e c hs i g n do b v i o u s l yd r o p s , e v e ns e r i o u s l yw h i c hc a l lc a u s e sb o t hs i d e su n a b l et ok e e pu pt a l k i n g ,t h e r e f o r ew es h o u l da d d ae c h o c a n c e l e ra tt h et e r m i n a lo f v b i p s ot h i sa r t i c l em a k e ss o m er e s e a r c ho ne c h o c a n c e l l e d a l g o r i t h mo nv o l e t h em a j o rm e t h o do fe c h o - c a n c e li st h a t :u s i n ga na d a p t i v ef i l t e rt oi m i t a t et h e e c h o - p a t h ,s ow ec a ng e tt h ee s t i m a t ee c h o ,t h e nm i n u st h ee c h of r o mt h ep r o x i m a l - e n ds o u n d s i g n a lt oc a n c e lt h ee c h o t h ea d a p t i v ef i l t e rt r a c k se c h ow a y sp r o c e s si st h ep r o c e s sw h i c h t h ea d a p t i v ef i l t e r sc o e f f i c i e n tu p d a t i n g 1 h em e t h o dw h i c ht h ec o e f f i c i e n tu p d a t i n gm a i n l y h a st h el m sa l g o r i t h m ,t h en l m sa l g o r i t h m ,t h er l sa l g o r i t h ma n ds oo n t h i sa r t i c l ec o m p a r e st h e s ea l g o r i t h m s p e r f o r m a n c ea n da p p l i e do c c a s i o n b e c a u s e v o i ph a sal o n g p a t he c h o ,s oi tn e e d saf i l t e rw i t hh i g hs t e p ,w h i c hm e a n sw es h o u l dc h o o s e a l la l g o r i t h mw i t hl o w e rc o m p u t a t i o nm a g n i t u d e t h e r e f o r et h i sd e s i g nc h o o s e st h el m s a l g o r i t h m ,t h i sa l g o r i t h m sm e r i ti st h ec o m p u t a t i o nm a g n i t u d ei sl o w , b u tt h es p e e do f c o n v e r g e n c ei ss l o w t h e nt h ea u t h o rc a r r i e so nt h es i m u l a t i o nu n d e rt h em a t l a bp l a t f o r m t ot h i s a l g o r i t h m ,a p p r a i s e st h ee c h o c a n c e l e r l sp e r f o r m a n c ew h i c hi su s i n gt h el m s a l g o r i t h m :i n c l u d i n gt h em s e ( m e a ns q u a r ee r r o r ) a n de r l e ( e c h or e t u r nl o s se n h a n c e m e n t ) t h e nw er e a c hac o n c l u s i o nt h a t :t h em e a ns q u a r ee r r o rc a na c h i e v e10 3 0o r d e ro f m a g n i t u d e ,t h ee c h or e t u r nl o s se n h a n c e m e n tc a nr e a c h3 0 d b t h e s et w op e r f o r m a n c e sa c h i e v e t h ec r i t e r i o no f g l 6 8 g 1 6 5 t h e nt h ea u t h o rr e a l i z e st h ee c h o c a n c e l e ri nt h ev o i pt e r m i n a l ,a c h i e v e st h er e a l - t i m e c a n c e ll o n gt i m ed e l a ye c h oe f f e c ta f t e rt h ec o n f i r m a t i o n t h em a i np r o c e s s o ro fv o l p t e r m i n a li st h ed u a l c o r ep r o c e s s o ro m a p 5 9 1 0w h i c hi sd e s i g n e df o r2 5 g 3 gr e m o t i o n c o m m u n i c a t i o nb yt ic o m p a n y i th a sa na r m 9c o r ea n dad s p5 5 xc o r e ,t h ea r m 9c o r ei s i i i 东北大学硕士学位论文 a b s t r a c t u s e df o rt h ew h o l ea t t e m p e ra n de t h e m e tc o m m u n i c a t i o n ,t h ed s p c o r ei su s e df o rg a t h e rt h e s o u n ds i g n a la n da c h i e v ee c h o c a n c e la l g o r i t h r ni nt h i sd e s i g n a tl a s t a c c o r d i n gt ot h ec h a r a c t e r i s t i co fv o l pe c h o 曲ee c h o - p a t hi sl o n g e rt h a nt h e t r a d i t i o n a le c h o ,t h ea u t h o rp u tf o r w a r dan e wm e t h o dt oc a n c e lt h i sk i n do fe c h o ,ih o p ei t c a nm a k es o m ee f f e c to nc a n c e l l i n gl o n g - p a t he c h o k e yw o r d s :w i p , e c h o - c a n c e l l e d ,l m s ,o m a p 5 9 1 0 独创声明 本人声明所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加 以标注和致谢的地方外,不包含其他人已经发表或撰写过的研究成果,也不包括本人为 获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论 文中作了明确的说明并表示诚挚的谢意。 学位论文作者签名:鼍蕨每 签字日期:矿? ,& 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即 学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许沦文被查阅和借 阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交 流。 ( 如作者和导师同意网上交流,请在下方签名:否则视为不同意) 学位论文作者签名:罨l 妖串 导师签名: 签字日期:如f 参签字日期: 东北大学硕士学位论文 第一章绪论 第一章绪论 1 1v o i p 概述 v o p ( v o i c eo v e ri n t e m e tp r o t o c 0 1 ) 俗称口电话。v o 口相对于传统的语音通信区别 在于v o m 是以计算机网络作为载体,通过分组交换技术来实现语音通信业务的。传统 的p s t n 网络采用电路交换技术,通信双方独享一条6 4 k b p s 固定链路,虽然这样的延 时和通话质量要优于采用分组交换的v o 口,但是带来的问题是网络利用率低,通信成本 高,即使是很多国际大公司依然为昂贵的长途电话费而头疼。因此,出现了采用分组交 换技术的v o i p i “。 v o p 是建立在口技术上的分组化、数字化传输技术,其基本原理是:通过语音压 缩算法对话音进行压缩编码处理,然后把这些语音数据按坤等相关协议进行打包,经 过p 网络,把数据包传输到目的地,再把这些语音数据包串起来,经过解码解压处理 后,恢复成原来的语音信号,从而达到由口网络传送话音的目的。 采用口网络承载话音业务与传统的电话业务相比存在着诸多的优势。v o 口可以使 电话物理网络和口物理数据网络合二为一,有效地简化通信系统,降低系统成本和管 理成本;利用碑分布式的、灵活而可扩展的通信方式,v o 口可以使话音应用与原有的 数据业务应用有机地融合在一起,开创新一代业务应用 2 】。 1 2 v o i p 历史及现状 1 9 9 5 年2 月,以色列的v o c a l t e c 公司推出的客户端软件口电话“i n t e m e tp h o n e ” 标志着v o 礤的诞生。自从v o c a l t e c 推出了软件“i n t e m e tp h o n e ”后,很多公司都相继 推出了类似的软件,比如微软的n e t m e e t i n g 、i d t 的n e t 2 p h o n e 、n e t s p e a k 的w e b p h o n e 、 英特尔的h a t e m e t v i d e op h o n e 等,用户只需在p c 机上安装客户端软件,并配合麦克风、 声卡、音响等设备,就可以在口网上与同样安装了这些软硬件的用户通话了。由于当 时这种应用只限于在i n t e m e t 上使用,因此人们通常将这种应用称为“i n t e m e t 电话”。 这一时期,使用者大多数是i n t e m e t 上的网迷,语音质量基本没有保证,技术还不完全 成熟。其后一些商用公司推出了p c p h o n e 的业务,这种方式要求主叫方通过口接入, 然后通过i p 网络连接到被叫方本地的p s t n 网络+ 这就要求被叫方只需拥有普通电话 即可。这秘方式在国际电话市场上占据了一定的市场。目前,国内最常见的是电话到电 话的方式,这种方式主要采用电话接入,口主干的方式。这样通信双方感觉上依然是 p s t n 网络的形式,但是无形中降低了通话成本【3 】a 东北大举硕士学位论文 第一章绪论 1 9 9 9 年4 月,中国信息产业部批准中国电信,中国联通和中国吉通三家公司进行 v o l p 业务试验,标志着v o i p 业务正式进入中国市场。f o r e s t e r 公司预测全球电话呼叫量 将以每年2 2 0 的速度增长,v o l p 正改变着产值数以万亿美元的全球通信产业。短短几 年时间,v o l p 以由初期的桌面方式进入到较成熟的网关方式。权威人士认为:在未来几 年里,以分组形式通过i n t e m a 传输的语音业务将要占语音业务的7 5 。基于v o 口技术 的p 电话业务正在以极高的性价比,成为国际通信市场的主流。据专家预测,v o i p 成 熟期将在未来5 年内出现,届时v o p 技术将具有如下特点:通信采用统一的标准,全 球各通信厂商的设备可以互通:电信运营公司开始提供成熟的i p 电话业务;向m 传输 多媒体过渡【4 1 。 虽然v o l p 技术通过共享带宽能够有效的降低通信成本,但是它同样带来了一些其 它的问题。由于语音通信的数据量较大,并且要求实时性,而在发送点和目的点之间没 有一条带宽能够得到保障的通信链路,因此,需要对采样来的语音信号进行编码并进行 压缩,传统的p s t n 网络占用的带宽为6 4 k b p s ,而v o p 上采用压缩技术以后传输的带 宽要降低到8 k b p s 以下。同对,有损压缩以后依然要保证通信质量,这就要求在压缩率 和通信质量之间保持一个平衡点,于是出现了各种压缩技术及标准包括p c m 、a d p c m 、 l d c e l p 、c s a c e l p 、m p - m l q 等压缩算法【5 】。然而,由于语音信号的压缩,打包以 及在路由器上传输等延时,一方面使得通信双方感觉到语音延时使通信质量下降,另一 方面会使回声路径变长,加大了回声消除的难度。本文正是基于这一考虑,探讨了一些 v o p 上回声消除算法,并且在德卅【仪器公司的o m a p 5 9 1 0 平台上实现了l m s 算法,并 且取得了较好的效果。 l _ 3v o i p 实现协议 1 3 1h 3 2 3 协议 h 3 2 3 是一套在分组网上提供实时音频、视频和数据通信的标准,是i t u t 制订的 在各种网络上提供多媒体通信的系列协议h 3 2 x 的一部分。h 3 2 3 协议被普遍认为是目 前在分组网上支持语音、图像和数据业务最成熟的协议。采用h 3 2 3 协议,各个不同厂 商的多媒体产品和应用可以进行互相操作,用户不必考虑兼容性问题。 从整体上来说,h 3 2 3 是一个框架性建议,它涉及到终端设备、视频、音频和数据 传输、通信控制、网络接口方面的内容,还包括了组成多点会议的多点控制单元( m c u ) 、 网关以及网守等设备。它的基本组成单元是“域”,在h 3 2 3 系统中,所谓域是指一个 由网i ) :管理的网关、多点控制单元( m c u ) 和所有终端组成的集合。一个域最少包含一 一2 一 东北太肇硕士举位论文第一章绪论 1 9 9 9 年4 月,中国信息产业部批准中国电信,中国联通和中国吉通三家公司进行 v o p 业务试验,标志着v o d 业务正式进入中国市场。f o r e s t e r 公司预测全球电话呼叫量 将以每年2 2 0 的速度增长,v o i p 正改变着产值数以万亿美元的全球通信产业。短短几 年时间,p 以由初期的桌面方式进入到较成熟的网关方式。权威人士认为:在未来几 年里,以分组形式通过i n t e m e t 传输的语音业务将要占语音业务的7 5 。基于v 0 i p 技术 的l p 电话业务正在以极高的性价比,成为国际通信市场的主流。据专家预测,v o 成 熟期将在未来5 年内出现,届时v 0 口技术将具有如下特点:通信采用统一的标准,全 球各通信厂商的设备可以互通;电信运营公司开始提供成熟的i p 电话业务;向i p 传输 多媒体过渡 4 l 。 虽然v o l p 技术通过共享带宽能够有效的降低通信成本,但是它同样带来了一些其 它的问题,由于语音通信的数据量较大,并且要求实时性,而在发送点和目的点之间没 有一条带宽能够得到保障的通信链路,因此,需要对采样来的语音信号进行编码并进行 压缩,传统的p s t n 网络占用的带宽为6 4 k b p s ,而v o i p 上采用压缩技术咀后传输的带 宽要降低到8 k b p s 以下。同时,有损压缩以后依然要保证通信质量,这就要求在压缩率 和通信质量之间保持一个平衡点,于是出现了各种压缩技术及标准包括p c m 、a d p c m 、 l d c e l p 、c s a c e l p 、m p m l q 等压缩算法朔。然而,由于语音信号的压缩,打包以 及在路由器上传输等延时,一方面使得通信双方感觉到语音延时使通信质量下降,另一 方面会使回声路径变长,加大了回声消除的难度。本文正是基于这一考虑,探讨了一些 、b 口上回声消除算法,并且在德州仪器公司的o m a p 5 9 1 0 平台上实现了l m s 算法,并 且取得了较好的效果。 1 _ 3v o i p 实现协议 1 3 1h 3 2 3 协议 h 3 2 3 是一套在分组网上提供实时音频、视频和数据通信的标准,是u _ t 制订的 在各种网络上提供多媒体通信的系列协议h 。3 2 x 的一部分。h 3 2 3 协议被普遍认为是目 前在分组网上支持语音、图像和数据业务最成熟的协议。采用h 3 2 3 协议,各个不同厂 商的多媒体产品和应用可以进行互相操作,用户不必考虑兼容性问题。 从整体上来说,h 3 2 3 是一个框架性建议,它涉及到终端设备、视频、音频和数据 传输、通信控制、网络接口方面的内容,还包括了组成多点会议的多点控制单元( m c u ) 、 网关以及网守等设备。它的基本组成单元是“域”,在h3 2 3 系统中,所谓域是指一个 由闱i j :管理的网关、多点控制单元( m c u ) 和所有终端组成的集合。一个域最少包含 由网j :管理的网关、多点控制单元( m c u ) 和所有终端组成的集合。一个域最少包含一 2 东北大学硕士学位论文 第一章绪论 个终端,而且必须有且只有一个网守。h 3 2 3 系统中各个逻辑组成部分称为 l 3 2 3 的实 体,其种类有:终端、网关、多点控制单元( m c u ) 、多点控制器( m c ) 、多点处理器 ( m p ) 。其中终端、网关、多点控制单元( m c u ) 是h 3 2 3 中的终端设备,是网络中的 逻辑单元。终端设备是可呼叫和可被呼叫的,而有些实体是不能被呼叫的,如网守。h 3 2 3 包括了h 3 2 3 终端与其它终端之间的、通过不同网络的、端到端的连接。其体系结构如 图1 1 所示。 里 区窭 圈1 1 h 3 2 3 体系结构 f i g 1 1a r c h i t e c t u r eo f h 3 2 3s y s t e m h 3 2 3 提供设备之间、高层应用之间和提供商之间的互操作性,它不依赖于网络结 构,独立于操作系统和硬件平台,支持多点功能、多播和带宽管理。h 3 2 3 同时具备相 当的灵活性,支持不同功能的节点之间的会议和不同网络之间的会议。h 3 2 3 的缺点是 标准过于复杂,产品过于昂贵,且不能与s s 7 集成,扩展性较弱。 1 3 2s i p 协议 s i p ( s e s s i o ni n i t i a t i o np r o t o c o l ,会话初始化协议) 是由i e t f 提出来的一个应用控 制( 信令) 协议。正如名字所隐含的:用于发起会话。它可用来创建、修改以及终结多 个参与者参加的多媒体会话迸程。参与会话的成员可以通过组播方式、单播连网或者两 者结合的形式进行通信。 s 口中有客户机和服务器之分。客户机是指为了向服务器发送请求而与服务器建立 连接的应用程序。用户代理( u s e r a g e n t ) 和代理( p r o x y ) 中含有客户机。服务器是用 于向客户机发出的请求提供服务并回送应答的应用程序。共有四类基本服务器: 1 用户代理服务器:当接到s 皿请求时它联系用户,并代表用户返回响应。 2 代理服务器:代表其它客户机发起请求,既充当服务器又充当客户机的媒介程序。 在转发请求之前,它可以改写原请求消息中的内容。 3 重定向服务器:它接收s i p 请求,并把请求中的原地址映射成多个新地址,返回给 3 东北大学硕士学位论文 第一章绪论 客户机。 4 注册服务器:它接收客户机的注册请求,完成用户地址的注册。用户终端程序往往 需要包括用户代理客户机和用户代理服务器。 代理服务器、重定向服务器和注册服务器可以看出是公众性的网络服务器。在s i p 中还经常提到定位服务器的概念,但是定位服务器不属于s i p 服务。 1 3 3h 3 2 3 和s i p 协议的比较 h 3 2 3 和s i p 分别是通信领域与因特网两大阵营推出的建议。h 3 2 3 企图把p 电话 当作是众所周知的传统电话,只是传输方式发生了改变,由电路交换变成了分组交换。 而s i p 协议侧重于将p 电话作为因特网上的一个应用,较f t p 、e - m a i l 等增加了信令和 q o s 的要求,它们支持的业务基本相同,也都利用r t p 作为媒体传输的协议。但h 3 2 3 是一个相对复杂的协议。 h 3 2 3 采用基于a s n 1 和压缩编码规则的二进制方法表示其消息。a s n 1 通常需要 特殊的代码生成器来进行词法和语法分析。而s i p 的基于文本的协议,类似于h t t p 。 基于文本的编码意味着头域的含义是一目了然的,如f r o m 、t o 、s u b j e c t 等域名。这种 分布式、几乎不需要复杂的文档说明的标准规范风格,其优越性已在过去的实践中得到 了充分的证明( 现在广为流行的邮件协议s m t p 就是这样的一个例子) 。s i p 的消息体 部分采用s d p 进行描述,s d p 中的每一项格式为“= ”,也比较简单。 在支持会议电话方面,h 3 2 3 由于由多点控制单元( m c u ) 集中执行会议控制功能, 所有参加会议终端都向m c u 发送控制消息,m c u 可能会有影响,特别是对于具有附 加特性的大型会议;并且h 3 2 3 不支持信令的组播功能,其单功能限制了可扩展性,降 低了可靠性。而s i p 设计上就为分布式的呼叫模型,具有分布式的组播功能,其组播功 能不仅便于会议控制,而且简化了用户定位、群组邀请等,并且能节约带宽。但是h 3 2 3 的集中控制便于计费,对带竟的管理瞧比较简单、有效。 h 3 2 3 中定义了专门的协议用于补充业务,如h 4 5 0 1 、h 4 5 0 ,2 和h 4 5 0 3 等。s i p 并未专门定义协议用于此目的,但它很方便地支持补充业务或智能业务。只要充分利用 s i p 已定义的头域,并对s i p 进行简单的扩展( 如增加几个域) ,就可以实现这些业务。 h ,3 2 3 沿用的是传统的实现电话信令模式,比较成熟,已经出现了不少h 3 2 3 产品。 h 3 2 3 符合通信领域传统的设计思想,进行集中、层次控制,采用h ,3 2 3 协议便于与传 统的电话网相连。s i p 协议借鉴了其它因特网的标准和协议的设计思想,在风格上遵循 因特网 贯峰持的简练、丌放、兼容和可扩展等原则,比较简堆,但推出时间不长,协 议并小韪很成熟。 一4 东北大学硕士学位论文 第一章绪论 1 4 本文的主要工作和内容组织 本文首先比较了v o 口和传统p s t n 网络两种语音传输技术各自的优缺点;进而提 出了v o i p 存在的某些不尽如人意的地方。本文的主要工作是比较了几种回声消除算法 的优劣,在m a t l a b 环境下实现l m s 算法仿真并评估了算法的性能,然后在德州仪器 公司的o m a p 5 9 1 0 平台上实现了l m s 算法,取得了较好的回声消除效果。 本文的内容组织如下:第一章概括的介绍了v o p 及其实现的协议。第二章分析了 v o 口上需要解决的几点关键技术,进而引出了本文的研究内容:回声消除技术。第三章 分析了回声消除算法的理论基础,并比较了l m s 、n l m s 、r l s 等几种算法,选择了 l m s 算法作为本设计的核心算法。第四章介绍了在o m a p 5 9 1 0 平台上回声消除的具体 软硬件实现。第五章对结果进行了分析和评估。 5 东北大学硕士学位论文 第二章v o i p 上的关键技术 第二章v o l p 上的关键技术 2 1 语音压缩编码技术 一般传输电话音质需要的带宽范围是3 0 0 - 3 3 0 0 h z ,因此普通一路模拟电话通常只 占用4 k h z 带宽,而一路数字电话的语音信号如果按每秒钟8 0 0 0 点采样,每个采样点 用8 b i t 表示,则传输过程中所占用的带宽为6 4 k b p s ,占用的带宽是模拟信号的1 6 倍。 因此为了减少语音信号所占用的带宽,就必须对数字语音信号进行压缩编码f 6 j 。 语音压缩编码是语音信号在i p 网络上传输的第一步,是减少分组和传送等开销的 基本技术要求,是l p 电话具有极大价格优势的重要原因。 目前,语音压缩编码主要有波形编码,参数编码和混合编码。如图2 1 所示。 剿2 1 语音压缩编码分类 f i g 2 1s o u n dc o m p r e s s i o nc o d i n gs y s t e m 1 波形编码 波形编码比较简单,编码前根据采样定理对模拟语音信号进行采样,然后进行幅度 量化,再进行二进制编码。解码器对接收到的数字信号进行数,模变换后再由低通滤波器 恢复出原始的模拟语音波形,这就是最简单的脉冲编码调制( p c m ) ,也称为线性p c m 。 波形编码的目标是让解码器恢复出的模拟信号在波形上尽量与编码前原始波形相一致, 也即失真要最小。波形编码的方法简单,数码率较高在6 4 k b p s 至3 2 k b p s 之间音质优 良,当数码率低于3 2 k b p s 的时候音质明显降低,1 6 k b p s 时音质非常差。 2 参数编码 参数编码又称为声码器,是根据人的发声机理,在编码端对语音信号进行分析,分 解成有声音和无声音两部分。声码器每隔一定时间分析一次语音,传送一次分析得到的 7 东北大学硕士学住论文 第二章v o f p 上的关键技术 有声,无声参数和滤波参数。在解码端根据接收的参数再合成声音。声码器编码后的码率 可以做得很低,如1 2 k b p s 、2 4 k b p s ,但是也有其缺点。首先是合成语音质量较差,往 往清晰度可以而自然度没有,难于辨认说话人是谁,其次是复杂度比较高。 3 。混合编码 混合编码是将波形编码和声码器的原理结合起来,数码率约在4 k b p s 1 6 k b p s 之 间,音质比较好,最近有个别算法所取得的音质可与波形编码相当,复杂程度介于波形 编码器和声码器之间“j 。 1 9 7 2 年i t u ( 国际电信联盟) 制定了( 1 7 1 1 系统语音编码标准,这是较早的波形编 码方案,它适用于3 1 k h z 音频在4 5 、5 6 和6 4 k b p s 通道上传送。g 7 1 l 描述的p c m 是 波形编码的最简单形式,( 1 7 1 1 p c m 使用8 k h z 采样频率,且每个采样点产生8 b i t 振幅 值。因此,g 7 1 1 p c m 需要6 4 k b p s 的带宽。事实上,( 1 7 1 1 p c m 没有使用任何形式的压 缩。 a d p c m ( 适应差分脉冲编码调制) 是i t u 于1 9 9 0 年制定的( 1 7 2 6 中描述的波形编 码方案。a d p c m 是一种基于波形变化的编码,通常计算两相邻采样点之间的波形及振 幅的变化,在每个采样周期上可产生2 、3 、4 或5 位数据,对相应的带宽要求分别为1 6 、 2 4 、3 2 或4 0 k b p s 。a d p c m 通常在3 2 k b p s 带宽上使用。它既提供良好的语音质量,又 比p c m 节约一半的带宽。但采样数据位数过少,会导致采样模拟图与实际波形图的差 异增大,从而降低语音质量。 波形编码具有设备无关性和语音质量好的优点,同时也存在所占带宽较大的严重不 足。无论是6 4 k b p s 的p c m 编码,还是3 2 k b p s 的a d p c m 编码,都无法适应现代通信 技术的需要。i t u 制定的第二组以l p c ( 线性预测编码) 技术为基础的压缩编码标准, 描述了混合编码方案。这一系列标准既保证了良好的语音质量,又尽可能地降低编码速 率。它们是v o l p 的主流,包括g 7 2 8 、( 2 7 2 9 、c t 7 2 9 a 和g 7 2 3 1 等。 ( 1 7 2 8 适用于3 1 k h z 音频在1 6 k b p s 通道上的传送。( 1 7 2 8 中描述了l d c e l p ( 低 延时编码激励线性预测编码) 。g ;7 2 9 建议描述了c s a c e l p ( 共轭结构代数代码激励线 性预测编码) 。c s a c e l p 是l d c e l p 的一个后继,它除了将所需带宽降到8 k b p s 外, 在利用噪声消减和声音合成技术来提高语音质量方面取得了突破性的进步。( 1 7 2 9 的 c s a c e l p 的音质已经超过标准a d p c m 且非常接近标准p c m 。g 7 2 9 a 描述了8 k b p s 的c s a c e l p 的一个具有较低复杂性的版本。为了尽量降低压缩后的声音传输带宽,i t u 于1 9 9 6 年推出了( 1 7 2 3 1 标准,它适用于5 3 k b p s 、6 3 k b p s 模式。g 7 2 3 1 标准描述了 m p m l q 、a c e l p 编码方案,( 1 7 2 3 1 现己成了h 3 2 3 的默认编码标准,所有的客户端 8 东北大学硕士学位论文 第二章v o p 上的关键技术 设备和网关都必须支持它。 表2 1 描述了几种主要语音压缩编码算法的性能和用途。 表2 ,l 几种语音压缩编码算法的性能和用途的比较 t a b l e2 1t h ed i f f e r e n c eo f c a p b i l i t ya n dp u r p o s eb e t w e e n s e v e r a ls o u n dc o m p r e s s i o nc o d i n ga l g o r i t h m 编码算法编码类型 i t u 位速率语音质量复杂性主要 标准 ( k b p s )( m o s ) ( m l p s ) 用途 p c m波形编码g 7 1 16 44 10 3 4p s n q a d p c m波形编码 g 7 2 63 23 8 5 1 4p s t n l d c e l p混合编码q 7 2 81 6 3 6 1 3 3v o 口 c s - a c e l p 混合编码 g 7 2 983 9 22 0v o i p c s a c e l p 混合编码 q 7 2 9 a83 7 1 0 5v o 口 m p m l q 混合编码 q 7 2 3 1 6 3 3 9 1 6 v 0 p a c e l p 混合编码 g 7 2 3 1 5 3 3 6 5 1 6v o m i t u 指定的各种语音压缩编码标准集中体现了语音压缩编码技术的发展水平和发展 方向,每个压缩算法都对语音质量有所影响。m o s 值是技术质量的一种量化,它是在 受话方测试压缩算法生成的语音质量的各要素的平均。位速率是与所需传输带宽紧密相 关的描述语音编码量化精细度的一个参数。g 7 2 3 1 和g 7 2 9 a 是目前普遍受欢迎的国际 标准,前者位速率低,音质好,但算法复杂性高,延时长;后者降低了算法复杂性,缩 短了延时,却牺牲了部分音质。 2 2i p 网延时和网络抖动的处理技术 网络延时可分为传输延时和处理延时两部分。传输延时是由传输介质和传输距离引 起的;处理延时是由语音传输过程中处理语音数据流的所有组件引起的。处理延时比传 输延时往往要长的多,同时,网络处理延时随附加处理的增加而增长,编码、分组和排 队延时加倍,会导致串行化和与网络有关的延时也加倍。当网络中端到端延时超过3 0 毫秒时,就会产生较强的回声,网络总延时常比语音呼叫允许的延时多2 0 0 3 0 0 毫秒。 因此,延时长短直接影响v o i p 的语音质量。网络抖动是指由于各种延时的变化导致网 络中数据分组到达速率的变化。排队延时、可变的分组、中间链路和路由器上的相对负 载等,常常会引起分组到达速率出现很大的变化。抖动与延时密切相关,抖动也是影响 语音质量至关重要的因素。处理v o i p 上延时和抖动主要有两种技术:基于硬件的延“寸 9 东北大学硕士学位论文 第二章v o i p 上的关键技术 和抖动处理技术,基于软件的延时和抖动处理技术。 2 2 1 基于硬件的延时和抖动处理技术 1 d s p 和a s i c d s p 主要用于语音和数据集成环境下的复杂计算。在此之前,这些诸如g 7 2 9 语音 压缩的计算由c p u 执行。在v o p 系统中,d s p 承担中央处理功能,以便将节省的资源 投入到执行路由和系统管理中去,从而减少处理延时,同时允许系统处理其它的呼叫业 务。d s p 还具有语音活动检测和回声消除功能。 a s i c ( 专用集成电路) 可以集中于狭窄专一的应用领域,能够对特定的功能进行高 度优化,a s i c 通常比通用c p u 快一个到几个数量级。它通常用于路由器和交换机等网 络设备中,负责执行路由查表、分组转发及排队处理等功能。在v o i p 系统中,开发和 利用a s i c 至少增加了三个优势:减少延时、增加带宽和优化q o s ( 业务支持) 。 2 s o n e t 和d s l s o n e t ( 同步光纤网络) 是种面向端到端业务的网络技术,它简化了复接分接技 术,能实现不同厂商光纤传输设备的互通。s o n e t 采用自愈混合环状网络结构,具有 自动维护和测试、带宽管理、实时路由选择、同步复用等功能。s o n e t 拓宽了带宽的 概念,它使得传输、交换和用户前端设备之间的界限变得模糊起来,未来的s o n e t 将 会具有可以把分开的语音、数据、图像网络结合到一个宽带多媒体网络的能力。s o n e t 为v o 口网络的运行提供了一个性能价格比更优的平台。 3 v f r a d v f r a d ( 语音帧中继接入设备) 可支持多种语音接口,最常见的是模拟语音接口, 这种接口能把模拟语音信号转换成压缩的数字语音信号,再经过帧中继网络传送。 v f r a d 采用帧分割和帧重组技术,将每个语音帧分割压缩成约1 5 个字节的短帧,在接 收端重组输出。这种“短、频、快”的帧处理技术既缩短了帧填充时闷,在优秀排队算 法的支持下,又减少了延时抖动和丢帧现象。目前,许多帧中继网络交换机都提供了 p v c ( 永久虚电路) 优先权机制,这种机制允许在短时间内保持较低优先权p v c 上的 数据的m 传送另一个p v c 上的业务。因此,将语音p v c 的优先权配置的比数据p v c 优先权 “就可以明显的降低语音的延时抖动。 2 2 2 基于软件和协议的延时和抖动处理技术 1r t prr c p r t pr t c p ( 实时沩、议实时控制协议) 是为在i n t e r a c t 或基于i p 的网络上传送诸如 1 0 东北大学硕士学位论文 第二章v o i p 上的关键技术 视频和音频数据等实时数据流而创建的,它包含在h 3 2 3 中。r t c p 执行r t p 流的控制 功能,r t p 运行于u d p i p 之上,它至少具有如下四个特征: 1 1r t p 报头域以恒定的速率变化。 2 1 口源地址和目的地址对于一个r t p 会话是不变的。 3 1u d p 源端口和目的端口对于一个r t p 会话是不变的。 4 、r t p 同步源( s s r c ) 对于一个r t p 会话是不变的。 r t p 的上述特征为c r t p ( 压缩的实时传输协议) 提供了技术支持。r t p 提供u d p 中没有的传输实时数据流所要求的一些元素,包括顺序编号和时间标记。在发送端,r t p 为每个离开的数据包分配顺序编号和时间标记;在接收端,利用顺序编号确认数据包已 经按顺序收到,且没有中间数据丢失,利用时间标记保证合适的回放速率。r t p r t c p 协议对减少包交换网络的各种延时起关键作用,并在一定范围内有效解决网络抖动问 题。 2 ,c r t p 减少延时最简单的技术之,就是每次发送较少的数据,因为较少的数据所需要的 时间少。c r t p 利用v a nj a c o b s o n 的t c p i p 报头压缩算法,把标准i p u d p r t p 报头从 4 0 个字节减少到2 5 个字节。对报头的压缩所得可资助分组语音数据流的开销。如果 数据链路报头与帧中继、p p p ( 点到点协议) 和h d l c ( 高级数据链路控制规程) 报头 大小相同,当每个分组净荷越小时,采用c r t p 技术后,诸如m p m l q 、c s - a c e l p 等 低位速率编码器的总语音带宽要求就越低。对于多个语音呼叫在低速链路上传输的情 况,这种优势特别明显,它既可增加呼叫容量,又可减少端到端延时。表2 2 描述了采 用c r t p 前后的分组开销和带宽使用等情况。 3 i p v 6 i p v 6 是i p v 4 的扩展和延续,它对口v 4 进行了很大的改进。首先,i p v 6 的地址空间 由 p v 4 的3 2 位扩展到1 2 8 位,并具有群址功能,支持多级地址,它还简化了路由表, 舍去a 、b 、c 、d 成员网分类,采用分层次选择路由结构。) v 6 的安全保密机制具有 算法独立性,一个新的算法可在已有的i p v 6 安全框架内使用。i p v 6 还具有动态自动配 置网络地址和支持实时业务的能力。i p v 6 的组播功能、资源预留、分组优先级、接入控 制和综合的业务质量等机制,为因特网上语音包的无缝传输与其它数据流共存提供了 q o s 保证。 4 r s v p r s v p ( 资源预留协议) 是i e t f 丌= 发的一种与现有的t c p i p 网络兼容的端到端协 东北大学硕士学位论文 第二章v o l p 上的关键技术 议。它保证了h 3 2 3 系统在一次网络连接中预留所需的带宽,有助于解决因带宽需求变 表2 2 采用c t r p 前后的分组开销和带宽使用睛况 t a b l e2 2p a c k e ts p e n d i n ga n du s eo f b a n d w i d t hl i s t ( u s ec t r po rn o r m a lc o n d i t i o n ) c r t p 之前c r t p 之后 编码算法分组分组 分组语 总带宽分组分组分组语总带宽 大小开销音带宽要求大小开销音带宽要求 ( b y t e )( ) 要求 ( k b p s )( b y t e )( ) 要求 ( k b p s ) ( k b p s )( k b p s ) p c m2 0 02 8 88 28 2 41 6 856 76 7 2 a d p c m1 2 05 7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论