(模式识别与智能系统专业论文)基于ip网络长延迟特性的回声抵消算法研究.pdf_第1页
(模式识别与智能系统专业论文)基于ip网络长延迟特性的回声抵消算法研究.pdf_第2页
(模式识别与智能系统专业论文)基于ip网络长延迟特性的回声抵消算法研究.pdf_第3页
(模式识别与智能系统专业论文)基于ip网络长延迟特性的回声抵消算法研究.pdf_第4页
(模式识别与智能系统专业论文)基于ip网络长延迟特性的回声抵消算法研究.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(模式识别与智能系统专业论文)基于ip网络长延迟特性的回声抵消算法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京邮电大学硕士研究生学位论文摘要 摘要 近年来,因特网技术快速发展,其业务类型已进入传统电信的实时话音通信。i p 网络 中的语音传输采用分组交换技术实现,传输的语音信号要经过编码、压缩、打包等一系列 处理过程,因而回声路径的延迟比较大,而且延迟抖动也较大。与传统电路交换相比,v o i p 系统中的回声问题尤其突出。 自适应回声抵消算法的运算复杂度与自适应滤波器的的长度有关,而i p 网络的长延迟 特性在很大程度上增加了滤波器的长度,导致算法复杂度增加,收敛速度变慢。 本文从回声信道时间延迟估计角度入手,研究了一种基于互相关方法的延迟估计算法。 该算法能够较好地进行话音信号的延迟估计,并且具有较好的稳健性和运算效率,最重要 的是它尤其适合估计有色( c o l o r e d ) 信号延迟。在此基础上采用目前常用的n l m s 、r l s 、 l s l 算法进行回声抵消。由于回声路径的冲激响应包含平坦时间延迟( f l a td e l a y ) 和活 动区( a c t i v er e g i o n ) 两个部分儿“,而在平坦延迟部分不存在回声,因此在自适应滤波 器不必在平坦延迟部分进行回声抵消,大大减小了算法中自适应滤波器长度,从而加快算 法收敛速度并降低了运算量,使回声抵消器性能得到优化。 全文分为6 章,在详细讨论i p 网络延迟特性和自适应滤波器算法的基础上,对延迟估 计算法以及基于延迟估计的改进型回声抵消算法做了深入研究,最后通过仿真来分析算法 性能。 关键词:回声抵消算法,v o i c eo v e ri p ,延迟估计算法,自适应滤波器 南京邮电大学硕士研究生学位论文 a b s t r a c t a b s t i 凇t i nr e c e n ty e a r s ,w i t ht h er a p i dd e v e l o p m e n to fc o m m u n i c a t i o nt e c h n i q u e s , c o n s i d e r a b l ei n t e r e s th a sb e e nf o c u s e do nv o i c e o v e r i ps y s t e m s ,p e o p l ed e m a n d h i g h e ra n dh i g h e r s p e e c hq u a l i t yi nc o m m u n i c a t i o n s oe c h oc a n c e l l a t i o n ( e c ) t e c h n i q u eh a sb e c o m eah o t s p o to fc o m p e t i t i o n b u t ,i ti s n o ta l w a y se a s yt o i m p l e m e n ta c o u s t i ce q u i p m e n t sf o rv o i c e o v e r i ps y s t e m sw i t hs a t i s f a c t o r yq u a l i t y p a c k a g el o s sa n dl a t e n c yc a u s e db yp a c k e tb u f f e r i n gh a v et h ef u n d a m e n t a li n f l u e n c e o nt h es p e e c hq u a lit y ,t h el a r g et o t a l d e l a yi nv o i ps y s t e m sr e q u i r e ss h o r t c o n v e r g e n c et i m ea n dl o wc o m p u t a t i o n a lc o m p l e x i t y h o w e v e r ,t h ec o m p u t a t i o n a lc o m p l e x i t yo fa d a p t i v ea l g o r i t h mi sr e l e v a n tt ot h e a d a p t i v ef il t e r sl e n g t h ,a n dt h el a r g ee c h op a t hd e l a yi ni pn e t w o r ki n c r e a s e s t h el e n g t ho ff i l t e ri nl a r g ed e g r e e i nt h i sp a p e r ,w es t u d ye c h oc a n c e l l a t i o nt e c h n i q u ef r o mi t so n ek e ya s p e c t e c h op a t hd e l a y e c h op a t h sc o n s i s to fac o n s t a n tt i m ed e l a yw i t hn oe c h os i g n a l a n da c t i v er e g i o n si nw h i c ht h ee c h os i g n a li sp r e s e n t w h e na na d a p t i v ef i l t e r e c h oc a n c e l l a t i o na l g o r i t h mi su s e d ,i t sp e r f o r m a n c ec a nb eg r e a t l yi n c r e a s e d , a n di t sc o m p l e x i t yc a nb er e d u c e di fi ti so n l ya p p l i e dt ot h ea c t i v er e g i o n s t h e r ea r e6c h a p t e r si nt h i sp a p e r f i r s to fa l l ,t h ea d a p t i v ee c h oc a n c e l l a t i o n a l g o r i t h m sa n dt h ed e l a y s c h a r a c t e r i s t i c si nv o i pa r ed i s c u s s e di nd e t a i l a n d t h e n ,d e l a ye s t i m a t i o na l g o r i t h ma n dl o n gd e l a yp r o p e r t yb a s e de c h oc a n c e l l a t i o n m e t h o d si n i pn e t w o r ka r es t u d i e da n ds i m u l a t e d k e yw o r d s :e c h oc a n c e l l a t i o n ,v o i c e o v e r i p ,d e l a ye s t i m a t i o na l g o r i t h m ,e c h o c a n c e l l e r ,a d a p t i v ef i l t e ra l g o r i t h m i i 南京邮电大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的 地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包 含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示了谢意。 研究生签名:起璺复1 日期:! z 竺笙膨 南京邮电大学学位论文使用授权声明 南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留 本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其 他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一 致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布 ( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权 南京邮电大学研究生部办理。 研究生签名:查旦疆:导师签名:验! 盟日期: 南京邮电大学硕士研究生学位论文第l 章绪论 第l 章绪论 随着信息技术的飞速发展,人们对网络通信的需求不断提高,希望不论在何时、何地, 与任何人都能够进行包括数据、话音、图像等任何内容的通信。这使得以多媒体通信为主 体的信息网络成为世界关注的热点。i n t e r n e t 的巨大成功,使得i p ( i n t e r n e tp r o t o c 0 1 ) 网络成为未来信息网络的支柱产业之二:7 以i p 为核心的分组交换将成为现代通信的主流发 :i : 展方向。回声是影响i p 网络实时话音通信质量的一个重要因素,本论文围绕回声抵消问题 进行了深入研究,并在此基础上研究了一种改进型回声抵消算法。 1 1 。回声抵消( e c ) 出现的背景 语音是人与人之间互相交流的最自然和最便捷的方式,也是最主要的交流媒介( 大约 占7 0 ) 。语音的重要地位和巨大优势推动了语音技术的飞速发展,比如通信领域的语音压 缩和编码、模式识别和人工智能领域的语音识别、说话人识别等技术,都己经取得了重大 突破。越来越多的语音技术产品正在融入我们的日常生活。 当人们在空旷的大房间或山谷大声说话时,由于山谷或墙壁对声波的反射,往往会产 生回声。与自然界的回声类似,语音技术也同样面临着回声干扰的问题。这是因为,在语 音信号的传输过程中,总是不可避免的受到各种类型回声的影响。这种被回声污染的语音, 对于受话人来说至少会引起听觉上的不适,严重一点会听不懂或根本听不清对方的语音; 对于语音处理系统来说( 如语音识别或说话人识别系统) ,可能会导致系统的性能( 如识别 率) 严重下降。 t , 。i : 按照回声的产生机理我们可以把回声分为电路回声和声学回声两种类型,下面分别加 以介绍。 1 1 1 电路回声的产生及消除技术 在电信网中,通常为了降低电话中心局与电话用户之间电话线的价格,用户线的连接 采用两线制;电话中心局之间的连接采用四线制。为了适应四线n r - 线或二线到四线的连 接,需要使用一种称作混合电路的模拟电路。二线到四线的混合电路是一对变压器,它使 用电感耦合把一个双工信号分隔成两个单工信号,在长途信号传输中有利于信号处理,例 如信道均衡和放大。 在传统的电话线路中,混合电路采用调谐变压器实现。由于阻抗失配,在混合电路中 南京邮电大学硕士研究生学位论文第1 章绪论 会产生电流泄漏阳,虽然已采用了各种各样的先进混合电路,但是混合电路中产生电流泄 漏仍然不可避免。电流泄漏使得一部分信号的能量反射回信号源,这种反射和信道延迟结 合在一起,使讲话者听到自己的声音或者回声。其产生的原理如图l l 所示,其中“发话 方回声 使说话人听n t 自己的一个延时的声音。 rrl l 图l l 电路回声的产生原理 混合电路泄漏的影响程度依赖于讲话者和另一端混合电路之间的距离及泄漏电流的幅 度。如果信道延迟短,讲话者一般不能辨认线路回声和旁音,而旁音在电话中总是存在的。 但是,如果信道延迟超过十几毫秒,那么会对讲话者产生很大干扰。决定线路回声影响程 度的另一个参数是混合电路的损耗,也就是说有多少发射信号被反射回来。一般情况下, 损耗至少为6 d b 。 对于短的传输延时一。,回声的抵消可以通过在连接通道中插入衰减来控制。因为回声 要经过两到三次衰减,而正常传出去的声音只经过一次衰减。事实上,如果总的回声延时 很短,即在几个毫秒以内,那么回声的影响就不明显,这时的回声效果称为混响,它将给 人产生一种舒适的感觉:这种通话声带有侧音,它对声音听觉质量的影响是正面的,许多 人更喜欢音响带有这种回响声。但是,当总的延时超过3 0 毫秒时,回声就成了有害的东西, r c l 它干扰人的正常通话“。,对于回声延时在4 0 毫秒以上者,通过在连接通道中插入衰减来控 制回声的方法已不能满足要求,通常需要使用自适应滤波器川1 来进行回声抵消。以提高 2 雨京邮电大学硕士研究生学位论文第1 苹绪论 语音通信的质量。 在电话通信中,有2 种突变的情形使自适应滤波器算法的正常运行受到挑战。一种情 形是通话的双方同时说话( d t ) 的现象。统计表明,电话通信时双方同时说话的概率为2 0 左右。当通话的双方同时说话时,若回声抵消器不及时检测这种情况并适时抑制滤波器的 迭代,则自适应滤波器会把近端的话音当作回声抵消,最终可能导致回声抵消器发散。另 一种突变情形是回声路径跳变( e p c ,即滤波器突变) 的情形。当话路被一次新的通话所占 用,或双方在一条话路上通话第3 方或多方以电话会议的形式插入,或正在进行电话会 议的一方或多方退出电话会议时,都会导致回声路径的突变。当这种情形发生时,回声抵 消器应迅速提高收敛速率,以便回声抵消器尽快抵消由这种路径突变造成的突发回声,并 重新收敛到新的稳定状态上。因此,当自适应滤波算法确定好后,d t 和e p c 的检测与控制 便是关系到回声抵消器性能好坏的关键。除基本的自适应滤波技术和双方同时说话回声 路径跳变检测与控制技术外,回声抵消器中普遍采用的技术还包括非线性处理技术,噪声 匹配技术,听觉回声控制技术以及近年来少数回声抵消器厂家先后推出的噪声补偿与噪声 抑制技术,等等。如何进一步革新与完善上述技术,并适应现代通信由窄带向宽带方向发 展的需要,这也是许多回声抵消器厂家为提高自身市场竞争地位而不断积极追求的目标。 1 1 2 声学回声的产生及消除技术 声学回声是指扬声器播出的声音在被受话方听到的同时,也经过多种路径被麦克风拾 取到,见图l - - 2 ,这种多路径反射的结果产生了不同的时延的回声。直接回声是指从扬声 器播放出来的声音未经过任何反射直接进入麦克风,这种回声的时延最短,它同远端说话 者的语音能量,扬声器和话筒之间的距离与角度,扬声器的播放音量以及麦克风的拾取灵 敏度等因素直接相关。而所谓的间接回声是指从扬声器播放出来的声音经过不同的路径 ( 如房屋或者房屋内的物体) 一次或多次反射后进入麦克风所产生的回声的集合,周围物 体的变动( 如一个人的走动或者一扇窗的打开) 都会改变回声的通道,因此这种回声的特 点是多路径的,时变的。 南京邮电大学硕士研究生学位论文第l 章绪论 图1 2 声学回声产生原理 解决声学回声问题有三种思路。一是直接去掉扬声器与传声器之间的声学耦合,通过 采用具有高度指向性的扬声器和传声器,同时采用强吸声的材料阻挡反射声。第二种采用 以牺牲全双工通话性能的“回声抑制”( e c h os u p p r e s s i o n ) 的措施。这种措施在输出线 路上增加一个控制器,用以判断输出是近端语音还是远端语音的回声,如果是后者,则断 开输出线路,完全抑制掉回声。而当近端讲话和远端讲话同时出现时( 即双端通话,d t ) , 则总有一端的讲话会被抑制,从而牺牲全双工的功能。最后一种思路,如果电路上存在一 种与现实中的扬声器房间传声器声学耦合 ( l o u d s p e a k e r - - e n c l o s u r e - - - m i c r o p h o n e ,l e m ) 完全等价的复制品,则可以抵消回声,同 时通话者不会感觉到任何不方便。但是这样的系统实现起来也至少存在三个困难:l e m 的 冲激响应可能长达几百毫秒,系统必须是自适应的,而且这个自适应过程面临的是语音信 号的输入。这种思路被称为声学回声抵消( a c o u s t i ce c h oc a n c e l l a t i o n ,a e c ) 。声学回 声抵消器可以通过将传送到扬声器的语音作用于自适应滤波器来对回声进行估计,达到消 除被麦克风拾取到的任何回声的目的,其原理如下图所示: 4 南京邮电大学硕士研究生学位论文第1 章绪论 砌, 图i - 3自适应声学回声抵消原理 图中的g ( z ) 表示产生回声路径( e c h op a t h ) 的传递函数;w ( z ) 代表白适应回声抵消 器,也就是一个自适应滤波器,x ( n ) 表示远端信号输入,d ( n ) 表示近端信号输出,但其中 含有x ( n ) 的回声部分,要减去y ( n ) ,二者之差即是送往远端的误差信号e ( n ) 。并且该误 差信号将被送回自适应滤波器,用以进行滤波器系数的更新。如果自适应滤波器能对房间 的冲激响应准确建模,则在e ( n ) 中只含有近端语音或近端背景噪声( 甚至背景噪声也可以 通过后处理手段被抑制) 。 1 2i p 电话中回声的特点 近年来v o i p 技术i s 3 迅猛发展,使信号延迟大大增加,回声现象也越来越严重。回声 消除的好坏目前已成为世界上各大通信产品质量竞争的一个重要指标,这种市场需求反过 来又促进了回声抵消技术的发展。 由于i p 电话是采用分组交换技术实现的一种全新的电讯业务,传送的语音信号要经过 编码、压缩、打包等一系列的处理。因此,i p 电话系统中的回声和p s t n 中的回声相比,还 具有如下特点: ( 1 ) 回声源较复杂引 前面已经讨论,在传统电话系统中存在着电路回声,该回声产生的主要原因是因为在 传统的电话系统中,存在2 - 4 线的转换。在电话语音的传输过程中,完成2 - 4 转换的混合器 因阻抗不匹配,造成混合器的语音“泄露。在i p 电话系统的组成结构中,i p 电话网关一 边连接p s t n ,另一边连接因特网。尽管电路回声产生于p s t n 中,但该回声同样会传至i p 电 话网关,影响i p 电话语音质量。因此电路回声是i p 电话系统中的回声源之一。 此外,和p s t n 类似,i p 电话系统中同样存在着扬声器播放出来的声音被麦克风拾取后 s 南京邮电大学硕士研究生学位论文第1 苹绪论 发回远端使远端通话者听到回声的情况,因此声学回声也是i p 电话系统中的回声源之一。 本文还将在第2 章中对v o i p 的回声源问题做更进一步的讨论。 ( 2 ) 回声路径的延迟大哺。 一 在i p 电话系统中,产生延迟的延迟源有:压缩延迟、分组传输延迟以及源端和目的端 进程延迟等。其中语音压缩延迟是产生回声的主要延迟之一。例如h 3 2 3 协议规定,在i p 电话系统中,首选的压缩标准是g 7 2 3 1 ,在g 7 2 3 1 标准中,压缩一帧( 3 0 m s ) 的最大压缩 延迟是3 7 5 m s 。另外,分组传输延迟也是影响回声的一个很重要的因素,而且分组的传输 延迟很大。据测试表明1 0 1 副,端到端的最大传输延迟可达4 0 0m s 以上。因此,在i p 电话系 统中,回声的路径延迟一般比较大。 ( 3 ) 回声路径的延迟抖动大 在i p 电话系统中,由于回声路径的不确定、语音压缩延迟的不确定、分组传输路径 的不确定等诸多不确定因素,带来了回声延迟的不确定,而且抖动较大,一般在2 0 4 0 0 m s 之间。 综上讨论,i p 电话系统的诸多特点给数字信号处理带来了新的挑战。为了克服延迟 抖动而引入的抖动缓存( j i t t e rb u f f e r ) 在很大程度上进一步加剧了回声路径的延迟。 在这种情况下,要实现回声抵消,就需要自适应滤波器具有很大的阶数,算法复杂度很高。 本论文以后的部分将从“延迟”角度探讨一种改进型的回声抵消算法。 1 - 3 国内外研究现状与发展趋势 回声抵消的理论基础是自适应滤波理论u “,自适应滤波器( a d a p t i v ef i l t e r ) 的术 语本身就暗含了滤波器的系数被周期性的修正以满足某种性能指标,这种指标通常在形式 上是误差或代价函数最小化。 上个世纪六十年代以前,由于客观条件和技术的限制,人们只能采用一种叫回声抑制 器的方法来实现回声抵消,回声抑制器其实就是在从近端到远端话路中设置一个开关,当 检测到只有远端用户在讲话时,把开关断开,这时任何信号都无法传回远端,自然就没有 回声了。当只有近端用户讲话时,开关闭合,于是近端用户的话音就可以完全毫不受损的 传向远端。但是当近端用户和远端用户同时讲话时,回声抑制器就无能为力了,所以安装 回声抑制器的电话系统只能工作在半双工状态,这种限制显然不能令客户满意,六十年代 以后,以自适应理论为先导,d s p 技术为基础的回声抵消器的广泛使用,使人们有可能以 6 南京邮电大学硕士研究生学位论文 第1 苹绪论 较低的成本享受到真正的全双工的,无回声的电话服务和通信服务。 国外对回声抵消算法的研究已经有了四十多年的历史,美国b e l l 实验室的m s o n d h i 于1 9 6 7 年首先提出了自适应回声抵消技术,之后回声抵消技术得到了较快的发展。现在 自适应回声的研究范围也较广,不再仅仅局限于电学回声,在声学回声,在会议电视,以 及全双工数据通信中的回声等方面也有较深的研究。当前国外有很多公司和大学及研究机 构都在致力于回声抵消的研究并且取得了很多成果,国外在回声抵消算法的研究和产品开 发等方面都领先于我国。此外,国外许多专家还积极参与了i t u t 在回声抵消领域标准的 制定,2 0 世纪9 0 年代以来,先后制定了消除线路回声的g 1 6 5 ( e c h oc a n c e l l e r ) ,消除 音频终端回声的g 1 6 7 ( a c o u s t i ce c h oc o n t r o l l e r ) 以及消除数字网络回声的 g 1 6 8 ( d i g i t a ln e t w o r ke c h oc a n c e l l e r ) 等回声消除的相关标准。 长期以来,回声消除是个非常具有挑战性的工作,声学回声的消除更是如此,主要原 因如下: ( 1 )由于声学回声将直接或者经过一次或者多次的反射后以叠加的形式进入麦克 风,其结果导致回声的尾音很长,对应的回声通道的脉冲响应也很长。据统 计,一般会议室内回声通道的脉冲响应通常为几百毫秒u “。因此,为了实现 回声抵消,所采用的自适应滤波器的阶数就必须很大。如果采用f i r 自适应 滤波器,则要求它具有上千阶,采用这种自适应滤波器对回声通道建模,自 适应给出的运算量大得惊人,若采用n l m s 算法,则这种算法收敛非常慢,导 致不能跟踪回声通道的变化,回声抵消的效果就会很差。对于v o l p 系统,由 于存在较大的时间延迟,自适应滤波器的阶数将更大。 ( 2 )由于语音信号是非平稳的和扩散的u 别,而常用的自适应算法的性能与输入信 号的统计特性有关,语音信号的自相关矩阵中特征值的扩散使得l m s 算法的 自适应过程变慢。 ( 3 )声学回声通道的特性是非平稳的,说话者或者房间内其它人或者物体的移动 都会使声学回声通道的脉冲响应发生很大变化,回声通道的快速变化特性要 求a e c 的收敛速度必须尽可能快,具有很好的快速跟踪能力。但是快速收敛 的算法与计算量有关,而a e c 的滤波阶数非常高,一般的快速算法通常起不 到很大的作用。 ( 4 )声学回声环境中背景噪声的影响有时是不可忽略的( 如车载台声学环境中的 喇叭呜叫声等) 当背景噪声的能量很大时,a e c 系统仅仅处理回声还不够, 7 南京邮电大学硕士研究生学位论文第1 章绪论 必须考虑消除噪声,这就更加增加了回声抵消器的设计难度。 由于以上原因,采用传统的消除电路回声的方法来消除声学回声很难获得理想的效 果。但事实上现有的a e c 产品大多数采用的仍然是f i r 结构及n l m s 算法,由于a e c 设计 时使用的算法及结构的局限性,使得a e c 产品的实用性也受到很大的限制。 目前在回声消除方面,研究的主要对象是声学回声和数字网络回声,后者是在2 0 世 纪9 0 年代,伴随着移动网络及移动业务的发展而产生的,当移动用户与固定用户通话时, 出现的回声问题不仅包括了p s t n 上的电路回声,而且也包括了移动终端的声学回声,特 别是对于那种免提的移动终端系统,声学回声的影响更加严重,这种回声的时延很大,对 通话质量影响也很大,相应的消回声系统不仅应考虑消除电路回声,而且还要消除声学回 声,但是数字网络回声消除的难点依然在于声学回声的消除。 到目前为止,回声抵消的主要工具是自适应滤波器。但是,对于声学回声来说,这种 : 方法令人难以满意,为此,研究者们一直在探索新的方法以有效地解决声学回声问题。目 前已经提出了很多种用于回声抵消地自适应算法。 鉴于自适应算法的不同优缺点,对其改进的策略也各有不同 1 为了提高回声抵消算法的收敛速度,可以对自适应算法步长的选择进行改进 ( 例如,加入步长控制算法) 。这是算法内部的调整。 2 由于语音信号具有很强的相关性,使得自适应滤波器收敛速度大大降低,那 么一种改进方法就是对语音信号做预处理来减少参考信号的相关性。 1 4 本文所做的主要工作 本论文将从i p 电话系统长延迟特性入手,分析i p 电话系统中的回声特点,重点讨论 一种改进型的适用于语音信号的信道估计算法,将改进型回声路径时间延迟估计算法加入 到回声抵消算法中,实现对传统回声抵消算法性能的增强,并在m a t l a b 7 0 环境下进行仿 真,从收敛速度、计算时间复杂度和稳健性三个方面分析改进型算法的性能。 全文共分六章: 1 :绪论。论述回声现象的产生及其消除技术、v o l p 技术给回声抵消带来的挑战,并 阐述本论文的主要研究工作。 2 :i p 电话系统中回声分析。该部分讨论i p 电话系统回声的特点,包括回声源分析、各 种网络设备对回声的影响。最后概述工p 电话系统的时间延迟,并在此基础上提出本文对具 有长延迟系统的回声消除基本策略。具体的i p 电话系统延迟分析在第4 章延迟估计算法研 8 南京邮电大学硕士研究生学位论文 第1 苹绪论 究及其改进中给出。 3 :自适应回声抵消技术。该部分在概述回声抵消技术的基础上对经典算法( l m s 、n l m s 、 r l s 、l s l 等) 进行详细分析,并通过仿真来说明算法的一般性能。 4 :延迟估计算法研究及其改进。本章首先详细讨论i p 电话系统的延迟现象以及延迟 与自适应滤波器算法的关系。然后重点研究延迟估计算法,并对一种适合语音信号的延迟 估计算法进行改进,对改进算法进行仿真分析以说明算法对于语音信号的稳健性。 5 :基于延迟估计的回声抵消算法。该部分将第四章讨论的改进型延迟估计算法应用到 回声抵消中,对现有回声抵消算法进行改进。并对算法进行仿真、分析。 6 :全文总结 9 南京邮电大学硕士研究生学位论文第2 章i p 电话系统回声分析 第2 章i p 电话系统回声分析 随着v o l p 技术的不断发展,分组交换技术已取代传统电路交换技术成为通信技术发展 的必然趋势。与传统电话相比,v o l p 的致命弱点就是语音质量较差。影响因特网语音质量 的因素是多方面的,重要因素之一是回声的影响u 制。本章主要是对v o l p 语音通信系统进行 回声分析。 2 1v o l p 技术概述 传统的电信交换网络以电路交换为基础,可以保证为用户提供足够的带宽,提供低时 延、低失真的实时通信服务,但其带宽的利用率不高。由于数据通信具有很强的业务突发 性,若按照峰值速率来分配电路带宽,则会造成资源的严重浪费;若按照平均速率来分配 的话,则会造成大量的数据丢失。在这种背景之下,提出了分组交换思想,并成为i p 网络 的基础。分组交换提供无连接的服务,同一链路在不同的时刻可以传送不同通信会话的数 据,实际上形成了对网络资源的统计复用,提高了网络带宽资源的利用率,而且其存储转 发机制可以依据网络的实际状态动态地选择路由,在一定程度上提高了通信的可靠性。 i p 电话系统就是指在以i p 为网络层协议的计算机网络中进行语音通信的系统。其实现 原理是先将p s t n 传来的电话语音转换为数字信号,经过编码压缩,通过t c p i p 协议网络和 其他种类的数据包( 数据、视频、图片等) 一同传送,在接收端经过重组、解压、合成、转 换重构实时语音,再通过p s t n 送达最终受话方。其原理框图如图2 - 1 所示。i p 电话系统中 采用的技术通称为v o l p ( v o i c eo v e ri p ) 技术u 。 从i p 电话原理分析,v o i p 技术属于分组语音通信的范畴,最早的研究始于2 0 世纪7 0 年 代初,并随着i n t e r n e t 技术的飞速发展而从理论研究转为实际应用。采用v o l p 技术的i p 电 话是以i p 为标志的网络分组化和以多媒体为目标的网络业务综合化两大主流技术融合的 结果,并成为i p 网络与电信网络优势互补的突破口。 j o 南京邮电大学硕士研究生学位论文第2 章i p 电话系统回声分析 图2 - 1i p 电话系统原理图 在传统电话网络业务不断发展的情况下,v o l p 的含义和设计目标超越了字面上的含义, 成为广义v o l p ,即除了电话通信以外,还可以进行交互式多媒体的实时通信( 包括语音、 图像、数据等) ,甚至还包括瞬时通信。其模块逻辑组成如图2 2 。因此,v o i p 可以看作是 一个正在演进的多媒体服务平台,是综合语音、图像、数据的基础结构,是传统电信网、 计算机网和有线电视网融合的基础技术u 。 图2 2 在本论文中,由于主要研究对象是话音信号的回声抵消问题,所以如果不特别说明, 南京邮电大学硕士研究生学位论文第2 章i p 电话系统回声分析 仍指传统的v o l p 技术,即其主要表示i p 电话系统中采用的技术。 2 2v o l p 回声源分析 一次完整的v o i p 通信中至少有两个参与者,而对每一个参与者来说,总存在两个通信 信道:发送信道和接收信道。简单地说,回声就是由发送信道中的信号泄漏到接收信道而 产生的。就回声的产生机理来说,回声可分为两类:电信号从发送信道泄漏到接收信道的 电学回声和声音信号从扬声器( 发送信道的终点) 泄漏到麦克风( 接收路径的起点) 的声学 回声。 回声是由模拟器件的信号泄漏产生的,数字网络部分不存在回声源。尽管在数字网络 的物理层,数字比特流要转变成模拟信号来传输,这种表示数字信号的模拟信号也可能会 发生泄漏,进而引起信号失真,但只要这种信号泄漏导致的信号失真不是大到使解码发生 错误,就不会影响信号质量。一旦这种信号泄漏导致的失真使解码发生错误,这时的信号 失真就是数字噪声,而不是回声。因此,实际在回声源定位分析时,无需考虑数字网络部 分的潜在回声源,只考虑模拟电路的信号泄漏就足够了。 为了方便回声定位的分析,图2 - 3 给出 7 v o i p 上的几种可能通信模式。 1 2 南京邮电大学硕士研究生学位论文 第2 章i p 电话系统回声分析 图2 - 3v o i p 的几种可能通信方式u 刈 电话l 和电话2 的通信过程为本地用户( 电话1 ) 的语音信号首先经过本地用户环路传到 本地用户交换机( p b x ) ,然后用户交换机( p b x ) 通过本地语音网关经工p 网络将信号传给 与同i p 网络相连的w l a n 接入点,最后w l a n 接入点将信号传给电话2 ;电话l 和电话3 的通信 过程为本地用户( 电话1 ) 的语音信号首先经过本地用户环路传到用户交换机( p b x ) ,然 后用户交换机( p b x ) 通过本地语音网关经i p 网络将信号传给与同i p 网络相连的i p 电话( 电 话3 ) ;电话2 和电话3 的通信过程为本地用户( 电话2 ) 的语音信号经w l a n 接入点通过i p 网 络将信号传给与同i p 网络相连的i p 电话( 电话3 ) 。其中本地语音网关和远端语音网关之 间是通过i p 网络连接的数字网络,用户与用户交换机之间是通过二线模拟电路连接的。用 户交换机与语音网关之间可以通过四线模拟发送一接收电路来连接,也可以通过i s d n 和 t 1 e 1 等数字网络来连接。 下面来讨论图2 3 所示的用户电话l 与用户电话2 通信时,用户电话1 的潜在回声源。 因为语音网关到w l a n 移动电话终端之间的i p 数字网络中不存在潜在回声源,所以不难 得出,图2 3 通信系统中的潜在回声源主要在本地用户交换机( p b x ) 、用四线模拟发送一 南京邮电大学硕士研究生学位论文第2 章i p 电话系统回声分析 接收电路同用户交换机相连的本地语音网关和远端用户终端( 电话2 ) 等几个设备中。 前面已经讨论过,回声对通信质量的影响主要取决于回声强度和回声延迟两个主要因 素。延迟很小的回声不会对通信质量造成影响,而越长的回声延迟意味着回声对通信质量 的影响越大。由于本地用户交换机( p b x ) 和本地语音网关产生回声的往返延迟很小,因 此它们不会影响通信质量。由此可见,用户电话1 的实际回声源是远端终端( 电话2 ) 。 下面在研究用户电话2 和用户电话l 的通信时,电话2 的实际回声源。同样,因为语音网 关到w l a n 移动电话终端间的i p 数字网络中不存在潜在回声,所以,不难得出电话2 和电话1 通信时,电话2 的实际回声源主要在用四线模拟发送一接收电路同用户交换机相连的远端 语音网关、远端用户交换机( p b x ) 和远端用户终端( 电话1 ) 等几个设备中。也就是说, 用户电话2 的实际回声源是远端语音网关、远端交换机( p b x ) 和远端用户终端等几个远端 设备。 同样的分析很容易推广到用户电话1 和用户电话3 通信时,用户电话l 的实际潜在回声源 是远端终端( 电话3 ) ;用户电话3 的实际潜在回声源是远端终端、远端用户交换机( p b x ) 和远端语音网关等几个远端设备。 至于其他通信模式下本地用户的潜在回声源,可以依次类推。譬如两个通过p s t n 和 i n t e r n e t 互连的v o i p 通信用户之间的通信,本地拥护的潜在回声源是对方所在地的用户交 换机、语音网关和通信终端设备。 综合以上讨论可知,i p 电话系统的实际回声源通常是对方所在地的远端设备,而回声 从远端经过网络传输到受话方必然存在一定的延迟,即回声路径延迟( e c h op a t hd e l a y ) , 因此可以从延迟角度来考虑提高回声抵消性能。 2 3 网络通信设备对回声的影响 由前面的讨论可以看出,v o i p 通信系统中主要包括用户交换机、v o i p 网关路由器和电 话终端等网络通信设备,下面讨论这些通信设备对回声的影响。 2 3 1 用户交换机 本文第l 章已经讨论,在传统的p s t n 通信系统d o - - 四线混合器是导致电路回声的主要 器件。 由上图2 3 所示,包含_ - 四线混合器的用户交换机( p b x ) 同样存在于v o i p 系统中,设 1 4 南京邮电大学硕士研究生学位论文第2 章i p 电话系统回声分析 混合器中的匹配阻抗为z 二,二线本地环路的阻抗为z & ,如果乙和z 去能够精确匹配, 混合器就能完成二线四线信号的无泄漏转换。但在i p 电话系统中,通常一个四线传输线 路要完成多个用户的通信业务,而不同的用户有着不同的本地环路阻抗,因此,通常只能 选择一个折中的阻抗匹配电路。这样,对一次具体的通信来说,就存在着阻抗不匹配问题。 这种阻抗不匹配使发送信号通过混合器时会产生一定程度的泄漏,使得部分发送信号又传 回讲话者。这样用户就又能听到自己的声音。因此,用户交换机是v o i p 系统电路回声的主 要来源。 2 3 2 电话终端 电话机是影响回声的另一个主要因素。从前面讨论的混合器原理可以看出电话机作为 混合器的一个负载而存在,当电话机的阻抗特性与混合器的匹配阻抗不匹配时,也会引起 信号泄漏,进而导致电学回声的产生。另一方面,在免提全双工通信系统中,当远端麦克 风被放置在能够直接接收到远端扬声器发出的声音或者是它经周围临近物体反射的反射 声时,远端扬声器播放的本地语音信号就会部分地通过远端麦克风传回到本地用户,这样 本地用户就又听到了自己的声音。 2 3 3 语音网关、路由器 语音网关是v o i p 系统的一个关键设备,主要完成信号编码、打包和抖动缓存等功能, 尽管这些功能实现中并不存在信号泄漏,但它引入了新的延时。语音网关引入的延时包括 算法延时和处理延时。其中,算法延时是由语音编解码器处理语音帧、对语音编解码造成 的,与编解码器的类型有关:处理延时是由对语音数据帧进行打包、解析以及为消除抖动 和失序而采用缓冲区导致的。前面已经讨论过,延时越大,回声对通信质量的影响也就越 大,因此语音网关也是影响回声的重要因素之一。 网络路由器的主要功能是决定最佳传输路径,完成数据包的转发。同语音网关一样, 网络路由器本身并不产生回声,但路由器将导致延时增加。路由器引起的转发延时主要与 所选取的路由算法、处理能力和网络状况有关。路由器引起的转发延时动态范围比较大, 是v o i p 网络延时的主要部分,因此路由器也是影响回声的重要因素。 南京邮电大学硕士研究生学位论文第2 章i p 电话系统回声分析 2 4 通信系统的回声与时间延迟的关系 在地球同步卫星用于通信时“,由于较长的往返延迟严重影响了正常通话,也正是 回声抵消器的出现才使卫星通信得到迅速的发展。这种回声抵消器的广泛应用是在大规模 集成电路出现以后。尽管光纤通讯的出现在很大程度上减小了卫星带来的延迟,但近年来, 一方面通信网络中大量使用语音编码,另一方面基于包传输的异步传输模式( a t m ) 和i p 电话的发展,这些再次给通信带来延迟。因此当代通信的发展越来越依赖于回声的控制。 在早年卫星通信的设计中,由于地面基站和地球同步卫星之间的通讯传播有很长的延迟, 在这种情况下,人们发现即使将通信中造成的回声消除得相当好,残余回声经过4 8 0 m s 的 往返延迟也使正常的通话难以进行。这个问题以及其他地面通信中与回声相关的问题都驱 使人们研究通话中回声的延迟和衰减对正常通话的影响。随着研究的深入,人们发现回声 所造成的影响不仅取决于它的大小,而且还与它的延迟时间有关。为了让人们仍然能够保 持正常的通话,就必须对回声信号进行衰减处理。 研究表明回声的时延越大,它所需要的平均衰减量也就越大,表2 1 给出了使回声 不影响通话时所要求的衰减,这些要求的平均衰减因延迟不同而不同。 回声延迟( m s )要求的平均衰减程度( d b ) o1 4 2 01 1 1 4 01 7 7 6 02 2 7 8 02 7 2 1 0 03 0 9 表2 1 对回声延迟的主观反映 2 5i p 电话系统的时间延迟概述 i p 网络最初是为数据传输设计的,绝大多数数据传输的特性之一就是异步传输,这 就意味着允许传输的延迟n 副。并且i p 网络的延迟是变动的( 抖动) 。i p 网络延迟抖动通 常由两种情况造成。第一种,数据包从发端传输到收端的过程中选择的路由不同,带来不 同的延迟。第二种,在选择相同的路由的前提下,数据包的排队时间不同。为了消除延迟 1 6 南京邮电大学硕士研究生学位论文第2 章i p 电话系统回声分析 抖动引入了抖动缓存,以使得存在的延迟保持固定值,而抖动缓存的引入将会增加总的延 迟。当网络资源紧张时抖动将会加剧,并且为了达到较小的丢包率抖动延迟将会更大。抖 动缓存通常将传输总延迟增加4 0 - 6 0 毫秒。 为了更高效利用网络带宽而采用的语音编码技术也会带来延迟,例如常用的g 7 2 9 a 编 码标准造成的单路( o n e - w a y ) 延迟大约为2 5 m s 。因此,典型的单路延迟大约在6 5 m s 到 8 5 m s 之间“。 话音信号在i p 网络中的传播过程也必然带来延迟现象,话音在网络中的传播速度大约 为2 5 0 k i n m s 叫。所以信号在网络中的传播过程也会带来一定的延迟现象。通常我们认 为在一个实时v o i p 网络中,如果单路延迟低于1 5 0 m s ,通话质量将是可以接受的。 由于v o i p 网关一边连接p s t n ,另一边连接因特网,因此在p s t n 端将产生电路回声,该 回声会传至i p 电话网关,影响通话质量。另一种是普遍存在的声学回声。i t u tg - 1 3 1 建 议单路延迟超过2 5 m s 时应采用回声抵消措施。由于以上讨论的i p 网络长延迟特性,i p 电话 必须采用更加高效的回声抵消算法来提高性能。 2 6 本文对i p 电话系统中的回声消除策略 由2 4 和2 5 的讨论我们知道,i p 电话网络中存在着很大的回声延迟部分,而v o l p 网络 延时加剧了回声现象,因此本论文考虑通过合理的延迟估计算法估计出延迟部分,然后再 进行回声抵消将加快自适应算法的收敛速度并大大减小运算量。 网络的延迟估计算法大致可分为两类。第一类,直接从自适应回声抵消器获得延迟估 计;第二类,通过一个辅助自适应滤波器得到估计值。 第一类,当自适应滤波器收敛于回声路径冲激响应时,延迟即可通过该自适应滤波器 估计出来。例如,将前导抽头的值和一个适当的门限值进行比较,从而估计出平坦延迟。 此后,再使用自适应滤波器来覆盖活动区。这种方法的缺陷在于,当延迟在一次通话中不 断变化( 延迟抖动) 时,此方法性能将大幅下降。 第二类,使用一个短长度的辅助自适应滤波器来减小实现的复杂性。原始信号先被低 通滤波并降采样( d o w n s a m p l e d ) ,然后再使用自适应滤波器。该方法和基于滤波器组的回 声抵消器相关。缺点在于其估计算法往往耗时比较长。 本文将研究一种基于互相关方法的延迟估计算法。该算法能够较好地进行话音信号在 网络中的延迟估计,该算法强壮且高效,最重要的是它尤其适合估计有色( c o l o r e d ) 信 1 7 南京邮电大学硕士研究生学位论文第2 章i p 电话系统回声分析 号延迟。我们知道语音信号是有色的,即具有强相关性。 算法的基本策略为: l :对传输信号和回声信号先进行低通滤波,然后分别对滤波后的信号进行降采样。 在合理选择低通滤波器和降

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论