(通信与信息系统专业论文)用于立体声回波对消的非线性预处理方法的分析和研究.pdf_第1页
(通信与信息系统专业论文)用于立体声回波对消的非线性预处理方法的分析和研究.pdf_第2页
(通信与信息系统专业论文)用于立体声回波对消的非线性预处理方法的分析和研究.pdf_第3页
(通信与信息系统专业论文)用于立体声回波对消的非线性预处理方法的分析和研究.pdf_第4页
(通信与信息系统专业论文)用于立体声回波对消的非线性预处理方法的分析和研究.pdf_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用于立体声回波对消的非线 性预处理方法的分析和研究 通信与信息系统专业 研究生田春丽指导教师何培宇 在电讯系统中使用声回波对消装置消除回声( 比如语音通信终端和电话会 议中由于扬声器一房间一话筒( l r m ) 这一声回授装置引起的回声) 。声回波对 消装置可由传统的单声道实现。传统的单声道回声对消器能在对消回声的同时 又能较好的辨识声回授通道,这样无论发送终端发生什么改变( 例如,在发送 终端说话人的位置或方位等空间信息的改变) ,单声道回声对消器都能很好的抑 制回声。 可是在实际应用中,为了增加声音的现场感,使用双声道技术是必要的然 而对于双声道情形,要必须唯一性地辨识两个声道,由此带来的双声道回波对 消问题相对于单声道来说解决起来更加困难。 本文正是在详细分析论述双声道所遇到的这些困难的基础上,从降低输入 信号之间互相关性的角度出发,使用非线性方法对输入通道的两路信号进行去 相关预处理为了正确真实地分析评价每一种非线性方法对语音去相关预处理 的效果和对语音失真度的主观影响,在非线性去相关预处理工作中使用l r m 声 回授通道冲激响应的真实数据是重要和必要的。为此我们通过使用 m s 3 2 0 c 5 4 2d s p 和- h $ 3 2 0 a c o l 在一个真实房间中实时测试获得了所需要 的l r m 声回授通道冲激响应的真实数据, 文中我们通过使用u t m 声回授通道的真实数据和真实语音对每一种非线 性方法进行了去相关预处理分析。谱分析和仿真实验表明:软限幅方法与其它 几种非线性预处理方法相比,不仅模型简单,实现起来容易,对声音的听觉效果 影响较小,而且对失配的改善效果较为显著 关键词立体声回波对消非线性预处理软限幅器 a n a l y s i s a n dr e s e a r c ho fn o n l i n e a rp r e p r o - c e s s i n gs o l u t i o nt os t e r e o p h o n i c a c o u s t i ce c h o c a n c e l l a t i o n c o m m u n i c a t i o na n di n f o r m a t i o ns y st e m g r a d u a t e t i a nc h u n l i s u p e r v i s o r h e p e i y u a c o u s t i ce c h oc a n c e l e r s ( a r c s ) a r e n e c e s s a r yf o r c o m m u n i c a t i o ns y s t e m ss u c ha s t e l e c o n f e r e n c i n gt o r e d u c ee c h o st h a tr e s u l tf r o mc o u p l i n gb e t w e e nt h e 1 0 u d s p e a k e r a n d m i c r o p h o n e w i t hc o n v e n t i o n a ls i n g c h a n n e l ( m o n o p h o n i c ) s y s t e m s ,s u c h a r c ss i m u l t a n e o u s l yr e d u c et h ee c h oa n di d e n t i f yt h ea c o u s t i cp a t h s ot h a tt h ee c h or e m a i n sc a n c e l l e dn om a t t e rw h a t h a p p e n sa t t h er e m o t et r a n s m i s s i o nr o o m ( s u c ha s t h ec h a n g eo f s p a t i a li n f o r m a t i o n ,f o re x a m p l e , t h ec h a n g eo fl o c a t i o no rd i r e c t i o no f s p e a k e ro f t h er e m o t et r a n s m i s s i o nr o o m ) t oe n h a n c et h es o u n dr e a l i s mi n a p p l i c a t i o n , t w o c h a n n e la u d i oi s n e c e s s a r y h o w e v e r ,i nt h i sc a s e ( s t e r e o p h o n i cs o u n d ) t h ea c o u s t i ce c h oc a n c e l l a t i o n p r o b l e mi sm o r ed i f f i c u l tt os o l v eb e c a u s eo ft h e n e c e s s i t yt ou n i q u e l yi d e n t i f yt w oa c o u s t i cp a t h s i nt h i s p a p e r , o nt h eb a s i so f e x p l a n a t i o n o ft h e s e p r o b l e m s ,w eu s en o n l i n e a rp r e p r o c e s s i n gt od e d u c e t h ec o r r e l a t i o no f t h et w or e c o r d e d s i g n a l s t o a n a l y z e a n d j u d g e c o r r e c t l y t h er e s u l to f d e c o r r e l a t i o no f e v e r yn o n l i n e a r p r e p r d c e s s i n g 3 s o l u t i o na n dt h es u b j e c t i v ee f f e c t o f e v e r y n o n l i n e a r p r e p r o c e s s i n g s o l u t i o no n s p e e c h ,i t i s v e r yi m p o r t a n t t ou s ef a c t u a ld a t ao fl r mi m p u l s i v er e s p o n s e i n t h i sp a p e rw et e s tl r mi m p u l s i v er e s p o n s ei nar e a l r o o m u s i n g t m s 3 2 0 c 5 4 2a n dt l c 3 2 0 a c 0 1i no r d e rt og e t f a c t u a ld a t ao fl r mi m p u l si v er e s p o n s e u s i n gf a c t u a ld a t ao fl r mi m p u l s i v er e s p o n s ea n d r e a ls p e e c hw e a n a l y z ea n dj u d g ee v e r yn o n l i n e a r p r e p r o c e s s i n gs o l u t i o n s p e c t r u ma n a l y s e sa n d e x p e r - i m e n t ss h o wt h a ts o f t l i m i t e rs o l u t i o ni sb e t t e rt h a n t h o s en o n l i n e a r p r e p r o c e s s i n gs o l u t i o n sp r o p o s e di n p a p e r 2 】 k e yw o e d s s t e r e o p h o n i c a c o u s t i ce c h oc a n c e - l l a t i o n ( s a e c ) 4 e p r o c e s s i n g 第一章导论 在电讯系统中与回声有关的问题极为普遍。例如,在免提式电话和车载式 电话的通信过程中,来自于远端的语音信号如果在近端不加以处理,那么经过 一段时延之后,会与近端的语音信号一起又发送到远端,形成回声这将会影 响正常的双工通信。抑制电讯系统中回声的典型手段是使用自适应回波对消技 术。用自适应的方法实现回波对消是一种从理论上看非常完美的方案,只要能 提供个和回声相同的复制信号,就可以将回声从系统中消掉。 自适应回波对消原理图如下图l 所示。由图可见,远端接收房间的话音信 号经由未知的l r m ( l o u d s p e a k e r r o o m m x o r o p h o n e ) 系统构成的声回授通 道产生回声,回声又连同近端话音一起被传输到远端。在一个闭环系统中,当 满足一定条件时,就会产生回声、啸叫等严重影响通话质量的现象。自适应声 回波对消的原理是:通过对未知l r m 系统冲击响应的辨识,产生出一个同回声 尽量相同的信号,在近端话音和回声的混合信号传向远端之前从中减掉回声。 图l自适应声回波对消基本框图 自适应声回波对消问题实质上是一个利用自适应技术进行系统辨识的问 题。图2 示出了自适应系统辨识框图。图中信号s k 既作为自适应处理器的输入, 也作为未知l r m 系统的输入。为了减小误差信号e k ,自适应处理系绕将试图模 仿l r m 系统的传输特性。当自适应过程结束后,在理论上自适应系统的传输特 性将与l r m 系统的传输特性相同。所以实现自适应声回波对消的关键技术就 8 是对消器要合适地辨识接收房间的l r m 声回授通道。 图2自适应系统辨识框图 传统上由单声道实现的自适应声回波对消系统能在对消回声的同时又能较 好地跟踪辨识l r m 声回授通道,这样无论发送终端发生什么改变( 例如,在发 送终端说话人的位置或方位等空间信息的改变) ,单声道回声对消器都能很好的 抑制回声。 可是在某些应用( 比如在电话会议系统) 中,仅仅使用单声道技术还是不 够的。为了增加电话会议参与者的亲临现场感,使用双声道技术是必要的。具 有双声道的立体声电话会议系统相对于一个声道的单声道电话会议系统来说更 具有现场感和真切性,因为立体声电话会议系统中近端听话人能够利用发送端 的空间信息帮助辨别远端发送房间中足谁在发言。这对于有许多发言人要参与 的电视电话会议系统来说尤其重要。实现j s 回波对消的关键技术是对消器合适 地辨识接收房间的声回授通道。然而对于立体声对消系统来说,由于输入通道 的两路信号来自于同一个信源s ,所以两输入信号之问有很强的互相关性,这 给& 墟c 中滤波器唯一性地辨识接收房间的两个声回授通道带来了难度。 本文正是在详细分析论述双声道所遇到的这些困难的基础上,从降低输入 信号之间互相关性的角度出发,使用软限幅器模型对输入通道的两路信号进行 非线性预处理。实验表明,我们所用的方法与文【2 】提出的几种菲线性预处 理方法相比,不仅简单,实现起来容易,而且对声音的听觉效果影响小最重要的 是,度量立体声回波对消效果的重要参数一失配改善的效果特别显著。 本文各章节的内容安排如下: 第二章简要介绍了立体声回波对消的基本原理,结构框图和涉及到立体声 9 回波对消的一些基本概念,以及研究立体声回波对消的意义a 第三章分析讨论了立体声回波对消所遇到的问题:非唯一性问题和失配问 题以及与这些问题密切相关的房间冲激响应的拖尾效应。探讨了立体声回波对 消工作所面临的最大挑战一矢配问题,以及解决矢配问题的最有效方法一即对 输入通道的两路信号进行非线性预处理。 第四章介绍了研究s a e c 问题所做的前期工作一l r m 声回授通道的测试工 作。 第五章仿真分析:分析探讨了目前常用的几种非线性预处理方法对矢配的 改善效果,以及我们所使用的新的非线性预处理方法基于软限幅器模型的方 法。通过仿真验证了:我们所用基于软限幅器模型的方法与目前几种常用的方 法相比,不仅对矢配的改善效果显著,而且还有很大的实用价值。 第六章总结 1 0 第二章立体声回波对消概述 2 1 立体声回波对消的基本原理和结构框图 图2 1 立体声回波对消原理图 图2 1 所示是立体声回波对消器的方框图,图中所示的立体声回波对消系 统只画出了一个麦克风信号的情况,类似的分析适用于另外一个麦克风信号。 由图可知立体声回波对消系统实际上是一个辨识系统。待辨识系统是一个多输 入未知线性系统,这个线性系统就是一个在声学屏蔽空间中由扬声器一房间一 麦克风( l r m ) 所组成的声回授系统通道,这一声回授系统通道用一对房间冲击响 应( h h z ) 表示其中h 表示由麦克风m 。到扬声器l 。的声回授通道,h :衰示 由麦克风m 。到扬声器l :。的声回授通道。s a e c 用一对自适应滤波器( 、,6 :) 来设法模拟这个未知线性系统。同样的模型适用于接收房间中另外一个麦克风 的情况。( g ,g :) 表示发送房间的一对冲击响应,其中g 和g 。分别表示信源 s 到扬声器l 。和扬声器l 。的声回授通道。( m 。,m :。) 和( m 。:。) 分别指 接收终端和发送终端的麦克风组。( l 。l :。) 和( l 。l 。) 分别指相应的扬声 器组。n l 表示非线性预处理。 注意,这里的接收终端和发送终端只是相对丽言,因为所谓的发送端和接 收端实际上是进行双工实时她通信。在这里为了分析方便,我们只画出了一个 立体声回波对消系统的情况,类似的分析适用于另外一个s a e c 对消系统。 如图2 。l所示,从发送终端送出的两路信号x ( n ) 和x :( 1 i ) 经过非线性预 处理后( 记为x r 1 ( n ) 和x ,2 ( n ) ) 送往接收终端,接收终端用一对扬声器把收到 的语音信号还原成语音。因为是双工通信,接收端在收到发送端送来的语音信 号的同时,有可能又向发送端发送语音信号,这时如果我们不对接收端发出去 的语音信号进行处理的话,那么在发送端就会听到自己回声。为避免这种情况, 我们在接收端用一对自适应滤波器把刚才的回声过滤掉。如果s a e c 的自适应滤 波器组( 6 1 , 2 ) 能把接收房间的声回授特性( h 。h :) 学习得很像的话。就会有 很好的对消效果,那么立体声电话会议系统的通信质量就会很完美,所以自适 应滤波器组( 6 1 ,f i 2 ) 如何才能合适地辨识接收房间的声回授通道是我f l i t 作的 最终目的,也是实现自适应声回波对消的关键技术。 2 2 有关立体声回波对消问题的一些基本概念 2 2 ,1何谓立体声回波对消 立体声回波对消是相对于传统的单声道回波对消而言。传统的单声道回波 对消指的是输入信号仅为一路的情况。如图1 所示,图中由远端发送房间送来 的信号只有一路x i ( n ) 。丽立体声回波对消指的是的输入信号有两路的情况。如 图2 1 所示的立体声回波对消原理图,图中的远端发送房问送出两路输入信号 x1 ( n ) 和x 2 ( n ) 至近端接收房溺。x 1 ( n ) 和2 f n ) 是在发送房间分别通过两个不同的 l r m 声回授通道所形成的两路输入信号。 2 2 2 何谓非线性预处理 非线性预处理是针对多声道回波对消( 包括立体声回波对消) 所提出的概 念。在多声道情形,由于输入的多路信号( 至少有两路) 都来自子同个信号 源s ,所以输入信号之间有很强的互相关性。正是这个强互相关性,给多声道 回波对消( 包括立体声回波对消) 工作带来了很大的困难。为了解决这个难题, 1 2 有学者从理论上提出了并已经过实验证明了的目前最好的解决方案:即在输入 信号送往接收房间和自适应滤波器之前先对输入的多路信号进行去相关处理。 这个去相关处理具体为就是给输入的原始语音信号增加一个类似语音的量,这 个类似语音的量是输入信号自身的非线性函数,所以称为非线性预处理。这就 是非线性预处理概念的来历。 2 3 研究立体声回波对消的意义 在某些应用( 比如在电话会议系统) 中,为了增加电话会议参与者的亲临 现场感,使用双声道技术是必要的。具有双声道的立体声l 邑话会议系统铟对于 一个声道的单声道电话会议系统来说更具有现场感和真切性,因为立体声电话 会议系统中近端听话入能够利用发送端的空间信息帮助辨别远端发送房间中是 谁在发言。这对于有许多发言人要参与的电视电话会议系统来说尤其重要。所 以研究立体声回波对消课题有很大的应用前景和实用价值。 第三章立体声回波对消问题所遇到的问题及解决方案 3 1 立体声回波对消的非唯一性问题 下面分析立体声回波对消器所遇到的非唯一性阃题。设发送房间的冲击响 应的长度为h ,自适应滤波器的长度为l ,接收房间j 申击响应的长度为n 。如图 2 1 所示,从发送房间出来的两路信号分别记为x ( n ) 和) ( 2 ( n ) ,x 1 ( n ) 和x 2 ( n ) 由同 一个信源s ( n ) 分别卷积发送房间的两个不同的声回授通道l r m l ( 用g i 表示) 和 1 3 l r m 2 ( 用9 2 表示) 得到,即: x 1 ( n ) :s ( 1 1 ) + 9 1 x2 ( n ) :s ( n ) 9 2 ( 3 1 ) ( 3 , 2 ) g t 和9 2 分别是发送房间的两个声回授通道的冲激响应。 假定系统( 发送房间) 是线性时不变的,因而我们有下面的关系式: x 7 1 m ( n ) + g2 m = x 7 2 m ( n ) 9 1 m( 3 3 ) 其中 虹,m = ix ,( n ) x i ( n 1 ) x i ( n r e + 1 ) 】7 ,i = 1 ,2 是发射房间中麦克风输出的信号采样值矢量,t 表示一个矢量或一个矩阵的转 置, gi ,m :【g j 09 1 1 g i n 1 】- 1 2 是发射房间的两个冲击响应。 定义任意长度p 的信号矢量为 x i ,p ( n ) :【xi ( n ) x ( n - 1 ) x ( n - p + 1 ) r - 1 ,2 p 根据分析假设可取值为p = m ,i 或n ,用h ( 阳,2 ) 表示接收房间冲击响应 自适应滤波器学习的冲击响应记为 j ,p ( n ) = 【 1 o ( n ) i 1 ( n ) i , p - 1 ( n ) 1 ,i _ 1 ,2 在此p 根据我们分析的情况,取值为p = m ,i 或n 定义联合矢量 l h 7 1 n h 7 2 n1 【 t i p 67 2 p j 【x7 t 。p x t 2 pj 1 4 : i i : n p p 够”如 回声对消器的目标就是根据误差信号efn ) 最小化准则训练滤波器学习接收房 间声回授通道h ( i = 1 ,2 ) 根据建立的模型滤波器可定义回归最小均方误差准 则( r e c u r s i v el e a s t s q u a r e se r o c r i t e r i o n ) j ( n ) :p = 1 唧 n 。pe 2 ( p )( 3 4 ) 其中 是指数衰减因子( 0 ( 九1 ) e ( n ) = y ( n ) - r 72 l ( n 】2l ( r i( 3 5 t 是n 时刻麦克风输出y ( n ) = h 7 2 n x 2 n ( n ) 和它的估值之间的误差信号( 3 4 ) 式的 最小化导出了下面的范数方程 6 1 l ( n ) r ( n ) 【】= r ( n ) 6 “( n ) 其中r ( n ) :p = 1 唧x 呻【x 1 l ( p ) 1【xt 1 l ( p ) x 12 l ( p ) 1 x 2 l ( p )( 3 7 ) 是输入信号协方差矩阵的估值 x 1 dp ) r ( n ) = p :1 一 m 9y ( p ) 【j x 2 l ( p ) ( 3 8 ) 是输入信号与输出信号之间的互相关向量估值 3 1 1 范数解的非难一性 当l ml 对于l m 情形。任意一种算法得出的都是非难一性解: 62 l ( n ) = h 2 。( n ) + u ( 39 ) 是一个任意常量t l = 【9 72 m 0 0 0 g l 。o 0 】7 ( 3 1 0 ) u 是奇异矩阵r ( n ) 零空间的一个向量 从式( 3 9 ) 我们可看出在l m 情形,范数方程有无穷多个解,即解是不 唯一,这唯一性n 解“的值取决于发射房间的冲击响应,这当然是不能令人忍受, 因为9l ,。和g2 ,。是瞬间变化的,比如一个人停下说话,另外一个入又接着说 的情形 3 nl q m a xix ;( n ) l x i ( n ) = ( n )当ix ,( n ) l :m a xf xi ( n ) f ( 4 6 ) l - a m a xi ) ( j ( n ) l 当x i ( n ) q m a xix ( n ) l a 是控制限幅程度的量0 = 1 2 ) 因为我们对输入信号进行了归一化处理 所以这里m a xi x i ( n ll :1 真实验表明我们所用的这种非线性预处理方法与文 2 】提出的几种非线 性方法相比不仅方法简单实现起来容易,而且失配改善的效果非常显著另 外对语音的听觉效果影响也最小 5 2 相关性分析 由第三章度量输入信号之间互相关公式( 3 1 3 ) s x l x 2 ( d y ( d = ( sx 1 ( f ) s x 2 x 2 ( f 】) 垤 ( sx k x l ( f ) :。一”e ( x k ( n ) xl ( n t ) e 一2 )k ,i = 1 ,2 ) 利用公式( 3 1 3 ) ,我们可以仿真计算非线性预处理前后输入信号之间的互相 关。从而可分析比较出每一种非线性预处理方法去相关洼的效果。其中sx , x 2 ( t ) 表示输入信号x l 和) ( 2 之间的互功率谱,s x lx 1 ( f ) 和s x 2 x 2 ( f ) 分别表示 x l 和x 2 的功率谱【1 3 1 f 1 4 】o 本文中所有信号功率谱的估计均采用经典谱估值的韦耳奇平均周期图 法【1 5 1 【16 1 【17 】。输入信号的自相关和互相关的数学计算直接采用m a t l a b 的谱 分析函数【18 1 【1 9 1 。 5 2 1 语音信号自相关性分析 f r e q u e n c v f r e q u e n c y f r e q l i o n w f r e q u e n c v 田毫2 语音信号x 1 的白相关分析【话音信号x l 由语音信号潦。仝田硕士研竞生八学考试尧语试题示纠 听力部分”与所测t 的戈迭房间冲激响应g l 相善积而得。语音信号潭的采样频率为8 k h z 田中t a o 为相关时间常敷罔期田估计使用的是2 5 6 点f 凡 f g ( h a n n i n g 敷据段车堂叠所得出的结果) 由图5 2 中可知。当相关时间常数t a o = 2 0 时,x l 的自相关性较强随着相 关时间t a o 的增大相关性逐渐减弱这说明语音信号自身存在强相关性 3 5 o口暑fuo四三。苎o】ecou一01n m口暑三ao薹oulj心_locou3 o口三芒o乏oucmcou鱼3 母口丑to田芝uco高cou6jn f r e q u e n c y f r e q u e n c y 图5 3 非践性 委地理对语音信号白相关性影响分析( 语音信号菲全圉硕士研亢生入学考试其 培试题示例听力部分1 与所测量的发遗房阀冲澈响应酐柄卷积得到x 1 语音信号潭的采样麓率为 8 k h z ,用期图估计使用的是2 5 6 点f f t , 汉宁亩( h 孙n l n g ) 欺据段车重叠所得出的结幕使用的非线性 预处理方法为软限幅相关时间 a o 都为2 0 ) 图中使用的是软限幅非线性预处理方法a 表示软限幅参数当a = 1 时表 示没有非线性预处理( 因为x 1 已经归一化) ,a 越小表示非线性预处理程度越 oo暑芒口四苫心ucoje l j o j - o 芎 深,由图可知,随着非线性预处理程度的加深,语音信号自身的自相关性改善 不大。这说明了菲线性预处理不能有效去除语音信号的自相关性这也是语 音信号难以处理的一个原因 5 2 2 语音信号互相关性分析 f r e q u e n c y ( x 1 0 0 f r e q u e n c 3 t ( x 1 0 0 ) 霹“两蹿 考号妁互相关 语音信号薄垒瞳硕士研完生入学考试荚语试题示杏衙力部分与所潮量的 炭迸房闻冲激响应9 1 和9 2 分剧相喜积得到x l 和x z 语音信号懑的采样期串为8 k h z ,用期图估计使用的 是8 1 9 2 x2 点f f r 汉宁育( h a r m i n g ) 敏据段零重叠所得出的结果互相关时间i a 0 均为车使用软限幡非线性 预处理方涤,田中a = o 1 时仍时声音的听觉效秉影响不走1 图中表示两路信号x 1 和) ( 2 的互相关性使用软限幅非线性预处理方法当a = l 时表示没有进行非线性预处理随着a 的减小非线性预处理程度加深随着非线 。口mlca日王mutimj8cou 口口mlco日苫。苎mj。cou o口rq芒oz ou cja co u 性预处理程度的加深,两路输入信号x 1 和) ( 2 之间的互相关性有减弱的趋势这说 明菲线性预处理去除输入信号的之间的互相关性这一思想是可行的 熙萝瓤阿7 l 。”。”。”8 ”i;i h m l f 明嘲c h x l 0 0 p 住】 o 善 暮 0 5 l 毫 莹 1 言 0 5 善 f f w e l l c “x 1 0 0 1 0 如3 04 05 06 07 08 0 f 眯1 0 0 哟 5 5 种语首相同影响效耒下谱昔蛭过不同的非线性预处理后所得出的互相关( 语音信号潭仝圆j 蔓士 研究生八学考试英语试题示例听力部分”与所测量的炭退房旧j 中敏响压g l 和9 2 分剐相卷积得到x 1 和x 2 语音信号源的采样频率为8 k h z 用期圈估计使用的是8 1 9 2x 2 点f f t , 汉宁窗( h 期n i n g ) 数据段零重叠所得出 的结果王相关时间t a o 抽为搴1 由图可知,对声音听觉效果同样影响的条件下,采用软限幅方法去除互相关 性的效果最显著,后面的仿真分析也证明了这一点 5 3 非线性预处理方法的仿真分析 s - 3 1 目前常用的菲线性预处理方法对矢配的改善效果及相应的非线性预处 理深度对声音失真程度的影响分析 为了说明这几种非线性变换的效果,我们用了真实的语音信号进行仿真,其 1 5 o 1 5 o t 5 a 8ae臼如u熏石u量口凸粤钏k,ju 皂aaa叫ylu 内容是”全国硕士研究生入学考试”,此即发送房间的信源s 。发送房间的冲击响 应( 9 1 和9 2 ) 和接收房间的冲击响应( h 1 和h 2 ) 都是在真实的房间里进行实测所得 的实验数据由于本实验只是为了得出各种非线性处理的相对效果,这里发送房 间和接收房间只取到6 4 阶自适应滤波器的长度也取为6 4 阶。本实验仿真用的 算法都是快速递归最, j , - - 乘算法f r l s ( f a s tr e c u r s i v el e a s ts q u a r e sa l g o r i t h m ) ,衰减因 子x = 1 一i ( 1 0 + l ,表2 表5 给出了我们的仿真结果 m i s a l i g n m e n h = ”姆1 0 i i h t 6 tl l “ m i s a l i g n m e n t 2 = 1 0 。i 0 9 1 0i ih r 吼i i i ih 2i i ( 6 a ) ( 6 b ) 表2 用h a l f - w a v e 非线性预处理方法所得出的实验数据 表3 用f u l l - w a v e 非线性预处理方法所得出的实验数据 3 9 i 观声音质量 原声 有大的直流噪声 ( 但不刺耳) 直流噪声增大 噪声继续增大 噪声继续增大 ( 听觉效果很差) m i s a l i g n m e n t l ( d b )m i s a l i g n m e n t 2 ( d b ) 均方误差m s c ( d b ) 01 3 4 5 7- 1 9 1 1 5- 4 6 1 7 8 0 1- 6 7 1 3 07 9 1 2 5- 3 6 4 8 2 o 2 o 3 0 4 8 5 9 7 2 - 9 4 5 0 2 9 9 3 7 9 9 9 1 4 2 1 0 8 0 0 9 1 1 3 0 0 5 3 2 3 6 0 - 2 9 6 2 0 2 7 5 4 7 表4 用h a r dl i m i t e r 非缉隆预处理方法所得出的实验数据 5 3 2 我们所用的基于软限幅模型的非线性预处理方法对矢配的改善效 果及对声音的失真影响 主观声音质量 没感觉 没感觉 没感觉 没感觉 稍稍有沙沙感 没感觉 没感觉 音量稍微变小 伴有沙沙感 同上 同上 同上 同上 同上 d m i s a l i g n m e n t l ( d b ) m i s a l i g n m c n o - , ( d b ) 0 9- 7 8 3 1 1- 8 0 3 2 7 0 77 5 4 9 178 0 3 2 0 6- 7 5 9 4 4 7 8 3 9 8 0 57 7 2 2 0 7 9 8 1 1 0 4- 1 0 5 8 6 2 1 0 1 0 4 7 0 3- 8 4 7 5 7 - 8 8 3 2 9 029 5 4 9 2 1 0 1 0 5 9 0 11 2 2 1 5 1 - 1 2 8 7 5 6 0 0 9 0 0 8 0 0 7 0 0 6 00 5 1 2 5 9 3 7 1 2 9 7 9 1 1 3 2 9 1 3 1 3 4 5 1 9 1 3 3 6 1 6 1 3 1 8 4 4 1 3 5 0 7 2 1 3 7 5 3 0 1 3 8 4 6 2 1 3 6 4 7 4 均方误差m s c ( d b ) - 4 1 4 4 8 4 3 6 2 7 - 4 3 4 2 8 4 2 9 6 4 3 9 5 3 8 4 2 1 2 3 4 1 9 1 8 _ 4 26 1 2 4 2 8 9 6 4 3 2 3 1 _ 4 3 5 7 0 1 4 3 9 6 6 4 4 4 1 4 表5 软限幅嚣模型实验数据 由以上实验结果可知我们所用的软限幅器模型非线性预处理方法与其 他非线性预处理方法相比不仅方法简单。实现起来容易,对声音的听觉效果 影响小,而且即使限幅很厉害 即n 很小) 时,声音的听觉效果只是沙沙的感觉 加重,但不像其它的非线性处理那样感觉刺耳,而且最重要的是:失配改善的 效果非常显著b b 较f u l l w a v e 和h a l f - w a v e 非线性预处理方法,当q :0 ,9 时声 音的听觉效果己经很受影响了,可是失配仍然大于( - 2 d b ) ;对于h a r d l i m i t e r 方法 当a :0 1 时,虽然失配分别达到6 7 1 3 0 d b 和79 1 2 5 d b ,可这时声音的失真很严 重。几乎让人无法忍受,而我们所提出的软限幅器模型方法,当d :06 时在对 声音的听觉效果影响较小的情况下失配分别达到- 1 0 6 8 6 2 d b 和一1 0 1 0 4 7 d b 可 见我们所用的方法明显优于其它的非线性方法为了更进一步比较说明软限 幅器模型方法的有效性下面我们用自相关性为零的白噪声和系数为o2 的 一阶a r 模型( 分别如图2 和图3 所示) 以及真实语音( 图4 ) 在突变点这一位 要( 在此突变点位置指的是针对同一个说话人。但说话人的位置发生了变化j 做一析比较 图5 3 1 输入信号是白噪声情况下,采用软限幅器模型所得出的均方误簋收敛曲线 盎 3 * 霉 散步妊 圈5 3 , 2 靖八信号是a r 模型时用软限幅嚣模型对输入信号非线性预处理后所得出的均方诀蔓 收敛曲残 惯敏步长 图5 3 3 精入信号是真奏; 音时用软限幅嚣模型对输入信号进行非线性预处理后所得出的均方 误盖收簸曲线 4 2 毫3 4 真实语音在突变点位1 ( 第5 1 2 0 点) 的细化圈 图2 的输入信号是自相关为零的白噪声图3 是输入信号有一定自相关的一 阶a r 模型图4 的输入信号是强自相关的真实语音,由图2 4 可知,对于每一种输 入信号,随着非线性预处理程度的加深均方误差收敛曲线在突变点位置的变 化都会愈加平缓:但是随着输入信号自相关程度的加深,非线性预处理的效果逐 渐削弱这表明非线性预处理的效果不仅和输入信号之间的互相关有关而且还 和输入信号自身的自相关有关 第六章总结 本文在详细分析论述t x x 声道所遇到的输入信号之间强相关性这一困难的 基础上,从降低输入信号之间互相关性的角度出发,使用非线性方法对输入通 道的两路信号进行了去相关预处理为了正确真实地分析评价每一种非线性方 法对语音去相关预处理的效果和对语音失真度的主观影响,在非线性去相关预 处理工作中我们使用了l r m 声回授通道冲激响应的真实数据和真实语音。其中 l r m 声回授通道冲激响应的真实数据是我们通过使用_ r h $ 3 2 0 c 5 4 2d s p 和 t m s 3 2 0 a c 0 1 在一个真实房间中实时测试获得。 通过使用l r m 声回授通道冲激响应的真实数据和真实语音对每一种非线 性方法进行了去相关预处理分析。谱分析和仿真实验表明:软限幅方法与其它 几种非线性预处理方法相比,不仅模型简单,实现起来容易,对声音的听觉效 果影响较小,而且对失配的改善效果较为显著 参考文献 【1 1j b e n e s t y ,d r m o r g a n ,a n d m m s o n d i ”a b e t t e r u n d e r s t a n d i n ga n da ni m p r o v e ds o l u t i o nt ot h es p e c i f i cp r o b l e m s o fs t e r e o p h o n i ca c o u s t i ce c h oc a n c e l l a t i o n “i e e et r a n s s p e e c ha u d i op r o c e s s i n 9 。v 0 1 6 ,p p 1 5 6 1 6 5 ,m a r 1 9 9 8 【2 1 d e n n i sr m o r g a n s e n i o rm e m b e r ,i e e e ,j o s e p hl h a l l a n dj a c o b b e n e s t y ,m e m b e r i e e e ,“i n v e s t i g a t i o n o fs e v e r a l t y p e so fn o n l i n e a r i t i e sf o ru s ei ns t e r e oa c o u s t i ce c h o c a n c e l l a t i o n “i e e et r a n s a c t i o n so n s p e e c h a n da u d i o p r o c e s s i n gv 0 1 9 n o 6 ,s e p t e m b e r 2 0 0 1 【3 】j b e n e s t y f a m e n d ,a g i l l o i r e ,a n d y g r e n i e r ,。a d a p t i v ef i l t e r i n ga l g o r i t h m sf o rs t e r e o p h o t l i c a c o u s t i ce c h oc a n c e 工工a t i o n ”i np r o c ,i e e ei c a s s p 1 9 9 5 p p 3 0 9 9 3 1 0 2 【41t i ,t l c 3 2 0 a c o i c s l n g l e - s u p p l ya n a l o gi n t e r f a c e c i r c u i t d a t am a n u a l 1 9 9 6 【51 戴明桢编t m s 3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论