(模式识别与智能系统专业论文)语音增强技术在数字通信中的应用.pdf_第1页
(模式识别与智能系统专业论文)语音增强技术在数字通信中的应用.pdf_第2页
(模式识别与智能系统专业论文)语音增强技术在数字通信中的应用.pdf_第3页
(模式识别与智能系统专业论文)语音增强技术在数字通信中的应用.pdf_第4页
(模式识别与智能系统专业论文)语音增强技术在数字通信中的应用.pdf_第5页
已阅读5页,还剩68页未读 继续免费阅读

(模式识别与智能系统专业论文)语音增强技术在数字通信中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语音增强技术在数字通信中的应用 摘要 随着人们进入数字信息时代,数字语音通信在生产和生活等各方面起到越来越重 要的作用。语音增强的目的就是为了在保持语音可懂度和清晰度的前提下,对语音进 行时域或频域的变换与处理,从而使语音在音强、音长、音调、音质与纯净度等方面 得到一定程度的提升。通过增强处理可以改善原系统在外界环境干扰条件下的性能, 提高语音数字通信质量。 本论文的主要研究对象是应用于语音增强的自动电平控制系统。该语音增强系 统,其实用化的基础是进行语音与音频检测,核心是完成自动增益控制,关键是符合 协议标准。自动电平控制系统运行于数字通信网络之中,首先需要选取合适的音频信 令检测算法,以保证不影响非语音数据流的传输;其次是根据语音信号的特征进行识 别,以决定是否需要开启电平控制;最后才能根据当前语音信号电平进行适当调整。 论文尝试从新的角度,采用新的方法构建灵活可行、稳定性高并符合i t u tg 1 6 9 协 议要求的自动电平控制系统。该系统还应能满足数字通信网络的实际需求,并能在综 合实验中得到较好的结果。论文从以下三个方面来展开研究: 首先在语音检测方面,论文研究了基于频谱特征的语音激活检测方法和单音频信 号快速检测方法。语音激活检测是任何语音处理系统中的基础部分,其目的是为了区 分语音与非语音两种状态,以便后续处理。基于频谱特征的语音激活检测方法易于实 现,计算量小且准确率高,适合较高信噪比的实时数字通信网络中。音频信号检测则 是面向通信网络中特殊的音频信令,采用快速迭代方法计算单频点的频谱幅度,准确 度高,响应时间快。这两种检测方法在实际系统的设计中得到使用,并获得了良好的 效果。 其次,在增强算法方面,论文在研究了各类增强方法之后,提出一种最优自动增 益控制方法,使用简洁的方式达到电平控制的目的,并通过对增益的平滑处理,得到 更好的语音增强效果。 最后,结合实际应用与g 1 6 9 协议的指标要求,实现了自动电平控制语音增强系 统,并通过m a t l a b 仿真证明了各算法的有效性。 关键词:语音增强,自动电平控制,语音激活检测,自动增益控制,数字通信 语音增强技术在数字通信中的应用 a b s t r a c t d i g i t a ls p e e c hc o m m u n i c a t i o ni sb e c o m i n gm o r ea n dm o r ei m p o r t a n ti no n l s o c i e t y w i t ht h ed i g i t a li n f o r m a t i o nt i m e sc o m i n g t h ep u r p o s eo fs p e e c he n h a n c e m e n ti st o i m p r o v et h eq u a l i t yo f t h es p e e c hi n t e n s i o n , l e n g t h , t o n ea n dp u r e n e s sb yt r a n s f o r m i n ga n d p r o c e s s i n gs i g n a l si nt i m e0 1 f r e q u e n c yd o m a i n , w h i l et h em e a n i n ga n de x p l i c i t n e s so f s p e e c hs h o u l dn o tb ed e s t r o y e d t h ep e r f o r m a n c eo ft h es p e e c hp r o c e s ss y s t e ma n dt h e q u a l i t yo ft h ed i g i t a ls p e e c hc o m m u n i c a t i o nc a na l s ob ei m p r o v e di n t h ed i s t u r b e d e n v i r o n m e n tb ye n h a n c e m e n ti m p l e m e n t a na u t o m a t i cl e v e lc o n t r o ls y s t e mf o rs p e e c he n h a n c e m e n ti sd i s c u s s e di nt h i st h e s i s t h i ss y s t e mi sn e c e s s a r yt oc o m p l e t et h ed e t e c t i o no fs p e e c ha n da u d i o ,a n dt h e na n a u t o m a t i cg a i nc o n t r o lm e t h o ds h o u l db eu s e d i ts h o u l da l s ob ec o n s i s t e n tw i t ht h e p r o t o c o l sa n ds t a n d a r d s a sr u n n i n gi nad i g i t a lc o m m u n i c a t i o nn e t w o r k ,t h ea u t o m a t i c l e v e lc o n t r o ls y s t e ms h o u l dn o tb ee f f e c ti nt h en o n s p e e c hd a t at r a n s m i s s i o nw i t ht h eh e l p o fs o m ep r o p e rd e t e c t i o na l g o r i t h m s ,a n ds h o u l db ea b l et or e c o g n i z et h ec h a r a c t e r i s t i c so f t h es p e e c hs i g n a lb e f o r et h el e v e lh a sb e e na d j u s t e dp r o p e r l y t h i st h e s i sa i m st oc o n s t r u c t af l e x i b l ea n ds t a b l es p e e c he n h a n c e m e n ts y s t e mi na c c o r dw i mi t u tg 1 6 9 f o rt h i s p u r p o s e ,t h ec o n s t r u c t e ds y s t e mm u s tb ea d a p t e dt ot h er e q u i r e m e n t so ft h ed i g i t a l c o m m u n i c a t i o n n e t w o r k a n dp r e f e r a b l ep e r f o r m a n c e sc a nb ea c h i e v e dt h r o u g ht h e e x p e r i m e n t s t h er e s e a r c hi sd i v i d e di n t ot h r e ep a r t s : f i r s t , w ea r ec o n c e r n e da b o u tt h ev o i c ea c t i v i t yd e t e c t i o na l g o r i t h m sb a s e do nt h e s p e c t r u mc h a r a c t e r i s t i c sa n dt h es i n g l ef r e q u e n c ys i g n a lr a p i dd e t e c t i o n t h ev o i c ea c t i v i t y d e t e c t i o n , w h i c hd i s t i n g u i s h e ss i g n a l sb e t w e e ns p e e c ha n dn o n - s p e e c hs t a t e m e n t ,i st h e b a s i cs e c t i o no f m a n ys p e e c hs i g n a lp r o c e s ss y s t e m o u rv o i c ea c t i v i t yd e t e c t i o nm e t h o di s s i m p l et ob ei m p l e m e n t e da n dc a l c u l a t e da n dh a sh i g ha c c u r a c y ,w h i c hc a nw o r ki nt h er e a l t i m ed i g i t a lc o m m u n i c a t i o nn e t w o r kw i t hb e t t e rs i g n a l - n o i s e r a t i o t h es i n g l ef r e q u e n c y s i g n a lr a p i dd e t e c t i o n , w h i c hh a sr a p i dr e s p o n s e ,w o u l dp r o c e s st h es p e c i a la u d i os i g n a l i n g t h e s et w oa l g o r i t h m sa r eb o mu s e di nt h ed e s i g n e ds y s t e mw i t hs a t i s f a c t o r ye f f e c t i v e n e s s t h e n ,w ep u tf o r w a r da no p t i m i z e da u t o m a t i cg a i nc o n t r o la l g o r i t h mt of u l f i l lt h eg a i n c o n t r o lb a s e do nm a n yo t h e rs p e e c he n h a n c e m e n tm e t h o d s w i mt h ef l a l n e s so ft h eg a i n 语音增强技术在数字通信中的应用 v a l u e ,w ec a ng e tm o r ei m p r e s s i v ee n h a n c e m e n tp u r p o s e i nt h ee n d ,o u ra u t o m a t i cl e v e lc o n t r o ls y s t e mi sc o m p l e m e n t e du n d e rt h ec r i t e r i ao f i t u tg 1 6 9 a n dt h em a t l a bs i m u l a t i o ne x p e r i m e n t sd e m o n s t r a t et h ee f f e c t i v e n e s so f o u r s y s t e m b i n y e ( p a t t e r nr e c o g n i t i o na n di n t e l l i g e n ts y s t e m s ) s u p e r v i s e db yp r o f e s s o ry o n g s h e n gd i n g o 帆 k e y w o r d s :s p e e c he n h a n c e m e n t ,a u t o m a t i cl e v e lc o n t r o l ,v o i c ea c t i v i t yd e t e c t i o n , a u t o m a t i cg a i nc o n t r o l ,d i g i t a lc o m m u n i c a t i o n s 语音增强技术在数字通信中的应用 东华大学学位论文原创性声明 本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本 人在导师的指导下,独立进行研究工作所取得的成果。除文中已明确注明和引用 的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的 内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律 结果由本人承担。 学位论文作者签名: 叶剐 日期:7 彻6 年z 月“日 语音增强技术在数字通信中的应用 东华大学学位论文版权使用授权书 学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向 国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权 东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影 印、缩印或扫描等复制手段保存和汇编本学位论文。 保密口,在年解密后适用本版权书。 本学位论文属于 不保密口。 叮西t t j 参,形 语音增强技术在数字通信中的应用 第一章绪论 1 1 研究背景 随着人们进入数字信息时代,数字语音通信在生产和生活等各方面起到越来 越重要的作用。然而在数字语音通信中,背景噪声的干扰以及信号传输的损耗使 得很多语音处理系统的性能急剧下降。例如语音编解码系统中,信道噪声与线路 噪声污染的影响是十分大的,又例如线路电平的不匹配造成音量大小不一等等。 为了消除实环境数字语音对人们主观听觉造成的负面影响,对语音增强技术及其 实用化的研究是非常有必要的。语音增强技术是数字语音信号处理的重要分支, 已经广泛应用于无线电话、电话会议与场景录音等领域。通过增强处理可以大大 改善原系统在外界环境干扰条件下的性能,提高语音通信质量。 语音增强的目的就是为了在保持语音可懂度和清晰度的前提下,对语音进行 时域或频域的变换与处理,从而使语音在音强、音长、音调、音质与纯净度等方 面得到一定程度的提升e l , 2 1 。实用语音增强系统主要包括噪声消除系统【3 一,电平 控制系统【5 7 】和回声控制系统 s , g l 等。噪声消除系统的作用是检测并降低语音信号 中的背景噪声,提高语音的纯净度;电平控制系统则能稳定信号传输电平,使双 端或多端语音的音强与音质维持在一定的水平上;回声控制系统则针对长途线路 中的回声现象,采用自适应滤波等方法进行回声对消,也起到提高语音纯净度的 作用【1 0 ,】。本文研究的重点是数字通信中的实用自动电平控制系统。 自动电平控制系统运行于数字通信网络之中,首先需要选取合适的音频信令 检测算法,以保证不影响非语音数据流的传输;其次是根据语音信号的特征进行 识别,以决定是否需要开启电平控制;最后才能根据当前语音信号电平进行适当 调整。基于上述原因,论文在研究了各种信号检测和电平控制算法之后,采用先 单音频检测,再语音激活检测,最后进行最优自动增益的语音增强流程。希望从 新的角度,采用新的方法尝试构建灵活可行、稳定性高并符合i t u tg 1 6 9 f 1 2 】协 议要求的自动电平控制系统。为了结合实用,该系统还应能满足数字通信网络的 实际需求,并能在综合实验中得到较好的结果。 语音增强技术在数字通信中的应用 1 2 研究现状 1 2 1 语音信号概述 语音是人们讲话时发出的话语,它既是一种声音,又包含了人们进行交流的 信息。因此,语音是语言和声音的组合体【”1 。目前语音信号处理的内容主要集 中在声音处理上。 根据声音所在的频率范围,可以把声音分类为: 亚音( s u b s o n i c ) :频率低于2 0h z 的信号; 音频( a u d i o ) :频率范围为2 0 h z 2 0 k h z 的信号; 超音频( u l t r a s o n i c ) :高于2 0k h z 的信号。 人类能够听到的声音是音频( 强度为5 1 3 0 d b ) ,但能够发出的声音却低 于4 k h z 。根据香农采样定理【1 4 1 ,数字语音信号采样率应为信号最高频率的两倍, 即8 k h z 。我们通常所说的语音信号处理,其实质就是对每秒至少8 0 0 0 个声音数 据进行分析与变换。 完整的语音信号的数学模型可以用三个子模型:激励模型、声道模型与辐射 模型的串联来表示【1 5 】,如图1 1 所示。 基音频率昂 i k 撼麟纛翥飞嫫瓤瑟薹i “ 号 浊音清音开荑、莲净邋模爱蠲一 辅翁餮垂阄 f 陵。憋熬。盈+ 筐。霆燃勰荔 鏖黔 i a 。 辐射模型 图1 1 语音信号产生的离散时域模型 2 出 音 语音增强技术在数字通信中的应用 其传输函数可表示为: 日( z ) = a u ( z ) 矿( z ) r ( z ) 其中,u ( z ) 是激励信号,浊音时u ( z ) 是声门脉冲即斜三角脉冲序列的z 变 换;在清音的情况下,u ( z ) 是一个随机噪声的z 变换。v ( z ) 是声道传输函数, 既可用声管模型,也可以用共振峰模型来描述,但其本质就是全极点模型1 6 1 : 矿( z ) : l 一吼z 4 k = l 而辐射函数r ( z ) 则可近似为: l e ( z ) = r o ( 1 一z 。1 ) 需要指出的是,这些模型都是“短时”的,因为一些语音信号的变化是缓慢 的,例如元音在l o 2 0 m s 内其参数才可假设不变。另外,模型中用浊音和清音 这样简单的划分方法是有缺陷的,对于某些摩擦音是不适用的,而且也无法用叠 加的方式得到,对于这些音可用一些修正模型来模拟。 1 2 2 语音分析方法 语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本 质特性的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识 别等处理。根据所分析参数的不同性质,可将语音信号分析分为时域分析、频域 分析、同态分析、线性预测分析等【1 7 1 。 ( 1 ) 时域分析方法 语音信号的时域分析就是分析和提取语音信号的时域参数,是一种比较直观 的分析方法。时域分析通常用于最基本的参数分析及应用,如语音的分割、预处 理与分类等,其实现简单、运算量也较小。 语音信号的时域参数有短时能量、短时过零率、短时自相关以及短时平均幅 度差等,这是语音信号的一组最基本的短时参数,在各种语音信号数字处理中都 要应用。为了使语音信号的短时能量与幅度变化相对平滑,在计算这些参数时使 语音增强技术在数字通信中的应用 用的一般是矩形窗或汉明窗。 ( 2 ) 频域分析方法 从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、 频谱包络分析等。常用的频域分析方法包括傅立叶变换法等。因为语音信号是一 个非平稳过程,因此适用于周期、非瞬变或平稳随机信号的标准傅立叶变换不能 用来直接分析,而应该用短时傅立叶变换进行频谱分析,相应的频谱称为“短时 谱”。 对第以帧语音信号矗) 进行傅立叶变换,其定义如下: n - i x 。0 7 。) = 扎( 肌) p 一 m = o 其中为变换点数,短时傅立叶变换实际就是窗选信号的标准傅立叶变换。选 取不同的窗口函数,就会得到不同的傅立叶变换结果。 如令角频率缈= 2 n 彘n ,则可得离散的短时傅立叶变换以( 后) 。在语音信号 数字处理中,一般采用h ( m ) 的离散傅立叶变换来替代以( b 归) ,并且可以用高 效的快速傅立叶变换算法完成由矗( 珊) 至以( | | ) 的转换。为了符合人耳的听觉特 性,提高语音信号处理系统的性能,还可以进一步将实际的线性频谱转化为临界 带频谱矢量,从而根据人耳对频率高低的非线性心理感受反映语音短时幅度谱的 特征。 ( 3 ) 同态分析 同态分析实现了将卷积关系变换为求和关系的分离处理,即解卷。对语音信 号进行解卷,可将语音信号的声门激励信息及声道响应信息分离开来,从而求得 声道共振特征和基音周期,用于语音编码、合成与识别等。 许多语音信号并不是加性信号,而是声门激励和声道冲击响应的卷积性信 号,同态信号处理可以将这类非线性问题转化为线性问题,在线性空间完成运算 后再逆变换为卷积信号。 对卷积信号x ( 聍) ;_ ( 拧) x :( h ) 进行如下运算处理: 4 语音增强技术在数字通信中的应用 f z 【z ( 甩) 】= r ( z ) = x 。( z ) x 2 ( z ) l n x ( z ) = l n x l ( z ) + i n x 2 ( z ) = x t ( z ) + x 2 0 ) = x ( z ) 【z 。【z ( z ) 】= z 。【墨( z ) + 爿j ( z ) 】= 毫( 胛) - i - x 2 ( ,力;叠( 功 由于量( 疗) 是加性信号,所以可对其进行需要的线性处理。例如在两个信号互不交 替的情况下,将声门激励信号和声道冲击响应分离开来。最后只需对分离信号进 行逆变换与指数运算即可恢复原来的卷积信号。 ( 4 ) 线性预测分析 线性预测分析的基本思想是:由于语音样点之间存在相关性,所以可以用过 去的样点值来预测现在或未来的样点值,即一个语音的抽样能够用过去若干个语 音抽样或它们的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间的误 差在某个准则下达到最小值来决定唯一的一组预测系数。现代语音编码的声道模 型参数估计大多都基于线性预测分析方法。 1 2 3 语音增强技术 由于噪声、通路以及电平匹配等原因,数字语音处理在实际应用时会产生很 多问题。例如,噪声的污染使许多语音处理系统的性能急剧恶化,语音识别正确 率明显降低;通信设备间信号电平不匹配,导致两端的接收电平大小不一等。人 们为了解决这些问题,做了很多研究,也制定了许多标准。近来随着人们对语音 通信质量的要求越来越高,可编程数字信号处理器的发展速度越来越快,语音增 强的大规模应用已初露端倪,目前实现的平台主要是在嵌入式系统中。 有关抗噪声技术的研究,已取得了丰富的研究成果。国内外研究成果大致分 为三类方法。第一类是采用语音去噪算法,提高语音识别系统前端预处理的抗噪 能力,常见的算法有滤波法、子波变换法、谱减法与维纳滤波法等d 8 - 2 4 。第二类 方法是寻找稳健的耐噪声语音特征参数。例如,m a n s o u r 和j u a n g 提出了短时修 正的相干系数【2 5 】( s h o r t - t i m em o d i f i e dc o h e r e n c ec o e f f i c i e n t ,简称s m c ) 作为 语音特征参数,该参数是基于自相关函数序列的线性预测技术,对宽带语音具有 较好的抗噪性能;a t a l 提出了倒谱系数零均值算法【2 6 】,该算法在消除麦克风和信 道失真方面取得了较好的效果。第三类方法是基于模型参数适应化的噪声补偿算 法。例如,针对加法性噪声的隐马尔可夫合成法吲、p a r a l l e lm o d e lc o m b i n a t i o n 语音增强技术在数字通信中的应用 法1 2 8 1 等。这类方法可以引入语音和噪声的统计知识,提出具有一定环境稳健性 的处理算法,但并不适用于低信噪比语音与非平稳噪声环境。随着声场景分析技 术和盲分离技术的发展,利用这些技术进行语音和噪声分离的研究也取得了一些 进展 2 9 ,3 0 。 电平控制与回声消除是语音增强另外两个重要分支。前者可以消除通信网络 中数字电平的差异【3 l 】,为后续处理提供更为优良的信源;后者可以去除或减弱 由二四线耦合引入的电学回声信号口2 】。电平控制并不等同于语音信号的增益控 制,它还包括了语音、音频检测等内容口3 4 1 。常见的增益控制方法包括自适应 增益控制【3 5 1 、非线性增益控制p 川与模糊增益控制3 7 1 等,增益控制不仅应用在语 音信号处理,也广泛应用于图像、视频与模拟信号的处理之中。回声消除的方法 则包括自适应对消法f 3 8 3 9 , 4 0 l 、基于高阶统计量的最小均方差法【4 1 1 以及盲信号分 离法1 4 2 1 等。 1 3 研究内容 本论文的研究内容是语音自动电平控制系统。主要工作是针对实用语音增强 系统研究了各种语音和音频检测方法,并做出比较和分析;针对目前各种流行的 增益控制算法,提出基于最优增益的语音增强算法,并给出结果及分析;最后, 结合i t u - t g 1 6 9 关于自动电平控制的要求,设计了一种实用的语音增强系统, 并在仿真实验中取得了较好的效果。 本文的创新性与实用性主要体现在如下三点: 1 提出了一种符合实际通信环境的语音最优增益算法。 2 将语音激活检测算法与音频检测算法应用于实际语音增强系统之中。 3 构建了一个符合g 1 6 9 协议要求的语音增强系统,并对整个系统的各功 能模块进行了详细的仿真实验。 1 4 论文结构安排 本论文各章节内容安排如下: 第一章“绪论”,主要介绍目前数字语音处理技术的发展状况、分析方法以 6 语音增强技术在数字通信中的应用 及语音增强的一些基本原理,并对论文的研究内容及结构安排加以介绍。 第二章“语音增强系统概述”。介绍符合g 1 6 9 协议要求的自动电平控制装 置的特性与性能要求。 第三章“a l c 系统设计与算法原理”,介绍了自动电平控制装置的系统结 构,详细分析了各子模块的算法原理,包括音频信令检测、语音激活检测与自动 增益控制算法等。 第四章“系统实验部分”,针对所设计的a l c 系统,在m a t l a b 中对各模块 进行了系统的实验,并给出结果及评价。 第五章“总结与展望”,对全文所作的工作进行总结,并针对其不足之处 和语音增强技术的最新发展动态提出下一步研究的方向。 语音增强技术在数字通信中的应用 第二章系统概述 2 1 引言 本文所指的语音增强系统是指自动电平控制( a u t o m a t i cl e v e lc o n t r o l ,简称 a l c ) 系统,系统由五部分组成:静音降噪单元、回声抑制单元、音频检测单元、 语音激活检测单元以及自动增益控制单元。 a l c 是一种语音增强技术( s p e e c he n h a n c e m e n t ) 。这里所说的a l c 技术 并不是普通模拟方式的自动增益控制,而是基于i t u tg 1 6 9a u t o m a t i cl e v e l c o n t r o ld e v i c e s ,即自动电平控制装置的建议规范而产生的。这种a l c 技术应用 于数字电话网络,如在p s t n 的传输线路中,而不应用于各种终端电平控制装置, 采用模拟方式运作的设备以及网络传输中的固定电平控制仪器。此外,除了自动 调整增益以控制信号电平之外,通过改变信号的频率响应或者频谱内容来使信号 电平得到变化也是a l c 的方法之一【4 3 1 。 g 1 6 9 协议内容可以分为两部分:一是对网络中的a l c 装置设定某些性能 要求,二是通过恰当的测试来验证a l c 装置是否满足上述性能限制。满足上述 要求并通过所有实验的a l c 装置,应该保证已有的网络整体性能( 例如语音、 语音带限数据和其他语音带限信号、i s d n 的传输) 不会因为a l c 的加入而下降。 同时,g 1 6 9 协议也讨论了与a l c 装置相关的其他网络及设备终端,但该协议 没有规定的标准算法,也没有确定方案准则、应用方向和目标调整电平。 2 2 协议指标 在数字网络中,能自动调整信号电平至某一预设值的信号处理设备都可以称 为a l c 装置。g 1 6 9 协议规定的a l c 装置具有如下指标: ( 1 )可以实时、自动地调整装置增益变化( 放大或衰减) ,使传输电路中的 信号电平保持在预设值附近; ( 2 )任何时刻都要保持电路的稳定性,不能由于a l c 的运作而导致通话中断 语音增强技术在数字通信中的应用 或出现其他问题: ( 3 )保证传真和语音带限数据的传输正确性,并且不影响音频信令的操作; ( 4 )能对环境及电路噪声作适当处理,不对其引起幅度变化;即使有回声影 响,a l c 也必须能正常运作; ( 5 )能根据传输信号类型使a l c 装置处于工作或休眠状态,即正常进行电平 控制或不产生任何操作;当其不控制信号电平时,a l c 装置应能处于将 6 4 k b p s 的比特流进行透传。 a l c 级联运作:a l c 装置的级联运作是个非常有意义的问题。所有级联的 a l c 装置都应具有可以转入休眠状态的功能。a l c 延时性能要求在数据处理和 非数据处理通路产生的延时应尽量减到最少。 2 3 系统特性 2 3 1 环境特性 环境特性问题在协议g 1 2 2 1 4 4 1 0 ? 有相关规定。对于有2 线终端的4 线通信电 路,实际上在4 线回路中一般都会有网络损耗。利用这点,即使a l c 装置阻抗 严重不匹配的情况下仍可以达到稳定要求。但a l c 装置的增益过大会影响链路 的稳定性,尤其是传输线的两个方向都放置了a l c 装置的情况,而有级联a l c 时问题更为严重,因此在操作中必须防止a l c 的增益过大。 a l c 可以配置在如下两种网络环境中: ( 1 )无回声消除器的电话网络 这种情况一般都是在国内本地网络中,其最大传输延时很小,因此没有必要 使用回声控制装置。在短期内,这种网络也不会使用a l c 装置,因为它们无法 提供a l c 合适的信号处理平台,但从长远来看,使用a l c 的可能性是不容忽视 的。 对于不与回声消除器连接混用的a l c 装置,建议根据g 1 2 2 来确定其最大 增益。这就意味着,对于某些国内本地线路,必须保证a l c 装置的最大增益不 能超过0 d b 。这就可能需要通过减少接收端r 和发送端t 的损耗来补偿本地长 话线路的信号衰减。 9 语音增强技术在数字通信中的应用 ( 2 )有回声消除器的电话网络 国际线路以及幅员辽阔的国家使用的本地网络,通常都会采用回声控制设备 来减弱反射的回声信号电平。在下面关于a l c 装置的增益和稳定性讨论中,都 假定a l c 在传输线上的位置是处于回声控制装置之后( 即不与回声控制装置整 合) ,并进一步假定回声控制装置指的就是回声消除器【4 5 】。 值得注意的是,不能认为把回声消除器换成回声抑制器下面的讨论依然成 立。因为在空话的时候,回声抑制器只能微弱地削减回声信号。在g 1 6 4 4 6 规定 的某种条件下的发送和接收线路上,回声抑制器可能根本不产生削弱回声的作 用,所以协议认为,回声抑制器无助于提高或保持网络的稳定性。 闭环回路的稳定性取决于回路的增益和损耗之和,增益或回声过大都会导致 回路不稳定。由于回声消除器能极大地削减其输入端的反射回声信号,所以在一 定的稳定性要求下,回路的增益可以有较大的取值范围,从而拓宽了回路的稳定 性界限。但一般说来,环路的稳定性并不依赖于消除器对回声的处理。 由此可见,只要在链路两端安装了回声消除器,并在传输线的两个方向上都 配备了a l c 装置,该环路就可以认为是稳定的。这种环路中,在保证稳定的前 提下,a l c 装置的最大增益可以等于回声消除器实际上对整个电话带宽上的回 声衰减的最低值。但是在呼叫开始而回声消除器还未正常工作时,需要特别注意 网络稳定性问题。为此,在呼叫开始时,a l c 装置的增益设为某一固定预设值 是比较理想的。当然不使用预设值而改为其他初始值也是允许的,只要其值不超 过+ 4 d b 就可以了。另外,a l c 装置的增益变化速率不能超过1 0 d b s 。考虑到某 些a l c 装置会采用按步长变化的增益,在计算a l c 步长间隔内产生的总增益变 化也应该涉及到增益变化的速率,而且步长间隔也应该包括装置启动后的第一次 增益调整时间。 综上所述,考虑到a l c 装置的复位启动及增益变化速率,g 1 6 9 规定与回 声消除器配合使用的a l c 装置,其最大增益不能超过+ 1 5 d b 。 2 3 2 回声消除特性 如果没有合适的回声预防措施,a l c 装置在遇到回声信号时也会进行增益 调整。这显然是不正确的,因为我们设计的a l c 应只对语音信号作自动电平控 1 0 语音增强技术在数字通信中的应用 制。如果装置应用在延时少而又不带回声消除器的电路中,对回声控制的影响会 更为严重,即使反射回来的信号听起来并不像回声,装置仍会对其产生增益变化。 实际上,a l c 装置都会预设一个闽值电平,a l c 不会对低于该阙值的信号 产生增益响应。当与回声消除器配合使用时,这样的设计有助于防止a l c 对残 余的回声信号作增益调整;而在没有回声消除器时,就需要采用其他更有效的方 法来防止这种现象。 不是所有的a l c 装置都需要设置阈值电平。但如果没有预设阙值,a l c 就 必须能区分语音和非语音信号。这样a l c 只会对语音信号电平进行控制,而不 会对其他信号入噪声进行调整。否则,a l c 就很容易对回声信号产生增益调整, 特别是在没有回声消除器的情况下。 从上面的讨论中可知,在没有回声消除器的情况下,a l c 装置要对回声信 号进行合适处理,就要利用分辨信号特征的方法,这也就意味着a l c 装置要与 发送和接收通路同时连接【4 7 】。 2 3 3 噪声抑制特性 自动电平控制系统的设计目的是把语音信号调整到最合适的电平幅度。当人 们说话停顿,系统就会响应背景噪声的电平值而产生不必要的增益变化。因此, 即使处于传输线路上预期的最低信噪比情况下,系统也必须保证电平控制对此具 有很强的鲁棒性。 背景噪声由话筒输入的各种环境噪声以及电路噪声组成h s ,其中,当模拟 线路作为连接电路的一部分时,电路噪声就尤为突出。这两种噪声具有不同的特 征,电路噪声是趋于宽带的,在大于几百毫秒的时间内取平均后其电平值大致是 一个常数;而环境噪声依赖于特定环境,而且其幅度会经常发生波动,频谱特性 与语音相似。实际上,这种噪声还包括了来自话筒附近的其他语音。在移动通信 中,汽车噪声是其主要成分,而且噪声电平也特别高。 应用在通信网络上的a l c 装置应该使用相应方法来区分有用信号和噪声。 但如上所述,环境噪声的特性使得a l c 装置难以达到完全分辨目的,其区分难 度要比电路噪声大得多,比较可行的方法是在输入a l c 前先对信号进行降噪处 理【4 9 】。 语音增强技术在数字通信中的应用 2 3 4 音频信令特性 a l c 系统必须保证电话网络上音频信令的正确操作。当需要使用音频信令 建立连接的时候,电平控制可以暂停运作或固定系统的增益,直至连接建立为止。 典型的a l c 装置不可能分辨语音信号和d t m f 信令,因此当传送d t m f 信令时,a l c 就有可能对此进行增益调整。即使经过电平控制,a l c 也不应该 影响d t m f 信令检测的可靠性。这除了依靠a l c 装置的设计方法外,还有赖于 d t m f 检测器的准确度。 2 3 5 数据传输特性 除了要保证音频信令的正确操作外,a l c 系统在对语音增强过程中,还不 能削弱如传真和语音带限数据传输之类的通信质量。因此a l c 装置应在v 一系 列调制解调器进行通信之前,自动检测2 1 0 0 h z 的应答音频而暂停工作。当a l c 装置位于前向传输线路时,a l c 需要检测到2 1 0 0 h z 音频,就意味着该装置还要 与接收回路相连接,由此所设计的a l c 音频检测器应该能对两传输方向同时运 作。 当a l c 装置不作电平控制时,在数据和传真输送过程中应该保证码流的完 整性。在多页文档的传真过程中,更应该禁止a l c 装置运作,即当分页或者是 其他数据传输暂停时,a l c 不能有恢复运作的趋向。 a l c 音频检测器的要求在多个方面与回声抑制器和回声消除器的音频检测 器是相同的,它们的目的都是在数据传输和传真的整个过程使装置停止运作。 回声抑制器的音频检测特性要求可见协议g 1 6 4 ,而回声消除器则可参考协 议g 1 6 5 1 5 0 l 与g 1 6 8 5 ”,这两种回声控制装置的特性十分类似。要使回声消除器 停止工作,g 1 6 5 与g 1 6 8 要求能检测符合协议v 2 5 t 5 2 】的、周期反相的2 1 0 0 h z 音频:而g 1 6 4 要求检测具有周期反相或不反相的2 1 0 0 h z 音频。 一旦开启了禁用功能,以上协议对装置从休眠状态返回至工作状态的要求是 一致的。返回操作是基于信号电平的变化,当两个传输方向的信号能量均低于某 个闽值,并超过了指定的持续时间( 返回时间) ,装置就恢复工作。协议指定了 1 2 语音增强技术在数字通信中的应用 的返回时间是2 5 0 + 1 5 0 m s ,其中上限( 4 0 0 m s ) 是为了防止信号电平短时下降导 致不正确的返回,下限( 1 0 0 m s ) 是为了减少语音突发激活音频检测器而引起的 语音损伤。 对于g 1 6 9 的a l c 装置的音频检测器,除了能检测上述两种的应答音频外, 还要能检测出符合v 。8 1 5 3 1 协议所定义的2 1 0 0 h z 音频。该音频不但具有以上两种 音频的特性周期反相或相位固定,它还可以添加幅度调制。 对于a l c 装置的音频检测器来说,上述的释放时间是不足够的。当输送的 传真数据有所停顿( 如分页) ,a l c 就很容易重新返回至正常工作状态。为了 满足整个传真过程a l c 处于休眠状态的要求,a l c 音频检测器的最小返回时间 设定为3 4 5 0 m s 。如果禁用功能由语音激活,则希望返回时间尽量缩短,因此系 统所允许的返回时间不能大于最小值过多,所以g 1 6 9 建议使用的最大值为 3 5 0 0 m s 。 对于因语音激活a l c 装置的音频检测器而使a l c 进入休眠状态,与因此而 要a l c 尽快恢复运作相比,前者显得更为重要,要求前者发生的可能性尽可能 地小。这是因为装置停止自动电平控制时,原本是连续变化的系统增益会被设定 为指定大小,增益可能产生较大的阶梯变化,导致经过增益处理的语音失真。当 a l c 恢复运作时,系统增益只能逐级变化直至适合实际的语音电平。2 1 0 0 h z 音 频检测操作的时间越长,就越能纠正由于语音所引起的误检测,因此设计a l c 音频检测器时,应尽可能增大检测时间。检测器需要响应所有传真和数据传送前 的音频信号,这就要求其检测时间要比预期的最小应答音频持续时间短。在不同 情况下,应答音频持续时间的区别可见协议v 2 5 。a l c 音频检测器的检测操作 时间最大值设定为4 0 0 m s 为宜,这也是g 1 6 4 的音频检测器所采用的。因此本 设计采用g 1 6 4 的标准,即3 0 0 1 0 0 m s 。 总之,a l c 装置中的音频检测器应该具有g ,1 6 4 、g 1 6 5 与g 1 6 8 规定的特 性,同时还要满足以下准则; 1 ) 当检测到周期反相或不反相的2 1 0 0 h z 音频( v 2 5 中定义) ,以及这种 信号加以幅度调制( v 8 中定义) 的音频时,a l c 要进入休眠状态; 2 ) 检测操作时间:最小值为2 0 0 m s ,最大值为4 0 0 m s ; 3 ) 返回时间:最小值为3 4 5 0 m s ,最大值为3 5 0 0 m s 。 语音增强技术在数字通信中的应用 2 4 小结 本章介绍了a l c 相关协议的一些评价指标,并对a l c 系统的特性加以说明。 通过上述分析可知,a l c 系统作为通信链路上的“中转站”,不仅承担语音信 号质量改善的任务,而且也必须保证其他数据的正常传输。在引入一些必要的检 测手段后,我们完全能将a l c 系统移植入某个独立运行的通信网络之中,并在 不影响现有硬件设施的限制条件下,借助可编程逻辑器件得以实现。 1 4 语音增强技术在数字通信中的应用 第三章算法原理 3 1 引言 当a l c 装置应用到电话网络中,必须保证对现有的各种服务质量不产生影 响。放置a l c 时,应尽量对传输路径的开始数据( 如a 接口处的p c m 码流) 起作用,这样信号经过电平优化使此后的所有网络设备得到性能改善。如果要得 到更大的性能提高,a l c 则要放置于传输线上的4 线最前端,先于其他信号处 理设备,这样由于说话人声强、说话时离话筒的距离、通话设备本身以及本地环 路衰减引起的语音电平变化,都可以得到补偿与改善。 理想情况下,可在模拟信号到6 4 k b w s 的p c m 格式数字信号的转换前,进 行a l c 处理,这样可以防止信号电平过大时引起的削波,并减少由于电平调整 导致的信噪比下降。但是这样放置a l c ,需要对大量电路进行升级,成本高, 显得非常不实际。 当a l c 应用在国际线路上时,其成本相对较小,尤其是网络中已设有信号 处理设备( 如回声消除器) 时,a l c 可藉此作为处理平台【5 4 】;同时传输线上的 设备也得到有效的性能提高,但这对于本地线路来说并无多大改善。 根据讨论分析,g 1 6 9 提出的a l c 设置方案如图3 1 所示: 馕戮潞鞠黼 ly + _ 竖,卜誓翟oi 劳aoj 辫薷蘸辫 撼f 1 燃磙 矗,耪i f 鼹麟僦, 落v 彗掣 母各母 图3 1a l c 系统配置图 图3 1 表明了一个网络终端的a l c 典型设置方法,对于连接线路的其他位 置,a l c 也可以按此设置。虽然a l c 的放置有许多选择,但并不意味着所有位 语音增强技术在数字通信中的应用 置都要安装a l c 系统。事实上,使用多个a l c 会产生稳定性的问题,而且级联 a l c 会容易引起电平控制的性能恶化,破坏环路的稳定性。这种性能恶化是由 于人们能感受

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论