已阅读5页,还剩63页未读, 继续免费阅读
(电路与系统专业论文)基于小波变换的语音增强方法研究与实现[电路与系统专业优秀论文].pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 语音增强是在带噪语音信号中提取出语音信息的方法,在语音识 别与编码、语音通信等领域中有着广泛的应用。因此,语音增强在语 音信号处理中扮演着重要的角色。本文对受加性噪声污染的语音信号 增强方法做了较深入的研究,主要工作和创新如下: ( 1 ) 讨论了谐波增强法、基于语音生成模型的语音增强法、谱相 减法、维纳滤波法等语音增强方法的基本原理,并比较了这些方法的 优缺点。 ( 2 ) 分析了语音信号和噪声的小波分解系数的不同特性,论述了 小波变换的基本理论、小波去噪的原理和方法。比较了不同的阈值估 计方法和阈值量化方法在滤除噪声时的特性,通过实验验证了小波去 噪的有效性。主要研究了基于阈值的小波域语音增强方法,给出了一 种改进的小波包分解的语音增强算法。仿真结果表明:该方法能有效 地增强受加性白噪声和加性飞机噪声污染的语音信号,即信噪比得到 了提高,语音的听觉舒适度得到了改善。 ( 3 ) 设计了一个基于t m s 3 2 0 v c 5 4 1 6 定点d s p 盼语音增强模块, 该模块实现了基于阈值的小波域语音增强算法。详细论述了模块的硬 件电路设计过程和算法的设计思路。在噪声环境中采集了带噪语音信 号进行增强处理。实验结果表明:该模块能够满足语音增强的要求, 验证了算法的有效性。 关键词:语音增强,小波变换,定点d s p a b s t r a c t s p e e c h e n h a n c e m e n tisam e t h o do fe x t r a c t i n gs p e e c h i n f o r m a t i o nf r o mn o i s ys p e e c hs i g n a l ,w h i c hi se x t e n s i v e l yu s e d i ns p e e c hr e c o g n i t i o n , s p e e c hc o d i n g ,s p e e c hc o m m u n i c a t i o na n d o t h e rf i e l d s h e n c e ,s p e e c he n h a n c e m e n tp l a y sa ni m p o r t a n tr 0 1 e i ns p e e c hs i g n a lp r o c e s s i n g t h i sd i s s e r t a t i o nd e e p l ys t u d i e d t h ee n h a n c e 研e n tm e t h o d so fs p e e c hs i g n a lw h i c hi sp 0 1 l u t e db y a d d i t i v en o i s e t h em a i nw o r k sa n di n n o v a t i o n sa r ea sf o l l o w s : ( 1 )t h eb a s i cp r i n c i p l eo fs e v e r a l s p e e c he n h a n c e m e n t e t h o d sa r es t u d i e di nt h i sd i s s e r t a t i o n , s u c ha sh a r m o n i c e n h a n c e m e n tm e t h o d ,t h ee n h a n c e m e n tm e t h o db a s e do n s p e e c h g e n e r a t i o nm o d e l , s p e c t r a ls u b t r a c tm e t h o d , w i e n e rf i l t e r m e t h o d,e t c t h e s t r o n g p o i n ta n ds h o r t c o m i n go ft h ea b o v e m e t h o d sa r ea l s oc o m p a r e dw i t he a c ho t h e ri nt h isd i s s e r t a t i o n ( 2 )d i f f e r e n te h a r a c t e r i s t i c so fs p e e c hs i g n a lw a v e l e t a n a l y s i sc o e f f i c i e n t sa n dn o i s ew a v e l e ta n a l y s i sc o e f f i c i e n t s a r ea n a l y z e d ,a n dt h eb a s i ct h e o r yo fw a v e l e tt r a n s f o r m ,b a s i c p r i n c i p l ea n dm e t h o d so fw a v e l e td e n o i s i n ga r ed i s c u s s e d 。 t h e c h a r a c t e r i s t i c sc o m p a r i s o nh a v eb e e nm a d eb e t w e e nd i f f e r e n t t h r e s h 0 1 de s t i m a t i o nm e t h o d sa n db e t w e e nd i f f e r e n tt h r e s h o l d q u a n t i z a t i o nm e t h o d sw h e nt h e ya r eu s e dt oe l i m i n a t en o i s ef r o m r 】o i s ys i g n a l , a n d t h ee f f e c t i v e n e s so fw a v e l e td e n o i s i n gi s v e r i f i e db yu s i n ge x p e r i m e n t w a v e l e tf i e l ds p e e c he n h a n c e m e n t m e t h o db a s e do nt h r e s h 0 1 di ss t u d i e d , a n da ni m p r o v e ds p e e c h e n h a n c e m e n tm e t h o do fw a v e l e tp a c k e ta n a l y s i si si n t r o d u c e d t h es i m u l a t i o nr e s u l t si n d i c a t et h a t :t h i sm e t h o d c a n e f f e c t i v e l ye n h a n c et h en o i s ys p e e c hs i g n a lt h a tw a sp 。l l u t e d b ya d d i t i v ew h i t en o i s ea n da d d i t i v ea i r p l a n en o i s e n a m e l y t h es i g n a ln o i s er a t i o ( s n r )i si n c r e a s e d , a n d t h eh e a r i n g e a s i n e s so fs p e e c hi si m p r o v e d ( 3 ) as p e e c he n h a n c e m e n tm o d u l eb a s e do nt m s 3 2 0 v c 5 4 1 6f i x e d p o i n td s pi sd e s i g n e d , a n dw a v e l e tf i e l ds p e e c he n h a n c e m e n t a l g o r i t h mb a s e do nt h r e s h o l di sr e a l i z e db yt h i s m o d u l e 。t h e d e s i g np r o c e s so fh a r d w a r ec i r c u i t 。ft h i sm o d u l ea n dt h ed e s i g n t h o u g h to ft h ea l g o r i t h ma r ed i s c u s s e di nd e t a i l n o i s ys p e e c h s i g n a lc 0 1 1 e c t e di nt h en 。i s ye n v i r o n m e n ta r ep r o c e s s e d t h e e x p e r i m e n tr e s u l t si n d i c a t et h a t t h i sm o d u l ec a ns a t i s f yt h e r e q u i r e m e n t。fs p e e c he n 1 a n c e m e n t , s ot h ee f f e c t i v e n e s so f a l g o r i t h mi sv e r i f i e d k e yw o r d s :s p e e c he n h a n c e m e n t , w a v e l e tt r a n s f o r m ,f i x e dp o i n t d s p 基于小波变换的语音增强方法研究与实现 第一章绪论 本论文研究了基于小波变换的语音增强方法及其硬件实现。本章 首先讨论了课题的选题背景和理论依据、语音增强的目的和应用,接 着回顾了语音增强研究的历史,最后是论文的内容安排。 1 1 课题的选题背景和理论依据 在语音通信过程中不可避免地会受到来自周围环境和传输媒介 引入的噪声、通信设备内部电噪声乃至其他说话者的干扰。这些干扰 最终使得收听者收到的语音已经不是纯净的原始语音信号,而是受到 噪声污染的带噪语音信号。例如,在街道、机场等嘈杂场所打电话, 常受到背景噪声干扰,严重影响通话质量;语音识别系统在背景噪声 很强时,识别正确率大大下降;在低速率语音参数编码中当模型参数 受到混杂在语音信号中的背景噪声严重干扰时,重建语音质量将急剧 恶化等等。 在上述情况下,语音增强作为一种预处理不失为解决噪声污染的 一种有效手段。因此,语音增强方法的研究在实际中有重要价值。 语音增强主要依据语音和噪音的不同特性“。语音虽然是时变 的非平稳随机过程,但由于人的发声系统生理变化速度有限,语音信 号在短时( 1 0 一3 0 m s ) 内是平稳的。浊音在频谱上具有共振峰结构, 能量主要集中在低频区( 】0 0 0 胁) 。不同的噪声有不同的特点:周期性噪 硕士学位论文 声的离散线状频谱可通过梳状滤波器加以滤除;脉冲噪声可以通过时 域的衰减或平滑进行抑制;由热噪声、气流噪声等各种噪声源引起的 宽带噪声最难消除,高斯白噪声是典型的平稳宽带噪声。若噪声谱是 非白化的可以先进行白化处理。 语音增强还可以利用人耳的语音感知特点进行增强处理。人耳的 语音感知特点有:人耳对语音频谱的幅度较敏感,而对频谱的相位不 敏感;人耳对频谱幅度的感受是对数方式的;人耳有掩蔽效应n 1 ,即 在某频率点上的强信号会掩盖其附近频率的较弱信号;幅度谱的共振 峰对听觉感知非常重要,可以通过模拟共振峰产生语音4 1 ,第二共振 峰比第一共振峰更重要,对语音的适当高通滤波不会对可懂度造成影 响。 尽管利用了上面这些结果,在语音增强算法的研究中对人的语音 感知和听觉机理、听觉生理学实验的借鉴仍然是很不充分的。一方面 是由于听神经的复杂结构和大脑的复杂作用,使得人们对听觉机理的 研究和认识尚处于非常粗浅的阶段“1 ,另一方面则是因为语音增强算 法的研究人员一般来自于信号处理领域,对语音学、心理学和生理学 的结果没有给予足够的重视。所以,语音增强的研究还有待于进一步 的完善和发展,还具有很大的研究空问和研究价值。 1 。2 语音增强的目的和应用 语音增强的目的主要有两个:一是改进语音质量,消除背景噪声, 减少收听人的疲劳感,这是主观测量;二是提高语音可懂度,这是客 观测量。但这两个目的往往彳i 可兼得,所以实际应用中总是视具体情 基于小波变换的语音增强方法研究与实现 况而有所侧重。 语音增强在许多方面都有着广泛的应用,它与人们的生产生活息 息相关,主要应用如下: 在街道、机场等嘻杂环境中进行通话时,通话质量会受到严 重的影响。有效的语音增强系统能够大大提高语音通讯的抗干扰能 力,能有效地扩展移动通讯的适应能力和应用范围。 随着数字语音信号处理技术的发展,机器语音识别成为可能, 在消声室中语音识别系统已经达到了非常高的识别率( 小词汇量识别 正确率大于9 9 ) ,但在有噪声的环境中识别率会急剧下降,信噪比 在o d b 时识别率降到了1 0 ”1 。因此有效的语音增强是提高语音识别 系统实际应用能力的关键因素之一。 在低比特率传输的声码器参数编码中,语音参数在噪声环境 下会出错,解码后的语音难以听懂。用经过语音增强的信号输入声码 器进行编解码时能够提高其抗噪能力。 在进行重要语音录音存储时,由于录音设备和周边环境噪声 的影响,信号会出现失真,可以通过语音增强加以改善。 有语言障碍的人发出的失真语音在经过合理的语音增强处理 后能够被人听懂,提高了残疾人的社会交际能力。 在国家和社会安全、军事等方面,语音增强也得到了应用。 例如,语音增强有助于提高侦听系统的效果,可以帮助侦察破案或获 取情报等等。 1 3 语音增强研究的状况 硕士学位论文 早在2 0 世纪6 0 年代,语音增强这个课题就已经开始引起人们的 注意。7 0 年代随着电子技术和数字信号处理技术的发展,语音增强 开始从理论走向实用。1 9 7 4 年,耽砖等人成功开发了一个实时语音 增强系统( 舰习俗f 刎盯1 。1 9 7 9 年,西 和 p 阴 。砌全面总结了此 前的语音增强方法”1 ,包括谱减法、维纳滤波法和一些基于模型的语 音增强方法。8 0 年代,印自阳砌等人提出了语音短时谱幅度( s 陷4 ) 的 最小均方误差( 僦) 叫“砷1 估计法。9 0 年代,短时谱幅度的最小均 方误差估计法继续得到改进,同时励 旭砌等人提出了隐马尔可夫模 型( 砌锄彳) 框架下的语音增强算法“2 儿”3 ,胁m 一等人则研究了基于预测 系数估计和维纳滤波的迭代语音增强算法。“。之后,新的语音增强方 法相继涌现,例如基于神经网络“、子空间分解。”n “、小波变换“” 和基于听觉模型“”的语音增强方法等。 1 4 论文的内容安排 第一章讨论了本课题的选题背景和理论依据、语音增强的意义及 研究状况,最后给出了本论文的内容安排。 第二章介绍了语音增强处理的基础知识。主要讨论了语音和噪声 的特性,概要地介绍了几种传统的语音增强算法,指出了这些算法的 优缺点,最后给出了衡量语音增强效果的信噪比的定义。 第三章论述了基于小波变换的语音增强方法。首先讨论了小波分 析的基本理论、分析了语音和噪声在做小波分解时的特性,利用它们 的小波分解系数的不同特性可以将语音信号和噪声在小波域进行分 离从而达到语音增强的目的;然后给出了一种基于结点阂值的小波包 基于小波变换的语音增强方法研究与实现 分解的语音增强算法。并将本算法与谱减法通过仿真结果进行了比 较,指出了各自的优缺点。 第四章讨论了一个基于定点d 卵的语音增强模块的设计过程。首 先介绍了模块的组成、硬件部分的设计,接着介绍了模块所采用的基 于结点闽值的小波包分解的语音增强算法设计过程,最后对模块进行 了调试。实际模块经调试后,能够实现语音增强处理,验证了算法的 有效性。 结论部分对论文进行了总结和展望。指出了论文的主要工作和成 果以及需要进一步深入研究和完善的地方。 第二章语音增强处理基础 语音增强主要研究如何在带噪语音信号中提取出语音信息的问 题。它的主要目的是对带噪语音进行处理,以消除背景噪声,改善语 音质量,提高语音的清晰度和舒适度,提高语音处理系统的性能。语 音增强不但与语音信号数字处理理论有关,而且涉及到人的听觉感知 和语音学。 本章深入讨论了语音和噪声的不同特性,这也是实现语音增强的 理论依据;接着概要地综述了几种常用的语音增强方法,主要有谐波 增强法、基于语音生成模型的增强方法、谱减法和维纳滤波法等,并 比较了这些方法的优缺点。 2 1 语音和噪声特性 2 1 1 语晋特性 语音是时变的、非平稳的随机过程。人类发音系统的生理结构的 变化速度是有定限度的,在较短时间内( 1 0 一3 0 阳) 人的声带和声道 形状是相对稳定的,可以认为其特性是不变的。 因而,语音的短时 谱具有相对稳定性。 语音可以分为清音和浊音两大类。浊音由声带振动在声门处产生 的准周期脉冲序列激励声道而产生,它在时域上呈现出明显的周期 性;在频域上有共振峰结构,而且能量大部分集中在较低频段内。例 基于小波变换的语音增强方法研究与实现 如,汉语拼音中的浊音 口 的时域波形图和频谱图分别如图2 1 和图 2 2 所示。从图2 一l 可以看出,浊音 a 具有明显的周期性且周期大约 为5 研s ,即它的基音频率大约为2 0 0 舷。从图2 2 可以看出,浊音 日 的 能量主要集中在三个区域,它们分别位于8 5 0 胁,2 5 危眩和3 4 尼舷附近 ( 虽然在频率超过2 5 盘眈以后频谱幅度非常小,但是在2 5 盘胁和3 4 盘胁 附近幅值还是很明显) 。这就是浊音m 的前三个共振峰频率。一般来 说,浊音频谱在频率超过4 七胁以后便迅速下降。 清音由气流强制通过声道中某一段收缩区间时引起的类似白噪声 的湍流激励声道而产生的,它没有明显的时域和频域特征,类似于白 噪声。例如,汉语拼音中的清音 s 的时域波形图和频谱图分别如图 2 3 和图2 4 所示。从图2 3 可以看出,它不像浊音 d 】那样具有明显 的周期性,而是杂乱无章的。从图2 4 可以看出,清音 s 】的频谱相对 于浊音m 的频谱而言较为平坦类似于噪声谱,且在频率高于4 盘舷以 后的高频处幅度增大。一般来说,清音的频谱能量主要集中在高频区 域,即使频率超过8 姚频谱也没有显著的下降( 信号的采样频率 工= 1 2 舰,图2 2 和图2 4 中的o 6 0 0 0 恐对应于o t 2 的频率段的 频谱,与之关于z 2 频率点对称的z 2 工频率段的频谱在图2 2 和 图2 4 中没有画出来) 。 图2 1 浊音 a 的时域波形图图2 2 浊音 口】的频谱图 硕士学位论文 图2 3 清音 s 的时域波形图图2 4 清音嘲的频谱图 2 1 2 噪声特性 噪声来源于实际的应用环境,因而其特性是变化无穷的。噪声可 以是加性的,也可以是非加性的。加性噪声比非加性噪声更加普遍, 并且有些非加性噪声可以变换为加性噪声。例如,乘积性噪声和卷积 性噪声可以通过同态交换变成加性噪声。加性噪声大致可以分为周期 性噪声、冲击噪声和宽带噪声等。 周期性噪声的特点是有许多离散的窄谱峰,它往往来源于发动机 等周期运转的机械。例如5 0 h z 或6 0 h z 交流声会引起周期性噪声。这 种周期性噪声可以用梳状滤波器加以滤除,这可以用数字信号处理的 方法来实现。然而,实际环境中产生的周期性噪声并非简单地只含线 谱分量,而是由许多窄谱组成。而且,往往是时变的并与语音信号频 谱重叠,必须采用自适应滤波的方法才有可能自动识别和区分噪声分 量。 冲击噪声表现为时域波形中突然出现的窄脉冲,它通常是放电、 爆炸和撞击的结果。消除这种噪声可以在时域内进行,其过程如下: 根据带噪语音信号幅度的平均值确定闽值。当信号幅度超过这一阂值 时,将它判断为冲击噪声然后将它进行适当地衰减甚至完全消除。也 r 基于小波变换的语音增强方法研究与实现 可以根据相邻信号样值通过内插的方法将脉冲噪声在时域进行平滑。 宽带噪声的来源很多,例如热噪声、气流( 如风、呼吸) 噪声及 各种随机噪声源,量化噪声也可以视为宽带噪声。由于宽带噪声与语 音信号在时域和频域都重叠,因而消除它最为困难。这种噪声只有在 语音间歇期才单独存在。对于平稳的宽带噪声通常可以认为是高斯白 噪声,不具有白色频谱的噪声可以先进行白化处理。对于非平稳的宽 带噪声情况就更加复杂。 本文主要讨论受加性宽带噪声污染的语音的增强方法。在文中 如无特别说明,所指的噪声都是加性宽带噪声。 2 _ 2 几种传统的语音增强算法 2 2 1 谐波增强法 谐波增强法乜”是利用语音信号中浊音段的准周期性,采用自适应 梳状滤波器来提取语音分量、抑制噪声的。自适应滤波器可以在时域 实现,表达式为: 灭功= g 砌一坳 ( 2 1 ) 公式( 2 一1 ) 中x ( n ) 是滤波器输入信号序列,y ( n ) 为滤波器输出信号序 列,上为基音周期,m 为常数,g 为系数,随信号周期而变化。输出 信号是输入信号的延时加权和的平均值。当延时与信号周期一致时, 这个平均过程将使信号的周期性分量得到加强,而其他非周期性分量 或与信号周期不同的其他周期性分量受到抑制或消除。谐波增强法依 硕士学位论文 赖于语音信号基音频率的检测,基音频率检测的误差直接导致增强语 音的畸变。其次,只有浊音段的语音具有准周期性,清音段不具有准 周期性,因此谐波增强法只能用于浊音的增强,不能用于清音的增强。 2 2 2 基于语音生成模型的增强方法 基于语音生成模型的增强方法“”是利用产生语音的生理特点来 达到增强目的的。语音的产生过程可以模型化为激励源作用于一个时 变线性系统,如图2 5 所示。激励源可以分为浊音和清音两类。浊音 由气流通过声带产生( 在图2 5 中用准周期脉冲序列发生器产生的准 周期脉冲序列来模拟浊音) 。清音则由气流强制通过声道中某一段收 缩区问时引起的类似白噪声的湍流激励声道而产生( 在图2 5 中用随 机噪声发生器产生的随机噪声来模拟清音) 。时变线性系统则是声道 的模型。通常认为声道模型是一个全极点滤波器,滤波器参数可以通 过线性预测分析得到。图中的清浊音开关模拟了加在声道上的激励的 改变情况,当开关接在浊音位置时,激励源是准周期脉冲序列发生器 即产生浊音,其重复周期由基音周期来确定;当开关接在清音位置时, 激励源是随机噪声发生器即产生清音。显然,如果能够估计出激励参 数和时变线性系统参数,就能够利用语音生成模型合成出“纯净”语 音。这种方法的关键在于如何从带噪语音中准确地估计语音模型的参 数。 基于小波变换的语音增强方法研究与实现 基音周期 2 2 3 谱减法 图2 5 语音的全极点生成模型 出 设纯净的语音信号是文功,加性噪声为荆,输入的带噪语音信 号是删,则有: 缸功= s ( 哟+ 烈功 ( 2 2 ) 要实现语音增强就是要由荆尽可能精确地估计出娴,使得估计值 在听觉上和纯净语音尽量一致。对公式( 2 2 ) 两边做傅立叶变换得 到对应的频域关系式如下: ( j ) = s ( 女) + d ( 七) ( 2 3 ) 其中七是频谱的离散值,由公式( 2 3 ) 可得到: s ( 尼) = r ( 女) 一d ( 女) ( 2 4 ) 公式( 2 4 ) 表明只要能估计出噪声谱就能从当前的混合信号频 谱减去噪声的频谱得到纯净语音信号频谱的估计值。 考虑到人耳对频谱的相位信息不敏感,设纯净语音频谱的相位和 带噪语音信号频谱的相位一致,即: 么s ( k ) = 乞r ( t ) ( 2 5 ) 此时关键是求出语音信号的频谱幅度值: 硕士学位论文 i s ( ) i = l ( t ) d ( 尼) i ( 2 6 ) 对ls ( 七) i 的估计方法不同就构成了频谱减法的不同方式,但实质都是 在混合谱中减去噪声谱。 先考虑功率谱的情况,将公式( 2 3 ) 两边取模平方并变为共轭 复数形式,有: x ( 七) z ( t ) = 【s ( ) + d ( ) 】 s + ( 七) + d ( 七) = s ( ) s + ( ) + d ( 七) s + ( 女) + d + ( 女) s ( 尼) + d ( t ) d + ( 女) ( 2 7 ) 公式( 2 7 ) 中术代表共轭复数,对公式( 2 7 ) 取数学期望并假设语 音信号与噪声不相关,即: e 【d ( 女) s + ( 女) 】= e 【d ( 女) s ( 女) 】= o ( 2 8 ) 则有: e x ( 七) x ( ) = 研s ( ) s ( 女) + e d ( ) d ( 七) 】 ( 2 9 ) 方括号中的各项是各信号的功率谱。如果将带噪语音信号和纯净语音 的期望值用当前帧的短时功率谱代替就得到功率谱减法的表达式: j s ( 足) j 2 = j 工( 厅) 1 2 一e d ( t ) d + ( 女) ( 2 1 0 ) 如果直接由公式( 2 6 ) 求就可以得到幅值谱减法的计算公式如 下: l s ( 意) ? 爿。v ( 女) ! 一e d ( 七) 口 ( 2 1 1 ) 在公式( 2 一l o ) 和公式( 2 一1 1 ) 中都要进行噪声谱( 功率谱或幅 值谱) 的估计,这样的估计值一般是通过对非语音帧的相应谱进行平 均得到的。因此,在频谱减法中一股有一个有声无声判决模块来决 定每一一帧是不含语音的噪声帧还是含语音的带噪语音帧。考虑到噪声 基于小波变换的语音增强方法研究与实现 的估计,上面两个公式的意义也可以理解为:在噪声帧估计噪声的功 率谱或幅度谱,而在语音帧时假定噪声的谱是不变的( 平稳噪声) 。 所以,语音信号就等于带噪语音信号减去噪声信号。 公式( 2 1 0 ) 和公式( 2 1 1 ) 可以一般化为: s ( 七) l = i ( 尼) | 一e id ( i ( 2 1 2 ) 其中r 是幅值谱的指数。当r = 2 时是功率谱减法;当,= 1 时是幅值谱 减法。 由公式( 2 一1 2 ) 可以看出,因为噪声谱的估计是平均值,所以当 前帧的噪声谱实际上与估计值是有差别的。当经过谱减法计算的语音 谱值为负值时,将结果置为零瞳,即: l s ( 尼) 0矿l 坝后) i 一日l 以七) r 】 0( 2 一1 3 ) 对噪声谱的估计可以在新的无语音帧时进行更新,如用平均法估 计的噪声谱可以写成: 1 吖一1 日ld ( 七) 门2 击萋l 口( 目1 ( 2 1 4 ) 其中m 是无语音帧的总数。噪声谱估计也可以用滤波法,公式如下: 团口门= 脚q r 】+ ( 1 一切i q r ( 2 1 5 ) 其中p 是滤波系数,典型值在o 8 到o 9 5 之间。 将经过频谱减法得到的语音幅度谱的估计与带噪语音信号的相 位信息结合起来进行傅立叶反变换就可以得到增强的语音信号的时 域估计。综上所述,可以画出基本谱减法的框图如图2 6 所示。谱减 法语音增强效果明显、运算量小,但是增强后的语音有较强的背景音 乐噪声池1 。 硕士学位论文 直照 爷嚣引嚣h 刚吣叫一童型迭劂重笪盐广111 l ! :! ! i ! f l | 裂p 叩硐文一 么x ( k ) !i s ( k ) f l 主! i 傅立叶反变换卜+ s ( n ) 图2 6 基本谱减法框图 2 2 。4 维纳滤波法 带噪语音模型如公式( 2 2 ) 所示。维纳滤波法就是按最小均方 误差准则对娴进行估计,即选取删的估计聊使均方误差 s = 耳 s ( 胛) 一;( 胛) 2 ) 最小。也就是要设计一个数字滤波器向,当输入 为枷时,滤波器的输出 j ( 功= 删坝力= 缸所一,) w ) ( 2 1 6 ) 使得占= e p ( 胛) 一;( 以) 2 ) 最小,公式( 2 1 6 ) 中。表示求卷积运算。 根据正交性原理,最佳厶必须满足对所有的,有下式成立: 取i ( 功一双功m 研一z ) ) = 0 ( 2 1 7 ) 将公式( 2 1 6 ) 代入公式( 2 1 7 ) 并对式子两边做傅立叶变换得: 黔器 ( 2 1 8 ) 公式( 2 一1 8 ) 中( 女) 为酮与荆的互功率谱密度,( | i ) 为硐的功 率谱密度。 由于删与荆不相关,即j r 耐( ,) = o ,则可得: 基于小波变换的语音增强方法研究与实现 是( 七) = & ( j j ) ( 2 1 9 ) ( 尼) = ( 后) + ( 七) ( 2 2 0 ) 则公式( 2 1 8 ) 变为: 日( 后) :i 煞 ( 2 _ 2 1 ) 一瓦( 尼) + ( 后) 公式( 2 2 1 ) 即为维纳滤波器“3 儿2 4 1 传递函数的频域表达式。 如果在频域采样点上对信号进行处理,可得如下估计值: s ( 七) = 乒,( 七) x ( 七) ( 2 2 2 ) 其中 ( 尼) :百煞 ( 2 哪) 五( 尼) + 乃( _ ) 公式( 2 2 3 ) 中五( 尼) 和乃( 尼) 分别为第尼个频率点上信号和噪声的功 率谱,j ( ) 为第后个频率点上语音频谱的估计值,x ( _ j ) 为带噪语音在 相应频率点上的频谱值。 实际上语音只是短时平稳的,而且语音功率谱也无法得到,因此 公式( 2 2 3 ) 可改写为: 日( 七) :到娑幽 ( 2 2 4 ) 、7 e 1 s ( 七) 1 2 】+ 丑。( | j ) 采用维纳滤波法最大的好处是增强后的残留噪声类似于白噪声, 而不是音乐噪声。但是维纳滤波法只在平稳条件下才能保证在最小均 方误差意义下的最优估计。而语音是非平稳的,只在短时间内近似平 稳,实际环境中的噪声也常是非平稳的,这是维纳滤波法的缺陷所在。 硕士学位论文 2 。3 信嗓比度量 在用数字信号处理技术研究语音增强算法时,经常使用处理前后 信噪比的提高作为语音增强算法的评价指标。本文所采用的信噪比 彤氓定义为: d 2 ( 功 册= 1 0 l o g _ ( 2 2 5 ) 扩( 功 “ 公式( 2 2 5 ) 中上是信号长度,文谚是语音信号,荆是噪声。 设纯净语音信号是文谚,加性噪声为故功,输入的带噪语音信号 是荆即功= s ( 即) + d ( 功,且删经过增强处理之后变为x ,x 就 是纯净语音信号删的估计值。那么,输入信嗓比眠( 带噪语音信 噪比) 和输出信噪比眠,( 增强语音信噪比) 分别定义为: 1 0 l o g t l 一 瞰哟s ( 功 2 s 2 飘= 1 0 l o g 丁l 一 x ( 哟一s 渊2 一 ( 2 2 6 ) ( 2 2 7 ) 基于小波变换的语音增强方法研究与实现 2 4 小结 本章简明地介绍了语音处理的一些基础知识、几种常用的传统语 音增强方法及信噪比的定义。较详细地分析了语音信号和噪声的时域 及频域特性、语音和噪声的分类。上述这些知识是实现语音增强的理 论依据。最后论述了几种传统语音增强方法的要点,指出了它们的优 缺点,即: 谐波增强法只能用于浊音的增强,不能用于清音的增强。 基于语音生成模型的增强方法是利用产生语音的生理特点来达到 语音增强目的的。这种方法的关键在于如何从带噪语音中准确地估计 出语音模型的参数。 谱减法语音增强效果明显、运算量小,但是增强后的语音有较强 的音乐噪声。 维纳滤波法最大的好处是增强后的残留噪声类似于白噪声,而不 是音乐噪声。但是维纳滤波法只在平稳条件下才能保证在最小均方误 差意义下的最优估计。而语音是非平稳的,只在短时问内近似平稳, 实际环境中的噪声也常是非平稳的,所以用维纳滤波法进行语音增强 处理时也需要进一步的改进。 上述这些算法都存在不足,有待于进一步改进和完善,这也为下 一章讨论基于小波变换的语音增强方法打下了铺垫。 硕士学位论文 第三章基于小波变换的语音增强方法 小波分析是一种时频分析,而传统的信号分析是建立在傅立叶 ( f o u r i e r ) 变换的基础之上的。由于傅立叶分析使用的是一种全局 的变换,要么完全在时域,要么完全在频域,因此无法表达信号的时 频局域性质,而这种性质恰恰是非平稳信号( 如语音信号) 最根本和 最关键的性质。为了分析和处理非平稳信号,人们对傅立叶分析进行 了推广乃至根本性的革命,提出并发展了一系列新的信号分析理论: 短时傅立叶变换、g a b 。r 变换、时频分析、小波变换等。小波变换是 一种信号的时间一尺度( 时间一频率) 分析方法,它具有多分辨率分 析( m u l t i r e s 0 1 u t i o na n a l y s i s ) 的特点,而且在时频两域都具有 表征信号局部特征的能力。它克服了短时傅立叶变换固定分辨率的缺 点,在信号的高频部分,可以获得较好的时间分辨率,在信号的低频 部分可以获得较高的频率分辨率,特别适用于像语音信号、地震信号、 声纳信号等非平稳信号的处理。 本文利用了小波变换所具有的多分辨分析的特点对语音信号进 行去噪处理,并通过实验验证了基于小波变换的语音增强方法优于基 于传统傅立叶变换的谱减法。本章首先给出了小波分析的基础理论知 识,主要有小波变换的定义及其算法、小波包的定义及其算法;接着 讨论了小波去噪的基本原理,用仿真实验验证了小波变换方法进行语 音增强的有效性;最后在基于闽值的小波域语音增强方法的基础上给 基于小波变换的语音增强方法研究与实现 出了一种改进的基于结点阈值小波包分解的语音增强算法。仿真结果 表明:本文所采用的方法能够提高带噪语音的信噪比和改善带噪语音 主观听觉的舒适度,且其性能优于传统的谱减法。 3 1 小波分析基础 3 1 1 小波变换及其算法 如果( r ) 口( r ) ( r ( r ) 表示平方可积的实数空间,即能量有限 的信号空问) ,其傅立叶变换为y ( 由) ,当( ) 满足 q = 上警 m ( 3 1 ) 则称y ( f ) 为一个母小波或基本小波( m o t h e rw a v e l e t ) ,公式( 3 1 ) 称为容许性条件。,称 啪0 ) :i 口l 一5y ( 三二鱼) 口,6 r ,口o ( 3 2 ) 乜 为小波序列,公式( 3 2 ) 中口为伸缩因子,6 为平移因子。当f ,以, 6 连续变化时,虬,6 ( f ) 称为连续小波;当日,6 分别离散化为口o “,“ 时,则称,a ( f ) 为离散小波。连续小波变换和离散小波变换分别定义 为 町( 咖) = 书l 专肌) ( 学妙 ( 3 - 3 ) 町( m ) = = i 上 厂( f ) y ( 乜。一“f 一,z 白) ) 出 ( 3 4 ) 公式( 3 3 ) 为连续小波变换的定义式,公式( 3 4 ) 为离散小波变换 的定义式。 硕士学位论文 定义3 。l 设函数m ( f ) r ( r ) ,如果存在两个常数 4 ,b ( o 0 定义3 4 设在尺度日= 2 下,如果不等式 硕士学位论文 i 7 j ( 口,f ) i 陟互( d ,吒) lf ( r 。一占,f 0 + 占) ( 3 1 8 ) 成立,则称为小波变换在尺度口= 2 下的局部模极大值点,i 呢( n ,) i 是小波变换的模极大值。 信号x ( ,) 的三枷幽汜指数与小波变换的模极大值满足下式瞠: z 。9 21 t ( d ,f ) 1 ,d 9 2 k + , ( 3 1 9 ) 公式( 3 1 9 ) 中k 为与小波基有关的常数。因此,可以得到小波 变换尺度a = 2 ,与三枷幽沈指数之间的关系,以及小波变换尺度口= 2 r 与小波变换系数畋u 的模极大值的变化规律: 当 0 时,小波变换系数吨的模极大值随着尺度反的增大 ( 即盘= z 中的,的增大) 而增大。 当= o 时,小波变换系数巩“的模极大值保持不变。 当 0 ,所以语音信号的 小波系数哦,的模极大值随着尺度盘的增大而增大。由于白噪声的 三枷咖抛指数= 一 一g o ,所以白噪声的小波系数喀“的模极 大值随着尺度日的增大而减小。而且由于小波变换是一种正交变换, 所以白噪声经小波交换后得到的小波系数以仍然是白噪声,即巩 在时域和频域上的分布是一致的。 综上所述,可知语音信号只在尺度日较大时对带噪语音信号的小 波分解系数巩- 有较大影响,而白噪声在尺度日较小时对带噪语音信 号的小波分解系数d 。有较大影响。而且,自噪声经小波变换后还是 基于小波变换的语音增强方法研究与实现 白噪声。所以,对于被白噪声污染的语音信号即带噪语音信号要实现 增强的目的,可以先对带噪语音信号进行小波变换,在小波域将语音 信号和白噪声粗略地分开并把噪声放大,然后对各个尺度的小波系数 进行适当的滤波就可以把噪声去除,最后对处理之后的小波系数进行 小波逆变换得到重构的纯净语音信号的估计值,实现增强语音的目 的。 3 2 2 阈值的选取方法及量化方法 用小波变换进行去噪可按如下方法进行处理:首先对带噪语音信 号z ( f ) 进行小波分解( 如进行三层分解,分解过程如图3 一l 所示) , 根据3 2 1 的分析可知噪声主要分布在高频系数c d l 、c d 2 、c b 上, 而语音信号主要分布在低频系数q 、c 坞、c 氇上,因而可以以门限 阂值形式对小波系数进行处理,然后对信号进行重构即可以达到去噪 的目的。 图3 一l 信号的三层小波分解 一般来说,对一帧带噪语音信号x ( f ) 的去噪过程可分为以下三 个步骤: 带噪语音信号x ( f ) 的小波分解。选择
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业气体生产工操作管理水平考核试卷含答案
- 2025年省直辖行政单位仙桃教师招聘参考题库及答案解析
- 2025年海南藏族自治州中小学教师招聘笔试参考试题及答案解析
- 2025年盈江县中小学教师招聘笔试参考试题及答案解析
- 2025年中阳县中小学教师招聘笔试参考试题及答案解析
- 2025年栾城县中小学教师招聘笔试备考试题及答案解析
- 2025年宜昌市虎亭区中小学教师招聘笔试参考试题及答案解析
- 2025年包头市东河区中小学教师招聘笔试参考试题及答案解析
- 四川省广元天立学校2025年高一上化学期中经典试题含解析
- 山东省新泰市二中2026届高一物理第一学期期末教学质量检测试题含解析
- 抗菌药物的处方审核课件
- 安全管理工作汇报
- (2025)食品安全法试题库(带答案)
- 老年肾病的护理
- 洗煤厂安全规程培训课件
- 宽窄巷子剧院介绍
- 产房安全管理课件
- 现场管理提升培训
- 现场安全文明施工培训课件
- GB/T 14992-2025高温合金和金属间化合物牌号及化学成分
- 小学阶段科学探究活动课件
评论
0/150
提交评论