




已阅读5页,还剩93页未读, 继续免费阅读
(通信与信息系统专业论文)基于dsp的语音增强系统的研究与设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
东华大学学位论文原创性声明 i ul i ii l li l l f l l l t lii l f l lj i l lu l y 2 13 5 8 6 2 , 本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学 位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。 除文中已明确注明和引用的内容外,本论文不包含任何其他个人或 集体己经发表或撰写过的作品及成果的内容。论文为本人亲自撰写, 我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。 学位论文作者签名:l7 易 日期: z 口1 1 年1 月l 驴日 东华大学学位论文版权使用授权书 学位论文作者完全了解学校有关保留、使用学位论文的规定,同 意学校保留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫 描等复制手段保存和汇编本学位论文。 保密口,在年解密后适用本版权书。 本学位论文属于 不保密日。 学位论文作者签名:王访 e l 期:弘1 1 年1 月i8 日 指导教师签名:懈良指导教师签名:、卜民 日期:f | 年乙厅骺 基于d s p 的语音增强系统的研究与设计 摘要 随着科学技术的迅速发展,语音通信技术已经越来越成熟。语音是人类进行 交流的一种非常重要的方式,语音质量的好坏将直接影响人与人之间的沟通与交 流。在现实的生活中,比如l q v 包厢、热闹的菜市场、演唱会现场、工厂车间、 地铁站等环境中使用的手机、麦克风、电话等各种通信设备,难免会受到来自环 境噪声的影响而使得语音通信质量下降,严重的甚至会导致通话无法进行。因此 在强噪声背景下进行语音通信时,非常有必要滤除背景噪声。语音增强的主要目 的就是去除背景噪声对于语音的干扰,从而提高语音通信系统的质量。 近年来,随着d s p ( d i g i t a ls i g n a lp r o c e s s i n g ) 技术和v l s i ( v e r yl a r g e s c a l ei n t e g r a t e dc i r c u i t s ) 的发展,为语音增强的实现提供了理论与技术上的支持。 随着d s p 芯片性能的不断改进与发展,以及开发平台的不断完善,能够使语音 增强技术在硬件系统上很好实现,并且很好的应用到语音通信的各个场合。本课 题主要研究噪声环境下的语音增强技术,其目的是为了提高语音通信的质量,尽 量提高语音通信的可懂度和清晰度,能够给人们在嘈杂的环境下创造一个舒适的 语音通信环境。 语音激活检测( v 如) 作为语音增强算法的前端处理算法,v a d 算法的性 能的好坏对语音增强效果有很大影响。本文在对各种语音激活检测算法进行研究 的基础上,对各种语音激活检测算法进行了分析比较及仿真实验,最终选择了基 于频带方差语音激活检测技术作为本系统的语音激活检测算法。 语音增强的主要环节是语音增强算法的实现。谱减法由于算法简单有效而成 为语音增强方法中的一个比较重要的方法,但是传统的谱减法在进行语音增强后 往往伴有“音乐噪声”,同时语音失真也比较大,尤其在带噪语音信噪比比较低 的时候,这些算法的性能急剧下降。本文在研究几种语音增强算法、并对它们的 优缺点进行分析的基础上,对现有的谱减法进行了优化改进。在语音增强系统中 采用了一种基于语音激活检测的多频带谱减法,作为语音增强算法的研究对象, 并对不同信噪比的背景噪声进行了试验仿真,结果表明,该算法能有效的抑制“音 乐噪声”,提高信噪比,在嘈杂的环境下能够有效地改善语音的通信质量。 本文给出了基于t m s 3 2 0 c 5 5 0 9d s p 的硬件与软件系统的设计,以及系统外 围器件与d s p 的连接方式、各个模块的初始化配置以及算法程序在系统上的实 现。最后在硬件系统上成功运行了所采用的语音增强算法,验证了算法的正确性, 对背景噪声起到了较好的抑制作用,基本达到了语音增强的目的。 关键词:语音增强,d s p ,v a d ,谱减法,频带方差 i i t h er e s e a r c ha n dd e s i g no ns p e e c he n h a n c e m e n ts y s t e m b a s e do nd s p a b s t r a c t w i mt h er a p i dd e v e l o p m e n to fs c i e n c ea n dt e c h n o l o g y v o i c ec o m m u n i c a t i o n st e c h n o l o g yi s b e c o m i n gm o r ea n dm o r em a t u r e v o i c ei sav e r yi m p o r t a n tw a yo fc o m m u n i c a t i o nb e t w e e n h u m a n s ,a n dv o i c eq u a l i t yw i l la f f e c tt h ec o m m u n i c a t i o na n de x c h a n g eb e t w e e np e o p l e i nr e a l l i f e ,w h e nu s i n gm o b i l ep h o n e ,m i c r o p h o n e ,t e l e p h o n ea n do t h e rc o m m u n i c a t i o n se q u i p m e n ti n s u c ha sm i l i t a r ye x e r c i s es i t e ,t h ec o n c e r ts c e n e ,a n dv e h i c l ec o m m u n i c a t i o nt h eq u a l i t yo fv o i c e w i l lb ei n e v i t a b l ea f f e c t e db yt h en o i s ef r o mt h ee n v i r o n m e n ta n dm a k et h eq u a l i t yd e c l i n e , s e r i o u s l yw i l ll e a dt ot h ec o n v e r s i o ni m p o s s i b l e t h e r e f o r e ,c o m m u n i c a t i o ni ns 仃o n gb a c k g r o u n d n o i s e ,i ti sn e c e s s a r yt of i l t e ro u tt h eb a c k g r o u n dn o i s e t h em a i np u r p o s eo fs p e e c he n h a n c e m e n t i st or e m o v eb a c k g r o u n dn o i s ea n di m p r o v ev o i c ec o m m u n i c a t i o ns y s t e mp e r f o r m a n c ei nt h e n o i s ye n v i r o n m e n t i nr e c e n ty e a r s ,w i t ht h ed e v e l o p m e n to fd s p ( d i g i t a ls i g r l a lp r o c e s s i n g y ) a n dv l s i ( v e r y l a r g es c a l ei n t e g r a t e dc i r c u i t ) ,p r o v i d i n gat h e o r e t i c a la n dt e c h n i c a ls u p p o r t i n gi nt h e o r ya n d t e c h n o l o g y w i t ht h ec o n t i n u o u si m p r o v e m e n ta n dd e v e l o p m e n to fd s pa n dt h e i m p r o v e m e n to f d e v e l o p i n gp l a t f o r m ,e n a b l i n gt h ev o i c ee n h a n c e m e n tt e c h n o l o g yi m p l e m e n t e dw e l li nt h e h a r d w a r es y s t e m ,a n dc a nb ew e l la p p l i e di nd i f f e r e n to c c a s i o n so fv o i c ec o m m u n i c a t i o n i nt h i s p a p e r , t h ev i o c ee n h a n c e m e n ti nn o i s ye n v i r o n m e n ti ss t u d i e d ,t h em a i n l yp u r p o s ei st oi m p r o v e d t h eq u a l i t yo fv o i c ec o m m u n i c a t i o n ,a sf a ra sp o s s i b l et oi m p r o v et h ei n t e l l i g i b i l i i t ya n dc l a r i t yo f v o i c ei nc o m m u n i c a t i o n ,c r e a t i n gac o m f o r t a b l ee n v i r o n m e n tf o rv o i c ec o m m u n i c a t i o n v o i c e a c t i v i t yd e t e c t o r ( v a d ) a st h ef r o n tp r o c e s s i n ga l g o r i t h mo ft h es p e e c he n h a n c e m e n f , i t s p e r f o r m a n c ed i r e c t l ya f f e c tt h es p e e c he n h a n c e m e n ta l g o r i t h m 。i nt h i sp a p e rs e v e r a lv a d sa r e s t u d i e d , a n da l s os i m u l a t et h e s ea l g o r i t h m s , t h er e s u l t sa r ea n a l y z e da n dc o m p a r e d , u l t i m a t e l yt h ev a db a s e do nf r e q u e n c yd e v i a t i o na st h e v o i c ea c t i v i t yd e t e c t i o no f t h es y s t e m t h em a i nl i n ko ft h es p e e c he n h a n c e m e n ti st h ea c h i e v e m e n to ft h es p e e c he n h a n c e m e n t a l g o r i t h m t h es p e c t r a l s u b t r a c t i o nb e c o m e st h ei m p o r t a n tm e t h o df o rs p e e c he n h a n c e m e n t b e c a u s eo ft h es i m p l i c i t ya n de f f e c t i v n e s s b u tt h et r a d i t i o n a ls p e c t r a ls u b t r a c t i o no r e na s s o c i a t e s w i t h “m u i c a ln o i s e ”,a tt h es a m et i m et h es p e e c hd i s t o r t i o ni s r e l a t i v e l y l a r g ea f t e rs p e e c h e n h a n c e m e n t e s p e c i a l l yw h e nt h es n r i sr e l a t i v e l yl o w , t h ep e r f o r m a n c e so f t h e s ea l g o r i t h m sa l e s h a r p l yd e c l i n e t h es p e c t r a ls u b t r a c t i o ni so p t i m i z e da n di m p r o v e db a s e do nt h ea n a l y s ia n ds t u d y o fs e v e r a ls p e e c he n h a n c e m e n ta l g o r i t h m s a v o i c ea c t i v i t yd e t e c t i o nb a s e do nm u l t i b a n ds p e c t r a l s u b t r a c t i o ns p e e c he n h a n c e m e n ta l g o r i t h mi su s e d i nt h i sp a p e r , w et e s ta n ds i m u l a t et h e u a l g o r i t h mw i t ht h eb a c k g r o u n dn o i s eo fd i f f e r e n ts i g n a lt on o i s er a t i o t h er e s u l t ss h o wt h a tt h e a l g o r i t h mc a ne f f e c t i v e l yi n h i b i tt h e “m u s i cn o i s e ”,a tt h es 赳 t l et i m e ,i n c r e a s i n gt h es i g n a lt on o i s e r a t i oa n di m p r o v i n gt h eq u a l i t yo fv o i c ec o m m u n i c a t i o ni nt h en o i s ye n v i r o n m e n t t h ea r t i c l ei n t r o d u c e st h ed e s i g no fh a r d w a r ea n ds o f t w a r eb a s e do nt m $ 3 2 0 c 5 5 0 9d s p , a l s ot h ec o n n e c t i o n sb e t w e e ns y s t e mp e r i p h e r a ld e v i c e sa n dd s pa n di n i t i a lc o n f i g u r a t i o no fe a c h m o d u l ea n da l g o r i t h mi m p l e m e n t a t i o np r o c e s so nt h es y s t e mi si n t r o d u c e d a tl a s tt h ei m p r o v e d s p e e c he n h a n c e m e n ta l g o r i t h mi ss u c c e s s f u lo p e r a t e do nt h eh a r d w a r es y s t e m t h es y s t e mc a n p l a ya ni n h i b i t o r ye f f e c to nt h eb a c k g r o u n dn o i s e ,t h eb a s i cp u r p o s eo fs p e e c he n h a n c e m e n ti s a c h i e v e d w a n gl o n g ( c o m m u n i c a t i o na n di n f o r m a t i o ns y s t e m ) s u p e r v i s e db yg u a nh o n g y u n k e yw o r d s :s p e e c he n h a n c e m e n t , d s p ,v a d ,s p e c t r a ls u b t r a c t i o n i i i 目录 第一章绪论l 1 1 引言1 1 2 语音增强的发展历史与现状1 1 3 课题研究的意义与目标2 1 4 课题研究内容与结构3 第二章语音增强技术5 2 1 引言5 2 2 语音和噪声特性5 2 2 1 带噪语音模型5 2 2 2 语音信号的特性6 2 2 3 噪声的特性7 2 3 语音增强的方法8 2 3 1 基于参数和模型的方法8 2 3 2 谱减法8 2 3 3 线性滤波法一9 2 3 4 小波变换法9 2 3 5 子空间语音增强方法1 0 2 3 6 自适应噪声抵消法1 1 2 3 7 基于阵列话筒的语音增强1 1 2 4 语音增强效果评价方法1 1 2 4 1 主观评价方法1 1 2 4 2 客观评价方法1 2 2 5 本章小结1 4 第三章语音激活检测技术15 3 1 语音信号系统的预处理15 3 2 基于谱熵和谱能量的语音激活检测方法1 6 3 2 1 算法实现步骤18 3 2 2 实验仿真及分析18 3 3 基于频带方差的语音激活检测方法1 9 3 3 1 算法实现步骤2 0 3 3 2 实验结果分析2 l 3 4 基于短时能及过零率的语音激活检测方法2 2 3 4 1 算法实现步骤2 3 3 4 2 实验结果与分析2 4 3 5 ,卜结2 5 第四章基于多频带谱减的语音增强方法。2 6 4 1 谱减法及其改进方法2 6 4 1 1 传统谱减法及其改进方法2 6 4 1 2 “音乐噪声”的产生2 9 i v 4 2 多频带谱减法算法2 9 4 2 1 多频带谱减法2 9 4 2 2 确定频带谱减参数的方法3l 4 3 算法仿真及分析3 2 4 3 1 语音增强效果评价标准3 2 4 3 2 实验结果及分析3 2 4 3 3 效果评价3 6 4 3 4 算法分析3 7 4 4 章小结一3 7 第五章基于d s p 语音增强系统的硬件设计。一3 9 5 1d s p 简介及d s p 系统开发流程3 9 5 1 1d s p 介绍3 9 5 1 2d s p 开发流程介绍4 0 5 2 系统方案设计4 1 5 3t 瞒3 2 0 c 5 5 x x d s p 芯片介绍4 2 5 4 外围功能电路设计4 4 5 4 1d s p 时钟设计:4 4 5 4 2 供电模块设计4 5 5 5 频信号的采集与传输4 6 + 5 5 1 高保真语音编解码芯片t l v 3 2 0 aic 2 3 介绍。4 7 5 5 2t l v 3 2 0 aic 2 3 的控制接口4 7 5 5 3t l v 3 2 0 aic 2 3 的数字音频接口4 8 第六章语音增强系统软件设计5 0 6 1 开发环境c c s 介绍一5 0 6 2 系统初始化程序设计5 0 6 2 1 存储空间分配和c i i d 文件5 0 6 2 2 中断设计51 6 2 3l2 c 总线连接及t l v 3 2 0 alc 2 3 初始化。51 6 2 4 陷p 的初始化5 2 6 2 5d m 的初始化5 3 6 3 语音增强算法的d s p 实现5 4 6 3 1 软件算法流程图5 4 6 3 2 中断向量文件5 8 6 3 3 链接命令文件6 0 6 4 结果与分析。6 4 6 5 ,j 、结6 6 第七章总结与展望6 7 致j 射6 9 参考文献7 0 附录1 ( 攻读硕士学位期间发表的论文及科研成果) 7 3 附录2 ( 开发板) 7 4 附录3 ( 源程序) 7 6 v 1 1 引言 第一章绪论 随着现代科学技术的迅猛发展,公共电话网、互联网以及移动通信网都得到 了很快的发展,技术也变的非常成熟。当人们在使用这些通信网络进行语音通信 时,发送方通常会受到来自周围所处环境( 比如汽车站、火车站、机场、地铁站, 菜市场、热闹的街道或嘈杂的车间等) 的背景噪声的干扰,这时进行语音通信时 环境强烈的噪声会通过传输媒质而进入到通信设备内传送到接收方,此时接收方 所接收到的语音信号已经不是纯净的原始语音信号,而是受到环境背景噪声污染 的带噪语音信号。当背景噪声比较强烈时,接收方会因为听不清楚对方所说的语 音而感到厌烦与疲劳。如果我们长时间的在这样嘈杂的环境中进行语音通话会增 加接受方的听力负担,时间久了还会让人感到烦躁、头痛、呕吐,甚至会造成听 力下降或引发各种身体疾病【0 1 1 。所以为了能够从带噪语音信号中尽可能的获取纯 净语音信号,减少背景噪声的干扰,就需要对带噪语音信号进行语音增强的处理。 因此,语音增强技术是提高语音处理系统性能的关键技术之一。通过语音增强技 术能够有效的改善语音通信质量,给人们带来一个比较舒适的语音通信环境。 实现高噪声环境下的高质量语音通信,是目前语音通信中亟需解决的技术难 题。强烈的背景噪声会破坏原始纯净语音信号声学特征和各种模型参数,会减弱 不同语音信号之间的特征差别而使语音通话质量下降、可懂度的降低。随着人类 的科学技术和社会生产力的蓬勃发展,人们经常处于高噪声环境的机会变的会越 来越多。在一些特定的场合,比如当新闻记者现场采访时,周围的噪声会直接影 响播出效果,又比如当我们在使用电话、手机、对讲机在进行沟通时,当要传达 的信息比较重要时,但由于周围噪声的影响,会让人们听不清楚对方讲的重要内 容,更严重的会使对方误解了说话的内容。因此,消除噪声、研究抗环境噪声的 语音增强系统对于语音通信技术将具有十分重要的意义。 1 2 语音增强的发展历史与现状 在早期的语音增强技术中,主要是采用模拟器件搭建的各种滤波电路来实现 的。但是由于模拟电路有自身的局限性,就是当信噪比小到一定程度时,滤波电 路不能有效地解决噪声消除问题。另外由于模拟电路自身的特性,当环境噪声发 生强烈变化的时候,模拟滤波器不能适应环境的变化。对于使用者来说,这种不 1 灵活性会带来极大的不便,因为每次噪声强烈变换一次就要修改模拟电路的参数 o i l 0 2 1 。因此,语音增强技术朝数字化方向研究己经成为一种必然趋势。 在上世纪7 0 年代,随着数字信号处理( d s p ) 理论的成熟,语音增强技术 逐渐引起了人们的关注,掀起了研究语音增强技术的高潮,在这方面取得了一定 的研究成果。在之后的几年时间里,人们主要对语音增强算法进行了大量的研究, 从不同的角度提出了语音增强处理的具体算法。首先,在1 9 7 8 年,l i m 和 o p p e n h e i m 等人提出了维纳滤波语音增强方法。接着在1 9 7 9 年,s b o l l 提出了 经典的谱减法语音增强算法,随后,又在谱减法的基础上提出了改进型的谱减法。 进入8 0 年代后,大规模集成电路的发展为语音增强的实时实现奠定了基础,从 而加快了语音增强技术的发展。1 9 8 0 年,m a c a u l a y 和m a l p a s s 提出了软判决语 音增强方法;1 9 8 4 年,e p h r a i m 和m a i a h 提出了基于m m s e s t s a 的语音增强 算法,1 9 8 5 年,两人又进一步提出了m m s e l o g s t s a 算法;1 9 8 7 年,p a l i w a l 将卡尔曼滤波引入了语音增强,形成了非常经典的卡尔曼滤波方法【0 2 l 。在此之后, 人们对于语音增强研究的热度仍旧不减。9 0 年代初,人们尝试将统计学中最为 经典的隐马尔可夫模型引入到语音增强中,这种方法受到了很多研究者的关注。 在1 9 9 4 年,r a i n e rm a r t i n 提出了基于最小统计的语音增强方法。1 9 9 5 年e p h r a i m 提出了基于子空间的语音增强方法。之后,r a i n e rm a r t i n 又进一步提出了基于最 优平滑和最小统计的噪声功率谱密度估计方法【0 3 11 0 4 l 。 此外,随着语音增强研究的不断深入和其他领域的一些新的研究方法的出 现,人们在原有经典算法的基础上不断引入新的思想,提出了一些很具有研究前 景的语音增强方法。比如对带噪语音信号进行小波变换( w a v e l e t ) 处理或者进 行离散余弦变换( d c t ) 的处理。此外,还包括了人工神经网络方法、卡亨南一 一洛维变换( 1 l t ) 方法以及麦克风阵列处理方法等【0 3 】1 0 4 11 0 5 1 。语音增强从被提出 开始到现在,始终是语音信号处理的研究焦点,在此过程中不断地涌现出新的优 秀算法,并且随着理论的成熟和新技术的发展,人们还会将其他领域新的研究方 法引入到语音增强中来,使语音增强技术不断地完善和进步。在未来很长的一段 时间里,语音增强技术的研究仍然会是一个比较热门的课题,并且还将诞生更多 的优秀的研究成果。 1 3 课题研究的意义与目标 语音增强技术在人们的日常生活具有较大的应用价值。当人们在强背景噪声 环境下比如综艺晚会现场,喧嚣的闹市,k t v 包厢等不同的环境中进行语音通信 时,不可避免地会受到来自环境噪声的影响,严重时会使语音质量急剧下降,以 致于听不清对方说的内容。当人们长时间在这样的环境下进行语音通信,会使人 2 们感到烦躁和沮丧,严重的还将影响人们的听力系统,从而限制了许多语音通信 工具在强背景噪声环境中的应用 0 4 1 0 5 1 。因此,为了让我们在嘈杂环境中能够比较 清晰地获取对方的语音信息,就需要进行含噪声的语音进行增强处理。如何快速、 有效地去除背景噪声已经成为当今语音增强技术中的一个研究热点和难点。 语音增强的目标是能够尽最大程度的从被噪声污染的语音信号中获取有用 的语音信号,而减弱所噪声对于语音信号的影响。因为噪声的分布是随机的,所 以要百分之百的去除噪声是几乎不可能的,语音增强的主要目的是降低环境噪声 对语音信号的影响,尽可能的提高信噪比。 本论文主要是研究了如何在噪声环境下,有效地提高语音通话质量的技术方 法,在语音增强算法上,针对传统谱减法的缺点,采用基于v a d 的多频带谱减 法,并通过m a t l a b 对算法进行仿真试验,同时编写程序并在硬件系统上运行, 试验结果表明,该算法对带噪语音信号具有一定的语音增强功能。 1 4 课题研究内容与结构 本文的研究内容与组织结构如下: 第一章为绪论,主要介绍了语音增强的国内外发展现状背景,以及本课题的 研究目标和意义,并介绍了本文的主要工作。 第二章主要介绍语音增强的一些基本原理和基础知识,对现今流行的几种语 音增强算法进行了简要的介绍,并分析了各自的优缺点。 第三章主要对基于语音激活检测的几种算法进行了介绍与比较。并对各种语 音激活检测算法进行了仿真,同时分析了各种语音激活的优缺点,最终选择了适 合本系统的语音激活检测方法。 第四章阐述谱减法的基本原理,并研究传统的几种谱减法的改进形式及其缺 点。基于所选择的语音激活检测,采用一种基于语音激活的多频带谱减法的语音 增强算法,改善了算法的语音增强性,更适合在d s p 系统上实现。对该算法进 行仿真试验,并对其性能进行了分析。 第五章为d s p 硬件系统设计。本文给出了所采用的d s p 芯片和其它相关器 件,以及各个器件的功能,同时设计了相应的硬件系统,并介绍了各个器件之间 的连接以及工作原理。 第六章为系统的软件设计。介绍了软件的开发环境,给出了系统的初始化设 计以及程序流程图,各个模块的初始化程序配置,算法程序的实现与优化过程, 并对程序结果进行了分析与处理。 第七章为总结与展望。对本文的主要工作进行了总结,指出了本文中所存在 的不足之处,提出了需要改进的地方,并对未来的研究进行了展望。 4 2 1 引言 第二章语音增强技术 语音增强技术,是指在随机分布的环境噪声中,如何来消除语音信号中的噪 声干扰,提取有效的纯净语音。其目的主要有:第一,主观上,尽可能的消除背 景噪声,为后续语音处理做好准备,使听者乐于接受,不会因为噪声的影响感到 疲劳;第二,客观上,提高语音信噪比,以提高语音的可懂度与清晰度为目的嗍 0 6 1 。 2 2 语音和噪声特性 2 2 1 带噪语音模型 本文中主要是以人们的喧嚣声,交通噪声以及工厂车间的噪声等为主要研究 对象的。这些噪声一般符合以下几个特性:局部平稳的、加性的、噪声与语音信 号是统计独立或是不相关的。 带噪语音信号的模型表达式如下: y ( n ) = s ( n ) + d ( n ) ( 2 1 ) 式中y ( n ) 表示带噪语音,s ( n ) 表示纯净语音,d ( n ) 表示噪声。带噪语 音模型如图2 - 1 所示: 图2 1 带噪语音模型 躁声的局部平稳性是指:一段带噪语音中的噪声具有和语音段开始前那段 噪声相同的统计特性,并且在整个语音段中保持不变。即,可以根据在语音开始 前那段噪声来估计语音中所叠加的噪声的统计特性【0 5 】【0 6 1 。 2 2 2 语音信号的特性 ( 1 ) 语音是时变的、非平稳的随机过程 语音信号是时变的、非平稳的,语音的模型参数是时刻在变化的,只是有时 变化快,有时候变化慢。在语音的开启端、结束端、短时的语音过渡、语音变调 等都是由于语音模型参数发生了变化。当然人类发音系统的生理结构的变化速度 是有一定限度的。在一段时间内( 1 0 - - 一3 0 m s ) ,人的声带和声道形状是相对稳定的, 可以认为其特征是不变的或者变化时缓慢的。由于语音的短时谱具有相对稳定 性,因此在对语音进行分析处理时经常需要用到短时谱的这种平稳性。 ( 2 ) 语音可分为清音和浊音两大类 语音可以分为浊音和清音,两者语音的产生机理有明显差异。在产生浊音时, 语音信号在时域上呈现出明显的周期性;在频域上有明显的共振峰结构,而且能 量大部分集中在较低频段内。而产生清音时,声带并不震动,语音信号没有明显 的时域和频域特征,类似于白噪声。在语音增强系统研究中,可以利用浊音的周 期性特征,采用梳状滤波器提取语音分量或者抑制非语音信号,而从带噪语音中 分离出清音是非常困难的嗍6 0 7 6 。 ( 3 ) 语音信号可以用统计分析特性来描述 由于语音是非平稳的随机过程,所以长时间的时域统计特性在语音增强的研 究中意义不大,语音的短时谱幅度的统计特性是时变的,只有当分析帧长趋于无 穷大时,才能近似认为其具有高斯分布。高斯分布模型是根据中心极限定理得到 的。在高斯模型假设下,傅立叶展开系数被认为是独立的高斯随机变量,均值为 零,而方差是时变的。将高斯模型应用于有限帧长只是一种近似的描述。在宽带 噪声污染的语音增强中,可将这种假设作为分析的前提。 ( 4 ) 语音感知对语音增强研究有重要作用。 人耳的听觉感知特性对语音增强技术的发展有着非常重要的推动作用,这些 特征主要有以下几方面:它对相位谱则不敏感;人耳对频率高低的感受近似与该 频率的对数值成正比;共振峰对语音的感知十分重要,特别是第二共振峰比第一 共振峰更为重要,因此对语音信号进行一定程度的高通滤波不会对可懂度造成影 响;人耳在两个人以上的说话环境中,有能力分辨出需要聆听的声音,这种特性 被称作“鸡尾酒会效应”。“鸡尾酒会效应”是指人可以在嘈杂环境中识别自己 感兴趣声音的能力,即人具有语音分离的能力 0 6 16 0 7 1 。 6 2 2 3 噪声的特性 在自然界中噪声的来源的途径是各种各样,因此噪声的特性也各种各样,变 化无穷,其分类自然也就各种各样的。按照噪声产生的原因可以将噪声分为内部 噪声和外部噪声。内部噪声是指语音信号处理系统内部的设备电路所引起的噪声 以及器材材料本身所引起的噪声等:而外部噪声则是指由信号处理设备外部环境 所引入的噪声f 0 7 1 【8 】。噪声可以是加性的,也可以是非加性的。考虑到加性噪声更 普遍且易于分析问题,并且对于非加性噪声,有些可以通过变换转变为加性噪声, 例如,乘积性噪声或卷积性噪声可以通过同态变换而成为加性噪声。此外根据噪 声的统计特性,又可以将噪声分为平稳噪声和非平稳噪声。如果噪声的统计特性 不随时间变化而变化,则称其为平稳噪声,否则称其为非平稳噪声。这里我们仅 讨论加性噪声。加性噪声大致可分为周期性噪声、冲激噪声、宽带噪声和语音干 扰。 ( 1 ) 周期性噪声 周期性噪声的特点是有许多离散的窄谱峰,它往往来源于发动机等周期运转 的机械。如5 0 或6 0 h z 交流声会引起周期性噪声。周期性噪声引起的问题可以通 过功率谱发现,并通过滤波或变换技术将其去掉。 ( 2 ) 冲激噪声 冲激噪声表现为时域波形中突然出现的窄脉冲,它通常是放电的结果。消除 这种噪声,可以根据带噪语音信号幅度的平均值确定阈值。当信号幅度超过这一 阈值时,判为冲激噪声,然后进行消除。 ( 3 ) 宽带噪声 宽带噪声的来源很多。如热噪声、气流( 如风、呼吸) 噪声及各种随机噪声源 等。量化噪声也可视为宽带噪声。由于宽带噪声与语音信号在时域和频域上完全 重叠,因而消除它最为困难。这种噪声只有在语音间歇期才单独存在。对于平稳 的宽带噪声,通常可以认为是白色高斯噪声。不具有白色频谱的噪声,可以先进 行白化处理。对于非平稳的宽带噪声,情况就更为复杂一些。 ( 4 ) 语音干扰 人耳可以在两个以上讲话环境中分辨出所需要的声音,这种分辨能力来源于 人的双耳输入效应,称为“鸡尾酒会效应 。 在本文中研究的噪声主要是以工厂机器或实验室环境下的噪声为主要研究 对象,这种噪声一般具有以下几个特征: ( 1 ) 属于加性噪声; ( 2 ) 具有局部平稳性; ( 3 ) 噪声与语音是独立的或不相关的; 7 2 3 语音增强的方法 随着人们所处的环境、时间的不同,背景噪声也是不断变化的,所以在进行 语音增强的时候很难找到一种能够通用的噪声数学模型和通用的语音增强方法。 在不同的条件下应该采用不同的语音增强方法,不同的增强方法对于不同的噪 声,抑制效果也不同。 随着数字信号处理理论技术的不断发展,在语音增强方面已经出现了多种语 音增强方法。在实际应用中,应该根据环境场合,针对的各种不同噪声比如人群 的吵闹声,飞机场的噪声,车间的机器运转的噪声的不同而采用不同的语音增强 方法。下面就介绍一下实际中应用到的几种典型的语音增强方法。 2 3 1 基于参数和模型的方法 基于参数和模型的方法通常可以分成两类:分析合成法和利用滤波器进行滤 波处理的方法。前者是把声道模型看作一个全极点滤波器,采用线性预测分析得 到滤波器的参数,然后通过从带噪语音中准确估计模型的参数来合成干净的语 音。这种方法关键在于如何从带噪语音中准确地估计语音模型的参数,包括激励 参数和声道参数【】【0 9 1 。后者则是考虑到激励参数难以准确估计,只采用声道参数 构造滤波器进行滤波处理。该类方法在低信噪比的情况下性能比较差,而且往往 需要多次迭代运算从而增加了算法的复杂度。 2 3 2 谱减法 谱减法是利用噪声的统计平稳性以及加性噪声与读音不相关的特点而提出 的一种语音增强方法。这种方法没有使用参考噪声源,但它假设噪声是统计平稳 的,即有语音期间噪声振幅谱的期望值与无语音间隙噪声的振幅谱的期望值相 等。用无语音间隙测量计算得到的噪声频谱的估计值取代有语音期间噪声的频 谱,与含噪语音频谱相减,得到语音频谱的估计值。当上述差值得到负的幅度值 时,将其置零。 谱减法的主要思想是认为:含噪语音在噪声平均功率以上的部分就是语音功 率,其余则认为是噪声功率。这种显然忽略了噪声和语音的随机特性。在含噪语 音的功率谱中,噪声平均功率以上部分并非全是语音,其中肯定有不少加性噪声 成分存在,其下部分则也必有语音成分存在。因此,这种方法对提高语音信噪比 十分有限,而且还会引起语音的失真。特别是在低信噪比时,这种方法很难提高 语音质量,更难提高语音可懂度。谱减法的优点在于它的算法简单,并且可以较 大幅度地提高信噪比,其缺点是增强后的语音中含有明显的音乐噪声,这是由频 谱相减而产生的一种残留噪声,具有一定的节奏起伏感,故而被称为”音乐噪 声”【1 们 1 1 1 1 2 1 。 2 3 3 线性滤波法 线性滤波法主要是利用了语音的产生模型。对于受加性稳态白噪声干扰的语 音信号来说,语音的频谱又以根据语音的产生模型近
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水龙吟苏轼次韵课件
- 水粉画讲解课件
- 海上光伏项目海洋环境监测与保护方案
- 消防设施区域划分与标识方案
- 市政管道施工地下水控制方案
- 医院药品采购与供应药品采购管理36课件
- 遮风避雨35景观建筑设施及小品设计18课件
- 二零二五版电动摩托车租赁与人才培训合同
- 二零二五年度文化活动策划劳务承包协议
- 二零二五年度房地产网络营销代理服务合同范本
- 医院安保突发治安事件应急预案
- 2023年宁波市慈溪市人民法院招聘编外人员考试真题及答案
- 高速公路服务区升级转型商业计划书
- 数学原来这么有趣
- 常见行政案件笔录模版
- 手术室甲状腺切除术手术配合护理查房
- 国家电网电力中级职称考试题
- 数据库设计规范说明
- 建设工程消防验收评定规则
- 肾内科临床技术操作规范2022版
- 2023年中国工商银行软件开发中心春季校园招聘500人笔试模拟试题及答案解析
评论
0/150
提交评论