




已阅读5页,还剩76页未读, 继续免费阅读
(控制理论与控制工程专业论文)数字助听器中语音增强算法研究及dsp实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
r e s e a r c ho ns p e e c he n h a n c e m e n t a l g o r i t h m sf o rd i g i t a l h e a r i n ga i d s a n d i t s 邛门田l e c n t a t i o n at h e s i ss u b m i t t e dt o s h a a n x i u n i v e r s i t yo fs c i e n c ea n dt e c h n o l o g y i np a r t i a lf u l f i l l m e n to f t h er e q u i r e m e n t f o r t h ed e g r e eo f t h e s i ss u p e r v i s o r :p m 凳s s o r 圣h 星望g 星望:塑壁g m a y ,2 0 1 0 数字助听器中语音增强算法的研究及d s p 实现 摘要 随着人们对听力损失等健康问题的重视,助听器得到了密切关注。目前 数字助听器由于其功能强、体积小、耗电省等优点在助听器行业中独领风骚。 语音增强技术作为数字助听器中一种重要的设计内容,也成为了研究热 点。对助听器而言,语音增强技术有着重要的意义,因为噪声严重影响到听 觉的舒适程度和言语的理解度。除此之外,语音增强技术也用来提高语音处 理系统前端预处理的抗噪声能力和输入信号的信噪比。如果信号不能较好的 从噪声中提取出来,就会使系统其他后续算法的效果大打折扣,甚至无法进 行。 针对于助听器的语音增强算法有许多算法,其中多通道方法由于存在结 构复杂、功耗大且不易实时实现等原因而无法广泛使用。相比之下,单通道 方法由于其结构简单,成本低,功耗小等优点而被选作助听器的最佳实现方 式。 目前单通道的语音增强算法最常用的是谱减法或其改进形式。这种方法 是从带噪语音信号的功率谱中直接减去噪声信号的功率谱而实现。其缺点是 增强后的语音会残留下很强的“音乐噪声 ,而且不台e , 1 1 甘又好的解决噪声抑制和 语音失真之间的矛盾。本文在这种背景下设计了一种基于掩蔽效应的改进型 维纳滤波算法,这种算法通过滤波器法使残留的音乐噪声白化为宽带噪声, 再利用人类听觉系统的掩蔽特性,通过掩蔽阈值对维纳滤波器权值系数的自 适应修改,有选择性地进行维纳滤波,使其在不影响听觉效果的前提下尽量 减小对语音信号的破坏。这样不但能有效增强语音,而且能在很大程度上减 少音乐噪声的影响,也较好地兼顾了去噪和减少语音失真。 实现方法为,提高语音信号的高频分量成分,再对原始带噪信号进行 b a r k 域的频带分割,根据频带再计算掩蔽阈值,通过掩蔽阈值调整维纳滤 波器的权值系数,然后在各个频带内分别进行维纳滤波。在m a t l a b 里对本 算法进行了仿真实验,结果表明,算法相对于谱减法及其改进型语音增强效 果显著,且失真小,几乎没有音乐噪声。同时,由于其计算量不大,也很适 合在基于d s p 的语音增强上实现。 文章也对d s p 的硬件部分进行了设计,包括前端放大抗混叠滤波电路、 f l a s h 存储器扩展、电源、时钟电路以及j t a g 仿真接口的设计等。最后在 d s p 系统上对改进型谱减法进行了硬件实验。实验结果表明,改进型谱减 法能有效地去除噪声,不足之处是会留下部分不适的音乐噪声。 关键词:数字助听器,语音增强,维纳滤波,掩蔽效应 r es e a r c ho ns p e e c he n h a n c e m e n t a l g o r i t h m sf o rd i g i t a lh e a r i n ga i ds a n di tsi m p l e m e n t a t i o n a b s t r a c t h e a r i n ga i dh a sb e e nc l o s e l yw a t c h e dw i t hp a y i n ga t t e n t i o nt ot h ep r o b l e mo f h e a l t h ya n dh e a r i n gl o s s n o w a d a y s ,t h ed i g i t a lh e a r i n ga i d st a k et h el e a dp l a c e i n h e a r i n gi n d u s t 巧b e c a u s eo fi t sp o w e r f u lf u n c t i o n ,s m a l li ns i z e ,a n dl o w p o w e rc o n s u m p t i o n e t c a sa ni m p o r t a n tc o n t e n to fd i g i t a lh e a r i n ga i d s s k i l l s ,h a sa l s os p e e c h e n h a n c e m e n tb e c o m eah o tf i e l d s p e e c he n h a n c e m e n ti 8 v e r yi m p o r t a n tf o r h e a r i n ga i d s ,f o rn o i s es e r i o u s l ya f f e c t st h ec o m f o r tl e v e ro fh e a r i n g ,s p e e c h u n d e r s t a n d i n gd e g r e e i na d d i t i o n ,t h es p e e c he n h a n c e m e n tt e c h n o l o g yi sa l s o u s e dt oi n c r e a s et h ef r o n t e n da n t i n o i s e c a p a b i l i t i e so ft h ev o i c ep r o c e s s i n g s y s t e ma n di n c r e a s et h es n r o fs i g n a l t h ee f f e c to fp o s ta l g o r i t h mw i l lb e c o m p r o m i s e ,e v e ni m p o s s i b l ei ft h es i g n a lc a n tb ew e l le x t r a c t e df r o mt h en o i s e t h e r ea r e m a n ya l g o r i t h m s i n s p e e c h e n h a n c e m e n tm e t h o d t h e m u l t i - c h a n n e lm e t h o dc a nn o tb ew i d e l yu s e db e c a u s ei t sc o m p l e xs t r u c t u r e 1 a r g ep o w e rc o n s u m p t i o na n dd i f f i c u l t r e a l i z i n go fr e a l t i m e i nc o n t r a s t , s i n g l e c h a n n e lm e t h o dh a sb e e ns e l e c t e da sb e s ti m p l e m e n t a t i o nb e c a u s eo ft h e a d v a n t a g e so f i t ss i m p l es t r u c t u r e ,l o wc o s t ,l o wp o w e r c o n s u m p t i o n c u r r e n t l y ,t h em o s tc o m m o n l yu s e dm e t h o do fs i n g l e c h a n n e ls p e e c h e n h a n c e m e n ta l g o r i t h mi st h es p e c t r a ls u b t r a c t i o no ri t s i m p r o v e df o r m t h i s m e t h o di sr e a l i z e df r o mt h er e s u l tw h i c ht h ep o w e rs p e c t r u mo f n o i s ys p e e c h s i g n a ld i r e c t l ys u b t r a c t i n gt h ep o w e rs p e c t r u mo fn o i s es i g n a lp o w e rs p e c t r u m t h ed i s a d v a n t a g e so ft h i sm e t h o da r et h a tt h ee n h a n c e dv o i c ew i l lb es t r o n g u n d e rt h er e s i d u a l “m u s i c a ln o s e ”f u r t h e rm o r e ,i tc a n ts o l v et h ec o n t r a d i c t i o n b e t w e e nt h en o i s es u p p r e s s i o na n dv o i c ed i s t o r t i o n i nt h i sc o n t e x t ,t h i sa r t i c l e i i i d e s i g n e da na l g o r i t h mo fi m p r o v e dw i e n e rf i l t e rb a s e do nm a s k i n ge f f e c t ,w h i c h w h i t e n i n gt h em u s i c a ln o i s et o t h ew i d e b a n dn o i s et h r o u g haf i l t e r ,a n d m o d i f y i n gt h ew e i g h tc o e f f i c i e n t so fw i e n e rf i l t e ra d o p t i v e l yu s i n gt h em a s k i n g t h r e s h o l dt h r o u g ht h em a s k i n gp r o p e r t i e so fh u m a na u d i t o r ys y s t e m b e c a u s eo f f i l t e r i n gt h es i g n a ls e l e c t i v e l y ,i tc a nm i n i m i z et h ed a m a g eo f f i l t e rr e s u l ti nt h e c o n t e x to fn o ta f f e c tt h eh e a r i n ge f f e c t s o ,i tn o to n l ye n h a n c e dt h es p e e c h ,b u t a l s om i n i m i z e dt h ee f f e c to fm u s i c a ln o i s el a r g e l y ,a n d b a l a n c e dt h e c o n t r a d i c t i o nb e t w e e ns u p p r e s s i n gn o i s ea n dr e d u c i n gv o i c ed i s t o r t i o n t h ef i r s ts t e po ft h i sm e t h o di sp r e p r o c e s s i n gt h ev o i c et oi m p r o v et h eh i 曲 f r e q u e n c yc o m p o n e n t t h e n ,s p l i tt h eo r i g i n a ln o i s ys p e e c hs i g n a lt os u b - b a n d a c c o r d i n gt h eb a r kd o m a i n t h e n ,c a l c u l a t et h em a s k i n g t h r e s h o l da c c o r d i n gt o f r e q u e n c yb a n d t h e n ,m o d i f yt h ew e i g h tc o e f f i c i e n t so f w i e n e rf i l t e ra c c o r d i n g t h em a s k i n gt h r e s h o l d a n dt h e n ,p r o c e s st h es i g n a lu s i n gt h ew i e n e rf i l t e ri n e a c hb a n dr e s p e c t i v e l y a tl a s t s i m u l a t i o ni sc a r r i e do u ti nm a t l a b t h er e s u l t s s h o w 也a te f f e c to ft h i sa l g o r i t h mi so b v i o u s ,l i t t l ed i s t o r t i o na n da l m o s tn om u s i c n o i s e a tt h es a m et i m e ,t h i sa l g o r i t h mi sv e r ys u i t a b l et oa c h i e v ei nd s p _ b a s e d s p e e c he n h a n c e m e n t b e c a u s eo fi t ss m a l lc o m p u t a t i o nc o m p l e x i t y t h eh a r d w a r eo fd s ps y s t e mi sa l s od e s i g n e di n c l u d eo ff r o n t - e n da m p l i f i e r c i r c u i tw i t ha n t i a l i a s i n gf i l t e r ,f l a s hm e m o r ye x p a n s i o n ,p o w e r ,c l o c kc i r c u i t a n dj t a ge m u l a t i o ni n t e r f a c ed e s i g n ,e t c f i n a l l y ,e x p e r i m e n t sa r ec a r r i e do u t u s i n gt h ep r o v e ds p e c t r a ls u b t r a c t i o r m e t h o do nd s ps y s t e m t h ee x p e r i m e n t a l r e s u l t ss h o wt h a ti m p r o v e ds p e c t r a ls u b t r a c t i o nc a ns u p p r e s sn o i s ee f f e c t i v e l y , b u ti tw i l lb el e a v i n gp a r to fu n c o m f o r t a b l em u s i c a ln o i s e k e yw o r d s :d i g i t a lh e a r i n ga i d s ,s p e e c he n h a n c e m e n t ,w i e n e rf i l t e r , m a s k i n ge f f e c t i v 目录 摘要i a b s t r a c t i i i 1 绪论:1 1 1 课题研究的背景及意义。1 1 2 国内外研究动态和水平2 1 3 本文的主要研究内容及章节安排3 2 基本概念5 2 1 语音和噪声的特征5 2 1 1 语音信号的特征5 2 1 2 噪声的特性6 2 1 3 语音信号的感知( 听觉) 特性7 2 2 掩蔽效应及b a r k 阈7 2 3 听力损失患者的特点9 2 4 数字助听器中的算法概述1 0 + 2 5 语音增强算法概述1 1 2 6 本章小结1 4 3 单通道语音增强算法的研究1 5 3 1 助听器对语音增强算法的选择1 5 3 2 谱减法1 6 3 2 1 基本谱减法1 6 3 2 2 改进谱减法1 8 3 3 维纳滤波法1 9 3 3 1 最小均方误差1 9 3 3 2 维纳霍夫方程的频域解k 1 9 3 4 基于掩蔽效应的维纳滤波器语音增强算法2 0 3 4 1 引言。2 0 3 4 2 语音处理的预加重处理2 1 3 4 3 语音活动检测2 2 3 4 4b a r k 域的分解2 4 3 4 5 分析滤波器和综合滤波器2 4 3 4 6 维纳滤波器的改进型2 6 3 4 7 掩蔽效应及掩蔽阈值的计算2 7 3 4 8 结合人耳掩蔽效应的维纳滤波算法2 8 3 4 9 语音增强结果的性能评价2 8 3 5 本章小结3 3 4 语音增强算法的d s p 实现3 4 4 1 处理器芯片的选择3 4 4 2t m s 3 2 0 c 5 4 ) 【) 【系列d s p 介绍3 4 4 3 多通道缓冲串行接口和d m a 传输模式3 6 4 4 数字助听器的硬件设计3 7 4 4 1 信号处理前端和后端设计3 7 4 4 2 电源设计。3 9 4 4 3 存储器系统设计:4 0 4 4 4 时钟电路设计4 1 4 4 5 监控和复位电路设计4 1 4 5a d 5 0 音频系统设计4 2 4 5 1 音频a d 5 0 简介4 2 4 5 2a d 5 0 的前端配置4 4 4 5 3a d 5 0 与d s p 的连接4 4 4 6j t a g 仿真接口的设计4 6 4 7 本章小结4 7 5 基于改进谱减法的软件设计4 8 5 1 集成开发环境c c s 及软件的开发流程4 8 5 2 数据的处理流程4 9 5 3 系统的程序设计5 0 5 3 1 主程序流程及初始化操作5 0 5 3 2 软件系统主要模块的流程5 3 5 4 系统引导方式的设计5 4 5 5 算法的调试5 7 5 6 实时系统在设计过程中的关键技术及解决方案5 9 5 7 本章小结6 0 6 总结与展望6 1 致谢6 2 攻读学位期间发表的学术论文目录6 6 原创性声明及关于学位论文使用授权的声明6 7 附勇乏6 8 附录a :临界带宽表6 8 附录b :数的定标方法表6 9 数字助听器中语音增强算法研究及d s p 实现 1 绪论 1 1 课题研究的背景及意义 1 课题研究的目的 随着社会的不断老龄化以及人们对耳聋问题的日益关注,人们逐渐认识到助听器发 展的重要性。据世界卫生组织估算,全世界有轻度听力损失者近6 亿,中度以上的听力 损失者约2 5 亿t 】。我国又是世界上听力障碍人数最多的国家,据2 0 0 6 年第二次全国残 疾人抽样调查显示,全国已有2 7 8 0 力不同程度的听力损失者。听力障碍预防与康复工作 面临严峻形势,听力康复工程成为研究的重点。 听力康复工作迫在眉睫,但就目前的医学水平,除突发性耳聋等少数情况外,对于 听力损失目前尚无良好的治疗手段可以康复,特别是感音神经性听力损失的患者。研究 表明【2 】,对于这样的患者佩戴助听器成为其最佳选择。 目前助听器市场中国内和国外的品牌都有,但国内厂家的助听器产品与国际先进水 平相比,在技术上存在着较大的差距,特别是在信号处理技术方面。国外助听器厂家已 生产出全数字型助听器,采用一系列数字信号处理技术来解决助听器的声音补偿、消除 声反馈等问题,而国内的产品虽然也也用到了数字式设计,但成熟度远不及国外产品。 这些情况带来的直接结果就是国外的助听器产品几乎垄断了国内市场。因此,国内厂家 亟需继续投入人力、物力开发新型的国产助听器,特别是数字助听器。 助听器的研究内容比较广泛,包括硬件和软件部分。硬件部分主要研究的内容有: 麦克风、电源、耳机以及最重要的硬件平台d s p 等。软件部分主要涉及算法的设计,包 括语音增强、移频技术、频响补偿、声反馈抑制等等。本文的目的是对语音增强算法进 行了一定的研究。在研究比较前人研究的许多算法的基础上,提出了一种基于掩蔽效应 的改进型维纳滤波算法。 助听器语音增强算法的设计目的还是要应用于实际。文章对d s p 的硬件系统进行了 设计,并试图把设计的新算法进行硬件测试。 2 课题研究的意义 耳聋不能得到缓解将会对人们的生活产生严重的影响。不论是儿童、成人还是老人, 耳聋不但影响着患者的交流能力,而且对其心理也产生不容忽视的影响。如果助听器能 使用地及时、得当,几乎可以使一半到三分之二的患者摆脱聋哑状态。随着助听器性能 的提高,康复的比例也逐步提高。 从助听器中的算法来说,语音增强技术对助听器的设计有着重要的意义。噪声严重 影响到听觉的舒适程度和言语的理解度 2 1 。语音增强的目的是去除环境中的干扰信号, 提高语音的听觉质量,从而减轻听者的疲劳度。除此之外,语音增强技术也用来提高语 陕西科技大学硕士学位论文 音处理系统前端预处理的抗噪声能力和输入信号的信噪比,增加后续系统对噪声的鲁棒 性。如果信号不能很好的从噪声中提取出来,就会使系统其他后续算法的效果大打折扣, 甚至无法进行。 1 2 国内外研究动态和水平 十八世纪以来,人们就开始对助听设备进行研究,到目前为止,助听器的发展大致 经历了三个阶段:模拟式助听器,可编程式助听器,数字式助听器。 传统的模拟助听器只是简单的对声音进行放大,提高声音的强度。其特点是没有考 虑到听力损失的频率分布,同时放大所有频率的声音,这对各频率听力下降水平一致的 听力患者效果较好。但对于更多听力随频率的分布变化比较大的患者来说,对听力较好 的频段进行声音的放大甚至会出现坏的影响。除此之外,模拟助听器也没有考虑到信噪 比的提高,有时甚至会降低信噪比。 9 0 年代末期出现了可编程的助听器,它考虑到了声音随频率分布不一致的情况,是 在模拟助听器的基础上,将助听器分成2 3 个频率段分别进行声音调节,这在一定程度 上解决了部分患者听力问题。但由于其划分频段比较粗略,而语音信号频带又比较宽, ( 2 0 h z 到2 0 k h z ) ,这样划分致使效果很难令人满意,而且不具有灵活性。 数字助听器的出现,对助听器的发展产生了革命性的影响,使其可控性大大提高, 他不但可以根据多频段进行调试,而且可以灵活划分频段。它使用数字电路并通过算法 进行设计,完全摆脱了模拟助听器对固定模拟电路的依赖,而且其算法还可以更新。另 外,随着器件制造业的发展,数字助听器的体积也越来越小,更适合患者的佩戴。 目前数字助听器主要研究重点主要是在各算法上,解决的问题主要包括降噪技术、 声反馈( 啸叫) 控制技术、频响补偿【3 】、压缩与变换【4 】、自动增益控制,方向性麦克风技 术( 方向性的出现是为了提高在噪声环境下的言语可懂度) 【5 1 以及电磁兼容( e m c ) 技 术【6 1 等等。 处理听障者频率听力不一致中,使用压缩算法。目前有许多种压缩方法,宽动态压 缩算法1 7 ,线性分段压缩( c o m p r e s s i o nl i m i t i n g ) ,t i l l ( t r e b l e i n c r e a s ea tl o w l e v e l s ) ,b i l l ( b a s si n c r e a s ea tl o wl e v e l s ) 等【4 】【8 】。 处理噪声方面,助听器主要处理的噪声包括:周期性噪声、脉冲噪声、宽带噪声、 竞争语音、回声等【9 】。只用一种方法就将它们很好的消除是不现实的t ,0 】,因此设计去噪算 法时都有其针对性。具体算法如:谱减法及其改进形式,维纳滤波法、梳状滤波器法, 小波分析法,卡尔曼和隐马尔科夫模型( h m m ) 铮t o 】。 同时,自适应波束形成技术可以和麦克风阵列技术也被用于进行语音方向性,声源 定位跟踪等研究,方法如延时估计等【s 】。 目前,助听器的发展也有了新技术,包括自然方向性技术、智能优化系统以及w a r p 2 数字助听器中语音增强算法研究及d s p 实现 技术、净噪技术、蓝牙耳机和充电器【i 以及3 d 声景技术【佗1 等。 另外,多重声景处理模式的使用,可以实现在不同聆听环境中进行不同的聆听程序 的转换。目前,瑞士峰力助听器公司又研制出助听器自动程序切换技术,它是一种动态 声景自适应技术,他不是简单的在声学4 大环境类别( 安静环境、噪声言语混合环境、 噪音环境和音乐环境) 中选择一种,而是在基于各声景程序的和谐配合的基础上,针对 聆听环境定制出精湛的综合声景程序b 3 。 当然,在助听器取得巨大进步的同时也有许多问题和难点有待解决。 d s p 平台改善了声反馈抑制和方向性性能,但在噪声控制方面,助听器厂家只能采 用已有的算法,因为我们虽然有了d s p 平台但并不意味着我们可以解决噪声问题。许多 实力雄厚的厂家都试图找到一个从言语信号中移除噪声的方法,如低频增益衰减、多通 道、宽动态范围压缩技术( w i d e d y n a m i c r a n g ec o m p r e s s i o n ,w d r c ) 等,效果一直很不 理想【1 4 】。 电磁兼容方面【6 】,移动电话等数字设备的快速发展对助听器的辐射抗扰度能力提出 了新的要求,目前大部分的产品是在开发完的检测阶段或者投入使用之后才发现其中的 电磁兼容问题。如果能在设计阶段就对其电磁兼容问题有所考虑,并采取一定的措施, 例如屏蔽等,使问题能提早解决。在实际解决问题时可能采取一种或者多种方法,只有 多方面的考虑才能够达到良好的效果。 , 听力测试仪器目前都是比较大而昂贵的,这为大家对自己听力的检测受到限制,以 至于很多人即使有听力损失也不知道,导致感音细胞在长期没有收到刺激的情况下听力 进一步下降。曾有人做过小型便携式的听度计r - 5 1 ,达到了一定的效果,但离广泛应用还 有很大差距。 数字助听器本身测试方面、电池方面、传声器、放音器方面 4 1 还都需要进一步加强。 1 3 本文的主要研究内容及章节安排 本文的重点是对语音增强算法进行了一定的研究。主要研究了基于掩蔽效应的改进 型维纳滤波器的语音增强算法以及改进谱减法的d s p 的实现。整体思路是,从基本的语 音信号、噪声信号以及听力损失患者的特征出发,结合各种语音增强方法的优缺点选择 单通道语音增强算法作为助听器的语音增强方法。在讲解谱减法、改进型谱减法以及维 纳滤波法等单通道方法的基础上引出了本文的主要算法:基于掩蔽效应的改进型维纳滤 波器的语音增强算法,并对其进行了仿真研究。最后讲解了语音处理系统的硬件实现方 法,并对d s p 系统的硬件进行了设计。由于各种因素,本文未对提出的新算法进行硬件 测试,而在硬件上只进行了改进型谱减法的测试。 论文的具体内容安排如下: 第二章:对一些基本概念进行了介绍,包括语音信号的特征,噪声信号的特征,听 陕西科技大学硕士学位论文 力损失患者的特征以及常见助听器算法的介绍和语音增强算法的概述。 第三章:本文的重点。对谱减法、改进型谱减法等单通道语音增强方法进行讲解, 随后重点讲了基于掩蔽效应的改进型维纳滤波法。 第四章:对d s p 硬件进行了设计。包括系统前端放大及抗混叠电路、存储器扩展、 电源电路、时钟电路、a d 5 0 连接电路以及j t a g 仿真电路的设计。 第五章:d s p 系统的软件设计。包括总体系统的数据处理、系统的初始化、中断的 处理以及滤波程序设计等。 第六章:对全文进行了总结并对进二步的发展做出了设想。 4 数字助听器中语音增强算法研究及d s p 实现 2 基本概念 2 1 语音和噪声的特征 2 1 1 语音信号的特征 1 声波的定义 物质的振动可以引起声音的产生,并向四周立体扩散传输,而这种振动最终传递到 人耳,为人耳所感知,就成了可以听到的声音。需要注意的是,声波在媒质中的传播, 只是媒质振动状态的传播,媒质本身并没有向前运动,它只是在其平衡位置附近来回地 振动,所传播出去的是物质的运动形态,这种运动形式叫波动。声音是机械振动状态的 传播,这种传播过程是一种机械性质的波动,故而称为声波。 可以感受到的声音频率范围是2 0 h z 到2 0 k h z t 撕j 。一般的声音都是由发音体发出的一 系列频率、振幅各不相同的振动复合而成的,这些振动中有一个频率最低的振动,由它 发出的音就是基音,其余为泛音。声带每开启和闭合一次的时间就是基音周期( p i t c h p e r i o d ) ,她的倒数称为基音频率( p i t c hf r e q u e n c y ) 。一般基音频率越高,声带被拉得 越紧、越长、越薄。基音频率范围约为8 0 h z 到5 0 0 h z ,其范围也跟人的年龄、性别等 而定。老年人、男性偏低,年轻人、女性偏高。 2 声波的物理描述 声波具有两个特点:频率和振幅。频率高,声调就高,振幅越大,响度越大,但频 率和振幅之间没有必然联系。 除了频率和振幅,声音还可以分为复合音( c o m p l e x ) 和纯音( p u r et o n e ) 。纯音是 只有基音没有倍音的声音,而所谓倍音是指该语音频率是基音频率的整数倍。在很长一 段时间里,人们只知道声音之间是有区别的,却不知道为什么不同。法国物理学家傅里 叶发现了各个声音之间的区别在于和弦( c h o r d ) 的不同,也就是每个声音突出的倍音是 不同的。这种被突出的倍音在各种乐器和人的发音中呈现出较为明显的起伏的峰值变化, 在声音信号的频谱中一般有3 到4 个明显的峰值,其幅值随着频率的升高越来越小。这 样的峰值是由声道共振所引起的,我们称其为共振峰。之所以能够听出各种乐器发出的 声音不同,究其根本,就是和弦或者共振峰的不同。和弦是由一个声音的基音和倍音共 同组成。其中频率最低的和弦是第一和弦,其余依此类推为第二和弦,第三和弦等。 声音又可以分为清音和浊音,浊音在频域中具有共振峰结构,且呈现出一定的周期 性,声音的大部分能量集中在低频段的浊音中,所以浊音决定着声音的响度;而清音则 处于高频段,不具有周期性,而且呈现出类似白噪声的特性,再加上其能量很小,清音 很难从噪声中区分出来,但清音对声音的清晰度却起着决定性因素,所以在去除噪声的 语音增强算法中,会或多或少的伤及清音能量,影响着声音的清晰度,这个问题对我们 陕西科技大学硕士学位论文 的语音增强算法确实是一个巨大的挑战。 3 语音的短时平稳性 由于在发音过程中声道处于运动状态,所以,语音是一种非平稳信号,但声道的运 动状态同振动相比要缓慢得多,故在短时间内( 一般认为是1 0 - - 3 0 m s ) 他却可以近似的 认为是平稳信号,即语音具有短时平稳性。这种平稳的假设是符合实际的,同时也为算 法设计提供了重要依据,很多语音处理算法都是基于这一假设为前提而设计的。 2 1 2 噪声的特性 噪声是干扰信息承载信号的通信、测量、接收和处理的任何有害信号。噪声几乎存 在于任何环境中,语音环境当然不例外。 根据噪声和语音信号之间的相互作用,噪声可以分为两种【l : 1 ) 加性噪声:通常是直接叠加在语音信号上的,通常假设噪声和信号是不相关的。 这一假设是符合实际的。我们后面的语音增强中的算法,基本都是基于噪声的这 一假设的。 2 ) 卷积噪声:卷积性噪声是由于语音信号受到线性系统的污染而产生的,最常见的 卷积性噪声是由麦克风引起的。在时域里,麦克风的传递函数和语音信号的传递 函数相卷积,而在频域中,这两者的功率谱是相乘的,所以有时卷积性噪声也叫 乘性噪声。 根据噪声的来源,噪声可以分为六种: 1 ) 声音噪声:由振动或者碰撞所发出的,是日常生活中最为广泛的一种噪声。 2 ) 热噪声:也称为j o h n s o n 噪声( 以其发现者j b j o h n s o n 的名字命名) ,它是由 电导体中热激发粒子的随机运动所产生的。这种热噪声是导体本身固有的,不能 通过接地或者屏蔽来消除。 3 ) 静电噪声:由电压产生,与电流无关,荧光就是最为常见的一种静电噪声。 4 ) 处理噪声:由信号的数模处理一起的噪声,如量化噪声。 5 ) 散粒噪声:它是由导体内电流的波动形成的,并且噪声强度随着导体的平均电流 变大而增加。 6 ) 电磁噪声:一般也称其为电磁干扰,只要有电磁波的地方都会产生电磁噪声,包 括自然界的太阳光在某种情况下也是一种噪声。电磁噪声的来源有两种:静电和 磁场。这两种产生源所发出的噪声具有不同的特性,需要不同的噪声屏蔽方法才 能降低其影响。不幸的是,大多数前面所讲的噪声产生的同时都会产生电磁噪声, 这就使得噪声的消除变得非常复杂。 根据频域或时域特性,噪声可以分为三种: 1 ) 白噪声:定义为在所有频率上具有相等功率的不相关随机噪声,如图2 1 所示。 6 数字助听器中语音增强算法研究及d s p 实现 白噪声在o o 频率范围内功率相等,其功率必然为无穷大,所以这只是一个理论 上的概念,实际中一般使用的其实是有限带宽的白噪声。 图2 - 1 高斯白噪声 f i g 2 - 1g a u s sw h i t en o i s e 2 ) 有色噪声:它指的是任意一个具有非白色频谱的宽带噪声。大多数的音频噪声主 要就属于这一类,如汽车噪声、周围人们走路的噪声等。 3 ) 脉冲噪声:脉冲噪声包括由多种信源,如通信系统中的开关噪声、电磁接口以及 敲击电脑键盘的短时“通断”噪声脉冲。 每种噪声的噪声源和特点都是不一样的,要消除噪声就必须针对特定的噪声选择特冀j 定的去噪方法,没有一种可以消除任意噪声的通用方法c 墙,。本文研究的语音增强中所要 降低的噪声主要是指白噪声类,因为这种噪声最为常见,影响也非常大。 2 1 3 语音信号的感知( 听觉) 特性 因为语音增强效果的最终度量是人的主观感受,所以语音增强过程除了考虑到信号 客观质量的改善之外还要考虑到人的主观感受。这种在主观听觉中表现出来的语音信号。 的特性就称作感知特性,它涉及到心理学、生理学、语音学和声学等很多领域。语音的 感知特性一般包括以下几种 1 9 1 1 ) 人耳对语音的感知是通过语音信号中各频谱分量的幅度获取的,对各分量的相位 则不敏感。 2 ) 人耳对频率高低的感受近似地与该频率的对数值成正比。 3 ) 人耳有掩蔽效应,即强信号对弱信号有掩盖的抑制作用。掩蔽的程度是声音强度 与频率的二元函数。人耳对频率临近分量的掩蔽要比频差大的分量有效得多。 4 ) 短时谱中的共振峰对语音的感知十分重要,特别是第二共振峰比第一共振峰更为 重要,因此对语音信号进行一定程度的高通滤波不会对可懂度造成影响。 5 ) 人耳在两人以上的讲话环境中有能力分辨出需要聆听的声音,人类这种分离语音 的能力称为“鸡尾酒会效应 。 因为后面我们的设计是和掩蔽效应是有关系的,所以,这里我们重点介绍一下掩蔽 效应的概念。 2 2 掩蔽效应及b a r k 阈 7 陕西科技大学硕十学位论文 当考虑到人对声音的主观反应时,声音的“掩蔽效应”需要特别重视。所谓掩蔽效应 2 0 l ,指的是由于一个声音的存在( 掩蔽音,m a s k i n gt o n e ) ,使得另一个声音( 被掩蔽音, m a s k e dt o n e ) 的听阈抬高的现象。 掩蔽分成时域掩蔽和频域掩蔽两种。时域掩蔽指的是在时间上相邻的声音之间出现 的掩蔽现象,又分为超前掩蔽( p r e m a s k i n g ) 和滞后掩蔽( p o s t m a s k i n g ) 两种。产生时 域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。一般来说,超前掩蔽很短, 只有大约5 一- - 2 0m s ,而滞后掩蔽可以持续5 0 - - 2 0 0m s 。 图2 - 2 掩蔽效应的时域图 f i g 2 - 2t i m ed o m m n o fm a s k i n ge f f e c t 频域掩蔽是指时间上同时出现的两种不同频率的声音之间的掩蔽现象,也称同时掩 蔽( s i m u l t a n e o u sm a s k i n g ) 。一般来说,能量小的纯音离能量大的纯音越近就越容易被 掩蔽。 确定一个声音的频率能够产生同时掩蔽另外一个声音的频率范围称为临界频带 ( c r i t i c a lb a n d ) 。具体地说就是,一个纯音可以被以它为中心频率,且具有一定带宽的 连续噪声所掩蔽,如果在这一频带内噪声功率等于该纯音的功率,这时该纯音处于刚好 能被听到的临界状态,即称这一带宽为临界带宽。 临界带宽有许多近似表示,一般在低于5 0 0 h z 的频带内,临界带宽约为1 0 0 h z ,而 在高于5 0 0 h z 时,临界带宽约为中心频率的2 0 ,最高可达到4 k h z 。临界频带的位置 不是固定不变的,以任何频率为中心都有一个临界频带。连续的临界频带序号即为临界 频带域,为了纪念b a r k h a u s e u 提出的这个概念,我们常称为这个域为b a r k 域。通常将 声音信号的频率区间2 0 h z - - 1 6 k h z 之间的频率用2 4 个b a r k 域来划分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年教育行业数字化教材开发与智能应用深度研究报告
- 节能基础知识培训总结课件
- 教师招聘之《幼儿教师招聘》考前冲刺测试卷讲解及参考答案详解(典型题)
- 2025年教师招聘之《幼儿教师招聘》真题及答案详解【基础+提升】
- 演出经纪人之《演出经纪实务》过关检测试卷及完整答案详解
- 基于2025年电商平台的本地生活服务行业政策影响报告
- 2025内蒙古呼伦贝尔农垦集团有限公司社会招聘笔试模拟及完整答案详解
- 押题宝典教师招聘之《小学教师招聘》考试题库附参考答案详解(轻巧夺冠)
- 教师招聘之《小学教师招聘》通关考试题库及完整答案详解(网校专用)
- 教师招聘之《小学教师招聘》考前冲刺测试卷附有答案详解(考点精练)附答案详解
- 年会基础知识培训内容课件
- 撕脱伤皮肤护理查房
- 地球的外衣大气层课件
- 呼吸性碱中毒急诊护理
- 2025年中学生法治素养竞赛题库及答案
- 新人教版五年级上册小学数学教学计划+教学进度表
- 名著章节课件-《水浒传》第5回《小霸王醉入销金帐 花和尚大闹桃花村》情节梳理+人物形象+巩固试题
- 海口寰岛小升初数学试卷
- 村级妇联半年工作总结
- 托育园一日常规流程规范
- 收费员考试题库及答案
评论
0/150
提交评论