版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1二、语音增强的意义 1. 日常生活中,经常会遇到在噪声干扰下进行语音通信的问题。例如在汽车、火车上使用移动电话,旁人的喧闹声,马路旁和市场里的公用电话等。 2. 军事通信中,指挥员的作战命令和战斗员的战情汇报都需要用语音来表达,由于战斗环境中的声环境恶劣,特别是炸弹产生的冲击性噪声,使有用信号完全淹没在噪声中。8.1 概述第1页/共34页2(3)窃听技术中需要语音增强(4)语音识别技术需要语音增强 在实际生活中,语音信号无时无地不受各种噪声干扰。人们正常的生活环境就是一个声级为60dB左右的噪声环境。被强噪声污染的场合,噪声达120dB以上。第2页/共34页3一、噪声的分类和度量 1.噪声的
2、定义:噪声是扣除被测信号真实值后的各种测量值,可能来自外界环境、物理系统、操作人员等。广义将噪声称为干扰。8.2 噪声度量、特性和评价第3页/共34页4 按产生原因和按噪声性质分类。(1)产生原因:产生于物理系统外部,并以声、光、电、机械等方式作用于物理系统,称为外部噪声;物理系统内部产生的噪声称为内部噪声,例如量子噪声等。2.噪声的分类第4页/共34页5(2)按性质分为:脉冲噪声(爆炸、撞击和放电)和连续噪声;周期性周期(如交流电的干扰)和非周期性噪声;按统计特性分为:平稳噪声(如白噪声)和非平稳噪声(如色噪声);按噪声和信号相关的性质分为加性噪声和乘性噪声。 我们研究的噪声是声音的一种,它
3、具有声波的一切特性,称之为声噪声。第5页/共34页63.噪声的度量 声压、声强和声功率(1)声压级(SPL):Lp=20lg(P/P0) P020uPa声压就是有声波存在时,在单位面积上大气压的变化部分 ,最弱的声音声压为0.00002 Pa,最强的声音的声压为20 Pa。(2)声强级:LI=20lg(I/I0) I0=1012W/m2声强是指单位面积上通过多少瓦的声能,单位是W/m2(瓦/平方米)。 (3)声功率级:Lw=20lg(W/W0) W0=1012W 声功率是指声源在单位时间内向外辐射出的总声能第6页/共34页7噪声源和噪声环境噪声源和噪声环境 声压声压/Pa/Pa 声压级声压级/
4、dB/dB飞机附近飞机附近200200140140织布车间织布车间2020100100地铁地铁0.630.639090繁华街道繁华街道0.0630.0637070普通谈话普通谈话0.020.026060安静房间安静房间0.0020.0024040耳语耳语0.000630.000633030树叶沙沙声树叶沙沙声0.00020.00022020农村静夜农村静夜0.0000630.0000631010听阈听阈0.000020.000020 0第7页/共34页8 声压和声压级表征声音在物理上的强弱,它是对噪声的客观评价,不能表征人对声音的主观感觉。响应级和响度是人耳对噪声的主观评价的基本量之一。响度的
5、单位为宋(Sone)响度级的单位为方(phon),在数值上等于1kHz纯音的声强级。噪声度量的另一个参数就是信噪比。其中Ps和Pn分别代表信号和噪声的有效功率 目前MP3播放器的信噪比有60dB、65dB、85dB、90dB、95dB等等,而在汽车中SNR只有几dBNSPPSNR/log10第8页/共34页9二、噪声的特性 从统计特性的角度讲:平稳噪声和非平稳噪声。白噪声是平稳噪声中的一种,其频谱和功率谱为常数,其概率密度分布满足正态分布。我们关注的噪声有:1.冲激噪声:放电、打火、爆炸等引起的噪声。它的消除方法可以在时域进行,通过阈值判别的方法滤除。2.周期性噪声:常见的由电动机、风扇之类周
6、期运转的机械发出,50Hz交流电源哼哼声等。在频谱上表现为离散的窄带谱,可以通过陷波器方法滤除。第9页/共34页10二、噪声的特性3.宽带噪声:说话时呼吸引起的噪声、随机噪声源产生的噪声等。特点是噪声频谱遍布于语音信号频谱之中消除较为困难,一般需采用非线性处理方法。4.语音干扰:干扰语音信号和待传语音信号同时在一个信道中传输造成的。一般两种语音的基因不同,也不成整数倍,则可以利用梳状滤波器提取基音及各次谐波,再回复有用语音信号。5.传输噪声:传输系统的电路噪声,她在时域里是语音和噪声的卷积,处理时采用同态处理的方法,把非加性噪声变换为加性噪声处理。第10页/共34页11一、频域语音增强技术 频
7、域语音增强技术是语音信号增强的一种重要技术,由于其原理简单所以被广泛使用,如手机中的降噪处理就是采用的此方法,美国NCT的Clear Speech产品中,就是应用的这技术。减谱法是频域语音增强技术的常用方法。 减谱法: 减谱法是处理宽带噪声较为传统和有效的方法,基本思想是假定加性噪声与短时平稳的语音信号相互独立的条件下,从带噪语音的功率谱中减去噪声功率谱,从而得到较为纯净的语音频谱。8.3 语音增强的原理和方法 第11页/共34页12 1.减谱法(Spectral Subtraction)的基本原理描述 DFT平方DFT插入相位IDFT含噪语音x(n)=s(n)+d(n)|X(ejw)|d(n
8、)|D(ejw)|纯噪声|S(ejw)|ejarg(X(jw)s(n)原始语音谱幅度的估值2第12页/共34页13 将含噪语音信号和有声/无声判别得到的纯噪声信号进行DFT变化,从含噪语音谱幅度的平方中减去纯噪声的谱幅度的平方,然后开方,得原始语音谱幅度的估值,再借用含噪语音的相位,进行IDFT变化,得到增强的语音。8.3 语音增强的原理和方法 1.减谱法(Spectral Subtraction)的基本原理描述 第13页/共34页14 2.减谱法的数学推导 首先假设语音和噪声信号是线性叠加的,且噪声是平稳的,噪声与语音信号不相关。 上式的傅里叶变换为: 简写为: 假设语音信号与加性噪声是相互
9、独立的,则有:8.3 语音增强的原理和方法 222)()()(DSY)()()(jjjeDeSeY)()()(DSY)()()(nDnSnY第14页/共34页158.3 语音增强的原理和方法 2.减谱法的数学推导 其功率谱:)()()(nsyPPP)(nP)()()(nysPPP)()(, 0)()(),()()(nynynysPPPPPPP由于平稳噪声的功率谱在发声前和发声期间可以认为基本没有变化,则可以通过发声前的所谓“静寂段”来估计噪声的功率谱222)()()(DSY在具体运算中,为防止出现负功率谱的情况,完整的减谱法为:第15页/共34页16 3.减谱法的特点(1)原理简单,只需要一个
10、话筒,故又称为单话筒语音降噪。话音噪声减谱法处理输出话筒第16页/共34页17(2) 需要无声和有声判决,在信噪比大的情况下,使用短时平均能量等参数可达到效果。(3)由于该方法存在的前提条件要求噪声平稳,因此当噪声特性变化时,消噪效果可能会变差,这时需要重新拾取噪声特性。 3.减谱法的特点第17页/共34页18 (4)由于噪声的随机分布的范围广,因此相减时,若该帧某频率点上的噪声谱幅度分量大时,就会有很大一部分残留,在频谱上呈现随机起伏的尖峰。在听觉上形成有节奏的类似音乐的残留噪声,又称为背景音乐噪声。背景音乐噪声损伤了语音的质量,降低了可懂度和清晰度,是该类方法最大的缺点。所以实际电路中一般
11、采用其改进形式进行语音增强处理。 3.减谱法的特点第18页/共34页19蓝色为原始含噪语音黄色为减谱法处理的结果第19页/共34页20 4.减谱法的改进形式DFT平方DFT插入相位IDFT含噪语音x(n)=s(n)+d(n)|X(ejw)|d(n)|D(ejw)|纯噪声|S(ejw)|ejarg(X(jw)s(n)原始语音谱幅度的估值1在辅音帧中取3,在元音帧中取4-5 ,信噪比可改善6dB左右第20页/共34页21二、时域语音增强技术 时域语音增强技术语音增强中另一常用技术,其特点是对语音的损伤小。在消噪过程中,一般需要二个以上话筒,采用自适应滤波算法。故常常将时域语音增强技术称为自适应语音
12、降噪技术(Adaptive noise canceling ANC)。 噪声的统计特性跟现场密切相关,即使同一场合的噪声统计特性也可能会随时间发生某种变化,这都要求消噪设备必须具有噪声跟踪的自适应能力。将自适应信号处理技术应用于语音通信的噪声对消.第21页/共34页22 主话筒和参考话筒获得的信号是语音和噪声在话筒处迭加后的混合信号。话音噪声+自适应滤波器主话筒 + 输出参考话筒-二、时域语音增强技术第22页/共34页23 主信号s+n0,为有用信号s(来自信号源)和一个与它不相关的噪声信号的混合而成。 n1为另外拾取的噪声参考信号,与n0相关。主输入信号x=s+n0 + 输出s参考输入n1自
13、适应滤波器+n- 1. 自适应消噪的基本原理描述 第23页/共34页24 将参考信号n1通过自适应滤波器后,得到信号n(n),此信号与n0(n)基本一致。 x(n)-n(n)=s(n)+n0(n)-n(n)=s(n)+e(n)=s(n) s(n)中仍然包含部分噪声(e(n),要使这部分噪声小,达到完全消除噪声的目的(e(n)=0),则n(n) 尽可能与n0(n)一致。 常常引入s(n)调节滤波器的参数,形成自适应地修改滤波器的参数,使e(n)的均方误差最小。 1. 自适应消噪的基本原理描述 第24页/共34页252. 自适应消噪的实现框图模拟放大两路A/D输出抗混叠滤波DSP一路D/A输入 在
14、DSP中实现核心LMS(最小均方)算法。采样率为8kHz,利用DSP串行口或定时器中断,每隔125us中断一次,读入两路数据,将参考数据按照先入先出的顺序排列,进行滤波,用主通道信号减去滤波后的数据,得到增强后的信号,将此信号输出,修改滤波器权系数。第25页/共34页26020004000600080001000012000-0.8-0.6-0.4-0.200.20.40.60.8抗交叉串扰自适应滤波消噪输出结果020004000600080001000012000-0.8-0.6-0.4-0.200.20.40.60.8主输入信号(收音机失谐纯噪声)第26页/共34页273. 影响自适应消噪
15、效果的因素 (1)参考信号中含有语音成分,则通过滤波后,n(n)信号中含有有用信号成分,经过相减后,将主通道信号减去一部分,损伤了有用信息。话音噪声+自适应滤波器主话筒 + 输出参考话筒-第27页/共34页28 可以证明,输出信号的信噪比和参考信号的输入信噪比有如下关系:参出nSnSPPPP1 可见,当参考通道的输入信噪比愈强,噪声抵消系统输出信噪比愈差,所以,为了获得好的噪声抵消系统性能,应使参考通道检测的信号尽可能小。第28页/共34页29 (2)主输入信号和参考输入信号中含有非相关的噪声成分m0和m1 。自适应滤波只能将两个输入中的噪声相关部分滤掉,则当信号不相关时,则无法消除。话音噪声+自适应滤波器主话筒 + 输出参考话筒-m0m1第29页/共34页3000.511.522.533.5x 104-1-0.8-0.6-0.4-0.200.20.40.60.81原始含噪语音00.511.522.533.5x 104-0.8-0.6-0.4-0.200.20.40.6基本自适应抗噪输出结果第30页/共34页31三、时频语音增强技术 为了达到更好的消噪效果,可将自适应消噪技术和谱相减结合起来。自适应消噪主输入信号参考信号谱相减消噪增强语音第31页/共3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论