




免费预览已结束,剩余20页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
河北大学2012届本科生毕业论文(设计)装订线 本科生毕业论文(设计)题目: 基于MATLAB的语音背景噪声消除 学 院 物理科学与技术学院 学科门类 理科 专 业 应用物理 学 号 XXXXXX 姓 名 XXX 指导教师 XXX 2012年 4月 18 日基于MATLAB的语音背景噪声消除摘 要语言是人类最重要、直接、有效和便捷的交换信息的方式。随着近些年科学技术的飞速发展,人们也不满足于和计算机的信息交换方式,希望能够甩掉键盘和鼠标而实现用语言来对计算机进行控制。因此,语音信号处理技术便应运而生。语音信号处理是一门新兴的学科,同时也是综合多种学科和涉及面非常广泛的交叉学科。现在在一些职能系统中嵌入有语音处理系统,但它们只能在安静的环境中才能使用。然而,在语音信息的采集过程中难免会有各种噪声的干扰。噪声不仅降低了语音的可懂度和语音质量,还严重的影响语音处理的准确性,甚至使系统不能正常工作。本文将就对语音增强技术的原理和方法进行讨论,重点介绍语音增强的一种方法谱减法及其改进算法。该方法能够有效消除平稳的加性噪声,其改进算法能够有效消除普通方法产生的“音乐噪声”,在很大程度上提高语音信号的信噪比。关键词:语音信号处理 语音增强 谱减法 改进算法AbstractLanguage is the most important, direct, effective and convenient means of information exchange. With the rapid development of science and technology in recent years, people are not satisfied with the way to exchange information with computer, hoping to get rid of the keyboard and the mouse and achieving the goal of using language to control the computer. Therefore, the language signal processing technology was produced. Language signal processing is an emerging discipline, but also is a cross discipline which multiplied disciplines and covered a very wide range. Now some language signal processing systems are embedded in the intelligent system, but they can only work in a quiet environment. However, in the speech information acquisition process will inevitably have a variety of noise interference. Noise can not only reduce speech intelligibility and voice quality, it also affect speech processing accuracy, and even make the system not working properly. In this paper we will discuses the principle and method of the speech enhancement technology. Mainly introduces a method for speech enhancement - spectral subtraction algorithm and its improved algorithm. The method can effectively eliminate the stationary additive noise, the improved algorithm can effectively eliminate which the common method produced “music noise”, obviously improves the speech signal to noise ratio.Keywords: Speech signal processing Speech enhancement spectral subtraction algorithm improved algorithm目 录一 绪论11.1 语音背景噪声消除的意义11.2 语音背景噪声消除的目的及要求11.3 比较常用的语音背景噪声消除的方法及特点2二 谱减法消除噪声的基本原理42.1 噪声的生成原理及分类42.2 基本谱减法消除噪声的原理52.3 改进谱减法消除噪声的原理62.4 比较两种方法处理的理论效果72.5 小结7三 实验设计及步骤83.1 语音信号的采集83.2 语音信号处理工具的选择83.3 程序读入语音信号83.4 语音信号处理9 3.4.1 含噪语音信号的合成9 3.4.2 用基本谱减法对含噪信号处理11 3.4.3 用改进谱减法对含噪信号处理133.5 比较两种方法处理的实验效果17四 总结18致谢19参考文献20一 绪论1.1 语音背景噪声消除的意义目前,语言识别技术已经取得了重大进展,并开始进入实用阶段。但语音识别系统必须在相对比较安静的环境下运行,然而,在语言信息的采集中难免会有各种噪声的干扰,在较强的噪声背景下,语音识别系统的准确性会受到较大影响,甚至没法正常工作。所以在语音识别系统对语音信息处理前,应该对语音信息进行预处理,即背景噪声消除。语音背景噪声消除技术的出现使得语音识别技术更加稳定和精确,也使得语音信息的可懂度大大提高,使人们能够从较复杂的语音信息中提取到更多的有用信息。1.2 语音背景噪声消除的目的及要求二十世纪中期以来,对语音可懂度的研究在电话系统飞速发展的时期就已经开始了1。Bell实验室在对电话系统中的音节清晰度进行了系统性的研究,研究表明,当信噪比(SNR)大于20-40dB时,噪音才不会对人的听觉造成有害的影响2。因此,语音背景噪声消除的目的就是从带有噪声的语音信息中提取出尽可能纯净的原始语音,提高语音的质量并提高听觉的舒适度。另外随着语音识别技术的诞生和应用,计算机向智能化迈进了一大步。为了提高语音识别系统的准确性,语音信息的除噪处理就显得更加重要。多年来经过人们不懈努力,发明了一系列语音背景噪声消除的方法,它们都是围绕着增强语音信息的清晰度和可懂度两方面进行处理的。1.3 比较常用的语音背景噪声消除的方法及特点经过几十年的研究和发展,许多语音增强方法被提出来,它们奠定了语音增强理论的基础并使之发展成熟。近些年,VLSI技术的发展和高速DPS芯片的出现使语音背景噪声消除的实时实现成为可能3。目前常用的语音增强算法一般可分为非基于语音生成模型参数和基于语音生成模型参数两大类。基于语音生成模型参数的方法特点就是对生成的语音模型的参数进行估计和修复。这类方法有一定的局限性,在信噪比比较低的情况下,我们很难对生成的模型参数进行估计,此类算法也往往因为需要迭代而增加算法的复杂度。非基于语音生成模型参数的方法中主要有自适应性噪声对消法和基于短时谱估计增强法等。目前,比较流行的语音增强算法主要有以下几种:1. 噪声对消法4噪声对消法是最基本的谱减算法,它的原理就是从带噪信息中直接减去噪声得到增强的语音信息。采用双声道(多声道)可以方便的得到噪声的准确复制,原理图如图1.1噪声自适应数字滤波器含噪语音FFTIFFT增强语音FFT图1.1 双声道采集系统噪声对消法原理采用双声道噪声对消法时,要保证两个声道相隔一定距离,防止两个声道同时收集到噪声信息。由于语音采集时两个声道距声源距离不同,两路信号会产生时间差,因此要对噪声声道信息进行滤波来模拟噪声。通常我们采用自适应滤波器来对其进行滤波。自适应滤波器的作用相当于回波抵消器。实验结果表明,在较强噪声背景下,噪声对消法能明显起到消除噪声的目的。但噪声对消法也有一定的缺陷,用该方法增强后的语音会残留一种叫“音乐噪声”的新噪声。所谓“音乐噪声”是频谱相减的残留产物,具有节奏性起伏,听起来像音乐。2. 基于小波分析的增强算法5小波分析是一种新兴的数学分析理论,在图像处理,语音处理以及其他非线性科学领域,它被认为是继Fourire分析之后又一重要有效的时频分析方法。小波分析法是基于小波分析理论而发展而来的一中新的语音增强算法,它对非平稳非加性噪声能有效的进行噪声消除,同时小波分析法也结合了谱减法的一些基本原理,是一种有非常广泛发展前途的一种语音增强方法。3. 基于语音谱特征的谐波增强算法6语音中分有清音和浊音的概念,其中浊音有明显的周期性,因此可以采用自适应梳状滤波器来提取语音分量,来抑制噪声。梳状滤波器在时域上实现的关键是要准确估计出基音的周期,使之于噪声周期性分量分离开来。基音周期的估计可以用语音信号处理中的各种估计算法实现。梳状滤波器在频域上的实现是先将语音信息进行傅里叶变换,提取出各次谐波的分量,然后进行逆傅里叶变换恢复成时域信号。用这种方法进行语音增强可以抑制各种噪声的干扰,但在强噪音背景下,很难准确地估计基音,在基音发生变化的过渡语音段里增强效果也会受到影响。4. 基于语音生成模型的增强算法将语音的发生过程建模为一个线性时变滤波器,对不同类型的语音采用不同的激励源。基于语音生成模型可以得到一系列语音增强算法,如卡尔曼滤波方法及时变参数维纳滤波。卡尔曼滤波能对有色噪声进行有效消除;维纳滤波则对背景噪声白化效果很好。该方法的运算量比较大,系统性能也有待于进一步提高。5. 基于听觉屏蔽的增强算法听觉屏蔽法是利用人的听觉特性的一种增强算法,如人耳能从许多说话者当中分辨出需要聆听的信号,这种效应叫做“鸡尾酒会效应”,相信随着生物科学的发展,人们对人耳特性的了解加深,用软件对其进行仿真,听觉屏蔽法将会有更深入的发展。6. 基于短时谱估计的增强算法现实中常用的许多方法如谱减法维纳滤波法、最小均方误差法等都属于基于短时谱估计的增强方法。这类方法具有适应信噪比范围大、方法简单、易于实现等优点,所以成为目前应用最为广泛的语音增强方法。综上所述,以上六种算法中,以短时谱估计法中的谱减法以及其改进方法拥有运算量小,容易实现且增强效果较好的特点而最为常用。小波分析法成为语音增强中一个新的研究热点。听觉屏蔽法师随着人们对人耳听觉系统的认识而发展起来的,目前还处于初级阶段。另外,一些新兴的理论也应用于语音增强中,如人工智能、隐马尔科夫模型、神经网络和粒子滤波器等,但都处于初级阶段,没有取得实质性的进展7。二 谱减法去除噪声的基本原理2.1 噪声的生成原理及分类噪声的来源取决于实际应用,不同情形下产生的噪声其特性也是千变万化,所以没有一种通用的语音增强算法能对每一种噪声起到有效的消除。下面我们来简单分析噪声的生成原理及分类情况。噪声可以分为两大类:加性噪声和非加性噪声,加性噪声一般是指热噪声、散弹噪声等,其特点是噪声信号与语音信号是加性的,噪声不随信号而改变,即使信号不存在噪声也会存在。非加性噪声如乘性噪声,他们与信号成乘性关系,信号存在噪声就存在,信号改变噪声也随之改变。一般通信中我们把加性随机性看成背景噪声,而乘性随机性则是由系统时变性和非线性造成的。这里我们仅介绍加性噪声,加性噪声一般分为一下几类:人为噪声,自然噪声和内部噪声。人为噪声是指信号之外人为的噪声,如外台信号、开关接触噪声、工业的点火辐射等;自然噪声则是由于自然界的各种电磁波源如闪电、大气中电暴和宇宙辐射等造成的噪声;内部噪声是信号采集时系统设备自身产生的各种噪声,如热噪声和散弹噪声等8。以上噪声中确定类型的噪声因为知道其产生机制,所以理论上是能够消除或者基本消除。但是有一类随机噪声因为不能预测其波形而比较难以消除,这种不能预测的噪声系统成为随机噪声。随机噪声可分为三类:(1)周期性噪声是由于发动机等机械、电气干扰特别是交流电等造成的周期性的干扰噪声。(2)脉冲噪声是突发的幅度高且持续时间短的离散脉冲。它的来源是由于爆炸、点击和撞击等,其特点就是脉冲幅度大,持续时间短,两个脉冲之间时间长等。这类噪声通常在时域情况下消除,根据信号的幅度平均值来确定信号幅度的闭值。当信号超过这一闭值时,系统则认为是脉冲噪声,再对脉冲噪声进行衰减。(3)宽带噪声的来源很多,热噪声、气流(如风、呼吸)噪声及各种随机噪声源,量化噪声也可视为宽带噪声。由于宽带噪声与语音信号在时域和频域上完全重叠,因而消除它最为困难。这种噪声只有在语音间歇期才单独存在。对于平稳的宽带噪声通常可以认为是白色高斯噪声。不具有白色频谱的噪声,可以先进行白化处理。对于非平稳的宽带噪声,情况就更为复杂一些。噪声破坏了语音信号原有的声学特征和模型参数,使语音质量下降,也使人产生听觉疲劳。不仅如此,强噪声环境还会对说话的人产生影响,使人改变在安静环境或者低噪声环境中的发音,从而改变了说话人的语音特征参数,这种效应被称为Lombard效应9,它对语音识别系统有很大影响。2.2 基本谱减法消除噪声的原理在诸多语音增强方法中,谱减法因其计算量小,容易实现和增强效果好等特点而备受关注,是诸多方法中比较有效的语音增强算法。谱相减方法是居于人的感觉特性,即语音信号的短时幅度比短时相位更容易对人的听觉系统产生影响,从而估计语音的短时幅度谱,比较适用于消除带加性噪声的语音10。谱减法在20世纪八十年代后用来与其它方法相结合来获得更为有效的语音增强算法。并且成为其它语音增强算法的比较标准。下面我们来详细了解谱减法的原理。在基本谱减法中,假定语音为平稳信号,且噪声为加性噪声,与语音信号彼此不相关。此时带噪语音信号可表示为: (1)式(1)中,y(t)为含噪语音信号,s(t)为纯净语音信号,n(t)为噪声信号。用Y(w),S(w)和N(w)来分别表示y(t),s(t)和n(t)的傅里叶变换,则有下列关系: (2)由公式(2)可得: (3)根据(3)可得: (4)由于基本假定是噪声信号与语音信号是加性的,s(t) 和n(t)独立,所以S(w)和N(w)也独立。故=0。所以对一个分析帧内得短时平稳过程,有: (5)因为噪声是局部平稳的,故可以认为没有语音信息是的噪声与有语音信息时的噪声功率谱是相同的,因而可以利用发语音前的“寂静帧”来估计噪声。由式(5)可以得到原始语音的估计值: (6)式(6)中,下标表示加窗信号,表示估值,则表示无语音信号时的均值。如果式(6)中结果出现负值,则将其改为0或改变符号,因为功率谱不能为负数。由式(6)可得原始语音估值: (7)根据人耳对语音的相位变化不敏感这一特点,我们可以用原带噪语音信号y(t)的相位来代替估计之后的语音信号的相位,将估计后的频域信号进行逆傅里叶变换得到降噪后的语音时域信号。基本谱减法的原理图如图2.1所示:图2.1 基本谱减法的原理示意图2.2 改进谱减法消除噪声的原理上一节中介绍的基本谱减法消除噪声的原理,是假设以无声期间统计的噪声方差来代替分析帧的噪声频谱的基础上的,而实际上噪声频谱是服从高斯分布的: (8)式(8)中,m为x的均值,为标准偏差。因此,在用基本谱减法消除噪声后,会有较大的剩余的功率谱分量,在频谱中呈现随机的尖峰,经逆傅立叶变换后的增强语音形成具有一定节奏性起伏的新噪声,这种噪声就是所谓的“音乐噪声”,而且这种噪声没办法再次经谱减法进行消除。为了尽可能减小“音乐噪声”对语音信息造成的二次污染,可以对普通的谱减法进行改进。含噪语音信息中语音能量一般集中于某些频率或频段,而噪声能量往往分布于整个频率范围。因此在幅度较高的时帧去除噪声是,减去(1),可以相对突出语音的功率谱。这种改进方法为被减项权值处理。11除此之外,还有改进方法为功率谱修正处理。其方法是将功率谱计算中的和改成和(2),效果和被减项权值处理相当。结合以上两种改进处理,谱减法增强形式可表示为: (9)当=2,=1时,公式(9)便成为基本的谱减法。我们知道为谱减功率修正系数,加大的值将会进一步提高信噪比;为谱减噪声系数,它的作用是对被减的噪声功率谱进行修正,增大的系数会起到减少噪声、更好突出语音频谱的作用。但是两者系数的增大也会加大语音信号的失真。实验表明,适当调节、对含噪语音处理能得到更好的增强效果12。由于基本的谱减法处理过的语音信号会产生“音乐噪声”,尽量减少“音乐噪声”的产生是改进型谱减法重点的解决对象。基本的谱减法在低信噪比情况下的增强效果是很明显的,且时域图形中噪声均匀分布于零坐标之上,包括“音乐噪声”和少量清音信号。对此我们要对语音信号在时域内做进一步处理,以提高信噪比,消除“音乐噪声”。在改进谱减法中,我们可以取出语音信号样值,减去被减值,如果出现负值,的将信号样值赋为0;如果所得值为正数,则信号样值=信号样值-被减幅值,这种在中心线上限值幅度叫中心限幅。实验证明这种方法可以抑制“音乐噪声”,同时,被减幅值不能过大,否则噪声被滤除的同时,大量清音也被滤除,这会影响语音的可懂度。2.4 比较两种方法去除噪声的理论效果从以上两节中我们可以了解到,基本谱减法能在低信噪比情况下有较好的增强效果,但是也会产生令人烦躁的“音乐噪声”,改进的谱减法在基本谱减法的基础上调节谱减功率系数和谱减噪声系数,使得在消除噪声的同时,有效的抑制了“音乐噪声”的产生。改进的谱减法更好地消除了噪声,提高了语音质量。2.5 小结本章重点介绍了常用的基本谱减法消除噪声和它的改进算法。虽然谱减法理论提出的比较早,但由于其计算简单、容易实现和增强效果较好等优点,直到现在也是一个非常有生命力的研究领域,一直以来是人们关注的热点。相信在人们的不断努力下,谱减法会出现更多的新的改进形式,语音增强的效果也会更加明显,为实现真正的人机对话创造条件。三 实验设计及步骤3.1 语音信号的采集在进行语音增强实验之前,我们要采集一段语音信号。windows系统有自带的录音机功能,录音机程序就在windows开始菜单中的附件里。只要将麦克风与电脑连接,使用录音机功能就能录制一段语音信息。由于录音机本身也有简单的消除噪声的处理,我们采集到的语音信息在进行语音增强实验之前要人为地进行加噪处理。加噪处理将在本章第四节介绍。3.2 语音信号处理工具的选择本实验是基于MATLAB平台上进行的。MATLAB是矩阵实验室(Matrix Laboratory)的简称,是由美国MathWorks公司研发的一款商用数学软件。因其在数据分析和数值计算等方面的强大功能被广泛的应用于各个领域13。在语音信号处理方面,在编程效率、程序可读性和可扩充性方面MATLAB远远优于其他高级编程语言。虽然较其他的高级语言相比,MATLAB程序的执行速度较慢一些,在电脑处理速度越来越快的情况下,对实时性要求不高的语音信号处理使用MATLAB平台是再适合不过的了。3.3 程序读入语音信号在MATLAB环境中可以直接读取wav格式的语音文件。其表达公式为y,fs,bits=wavread(Blip,N1 N2);用于读取语音,采样值放在向量y中,fs表示采样频率(Hz),bits表示采样位数。N1 N2表示读取从N1点到N2点的值(若只有一个N的点则表示读取前N点的采样值)。在MATLAB中 sound(y);用于对声音的回放,而wavwrite(x,fs,12.wav);则能将向量x转换成语音文件12.wav保存起来。将之前用录音机采集到的一段语音以“11.wav”的文件名保存在MATLAB程序文件夹下的Work文件夹下。运行MATLAB,输入以下程序:x,fs,bits=wavread(11.wav);x1=x(1:end,1);%因录音时是立体声,故取其中的第一通道的音频数据 sound(x1,fs,bits); X1=fft(x1,4096);%对x1进行4096点傅里叶变换magX1=abs(X1);angX1=angle(X1);subplot(221);plot(x1);title(原始信号波形);subplot(222);plot(X1); title(原始信号频谱);subplot(223);plot(magX1);title(原始信号幅值);subplot(224);plot(angX1);title(原始信号相位);点击回车运行程序,MATLAB程序读入11.wav文件,并将其进行傅里叶变换后分别显示出这段语音信号的时域波形、频谱、幅值和相位,能够直观的体现语音信号的各种特征。并播放该语音信息。运行结果如图3.1所示:图3.1 原始语音波形、频谱、幅值及相位示意图3.4 语音信号处理3.4.1 含噪语音信号的合成上节中MATLAB读取的语音信号声音比较清晰,信噪比较高,用这样的信号实验对比效果不太明显。因为Windows自带的录音机有简单的去除噪声的功能,因此在进行消除噪声实验之前我们要人为的给原始信号添加随机白高斯噪声,降低语音信号的信噪比。具体步骤如下:运行MATLAB程序,在MATLAB操作界面的左上角点击新建一个m文件,m文件中编写下列程序:clc,clearx,fs,bits=wavread(11.wav);N=size(x,1);x1=x(1:N,1);%因录音时是立体声,故取其中的第一通道的音频数据 fn=1000; %设定噪声的频率为1000Hzt=1:length(x1); %设置噪声的长度跟原语音信一样长,x2=0.5*sin(2*pi*fn/fs*t);%产生幅度为0.5频率为fn的正弦波作为噪声.y=x1+x2; %将原语音信号跟噪声相加,x为带有噪声的语音信号.wavwrite(y,fs,12.wav);%将带有噪声的语音信号转换为声音,12.wav中将有噪声将m文件保存为“jiazao.m”并运行该文件,可以得到一个新的语音文件12.wav。打开12.wav和11.wav进行比较。图3.2 含噪语音波形、频谱、幅值及相位示意图3.4.2 用基本谱减法对含噪信号处理在上一章中,讲到了基本谱减法语音增强的原理,假设我们不知道含噪信号的噪声的时域波形、频谱、幅度和相位信息,而且噪声信号是平稳而且贯穿于整个语音信息。在含噪语音的前一小段中,没有语音信息,只有噪声信息,我们可以截取这一段,认为是纯噪声信息。将被截取的一段时域信息进行傅里叶变换便可以得到噪声的时域波形、频谱、幅度和相位等信息。在MATLAB中运行以下程序:clc,clearx,fs,bits=wavread(12.wav);%读取12.wav文件并返回fs和bits的值。y=x(1:4096,1);%截取语音信息前4096点作为噪声信号Y=fft(y);%对噪声信号进行傅里叶变换magY=abs(Y);%取噪声功率谱绝对值angY=angle(Y);%取噪声相位subplot(221);plot(y);title(噪声信号波形);subplot(222);plot(Y); title(噪声信号频谱);subplot(223);plot(magY);title(噪声信号幅值);subplot(224);plot(angY);title(噪声信号相位);程序运行结果如图3.3所示:图3.3 噪声信号示意图我们认为在整个语音信号中噪声是平稳的,且利用短时谱内人耳对语音信号相位信息不敏感的特性,我们可以在短时谱内对含噪语音信号分别进行傅里叶变换、求出信号幅值,再利用公式(7)对信号进行除噪处理,然后将相减后的幅值信息进行逆傅里叶变换,最后将每个增强后的语音连接起来,基本谱减法也就完成了。在MATLAB中具体程序如下:clc,clearx,fs,bits=wavread(12.wav);%程序读入12.wav音频文件,并将文件频率和位数分别返还fs值和bits值y=x(1:4096,1);%截取原语音信号的前4096点生成新的语音信号,因为在该段没有有用语音信息,所以认为是噪声信号Y=fft(y);magY=abs(Y);b=;for i=0:126;n=4096;x1=x(1+n*i:n+n*i);X1=fft(x1);magX=abs(X1);S=(magX.2-magY.2);S1=abs(S).0.5;s1=ifft(S1);a=s1;b=b a;endx2=b;plot(x2);sound(x2,fs,bits);wavwrite(x2,fs,13.wav);%将重新生成的增强后的语音信号以文件名13.wav保存在work文件夹下运行程序后,在work文件夹中新建了一个名为“13.wav”的语音文件,即经过语音增强后的语音。MATLAB并显示出增强后的时域波形及播放增强后的语音。从显示的增强语音的波形和播放的语音效果来看,都有一定的改善效果。增强后的语音信号时域波形如图3.4所示:图3.4 语音增强后的信号时域波形图从语音增强后的信号波形图与原信号波形图的对比中,我们看到波形得到了明显的改善,对比12.wav和13.wav也能发现后者噪声明显小于前者。但是,从图3.4我们可以看出,有一些周期性的突发信号贯穿整个语音信息中,它们的特点是持续时间段,幅度大。这就是基本谱减算法进行语音增强后产生的“音乐噪声”,用sound(x2,fs,bits);调取播放增强语音也能明显的听到周期性类似金属撞击一样的噪声。我们想要尽量减少这种“音乐噪声”对语音信号造成的二次污染,就必须对基本的谱减算法进行改进。3.4.3 用改进谱减算法对含噪信号处理在上一章中我们了解了改进谱减算法的基本原理和对基本谱减算法改进的地方,下面就在MATLAB中实验一下改进效果。在公式(9)中,提高的值将会进一步提高信噪比,同时增大的系数会起到减少噪声、更好突出语音频谱的作用。在处理“音乐噪声”方面,采取“半波整形,中心限幅”的方法对语音信号在时域内进一步处理,以进一步提高信噪比,消除音乐噪声。基于产生的“音乐噪声”是随即的幅值很高的信号,我们可以在基本谱减法程序的基础上,在每一个模块中设置一个阈值,当增强语音的幅度高过这一阈值时,将原信号强度衰减为原来的1/4,从而对“音乐噪声”进行限制。因为“音乐噪声”的幅值远远高于语音信号幅值,我们可以去短时信号的平均值*300作为阈值。这样,在基本谱减法程序的基础上,加入阈值和判断程序,程序如下:clc,clear;x,fs,bits=wavread(12.wav);y=x(1:4096,1);Y=fft(y);magY=abs(Y);b=;for i=0:126;n=4096;x1=x(1+n*i:n+n*i);X1=fft(x1);magX=abs(X1);S=(magX.2-magY.2);S1=abs(S).0.5;s1=ifft(S1);m=mean(s1)*300;for j=1:4096;if abs(s1(j)m;s1(j)=s1(j)/4;endenda=s1;b=b a;endx2=b;plot(x2);sound(x2,fs,bits);运行程序后,计算机显示被处理后的语音信号时域波形如图3.5所示:图3.5 进行中心限幅后语音时域波形示意图从图像上看,经过中心限幅后的语音波形得到了明显的改善;从听觉上,“音乐噪声”也有所减小,不过值得注意的是,这种方法在减小“音乐噪声”影响的同时,不可避免的消除了一些清音信息,使得语音信息的可懂度降低,这就要求在限幅阈值的取值上进行适当的选择,阈值过高,噪声衰减的效果非常低;阈值过低又会将语音信息一同衰减造成失真。结合上一章中改进谱减法将频谱处理中的平方和平方根修改成方和开方根,修改谱减法程序如下:clc,clear;x,fs,bits=wavread(12.wav);y=x(1:4096,1);Y=fft(y);magY=abs(Y);b1=;a=1.3;b=1.3;%设定和的值for i=0:126;n=4096;x1=x(1+n*i:n+n*i);X1=fft(x1);magX=abs(X1);S=(magX.a-magY.a);S1=abs(S).(1/b);s1=ifft(S1);m=mean(s1)*300;for j=1:4096;if abs(s1(j)m;s1(j)=s1(j)/4;endenda1=s1;b1=b1 a1;endx2=b1;plot(x2);sound(x2,fs,bits);wavwrite(x2,fs,14.wav)%增强后语音以14.wav为文件名保存运行结果如图3.6所示:图3.6 设置、值为2.3的语音增强波形图大量实验证明,选取不同的和值会对语音增强效果产生不同的影响,适当增大和的值会有效抑制“音乐噪声”,同时也会引起语音的失真。3.5 比较两种处理方法的实验效果就消除噪声而言,基本谱减法和改进的谱减法都能有效地从含噪信号中消除背景噪声得到增强的语音文件,增强效果也十分明显。在改进型谱减算法中考虑到基本谱减法处理产生的“音乐噪声”并进行抑制,从处理后的波形图看来,改进谱减法确实有效的抑制了“音乐噪声”,如图3.7所示:图3.7 两种语音增强的实验效果比较果从声音效果上来,分别试听work文件夹下的13.wav和14.wav音频文件,明显能听出来14.wav音频文件中的音乐噪声比13.wav中的音乐噪声小的多。四 总结随着科学技术的迅猛发展,人类与计算机的信息交流量也越来越多。人们已经不满足于与计算机交流的传统方法,已经尝试用更简单方便的方式实现人机交流。人机对话将会是未来人机交流的主要方式。目前为止,人们对计算机语音识别系统的研究已经有了一定的成果,并研发出计算机语音识别系统,为了保证语音识别系统的准确性,语音信号的噪声
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年安全员竞聘安全服务题及答案
- 2025年BIM安全管理体系建设题及答案
- 2025年建筑施工企业三类人员-B-证笔试预测题
- 2025年安全生产管理模拟题答案解析
- 2025年维修工笔试高频题库与解析
- 2025年视距内无人机面试必考题
- 2025年文物保护师初级考试题集
- 课件中时间轴
- 2025年健身教练从业资格水平考核试题及答案解析
- 2025年建筑材料工程师专业知识考核试题及答案解析
- 人教版(2025新版)七年级下册数学第七章 相交线与平行线 单元测试卷(含答案)
- 厂房消防应急预案
- 景区开发政府战略框架协议书(2篇)
- 保洁投标书范本
- “雄鹰杯”全国小动物医师技能大赛考试题库(660题)
- 实验室隐患排查培训
- 九年级化学第三单元课题1分子和原子人教新课标版省公开课获奖课件说课比赛一等奖课件
- 宠物医疗器械创新与发展
- 《路由与交换技术》教学大纲
- 4《给植物画张“像”》教学设计-2024-2025学年科学一年级上册教科版
- 森林防火条例
评论
0/150
提交评论