




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要人们在语音通信的过程中,常常会受到各种环境噪声的干扰,如餐厅的噪声、汽车噪声以及其他人的讲话声等。由于各种类型的噪声,现今的语音通信系统严重恶化。噪声不仅会影响语音的质量,更会使人耳感觉疲劳。语音增强算法是旨在尽可能的消除语音信号中的噪声,提高语音信号的可懂度及减小失真度。经过数十年的发展,大量的语音增强算法被提出,本文主要研究其中的LMS算法,并通过Matlab仿真实现该算法。LMS算法也就是最小均方算法,在上世纪60年代就被提出,由于其实现简单并且对信道统计特性变化具有稳健性,获得了极为广泛的应用。实验结果表明,LMS算法具有良好的语音增强效果。关键词:语音增强,噪声,质量,可懂度,LMS算法IABSTRACTIn the process of speech communication,people always be interfered by noise which exist in natural environment,such as noise in restaurant,car and other peoples voices.Due to various type of noise,speech communication system of today become worse and worse.Noise not only affects the quality of the speech, but also will make peopleear feel tired.Speech enhancement algorithm aim at eliminate the noise in noisy speech signal as much as possible, improve the intelligibility of noisy speech signal and reduce distortion.After several decades of development, a large number of speech enhancement algorithms have been proposed,this paper studies the LMS algorithm which is one of the speech enhancement algorithms,and simulate the algorithm by using Matlab.LMS algorithm,also known as Least mean square algorithm,was proposed in the 1960s,it is widely used in various fields,because of it can be simply realized and keep steady while statistical properties of channel changed.Experimental results show that, LMS algorithm has good effect in speech enhancement.KEY WORDS: speech enhancement, noise,quality, intelligibility,LMS algorithmII目录第一章 绪论11.1 课题的研究背景11.2 语音增强的历史和发展现状11.3 本文的主要研究内容及结构安排2第二章 语音增强的基础知识32.1 人耳的感知特性32.2 噪声的分类和及特性32.2.1 噪声的分类32.2.2 噪声的特性32.3语音特性4第三章 基于LMS算法的语音增强技术63.1 LMS算法原理63.2 LMS算法的Matlab仿真结果83.2.1 输入信号为正弦信号的仿真结果83.2.2 输入信号是语音信号10总结14致谢15参考文献16附录17III第一章 绪论1.1 课题的研究背景语音增强技术可以看做为语音分离的特殊情况。语音分离指从混合信号中分离出所有的语音分量。而语音增强算法目标在于减少单路语音信号中的噪声分量,提高语音信号的质量和可懂度,减小听觉疲劳。语音增强技术是一门非常实用的技术。在自然环境中,噪声是时时刻刻存在的,无论是在火车站、餐馆还是街道,噪声都极大地影响着我们的通信质量。这些噪声会干扰语音的可懂度和质量,使听者感觉疲劳甚至使我们难以辨识对方的语音。随着信息化的发展,基于信息化的通信方式越来越多的被人类社会所接受,传统的通信方式逐渐被蚕食、遗忘。因此,解决信息化通信过程中存在的问题显得异常迫切。如何减少语音传输过程中的失真,提高语音信号的可懂度是当下研究的重要课题。对于以上这些情况,语音增强技术是很好的解决方案。通过语音增强技术,可以抑制背景噪声,提高系统的抗干扰能力,减小听觉疲劳。1.2 语音增强的历史和发展现状上世纪60年代,一系列数字信号处理的理论和算法被提出,如快速傅里叶算法,数字滤波器,奠定了语音信号数字处理的理论基础。进入20世纪70年代中期,随着数字信号处理理论的成熟,语音增强发展成为语音信号处理领域的一个重要分支。1978年,Lim和Oppenheim提出了语音增强的维纳滤波方法。1979年,Boll提出了谱减方法来抑制噪声。1980年,Maulay和Malpss提出了软判决噪声抑制方法。1984年,Ephraim和Malah提出基于MMSE短时谱幅度估计的语音增强方法。1987年,Paliwal把卡尔曼滤波引入到语音增强领域。在三十几年的研究中,各种语音增强算法不断被提出,奠定了语音增强技术的基础并不断走向成熟。1.3 本文的主要研究内容及结构安排本文是对语音增强算法的仿真,针对以上问题,运用Matlab编写一段处理语音信号的程序,实现对语音信号的简单处理。论文章节安排如下:第一章介绍课题研究的背景,讲述语音增强在应用中的重要性,以及语音增强的发展历史和前景。第二章主要是语音信号增强的理论基础,介绍了人耳的感知特性、噪声的分类和语音特性。第三章是本课题研究的主题,首先介绍了LMS算法的原理,然后通过在Matlab中编译程序,实现了该算法,通过仿真结果,可以看出LMS算法对语音增强具有显著效果。 第二章 语音增强的基础知识2.1 人耳的感知特性语音增强的效果最终取决于人耳的感受效果,因此可以根据人耳的感知特性来减少运算代价。研究表明,人耳对背景噪声有很大的抑制作用,通过了解其机理有助于语音增强技术的发展。目前,已有一些重要的结论可以用于语音增强。1) 人耳有掩蔽特性,也就是强信号对弱信号有掩盖的抑制作用,掩蔽的程度是声音强度与频率的二元函数,对频率的临近分量的掩蔽要比频差大的分量有效的多。2) 人耳对频谱分量强度的感受是频率与能谱的二元函数,响度与频谱幅度的对数成正比。3) 人耳对语音的感知与语音信号频谱分量幅度有关,但对分量相位不敏感。4) 人耳可以从多人讲话的环境中分辨出所需要的声音,这种分辨能力源于人的双耳输入效应,又称为“鸡尾酒效应”。5) 人耳对基频有极好的回复能力。6) 人耳对频率高低的感受于频谱的对数值成近似正比。2.2 噪声的分类和及特性2.2.1 噪声的分类噪声的特性可以说是千变万化,根据与输入语音的关系,噪声可分为加性噪声和非加性噪声两类。对于非加性噪声,也可以通过变换转换为加性噪声。以下只讨论加性噪声,加性噪声大体上可分为宽带噪声、脉冲噪声、周期噪声和同信道语音干扰等。2.2.2 噪声的特性(1)宽带噪声宽带噪声来源很多,热噪声、气流(如风、呼吸)噪声及各种随机噪声源,量化噪声也可视为宽带噪声。由于宽带噪声与语音信号在时域和频域上基本上重叠,因而消除这种噪声比较困难。这种噪声只有在语音间歇期才单独存在。对于平稳的宽带噪声,通常可以认为是高斯白噪声。对于不具有白色频谱的噪声,可以先对其进行预白化处理。对于非平稳的宽带噪声,情况就更为复杂一点。(2)脉冲噪声脉冲噪声表现为时域波形中突然出现的窄脉冲,主要来源于爆炸、撞击、放电等。其特征是时间上的宽度很窄。消除脉冲噪声通常可以在时域内进行,其过程如下:根据带噪语音信号幅度的平均值确定阈值,当信号幅度超出这一阈值时判别为脉冲噪声,然后对信号进行适当的衰减,就可以完全消除噪声分量,也可以使用内插方法将脉冲噪声在时域上进行平滑。这是一种直接消除的方法。(3)周期性噪声周期性噪声的特点是具有许多离散的线谱,主要来源于发动机等周期性运转的机械,电气干扰,特别是电源交流声也会引起周期性噪声。实际信号受多种因素的影响,线谱分量通常转变为窄带谱结构,而且通常这些窄带谱都是时变的,位置也不固定。必须采用自适应滤波的方法才能有效地区分这些噪声分量。(4)同声道语音干扰噪声 人耳可以从两人以上谈话的环境中分辨出所需要的声音,人类的这种分离语音的能力成为“鸡尾酒效应”,这种能力来源于人耳的双耳输出效应。干扰语音信号和语音信号同时在一个信道中传输所造成的语音干扰即为同声道语音干扰。区别于用语音和干扰语音的基本方法是利用它们的基音差别。考虑到一般情况下两种语音的基音不同,也不成整数倍,这样可以用梳状滤波器提取基音和各次谐波,再恢复出有用语音信号。(5)传输噪声传输系统的电路噪声,处理这种噪声可以采用同态处理的方法,把非加性噪声变换为加性噪声来处理。2.3语音特性(1)语音信号具有短时平稳性声道形状有相对稳定性,在一段时间内(10ms30ms),人的声带和声道形状是相对稳定的,可认为其特征是不变的,因而语音的短时谱具有相对稳定性,在语音分析中可以把语音信号分为若干分析帧,每一帧的语音可以认为是准稳定的。语音增强可以利用这种短时平稳性。(2)语音信号可以分为浊音和清音语音可以分为周期性的浊音和非周期性的清音。在语音增强中,可以利用浊音的周期性特征,采用梳状滤波器提取语音分量或者抑制非语音信号,而清音则难以与宽带噪声区分。(3)语音信号可以利用统计分析特征描述作为一个随机过程,语音信号可以利用许多统计分析特征进行分析。语音的短时谱幅度统计特征是时变的,只有当分析帧长趋于无穷大时,才能近似具有高斯分布。在高斯模型的假设中,可以认为傅里叶展开系数是独立的高斯随机变量,均值为零,而方差是时变的。在有限帧长时这种高斯模型只是一种近似的描述,可以作为分析的前提在宽带噪声污染的带噪语音增强中应用。第三章 基于LMS算法的语音增强技术3.1 LMS算法原理LMS算法全称Least mean square算法。中文是最小均方算法。由于实现简单且对信道统计特性变化具有稳健性,LMS算法获得了极为广泛的应用。LMS 自适应算法是一种以期望响应和滤波输出信号之间误差的均方值最小为基准的,依据输入信号在迭代过程中的估计梯度矢量,并更新权系数的迭代算法。LMS算法中的输入矢量为: (3.1)加权矢量(即滤波器抽头系数矢量)为 (3.2) 可知滤波器的输出 (3.3)其中,代表时间指针,、表示共轭转置,代表滤波器次数。误差序列为: (3.4)其中,代表期望信号,代表滤波器的输出。由(3.4)可以看出,通过优化加权矢量可以使最小化,以此来达到最佳滤波的目的。根据最小均方误差准则,最佳的滤波器抽头系数矢量应使得性能函数均方误差为最小。均方误差性能函数如下: (3.5)其中代表期望,将式(3.4)代入式(3.5)可得 (3.6)其中表示和的互相关矢量。表示的自相关矩阵。对(3.6)式两端对求导,并令导数为零,得到: (3.7)当为满秩时,从而可得到该横式滤波器抽头系数的最优维纳解为: (3.8)由式(3.8)可知维纳滤波器的抽头系数的直接计算需要用到矩阵求逆,当滤波器阶数较大时,计算量较大且由于信号和干扰环境的变化常须对求逆过程不断进行。所以常用其它递推求解的方法。下面我们介绍从最陡下降法来推导LMS算法。根据最陡下降法,有: (3.9)其中,为的梯度,而为常数并被称为步长因子。又因为: (3.10)为了实现上述迭代算法需要知道梯度的精确值,这就要求输入信号和平稳且其二阶统计特性已知。这时才能根据信号和需要信号的采样值来估计和,从而寻找。为了克服上述困难和减少求解每次迭代的计算量的问题。一种粗略的但是却是十分有效的计算的近似方法是:直接取作为均方误差的估计值,即 (3.11)由式(3.4)可得 (3.12)将式(3.11)和式(3.12)代入式(3.9)得 (3.13)上式就是B.Windrow在60年代初提出的LMS自适应迭代算法。LMS算法的流程归纳如下: 初始化: 更新: 在第二步中,若取=常数,则称之为基本LMS算法;若取=,其中,0,则得到归一化LMS算法。LMS算法的重要特点是将其期望值近似为瞬时值。故在迭代收敛后,加权矢量不会等于最优的加权矢量,而是在最优加权矢量附近随机性的波动,等效于在最优加权矢量上叠加了一个噪声,也就是说这种近似存在误差。所以,LMS算法又被称为随机梯度法。此法可以被视为最陡下降法的近似。其另一个重要的特点是每次迭代需要次乘法和次加法,因而运算处理相当简单。3.2 LMS算法的Matlab仿真结果本文研究的课题是语音信号增强算法的仿真实现,通过分析LMS算法,在Matlab软件上编译了一段代码仿真该算法。仿真过程分两步,首先输入正弦信号,分析LMS算法在这种周期信号下的语音增强效果,然后输入语音信号,分析该算法在实际运用中的效果。3.2.1 输入信号为正弦信号的仿真结果输入信号为正弦信号,信号的时域波形如下: N=1024; % 采样点数为点 t=1:N; a=1;% 正弦信号幅度为 s=a*sin(0.1*pi*t); % 输入单频信号s figure(1); plot(t,real(s); % 信号s时域波形 title(信号s时域波形); xlabel(采样点数n); ylabel(幅度s); axis(0,N,-a-1,a+1);图3.1加入均值为零、信噪比为5dB的高斯白噪声 xn=awgn(s,5);图3.2经过算法处理的输出信号图3.3得算法的收敛曲线为图3.4比较输入输出信号可以看出,该算法整体上有较好的语音增强效果。收敛曲线的误差随着采样点数急速减小,后期的误差几乎可以忽略不计,不过前期的误差较大。根据该算法,采样点数点以后的输出才是根据算法得出的结果,采样点数点以前的是计算不出来的。所以前期的信号不能得到增强。3.2.2 输入信号是语音信号首先是语音信号的采集,windows系统自带有录音功能,在附件中找到录音机,打开录音,收集到一段格式为wma格式的语音信号,通过格式转换器转换为wma格式,语音信号的采集就完成了。在Matlab中,可以通过wavread函数读取一段wav格式的语音信号,表达式为x,fs,bits=wavread(D:1.wav,N1,N2)。其中x表示采样值,fs表示采样频率,bits表示采样位数,D:1.wav表示语音信号的路径,N1表示读取语音信号的起点,N2是终点。由于录音是立体声,还需要取其中第一通道的音频数据。读取音频信号并对其加噪声的Matlab程序如下: x,fs,bits=wavread(D:1.wav,N1,N2); % 读取音频信号 x1=x(1:N,1); % 读取音频信号figure(3); subplot(3,1,1);plot(t,x1);title(输入语音信号);xlabel(采样点数/n);ylabel(幅度/s);axis(0,N,-0.15,0.15);noise=0.05*randn(1,N); % 噪声信号 subplot(3,1,2); plot(t,noise); title(噪声信号); xlabel(采样点数/n); ylabel(幅度/s); axis(0,N,-0.2,0.2);xn=x1+noise; subplot(3,1,3);plot(t,xn);title(加入噪声后的信号);xlabel(采样点数/n);ylabel(幅度/s);axis(0,N,-0.2,0.2);通过LMS算法对语音信号进行处理,步长u=0.016,算法的Matlab主程序如下: for i=(k+1):N XN=xn(i-k+1):(i); y(i)=w*XN; e(i)=x1(i)-y(i); w=w+u*e(i)*XN; End图3.6是经过LMS算法处理的输出信号,对比输入信号和输出信号,可以看出输出信号在开始时衰减过大,整体的增强效果较为理想。比较图3.4和图3.7可以看出,LMS算法对于正弦信号的增强效果要比语音信号的增强效果好的多。图3.4误差岁采样点数急速减小,误差也趋近于0,图3.7误差整体上呈现下降趋势,但误差总体上仍然较大。分析其中的原因,由于LMS算法是一种固定步长的算法,即u取一常数值,故对于正弦信号这种有规律的信号,LMS算法的增强效果更好。而语音信号和正弦信号相比,缺乏规律,为得到更好的增强,需要用到变步长的LMS算法,通过更新步长u来得到更好的增强效果。同时,步长u的取值也会影响增强效果。 图3.5图3.6图3.7总结通信技术的发展极大的方便了我们的日常生活,但噪声的存在却妨碍了人们之间的通信,成为限制通信系统发展的瓶颈。本文在参考大量文献的基础上,通过在Matlab仿真软件来抵消噪声,实现语音信号增强。在查阅了大量的语音信号增强算法的基础上,本文选择了LMS算法。在分析并理解算法的基础上,在Matlab仿真软件上编译了一段实现该算法的程序。首先在纯净信号中加入噪声,然后用LMS算法处理该加入噪声的信号,通过对比输入、输出的信号,可以看出该语音增强算法具有良好的处理信号的能力。尽管仿真结果证明该算法具有良好的处理语音信号的能力,但是离实际应用仍有一定的距离。为了进一步完善该程序,还有许多问题需要考虑。限于作者的水平和时间的关系,作者认为还有许多方面需要改进,如:1) 步长u的选择会影响语音增强的效果,可以通过取不同的u值,分析如何取u的值,来达到更好的语音增强效果。2) 对于语音信号,通过改变u的值能获得更好的增强效果,本文由于作者能力有限,采取了统一的u值。可以通过仿真变步长的LMS算法来得到更好的语音增强效果。致谢随着论文的完成,我的大学生活也已接近尾声,不久就将踏入社会,但自己仍缺少实感。回想大学四年,不乏有愉快的回忆。在大学,我不仅学到了广泛的知识,也树立了正确的人生观、世界观和价值观。是大学让我学会了如何为人处世,如何去学习,如何去享受生活。在此,我特别要感谢我的导师袁昕老师,袁老师无论是在选题还是后期的论文都给了我很大的帮助,他细心的指导使我能如期完成毕业论文。他渊博的专业知识、严谨的治学态度、求实的科研作风、忘我的工作热情以及谦逊随和的人品都对我的人生产生了深刻的影响。在此,我要向袁老师表示诚挚的感谢。最后,我要衷心感谢那些在我身边支持我的同学,无论是在学习上,还是在生活上,他们都给予了我很大的帮助,离别之际将近,衷心祝福他们能身体安康,生活幸福。参考文献1吴青、吴京京,LMS算法的改进NLMS算法来实现语音增强D,中国矿业大学出版社,2012 2李梅、李文杰、姚善化,改进的变步长LMS自适应滤波算法及仿真J,安徽理工大学出版社,2010.3曹晓琳、张素莉、吴平、丁铁夫,基于MATLAB的谱相减语音增强算法的研究J,中国科学院研究生院出版社,2005 4葛良、陶智,基于MATLAB的语言背景噪声消除D河北大学出版社,2012 5张运伟、陈 健、傅丰林,一种MMSE语音增强算法的研究与实现J,西安电子科技大学出版社,2004.6索忠伟、王建英、魏阳、吕雪,一种基于LMS改进算法的语音增强方法J,西南交通大出版社,2006.7陈素芝、李英,一种基于变步长LMS算法的语音增强方法.江南大学出版社J,2005.3.8李宏伟,一种语音增强算法的研究及实现D,吉林大学出版社,200112.9马建芬,语音信号盲
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 操作技能考核论述模拟练习题带答案(7)工勤技能岗位等级考试
- 液力元件制造工工艺创新考核试卷及答案
- 高岭土加工工岗位操作技能考核试卷及答案
- 电子设备波峰焊装接工特殊工艺考核试卷及答案
- 2025年证券金融试题及答案
- 2025年公共卫生执业考试试卷及答案
- 2025年传染病试题及答案(四)
- 2025年财务管理师职业资格考试题及答案
- 英文完形填空试题及答案
- 2025年奉虹口学一模试卷及答案
- GB/T 46238-2025淡水水下搜救机器人通用技术条件
- 创造性思维训练题库及答案
- 2025版施工合同主体变更与工程竣工结算协议
- 2025年医院麻醉科服务优化计划
- 选矿技术基础知识培训课件
- 校车安全管理操作规范
- 2025-2026学年苏科版(2024)初中物理九年级上册教学计划及进度表
- 劳技鉴别织物课件
- 2025年北京市天文知识竞赛(小学组)历年参考题库含答案详解(5卷)
- 热压罐安全操作规程
- 2025年秋期人教版3年级上册数学核心素养教案(第4单元)(教学反思有内容+二次备课版)
评论
0/150
提交评论