基于线形神经网络的语音去噪技术(共7页)_第1页
基于线形神经网络的语音去噪技术(共7页)_第2页
基于线形神经网络的语音去噪技术(共7页)_第3页
基于线形神经网络的语音去噪技术(共7页)_第4页
基于线形神经网络的语音去噪技术(共7页)_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上 基于线形神经网络的语音去噪技术 龙宇 王忠 (四川大学电气信息学院通信工程系,成都)摘要:针对传统意义上的FIR滤波器所存在的缺陷,本文采用线性神经网络构成自适应滤波器解决特定情况下的噪声去除问题。在神经网络训练的过程中利用“对消”的思想,可以很好地逼近原始语音信号。整个过程采用MATLAB编程实现,它可以在一定程度上弥补FIR滤波器的不足。关键词:线性神经网络 自适应滤波 “对消”法语音去噪1.引 言 语音技术历来是人们关注的热点。特别是在语音信号的噪声去除方面,既是研究的一个重点,同时也是一个难点。如何采取一种功能强大且适用范围广泛的去噪系统进行去噪处理便显得尤

2、为重要。由于噪声来源于各种实际的应用环境,故不同的噪声其特性差别很大。噪声可以是加性的,也可以是乘性的。对于非加性噪声,有些可以通过变换转变为加性噪声。(例如,乘积性噪声或卷积性噪声可以通过同态变换而成为加性噪声)从谱分析的角度来看,噪声大致可以分为以下三类:周期性噪声,冲激噪声,带宽噪声和语音干扰。神经网络是当今研究的一个热点课题,在人工智能,生物工程以及心理学等方面均具有广阔的应用前景。针对含有固定噪声源的语音信号,通过频谱分析发现,噪声与有用信号频谱会在同一频段发生重叠。在这种情况下,利用传统的FIR经典滤波器将无法对噪声进行有效的滤除。故考虑采用线性神经元的网络结构来构成自适应滤波器,

3、因为神经网络滤波器在自动调节本身系统以达到人们的预想目的方面具有其它传统的经典滤波器所不可比拟的优越性,在解决混杂特定噪声的语音滤波问题中会显示出较大的优势。本文试图通过解决对含特定情况下的去噪问题,以展现神经元网络在现代科学各个领域中的良好发展前景。2.基本概念神经网络的基本单元为神经元,它是对生物神经元的简化与模拟,与神经网络之间是个体和整体的关系。大量神经元的相互连接即构成了神经网络。一个典型的具有R维输入的神经元模型可以用下图来描述: 输 入 神 经 元 f P1 W1,1 n a P3 W1,R b 图1 神经元网络的基本结构它主要由以下的五部分组成:(1)输入p1,p2,pR代表神

4、经元的R个输入,用R1维的列矢量P来表示(其中T表示取转置)P=p1,p2, , pRT (1) (2)网络权值和阈值w1,1,w1,2,w1,R为网络权值,表示输入与神经元之间的链接强度;b为神经元阈值,它可以被看作是一个输入恒为1的网络权值。网络权值可以用一个1R的行矢量W来表示:W=w1,1 , w1,2, ,w1,R (2)阈值b为11的标量。 网络的权值和阈值都是动态可调的,而神经元的智能特性也正在于通过训练和学习来不断地调节其本身的权值和阈值,使得训练后输出的结果尽量逼近于我们预计的理想目标。因此从这个意义上可以说,网络权值和阈值的可调性是神经网络学习特性的基本内涵之一。(3)求和

5、单元 求和单元完成对输入信号的加权求和,即n=piw1,I+b (3) 这是神经元对输入信号所进行的第一个处理过程。用MATLAB语言表示为:n=w*p+b (4)(4)传递函数在上图中,f表示神经元的传递函数或激发函数,它用于对求和单元的计算结果进行函数计算,得到神经元的输出。此为神经元对输入信号的第二个处理过程。传递函数的形式多种多样,应该根据要解决的具体问题的不同而灵活选用。典型的有阈值函数,线性函数,对数Sigmoid函数,正切Sigmoid函数等。在本文中是利用线性神经元网络去噪的,故采用线性函数。(5)输出输入信号神经元加权求和及传递函数作用后,得到最终的输出为a=f(wp+b)

6、(5)若取传递函数为purelin函数,则神经元的输出用MATLAB语句表示即为a=purelin(w*p+b) (6)神经网络的结构会因解决问题的难易程度的增大而变得很复杂,但都是在这个简单关系上的扩展。3.问题描述在实际生活中,我们常常会遇到语音信号中含有固定噪声源的情况。如在学校的广播室里,节目主持人正在对着话筒说话,声音将通过麦克风传到外面学校广场上的扩音器播放出去。如果在停电的情况下要保持正常播音,需用小型发电机发电。然而这时发电机工作时所发出的轰鸣声也会通过麦克风传出去,使得广场上的同学根本不能听清主持人的话。又如,医院里用于给病人检查身体的一些仪器,如心电图,CT仪等,可能会受到

7、内部一些固定频率信号的干扰,从而使得在仪器显示频上显示出的心电图信号不纯。对这些混杂的噪声信号进行分析不难发现它们具有以下特点:第一,噪声源相对比较固定,这为我们通过采样的方法提取一个较为单纯的噪声样本提供了可能;第二,这些噪声与我们所发出的语音信号比较,是相对独立的,也就是说,它们属于加性噪声,与原始的语音信号并不相关,但是却会始终干扰有用信号。第三,它们和语音信号一样,也要通过通信信道传输,在这个过程中,噪声信号将发生一个线性变换,其线性关系将由通信信道的性质决定。4.去噪模型的建立利用线性神经元网络构成自适应滤波器来解决上述问题。当输入矢量与目标矢量之间是线性关系时,通过线性神经网络就可

8、以得到一个完全的线性拟合;如果是非线性关系,则只能得到输入、输出间的最大线性拟合解。而我们已经知道,当噪声被录入麦克风,经过传输信道,最后通过扩音器输出,其间经过的是一个线性变换,至于这个线性变换具体的表达形式则完全由传输信道而定,甚至它还可以随着传输信道的改变而改变。但不管其具体的形式如何,通过线性神经网络,都可以实现由输入向目标的逼近。当然,在这个过程中,原始的语音信号经过传输信道后也会发生线性变化,(如:通过扩音器后,其频谱幅度将会被放大)不过,它与发电机发出的噪声之间仍然不存在相关关系。所以,我们可以这样来确定神经网络的各个参数:首先对噪声信号进行采样,得到一个原始噪声信号的样本作为输

9、入的参考信号,设为r(t)。将经过信道传输,由扩音器输出的混杂有噪声的语音信号也进行采样得到一个样本,设为x(t),令x(t)=s(t)n(t).其中,s(t)表示通过信道后的原始话音,n(t)表示通过信道后的话音中混杂的噪声。r(t)与s(t)不相关,但与n(t)相关。经过神经网络训练后,得到一个输出a(t),使得a(t)尽量与x(t)中的n(t)相匹配,那么网络的“误差值”,即e(t)x(t)a(t) (7)即为我们所需要的有用信号,它是尽量逼近于原始语音信号s(t)的。利用这种“对消”思想,可得到较为纯正的原始话音。去噪模型可用下面的框图来表示:z(t)x(t)=s(t)+n(t) +自

10、适应滤波器r(t)a(t) 控 制 - 图 2 去噪模型框图5.程序示例用一个人工合成的噪声环境来模拟实际环境,检验这种滤波器的性能。原始话音信号为录制的一段新闻播报,时间大概在5秒钟左右。对其进行离散化处理,采样频率为8KHZ。然后取得噪声的一个样本:自定义一个零均值的高斯白噪声离散信号,其长度和原始语音信号相同将其作一个线性变换以模拟实际中通过通信信道传输的过程,加到原始语音信号上,这就合成了一个含噪的语音信号,且满足噪声来源固定,加性,经过线性变换这三个条件。创建线性神经元网络。由于采用自适应滤波,故需定义延迟阶数。从理论上来说,阶数越高,对目标信号的逼近程度就越高,滤波的效果就越好。但

11、同时网络的计算量也就越大,耗时越多,这与实际应用中实时处理的要求是不相符合的。所以在调试过程中要把两种因素要综合起来考虑。程序流程框图如下所示:混合语音原始语音确定神经网络输入矢量和目标矢量创建线性神经网络分段,逐段进行仿真和训练判断是否为第一断前后两段数据结果首尾相加达到循环输出处理后的语音信号开 始 图3 程序流程框图专心-专注-专业6.频谱分析 这里列出信号在处理过程中各个阶段的频谱分析,以反映滤波器在噪声去除过程中的频谱变化过程:原始的纯净语音信号频谱如下所示: 图4 原始语音信号频谱加入零均值高斯白噪声后的混合语音信号频谱如下所示: 图5 混音信号频谱图由图可见,高斯白噪声对话音的影

12、响相当大,语音信号和噪声信号的频谱完全重叠.从实际的听觉情况来看,它几乎把原始话音完全湮没。经过线性神经网络处理后的语音信号频谱如下所示: 图6 去噪后输出语音信号频谱可见,经过线性神经网罗自适应滤波器滤波后,得到的信号频谱图与原始语音信号频谱相似,可以听到较为清晰的原始话音,表明滤波效果是比较理想的。7.结语去噪问题一直是语音处理技术中的一个重要方面,对现实应用具有很重大的意义,而神经网络又是当今智能科学中的研究热点。本文把这两个重要的方面相结合,讨论了在特定的噪声环境中利用线性神经网络去噪的方法,并利用MATLAB给出示例程序实现之。由于噪声的形式是多种多样的,产生方式各有不同,每一种噪声

13、都有其特点,所以这也造成了去噪的困难。本文也仅仅是针对实际中出现的含有固定的,通过通信信道发生线性变换的加性噪声的语音信号的去噪问题做出一些讨论,希望籍此能加深对噪声特性的理解,为从更广泛的层面上去除其它类型的噪声作一个铺垫。参考文献【1】 朱明雄. 计算机语音技术. 北京航空航天大学出版社. 1992【2】 胡守仁,余少波,戴葵. 神经网络导论. 国防科技大学出版社. 1993【3】 R.维得罗,S.D.史蒂恩斯编,王永德,龙宪惠译校. 四川大学出版社. 1989【4】胡航. 语音信号处理. 哈尔滨工业大学出版社. 2000【5】易克初,田斌,付强. 语音信号处理. 国防工业出版社. 200

14、1【6】陈怀堔. 吴大正. 高西全. MATLAB及在电子信息课程中的应用.(第二版). 2003【7】从爽. 面向MATLAB工具箱的神经网络理论与应用(第二版). 中国科学技术大学出版社. 2003The technology of Noise Cancellation by linear neuron Long Yu Wang Zhong(Communication Engineering Department,SiChuan University,Chengdu.)Abstract: Neural networks are composed of simple elements ope

15、rating in parallel. These elements are inspired by biological nervous systems. As in nature, the network function is determined largely by the connections between elements. We can train a neural network to perform a particular function by adjusting the values of the connections (weights) between ele

16、ments.The operation of a linear adaptive filtering algorithm involves two basic processes:A filtering process designed to produce an output in response to a sequence of input data.An adaptive process, the purpose of which is to provide a mechanism for the adaptive control of an adjustable set of parameters u

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论