基于提升小波的语音增强算法的研究与实现.doc_第1页
基于提升小波的语音增强算法的研究与实现.doc_第2页
基于提升小波的语音增强算法的研究与实现.doc_第3页
基于提升小波的语音增强算法的研究与实现.doc_第4页
基于提升小波的语音增强算法的研究与实现.doc_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,分类号注密级一学位论文基于提升小波的语音增强算法的研究与实现(题名和副题名)冯岩(作者姓名)指导教师姓名唐普英岳昵殳授电子科技大学成都(职务、职称、学位、单位名称及地址)申请专业学位级别硕士专业名称电路与系统论文提交日期论文答辩日期学位授予单位和日期电子科技大学答辩委员会主席评阅人年月日注:注明国际十进分类法的类号。独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名:多玛岩日期:矽年多月日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩日或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)签名:二墨址导师签名:;峨日期:矽加年月日摘要摘要语音增强已经发展成为语音信号处理的一个重要的研究方向。在许多语音处理的应用中,例如移动通信、语音识别和助听器,语音信号的处理不得不在具有噪声的环境下进行。在过去的几十年里,人们提出了许多方法去消除噪声和减少语音失真,例如谱减法,基于小波的方法,隐式马尔科夫模型法和信号子空间法虚生守。小波变换的特点是可以采用一个可变的时间窗来处理不同的频率成分。通常,我们可以使用较长的时间窗来获取更精确的低频信息,而使用较短的时间窗来获取高频信息。传统的基于小波的语音去噪算法可以有效的消除带噪语音信号中的高斯白噪声,但是这种算法不能很好的去除现实生活中经常遇到的非平稳噪声。这种算法的缺点是所使用的简单的时不变的阈值不仅会消除背景噪声,也会消除语音信号中的有用的清音成分。这会导致增强后语音质量的下降。为了更好的消除现实生活中广泛存在的非平稳噪声,本文提出了一种基于提升小波的语音增强算法。这种算法包括感知小波包变换和自适应噪声估计。小波阈值是随着自适应噪声估计所计算出来的带噪语音信噪比的变化而变化的。该算法不需要语音暂停检测。与传统的离散小波变换相比,提升小波具有速度快,计算复杂度低,节省硬件资源的特点。采用了提升小波算法实现了感知小波包的分解和重构,这是整个算法的关键,为以后该算法的硬件实现打下了基础。仿真实验结果表明,与传统的小波阈值去噪算法相比,在非平稳噪声环境下,所提出的算法具有更好的去噪效果。在对所提出算法研究的基础上,设计了一种该算法的硬件实现结构。语音增强算法的硬件实现通常是用或等硬件描述语言在上编程完成的。但是这种实现方法比较复杂,效率比较低。首先,在环境下对其进行系统建模。然后,利用将其转化为硬件描述语言。最后,在环境下对其进行编译和综合,并在上进行实现。这种方法缩短了设计周期,提高了设计效率。实验结果表明了该设计的可行性和正确性,具有广阔的应用前景。摘要关键词:语音增强,提升小波,曲,:,目录目录第一章绪论研究背景和意义本文的主要内容本文的结构安排第二章语音增强算法的综述语音增强算法的结构经典的语音增强算法维纳滤波法谱减法基于贝叶斯定理的最小均方差法卡尔曼滤波法。基于小波的语音增强算法本章小结第三章一种改进的基于提升小波的语音增强算法改进的语音增强算法的结构各模块的算法设计感知小波包变换模块自适应噪声估计模块平滑参数计算模块自适应阈值模块软阈值处理模块实验和结果分析时频分析信噪比分析本章小结第四章基于的语音增强系统的实现开发平台目录系统的硬件结构设计语音增强模块配置寄存器模块音频接口驱动模块时钟模块系统测试本章小结第五章结论与展望本文的总结前景展望致谢。参考文献作者攻硕期间取得的研究成果第一章绪论研究背景和意义第一章绪论语言是人类创造的,是人类区别于其他地球生命的本质特征之一。语音是语言最本质、最自然、最直接的表现形式。人们对语言的研究早已有之,其中语音学是研究人类语音的产生、传播及感知等过程机理的学科,包括发音语音学、声学语音学和听觉语音学三个分支。数字信号处理是通过计算机或其他专用设备,对离散信号用数字方式进行增强、压缩、滤波、变换及识别等处理的新兴学科。语音学和数字信号处理的交叉结合便形成了语音信号处理。语音信号处理是建立在语音学和数字信号处理基础之上的,对语音信号模型进行分析、存储、传输、识别、合成等方面研究的一门综合性学科。语音增强目前已发展成为语音信号处理的一个重要的研究方向。现实生活中的语音不可避免的要受到周围环境的影响,很强的背景噪声例如飞机驾驶舱里的机械噪声,在街道、市场等嘈杂环境中其他说话者的话音等均会严重地影响语音信号的质量。此外传输系统本身也会产生各种噪声,所以在接收端的信号为带噪语音信号。语音增强的主要目标是从带噪语音信号中提取尽可能纯净的原始语音,是一种解决噪声污染的有效方法。小波分析是近年来迅猛发展起来的新兴的交叉性学科,小波变换的概念是由法国从事石油信号处理的工程师在年首先提出的【。与傅里叶变换、窗口傅里叶变换(变换)相比,它是一个时间和频率的局域变换,因而能有效地从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进行多尺度细化分析,解决了傅里叶变换不能解决的许多困难问题。小波变换被誉为“数学显微镜,它是调和分析发展史上里程碑式的进展。小波理论被认为是对傅里叶分析的重大突破,它已被广泛应用于数值分析、信号处理、图像处理、量子理论、地震勘探、计算机视觉、语音识别、机械故障诊断等领域,并深深地影响着这些领域。它具有重要的理论价值和实际应用价值,是众多学科所共同关注的热点之一。语音信号是一种非平稳的随机信号。语音的生成过程与发音器官的运动过程电子科技大学硕士学位论文密切相关,考虑到人类发声器官在发声过程中的变化速度具有一定的限度而且远小于语音信号的变化速度,因此可以假定语音信号是短时平稳的。小波分析具有多分辨率分析的特点,在时域和频域都有表征信号局部信息的能力,时间窗和频率窗都可以根据信号的具体形态动态调整。在一般情况下,低频部分信号较平稳,可以采用较低的时间分辨率,而提高频率的分辨率。在高频情况下,频率变化不大,可以利用较低的频率分辨率来换取精确的时间定位。因为这些特点,小波分析可以探测正常信号中的瞬态,并展示其频率成分,适合对语音这种非平稳信号进行处理。近年来,基于小波变换的语音增强技术有了很大的发展。年,等提出了种基于小波的阈值去噪方法【】,缺点是使用的阈值为全局阂值,没有考虑噪声在不同尺度上的差异。从那时开始,各种各样的小波去噪算法被广泛的研究。为了进步提高去噪效果,年,等又提出了基于小波分解尺度相关的阈值设去噪方法【,这种方法可以改进恢复的语音信号质量,但无论是全局阈值还是尺度相关的阈值,都是随时间不变的,因此在传统的基于小波变换的语音增强中,经常会出现过度阈值处理的现象,即在抑制噪声的同时,将语音信号的一些有用成分也去除了。而且,这些去噪方法主要是针对高斯白噪声的,现实生活中大多数噪声是比较复杂的非平稳背景噪声。本文的主要内容本文对基于提升小波的语音增强算法进行了研究和实现。本文的主要研究工作可归纳如下:()针对传统的基于小波阈值去噪算法在处理非平稳噪声时的不足,本文提出了一种基于感知小波包变换和自适应噪声估计的语音增强算法,小波的阈值不是固定不变的,而是可以根据计算出来的带噪语音信噪比的变化,进行自适应的调整。这种算法不需要进行复杂的语音暂停检测,减少了计算的复杂度。并采用简洁高效的提升小波算法实现了感知小波包的分解和重构,这是整个算法的关键,为以后该算法的硬件实现打下了基础。仿真实验结果表明,在不同噪声类型、不同信噪比的非平稳噪声环境下,该算法能更好的适应非平稳噪声的变化。与传统的小波阈值去噪算法相比,可以有效的消除噪声并且减少语音失真。()在对基于提升小波的语音增强算法研究的基础上,给出了该算法的硬件第一章绪论实现结构。语音增强算法的硬件实现通常是用或等硬件描述语言在上编程完成的。但是这种方法比较复杂,效率比较低。本文利用最新的基于的开发工具,结合等开发工具在上进行硬件设计实现,极大的提高了设计效率,缩短了设计周期。首先在环境下对设计进行建模仿真,然后利用把语音增强系统的模型转化为硬件描述语言。最后,用软件对设计进行编译,综合,布局布线,产生编程文件,下载到上进行硬件实现。综合和仿真结果表明,该硬件结构较好的实现了本文提出的语音增强算法,达到了预期的效果。本文的结构安排全文共分为六章,内容安排如下:第一章绪论,介绍了基于小波变换的语音增强算法的理论背景及应用价值,概括了本文所做的主要工作及本文的组织结构。第二章主要阐述了语音增强算法的系统模型和几种常用的语音增强算法,并介绍了基于小波的语音增强算法。第三章在离散小波变换的基础上引入了提升机制,提出了一种基于提升小波的语音增强算法,并把它与其他的语音增强算法进行比较,给出了仿真实验和结果分析。第四章对基于提升小波的语音增强系统进行设计,采用了基于的开发方法,并在上对该系统进行了实现与测试。第五章对本文所作的工作进行了概括和总结,并指出了论文中存在的不足之处以及进一步的研究方向。电子科技大学硕士学位论文第二章语音增强算法的综述语音增强是一个在许多应用中长期存在的问题,例如助听器,语音通信,语音信号的编码和自动识别,语音增强应用于信号含有噪声或者接收端受损的情况。例如,听力受损的人需要对通常的语音进行增强来使他们具有正常的收听语音的能力。房间里的语音信号会产生回声,当使用一个单声道移动电话不能用双耳收听的时候,回声对收听效果会有很大的影响。一个语音编码器可能被设计用来处理纯净的语音信号而它的输入信号可能是带有噪声的。同样的,个语音识别系统可能在与设计所期望不同的环境下工作。这几个例子表明了语音增强问题的应用范围和复杂性。在本文中,我们主要关注于对带噪语音信号的增强来改善语音的质量。我们假定噪声是加性的和统计独立的信号,此外我们假定带噪信号是唯一可以利用的信号,因此没有参考的噪声源可以利用。这是一个非常有趣的问题,在过去的五十多年已经引起了极大的关注和研究。在噪声环境中,比如汽车里、火车里、街道上、喧闹的公共场所等,语音增强可以改善语音质量和可懂度【】【】【】。语音增强具有广泛的应用,例如移动电话、免提电话、电话会议、汽车内的通信系统和自动语音识别服务。本文主要介绍噪声环境中单输入语音增强的方法。语音增强算法的结构假定语音信号文所)和噪声,()都是加性的,带噪语音(,)可以表示为()()甩(,)(一)式中,整型变量定义为离散时间的下标。通常认为语音和噪声是不相关的,在大多数情况下这个假设是合理的,因为语音信号和噪声是由不相关的源产生的。典型的语音增强算法的通常形式如图所示。语音增强算法由如下的一组模块组成:第二章语音增强算法的综述语音增强一一(亘一糯鞭型扣一恒华学一?一丫一特征提取语音和噪声的识别图语音增强算法的模块图()语音被分成一系列重叠的帧,帧长大约为,然后对每一段进行加窗处理,例如窗。()对每一个语音帧进行离散傅里叶变换为一组短时频谱采样。()估计纯净语音的频谱幅度,包括根据对每一频率的信噪比进行估计来修正带噪语音的幅度谱。()利用连续语音帧频谱的短时相关性来使帧间信号变平滑。()语音和噪声模型以及语音和噪声的译码器为语音估计提供了所要求的语音和噪声的统计信息,如功率谱、相关矩阵等。()语音激活检测()用来从只有噪声存在的周期估计和生成噪声模型,也可以对只有噪声存在的周期中的信号进行额外的衰减。下面将要更详细的阐述语音增强算法的基本单元。()语音的分段和加窗语音处理系统把采样的语音信号分成大约时间长的重叠的帧。每个帧内的个语音采样点被处理,由一组频谱特征或语音产生的线性预测模型所表示。每一帧的信号被认为是平稳的。语音帧长度的选择(典型值为到之间)不仅由线性时不变信号处理的方法(例如傅里叶变换或者线性预测模型)的平稳性假设所决定,也由实时通信系统(例如话音编码器)的最大允许延迟所决定。式中,】,()和越()】(七)】分别是频域的幅度和相位。注意傅里叶变换模拟了具有正弦函数形式的语音采样点的相关性。可以被用来单独的处理语音或者把听觉心理声学考虑进去来处理语音。()语音和噪声的线性预测模型表征【】语音(或噪声)采样点的相关性可以由线性预测模型(也叫做自回归模型)所模拟。利用语音和噪声的线性预测模型,带噪语音可以表示为(肌):圭口。(历一七)()圭瓯刀(柳一尼),(朋)()女,一、,一式中,。和以分别是语音和噪声的线性预测模型的系数。线性预测模型可以被用于各种各样的语音增强方法中,包括维纳滤波法,卡尔曼滤波法和经过分解和综合的语音重构。()帧内和帧间信息的相关性两种模型化带噪语音的观点:一是利用每个带噪语音帧的语音和噪声采样点的概率分布和帧内相关性来模型化;二是利用连续带噪语音帧的语音和噪声特征的概率分布和帧间相关性来模型化。大多数语音增强算法是基于对语音的短时幅度频谱或者线性预测模型的估计,语音的相位失真可以忽略。在基于特征的情况下,每一个在离散频率的频谱采样()和正弦函数砌形式的语音采样()具有相关性。帧内的频谱第二章语音增强算法的综述相关性即一个语音帧内的频谱采样点的相关性通常是可以忽略的,因为连续语音帧间的频谱采样的短时相关性是不变的。在线性预测模型的情况下,极点表示了每一帧帧内频谱的相关性。然而,线性预测模型的极点或者系数的去噪可以通过对纯净语音的频率响应的去噪来完成,它忽略了频谱采样点的相关性。如何利用帧间和帧内相关性得到最优的语音采样点目前还没有很好的解决办法,是将要继续进行研究的课题之一。()语音估计模块语音增强算法的核心是语音估计模块。语音增强中的语音频谱幅度或者线性预测模型通常是估计得出的,然后利用这些估计值去重构语音采样点。现在已经提出了很多方法去估计纯净语音,包括维纳滤波法、谱减法、卡尔曼滤波法、最小均方误差法和最大后验概率法【】等。为了实现语音估计模块的功能,我们需要得到语音和噪声的统计信息,这可以从带噪语音中估计或者从预先训练好的语音和噪声模型中获得。()语音和噪声的概率模型噪声消除方法(例如维纳滤波法、卡尔曼滤波法、谱减法或贝叶斯估计法)的实现需要估计语音和噪声的统计信息(特别是功率谱或者等价的相关矩阵)。噪声统计信息的估计可以由语音不活动的时间内得到。然而,为了得到最好的结果,语音和噪声的统计信息可以由语音和噪声的概率统计模型中得到,这就意味着在最优的语音处理系统中语音识别和语音增强需要有机结合。最常用的语音概率模型是隐式马尔科夫模型。隐式马尔科夫模型或者高斯混合模型(,)也可以被用来模拟非平稳噪声。为了去模拟不同类型的噪声,多个模型需要同时训练,一个模型对应一种类型的噪声。同样,可以使用一个包含了许多噪声成分的模型,每个成分对应不同类型的噪声。经典的语音增强算法经典的噪声消除方法是维纳滤波()法【,它根据对每一个频率信噪比的估计,修正了输入带噪信号的幅度频率谱。维纳滤波器需要对语音和噪声的功率谱进行估计,或者估计它们相应的自相关矩阵。最简单的噪声消除的方法是基于从带噪信号中减去所估计噪声的幅度频谱。谱减法只需要估计平均噪声电子科技大学硕士学位论文谱,通常从没有语音却只有噪声的周期中获得,但是会引入一些失真。高性能的语音增强方法是基于贝叶斯()定理的估计,包括卡尔曼滤波()法】,最小均方误差估计法【,和基于语音和噪声的隐式马尔科夫模型(,)的信号重构方法【。维纳滤波法维纳滤波器的思想是语音增强算法的基础。维纳滤波器的输出由下式给出:;():壹以)()()式中,后)是输入语音()去噪后的滤波器系数,()是纯净语音()的估计值。维纳滤波器系数向量,(),以),戗)由下式得出:别勺()式中,如是带噪语音信号少的自相关矩阵,勺是纯净语音和带噪语音的互相关向量。对于不相关的语音和噪声,维纳滤波器式()可以写成:,【疋氏()式中,和如分别是语音和噪声的自相关矩阵,是语音的自相关向量。在频域,加性噪声和语音是不相关的,维纳滤波器式可以表示为:吣,揣()式中,形(七)是维纳滤波器的频率响应,(七)和尸删(七)分别是语音和噪声的功率谱,是离散频率变量。图是频域维纳滤波器的实现框图。第二章语音增强算法的综述带噪语音增强语音维纳滤波器式()的分子和分母同时除以(),维纳滤波器可表示为信噪比的形式:吣)篇黯()这个等式表明了影响信号输入噪声消除系统的重要因素。噪声抑制方法可以有效的利用信噪比估计的函数去改变带噪信号的频谱幅度。实现维纳滤波器的关键是:精确估计频域维纳滤波器式()中的语音和噪声的功率谱名(七)和(七),或者等价为估计时域滤波器式()中语音和噪声的自相关矩阵砭和冠。这不是很容易实现的,因为语音和大多数噪声都是非平稳的。如果已知带噪语音信号,语音和噪声时变的功率谱可以利用维特比译码器()从预先训练好的语音和噪声的隐式马尔科夫模型或者高斯混合模型中估计得到,如图所示。图基于维纳滤波器和帅的语音增强算法的结构框图基于状态的维纳滤波器包括以下信号处理的步骤:电子科技大学硕士学位论文()语音和噪声的分解。这包括对已知带噪语音信号中语音和噪声的模型的组合进行最大可能的估计。利用维特比译码器,语音和噪声组合状态的最大可能估计可以得出纯净语音和噪声的频谱概率分布函数的最大可能估计。()从()中获得的语音和噪声的功率谱被用来实现基于状态的维纳滤波器。在基于的维纳滤波器中,训练模型的语音特征的选择需要对语音识别和增强都是合适的。基于线性预测的倒谱特征提供了合适的方法,因为从状态中得到的倒谱系数可以映射成线性预测模型的系数以及用于实现维纳滤波器的线性预测模型的频谱。假设带噪语音信号的频谱(),维特比译码器返回了个不同的最大可能状态序列,然后在每一状态中语音频谱的概率密度函数可以由个高斯概率密度函数联合来表示,维纳滤波器可以写成:材叉(尼)【(,力,(七)】(七)()式中,(,)是从模型状态的混合状态厂中估计的语音和噪声频谱的概率。,(后)是维纳滤波器的状态。谱减法图基于的谱减法语音增强算法谱减法【冽是一种简单和广泛研究的语音增强方法,如图所示。在谱减法中,噪声的平均幅度谱的估计值从带噪语音幅度谱中减去。谱减法滤波器可以第二章语音增强算法的综述表示为带噪语音频谱】,(七)和频谱增益函数(后)的乘积。()(尼)(尼)()式中,谱减法滤波器的频率的频率响应(足)为哪篙】()式中,()是噪声平均幅度频谱的估计值,()是与频率相关的减法因子,选择函数伍()是为了避免()为负数,当信噪比相对较低时为其提供了一个平滑的频率响应。函数台()的形式可以写成:()(一)鬻一,帆冀黑()()式中,()是在离散频率信噪比的估计值。咖是阈值,一旦超出了这个阈值,谱减法函数将以指数的形式衰减。是参数,为转换点提供了连续性。是衰减控制因子。谱减法的问题是经常会使语音失真,导致音乐噪声的出现。谱减法的缺点可以总结为如下几点:()谱减法中唯一使用的统计信息是噪声幅度频谱的平均值,而没有使用纯净语音的平均值和方差、噪声的方差。结果,平均值附近的噪声方差没有被有效的抑制,这会导致更多的失真。()谱减法不是专门用于语音的,经过一段时间的语音频谱轨迹没有在去噪过程中模拟和使用。()需要利用硬判决去避免谱减函数为负数或者低于噪声下限时幅度谱的估计值。基于贝叶斯定理的最小均方差法频谱幅度的贝叶斯估计可以表示为:电子科技大学硕士学位论文一五(后)五,以)女,以)呱兰卫再一()(】,(尼)墨,以)。(式中,()()是己知带噪语音(七),纯净语音()的后验概率。式()需要求出带噪语音的似然概率()五,。)和纯净语音的先验概率密度函数,)利用纯净语音幅度频谱的瑞利分布,纯净语音的统一相位,带噪语音的复合高斯分布,最终的估计值可以写成:呢觚(七)增益因子(七)由下式给出:()椰,每唧一净抄咏一劬协式中,()是伽马函数,()是阶数为,的贝塞尔函数,屹和圪被定义为:篙砒舞舻丽()()式中,(后)和)时语音和噪声频谱的方差,彘是先验的信噪比,以是后验的信噪比。卡尔曼滤波法卡尔曼滤波器与维纳滤波器有几点不同,最主要的差别是卡尔曼滤波器式允许明确的包含语音和噪声的时变等式。对于去噪语音,卡尔曼滤波器可以在时域或者频域实现。常见的方法是时域的卡尔曼滤波器。语音信号()和噪声()可以用自回归模型来表示:):圭(一七)()()第二章语音增强算法的综述刀():羔瓯,(一尼)(聊)()七和吮分别是语音和噪声的自回归模型的系数。式()和式(一)可以表示为卡尔曼滤波器状态空间的形式:(),(一),()()吃()()。(一)()()吃以(,)式中,模型的系数矩阵可以定义为:以口口包乞一。吃()()()()()信号和噪声向量是:(扰)缸删),(一),(),以()【,(聊),(),(),吃,和见岛,】。信号和噪声可以结合到一起写成状态空间形式的等式:呈降龇咖()汨这个等式可以简写成:(所)()()带噪语音的表达式可以写成:()()工(研),(所)()()电子科技大学硕士学位论文热将注意,在卡尔曼滤波器的式中,式()中的信号和噪声以及式()带噪信号的表达式是由状态向量的线性变换得出的,所生成的信号和噪声都是性的。状态向量的预测等式为(状态向量由语音和噪声组成):()()()(预测误差的协方差矩阵为:(一)(一)(一)()()(卡尔曼增益向量:状态更新等式;()(一)(一)】。()三(聊)三(一)置(聊)()一(一)】()注意更新信号()一三()是信号与噪声的不可预测部分的组合。估计误差的协方差矩阵为()(),()()卡尔曼滤波器的应用需要对语音和噪声的模型进行估计,口。,】和岛,如,乞】,如图所示。这些可以通过应用最大估计算法来得到,它可以有效的得出如下标准式(即公式):口一,()二;工工!()一式中,语音和噪声的自相关矩阵是由卡尔曼估计得到的:第二章语音增强算法的综述二瓶(聊),()三(),二()】)屯;二(聊),()二(朋),二(,)】)初始语音模型钆初始噪声模型一一卫一一带噪语酱增强语音一卡尔曼滤波器一图基于卡尔曼滤波器的语音增强算法基于小波的语音增强算法()()在移动通信系统中,语音编码的质量经常受到周围背景噪声的干扰。解决这个的问题的一种方法是应用语音增强方法来改善语音通信系统的质量。传统的语音增强方法利用线性处理技术来实现,例如维纳滤波法【、谱减法【】和线性预测方法【】等。尽管这些方法可以抑制背景噪声,但是这些方法也可以使语音信号失真并且引入可感知的使人厌烦的残留噪声,通常称为音乐噪声。近些年来,基于小波的滤波技术在语音信号处理领域得到了广泛的研究。小波分析【】是近年来发展起来的一种新的时频分析方法。传统的信号分析是建立在傅里叶变换的基础上的,由于傅里叶分析使用的是一种全局的变换,因此无法表述信号的时频局域性质,而这种性质恰恰是非平稳信号最根本和最关键的性质。为了分析和处理非平稳信号,人们对傅里叶分析进行了推广乃至根本性的革命,提出并发展了一系列新的信号分析理论:短时傅里叶变换、变换、时频分析、小波变换、分数阶傅里叶变换、线调频小波变换、循环统计量理论和调幅。调频信号分析等。其中短时傅里叶变换和小波变换也是应传统的傅里叶变换不能满足信号处理的要求而产生的。但从本质上讲,短时傅里叶变换是一种单一分电子科技大学硕士学位论文辨率的信号分析方法,因为它使用一个固定的短时窗函数。因而短时傅里叶变换在信号分析上还是存在着不可逾越的缺陷。小波变换是一种信号的时问尺度分析方法,它具有多分辨率分析的特点,而且在时频两域都具有表征信号局部特征的能力,是一种窗口大小固定不变但其形状可改变,时间窗和频率窗都可以改变的时频局部化分析方法。小波变换在低频部分具有较高的频率分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,很适合探测正常信号中夹带的瞬时反常现象并展示其成分,所以被誉为分析信号的显微镜。基于小波的语音增强方法的主要思想来自于小波阈值算法【,简单的说就是小波变换可以将带噪信号分解为具有时间一频率特性的小波系数,然后选择一个合适的阈值,背景噪声可以通过将带噪小波系数进行阈值处理来消除。最后把这些经过阈值处理后的小波系数进行重构来得到增强信号。这种去噪算法可以很好的消除带噪语音信号中的加性高斯噪声。在许多信号处理领域的应用中,小波阈值去噪算法是消除信号中噪声的一个有力的工具。这个算法可以分为以下三个步骤:()对带噪信号进行小波变换。()对得到的小波系数进行阈值处理。()进行小波反变换,从而得到去噪后的信号。这个算法是由和首先提出的,可以利用一个全局的和时不变的阈值力来消除信号中的高斯白噪声。兄是由下式得到的:名:,()()式中,是所估计的噪声的标准差,是小波系数的绝对中值估计,是帧的长度。对于小波包变换,阈值可以写为:五,(忉()硬阈值和软阈值函数【分别定义为:蜘譬落协,以及,第二章语音增强算法的综述。:咖缈,列()。,【,式中,丁是阂值,和雎分别是经过硬阈值和软阈值处理后的小波系数。虽然这种小波阈值去噪算法是简洁的并且可以有效的去除信号中的白噪声,但对于带噪语音信号中常见的有色和非平稳噪声,这种全局阈值的去噪方法的效果不是很好【。为了克服小波阈值时不变的不足,改进的小波阈值去噪算法相继被人们所提出,这些算法中不同子带的小波阈值是随着时问变化而自适应调整的。下面介绍几种主要的改进算法:()基于后验的自适应算法【删:为了追随带噪语音的变化,阈值根据所计算的每一帧的值而进行自适应调整。在语音主导的帧中,利用较小的阈值来使语音失真达到最小。对于噪声主导的帧,利用较大的阈值来消除噪声的小波系数。()基于掩蔽效应的自适应算法:这种噪声掩蔽效应在浊音段的高频带和清音段的低频带中自动增加,利用这种效应来调整阈值的大小,不需要额外的算法对清浊音进行判决。()基于能量算子的自适应算法【】:利用可以区分语音主导的帧和噪声主导的帧。在许多语音应用中,都是一个有效的非线性算子【】【。对于一个已知的带限离散语音信号(),离散时间的可以用下式来表示:甲【(玎)】()()(一)()这个算子本质上是一种对信号能量的度量,是时间的函数。基于的语音增强算法的模块图如下图所示:旯带图基于的语音增强算法的模块图电子科技大学硕士学位论文本章小结本章首先介绍了语音增强算法的结构,在此结构的基础上介绍了几种有代性的算法,如维纳滤波法、谱减法等,详细阐述了这些算法各自的特点和分析法。最后,介绍了基于小波的语音增强算法。第三章一种改进的基于提升小波的语音增强算法第三章一种改进的基于提升小波的语音增强算法上一章介绍基于小波的阈值去噪算法可以很好的消除带噪语音信号中的加性高斯噪声,然而这种算法不能有效的处理现实世界中广泛存在的有色和非平稳噪声。小波阈值算法的缺点是所使用的简单的时不变的阈值不仅会消除背景噪声,也会消除语音信号中的有用的清音成分。这会导致增强后语音质量的下降。最近,人们又提出了一些改进的应用于语音增强的小波阂值算法。和提出了利用能量算子(,)】来区分一个语音帧是语音主导的帧还是噪声主导的帧,然后分别用阈值进行处理。然而,阈值的确定是由实验总结得出的,这种算法仍然存在阈值处理过度的问题【。为了更好的消除现实生活中广泛存在的非平稳噪声,在前人研究的基础上,本章对传统的小波阈值算法进行了研究和改进,提出了基于提升小波的语音增强算法。改进的语音增强算法的结构本文改进的语音增强算法的结构框图如图所示。带噪语音信号以的频率采样。在这个算法中,输入信号利用感知小波包变换被分解为个子带信号。在子

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论