(计算机应用技术专业论文)基于小波变换的语音信号增强方法研究.pdf_第1页
(计算机应用技术专业论文)基于小波变换的语音信号增强方法研究.pdf_第2页
(计算机应用技术专业论文)基于小波变换的语音信号增强方法研究.pdf_第3页
(计算机应用技术专业论文)基于小波变换的语音信号增强方法研究.pdf_第4页
(计算机应用技术专业论文)基于小波变换的语音信号增强方法研究.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

(计算机应用技术专业论文)基于小波变换的语音信号增强方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

abs t rac】 , abs tract the ree x i s t v a ri o u s d i s tu rb s froms u rr o u ndi n ge nvi ro 阴e n t , n o i s e sc aus e db y t rans fo rm m e d i as , i nne r e 1 e c t r i cal n o i s e so f 1 b ecom m u n i cat i on equ i p m e n t s , eve n d i s tu th sfromo th erspe a k e rsd u ri n gt h es p e e c hcom m u ni cati o np r o c e ss . s p e e c b e n h anc e m e n t i s toi mprov e t h e s p e e c h s i gna l qua l i t y,a n d i m p rov e t h e a rt i c u l a t i onand int e l l i gi b i l i t y inp r a ct ical app l i cati on p 代 沁 e s si n g , the s i gna l s are n o s t e ady,es p ecia l l y for t h e 印 e e chs i gnals e ct i o n w h i chare s t ri ctno s t e a d y,t h e d e ta i i fe a t u re s w er e b l u rr e d b y u s i n gtr a d i t i o n alm et h o ds. thew ave l e tt rans fo r m whi ch h aveth echar act e ro f t i m e 一 freq u e n c y l ocal 说 a t i on and th e n atureo f t hem u l t i p l e r e sol u t i on r a t i o s ana l y s i s p r 0 v i d e ane ffect iv e t 0 0 l fo r abo v e p r o b 1 e m s . the wav e l e t t ra n s fo rm can d e c o m pos e s p e e c bs i gna l b yth em u l t i p l escal e s . f b r the cha i a c t ero f the spe ecbs i gna l s a n d rand o mnoi s e s u n d e r d i ffer e n t s c a l e s , soi t sg o o dtoth ed e noi s i n gfo r s p e e c h s i gna l s . 玩t hi s th e s i s , s p e e chs i gna l s e nha n c e m e n t m e th o dsare s tu d i edb as e o n wavel e t 打 月 。 二 场而 a ti o n . ( 1 ) the th e s i s m a 1 ul y i n t r odu ces m e th o d s for s p e e c hs i gnals c nhancem e n t and ana l yse sth e iradv anta ge andw c a k n e s s , c nvi s a g e sthe b a s i ct h cori es o f 、 . a v e l et t r a n s fo n 力 atio n and 叩p l i cat fo n p r o spect inw ave l e t d e n o i s i ng. ( 乃t 五 ew a v e 】 e t den o i s 吨 b asisp r 1 n c i p 1 es an dm e th odsu s in gwav e l etare a n a l ys i s e dands tu d i e 氏the a d v anta g e sandd i s a d v anta geso ft h es em e t h o d sare 5 , , mmn 行 z e d . (3 ) ma inly s t u d i e s 山 r e s h o l d fun c t i o n int h e w avel e t t h r e s hol d den o i s 1 n g . inthe w ave l e t t hre s hol d fun ct io n , t o s o lv e the in s u ffici e n c y ofth e softand h a r d th r e s hol d , a nov e l t h r e s hol d fu n c t l o n i s p ro pos e 氏a n d t heanal ysi s and d e ri v a t i o n are p r e s e n te d . (4 ) s peci al l ym odi fi e s t h es e l ect o f t h r e s h o l d , whi ch are linpon a n t for the w ave l c t d e noi s in g . wit h ne卿an一 p e a r s o n c ri t erionand c h a r a c t ero f s pee c h s i gna l s , a nov e l w ave l ets p e e c b dsnoi s i n g m e t b 0 d b as e d 0 n th e e n e rg y cel l a n d llewt h r e s h of d rul e i s p r o pos e d in面s t h esi s . k e y w o rd: w台 v e l e t t r a n s format i o n ; s p e eehe nha n eem e n t ; t h r e s h o l dfun c 6 o n ; e n e rgy cel l ; n e y m a n 一 p e arso n c r i t e ri o n 学位论文独创性声明 学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他 人已 经 发 表 或 撰 写 过的 研究 成果 , 也 不 包 含 为 获 得 南昌大学 或 其 他 教 育 机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的 任何 贡献均已在论文中作了明确的说明并表示谢意。 学 位 论 文 作 者 签 名 (手 写 ,:协雨签 字 日 期 : 伽 7 年 ” 价 学位论文版权使用授权书 本学 位论文作者完 全了解南昌大学有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅 和借阅。 本人授权南易大学可以 将学位论文的全部或部分内 容编入有关数据库 进行检索, 可以 采用影印、缩印或扫描等复制手段保存、 汇编学 位论 文。 ( 保密的学位论文在解密后适用本授权书) 学 位 论 文 作 者 签 “ 手 “ ,蓬 苏 雨 签 字 日 期 :” 7 年 ” t石 日 导师签名 ( 手写) : 外 必 签字日期: 坷 年 右 ” 和 学位论文作者毕业后去向: 工作单位: 通讯地址 : 电话: 邮编: 第 1 章 绪论 第 1 章绪论 l l概述 语音是人类相互之间进行交流时 使用最多、 最自 然、 最基本也是最重要的 信息 载体。 在实际环境中, 语音信号总是会受到外界环境噪声的干扰,这些噪 声 包括从周围环境、 传输媒质中引入的噪声、通信设备内 部电噪声、 乃至其他 说话人的千扰等等。 这些千扰会使接收端的语音成为受噪声污染的 语音,当噪 声干扰严重时, 语音将完 全淹没到噪声中,使其无法分辨。 语音增强是解决噪声污染的一种有效方法,它是从带噪语音信号中提取尽 可能纯净的原始语音。 总的来说语音增强的目 标11 主要有: 改 进语音质量, 消除 背景噪声, 使听 者乐 于接受, 不感觉疲劳;提高 语音可 懂度,方便听者理解。 在实际需求的 推动下, 早在60年代语音增强 这个课题就引 起人们的注意, 此后40 年人们一直锲而不舍地进行这方面的研究。随着数字信号理论的成熟, 70 年代曾形成一个理论高潮,取得了一些基础性成果,并使语音增强发展成为 语音信号处理的一个重要分支。 进入 80 年代后,刀 改 尸 技术的发展和成熟为语音 增强的实时实现提供了可能。 语音增强不但与语音信号数字处理理论有关,而且涉及到人的 听觉感知和 语音学范畴。但由于噪声来源众多,随着应用场合而异,它们的特性也各不相 同,即使在实验室仿真条 件下,也难以找到一种通用的 语音增强算法,能适用 于各种噪声 环境,因 此必须根据不同的噪音,采取特定的 语音 增强策略来降低 噪 音 11 。 l z语音和噪声的特性 语音增强不仅涉及传统信号处理理论,而且与语音特性,人耳感知特性密 切相关;同时由于实际应用中噪声的来源及种类各不相同,从而造成处理方法 的多样性。因此要结合语音特性、人耳感知特性及噪声特性,根据实际 情况选 用合 适的 语 音 增强 方 法 111 12 。 第 1 章 绪论 l 2. 1语音特性 语音信号是一种非平稳、时变的随机过程,其产生过程与发声器官的运动 紧密相关。但发声器官的状态变化速度比声音振动的速度要缓慢得多,因此语 音信号可以 认为是 短时 平稳的。 在一段短时间内 ( 10 3 0ms) 其 特性基本保持 不变 即相对稳定,从而可以应用平稳随机过程的分析方法来处理语音信号,并可以 在语音增强中利用短时频谱的平稳特性. 语音信号分为清音和浊音两大类,两.者在语音产生机理上和特征上有明显 的差异.比如浊音在时域上有明显的周期性和较强的振幅,其能量大部分集中 在低频域内, 在频谱上表现出 共振峰结构:而清音没有明显的时域和频域特征, 波形类似于白噪声并有较弱的振幅。在语音增强中,可以利用浊音的准周期性 特征,采用梳状滤波器提取语音分量或者抑制非语音信号,而清音则难以与宽 带噪声区分。 l 2. 2人耳感知特性 语音增强效果的最终度量是人耳的主观感受,所以在语音增强中可以利用 人耳感知特性来减少运算代价。目前己有如下一些有用的结论可应用于语音增 强:人耳对语音的感知主要是通过语音信号频谱分量幅度获取的,对各分量相 位则不敏感;人耳对频谱分量强度的感受是频率与能谱的二元函数,响度与频 谱幅度的对数成正比:人耳有掩蔽效应,即强信号对弱信号有掩盖的抑制作用, 掩蔽的程度是声音强度与频率的二元函数,对频率的临近分量的掩蔽要比 频差 大的分量有效的多;人耳还可以在两个人以上的讲话环境中分辨出所需要的声 音等等。 l z j噪声特性 根据输入语音信号的关系,噪声可以分为加性噪声和非加性噪声两类。对 于非加性噪声,有些可以通过变换转变为加性噪声。例如,乘性噪声可以通过 同态变换转换为加性噪声。某些与信号相关的量化噪声也可以通过伪随机噪声 扰动的方法转换成与信号独立的加性噪声。加性噪声通常分为周期性噪声、脉 冲噪声、宽带噪声和同声道语音干扰等。 周期性噪声主要来源于发动机等周期性运转的机械,电气干扰也会引起周 期性噪声。其特点是频谱上有许多离散的、时变的、与语音信号重叠的窄谱峰, 第 1 章 绪论 必须采用自 适应滤波的方法才有可能自 动识别和区分噪声分量。 脉冲噪声来源于爆炸、撞击、放电及突发性干扰等,其特点是时域波形是 类似于冲激函数的窄脉冲,消除这种噪声可以在时域内 进行。 宽带噪声的来源很多,包括风、呼吸噪声和一般地随机噪声源。量化噪声 通常也作为白噪声来处理,也可以视为宽带噪声。由于宽带噪声的语音信号在 时域和频域上完全重叠,因而消除它最为困难,至今所研究地最成功地方法是 利用了某种形式地非线性处理。 同声道语音干扰是多个语音同时在单信道中传输时叠合在一起导致的语音 千扰。其特点是不同语音有基音差别,可以考虑采用语音分离的方法。 i j语音增强方法 由于噪声的种类很多,特性并不完全相同,因此针对各类噪声必须采取不 同的语音增强方法.一直以来,人们都在宽带加性噪声的模型上进行研究,提 出了各种语音增强算法。就目 前来说,语音增强的方法分为三类。第一类是时 域 方法, 例 如基于 参 数和 模型的 方 法l3 l 、 子空间 的 方法151 16 等; 第二 类 是频 域 方 法, 例如 减谱法闭 181 19 、自 适应滤波 法11 0 ,以 及基于马尔 柯夫 模型 滤波方法1111 等;第三类是其它方法,例如小波变换法、听觉掩蔽法等。以下对这几类方法 进行简单介绍和分析。 1 3.l时域方法 基于参数和模型的方法 基于 参 数和 模型的 方 法 通常 有 两大 类11 21 : 分析 合成 法和 利 用滤波 器 进行 滤 波处理的方法。前者是把声道模型看作一个全极点滤波器,采用线性预测分析 得到滤波器的参数。 通过从带噪语音中准确估计模型的参数来合成干净的语音, 这种方法关键在于如何从带噪语音中 准确地估计语音模型的参数 ( 包括激励参 数和声道参数) 。后者则是考虑到激励参数难以准确估计,采用只利用声道参数 构造滤波器进行滤波处理。而在低信噪比下,很难对模型参数进行准确估计, 并且此类方法往往因需要迭代而增加算法的复杂度。在实际应用中有时也会把 两者合并在一起相互补充。具体来说主要有以 下几种方法。 ( 1 )最大后验概率估计法 最大后验概率估计法则是把语音看作一个全极点的模型,首先依据最大后 第 1 章 绪论 验概率准则估计lp c线性预测参数,然后根据lp c参数的功率谱来构造一个非 因果的维纳滤波器对带噪语音信号进行滤波,通过多次迭代直到满足预先设定 的闷值为止。此种算法适用于高斯白噪声。 它在一定程度上能消除噪声,提高信噪比。但是由于维纳滤波器只能在平 稳条件下才能保证最小均方误差意义下的最优估计,而语音和背景噪音的非平 稳性,会导致最优估计的误差。而且采用维纳滤波也没有完全利 用语音的生成 模型。同时每次的迭代过程在不同程度上降低了声道谱的共振峰宽度 ,其位置 也出现抖动,从而使得增强后的语音带有不悦耳的声音。 ( 2 )卡尔曼滤波法131 卡尔曼滤波在一定程度上可以 弥补维纳滤波引 起的误差。因为 它是基于语 音生成模型的,且在非平稳条件下也可以保证最小均方误差意义下的最优,适 用于非平稳噪声干扰下的语音增强。卡尔曼滤波通过引入卡尔曼信息,并将要 解决的滤波与预测的混合问题转化为纯滤波和纯预测两个独立的问题来考虑进 行语音增强,卡尔曼滤波的优点是噪声在平稳和非平稳情况下都能使用,能在 不同程度上消除噪声, 提高信噪比。 而其缺点是方法计算量大; 需要假设lpc生 成模型的激励源为白 噪声 源且只在清音段才成立; 主观试听发现该方法 对语音 造成了一定的损伤。 (3) 梳状滤波器法111 根据语音信号浊音段有明显周期性的特点,可采用梳状滤波器来提取语音 分量,抑制噪声.梳状滤波器的输出信号是输入信号的延时加权和的平均值, 当 延时与 信号的基音周期一致时,这个平均过程使周期性分量加强, 而非周期 分量或周期不同于信号的其他周期分量被抑制或消除.这种方法的关键是要准 确估计出语音信号的基音周期.在基音变化的过渡段和强噪声背景千扰下无法 精确估计时,这种方法的 应用受到限制。 这种方法一般也只 适用于平稳的非白 噪声。 2 .子空间的方法 在子空间法中, 大量实验表明,语音矢量的协方差阵 有很多零特征值,这 说明干净语音信号矢量的能量只分布在它对应空间的某个子集中。而噪声的方 差通常都假设已知、且严格正定,这说明噪声矢量存在于整个带噪信号张成的 空间中。因此带噪语音信号的矢量空间可以认为由 一个信号与加噪声的 子空间 和一个纯噪声子空间构成。 第 1 章 绪论 子空间法就是将带噪声语音信号分解为正交的信号 加噪声子空间和纯噪声 子空间,对纯净语音信号的估计可以 将噪声子空间中的 信号舍弃,只保留 信号 子空间中的信号,来预测干净的语音来达到降噪的目的。子空间法的优点是有 效地去除带噪语音中 的背景噪声, 使语音的质量和可懂度都有较大的提高, 但 是计算量较大,因此在快速计算中该方法需要进一步研究。 1 3 .2频域方法 由于语音信号的短时谱具有较强的相关性,而噪声的前后相关性很弱,因 此可以 利用短时谱估计的方法从带噪 语音中估计原始语 音。同于人耳对语音相 位感受不敏感 ,可将估计的对象放在短时谱的幅度上。典型的方法有谱减法、 维纳滤波法、短时谱幅度的mms e估计法、自适应滤波法等。 1 、减谱法 谱减法是在假定加性噪声与短时平稳的语音信号相互独立的条件下,从带 噪语音的功率谱中减去噪声功率谱, 从而得到较为“ 纯净” 的语音频谱。 它的优点 是运算量小,容易实时实现, 增强效果也较好。但是也存在一定的缺陷, 谱减 法是一种最大似然估计,没有对语音频谱的分布进行假设,而语音频谱分量的 幅度对人耳的听觉是 最重 要的。因此谱减法进行增强处理后, 会带来音乐噪声, 不仅使听者在听觉效果上产生一定的干扰影响,还影响后续处理, 如语音编码 等。特别对于快速变化的语音,传统谱减法无法迅速跟上处理。 2 、 维纳滤波法 维纳滤波法是在最小均方准则下实现对语音信号估计的一种滤波器。对于 带噪语音信号,确定滤波器的冲激响应,使得带噪语音信号经过该滤波器后得 到最接近于“ 纯净” 的语音信号。 采用维纳滤波的 好处是增强后的残留 噪声类似于白 噪声,而不是有节奏起 伏的音乐噪声。维纳滤波是平稳条件下时域波形的最小均方误差准则估计。由 于没有考虑到语音频谱分量的幅度对人的听觉最重要,因此采用维纳滤波来增 强语音存在一定的缺陷. 3 、 短时 谱幅度的 最小均方误差 ( m m s e) 估计法 针对特定的失真准则和后验概率不敏感的估计方法,利用 已知的噪声功率 谱信息,从带噪语音短时谱中估计出“ 纯净” 语音短时谱,达到语音增强的目的。 对于语音短时谱幅度的分布,通常通过两种途径解决:一是假设一个合理的概 第 1 章 绪论 率分布模型;另一个则是通过实际统计的方法去获得.为此,假设语音频谱分 布为高斯分布,并在此假设下推导mms e估计公式,然后讨论实际分布情况。 另外,可以利用相邻帧间频率点信息的相关性,对当前帧频率点的频谱幅度值 进行估计,这就是基于帧间频谱分布约束的m ms e 估计方法。又因为人耳对声 音强度的感受是与谱幅度的对数成正比的,因此在处理语音谱幅度时,采用对 数失真准则更为适合一些。为此,将上述mms e 估计式进行推广,得到频域分 布约束下的短时对数谱的m m s e 估计。 短时谱幅度的m ms e估计在降噪和提高语音可懂度方面进行了折衷,适用 信噪比的范围较广,但是计算量较大,而且语音频谱的先验分布获得在很大程 度上要取决于统计结果的代表性、重现性等。 4 、自 适应滤波器法 以均方误差或方差最小为准则,对噪声信号进行最优估计,然后从带噪语 音中减去噪声达到降噪,提高信噪比,增强语音的目的。当输入信号的统计特 性未知,或者输入信号的统计特性变化时,自适应滤波器能够自 动地迭代调节 自身的滤波器参数,以满足某种准则的要求,从而实现最优滤波。因此,自适 应滤波器具有“ 自我调节” 和“ 跟踪, , 能力。 此方法的关键是如何得到带噪语音中的噪声。在多声道采集系统中,两个 话筒间要有一定的距离,因而实时采集的两路信号的噪声不同,而且还受到回 声及其他可变衰减特性的影响。在用单声道系统来采集带噪语音时,必须在语 音间歇期间利用采集到的噪声进行估值, 如果噪声是非平稳的,会严重影响语 音的增强效果。此外另一个缺点是增强后的语音中含有明显的“ 音乐噪声,o 5 、隐马尔可夫模型法 可以采用基于状态空间的变换方法,对不同类别的语音和噪声信号建立不 同的模型。隐马尔可夫模型的各个状态可以对带噪信号、噪声信号所有不同的 区域进行充分的建模,将带噪信号中的噪声信号部分去除就可得到语音的增强。 甚至于在只有带噪信号的情况下,利用隐马尔可夫模型对状态转移概率进行建 模,将可能为噪声的信号部分滤除,就可以做到语音增强。但是这种方法,在 只有带噪信号的情况下要正确分类,准确估计噪声有会一定的误差。 i j j其它方法 随着信号处理的理论和技术不断发展完善,涌现出许多的新方法,如小波 第 1 章 绪论 变 换 1 ,3 11, 4 1 、 神 经 网 络 1 5 1 、 听 觉 掩 蔽 1 61 、 分 形 理 论 1切 等. 1 、小波变换 小波变换是一种多尺度的时频信号分析方法。小波变换能将信号在多个尺 度上进行小波分解,各尺度上分解所得的小波变换系数代表原信号在不同分辨 率上的信息。利用信号和随机噪声在不同尺度的特性关系,进行信号的去噪处 理。小波去噪法主要有小波模极大值去噪法、基于小波系数尺度间相关性的去 噪法、小波阐值去噪法。 小波模极大值去噪法是随着尺度的增大, 信号和噪声所对应的模极大值分 别是增大和减小,经过若干次小波变换后,由噪声对应的模极大值已基本剔除 或幅值很小,而保留了信号所对应的模极大值点,然后利用剩余的模极大值点 进行重构小波系数,进而恢复信号。此方法有很好的理论保证,去噪性能非常 稳定,它对噪声的依赖性较小,无需知道噪声的方差。而它的缺点是算法复杂、 计算量大。 基于小波系数尺度间相关性的去噪法是对带噪信号进行小波变换后,其小 波系数在各尺度上有较强的相关性,尤其是在信号的边缘附近,其相关性更加 明显,而噪声对应的小波系统在尺度间却没有这种明显的相关性,利用这个特 性进行取舍,然后直接重构信号。该方法在对带噪信号进行去噪有较好的去噪 效果,而且实现原理也较简单。但其计算量较大,需要进行迭代,还需估计噪 声方差。 小波阐值法是把带噪信号经小波变换,认为信号对应的小波系数包含信号 的重要信息,其幅值较大,但数目 较少,而噪声对应的小波系数是一致分布的, 个数较多, 但幅值较小。 通过在不同 尺度上选取合适的闽值,并将小于该阐值 的小波系数置零,而保留大于闲值的小波系数,最后进行小波逆变换,得到去 噪后的重构信号。该方法是实现简单,计算量较小,应用很广泛。但其阐值的 选取比较困难。 2 、 神经网 络 语音增强在一定意义上也是一种说话人区分问题,只不过所区分的是在背 景中的噪声,因此可以利用人工神经网络来实现语音的增强。假设测试语音和 噪声环境的分布保持不变且与训练时相同,利用带噪语音和干挣的目标语音分 别进行训练,得到合适的预测神经元模型,构造可以对语音和噪声进行分类的 分类器,对当前语音信号进行最佳匹配,来实现语音增强。 第 1 章 绪论 3 、听觉掩蔽 听觉掩蔽法是利用人耳的听觉特性的一种增强算法。人耳能够掩蔽语音信 号中能量较小的噪声信号,使得这部分噪声不为人所感知到。听觉掩蔽模型常 与语音增强算法结合实现去噪,其实现过程为:首先基于一种语音增强方法对 语音信号进行粗估计,再由语音信号粗估计计算出听觉的掩蔽阐值,根据听觉 掩蔽阐值和噪声参数的估值,结合相应的增强算法计算出增益,并依此估计出 纯净语音。这种方法在消噪的同时可以减少不必要的语音失真。但由于噪声掩 蔽闽值是在纯净语音基础上得到的,在实际中常只能用带噪语音来估计掩蔽阐 值,这样估计的结果误差较大。 4 、分形理论 语音与噪声具有不同的混沌和分形特性,因此可将分形维数用于语音增强。 根据分形结构的语音信号在一定的尺度范围内具有等价标度不变性,导出带噪 语音信号的真实分形维数的计算方法,利用分形维数内插方法计算出信号的维 数.根据它们之间的差值进行对重构的阐值和位置自 适应控制,实现语音信号 与噪声的分离。既抑制了噪声,又减少了语音段的信息的损失,提高了信噪比。 l 4语音增强的意义 在许多情况下,我们所关心的语音信号常常会被其它信号所污染,即在我 们所关心的语音信号中掺杂着噪音,千扰了我们的听辨。这对我们听出语音信 号中的有用信息带来了很大的困难,在不少领域影响了人们的工作效果,这就 需要语音增强。因此,语音增强在语音处理系统、通信、多媒体技术、数字化 家电等领域得到了越来越广泛的应用,例如: 语音识别前端上的应用。语音识别是通过对所接受到的语音信号进行处 理,提取相应的特征或建立相应的模型,然后据此做出判别。通常在实验室环 境下,工作良 好的识别器在带噪的情况下性能会明显下降,所以必须采取语音 增强技术。 语音编码上的应用。语音编码技术是随着语音的数字化而产生的,目 前 主要应用在数字语音通信和数字语音存储两个领域。但这两种情况都需要在无 噪声情况下进行,所以也需要对语音进行预处理,即:对输入语音进行语音增 强后再进行语音编码。 第 1 章 绪论 军事、医疗等领域的应用。例如助听器里不但需要放大电路,同样,也 要求放大后的声音清晰、无噪。但放大后的声音不仅有环境噪声,而且由于放 大电路产生噪声,所以需要在助听器里采用语音增强技术。军事上需要对敌方 的情况进行监听时,由于噪声可能会大于所采集到的有用信息,同样需要进行 语音增强。 通信、网络等领域的应用。由于计算机和因特网以 惊人的速度和规模渗 透到社会的各个领域,许多应用要求简单、自 然、友善的人机界面, 而语音就 成为一种理想的人机信息交流手段, 用计算机进行交流时需要从带噪语音中提 取尽可能纯净的语音信号。 总而言之, 在现实生活中,语音增强处理的意义很大,它能帮助我们解决 很多问题。找到有效的语音增强方法将对不少领域里的工作产生积极的影响。 本论文就是公安部“ 基于小波变换和人工神经网络的语音增强系统” 的子项目。 l s小波理论的发展和应用: 任何理论的提出和发现都有一个漫长的准备过程, 小波理论也不例外。 1 910 年,h arr提出了 小波规范正交基, 这是最早的小波基。1 9 36年,ul e w o o d 等人 对傅立叶级数建立了二进制频率分量分组理论,对频率进行划分,傅立叶变换 的相位变化并不影响函数的大小,这也是多分辨率分析思想的最早来源。1946 年,g abor提出了加窗傅立叶变换理论,使得对信号的表示具有时一 频局部化的 性质。 人们真正开始研究小波是在八十年代,1 9 81年mor let在分析地质数据时, 基于群论首先提出了 小波分析这一概念。1 9 84年,gros sman和m o rlet 首次提出 了小波的概念, 给出了一个按确定函 数的 伸缩平移系展开的系统理论和进行信 号表示的 新思想. 1 9 85年, meye r 证明了 一维小 波的 存在性, 并首次 提出了 光滑 的小 波正 交基, 后被称为m ey er 基。 1 9 86年,m a uat和m e y e r 提出了 多分辨率分 析的理论框架,为正交小波基的构造提供了一般途径,多分辨率分析是小波理 论的核心,统一了在此之前提出的各种具体小波的构造方法。此后,人们构造 也了大量的小波, 其中包括具有指数衰减的b at tle一 玫m a r l e 小波和双正交小波等, 比较引人注目的是,1 9 88年,d auhechi es构造了一类具有紧支集的有限光滑正 交小波函数。 1 9 89年,m al 城提出了实现小波变换的快速算法一m al 城算法, 它 的地位相当于f f t 之于傅立叶变换. 1 9 92年,go有 加a 。 和wic k e r h aus er等人通过 第 1 章 绪论 对某小波函数进行伸缩、 平移和调制运算, 提出了小波包的概念, 并将m al 恤算 法进一步深化,得到了小波包理论。 小波变换的应用是与小波变换的理论研究紧密结合在一起的,现在己在科 技信息产业领域取得了令人注目的成就。电子信息技术的重要方面是信号与图 像处理,而信号处理己 成为当代科学技术工作的重要部分。现在,对于信号去 噪方法的研究是信号处理中一个永恒的话题。对于性质随时间稳定不变的信号, 处理的理想工具仍然是傅立叶变换,传统的去噪方法是在短时平稳假定的基础 上,采用固定窗傅里叶变换,时一 频分辨率均是固定不变的。但实际应用中的信 号都是非稳定的,对于瞬间信号、宽带噪声信号、非平稳信号等,采用传统方 法具有一定的局限性。 特别对某些“ 严格非平稳” 的语音段 ( 如爆破音和塞擦音 等) ,传统方法模糊了语音的细节特征, 80年代中后期成熟并发展起来的小波理 论由于具有时一 频局部化的特点及小波函数选择的灵活性,为解决这一问题提供 了有力的工具,小波变换能将语音信号在多个尺度上进行小波分解,各尺度上 分解所得的小波系数代表原信号在不同分辨率上的信息。由于信号和随机噪声 在不同尺度的特性关系,利用这种特性进行信号的去噪处理,并取得较好的效 果。 l 6本文的主要内容和结构安排 本文基于小波理论,对语音信号的去噪方法进行了分析和研究。本论文的 主要工作包括以下几个方面: ( 1) 综述目 前一些主要的语音增强方法,分析各种方法的优缺点,展望了 小波理论的发展和去噪方面的应用前景。 (2)对小波去噪的基本原理和小波去噪方法进行了分析、研究和总结。 ( 3 )对小波阐值去噪法中阐值函数进行了改进。针对软、硬闽值函数的不 足,提出了新的闽值函数,对新闽值函数进行分析和推导,并进行了仿真实验。 ( 4) 对小波阐值去噪的重要环节闭值选取规则进行了研究和探讨。根据 万 即 功 an一 pea rson 准则, 针 对 语 音信号的 特点 , 本文 给出 了 一 种基 于 能 量元 和新 阐值规则的小波语音去噪法,并对其进行仿真实验。 本文的结构安排如下: 第一章绪论 第 1 章 绪论 首先对语音增强进行概述,然后在语音和噪声特性的基础上,对语音增强 方法进行分类讨论,分析了各种方法的优缺点以及语音增强的意义,最后介绍 了小波理论的发展和在去噪上的应用。 第二章小波变换基础 首先介绍傅立叶变换、短时傅立叶变换、小波变换的概念,和小波变换的 特点,然后介绍连续小波变换和离散小波变换,紧接着从理想滤波器组和函数 空间的划分入手,来介绍多分辨率分析理论以及二尺度差分方程、多采样滤波 器组、mal la t 算法.最后介绍了常用的一些小波函数。 第三章小波去噪的方法 首先介绍了小波去噪的基本原理,并对小波去噪方法进行了分析,总结。 然后主要对小波阐值去噪方法进行了研究,针对硬阐值和软阐值函数的不足, 提出了一种新的阐值函数。 第四章基于能量元和新阐值规则的小波语音去噪法 针对阐值选取规则这个小波阐值去噪的重要环节进行了 研究,我们针对语 音信号的特点,给出了一种基于能量元和新阐值规则的小波语音去噪方法。 第五章结论与展望 对本文的工作进行了总结,并对进一步工作的方向进行了展望。 第2 章小波变换基础理论 第2 章小波变换基础理论 小波变换是近年来发展起来的一种新的时一 频分析方法。在传统的傅立叶变 换中,信号完全是在频域展开的,不包含任何时域的信息,但是丢弃的时域信 息可能对某些应用同样非常重要,所以人们对傅立叶变换进行了推广,提出了 很多能表征时域和频域信息的信号分析方法,如短时傅立叶变换、小波变换等。 其中短时傅立叶变换是在傅立叶变换基础上引入时域信息,其基本假定在一定 的时间窗内信号都是平稳的,通过分割时间窗,在每个时间窗内把信号展开到 频域就可以获得局部的频域信息,但它的时域区分度仅依赖于大小不变的时间 窗,即短时傅立叶变换只能在一个分辨率上进行。 小波变换克服了短时傅立叶变换在单分辨率上的缺陷,具有多分辨率分析 的特点,在时域和频域都有表征信号局部信息的能力,时间窗和频率窗都可以 根据信号的具体形态动态调整。在一般情况下,在低频部分可以用较低的时间 分辨率,而提高频率的分辨率,在高频情况下可以用较高的频率分辨率来换取 精确的时间定位。因为这些特点,小波变换可以探测正常信号中的瞬态成分, 并展示其频率成分,被誉为数学显微镜,广泛应用于各个时频分析领域。 l)刀 (2口 2. 1从傅立叶变换到小波变换 傅 里 叶 变 换由 下 列 公 式 定 义 118 】 : 正变换 j ( 。 ) 一 厂厂 (t 神 一沁 山 逆变换 了 (t) 一 牛厂 广 ( 。 分 , dt 乙几 j一 田 从傅里叶变换的公式中可以看出,傅里叶变换的积分域是整个时间轴,故 信号的局部化被分散到了整个时间轴,致使它所得到的频谱只能反映信号在整 个时间范围内的频率分析,而无法给出局部信号的频率特性,因此傅里叶变换 没有时一 频局部化功能, 它仅是分析平稳信号最重要的工具。 然而在实际应用中, 所遇到的信号大多数并不是平稳的,至少在观测的全部时间段内它不是平稳的, 第2 章小波变换基础理论 所以随着应用范围的逐步扩大,理论分析进入了不断深入的 研究。 为了克服傅立叶变换的局限性, 使其对非平稳信号也能做较好的分析, 通过 对信号 在时 域 上加 一 个窗函 数9 (t 一 d, 使其 对 信号f (t)进 行乘积 运算, 以 实 现 在r 附近的加窗和平移, 再对加窗的信号进行傅立叶分析, 这就是短时傅立叶变 换,或者称为加窗傅立叶变换。 短时 傅立叶 变换的定义为 1 习 : 5 了 (“ , 卜 石f (t) 9 (t 一 r 一 ” dt ( 2 . 3 ) 其中 ,窗口函 数9 (t)一般取为光滑的 低通函数, 保证9 (t 一 灼只在r 的附 近 非零, 在其余处迅速减掉。 这样, 短时傅立叶变换就在r 点附近局部地测量了频 率分量口的幅度值, 得到信号在t . 二 时刻附近的频率信息。 如果选取的窗口函数在时域和频域都具有良好的局部性质,此时短时傅立 叶变换能够同时在频域和时域内提取关于信号的精确信息。但短时傅立叶变换 也存在其固 有的 局限 性, 其时间频率窗口 是固定不变的, 一旦窗口 函 数9 (t)选定, 其时频分辨率也就确定了, 并且不随频率口和时间丁 而变化。也就是说, 它对所 有的 频 率都 使用同 样的 窗口 。由heis en be rg测不准原 理可 知, 短时 傅 立叶 变 换 不可能在时间和频率上均有任意高的分辨率,因为时间和频率的最高分辨率受 下式的制约: 。 . 对于高频谱的信息,时间间隔要 相对地小,以 给出 较高的精度; 对于低频谱的信息,时间间隔要相对地宽,以 给出 完全的 信息。 换句话说,重要的是要有一个灵活可变的时间 频率窗,能够 在 “ 高中心频率”时自 动变窄,而在 “ 低中心频率”时自 动变宽。 而小波便是 为此而设计的。 设f (t ) 是 平 方 可 积函 数, 记 作如 果f (t)e 尸 (r) , 砂 (t)为 母小 波, 如 果势 (t)满 足容许性条件1191 第 2 章小波变换基础理论 1 叨 ( 。 ) 2 田 d田 + 00 ( 2 .5 ) 则小波变换定义为: wf (a, 小 (, 叭 ) 一 厂 (t) 岩 , 牟冲 (2. 6) 变换的核函数为: 、 , (t) 一 熹, 些) ,。 , 仪 , 。 v l al 、 u / (2.乃 其中, 沪 (t ) 称为基小波或母小波, 它一般是时域上以 t 。 为中 心的带通函数, 在时域和频域都具有局部化,且均值为零,即 .s)9) (2(z. 厂 , (t 冲 一 “ 另外,小波变换还可写成卷积形式 wf (a, b) 二 (+ 了 (t) 李训 (些冲 一 f * 诃 (0) j 一va召 其 中 , 而 卜 分(一 :)o 小波变换的特点 小 波变换的 作用粗略地看来: 用镜头 观察目 标了 (t) ( 也就是 要分 析的 信 号) ,叨 (t)代表镜头所起的 作用,b 相当 于使镜头相对于目 标平行 移动,a 相当 于镜头向目 标推进或远离.具有多分辨率的特点,可以由粗及精的逐步观察信 号, 也可以 看成是用基本频率 特性为势 (t)的 带通滤波 器在不同 尺度a 下 对信号作 滤 波 匆 112 1 1 。 若 劝 ( 。 ) 的 频 率中 心 是残, 带 宽 是 。 , 定 义 q二 八 。 / 几二 带宽 / 中 心频 率(2 j o) 为 母 小 波 , (t ) 的 品 质 因 数 , 不 论 。 为 何 值 。 , 。 , , (与 始 终 保 持 了 和 , (t) 具 有相同的品质因数.恒q 性质是小波变换的一个重要性质, 这也是它区别于其 它类型的 变 换且 被广泛 应用的 一个重要原因, 而且说明了 势 ( 卿和势 (a 卿的 带宽 第2 章小波变换基础理论 及中心频率随a 变化的情况。 叫0 ) , 甲伍 0) 、甲伍0) 、 。 1 2 衬 ( a ) 口 2 。 护 图2 . 1平(a 9 ) 随a 变 化的 说 明 o一 一1 ,( b )口一2, o ( c )口一1 / 2 图 2. 1 为劝 (a q ) 和a 变化图, 对应a 取值分别为1 、 1 /2 、 2 。 我们可以 看出 小 波变换在对 信号 分析时 有如下特点: 当a 变小时, 对了 (t)的 时 域观察范围 变窄, 但对劝 ( q ) 在频率观察的范围 变宽, 且观察的中 心频 率向高 频处 移动, 如图 2. 2 a 1 12时 情况. 反之,当a 变大时, 对f (t)的时 域观察范围 变宽,频域的观察范围变窄, 而且分析的中心频率向 低频处移动,如图2 .2 a . 2 时情况.将时一 频的关系结合在一起,我们可得到在不同尺度下小波变换所分析 的时宽、带宽、时间 和频率中心的关系,如图2. 2 所示。 尸 加= 1 1 2) 2 q 舀 (a= 1)鸟 (a= 2) 端1 2 图2 . 2日 取不同值时小波变换对信号分析的时一频区间 由 于小波变换的 恒q 性质,因此在不同尺度下,时频区间的 面积保持不变。 由此我们看到,小波变换为我们提供了一个在时、频平面上可调的分析窗口。 该分析窗口 在高 频 端( 图 2 .2 中2 几处) 的 频 率分辨率不好( 矩形窗 的 频率 边变 长) , 但时 域的 分辨 率 变 好( 矩形的 时间 边 变短) ; 反 之, 在低 频端( 图 2. 2 中几/2 处) ,频率分辨变好,而时域分辨率变差。 但在不同的a 值下,图2. 2 中分析窗的 面积保持不变,也即时一 频分辨率可以随着分析任务的需要做出调整。 第2 章小波变换基础理论 众所周知,信号中的高频成分往往对应时域中的快变成分,如陡峭的前沿、 后沿、尖脉冲等。对这一类信号分析时,则要求时域分辨率要好,以适应快变 成分间隔短的需要,对频域的分辨率则可以放宽,当然,时一 频的分析窗也应处 在高频端的位置。与此相反,低频信号往往对应是信号中的慢变成份,对这类 信号分析时一般希望频率的分辨率要好,而时间的分辨率可以放宽,同时分析 的中心频率也应移到低频处。显然,小波变换的特点可以自 动满足这些客观实 际的需要。 当我们用较小的尺度因子对信号作高频分析时,我们实际上是用高频小波 对信号作细致观察;当我们用较大的尺度因子对信号作低频分析时,实际上是 用低频小波对信号作概貌观察。如上面所述,小波变换的这一特点既符合对信 号作实际分析时的规律, 也符合人们的视觉特点。 适当地选择基本小波来使功 (t) 在时 域上为有限 支撑, 势 ( 。 ) 在频域上也比 较集中, 便可以 使小 波变换在时 一 频两 域都具有表征信号局部特征的能力,因此有利于检测信号的瞬态或奇异点。 综上所述,由于小波变换具有恒q 性质及自 动调节对信号分析的时宽 / 带宽 等一系列 突出 优点,因 此被人们称为信号分 析的 “ 数学显 微 镜” 20 。 2. 2连续小波变换 对 任 意 连 续 函 数 或 信 号了 (t)进 行小 波 变 换, 如 果 基函 数 汽, (t)的 两 个参 数a 和b 均为 连续 变量, 则被称为 连续小 波变换 118 10 连续小波变换的形式可以写为: wf (a, 。 一 厂 , (t) 分 牟冲 (2. 1 1 ) 只 要小波势 (t)满足容许性条件(2 .5 ) , 则连续小波 变换的 逆变换存在, 形式如 下: (t) 一 汀厂 知和 ,蜘 。 (tw “ ( 2 . 1 2 ) 也就是说,这时可根据信号的小波系数精确地恢复原信号。 第 2 章小波变换基础理论 z j离散小波变换 2 3 .1离散小波变换 在实际应用中, 连续小波必须离散化。因此, 有必要讨论离散小波变换。 这 里 是 指 将 连 续 小 波叭力 (t)和 连 续 小 波 变 换可(a , b)离 散 化。 在连续小 波中, 考虑式 (z .5 ) , 劝是容许的, 在离散化时, 总是限制a 取正 值, 这样离散小波变换的容许条件就变为: 马 一 f 1 望 鱼止面 、 ao (2. 1 3 ) 通常, a 叫, b 把连续小波变换中尺度参数a 和平移参数b离散化,公式分别取作 kvo司,则 得到离散小 波为: , , (t ) i a 。 1一 , 势 ( a 一 ,卜 战) j ,* 。 2( 2 . 1 叼 从而离散小波变换表示为: 衅 (j, k) ( f, 也 , (t) ) 月 。 !“ 厂f (t 冲 (a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论