(信号与信息处理专业论文)数字基带语音增强算法的研究及sdr实现.pdf_第1页
(信号与信息处理专业论文)数字基带语音增强算法的研究及sdr实现.pdf_第2页
(信号与信息处理专业论文)数字基带语音增强算法的研究及sdr实现.pdf_第3页
(信号与信息处理专业论文)数字基带语音增强算法的研究及sdr实现.pdf_第4页
(信号与信息处理专业论文)数字基带语音增强算法的研究及sdr实现.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(信号与信息处理专业论文)数字基带语音增强算法的研究及sdr实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京邮电大学硕士论文 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所 知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰 写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢 意。 申请学位论 本人签名: 处,本人承担一切相关责任。 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校 攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部 门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅:学校可以公布学位论 文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释:本学位 本人签名: 导师签名: 适用本授权书。 日期: 日期: p | 口i 习。略 邮电大学硕士论文 北京邮电大学硕士论文 数字基带语音增强算法的研究及s d r 实现 摘要 在无线通信系统中,由于传输过程中有噪声的存在,语音信号在 到达接收端时质量都会有不同程度的下降,这种情况严重时甚至会使 通信无法进行。为了提高语音质量,人们采用了多种方法,如语音增 强算法就是其中行之有效的一种。 噪声情况多种多样,到目前为止还没有一种算法可以同时适应所 有情况。本课题基于的软件无线电平台是应用于串行无线通信系统中 的,在该通信环境中,宽带噪声是最常见的一种噪声。因此,本文将 主要针对这种噪声进行处理。 本论文所做的工作主要可以分为两个部分:一、语音增强算法的 理论研究工作和仿真分析;二、语音增强算法在软件无线电( s d r ) 硬件平台上的实时实现。具体内容如下: 第一部分,首先介绍了一些基础性的理论知识,然后是本课题语 音增强算法的整体设计工作:对r m a r t i n 提出并在之后加以改进的一 种基于最小值跟踪的噪声估计算法做了详细的阐述;给出了一种结合 谱减法和听觉掩蔽效应的语音增强算法。最后对该增强算法进行了仿 真和性能评价,结果表明,该算法性能良好。 第二部分,主要分为以下几块内容:首先对本课题软件无线电平 台的搭建情况做了相关介绍,然后就语音增强系统在软件无线电平台 上实现的整体情况以及其中的关键要点做了说明,最后针对本系统做 了简单的优化工作。 关键词:d s p 语音增强软件无线电谱减法听觉掩蔽 京邮电大学硕士论文 北京邮电大学硕士论文 s t u d ya n ds d ri m p l e m e n t 棚o n o fd i g t a lb a s e b a n ds p e e c h e n h a n c e m e n ta l g o r i t h m i nt h ew i r e l e s sc o m m u n i c a t i o ns y s t e m ,t h es p e e c hs i g n a li sc o r r u p t e d a c o u s t i c a l l yb yn o i s eb e t w e e nt h ew a yf r o mt r a n s m i t t e rt or e c e i v e r a sa r e s u l t ,t h eq u a l i t yo fs p e e c hs i g n a li sd e g r a d e dm o r eo rl e s s i ns e v e r e c a s e s ,w ec a n tc o m m u n i c a t ec o m p l e t e l y n u m e r o u sm e t h o d sa t ed e s i g n e d t os o l v et h i sp r o b l e m f o re x a m p l e ,s p e e c he n h a n c e m e n ta l g o r i t h m si sa n e f f e c t i v eo n e n o i s ec h a n g e si nd i f f e r e n ts i t u a t i o n s ,s ow ec a n tf i n dav e r s a t i l e s p e e c he n h a n c e m e n ta l g o r i t h m s t h a tw o r ke f f e c t i v e l yi na l l p r a c t i c a l e n v i r o m e n t t h i st h e s i si sb a s e do ns o f t w a r ed e f i n e dr a d i o ( s d r ) h a r d w a r e p l a t f o r mw h i c ha p p l i e di n s h o r t w a v es e r i a lw i r e l e s sc o m m u n i c a t i o n s y s t e m s ow e f o c u so nf i n d i n gam e t h o dt oe n h a n c es p e e c hc o r r u p t e db y b r o a d b a n dn o i s ew h i c hi sav e r yc o m m o nn o i s ei nt h i sc o m m u n i c a t i o n s y s t e m t h i st h e s i si n c l u d e st w op a r t s :1 t h e o r yr e s e a r c ha n ds i m u l a t i o n w o r k sa b o u ts p e e c he n h a n c e m e n ta l g o r i t h m s 2 c o n s t r u c t i o no fs p e e c h e n h a n c e m e n ts y s t e mb a s e do nt h es d rh a r d w a r ep l a t f o r m f o l l o w i n gi s t h em a i nw o r k : i nt h ef i r s tp a r t ,w ei n t r o d u c es o m eb a s i cp r i n c i p l e s ,t h e ns t u d yt h e n o i s ee s t i m a t i o na l g o r i t h mb a s e do nm i n i m u mt r a c k i n gm e t h o dw h i c h w a sd e s i g n e db yr m a r t i na n di m p r o v e dl a t e l yh i m s e l f f i n a l l y , w eg i v ea s p e e c he n h a n c e m e n ta l g o r i t h mc o m b i n i n gs p e c t r a l s u b t r a c t i o na n d p e r c e p t u a la u d i t o r ym a s k i n ge f f e c t s i m u l a t i o nr e s u l t s h o w st h a tt h i s a l g o r i t h mp r o v i d e sg o o dp e r f o r m a n c e t h es e c o n dp a r td i s c u s s e st h ee s t a b l i s h m e n to ft h es d rh a r d w a r e i e n h a n c e m e n ts y s t e m a t - t i m es y s t e m s o f t w a r ed e f i n e dr a d i o 1 1 语音增强概述。l 1 2 软件无线电概述2 1 3d s p 概述3 1 3 1 数字信号处理( d i g i t a ls i g n a lp r o c e s s i n g ,d s p ) 3 1 3 2 数字信号处理器( d i g i t a ls i g n a lp r o c e s s e r ,d s p ) 3 1 4 论文结构安排5 第二章语音信号处理基础。6 2 1 语音和噪声特性6 2 1 1 语音特性。6 2 1 2 噪声特性7 2 2 常用语音信号处理方法8 2 2 1 防混叠滤波处理8 2 2 2 语音信号的采样处理8 2 2 3 语音信号的重叠相加9 2 2 4 语音信号的加窗处理9 2 2 5 快速傅里叶变换1 0 2 3 本章小结1 0 第三章语音增强系统总体设计1 1 3 1 噪声估计模块设计1 1 3 1 1 最优平滑处理1 2 3 1 2 得出估计噪声。1 4 3 2 语音增强算法模块设计1 6 3 2 1 基本谱减法1 7 3 2 2 语音听觉掩蔽效应1 9 3 2 3 本课题使用的两种改进型谱减法2 2 3 3 语音增强系统总体性能分析。2 4 3 3 1 语音质量评价标准2 4 3 3 2 本课题语音增强算法性能评价2 5 3 4 本章小结2 7 第四章软件无线电平台硬件设计2 8 大学硕上论文 s d r 平台总体结构介绍2 8 d s p 芯片的选择2 8 f p g a 芯片的选择3 0 直接存储器访问( d i r e c tm e m o r ) ra c c e s s ,d m a ) 3 1 多通道缓冲串口( m u l t i - c h a n n e lb u f f e r e ds e r i a lp o r t ,m c b s p ) 3 2 d s p 和f p g a 串口通信系统设计3 4 爿s 章刀、结3 5 基于软件无线电平台的语音增强系统实现。3 6 d s p b i o s 实时操作系统3 6 5 1 1d s p b i o s 总体概述3 6 5 1 2d s p b i o s 的线程管理3 7 5 1 3d s p b i o s 程序开发过程3 7 语音增强算法的软件无线电平台实现。3 8 算法实现的几个关键点4 0 5 3 1 利用乒乓b u f f e r 提高数据操作效率4 0 5 3 2f f f 模块的实现4 1 5 3 3 重叠相加法的d s p 实时实现4 2 5 3 4 系统线程的实时调度4 3 5 3 5 利用d s p b i o s 进行系统配置4 4 5 3 6 算法的定点化4 8 系统自举4 9 本章小结。5 0 系统优化5 1 总结与展望。5 5 参考文献5 6 鸳i 谢。5 9 作者攻读学位期间发表的学术论文目录6 0 北京邮电大学硕士论文 1 1 语音增强概述 第一章绪论 语音是人们最为重要、最为有效、最为常用同时也是最为方便的交换信息的 形式。在无线通信系统中,语音信号在传输过程中,不可避免地要受到诸如路径 衰耗、时间延迟、大气噪声、多径效应、电离层衰落乃至来自其他通信者的干扰 等多种因素的影响,此外,传输系统本身也会产生各种噪声,由此导致在我们在 接收端得到的语音信号己非纯净的原始语音信号,而是受噪声污染的带噪语音信 号。这些噪声的存在不但降低了通信系统中语音质量和语音可懂度,甚至在严重 情况下语音信号有可能会完全淹没到噪声中无法分辨,导致系统性能急剧恶化, 通信无法建立。为了从带噪语音信号中获得尽可能纯净的原始语音信号,消除噪 声的干扰,使语音接收者乐于接受,不感觉疲劳,就必须要采用语音信号处理方 法,语音增强技术就是常用的一种。 另外,由于噪声来源众多,在不同的场合有着不同特点,例如火车站、商业 街等人群聚集的地方都会受到强噪声的干扰;而在远距离通讯( 如军用电台通信, 卫星通信) 中,传送的语音信号会受到信道噪声以及通讯设备自身所产生噪声的 双重干扰,除上述两种情况之外还有其他各种特性迥异的噪声。如何找到一个通 用的语音增强算法同时适应这些不同情况的噪声是一个艰巨的任务,而且语音增 强算法不仅仅与语音信号数字处理理论有关,这其中还涉及到人的生理学特点和 语音学,所以必须针对不同的噪声,采取不同的语音增强方法。 几十年来人们针对如何进行有效的语音增强做了很多不懈的努力和探索,得 出了大量的研究成果。语音增强算法从信号输入的通道数上可以划分为单通道的 语音增强算法与多通道的语音增强算法两种。单通道语音系统在实际应用中较为 常见,如对讲机、电话,手机等设备的通信。在这种情况下,语音与噪声存在于 同一个通道中,语音信息与噪声信息从同一个信号中得到。一般针对这种语音系 统做语音增强处理要求噪声比较平稳,以便在非语音段对噪声进行估计,再依据 估计出的噪声对带噪语音进行处理,如传统的谱减法就是单通道语音增强算法的 典型代表。当语音系统是多通道语音系统时,一般来说,各个语音通道之间都会 存在某些相关性,我们可以利用这些相关性进行语音增强。如在自适应噪声对消 语音增强算法中,输入信号共有两路,分别由两个话筒采集得到,一路采集带噪 语音信号,另一路则负责采集噪声,这种方法将从噪声通道所采集到的信息直接 号都要经过d s p 的处理。软件无线电中的d s p 除了要能适应运算处理的高速度、 高精度、大动态范围、大运算量外,它还应该具有高效率的结构和指令集、较大 的内存容量、较低的功耗等特点。后面我们将更深入地介绍d s p 。 1 3d s p 概述 一个典型的d s p 系统如下图所示: 卜 目 叭a d d s p 处理器 数字信号爿 二二j数字信号 裂卅聃 图1 - 1 一个典型的d s p 系统 2 北京邮电大学硕士论文 对于d s p 可以有两种理解,一种是数字信号处理( d i g i t a ls i g n a lp r o c e s s i n g ) ,还 有一种理解是数字信号处理器( d i g i t a ls i g n a lp r o c e s s o r ) ,下面我们分别来加以 介绍。 1 3 1 数字信号处理( d i g i t a ls i g n a lp r o c e s s i n g ,d s p ) 数字信号处理【4 8 1 1 3 9 1 指的就是对数字信号进行分析和处理,该理论是随着计 算机技术和信息技术的发展而发展起来的,在通信、计算机等领域有着极其广泛 的应用。 数字信号处理理论主要包括:信号的采集,离散信号的分析,离散系统的分 析,信号处理中的快速算法,信号的估值,滤波技术,信号的建模,信号处理中 的特殊算法,信号处理技术的实现,信号处理技术的应用【8 j 。 数字信号处理相较之前的模拟处理方法来说,具有突出的优点:更大的灵活 性,更快的运行速度,更好的稳定性,更强的抗干扰能力等。 1 3 2 数字信号处理器( d i g i t a ls i g n a lp r o e :e s s c r ,d s p ) 数字信号处理器 4 3 9 1 与一般的微处理器有所不同,是一种专门为数字信号处 理设计的微处理器,它的主要特点是t 1 高度的实时性,运行时间可以预测; 2 哈佛( h a r v a r d ) 体系结构,指令和数据总线分开( 与冯诺依曼结构不同) ; 3 r i s c 指令集,指令时间可以预测; 4 特殊的体系结构,适合于运算密集的应用场合; 5 内部硬件乘法器,乘法运算时间短、速度快: 6 高度的集成性,带有多种存储器接口和i o 互联接口; 7 普遍带有d m a 通道控制器,保证数据传输和计算处理并行工作; 8 低功耗,适合嵌入式系统应用。 自1 9 8 0 年以来,d s p 芯片取得了突飞猛进的发展,d s p 芯片的应用也越来 越广泛。从运算速度来看,d s p 指令周期从8 0 年代初的g o o n s 降低到1 0 n s 以 下,相应的运行速度从2 5 m i p s 提高到2 0 0 0 m i p s 以上;从制造工艺来看,从早 期的4 a m 的n 沟道m n o s 工艺发展到现在的0 1 3 a m 甚至几十纳米的c m o s 工 艺;从存储器容量上来看,从几百个单元的片内存储器到如今的几十千字、甚至 高达兆字的存储容量;在内部结构上,当前的d s p 芯片广泛采用多总线、多处 理单元、多级流水结构。另外,d s p 芯片的成本、重量、体积以及功耗等方面都 有很大程度的下降。 d s p 有多种分类方式。其中按照数据类型分类,d s p 被分为定点处理器( 如 北京邮电大学硕士论文 t l 公司的d s p 芯片刚s 3 2 0 c 5 铡c 5 5 x ) 和浮点处理器( 如t i 公司的d s p 芯片 t m s 3 2 0 c 6 7 ) 。 一般来说,选择d s p 芯片时考虑如下诸多因素。 1 d s p 芯片的运算速度。运算速度是d s p 芯片的一个最重要的性能指标,也是 选择d s p 芯片时所需要考虑的一个主要因素d s p 芯片的运算速度可以用以下 几种性能指标来衡量: 指令周期:执行一条指令所需要的时间,通常以n s 为单位; m a c 时间:一次乘法累加操作花费的时间; f f t 执行时间:运行一个n 点f f t 程序所需的时间; m i p s :每秒百万条指令; m o p s :每秒百万次操作; m f l o p s :每秒百万次浮点操作; b o p s :每秒执行十亿次操作。 2 d s p 芯片的价格。根据需要搭建的系统预算,选择价格适中的d s p 芯片; 3 d s p 芯片的硬件资源; 4 d s p 芯片的运算速度; 5 d s p 芯片的开发工具; 6 d s p 芯片的功耗; 7 其它的因素,如质量标准、封装的形式、生命周期等。 因为本课题语音增强系统的需要对数字信号进行定点实时处理,并且要求严 格控制功率,综合考虑了芯片性能、价格等方面,选择了比较适合语音增强系统 实现的1 i 公司的t m s 3 2 0 v c 5 5 1 0d s p 芯片。 1 4 论文结构安排 本课题主要工作分为以下两个部分:第一部分是语音增强系统的设计;第二 部分是软件无线电硬件平台的搭建以及语音增强系统在此平台上的实现。 第一章绪论。这一部分介绍了语音增强、软件无线电和d s p 的基本概念, 并就全文做了安排。 第二章介绍了语音领域的一些基本理论知识和处理方法。 第三章分模块详细介绍了本课题语音增强系统的设计,并给出了性能评价。 第四章介绍了本课题软件无线电平台的搭建,并对其中重要部件和系统模 块进行了介绍。 第五章介绍语音增强系统在软件无线电平台上的实时实现。 第六章对已经在软件无线电平台实现的语音增强系统进行优化,使之性能 4 北京邮电大学硕士论文 更加优良。 总结与展望总结本论文所做的工作,并对将来的工作作出展望。 5 种特性称为语音信号的“短时性”。 语音的“短时性”是语音信号分析和处理的基础,利用这一特性就可以应用平 稳随机过程理论来分析与处理语音信号。我们知道的大部分语音信号数字处理的 算法和技术也都是建立在短时分析技术基础之上的,这些处理方法主要可以分为 时域和频域两个方面( 也有其它方法,本文不作讨论) ,主要是根据语音的统计 特性如幅度、能量、准周期性、过零率、短时傅立叶变化以及傅立叶反变换来处 理语音信号的。 下面我们通过一段语音信号的时域波形图和频域波形图来直观地了解一下 语音信号的特性。这段语音波形的采样频率是8 k h z ,量化精度是1 6 b i t 。从图中 我们虽然无法辨别语音波形的细节,但是可以根据语音能量的起伏大致分辨出话 语中每一个字( 音节) 在此波形中的位置。 j - 一 - 溘k 0 一乙lkj卜。 卜j 。r - 1 r r 1 i 吖一”鬻r r y 1 1 r v r 一。丫丫 i 522 533 544 55 x 1 0 图2 1 ( a ) 一段语音信号的时域波形图 6 北京邮电大学硕士论文 2 1 2 噪声特性 图2 1 ( b ) 一段语音信号的频域波形图 噪声1 5 】【6 l f l 5 l 【1 6 1 f 1 7 1 1 1 8 l 来源取决于实际的应用环境,其表现形式多种多样,其特 性也各有不同。噪声可以分为加性( 如环境噪声) 和非加性( 如电器线路干扰) 两种形式。非加性噪声可以通过同态滤波转换为加性噪声【8 】【1 射,因此我们这里仅 讨论加性噪声。对于一般的加性噪声我们假设噪声与语音统计独立或不相关,带曩 噪语音模型如下图2 2 : ” 噪i 声 嘉 噪声 菇 图2 - 2 加性噪声模型 加性噪声可以粗略地分为几类:宽带噪声、窄带噪声、周期噪声、脉冲噪声 和同声道其他语音干扰1 5 1 。 1 宽带噪声:这种噪声的来源有很多,如气流噪声( 风、呼吸) 、热噪声 以及各种随机噪声源等都属于这一类,宽带噪声在时域和频域上与语音信号都是 完全重叠的( 通常情况下,对于平稳的宽带噪声通常我们认为其是高斯白噪声, 在后面的仿真分析部分,为了方便分析,我们直接往信号里添加高斯白噪声生成 带噪信号) 。 2 窄带噪声:顾名思义,窄带噪声的能量是分布在一个较窄频带的范围之 内的。无线电干扰是典型的窄带噪声。 3 周期噪声:周期噪声的特点是在频率上具有许多离散的线谱。周期性转 动的机械和电气干扰会产生这种噪声。 4 脉冲噪声:脉冲噪声表现为时域波形中出现的窄脉冲。电火花、断续电 流以及雷电都会产生脉冲噪声。 7 北京邮电大学硕士论文 5 同声道语音干扰:所需要的语音信号和干扰噪声处于同一信道,这种现 象引起的干扰叫做同声道语音干扰。 本课题基于的软件无线电平台是应用于串行无线通信系统中的,在该通信环 境中,宽带噪声是最常见的一种噪声,因此,本文将主要针对这种噪声进行增强 处理。由于无论在时域和频域上,宽带噪声与语音信号都是完全重叠的,因而滤 除宽带噪声的难度较大。针对受宽带噪声干扰语音的处理,现有的大部分增强算 法,只单纯考虑信噪比的提高,而忽略了语音可懂度,其结果是导致语音质量无 法得到有效提高。本课题关注如何提高带噪语音的可懂度,从而达到有效增强被 宽带噪声干扰的语音信号( 特别是在低信噪比情况下) 。 2 2 常用语音信号处理方法 在正式介绍语音增强算法之前,我们必须对语音信号领域一些基础的处理方 法【8 j 【1 6 】【1 8 2 3 】有所了解,下面简要地加以叙述。 2 2 1 防混叠滤波处理 在对模拟语音信号进行a ,d ( 模拟到数字) 转换之前,要先用低通滤波器把 不需要的信号从有用带宽中消除掉,该低通滤波器的截至频率由语音信号带宽决 定,用以滤除高于1 2 采样频率的信号成分或噪声,并且希望其带内波动和带外 衰减特性尽可能好。a d 转换后再采用低通滤波器作为平滑滤波器,对重构的语 音波形的高次谐波起平滑作用,以去除高次谐波失真。对于这种低通滤波器的特 性和a d 转换频率,也要求与采样时具有相同的关系。 2 2 2 语音信号的采样处理 采样,也可称为抽样、a d 转换,这种处理手段在数字语音处理中非常重要, 因为它是任何数字语音处理系统的第一步。一般情况下,我们接收到的初始语音 信号都是模拟信号,需要先对其进行采样,得到数字语音信号,之后才能用数字 信号处理方法进行处理。我们知道语音信号的频谱分量主要集中在3 0 0 3 4 0 0 h z 之间,因此,根据奈奎斯特( n y q u i s t ) 抽样定理,我们至少要保持抽样频率大 于6 8 0 0 h z 才能保证抽样得到的数字序列能够包含原模拟序列的全部信息。在这 里,我们取抽样频率为8 0 0 0 h z ,这样可以很好地保证语音信号的质量。 2 2 3 语音信号的重叠相加 绝大部分情况下,由于语音信号的短时特性,在实现语音增强方法时,语音 8 北京邮电大学硕士论文 处理帧长都是取2 0 - 3 0 m s 语音。而在进行处理时,我们不是简单地按帧从数据区 中取出数据,处理完成一帧后直接取下一帧数据,为了保证数据的连续性,我们 在取数据时要采取重叠相加的方法,我们称前一帧和后一帧的交叠部分为帧移, 帧移与帧长的比值一般取o 加5 。该方法处理过程如下图2 3 所示。 2 5 6 点数据 图2 - 3 重叠相加法示意图 采用重叠相加法的好处是:可以减少语音分帧处理造成的不连续性。本论文 取帧移与帧长的比值为0 5 ,此时数据帧长为2 5 6 点,那么重叠长度1 2 8 点。值 得注意的是:经过重叠相加法处理的语音信号在经过增强处理后还需要进行还原 才能得到最终需要的增强语音信号。 2 2 4 语音信号的加窗处理 经过重叠相加法取出的一帧语音信号还需要经过加窗处理, 跏伽) 一s 0 ) w o )式( 2 - 1 ) 其中,s ( n ) 为语音信号,w ( 咒) 为窗函数,s ,o ) 为加窗后语音信号。在语音 信号处理中常用的窗函数是方窗、汉明窗和哈宁窗。在本论文中采用汉明窗,其 表达式如下: w ,。疗,。1 0 5 4 - 0 4 6 c o s ( 品_ 1 ,一1 k ,以_ 。c 一d 式。2 2 , l0 刀为其它值 汉明窗的特点是旁瓣幅度小,旁瓣峰值小于主瓣峰值的0 1 ,可以有效的降 低吉布斯效应的震荡程度。 2 2 5 快速傅里叶变换 在语音信号处理里中,频域分析方法是非常重要的一种方法。傅早叶变换是 一种将信号从时域变换到频域的重要方法,有连续傅立叶变换和离散傅立叶变换 9 北京邮电大学硕士论文 ( d v r ) 两种形式。在本论文中,我们要处理的对象是数字语音信号,需要用到 的是d f i 。对n 点序列x ( n ) ,其d f t 变换定义为: x 蜘n 荟- 1 嘭,七- 0 , 1 , ,n 一1 e x p ( 一1 争式( 2 3 ) x 似) 一薹z o ) 嘭, 七 ,一1 - e 一1 争式( 2 3 工( 刀) 一吉罗x 厩t , 露- 0 , l ,n l w , , n _ p - 式( 2 - 4 ) v 筋 由于d f t 的计算量很大,在计算全部点的情况下需要进行0 0 f ) 次复数乘法 和加法,在很长的一段时间内,其应用受到很大的限制。c o o l e y 和t u k e y 提出 了快速傅立叶变换算法【1 4 1 1 5 1 1 2 1 1 ( f a s tf o u r i e rt r a n s f o r m ,n 砷,该算法利用蝶形 运算单元的对称性和周期性,大大地减少计算次数,加快了运算的速度,使n , 点d f t 的乘法计算量由n 2 次降为;】0 92 n 次。 z f f f 算法主要思想:将长序列的d f t 分解为短序列的d f r 。n 点的d f t 先 分解为两个n 陀点的d f t ,每个n 陀点的d v i 又分解为两个n 4 点的d f t ,依 次类推。其中最小变换的点数就是基数,基数为2 的f f f 算法的最小变换( 或 称蝶形) 是2 点d f r 。另外,f f t 算法还可分为时间抽取( d i t ) 和频率抽取( d i f ) 两类。本论文采用基数为4 的时间抽取的2 5 6 点h 丌算法。 2 3 本章小结 本章针对本课题要处理的对象语音和噪声各自的特性做了大致介绍,并且阐 述了语音信号领域一些常用的处理方法。 1 0 北京邮电大学硕士论文 第三章语音增强系统总体设计 一个完整的语音增强系统如图3 - 1 所示,包括预处理模块、噪声估计模块以 及语音增强算法模块三个部分。 增强语音卜 图3 1 语音增强系统示意图 其中预处理也叫前端处理,是指在对带噪语音信号进行增强之前先对其进行 处理的过程,在本课题中预处理手段主要包括抽样、重叠相加法和加窗处理( 从 f p g a 发送过来的数据本身已经是0 - 4 k h z 的带限信号,此处不再需要另做防混 叠滤波) ,这些在2 2 节已经做过详细介绍,不再赘述。下面我们对噪声估计模 块和语音增强算法模块分别进行讨论。 3 1 噪声估计模块 本论文主要是围绕如何有效地对带有宽带加性噪声干扰的语音信号进行增 强展开的。我们现行的很多增强算法,尤其是一些经典的语音增强算法( 如谱减 法、m m s e 法等) 都直接或间接地需要对宽带加性噪声进行估计,甚至有些算法 的性能完全以噪声估计的准确与否为前提,噪声估计算法是否得当将直接影响语 音增强的效果。对本课题实现的基于谱减法及其改进形式的语音增强算法而言, 噪声估计方法的选择也是十分重要的,是该算法能否有效进行的前提。噪声的估 计方法很多,一般来说,关于噪声的动态更新采取以下两种方法:一种是根据语 音和噪声的不同特性对语音信号进行语音检测【9 l 【1 0 1 ( 如i ) ,以寂静帧的值来代替 噪声,在判断为无声情况时对噪声估计加以更新,反之,保持原有的噪声估计不 变。但是现有的v a d 方法很难实时跟踪噪声变化,尤其是在信噪比较低的情况下 更加恶劣,估计出来的噪声很难保证准确性。另外一种方法是按帧来估计噪声i z j 【1 1 】【1 2 】,不需要对寂静帧和语音帧进行检测,在任意情况下都对噪声估计进行更 新。本文使用的是r m a r t i n 在文献【1 1 】和【1 2 1 中描述的基于最小值跟踪的噪声估计 算法,是一种有效的不需要进行语音检测的噪声估计算法。下面我们对该算法做 一个详细的介绍。 r m a r t i n 提出的噪声估计算法主要分为几个步骤: 有如f 式子: p ( x ,k ) 一口( a ,七) p ( a 一1 ,七) + ( 1 一口( a ,k ) ) l y ( x ,七) 1 2 为了使p q ,七) 尽可能逼近q ,k ) ,只需要式( 3 - 3 ) 条件均方误差达到最小值,就 可以得到最优口 e ( 尸( a ,七) 一口;( a ,七”2ip ( x 一1 ,七) 式( 3 3 ) 由e ly q ,七) 1 2 一q ,k ) ,e iy ( a ,七) r 一2 以q ,k ) ,我们对式( 3 3 ) 展开得到 口2 ( a ,k x p ( a 一1 ,七) 一。寺( a ,七) ) 2 + 口:( a ,k ) o - a 2 ( a ,七) ) 2 式( 3 4 ) 令上式等于0 可得口掣q ,k ) : 根据上述过程得到的平滑因子直接用计算噪声功率谱密度存在一些问题,并 不能及时准确地跟踪噪声的变化。实际操作中,我们需要对口再进行修正,具体 方法是对得到的a o 叫( z ,k ) 再乘以一个修正因子,修正因子的计算过程如下: 首先,计算式子 撕2 两弦两两1 河丽 式( 3 8 ) 对绝。 ) 进行平滑得到口。 ) ,这里的平滑因子根据经验取为o 7 。 口。q ) 一0 7 a 。q 一1 ) + 0 3m a x ( 。& 。q ) ,0 7 ) 式( 3 9 ) 根据计算得到的a 。q ) 我们来对上一节得到的口叫q ,k ) 进行修正可以得到平 滑因子的计算公式: 口( a ,七) 。1 + ( p ( a - 旦1 , k ) 型o 塑2 ( a l - 1 一, k ) - 1 ) 2 式( 3 - 1 0 ) 为了进一步提高该噪声估计模块在处理非平稳噪声时的性能,我们给出a 允 许的最小值,该值计算过程如下: 墨 口m i n m i n ( o 3 ,s n ro 心班)式( 3 1 1 ) 北京邮电大学硕士论文 其中,s n r 为信噪比,在这里我们可以直接用= p n 一1 ,七) = q 一1 ,七) 来 计算得到;b 为采样率,本论文中f s 为8 舷;尺一三二- 1 2 8 ( l = 2 5 6 ,为帧长) 。 这样,我们可以得到最终的平滑因子 口加_ ( a ,k ) - m a x ( 口( a ,七) ,口_ 妇) 式( 3 1 2 ) 3 1 2 得出估计噪声 我们根据最小功率谱统计跟踪的方法从平滑得到的p ( a ,七) 中推导得到需要 的噪声功率谱密度,具体步骤如下: 首先我们将p ( a ,七) 展开: p ( a ,k ) 一a p ( a 一1 ,七) + ( 1 一口) i y ( a ,k ) 1 2 - a ( a p ( a 一2 ,七) + ( 1 一a ) l y ( x 一1 ,后) 1 2 ) + ( 1 一口) i y ( a ,k ) 1 2 _ 式( 3 - 1 3 ) - ( 1 一口) 罗口i r ( x i ,七) 1 2 箭 这里的口为3 1 1 节修正后的口删q ,k ) ,为了直观起见,仍记为口。求d 个连续 的p ( a ,七) 中的最小值p 缸a ,k ) ,其中,a 九,a l - i ,九一d + q 。 即朋的概率密度函数为: 亦巧葡拓,从该式可以知道, e p 血。q ,七) 】是和以似,七) 成正比的,同样,其方差正比于以q ,七) ,我们在 正( a ,k ) = 1 前提下计算均值和方差即可。 我们给出两个概念: 砝q ,k ) = e 妒m i n q ,k ) l 2 ( 厶足) 1 式( 3 - 1 4 ) q i 叼( a ,k ) 一2 d 品( a ,k ) lv a r p ( a ,七) ,( 2sq 钾( a ,七) s1 4 ) 式( 3 - 1 5 ) 在文献中,r m a n i i l 给出了计算b m q ,k ) 的两种方法,这里,我们直接采用 简便算法: 曰m i n ( 圳_ 1 + ( d 一1 ) 瓦两2 式( 3 - 1 6 ) 1 4 北京邮电大学硕士论文 其中,咖鼍紫,m ( d ) 是d 的函数文献【1 2 】给出了对 应表格 dm ( d )h ( d )dm ( d )h ( d ) 10o 3 0 0 82 0 20 4 8o 3 04 0o 8 2 52 0 50 6 42 7 6 0 0 8 62 0 80 6 82 68 0o 8 92 9 1 00 72 61 2 00 9 1 53 2 1 50 7 42 51 4 00 9 2 33 3 5 2 0 0 7 72 5 1 6 0 o 9 3- 3 5 若d 介于表格中两个取值之间,可以用线性的方法进行计算,如本论文需要 d = 1 2 幂 1 9 6 时m p ) 值 m o o m ( 8 0 ) + 黼 m 0 2 0 ) 一肘 - o 8 9 + 丽1 6 ( o 9 1 5 一o 8 9 ) 一0 9 同理,m ( 1 2 ) - - 0 7 1 6 ,分别用于计算d = 1 2 和9 6 时b m a ,七) 。 另外,实际操作中,我们在用式( 3 - 1 5 ) 来计算q 叼q ,七) 时用以( x - l k ) 代替 以q ,k ) ,式0 - 1 5 ) 中的v a r p ( a ,七) ,的估计如下: s v a r p ( z ,七) 。声( a ,七) 一2 q ,七)式( 3 1 7 ) p q ,k ) 、p 2 似,k ) 由p ( x ,k ) 、p 2 q ,七) 平滑得到。 e ( x ,k ) 一声( a ,k ) p ( a l 七) + ( 1 一卢( a ,七) ) p ( a ,k )式0 - 1 8 ) p 2 ( a ,k ) 一卢( a ,k ) p 2 q 一1 七) + ( 1 一p ( x ,七) ) p 2 ( a ,k )式( 3 1 9 ) 卢( a ,k ) - a 加,q ,七) ) 2 ,且卢一q ,七) = 0 8 ,为了适应非平稳环境,将b 向n ( a ,k ) 乘上一个系数& q ) , & ( a ) 。1 讯厅( a ) ,( 舭2 1 2 ,矿( a ) 一( i l ) 2 :1 0 l q , q ( a ,七) ) 式( 3 2 0 ) 北京邮电大学硕士论文 在搜索p m a ,k ) 时,我们将d 个连续的p ( x ,七) 按v 个一组分为u 组( 根据 r m a r t i n 在文献【1 l 】中的描述,取d = 9 6 ,u = 8 ,v = 1 2 ,d - u 宰v ) ,计算每一组 2 5 6 个数据的b 曲( d ,q e q ( a ,七) ) p ( a ,七) 值( 分别计算大当d = 9 6 和1 2 时取值,记为 bm d ,q e q ( a ,七) ) p q ,七) 和曰嗵柚p ,q e q ( a ,七) ) 尸q ,七) ) ,将该两组数据与前面储 存的值在2 5 6 个频点上做比较,取对应频点上较小值进行更新,得到两组新的数 值。其中,bm 虹柚( d ,q e q ( z ,七) 妒m i n ( a ,k ) 为当前噪声估计( 在这里,我们认为噪 声均值为零) 炉而舞赫而 = 口嗵,曲( d ,q e q ( a ,七) ) pm i “a ,k )式0 - 2 1 ) 此处口m i n 为经过及似) 修正后的值。按照相同的方法估计噪声直到第u 组数据, 第u 组数据不进行噪声估计的更新,只给出接下来u 组数据的初始噪声估计,该 值由口曲( d ,q e q ( a ,七) ) p q ,k ) 的最后更新值口m 缸( d ,q e q ( a ,七”尸曲q ,七) 和前u - 1 组数据得到的该值做比较取最小值得到。 该算法可以很好地估计噪声并对噪声进行跟踪,实际使用中,我们有时还要 通过乘以一个系数对上述方法估计得到噪声进行进一步修正使其更符合实际情 况。 3 2 语音增强算法模块 在第二章介绍噪声的时候,指出噪声种类繁多,且特性各异,针对不同情况, 语音信号增强的方法也应该各不相同。本论文所要处理的噪声是宽带白噪声,本 课题采用的语音增强算法是以听觉掩蔽效应和谱减法为基础构建的,主要由几个 子模块组成,示意图如下: 预处 图3 - 2 语音增强算法分模块示意图 下面部分来介绍跟上述语音增强算法模块有关以及一些最重要的基础理论 1 6 北京邮电大学硕士论文 和算法。 3 2 1 基本谱减法 自从b o l l 提出谱减法【3 l 【1 5 1 1 1 6 l 【1 s l 2 3 1 以来,由于该算法思路简单、运算量小、 实时性强,且在滤除加性噪声时效果很好,该算法及其改进形式一直以来被广泛 地应用于各种语音信号处理系统当中。本课题所依赖的语音增强算法也是以谱减 法为基础开发的,因此,有必要将对基本谱减法的研究放在本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论