




已阅读5页,还剩66页未读, 继续免费阅读
(计算机应用技术专业论文)短波通信中信号检测算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
哈尔滨j 程大学硕十学位论文 摘要 木论文研究的是强噪声背景下信号流检测。通讯系统中的干扰是不可避 免的,尤其是短波通讯,信号更容易受到噪声的干扰。在通讯、广播系统中 噪声严重的影响着声音的质量,增加了工作人员的听觉疲劳,信号检测的目 的就是检测语音信号或莫尔斯信号的有无,改善工作人员的工作环境。 端点检测是语音信号处理的一个重要分支。基于过零率和能量的传统检 测算法,在噪声环境比较复杂的情况下效果很不稳定,尤其是信噪比较低或 者语爵信弓较弱时,检测效果很不理想,因此,在多种语言和噪声随机出现、 噪声和语音强弱不一的实际噪声环境下,必须利用新的算法提取有用信号和 噪声信号的有效特征,力能解决实际的问题。 本文首先介绍了噪声的类型、语音和莫尔斯信号的特征,然后对不同类型 的噪声信号进行了分析,在各种不同的嗓声背景下利用不同的算法检测语音 信号和莫尔斯信号,实现有用信号和噪声的分离。基于实际背景噪声的复杂 性,本文提出了语音信号的小波分析和高阶统计量分析相结合的方法,有效 的分离了语音信号和非高斯噪声,取得了不错的效果,基于现场实验表明, 该铬法取得了很好的效果 针对语音信号及其背景噪声的特点,本文利用了基于小波变换系数统计、 双嘴和复数谱力芳等检测算法。似波系数统计算法在解决周期信号、高能噪 声和高斯信号方面有独特之处,能简单有效提取以上噪声的特征:双谱能够 提供比功率谱更多的有用信息,有效地检粳4 信号幅度之外的其它信息,并能 有效抑制商斯噪声,短时语音信号一般认为是平稳且有一定的周期性的非高 期信号,【;i ;l 瓶。叮以利用双谱来提取语音信号特性并实现信噪分离;复数谱方 差算法是在对语音信号进行深入观察和分析的基础上而提出来的一种全新的 语音特征提取方法,此方法简单而有效的提取了语音和噪声的特征。 莫尔斯( m o r s e ) 电报码是一种类似单周期的规则信号,其特征比较明显, 它是利 j “点”、“划”和“间隔”( 实际上就是时间长短不一的电脉冲信 号) 的不周组合来袭示字母、数字、标点和符号。有两个典型的特征:一是 哈尔浜t 群人学硕十学位论文 舟时川卜是删断、不连续的;二是在强度上也是不连续的,只有有限的离散 值a 吵一一 钊财莫尔斯信号的单刷期性和周期频率涮断性的本质特征,本文利用复 数谱方差算法来判断信号是否单周期并确定其周期频率,然后根据傅罩叶变 换的性质,提取周期频率相对应的变换系数,对这些数据进行分析结合归一 化和闽值的思想进行间断性的特征提取,从而达到莫尔斯信号检测的目的。 德州仪器公司的数字信号处理器是高性能的d s p 芯片,论文详细介绍了 它的高速计算的特点,芯片的基本结构和硬件资源,并利用t m s 3 2 0 c 5 4 0 2 型 号的d s p 芯片设计了算法实现的硬件系统。 关键词:语旨信号处理;莫尔斯电报码;端点检测;小波变换;高阶统计量; 复数漕方差 哈尔滨i 。群人学硕十! 学位论文 a b s t r a c t t h i st h e s i sr e s e a r c h e st h es i g n a ls t r e a md e t e c t i o ni ns t r o n gb a c k g r o u n dn o i s e e n v i r o n m e n ti ti si n e v i t a b l et h a tt h ec o m m u n i c a t i o n s y s t e m i sd i s t u r b e d e s p e c i a l l y t h es h o r tw a v ec o m m u n i c a t i o n ,i t ss i g n a li s e a s i l yd i s t u r b e db yt h e n o i s ei nt h ec o m m u n i c a t i o na n db r o a d c a s ts y s t e m ,t h en o i s ed e e p l yd e c r e a s e st h e q u a l i t yo fs p e e c h ,a n di n c r e a s e st i r e d n e s st ot h ew o r k e r t h ei n t e n t i o no fs i g n a l d e t e c t i o ni st h a td e t e c t i n gt h es p e e c ho rm o r s es i g n a l ,o b l i t e r a t i n gt h en o i s es i g n a l f r o mt h es i g n a ls t r e a ma n di m p r o v i n gt h ew o r k i n ge n v i r o n m e n t e n d p o i n t d e t e c t i o no fs p e e c hi sai m p o r t a n tb r a n c ho ft h es p e e c hs i g n a l p r o c e s s i n g t h et r a d i t i o n a ld e t e c t i o na l g o r i t h m ,b a s e do nz e r o c r o s s i n go re n e r g y , w i l ln o t a c q u i r ei d e a l e f f e c tw h e nt h e s i g n a l t o - n o i s e i sl o wo rt h es i g n a li s w e a k e r r h e r e f o r e t or e s o l v et h er e a lp r o b l e mi nt h er e a le n v i r o n m e n tt h a ta l l k i n d so fr a n d o mn o i s ea n ds p e e c hs i g n a le x i tt o g e t h e r ,s o m en e wa l g o r i t h mm u s t b ep u tf o r w a r d a tt h ef i r s t ,t h et h e s i si n t r o d u c e st h et y p e so fn o i s e ,s p e e c hs i g n a la n dm o r s e s i g n a lc h a r a c t e r t h e ni l l u s t r a t ea l l k i n d so fn o i s ea n d p u tf o r w a r d e x a c ta l g o r i t h m t os e p a r a t et h en o i s ea n ds p e e c ho rm o r s es i g n a l a c c o u n tf o rt 1 1 ec o m p l e x i t yo f r e a ln o i s e ,w e i n t e g r a t e t h ew a v e l e tt r a n s f o r ma n dh i g h o r d e r s t a t i s t i c sa n d a d v a n c ean e wa l g o r i t h m ,t h ea l g o r i t h mc a ns e p a r a t et h es p e e c hs i g n a la n dt h e n 0 1 3 一g a u s s i a nn o i s e a n dt h ee x p e r i m e n t a t i o ns h o w s t h a tt h ea l g o r i t h mi se f f e c t i v e a n du t i l i t a r i a n o nt h eb a s i so ft h ec h a r a c t e ro ft h es p e e c ha n dt h eb a c k g r o u n dn o i s e ,t h e t h e s i sb r i n g sf o r w a r dt h ea l g o r i t h mt h a tb a s e d 0 1 1t h es t a t i s t i co f w a v e l e tt r a n s f o r m c o e f f i c i e n t ,b i s p e c t r u ma n dt h ec o m p l e xn u m b e rs p e c t r u mv a r i a n c et od e t e c tt h e s p e e c hs i g n a l t h es t a t i s t i co f w a v e l e tt r a n s f o r mc o e f f i c i e n ta l g o r i t h mc a ns o l v e t h ep e r i o d i cn o i s e ,h i g h e n e r g yn o i s ea n ds o m en o n g u a s s i a nn o i s es i m p l ya n d e f f i c a c i o u s l y ;b i s p e c t r u mc a na c q u i r em o r ei n f o r m a t i o nf r o mt h eo r i g i n a ls i g n a l 堕釜鎏 :堡兰鎏:主釜鲨耋 t h a np o w e r - s p e c t r u m ,d e t e c tm o r ei n f o r m a t i o ne x c e p tf r o m r a n g ea n dr e s t r a i nt h e g u a s s i a nn o i s e ,s h o r t t i m es p e e c hs i g n a lc a nb ec o n s i d e r e da ss t a t i o n a r ya n dw i t h p e r i o d i cn o n g u a s s i a ns i g n a l ,s ow ec a l lm a k eu s eo fb i s p e c t r u mt oo b t a i nt h e s p e e c hc h a r a c t e ra n ds e p a r a t et h es p e e c ha n dn o i s e ;c o m p l e xn u m b e rs p e c t r u m v a r i a n c ea l g o r i t h mi sp u tf o r w a r db a s e do nt h ed e e p l yo b s e r v i n g s p e e c hd a t a ,i ti s an e w a l g o r i t h m ,e x p e r i e n c es h o w t h a ti ti ss i m p l e ,e f f e c f i v ea n du t i l i t a r i a n , m o r s et e l e g r a p hc o d ei sas i n g l ep e r i o da n dr e g u l a rs i g n a l ,i t sc h a r a c t e ri s o b v i o u s ,t h ec o m b i n a t i o no fd o t ,l i n e ,s p a c ea r eu s e dt od e n o t et h el e t t e r , n u m b e r p u n c t u a t i o n ,s i g n a n di t st y p i c a lc h a r a c t e ri sd i s c o n t i n u o u si nt i m e s p a c ea n di n s p e c t r u m s p a c e o nt h eb a s i so ft h ee s s e n t i a lc h a r a c t e ro fm o r s e s i g n a l sp e r i o d i c i t y m a d p e r i o d i c ( r e q u e u c yd i s c o n t i n u i t y ,t h et h e s i sa p p l i e st h ec o m p l e x n u m b e r s p e c t r u m v a r i a n c e a l g o r i t h m t od e t e c t i o n p e r i o d i cs i g n a l a n dt h e f f e q u e n c yt h e n ,i n a c c o r d i n gw i t ht h ec h a r a c t e ro f f o u r i e rt r a n s f o r m ,w eo b t a i nt h ec o r r e s p o n d i n g t r a n s f o r mc o e f f i c i e n ta n da n a l y z et h e m c o m b i n i n gu n i t a r i n e s sw i 血t h r e s h o l d ,w e o b t a i nt h ed i s c o n t i n u i t yc h a r a c t e ro f m o r s es i g n a la n dd e t e c ti t t h ed s p c h i po ft ic o r p o r a t i o ni sh i g h p o w e r e d t h et h e s i s i n t r o d u c e si t s s u p e r i o r i t y i n h i g h s p e e dc o m p u t e r a t l e n g t h a n dt h eb a s i cs t r u c t u r ea n dt h e h a r d w a r er e s o u r c e ,a tl a s t ,w ed e s i g nt h ec i r c u i tt or e a l i z et h ea l g o r i t h m k e y w o r d :s p e e c hs i g n a lp r o c e s s i n g ;m o r s et e l e g r a p hc o d e ;e n d p o i n td e t e c t i o n ; w a v e l e tt r a n s f o r m a t i o n ;h i g h o r d e rs t a t i s t i c ;c o m p l e xn u m b e rs p e c t r u mv a r i a n c e 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导 下_ ,由作者本人独立完成的。有关观点、方法、数据和文 献的引用已在文中指出,并与参考文献相对应。除文中已 注明引用的内容外,本论文不包含任何其他个人或集体已 经公开发表的作品成果。对本文的研究做出重要贡献的个 人和集体,均己在文中以明确方式标明。本人完全意识到 本声明的法律结果由本人承担。 作者( 签字) :碴i :j i 竺 e t 期暑,t 口丫年王月l 乙日 ! 立尘鎏! :堡耋堡土:i :生鎏兰 第1 章绪论 1 1 论文研究的目的和意义 本论文是研究强噪声背景下语音信号流和莫尔斯信号流的检测。信号流 检测的目的是去掉语音流和莫尔斯流中的噪声信号,提取有用的信号流。信 弓流检测,尤其是端点检测,在信号处理中有着举足轻重的地位,它也是信 号v | 1 、1 ”f 1 0 、语音说话者和语种识别等信号处理的预处理,同时,信号流检测在 很多领域具有重要的意义。现实中大多数场合信号流检测都是靠人工来完成 的,由于短波信号受到的干扰很严重,各种类型的噪声都有,有些噪声听起 来很小舒服,甚至还有恶心的感觉。长期工作在这种环境下,人的身心健康 会受到很大的影响,甚至会导致内分泌失调。因此,用机器代替人进行信号 流检测就显得非常必要了。它可以把信号段从噪声中分离出来,便于人的收 听乖f 处理。 端点检测的目的在于从数字信号中区分出语音信号或者莫尔斯信号的有 丸,准确地确定出信号的起始点和终点。端点检测的研究已经有几十年了, 其实现算法t 要集中在基于能量阈值、基音估计、谱分析、过零率、周期检 测等方法。 1 2 信号检测的研究与发展 语音流检测算法研究的第一个应用是在b e l l 实验室的语音转播和交换系 统中实现的,目的是为了通讯信道的时间合理分配,原理是使用语音激活检 测技术在信道的空闲时间罩插入其它的通话【2 j 。通常,在背景噪声较小的情 况卜i j 以比较容易地检测 h 语音的端点。最早的、最简单的方法是基于能 量和过零率的方法。在这种方法中,先对背景噪声的能量作一个统计估t 1 , 得到一个能量闽值,利用该闽值来确定语音的端点。在信噪比较高,而且噪 声l 峙度保持相对恒定的情况下,可以取锝很好的效果,过零率可以用于简单 哈尔滨i 挫人学颂十学位论文 的分频榆测。但是,在强噪声背景下,基于能量的方法检测性能开始恶化, 阀值选择的偏差对检测性能的影响是灾难性。而且当噪声的频率与语音某些 音节的频率相重叠时,过零率也不足以作为辅助判据。在强噪声背景下,运 剧这两种方法检测语音信号或者莫尔斯信号的端点已变得十分困难。 一个好的端点检测算法应该具备以下性能【3 : ( 11 不管信噪比的高低,都能具有准确的检测能力,对微弱信号仍能其 有良好的检测能力; ( 2 ) 具有实时性、鲁棒性和较低的计。算复杂度。 本论文的算法主要根据噪声、语音和莫尔斯信号各自不同的特征,利用 钊小波变换、高阶统计分析和复数谱方差分析等方法来分析信号并进行特征 提取,从而达到信号流检测的目的。 1 3 语音和噪声的特征 信号检测算法就是在分析语音信号或者莫尔斯信号与噪声信号的不同特 征的基础上提出来的,所以必须分析了解语音信号和莫尔斯信号的特征,尤 其是跟嗓声信号不样的特征。根据不同的特征,可以利用算法来提出各自 的特钶:,从而进行检测,可以说,信号特征的提取是信号检测算法的基础。 f 面简要介绍语音信号、莫尔斯电报码和噪声信号各自的特征。 13 1 语音特征 语旨是由一连串的音节组成的语言声音,它是人的发声器官发出的一种 声波,具有一定的音色、音调、音强和音长。语音信号是时变的、非平稳的、 短时多周期性的随机过程,在发音的短时问内,由于人的声带和声道形状相 对稳定,所以其特征在1 0 3 0 m s 内可以认为是准稳定的,其短时谱也是相对 稳定的。 语音可以分为清音、浊音两大类。浊音的声音段以相对高的能量分布为 特征,玎以认为是含有基音周期的周期性信号,在频域上具有共振峰结构, i f i 且能量大部分集中在低频段内。清音可以用随机白噪声来模拟,分布在较 高的频段内。清音的形成是在声道中的一定部位被压缩后,压迫空气以足够 哈尔滨l :科人学硕七学位论文 岛的速度通过这些压缩部位,产生涡流,从而形成的。 贯穿了语音分析全过程的是“短时分析技术”。语音信号从整体来看其特 征及表征其本质特征的参数均是随时间而变化的。但是,由于不同的语音是 由人的口腔肌肉运动构成声道某种形状而产生的响应,而这种口腔肌肉运动 相划j :语暂频率来说是非常缓慢的,可以认识是短时平稳性【。 13 2 噪声特性 实际的环境中,噪声随机可见,各式各样,其特征变化也很大,可以分 为加性噪声和乘性噪声。由于噪声的随机性,分析噪声就要分析其统计特征, 其中概率分布密度、功率谱密度及相关函数都是其主要统计量特征。实际噪 声的分如概率密度很不样,各种分布都能有,我们把它分成高斯分布和非 高斯分布来处理,功率谱和自相关其实是一对傅旱叶变换之间的关系,可以 利用自相关函数束研究噪声。它们都是描述随机过程十分重要的统计特征, 这两个统训特征量对于一个高斯过程来说是完全足够的,但对于非高斯过程 失不够的,我们呵以利用高阶统计量来分析检测非高斯信号。下砸我们介绍 几利t 我们常见的噪声【5 l 6 】: ( 1 ) 白噪声:指具有平坦的功率谱,可表示为:s 。= _ j v 0 , n o 为白噪 ,导的单边功率谱密度,s 为功率谱。其自相关函数: r ,( f ) = 芒1 ! s ( c o ) e ”d m = 。v ,o 6 ( f ) ( 1 - 1 ) 可见,白噪声具有一个明显的特征,即不同时刻的取值是不相关的。这 个性质对于白噪声中信号的提取极为有利。 ( 2 ) 限带白噪声:指白噪声经滤波器输出的噪声,因此其噪声功率谱密 度占据定的带宽。根据维纳一辛钦定理,限带白噪声的自相关函数为; 驰) = 鲁e j n 口r d c o = n o 丐s i n 2 f ;r b r ( 1 - 2 ) 式申 r ,( 0 ) = n o b 为限带白噪声功率,b 是带宽,我们处理的噪声大部 分都属f 这一种,严格的白噪声实际中几乎是没有存在的。 ( 3 ) 窄带噪声:指噪声通过带通滤波器输出,只是带通滤波器的带宽印 哈尔滨l :程人学硕十学位论文 远小于频率峨,因此叫做窄带噪声。其带内可以认为是白噪声,窄带噪声的 自相关函数为: 尺。( f ) = o b s i 柏n7 r r b r c 。s f ( 1 3 ) 窄带噪声的自相关函数,其相关时间为l = 1 2 b ,可以看成是由慢变部 分“( r ) = = f ,bs i n r c b r r c b r 及快变部分c o s u t 组成。 1 4 莫尔斯电报码特征 莫尔斯信号的特征非常明显,一是:特征频率相对固定,并且特别窄, 般集中在9 5 0 1 0 5 0 h z 内,信号的主要能量集中在这个频带内;二是:间 断性,在时域和频域都是间断的,利用“点”、“划”、“空隙”来表示各种数 字、字母和标点符号。 1 5 i 2 文的安排 沦文的第1 章主要介绍了论文的研究目的和意义:第2 章介绍了语音产 生的机理、详细的分析了噪声的种类及语音特征:第3 章详细的介绍了语音 信号的小波变换及其系数的统计特征;第4 章介绍仿真实验并对实验数据进 行分析:第5 章介绍有关d s p 硬件知识,尤其是t m s 3 2 0 c 5 4 0 2 硬件资源, 并详细介绍了算法的硬件实现的设计方案;最后对全文的工作做了总结。 、 堕尘鎏:;堡盆兰鎏主耋垡鎏奎 第2 章噪声、语音和莫尔斯信号的基本特征 噪声的类型有好多,可以分为加性噪声和乘性噪声。加性噪声与信号相 互独立,町以用加法运算来说明它对信号的影口叭乘性噪声又称相关噪声, 信号存在时它存在,信号消失后它也消失。实际环境的噪声几乎各种类型都 有,本论文主要涉及到的噪声主要有单周期噪声,多周期噪声,“风声”,脉 冲噪声,甲稳自噪声和有色噪声。下面介绍一下噪声的分类。 2 ,1 噪声的分类 按照噪声对线性谱的影响是笳性的还是乘性,可将其分为热性噪声和卷 积嵘声。 ( 1 ) 加性噪声 、j 信号与噪声在线性谱上表现为相加的关系时,即接收信号线性功率表 现为噪声信号线性谱功率o :与语音信号线性功率谱a ;之和时,即 o ;:a j + a j ,称噪声信号是相对于语音信号的加性噪声。 ( 2 ) 卷积噪声 卷积噪声主要指信号通过信道后的干扰,表现为频谱中某些分量被衰落。 卷积噪声的处理办法通常利用倒谱或者复倒谱的方法来进行解卷和分离。 2 1 1 周期性噪声 周期噪声来源于周期性运动的声源,其特点是具有许多离散的线谱,能 量集中在狭小的频带中问,这种周期性噪声可以用梳妆滤波器予以抑制。然 而实际环境中产生的周期性噪声并非简单地只含线谱分量,而是出许多窄带 带组成。两且,往往是时变的,并与语音信号频谱重叠在一起。 2 1 2 脉冲噪声 脉冲噪声表现为时域波形中突然出现的窄脉冲。它来源于爆炸、撞击和 放电、冲击等。消除脉冲噪声的方法通常可以在时域进行,其过程如下:根 哈尔7 兵1 鞋人学硕士学位论文 据带噪语音信号幅度的平均值确定阈值。当信号幅度超过这一阈值时,判别 为脉冲噪声。然后对它进行适当的衰减,甚至完全消除。 2 1 3 “风声”噪声 “风声”有点像周期噪声,但是还是不一样的,主要的区别是周期的线 谱是垂直的,而“风声”的线谱是斜的,还跟语音叠合在一起,可以利用处 理单周期的思想来处理“风声”,不同的是,要先判断出“风声”,然后估计 代表“风声”线谱的宽度进行切割。 2 1 4 平稳非平稳噪声 平稳噪声指统计特性不随时问变化的一类噪声,而非平稳噪声指统计特 性随时削变化的一类噪声。应该说,非平稳噪声是实际存在中较之平稳噪声 更县广泛意义,而平稳噪声往往只是非平稳噪声的- - i f p b 近似处理或者特殊情 况。,卜稳噪声的统计特征比较稳定,在一定的频段内分布比较均匀,熵值较 人,很容易处理,能够利用双谱或者复数谱方差的方法来提取特征并进行处 理。 21 5 宽带噪声 宽带噪声的来源很多,热噪声、气流噪声及各种随机噪声源,量化噪声 也可视为宽带噪声。由于宽带噪声与语音信号在时域上完全重叠,因此消除 它最为困难。这种噪声只有在语音问歇期才单独存在。对于常见得平稳宽带 噪声,通常可以认为是自色高斯噪声。不具有白色频谱的噪声,可以先进行 h 化处理。 22 语音信号生成的数学模型 语音信号生成的数学模型的基础是人的发音器官的特点和语音产生的机 坤,数学模型就是要寻求一种可以表达一定物理状态下量与量之间关系的数 学表示,只有建立这个模型,才能够用计算机来定量地对语音信号进行模拟 和处理,所以浯音信号生成的数学模型是语音信号处理的基础 4 1 0 语音生成系统可以分为三个部分: 哈尔滨i 氍人学硕- k 学位论文 ( 1 ) 激励系统:在声门以下,负责产生激励振动。般分为浊音激励和 清音激励,浊音激励模型可表示为: 叫z ) = ) 比) = 南正两 ( 2 - 1 ) 式中g ( z ) 是单个斜三角波模型:e ( z ) 是加权了的单位脉冲串,也就是说浊 音激励波是个以基音周期为周期的斜三角脉冲串。而把清音激励模拟成均 值为0 、方惹为1 的随机白噪声。 ( 2 ) 声道系统:从声门到嘴唇的呼气通道。根据通道的物理特征,对于 一般,i 音,可以用全极点模型来表示其传输函数: y ( z ) = 1 l ( 2 - 2 ) 1 一吼z 4 式中,n 是极点个数;g 是幅值因子;嘶是常系数。 而对于非一般元音以及大部分的辅音,必须利用零极点模型的传输函数 水表示: n b ,z 。 y ( z ) = 型 一 1 - z 吼z 一 = i ( 2 3 ) 通常n r ,r 是零点数。 ( 3 ) 辐射系统:嘴唇以外,语音从这里辐射出去。从声道模型输出的是 速度波“,( ) ,而语音信号是声压波p l , ( ”) ,二者之倒比称为辐射阻抗z t t 其公式如下: 姒妒巷瓷 c z 一4 , 式- 扣r r = 罟,。= 墨,这晕,d 是口唇张开时的开口半径,c 是声 波传输速度。 综上所述,完整的语音信号的数学模型如图2 1 所示: 这种模型和真实模型在输出处是等效的,因为语音信号的变化是缓慢的, 哈尔滨r 稚人学硕士:学位论文 所以这个模型是短时的,声道转移函数v ( z ) 是一个参数随时间缓变的模型。 对j 二摩擦音,这个模型存在些缺陷,可用一些修正模型或更精确的模型来模 拟。 声道参数 u 清浊音开关 激励模型 j 声道模型 l辐射模型 图2 1 语音信号的数学模型 23 语音信号的统计特性 语音信号的统计特性可以用它的波形振幅概率密度函数和一些统计量, 如均值和自相关函数来描述。表示语音信号的统计特性的概率密度的估算方 法是根掘长时阳j 范围内一段语音信号的大量采样数据的幅值绝对值计算出器 l 弼度磨方图,然后,根据统计的振幅直方图,寻找近似的概率密度表达式。 通过埘语音信号统计特性的研究表明,其幅度分布的概率密度由两种近似的 表达。较好的是修证伽玛( g a m m a ) 概率分布”1 : 八加蔫箫 q 巧 式中女是一个常数,与标准差盯。有一i :列的关系: 片 :旦 2 吒 咒种是精度稍差一些的是拉普拉斯( l a p l a c i a n ) 分布: m 、:0 5 a e - 4 。 ( 2 6 ) 8 ,。 :立笙鎏。! i 型盔尘竺土釜生丝塞 式中a 是一个山标准差盯。决定的常数: j t t = 盯r 对于长期统计来说,用拉普拉斯分布描述语音信号的统计特性不及用伽 玛分御描述精确,但其函数式却简单一些,也可以用高斯分布来近似。语音 振幅的概率分布不仅反映从一个瞬时到另一个瞬时的取样值的分布,而且还 反映语音强度的总的变化。 语音信号的幅度统计特性同信号的带宽、话音质量、以及进行统计的时 间长度都有关系,对于带通在2 0 0 3 4 0 0 h z 的语音信号来说,几十秒以上的 统i :l - o 鬲度特性接近于伽玛分布,长时间的统计特性也可以用双边指数或拉普 拉斯分卸来近似:而短时统计所得的幅度特性接近于高斯分布。 24 语音特性 语音特性可以归纳为以下三个方面1 2 j : ( ) 语音是一个时变的、非平稳的随机过程 人类发声过程是机械的变化过程,其速度有一定限度的,在一段短时间 内( 1 0 3 0 m s ) 人的声带和声道形状有相对稳定性,可以认为其特征是不变 的,凶而语音的短时谱分析也有相对稳定性。 ( 2 ) 语音大体上可以分为清音和浊音两大类 从语音产生的机理上看,两者有明显的差异,因而在特征上也有明显区 别。浊音在时域上呈现出明显的周期性;在频域上有明显的共振峰结构,而 ii 能量大部分集中在较低频段内。清音则完全不同,它没有明显的时域和频 域特征,类似于白噪声,并且难以与宽带噪声区分。 ( 3 ) 作为一- 个随机过程,语音信号可以用统计分析特性来描述 浯音信号的时域统计特征近似伽玛( g a m m a ) 概率分布、拉普拉斯分布 和高斯分布,在高斯模型假设下,傅罩叶展开系数被认为是独立的高斯随机 变量,均值为0 ,衍方差是时变的。这种高斯模型应用于有限帧长时只是一 利r 近似地描述。 哈尔滨l 程人学硕十学能论文 2 。5 频率选择对语音清晰度影响 利用高通或低通滤波器有选择地率出语音信号中的某些频率成分,会影响 到它的清晰度。图2 2 ( a ) 、( b ) 分别给出了利用六个高通滤波器和六个低通 滤波器分别滤除不同高频与低频信号成分时对单音节或无意义音节清晰度的 影响。( a ) 中横轴为高通滤波器的下截止频率;( b ) 中横轴为低通滤波器的 卜截l :频滤。可以看出,语音的主要特征分布在5 0 0 - - 2 5 0 0 h z 的频带内,可 利用这个频带来检测语酱信号“】。 1 0 。 谴8 0 * 6 0 警 繁4 0 2 i l 高运壤谜事f 鼬 ( $ ) 悯蕾域麓辜t ) ( b ) 图2 2 高通与低通滤波对语音清晰度的影响 在上述所介绍的噪声特征、人类发声机理和语音特性,都是后续算法的 理沦基础。 2 6 语音信号的时域特征 语音检测和莫尔斯信号检测都必须提取各自的信号特征,区分有用的信 号和噪声信号,从而达到信噪分离。特征的提取是检测算法实现的核心步骤。 所谓特征提取即为对原始的语音信号进行观察分析,提取出的特征应尽可能 多的能体现信号的原本特征,最大限度地摒弃那些信号与噪声共性的信息。 我们稀誉选取某种特征,或莱几种特征的组合,能够体现语音的共性,有 效的区分语音段和噪声段。 特征提取准则: 1 q 霹一 ,么 飞一 哈尔滨i 槲人学硕士学位论文 ( 1 ) 能携带更多信号的共性特征; ( 2 ) 特征提取要有较低的计算复杂度; ( 3 ) 要有泛化能力; ( 4 ) 能有实时性: p 向介绍语音特征常用到的部分参数:短时能量、短时平均过零率、频 域的部分能量。 2 6 1 短时能量及短时平均幅度 当窗的起点n = o 时语音信号的短时能量用e ,表示,其计算公式如下: 一l e n = j 。2 ( h ) ( 2 - 7 ) n = 0 其中j v 为帧长,如果窗的起点不是n = o ,而是某个其它整数胁那么相 应的短时能量用t 表示,其取和限是n = m ( m + n - 1 ) 由r 短时能量函数对高电平非常敏感,我们采用另一个度量语音信号幅 度值变化的函数,即短时平均幅度函数 t : n i m ,= 1 k ( 圳 ( 2 8 ) m 。0 m ,也是一帧语音信号能量大小的表征,它与e 的区别在于计算时小取 样值和大耿样值不会因取平方而造成较大差异。 短h 、 能量和短时平均幅度函数的主要用途有: ( 1 ) 可以区分浊音段与清音段,因为浊音时e 。值比清音时大得多。 ( 2 ) 叮用来区分声母与韵母的分界,无声与有声的分界,连字的分界等。 ( 3 ) 乍为一种超音段信息,可以用于识慰中。 262 短时平均过零率 肖窝的起点n = o 时,语音信号的短时过零率用而表示,以表示一帧语音 中语音信号波形穿过横轴( 零电平) 的次数。它可以用相邻两个取样改变符号 的次数来计算如下: 1一l z 0 = 去匹i s g n s 。( h ) 卜s g n s 。( h 一1 ) m ( 2 9 ) 哈尔滨i 。群人学硕十学位论文 其中n 为帧长,s g n 表示取符号,即 渺m = 名蒜 协 同样,当窗的起点为任意整数m 时,过零率用z 。表示。 2 ,6 ,3 短时相关分析 相关分析是一种常用的时域波形分析方法,语音信号分析中,我们经常 用到短时自相关函数,语音信号t ( m ) 的短时自相关函数b ( 女) 的计算式如 下: 足。( 女) = 讳( h 。( m + t ) ( o 女茎k ) ( 2 1 1 ) k 是最大的延迟点数。 短时白相关函数具有以下的性质: ( 1 ) 如果xf m ) 是周期的,则自相关函数也是周期函数,并且周期一样: ( 2 ) 凡,f a ) 足偶函数; ( 3 ) 当女:o 时,自媚关函数具有最大值,并且如( 0 ) 等于确定性信号序 列的能量或随机性序列的平均功率。 2 7 语音信号的频域特征 2 71 频域的部分能量 人耳的对语音信号频谱差别的敏锐感知力使得人类可以区分近似的语 音。因而语音信号的频域信息也代表了语音的全部信息。频域分析是语音研 究的重要方法。短时傅旱叶变换就是在语音信号的短时平稳性假设下,用稳 态方法分析语音信号,给定有限长帧序列x ( h ) 的离散快速傅里叶变换( d f t ) 为f 4 1 : 一4 ( 女) = ( q ) = x ( 刚侈0 s n l ( 2 1 2 ) n = o 式中,。:q 。t ,u 为数字角频率,因为= q r ,故。无量纲。o 为 模拟角频率,因为q :2 可,敌q 的量绢为1 秒。而无限长序列的傅晕叶变 哈尔滨l 稃人学硕士学位论文 换为 因为 由 x ( c o ) = x ( n ) e 一” ( 2 1 3 ) x ( 6 0 + 2 n - ) = x ( n ) e 7 。剖= x ( n ) e ”“= x ( ) 所以,朋“) 是6 9 的周期函数,周期为2 月。以下是对d f t 的解释 q 。= 警= 。,: 义峨= 百2 7 - 得: 所以 从而 卟和, 2 矾:i 2 7 工 i v k = 冬nk 【o ,n 一1 ( 2 1 4 ) ( 2 ,1 5 ) ( 2 1 6 ) ( 2 1 7 ) 2 7 2 频谱幅度平均 氏度为n 的序列x ( n ) 的离散快速傅晕叶变换( d f t ) 如公式( 2 1 2 ) ,若 有m 帧长度为n 的工( h ) 序列,则频漕幅度平均为【8 】: 1 埘一i 陋( 芷) | = 专l ,( 女) i ( 2 _ 1 8 ) 28 语谱图 语音的时域分析和频域分析是语音分析的两种重要方法。但这两种方法 、 堕尘鎏。! :型盔兰竺耋耋垡鎏銮 各有其局限性:时域分析对语音信号的频率特性没有直观的了解:频域分析 中没有语音信号随时问的变化关系。因此,入们致力于研究语音的时间依赖 于傅罩叶分析的方法,这种时间依赖于傅旱叶分析的显示图形称为语谱图, 用语谱图分析语音又称为语谱分析。语谱图中显示了大量的与语音的语句特 性有哭的信息,它综合了频谱图利时域波形的优点,明显地显示中语音频谱 随刚问的变化情况。域谱图的具体分析方法町以参考c o o l e d i t 软件 短时傅里叶变换幅度的平方l 。( p ) r 是信号x ( ”) 在时间n 处的频谱能量 密度函数,也即信号x ( n ) 的短时自相关函数的傅里叶变换。其计算表达式如 式( 2 - 11 ) 。在实际计算时,一般用离散傅里叶变换代替连续傅罩叶变换,这 就需要对信号进行周期性扩展,即把x ( n ) w ( 一) 看成是某个周期性信号的个 j 嗣期,设w ( n ) 窗长为l ,则自相关函数r ,( 女) 的长度为2 l ,为保证循环相关 和线性相关的等价,需在x ( n ) w ( n ) 后补零以扩展成长度为2 l 的序列后再做 傅艰| _ 变换。此时所求的功率谱函数p 。( 0 3 ) ,是二维的非负实值函数,用时 问i 1 作为横坐标,频率c o 为纵坐标,将p )的值表示为灰度级所构成的二o(co 维图像就是语谱图。这种反映语音信号动念频谱特性的时频图在语音分析中 有重要的应用价值,称为可视语音( v i s u a ls p e e c h ) 。实际上这种谱图是一种 :三维颛谱,即同时在时问和频率上显示出语音的特性,是一种动态频谱,任 一给定频率成分在给定时刻的强弱用相应点的黑白度即色调的浓淡来表示。 2 9 莫尔斯信号的发展 1 8 3 7 年,一位名叫莫尔斯的画家和精通机械的工程师设计出著名的莫尔 斯电码,并于六年后建设了华盛顿到巴尔的摩的电报线路。该电报机是用点 ( 短信号) 、划( 长信号) 和空白( 无信号) 的组合来表示字母、数字和符号。 这种以断续电流柬表示的莫尔斯电码,载着信息通过电报线路传送到远方。 莫尔斯从在电线中流动的电流在电线突然截止时会进出火花这一事实得 到启发,“异想天丌”地想,如果将电流截止片刻发出火花作为一种信号,电 流接通而没有火花作为另一种信号,电流接通时间加长又作为一种信号,这 i 种信号组合起来,就可阻代表全部的字母和数字,文字就可以通过电流在 哈尔滨l :程大学硕十学位论文 。_ 。_ i i _ _ _ i _ _ _ - _ _ _ _ i _ _ _ _ i _ _ _ - _ i _ _ i _ _ l - l i i _ _ ;i i - ;i i i f 乜线巾传到远处了。 经过几年的琢磨,1 8 3 7 年,莫尔斯设计出了著名且简单的电码,称为莫 尔斯电码,它是利用“点”、“划”和“间隔”( 实际上就是时问长短不的电 脉冲信号) 的不同组合来表示字母、数字、标点和符号。 1 8 4 4 年5 月2 4f 1 在华盛顿国会大厦联郊最高法院会议厅里,一批科学 家和政府官员聚精会神地注视着莫尔斯,只见他亲手操纵着电报机,随着一 连串的“点”、“划”信号的发出,远在6 4 公里外的巴尔的摩城收到由“嘀”、 “i l _ ”声组成的世界上第一份电报。 电报机有入jr = 和自动两种,还有有线发送和无线发送两种方式。入工电 报机足由人柬按动电键,使电键接点开闭,形成“点”、“划”和“间隔”信 号,经电路传输出去,收报端接到这种电信号后,便控制音响振荡器产生出 “响”、“嗒”声,“嘀”声为“点”,“嗒”声为“划”,供收报员收听抄报。 在无线通信情况下,发报端除有发报电键外,还必须有发射机,以便将 电键发出的电脉冲信号变换( 即调制) 成高频载波信号,才能发送出去。在 接收端,除了耳机外,还必须有接收机,它将发射端发送的高频载波信号接 收卜- 束,再变换( 即解调) 成音频信号,供人工收听抄报。 自动电报机的发报端在发报时,事先将准备发送的报文用专用的凿孔机 凿成发送凿孔纸带,然后用快机发送出去。在收报端,使用波纹收报机来收 报,即在移动的纸带上自动记录莫尔斯电码波纹信号。电报的发明,为各地 气象资料的迅速传递和集中提供了条件,使绘制当同天气图成为可能。 电报系统传送的信号有两个典型的特征:一是在时间上是间断、不连续 的;= 是在电强度上也是不连续的,只有有限的离散值。这说明电报信号有 典型的数字信号特征。可以说,电报通信是数据通信最原始的雏形,尽管它 传送的信号速率很低,信息量很少,但是在很多方面与今天的数据通信有很 多共俐点。 也许您的生活已经和莫尔斯电
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民法课件笔记
- 初源电子理论考试题及答案
- 表格考试题库及答案大全
- 民歌编花篮声部课件
- 新质生产力陕西行
- 金融业拥抱新质生产力
- 新质生产力:内涵与发展路径
- 广东:加快形成新质生产力路径
- 广东视角:新质生产力的实践与思考
- 端午节特色的活动策划方案
- 麻风病防治知识讲座
- 2023年威海桃威铁路有限公司招聘笔试参考题库附带答案详解
- 急性心梗诊疗(2025指南)解读课件
- 2025至2030年中国综合能源服务产业投资规划及前景预测报告
- 虾滑产品知识培训课件
- 2025-2030全球宠物电器行业发展趋势分析及投资前景预测研究报告
- 吸痰护理操作课件
- 2025年天津市专业人员继续教育试题及答案3
- 主要诊断及主要手术的选择原则
- 2024年急危重症患者鼻空肠营养管管理专家共识
- 医学教材 《中国高尿酸血症相关疾病诊疗多学科专家共识(2023年版)》解读课件
评论
0/150
提交评论