(通信与信息系统专业论文)基于二次时频分布的语音信号分类与验证.pdf_第1页
(通信与信息系统专业论文)基于二次时频分布的语音信号分类与验证.pdf_第2页
(通信与信息系统专业论文)基于二次时频分布的语音信号分类与验证.pdf_第3页
(通信与信息系统专业论文)基于二次时频分布的语音信号分类与验证.pdf_第4页
(通信与信息系统专业论文)基于二次时频分布的语音信号分类与验证.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(通信与信息系统专业论文)基于二次时频分布的语音信号分类与验证.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华北电力人学硕士学位论文 摘要 语音信号分类悬语音识别、说话人识别和语音合成的一个熏要基础过程,其首 要问题就是选择合适的信号特征参激。 论文首先对时频分析和语音信号处理研究的发展做了简要回顾,然后对短时傅 立时变换、线性预澜分搴斥、g a b o r 变换、小波交换和同态分析等语音特征表示技术 以及最小距离分类器、矢量量化、g m m 和h m m 等算法模型的原理、应用场合和特点 做了深入探讨。针对短时傅立旰变换和小液变换在表现添音信零参数稽缁结梅上的 不足,本文采用二次时频分布做为语音信号的特征参数。为获得理想的分类效果, 采嗣n e l d e r m e a d 算法对选笄l 静核函数静参数避行了後仡。最怎,通避语音诞嗣 和说话人识别实验戥示,采用优化的核函数,以二次时频分布为特征进行语音信号 分类,可敬获褥理憋静效暴。 关键嗣:语蠢镶剐,谎话入鼋筵嗣,簿频分务,最小距离分类器 a b s t r a c t c l a s s i f i c a t i o no fs p e e c hs i g n a l si sa ni m p o r t a n tb a s eo ft h es p e e c hr e c o g n i t i o n , s p e a k e rr e c o g n i t i o na n ds p e e c hs y n t h e s i s ,f o rw h i c ht h ec h i e fi s s u ei st os e l e c tt h ep r o p e r c h a r a c t e r i s t i c so fs i g n a l s f i r s t l y , w er e v i e w e dt h er e s e a r c ho ft i m e f r e q u e n c ya n a l y s i sa n ds p e e c hs i g n a l p r o c e s s i n g t h e nt h ed i s s e r t a t i o ns t u d i e st h ep r i n c i p l e s ,a p p l i c a t i o n sa n dc h a r a c t e r i s t i co f t h es p e e c hc h a r a c t e r i s t i cr e p r e s e n t a t i o nt e c h n o l o g i e s ,s u c ha ss h o r tt i m ef o u r i e r t r a n s f o i t n ( s t f t ) l i n e rp r e d i c t i o nc o d i n g ( l p c ) 。g a b o r 曩a n s 勤r ma n dw 8 v e l e t t r a n s f o r m ,a n da r i t h m e t i cm o d e l ,s u c h a sm i n i m u md i s t a n c e c l a s s i f i e r , v e c t o r q u a n t i z a t i o n ( v q ) g a u s s i a nm i x t u r em o d e l ( g m m ) a n dh i d d e nm a r k o vm o d e l ( 珏m m ) s i n c es t f ta n dw a v e l e tt r a r t s f o r mc a n t r e p r e s e n tt h ef i n es t r u c t u r eo f s p e e c hs i g n a l ,t h et h e s i su s e sq u a d r a t i ct i m e f r e q u e n c yd i s t r i b u t i o na st h ef e a t u r eo ft h e s i g n a l s t oo b t a i nt h eb e t t e rp e r f o r m a n c eo fc l a s s i f i c a t i o n ,t h es e l e c t e d k e r n e l sa l e o p t i m i z e db yn e l d e r - m c a da r i t h m e t i c f i n a l l y , t h ee x p e r i m e n t so fs p e e c hr e c o g n i t i o n a n ds p e a k e rr e c o g n i t i o ns h o w st h a tw ec a no b t a i nt h ep e r f e c tp e r f o r m a n c eo f c l a s s i f i c a t i o nw h e nq u a d r a t i ct i m e - f r e q u e n c yd i s t r i b u t i o n sw i t ho p t i m i z e dk e m e la r e u s e da sc h a r a c t e r i s t i c s z h e n gp u l i a n g ( c o m m u n i c a t i o na n di n f o r m a t i o ns y s t e m ) d i r e c t e db yp r o f x ug a n g k e y w o r d s :s p e e c hr e c o g n i t i o n ,s p e a k e rr e c o g n i t i o n ,m i n i m u m d i s t a n c ec l a s s i f i e r t i m e f r e q u e n c yd i s t r i b u t i o n s 华j e 电力人学硕士学位论文 璃要 语音信号分搬是语音识别、晓话人识别和语音合成的一个重要基础过程,其首 要阀题就是选择台适的信号特征参数。 论文营先对辩频分撰彝嚣露售号楚理嫒突戆发震皴了麓要密颞,然基对短辩簿 立叶变换、线性预测分析、g a b o r 变换、小波变换和闻态分析等语港特征表示技术 以及擞小距离分擞器、矢量量化、g m m 和h m m 等算法模型的原理、应用场合和特点 徽了深入探讨。针对短时傅立时变换和小波变换在表骥语音信号参数精细结构上的 不足,本文采焉二次时频分布徽为语音信母的特征参数。为获褥理憨的分类效聚, 采用n e l d e r m e a d 算法对选用的核函数的参数进行了优化。最后,通过语音识别 和说话人识别实验显示,采用优化的核函数,以二次时频分布为特征进行语音僚号 分类,霹瑷获褥瀵惑熬效采。 关键词:语音识别,说话人识别,时频分布,最小距离分类器 a b s 至l 弧e t c l a s s i f i c a t i o no fs p e e c hs i g n a l si sa ni m p o r t a n tb a s e o ft h es p e e c hr e c o g n i t i o n , s p e a k e rr e c o g n i t i o na n ds p e e c hs y n t h e s i s ,f o rw h i c ht h ec h i e fi s s u ei st os e l e c tt h ep r o p e r c h a r a c t e r i s t i c so fs i g n a l s f i r s t l y , w er e v i e w e dt h er e s e a r c ho ft i m e - f r e q u e n c ya n a l y s i s a n ds p e e c hs i g n a l p r o c e s s i n g t h e nt h ed i s s e r t a t i o ns t u d i e st h ep r i n c i p l e s ,a p p l i c a t i o n sa n dc h a r a c t e r i s t i co f t h es p e e c hc h a r a c t e r i s t i cr e p r e s e n t a t i o nt e c h n o l o g i e s ,s u c ha ss h o r tt i m ef o u r i e r t r a n s f o r m ( s t f 羊) ,l i n e rp r e d i c t i o nc o d i n g 模型是个全零点模型。 c ) 自回归一移幼平均( a r m a ) 模型是一个既有零点,又有极点的模型。 考虑到求解a r 模登的歪姻方穰( n o r m a le q u a t i o n ) 是一组线性方程,丽求解 m a 和a r m a 模型的方程是非线性方程,所以在实际应用中a r 模型馒用较广泛,丽曼 a r 模型又可以与基于级联无损声管的语音产生模型相关联,因此在语音信号处理领 域获褥了广泛采蠲,萁中线褴预测分析技术采用的时域模型就是基于a r 模型。 线性预测分扳螅基本思想o ”是,各谖音榉点可用其过去若于个撵点馕豹“线性 组合”来逼近。通过线性预测得到的采样在最小均方误差意义t 逼近实际语音采样, 可疆求敬一组难一的预渊系数,这些系数也怒线性组合中所羽的加权系数。线性预 测分叛最早用于语豢编褥,因此也常被称为l p c 0 农时间r = 村附近对x ( 即) 傅立叶变换的局部化。对于 v 掰e r ,这种局部化完成的很好,达到了对x ( e j “1 的精确分解,而完擞地给出了 x ( ”) 频谱的局部信息,充分体现了g a b o r 变换在时间域的局部化思想。 作为信号分析的工具,短时傅立叶变换和g a b o r 变换发展了傅立叶变换,能够 潢建信号憝理躺一骛特骤需要。毽怒,避一步的磺究发现,它们都没有离散韵正交 基,使得在数值计冀时,没有像离散傅立时变换中f f t 那样的快速舞法,限制了冀 应用;另一方面,当选定窗函数后,对傅立叶变换和g a b o r 变换而富,时频窗函数 9 一 华北电力大学硕士学能论文 的形状是固定的,不能随所分析的信号成分足高频还是低频等信息做相应的变化, 恧蒌乎稳繁号龟含躲频率戏分i 常事富,瑟以,它饲嚣萋平稳信号静分援缝力真凝。 2 5 小波分析 短时傅立叶变换、g a b o r 变换和本节将要讨论的小波变换都属于线性时频分析, 而小波变换和前两种变换的主要隧别在于时频平面里网格划分的特殊性。 短时倦立时变换髑固定长度的溪动窑对语密信号进行分棱,从雨可以表征信号 频率的弱鄢特性。辩域的滑动窗姣瑗等效予频城以滤波器缀将信号分频段滤波,各 个滤波器媳有相同的频率特性,只是各个中心频率沿分析的频带等间隔分布。也就 是说,短时傅立叶变抉以等宽的滤波器组对非平稳信号进行分析,并从嚣路滤波器 输窭熬辩阏交讫褥箱不霜露霾熬猿察分量弱分奄潺琵。焉g a b o r 交换豹特毪,迄与 此类似。 很盟然,这种在时域等宽的分析方法并不是对所有信号都合适。法阑科学家j m o l e t 予2 0 世纪8 0 年代积在分援缝震波的局部特性时发瑷,这类信号在低频螺应 该具有缀璃的频率分辨率,在高额端的频率分辨率可以较低。从对频不确定牲原理 角度来看,这类信号的高频分量成该具有高的时间分辨率,而低频分量可以具有低 的时间分辨率。据此,m o l e t 提出了小波变换。所谓小波,“小”是指其舆有衰减性; “渡”撵蒺渡交往,静小波靛振旗爨有菝辐王受矮阗静振荡形式。小波疆论采爱多 分辨率分析的思想,j 均匀地划分时频空间,在时频平面上具有不同的分辨率。小 波分析的目的就是既要看到信号的概貌,又要精到信号的细节。 不仅人工造震勘探信号具有这撵蕊特性,谗多鑫然信譬( 铡妇语磐、图像等) 也具有类似的特性。骈以,小波交换很快成为信号处理领域的研究热点,已经广泛 的应用于信号处理、语音分析和合成、图像处嫒、计算机视觉等诸多领域”6 ”1 。 用数学形式来表示小波,小波就是在函数空间r ( r 1 申满足下述祭l 牛的一个函 数或者倍譬矿汹: ,l v f 1 | 2 c ,= i l l d e a ( 2 1 1 ) 式中r + 表示零窑数全蒋,葵中¥。”为f 嚣频羧表示形式。 f ,f # ) 穗为,l 、 波母函数。对于任意的实数对( d ,b ) ,称下式所示的函数为幽小波母函数( ,) 生成的 依赖于参数f a ,b ) 的连续小波函数,简称小波。其中参数a 必须为非零实数。 # ( 0 = 了i | 坐l 2 - 1 2 ) 一1 0 一 华筵毫力大学醺齄学穰论文 其中,连续性指参数对( 口,6 ) 可以连续瞅值。若口,b 不断变化,则可以得到一族 函数。( ,) 。 当_ i i l f 主要使用的几种母小波函数有以下几种 ( 1 ) i t a a r 母小波。最篱单的母小波爨羧是以h a a r 函数 ( r ) = 1 0 蔓f 二 一l 土兰f 1 o ,其它 ( 2 - 1 3 ) 挈綦函数绝遣h a a r 嚼小波。容易验证,h a a r 母,l 、波跫种歪交函数系,郄露 e 。( r ) 。( f h ) 衍= o ,”= o ,l ,+ - 2 ,- ( 2 - 1 4 ) ( 2 ) 赢斯母小波。睡l 离斯函数 矽f ) = g 。2 ( 2 一l 国 给定。 ( 3 ) 墨西哥草帽小波。这种母小波是g a u s s 母小波函数的二阶倒数 妒( f ) 5 丽2 ( 1 一f 2 ) p 1 叶2 睁1 6 ) 式中系数豹选择是为了满是单位能量条俦。 ( 4 ) m o r l e t 母小波。以上三种母小波都是实值小波,而m o r l e t 小波是最常 用的笈值母小波,定义为 妒( r ) 2 击( e _ 虬e 1 啦2 ) e 。叶2 1 7 ) 上述四种小波,除了隔斯外,其余的都满足容许条件即 r 妒( f ) 前= o ,这约束将使妒( ,) 的图形符合“一小段波”这一特征。参数d 称为 尺度因予,作用是把基本小波( f ) 做伸缩;参数b 称为平移因子,l 乍餍是确定对信 号善( f 分孝厅匏薅润霞藿,纛帮霹褥中心。平移因子矗= o 豹,j 、泼,。捞索蘧稼为尺瘦 小波,很显然,母小波和尺度为1 的小波。( ,) 完全相同。虬。( ,) 在扭6 的附邋有 明髭的波动,波动范围的大小完全依赖于尺度因子盯的变化。强a = 1 时,这个范围 一 一 华北电力大学硕十学何论文 秽器寒静小渡函数y ) 懿范溺是一致豹;当口1 薅,这个范围院照来豹,j 、波透数 渺( ,) 的范围大些,小波的波形变得矮窳;当口变的越来越大时,小波的形状变得越 累越宽、越来越矮,整个函数的形状表现出来的变化越来麓缓慢;警0 0 ,这时时间域豹窗1 2 1 宽度口( y ) 随着a 一起变小,中心频率变岗,检 测到的主要是高频成分。对于较大的d 0 ,时域窗口a a ( q 1 随着麒一起变大,中心 频率变低,捡溅舅静主要是酝凝成分。 小波分析是从傅立叶分析方法的发展和延拓,两者相比,主要肖以下的不同: ( 1 ) 傅立叶变换用到的基本函数只有s i n ( c o t ) 、c o s 国f ) 和e x p ( j ( o t ) ,舆有唯 一性;小波分季厅瑗羽的函数羹| j 其有不瞧一往,同样一个闻遂瑁不巅的小波涵数进行 分析,有时结果相差很远。 ( 2 ) 在频域,傅立时变换其有缀好静局部亿篷力,健在时竣巾,傅立时变换 没有局部化能力,无法从信号的傅立时变换中稽出原信号在任一时间点附近的形 态。 ( 3 ) 筹霜信号暹过滤波器来瓣释,小渡交换与短时缮立时变换懿不同之楚在 一1 2 华北电力大学硕: = 学位论文 于:对于短时傅立叶变换来说,带通滤波器的带宽与中心频率无关:相艇,小波变 换带宽剐琵毙与中心壤率,帮小没变换对应瞧滤波器有一个恒定的箱黠穆宽。 讵是小波变换其商傅立时变换无法比拟的性质,这使得很多学者将小波变换应 用到语音信号的研究中,主要应用领域有:利用小波对听觉感知系统进行模拟,对 语音信号i 揸行降噪,进行清、浊音的判别等。 2 6 固态分析 对于线性叠加并熙频谱不重合的多个信号,可以采用线性滤波器把他们分离出 来。而在语音信号的线性模型中,激励源与系统是卷积结合的,所以就不能采用线 滢滤渡爨豹方法,纛蛩采用鼹卷辍戆处理技术。鏊羲使用熬鳃卷积技零霉嚣秘,一 种就是前丽提到的线慢预测分析技术,是一种参数分析方法;另外一种就是同态分 析方法。同念分析的撼本思想是将非线性结合在一起的信号映射为加性结合的信 号,从两通过线性滤波嚣对其进行分离。对语蠢信号进行阉态分捱后,褥到语音信 号豹倒谱参数,困魏瓣态分析也稼为餐谱分轿藏酋同态楚溅。司态处理怒一种比较 好的解卷积方法,可以较好的将谱裔信号中的激励信号和声道响应分离,并且只需 要十几个倒谱系数就能相当好的描述语音信号的声道响应,因而在语音信号处理中 占舂擐螯疆豹整置。 同态系统能够将非线性结合的信号变换为加性信号,通过线性滤波器进行分 离,是基于同态系统可以表示为三个同态子系统的级联,遮称为同态系统的通用表 示。“。一个卷积同态系统的通用表示如图所示,餐号t 表示是根据卷积缀合攫则缝 合起来的空闯。同态系统酌一个鬣主要理论是黼态系统分辩,分解匏黉的是用两个 特征系统和一个线性系统来代替非线性的同态系统。( a ) 爝系统的通用寝示,也是 系统分解的示意图;( b ) 是特征系统子系统d 的结构示意图;( c ) 是逆特征系统所1 熬结稳示感圈 地! 研! 葛 墨笥司 ( a ) 禚积同态系统通用示意圈 摘氅鍪l j l _ 二j l 二二j 1 3 一 华北电力大学硕十学位论文 ( b ) 特征系统d 的结构示意图 文生f 陶料枣帕 【一1 一i j ( c ) 逆特征系统缓鹎缝梅示意图 凿2 1 卷狡蔺态系统及英分解和特征系统的构成 图中x ( 斗) 是输入的语音信号,它是声门激励信号和声邋响应的卷积,膏( ”) 是输 天语音售号筑翻谱,y ( 疗) 是浚复谬密信号e ( a 中稳l 部分是对瓣卷狡嚣,楚理为 加性结构的圣( ”) ,按照需要,进行线性化处理。 1 4 一 华北电力大学硕士学位论文 第三章二次时频分布研究 鏊于蜷立畸变羧戆信号频蠛表示及冀疑量载频域分鑫撼示了癌号褒频域戆特 征,是平稳信号分析的有力工具。但是,傅立叶变换作为一种整体变换,对信号的 表缝疑么完全在对域,要么完全在频域,对于语音售号等非平稳壤号,不能 i 5 l 逑信 号频谱随时问变化的情况,因此要使用时问和频率的联合函数来表示信号,这种表 示就称为售号豹露频表示。时频表示分为线性帮二次型弱秘。典型的线性时菝袭示 有上章指出的短时傅立叶变换、小波变换和g a b o r 变换。对于二次型时频表示, 我们希望能够描述该信号驰能量密度分奄,这秘燮严格意义下戆时频表示称为攘号 的时频分布i i “。 3 1 时频分布的蒸本概念 3 测苓熬原理 令x ( t ) 是一个共有有限能量的零均德复信号,x ( t ) 蛇有殴变度t = a t 和频谱 x ( y 1 的有限宽度b = a f 分别称为该信号的时宽和带宽,并定义为 r :( a ,) z :衅 ( 3 一1 ) 肪( r ) 1 4 d t 妊t 研= 黼 渺2 , 装x k ( f ) = x ( 缸) 代表拉l 枣后鲍信号,其中k 为挝讳毙,则拉l 枣信号懿黪窕是艨售 号时宽的女继。另外,计算抛馋信号的f o u r i e r 变羧褥到五( ,) = 妻x ( ) ,是 。, 再由帮宽b 的定义知,拉伸信号的带宽是服信号带宽的? 1 倍。显两易见,拉馋傣号 的时宽一带宽乘积与原信号的时宽一带宽乘积相间。这一结论说明了对于任意信号 恒有关系式t b = 常数的可能性。当然对于不同的信号,该常数可能不捆同。不确 定毪簸理( 藏称测不准霖毽) 准确罐速了一个信号虢露宽帮带宽之闻的这种基本关 对于商限能爨的任意信号,其对宽和带宽的乘积憩是满慰下面不簿式: 1 5 华趣毫力大擎璐一 ? 学侮论文 时宽一带宽乘积= t b = 或t b = a t a d o 毒 ( 3 3 ) 4 万z 不确定憾原理也称测不凇原理或h e is e n b e r g 不等式。式( 3 3 ) 中的f 和厂分别称 为时阍分辨率和频率分辨率,它们表示蛉怒鼹对阀点积两频率点之闻信号的区分艇 力。 在信号处理尤其是非乎稳信号处理中,鬻函数往往起着关键作用。所加密函数 能否证确反映信号的时频特性( 即窗函数魁褥具有高的时间分辨率和频率分辨率) , 这与待分析信号的非平稳特性有关。不确定巾生原理的重要意义在于它告诉我们,既 有任意小的时宽,又有任澈小的带宽的窗函数是根本不存在的。两个极端的例子是: 净激绥号z 秘= 艿) 兹黪宽梵零,露萁繁宽免无穷大;单位壹浚壤号z - l 戆豢凳菇 零,黼箕时宽戈无穷大。谯缮强调的是,对蒋平稳信号 乍热越的局域处理,密遵数 内的倍母必须是基本平稳的,即窗宽必须与非平稳信号的局部平稳性相适应。因此, 非平稳信号分析所能获 替的频率分辨率与信号的“局域平稳长度”有关。该长度很 短的信号是不可能直接得到高的频率分辨率的。 信弩分为乎稳信号秘游平稳信号两大类,乎稳售号有二除_ 乎稳和赢除乎稳之分, 裴乎懿信号中又寿一大褥魏予类是锤琢乎稳鹣。在速鼙挺密褥耨麓瑷轰,瑟纂平 稳信号还存在另外一大特殊子类具有二次激平稳特性:信号x ( t 1 本身是非平稳的, 但其乘积信号x f + p it 一i 却是平稳的。称这类非平稳信号为二次型平稳信号, 、2 2 懿j 平稳夔摹分量线性调频痿号裁是二次鍪平豫售号。可隧慧到,魏票一个j 乎稳 信号o f 的二次型是平稳的( 鄂有无穷大麓褥域平稳长度) 或密其有跣x 扛) 本身受 长“二次型局域平稳长度”,我们就可以对前种信号的乘积信母加无穷宽的窗函数, 对后种信号的乘积信号使用足够宽的窗函数,当然其窗宽要与信号的循环平稳长度 ( 即臼相关函数的时间周期) 相适应。 露蕊数与局域平稳长发闯靛上述关系琰示我们,时频分布逶舍用作局域平稳长 瘦跑较大的菲平稳信号翡瓣簇分辑;若爱域乎稳长疰缀枣+ 麓辩频分季厅鹃效采较麓。 3 1 2 时频分布的基本性腹要求 对于任何一种实际和有用的非平稳信号分析,通常要求时频分布具有表示信号 能量分奄的特性e 因此,瓣予一个菲平稳信号x ( f ) 希望时频分布满足下面的一些麓 本瞧璇。 时频分布必须是实的( 且希望是非负的) 。 时频分卸关于时间,和频率,的积分应给出信号总能量e ,即 一l 巷一 华j 遣力大学颈士学霞论文 户( f ,s ) d , d s = e ( 3 - 4 ) 边缘特性: p ( f ,s ) d 一”可d r = 层 z r + 主) z ( ,一2 1 s j 2 州d r ( 3 - - 2 5 ) 交换数学期望与积分两个辫子戆位置,剐式( 3 。3 5 ) 给出以下结果: s :0 ,力=莒 z ( ,+ 匀z ( r 一书。一露珂d r ( 3 2 6 ) 这表明,信号z ( t 1 的演变谱等于该信号的w i g n e r v i l l e 分布的数学期望,即 s 二0 ,力= e 眠0 ,翼 ( 3 - - 2 7 ) 出予邀一关系,有时也将演变谱豫俸w i g n e r v i l l e 诺。 众所周知,在平稳随机信号的相关分析中,两个随机信号x ( ,) 和y o ) 的相干魔定 义为 c 蒯= 南路( 3 - - 2 8 ) 类似的,可以定义两个菲平稳随机倍号x 和) 和y 回的相干发。由于这种相干发怒 时间和频率两个变量的函数,所以称其为时频相干度函数,定义为 ) = 揣 ( 3 2 9 ) 式中s ,) 鞠s ,参,力分麓楚信号x 章) 毒蠢y f ) 囊滨交谱,嚣s 。,力是x 辜裒y 毒) 懿 演变谱,由下式定义: 啪= 叫x ( r + 抄( ,一册川= e 帆) ) ( 3 - - 3 0 ) 国式( 3 - - 2 9 ) 窖易滋明时频枢于度遨数具有下列一些毽溪。 瞧溪i :o _ 。2 “”西( 3 - - 3 3 ) 成为模糊函数,式中z ( f ) 是j ( ,) 的解析信号。 z ( f ) 的瞬时相关函数为: 咖) - z ( ,+ 荆r 三) ( 3 - - 3 4 ) 稷撼上蚕( 3 3 3 ) 帮( 3 - - 3 4 ) 繇,摸裁涵数哥滋程为溪对相关涵数关于t 魏缮立 叶蜃蛮换: 奠( f ,y ) = f 一1 陵”) j ( 3 3 5 ) 对比模糊函数和w i g n e r v i l l e 分布可知,它们都是双线性变换信号或糟瞬时相关 函数k ff,f翡莱耱线经交换,焉者变挟到辩频平鬻,表示能量分匆,称为髓量域;z 前者则变换到时延一频偏平面,表示相关,称为相关域。既然模糊函数表示相关, 哥鞋涯疆w i g n e r - - v i l l e 分布是模獭函数豹二维传立甘交换。郢有 睨( f ,) = 4 ( r ,v ) e - j 2 ”( 1 v + r f ) d p d r ( 3 3 6 ) 信号o ( r ) 相对于参考信号y ( f ) 的互模糊函数定义为 4 ,( 刚) = 。j ,+ ( 卜v 胁“d t = f 叫1k z , y ( ) ( 3 3 7 ) 式中f 一1 颤,( f ,却) 楚信号z ( f ) 和y f ) 静互瞬对葙关函数t ,( f ,“) 瀚薅立时反交换: f 一1 恕,( ,“) ;t ,f ,“) e 站“者 ( 3 3 8 ) 2 2 华北电力大学硕士学位论文 式中。( r ,“) = z ( ,) y ( ,一v ) 。 3 4c o h e n 类时频分布 6 0 年代中期,c o h e n 发现众多的时频分布只怒w i g n e r - - v i l l e 分布的变形,它 们可以用统一的形式表示,不同的时频分布只是体现在积分变换核的函数形式选择 上,两对于时频分布各种髓质的要求刘反映在对梭函数的约束条件上”,这种统一 的时频分布现在习惯上被称为c o h e n 类时频分布。 c o h e n 撩出,信号z 矗) 的时频分布统一袭示为: p 毫,) = f :i 打十三j z ( 甜一三j 庐p ,v 一蹿# 。f + 矿d u d r d v ,鼻( f ) = 去一2 ( f i ( o ,v k o ) 其中爿( ,) 和d o ) 分别是信号 s “) = 一“k ,a o ) ( 3 5 3 ) ( 3 5 4 ) ,型掣l p 卜切砒( 3 - 5 5 ) ( 3 5 6 ) 的幅值和相位。 对于乘积核,式( 3 - 5 5 ) 变作 ( ,) ,只o ) = 去k ( o 扣2 0 k 电) + 2 ( o n ( f n 心) ( 3 - 5 7 ) 那么式( 3 - 5 7 ) 意味着什么呢? 显而易见的是,如果在式( 3 - 5 5 ) 中取 州= 和掣| f = 0 = 。 或在式( 3 - 5 7 ) 中取 ( o ) = 1 和( o ) = o ( 3 5 8 ) ( 3 5 9 ) 然后令鼻( f ) = a2 0 ) ,则有 ( 厂) ,= - 口电) ( 3 - 6 0 ) 如果将c o h e n 类时频分布定义式加以改写,则得到另外两种表达形式: p o ,厂) = o 一“,r k ( + 三 z + ( “一三 e 1 2 珂幽d r ( 3 - 6 1 ) 和 j d o ,) = f i a :( 砂弦( 刈弘川枷4 d r d v 2 5 ( 3 6 2 ) 华北电力大学硕十学位论文 式中,核函数( ,r ) 与( r ,v ) 之间存在下列关系: ( r ,v ) = 广o ,f l 脚”d t ( 3 - 6 3 ) o ,r ) = f :妒( r ,v 讲”d v ( 3 - 6 4 ) 这样,c o h e n 类时频分布的数学性质也取决于核函数y ( f ,f ) 的选择。 在变量f ,f ,r ,v 中任取两个都可以构成一种二维分布,例如瞬时相关函数就是以 时间f 和时移r 作为变量的。剩下一个以频率厂和频偏v 作为变量的分布,称之为点 谱相关函数。 我们将点谱相关函数定义为 k :驴,v ) = z f + 丢) zf 一丢) ( 3 - 6 5 ) 如果我们留意c o h e n 类的w i g n e r v i l l e 分布和模糊函数的表达式,便不难发 现前者用时频平面( f ,) 表示,后者用时延一频偏平面( r ,v ) 表示。事实,卜。c o h e n 类 分布中,一大类成员都可以理解为经过二维滤波之后的w i g n e r v i l l e 分布,并且 可以证明:当且仅当一种时频分布尸0 ,) 可以借助时频卷积由w i g n e r v i l l e 分布导 出时,该分布便是c o h e n 类中的成员。这样一类分布习惯上叫做( 移不变) 能量化 c o h e n 类,记作c 。可用统一公式表示为 p ( ,厂) g e ( t ,) = e 中( ,一,一f 7 y y z ( t ,f ) a c d ( 3 6 6 ) 另外一方面,c o h e n 类分布中另一大类成员与模糊函数密切相关,习惯上称它 们为相关化c o h e n 类。相关化c o h e n 类是能量化c o h e n 类的对偶形式,常记作 气。( f ,v ) ,定义为能量化c o h e n 类分布的二维f o u r i e r 变换: 气。f ( r ,矿) = f 。p ( t ,p 2 扯7 d t a f ( 3 6 1 ) ( 移不变) 相关化c o h e n 类记作c ,( 下标代表相关化) 。重要的是,一种相关 化分御( ,v ) 若属于c 。类,则它可以表示成核函数矽( r ,v ) 与模糊函数a 。( r ,v ) 的乘 积,即有 p 。,( f ,y ) c c := 只。,( f ,p ) = 0 ( 3 ,v ) a :( f ,y ) ( 3 - 6 8 ) 除了能量化c o h e n 类之外,仿射类是另一类能量化c o h e n 类。仿射类a 。是这样 一类二次型时频分布:它们能够保持时间尺度不变和保持时移不变,即 孑o ) = 抓砝【口o - t o ) 】辛b ( 口( f r 。l 丢) ( 3 6 9 ) 任何一种仿射类的时频分布p 7 都可表示成w i g n e r v i l l e 分布的仿射变换: 2 6 华北电力人学硕士学位论文 ( f ,) 以铮芝( r ,厂) :z f 厂( ,一f ) ,等1 ( f f ,7 p 谚 ( 3 7 0 ) 由于定义能量化c o h e n 类c 。和仿射类a 。的公理不互相排斥,所以存在一些同 属于c 。和4 。类的时频分布,即它们能够保持时移,频移和时间尺度的不变。这些 “移位一尺度不变”的时频分布形成了c o h e n 类和仿射类爿,的交集c a 。= c ,n 彳,。 移位一尺度不变时频分布的最大特点是:( f ,y ) 取“积核”形式,即它仅取决 于r 和v 的乘积: 巴o ,) c a ,矿( f ,v ) = z ( r v ) ( 3 - 7 1 ) 一维函数z ) 完全描述时频分布芝o ,f ) 。这意味着,时间一时间滞后核取以下形式: p :占: h r ( 3 7 2 ) 移位一尺度不变类中的w i g n e r v i l l e 分布和r i h a c z e k 分布是广义w i g n e r 分布的 两个特例。 2 7 华北电力人学硕士学位论文 4 1 最小距离分类器 第四章信号分类算法研究 设想在一个说话人识别器中,我们从训练和测试数据的每一分析帧中获取了一 系列的特征参数。我们把这些由每一+ 帧得到的特征参数称为特征矢量( f e a t u r e v e c t o r ) 。最简单的一种说话人识别方法就是根据测试数据和训i 练数据,对说话人 的多个分析帧的特征矢量计算平均值,然后找出这些平均测试矢量和训练矢量之间 的距离。在说话人确认中,我们设定一个距离的阈值,小于此值,就认为检测到了 原说话人:在况话人辨认中,我们把与测试人距离最小的说话人作为目标说话人。 下面我们以m e l 倒谱参数为例子来说明最小距离分类算法: o “【n 】2 去著c , s 陋川( 4 - 1 ) p 1 - 2 去著c , r 【枇,叫( 4 - 2 ) 其中上标船和护分别表示测试和训练数据;m 是分析帧的数目,它们在训练和测试 时是不同的;上是帧长。我们可以用测试数据和训练数据的平均特征矢量之阳j 的均 方差作为一种距离度量,其表达式为: d 2 击善( p 【”f 例( 4 - 3 ) 其中胄是m e l 倒谱系数的数目,也是特征矢量的长度。而且上式中没有包括倒谱零 阶系数的方差,因此对于刻度变换过于敏感。在说话人确认中,当d 小于某一阈值 时,说话人就得到了确认,即 如果d 妒( 肖弦) ( s ) 式中k 怒迭代次数。e m 算法就是在不断的遮代中改进,从而能最好的匹配观测数 据。 4 4 隐舄尔可夫模型 隐马尔可夫模型( h i d d e nm a r k o vm o d e l s ,h m m ) ,是谬膏信号的一种统计模 型,广泛应用于包括语音信号处理在内的众多领域f 4 6 1 【4 7 。有必它的理论基础,烧 在1 9 7 0 年左右由b a u m 等人建立起来的,随后由b a k e r 和j e l i n e k 等人将其应用到 语音t 剐之中,著且取褥了很大的成果。8 0 年代中期成为公认盼研究热点,其基零 理论秘器秘实霉算法莛现代语音谖裂豹重簧蒸戳之一。 对予一个平稳的、非时变的信号来说,弼传统的线性模型来描述即可。值谮啬 信号魁非平稳、时变信号,我们只能在短时间内对语音信号作线性处理,这样,在 一段时问内,语音信号的线性模型参数是时变的,但在很短的时间内它可以被看作 是平稳、非时变的。在这种前提下,处理谮音信号的简单解决思想是:将这些线性 模型参数枣超来,来记秉熬令语音馕号,这藏是骂尔可夫链。壤箕中毒在戆润题楚, 遥拜雾长一段对阕雩# 为一个线性处理的单元。由予语音信号的复杂往,要想准确德 选择这个时间段是很难的,所以这种方法鼠然可行但却不是最肖效的方式。隐马尔 可夫模烈就解决了这个问题,它既能够用短时模型来描述非平稳信号,又可解决短 时平稳段过渡的问题,即什么时间过渡,怎么过渡的问题。 m m 是建立在一阶 m a r k o v 链兹基础之上戆,它靛懿概率特瞧蘩零掴困。不同的楚h m m 是一个双肉焱 式豹疆瓤过程,帮h m m 怒由两个隧辊过耧缎成,一令随机过税籀透状态季疆鼹黎镳 之间的统计对应关系,它解决了用短时模型描述平稳段信号的问题;由于实际问题 比m a r k o v 链模型所描述的更为复杂,观察到的时间不是如m a r k o v 链模型中与状态 一一对威,所以h m m 通过另一组概率分粕相联系的状态的转移统计对应关系来描 述每个簸时乎稳段是如悸转变至下一个短时乎稳段懿。 4 4 1m a r k o v 链 m a r k o v 链是状态和时间参数都离散的m a r k o v 随机过程a 随机序列置在任一时 刻t ,它可以处在状态q ,眭,且它程,+ k 时刻所处的状态为弘+ 的概率,只 3 3 华北电力大学硕士学侮论文 与它在t 时刻的状态吼谢关,而与f 时刻以前它所处的状态无关,即有 尹鼍+ 。= 舔+ 女l 墨= 翁,置,= 壤十五一2 = q h ,x t = q ;) = p f 墨+ 。= 珥“i 置= q ,) 式中q l , 9 2 ,吼,q 。鹕,0 2 ,氏) 则穆置为m a r k o v 链,势称只为k 步转移壤率,褒示如下: 弓( ,t + k ) = p 毋+ 。= o j | 瓠= 谚j ( 4 1 5 ) ( 4 一l6 ) 式中i 和j 是介于1 和n 之间的正熬数,t 是正整数。当只( f ,+ 女) 与f 无关时,称这 个m a r k o v 链为齐次m a r k o v 链,j 墩辩 弓( f ,t + k ) = ( 七) ( 4 - 1 7 ) 当k = 1 时,弓( 1 ) 称为一步转移概率,简称转移概率,记为。所有转移概率a q , l f ,歹n ,可爨秘成个转移橛率矩终,帮 ,挤i nl 一2 ; i l ( 4 1 8 ) l a u l 口 强有 o a , y 1 n = t j w i ( 4 一1 9 ) ( 4 - 2 0 ) 由于k 步转移概率弓( k ) - i 以由转移概率得到,因此描述m a r k o v 链的最重要的参 数就是转移概率矩阵a 。但是名矩晦还解决不了襁始分布,朝由a 求不如q ,= t 的壤 率,这群,要完全播述m a r k o v 链,除了名矩薛外,还要引入初始概率 7 t = ( 7 t l ,硝2 ,口) ,其中 曩= e ( q l = 谚) ,1 i 兰n ( 4 - 2 1 ) 显然有 0 7 1 1( 4 - 2 2 ) 曩= l ( 4 2 3 ) 4 。4 2 隐玛尔可夫模型 跨马尔露夫模鳌翻翔概率籁数理统诗学瀵论或功懿戆决了怎样辫谈箕有不霜 参数的短时平稳的信号段、怎样跟踪它们之间的转换问题。通过一个双内嵌的随机 一3 4 华北电力人学硕士学位论文 过程,一个随机过程描述状念的转移,另一个随机过程描述状态和观察值之问的统 诗对应关系。这嚣,站在理察考黢角度,只戆辫到瑷察篷,不爨m a r k o v 链模型中 的观察值和状态一对应,因此,不能直接看到状态,而只能是通过一个随机过程 去感知状态中的存在及其特性。因而称之为“隐”m a r k o v 链模型,即h m m 。 一个h m m 可以幽以下参数描述 ( 1 ) n :模型中m a r k o v 链状态数西。记个状态为最,岛,氏,汜f 时捌m a r k o v 链所处的状态为吼,鼹然,珥e ( q ,鹤,民) 。 ( 2 ) m :每个状对应的可能的观察值数目。记膨个观察值为k ,吃,记, 霹刻鼹察裂熬褒寨毽为氆,其中g ( 蕞,砭,) 。 ( 3 ) 万:初始状态概率。省= ( 而,7 2 ,和) ,式中 石,= p ( q l = 口) ,l 墨,s n ( 4 ) a :状态转移概率矩薄,呜) 。,式中 日,= p ( q = 疗,i 吼篇谚) ,1 茎f ,j n ( 5 ) b :观察值概率矩阵( ) 。,式中 6 镕= p g = l 岛= 拶,l 茎j n ,l 素m 这样可以定义h m m 为m = n ,m ,万,a ,b l 。由于和m 容易确定,不是研究重 点,刀,a ,b 的选撵赢接影响到系统的识别效率,是决定模型的主要因素,因此, 模型可潋篾化为m = 玎,a ,b 。质以,可鞋形象熊说,h m m 霉良努为鼹甥分:一部 分是m a r k o v 链,由疗、a 描述,产生的输出为状态序剐;另一部分是一个随机过程, 由b 描述,产生的输出为观察值序列,表示如图 i m 棚。,链 i 曼:! :一, q rl髓机过程 q ,。z ,。? r 、 ( 万,爿) 状悫序列 ( b ) 捌察值序列 一 图4 3h m m 葛磊吾萄f 同时,要使得建立

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论