(计算机软件与理论专业论文)利用透射波提取语音特征参数初探.pdf_第1页
(计算机软件与理论专业论文)利用透射波提取语音特征参数初探.pdf_第2页
(计算机软件与理论专业论文)利用透射波提取语音特征参数初探.pdf_第3页
(计算机软件与理论专业论文)利用透射波提取语音特征参数初探.pdf_第4页
(计算机软件与理论专业论文)利用透射波提取语音特征参数初探.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(计算机软件与理论专业论文)利用透射波提取语音特征参数初探.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山东大学硕士学位论文 利用透射波提取语音特征参数初探 研究生:孔宇 指导教师:宁飞教授 摘要 从5 0 年代开始,科学家们就致力于语音识别的研究。近二十年来,语音识 别技术取得显著进步,开始从实验室走向市场。和其他语系相比汉语语音有许 多有利于语音识别的特点,如每个汉字的发音均为单音节,声母,韵母只有上 千个有意义的组合等【1 】。这为利用纯粹的声波物理方法来进行语音识别提供了 便利。 在语音识别过程中。声学模型的建立是语音识别的核心部分。目前的声学 模型中的声道部分,普遍采用的是无损声道模型( 也有人称为行波模型) 。在无 损声道模型中利用流体力学的原理粗略的求解出系统的传递函数,这个传递函 数是一个只含递归结构的全极点模型。然后运用线性预测( l p c ) 的方法求出 线性预测系数来表征语音信号。但是,l p c 有一个明显的缺点r 2 ) i 3 ,它基于的 声道模型只是一个含递归结构的全极点模型,而实际上的声道传递函数应该采 用自回归滑动平均模型,而不是简单的全极点模型因为声道响应都含有零点的 影响。对于这种缺点,本文提出了一种全新的声道模型:基于透射系数的声道 模型。本方法利用了物理学中声波在介质中的传播的性质。而不是传统的利用 流体力学声管模型的方法。 声音是由振动源引起的。声音将同时以横波与纵波的方式进行传播,在传 播的过程中遵循惠更斯原理【4 l 【5 1 即波所达到的每一点都可看作是发射次级子波 的波源;在其后的任一时刻这些子波的包迹( 公切面) 就是新的波前。当声波经 过不同的介质时,将会产生折射、反射和吸收。相应的会有透射系数,反射系 数等来描述声波在两种介质之间的传播。透射系数与反射系数实际上是介质的 阻抗的函数,而介质的阻抗仅与介质有关。当声音在声道中传播时,声道的形 状是变化的,所以声道中空气的密度是不同的,因此可看成是不同的介质。由 此可见透射系数与反射系数能够描述声道的变化,从而提供了一种全新的声道 模型。在新模型中,透射系数与反射系数替代了传统方法中的l p c 参数。 山东大学硕士学位论文 在求解透射系数与反射系数时必须要解决两件事。首先,应该滤除掉语音 信号中的高频干扰,因为高频成分会掩盖许多有用特征信号。第二,必须要找 到声门激励和实际测到的声音信号的对应点,以便正确的求出透射系数与反射 系数。在本文中,利用了数字信号处理的最新技术_ ,j 、波分析,将这两件事一并 解决。 小波分析作为一种新的时频域兼顾的分析手段出现在1 9 8 4 年。在此之后, 小波变换作为信号处理的一种手段,逐渐被越来越多领域的理论工作者和工程 投术人员所重视和应用,并在许多应用中取得了显著的效果。同传统的处理方 法相比,小波分析产生了质的飞跃。作为一种调合分析方法( 兼顾时域和频域) , 小波技术具有十分巨大的生命力和广阔的应用前景。由于小波分析的使用,使 得求取基音周期变得非常简单,并能够非常容易得找到清音和浊音的结合点( 特 征点) 。而且通过小波变换可以有效地将语音信号中的高频成分滤除掉。 将经过小波处理后的语音信号作为实际要参与计算的输出信号,利用 r o s e n b e r g 函数构造的三角波脉冲,作为要参与计算的输入信号。从而可以计算 透射系数和反射系数。但是由于计算透射系数和反射系数非常的复杂,所以又 根据透射系数和反射系数构造了一个新的特征变量。它是透射系数和反射系数 的函数,当然也能够描述声道的变化。将这一新的特征变量最终用于语音识别, 并能够取得预想的效果。 利用物理学中声波在介质中的传递的性质来进行语音识别是一种新的尝 试,虽然目前还不能和当前流行的分析模型相比,但这只是一种初步的探索, 随着研究工作的继续进行一定会产生巨大的影响。 关键字:语音识别、透射波、小波、透射系数 山东大学硕士学位论文 p i l o ts t u d yo fe x t r a c t i n gv o i c ef e n 兀承e p arap 伍t e r sb yt r a n s m i t t e d 硝v e s t u d e n t :k o n g y u t u t o r :p r o f n i n g f e i a b s t r a c t s i n a e 1 9 5 0 s ,s c i e n t i s t s h a db e e n f l i n g i n g t h e m s e l v e si n t ot h e r e s e a r c ho fs p e e c hr e c o g n i t i o n i nt h ep a s th a l fc e n t u r y ,i d e n t i f y i n g v o i c eh a sm a d eg r e a tp r o g r e s s w h i c hb e g i n st ow a l k o u tl a ba n dg e ti n t o a p p l i e da r e a c h i n e s es p e e c hh a sal o to ff e a t u r e sb e n e f i c i a lt ot h e s p e e c hr e c o g n i t i o na sc o m p a r e dt oo t h e rl a n g u a g e f o re x a m p l e ,e v e r y c h i n e s ew o r dj u s ti n c l u d e so n es y l l a b l e s oi tb e c o m e sp o s s i b l et o r e c o g n i z eo n ec h i n e s ew o r dj u s tm a k i n gu s eo ft h eq u a l i t yo fs o u n dw a v e t r a n s m i t t i n gi np h y s i c s i n s p e e c hr e c o g n i t i o n ,i t i sc o r eo f i d e n t i f y i n gv o i c et ob u i l d a c o u s t i c sm o d e l a tp r e s e n t ,v o c a lt r a c tm o d e li nw h o l ea c o u s t i c sm o d e l u s u a l l ya d o p t s 1 0 s s l e s sv o c a lt r a c tm o d e l ( t r a v e l l i n gw a v em o d e l ) i nv o c a lt r a c tm o d e l ,h y d r o m e e h a n i c sp r i n c i p l ei si n t r o d u c e dt or o u g h l y s o l v et r a n s f e rf u n c t i o no fs y s t e m t h et r a n s f e rf u n c t i o nm o d e li sa n a l l p o l em o d e lw i t ha u t or e g r e s s a c c o r d i n gt ot h i st r a n s f e rf u n c t i o n m o d e t h el i n e a rp r e d i c t i v ec o e f f i c i e n t ( l p c ) i se d u c e dt od e n o t es p e e c h s i g n a l u n f o r t u n a t e ,l p ch a sa no b v i o u sf l a w i td e p e n d so na na l1 一p o l e m o d e lb u tar e a lt r a n s f e r f u n c t i o n o f v o c a lt r a c ts h o u l db e a u t o r e g r e s s i v em o v i n ga v e r a g em o d e ln o tas i m p l ea l l p o l em o d e lb e c a u s e t h er e s p o n s eo fv o c a lt r a c ti n c l u d e sz e r op o i n t c o n s i d e r i n gt h ef l a w , ak i n dn e wv o c a lt r a c tm o d e l b a s e do nt r a n s m i s s i o nc o e f f i c i e n ti s p u t u p i nt h en e wm o d e l ,h y d r o m e c h a n i c sp r i n c i p l ei sn o tu s e db u tt r a n s f e r q u a l i t yo fs o u n dw a v ei nm e d i a s o u n di sf o r m e db yv i b r a t i o ns o u r c e d u r i n g t r a n s f e r r i n gs o u n da r e l l l 山东大学硕士学位论文 t r a n s v e r s ew a v eo rl o n g i t u d i n a lw a v ea n da c c o r dw i t hh u y g e n sp r i n c i p l e , t h a tis ,a n yp o i n to naw a v ef r o n to f1 i g h tm a yb er e g a r d e da st h es o u r c e o fs e c o n d a r yw a v e sa n dt h a tt h es u r f a c et h a tist a n g e n tt ot h es e c o n d a r y w a v e sc a nb eu s e dt od e t e r m i n et h ef u t u r ep o s i t i o no ft h ew a v ef r o n t s o u n dw a v ew il lb er e f r a c t e d ,r e f le c t e da n da b s o r b e dw h e np a s sin g d i f f e r e n tm e d i a t r a n s m i s s i o nc o e f f i c i e n ta n dr e f l e c t i o nc o e f f i c i e n t c a nd e s c r i b es o u n dw a v e t r a n s f e r r i n g b e t w e e n2m e d i a i nf a c t t r a n s m i s s i o nc o e f f i c i e n ta n dr e f l e c t i o nc o e f f i c i e n ti sf u n c t i o no f i m p e d a n c eo fm e d i u m ,w h i c ho n l yr e l a t e st op r o p e r t yo f m e d i u m w h e ns o u n d w a v et r a n s f e r r i n gi nv o c a lt r a c t ,t h es h a p eo fv o c a lt r a c tv a r i e sf r o m t i m et ot i m es od e n s i t yo fa i ri nv o c a lt r a c tv a r i e s ,t o o a i ri nv o c a l t r a c tc a nb er e g a r d e dd i f f e r e n tm e d i u m a c c o r d i n gt ow h a ta b o v e m e n t i o n e d ,t r a n s m i s s i o nc o e f f i c i e n ta n dr e f l e c t i o nc o e f f i c t e n tc a n d e s c r i b ec h a n g eo fv o c a lt r a c t t h e r e f o r et r a n s m i s s i o nc o e f f i c i e n ta n d r e f l e c t i o nc o e f f i c i e n tc a nb ea sak i n do fn e wv o c a lt r a c tm o d e l i nt h e n e w m o d e l ,t r a n s m i s s i o nc o e f f i c i e n ta n d r e f l e c t i o n c o e f f i c t e n t s u b s t i t u t el p c t h e r ea r e2t h i n g sm u s tb ed o n eb e f o r eg e tt r a n s m i s s i o nc o e f f i c l e n t a n dr e f l e c t i o nc o e f f i c i e n t i nt h ef i r s tp l a c e ,h i g h e rf r e q u e n c ys i g n a l i n s p e e c hs h o u l db ef i l t e r e db e c a u s et h eh i g h e rf r e q u e n c ys i g n a lw i l l c o v e re f f e c t i v es i g n a l t h ef 0 1 l o wu p i no r d e rt o g e tt r a n s m i s s i o n c o e f f i c i e n ta n dr e f l e c t i o nc o e f f i c i e n t ,t h ec o u n t e r p o i n to fs i g n a o n g o t t i sp u l s em u s tb ea s c e r t a i n e d i nt h i sa r t i c l e ,w a v e l e ta n a l y s i s , ak i n do fn e wt e c h n o l o g yi ns i g n a lp r o c e s s i n g ,i su s e dt os o l v et w o t h i n g s a tt h es a m et i m e a sak i n do fa n a l y s i sm e t h o dw a v e l e ta n a l y s i s ,w h i c hg i v e sa t t e n t jo n t ot i m ed o m a i na n df r e q u e n c yd o m a i na tt h es a m et i m e ,a p p e a r si n1 9 8 4 a san e ww a yi n p r o c e s s i n gs i g n a l ,w a v e l e tisp a i dm o r e b ya c a d e m i c i a na n de n g i n e e rf r o md i f f e r e n td o m a i n sa n d 山东大学硕士学位论文 a c h i e v e ss u c c e s si n m a n ya p p li e dd o m a i n c o m p a r i n gw i t ht r a d i t i o n a l a n a l y s i sm e t h o d so fs i g n a lp r o c e s s i n gw a v e l e ta n a l y s i sh a sq u a l i t a t i v e c h a n g e w a v e l e ta n a l y s i s i sac o n s i s t e n t a n a l y s i sm e t h o d ( p a y i n g a t t e n t i o nt ot i m ed o m a i na n df r e q u e n c yd o m a i na tt h es a m et i m e ) ,w hc h h a ss t r o n gv i t a l i t ya n dc a nb eu s e di nm a n yd i f f e r e n td o m a i n s b e c a u s e o fw a v e l e ti ti sv e r ye a s yt og e tp i t c ha n dt og e tap o i n t ( c h a r a c t e r p o i n t ) b e t w e e nc o n s o n a n ta n dv o w e l i ti sv e r ye f f e c t u a lt of i l t e rh i g h e r f r e q u e n c yf r o ms p e e c hs i g n a lb yw a v e l e tt r a n s f o r m as p e e c hs i g n a l p r o c e s s e db yw a v e l e tc a nb ea so u t p u ts i g n a la n d t r i a n g l ew a v ef o r m e db yr o s e n b e r gf u n c t i o nc a nb ea si n p u ts i g n a l ,w h i c h t a k e p a r t i nc a l c u l a t i o n t r a n s m i s s i o nc o e f f i c i e n ta n dr e f l e c t i o n c o e f f i c i e n tc a nb eo b t a i n e d b u tt h et w o c o e f f i c i e n t sa r e v e r y c o m p l i c a t e d s oan e wc h a r a c t e rv a r i a b l ei s f o r m e d a c c o r d i n g t o t r a n s m i s s i o nc o e f f i c i e n ta n dr e f l e c t i o nc o e f f i c i e n t t h en e wv a r i a b l e i sf u n c t i o no ft r a n s m i s s i o nc o e f f i c i e n ta n dr e f l e c t i o n c o e f f i c i e n t , w h i c hc a nd e p i c tt h ec h a n g e so fv o c a lt r a c t t h en e wc h a r a c t e rv a r i a b l e h a db e e nu s e di n r e c o g n i z i n gs p e e c ha n dt h er e s u l ti se x p e c t e d i ti san e w a t t e m p t t om a k eu s eo ft h e q u a l i t yo f s o u n dw a v e t r a n s f e r r i n gi nm e d i at or e c o g n i z es p e e c h t h o u g ht h en e wm o d e lh a s d e f i c i e n c yc o m p a r i n gt oc u r r e n tm o d e li t i sp i l o ts t u d y t h en e wm o d e l w i l l g a i ng r e a te f f e c tw i t hs t u d yc o n t i n u i n g k e y w o r d s :s p e e c hr e c o g n i t i o n 、t r a n s m i t t e dw a v e 、w a v e l e t 、t r a n s m i s s i o n c o e f f i c i e n t v 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研 究作出重要贡献的个人和集体,均己在文中以明确方式标明。本声明 的法律责任由本人承担。 论文作者签名:碰心j 盗e t 期:皇缪堡垒垒 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学校保留或向国家 有关部门或机构送交论文的复印件和电子版允许论文被查阅和借阅;本人授权山东大 学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印 或其他复制手段保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文储虢挝生翩繇彗日期:型丝岁 山东大学硕士学位论文 第一章引言 语音识别是- - i 1 交叉学科,作为2 0 0 0 年至2 0 1 0 年间信息技术领域十大重要 的科技发展技术之一,正逐步成为信息技术中人机接口的关键技术,与机器进行 语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别 技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高 技术。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。语音 识别听写机在一些领域的应用被美国新闻界评为1 9 9 7 年计算机发展十件大事之 一n 1 1 语音识别技术的基础 语音识别技术关系到多学科的研究领域,不同领域上的研究成果都对语音识 别的发展作了贡献。让机器识别语音的困难在某种程度上就像一个外语不好的人 听外国人讲话一样,它和不同的说话人、不同的说话速度、不同的说话内容、以 及不同的环境条件有关。语音信号本身的特点造成了语音识别的困难。这些特点 包括多变性,动态性,瞬时性和连续性等。计算机语音识别过程与人对语音识别 处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基本 理论。一个完整的语音识别系统可大致分为三部分1 6 : ( 1 ) 语音特征提取:其目的是从语音波形中提取出随时间变化的语音特征 序列。 ( 2 ) 声学模型与模式匹配( 识别算法) :声学模型通常将获取的语音特征通 过学习算法产生。在识别时将输入的语音特征同声学模型( 模式) 进行匹配与比 较,得到最佳的识别结果。 ( 3 ) 语言模型与语言处理:语言模型包括由识别语音命令构成的语法网络 或由统计方法构成的语言模型,语言处理可以进行语法、语义分析。对小词表语 音识别系统,往往不需要语言处理部分。 声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一部分。 声学模型的目的是提供一种有效的方法计算语音的特征矢量序列和每个发音模 板之间的距离,当距离小于某阈值时即认为声音的特征矢量序列与模板匹配 山东大学硕士学位论文 了。声学模型的设计和语言发音特点密切相关。 语言模型对中、大词汇量的语音识别系统特别重要。当分类发生错误时可以 根据语言学模型、语法结构、语义学进行判断纠正,特别是一些同音字则必须通 过上下文结构才能确定词义。语言学理论包括语义结构、语法规则、语言的数学 描述模型等有关方面。目前比较成功的语言模型通常是采用统计语法的语言模型 与基于规则语法结构命令语言模型。语法结构可以限定不同词之间的相互连接关 系,减少了识别系统的搜索空间,这有利于提高系统的识别。 1 2 语音识别技术的发展情况 我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从 实验室逐步走向实用。从1 9 8 7 年开始执行国家8 6 3 计划后,国家8 6 3 智能计算 机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的 研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优 势,并达到国际先进水平。 语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精 度已经大于9 8 ,对特定人语音识别系统的识别精度就更高。这些技术已经能 够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别 系统也已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量的语 音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了 语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语 音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、 旅游、银行信息,并且取得很好的结果。调查统计表明多达8 5 以上的人对语 音识别的信息查询服务系统的性能表示满意。 可以预测在近五到十年内,语音识别系统的应用将更加广泛。各种各样的语 音识别系统产品将出现在市场上。人们也将调整自己的说话方式以适应各种各样 的识别系统。在短期内还不可能造出具有和人相比拟的语音识别系统,要建成这 样一个系统仍然是人类面临的一个大的挑战,我们只能一步步朝着改进语音识别 系统的方向一步步地前进。至于什么时候可以建立一个像入一样完善的语音识别 系统则是很难预测的。就像在6 0 年代,谁又能预测今天超大规模集成电路技术 山东大学硕士学位论文 会对我们的社会产生这么大的影响。 第二章语音信号的数字模型 6 i 【7 】1 8 】【9 】【1 0 】 2 1 人类的说话发音过程 人的发音器官包括肺、气管、 在发音时,有肺部收缩送出一 股直流空气,经气管流至喉头 声门处( 声带的开口处) 【1 1 】【1 2 】。 在发声之初,声门处的声带肌 肉收缩,声带并拢,这股气流 冲过很小的缝隙,使声带向两 边运动,缝隙增大,而弹性恢 复力又将声带拉回到平衡位 置并继续趋向于闭合,从而使 声带振动,而且有一定的振动 周期。每开启和闭合一次的时 闻即振动周期称为音调周期 或基音周期其倒数称为基音 频率,也简称为基频。声带振 动的频率即基音决定了声音 频率的高低,频率快则音调 高,频率慢则音调低。基音的 喉( 包括声带) 、咽、鼻和口等,如图2 1 。人 图2 1 人的发音器官示意图 范围约为7 0 3 5 0 h z 左右,它随发者人的性别、年龄及具体情况而定,老年男性 偏低,小孩和青年女性偏高。语音由声带振动或不经声带振动来产生,其中由声 带振动产生的音统称为浊音,而不由声带振动产生的音统称为清音。浊音中包括 所有的元音和一些辅音,而清音中包括另一部分辅音。一般声道是由咽、口腔和 鼻腔组成,它是一根从声门延伸至口唇的非均匀截面的声道,其外形变化是时间 的函数。成年男子声道的平均长度约1 7 e r a ,而声道的截面积取决于其他发音器 官的位置,它可以从零( 完全闭合) 变化到2 0 c m 2 。声道是气流自声门声带之后最 山东大学硕士学位论文 重要的、对发音起决定性作用的器官发不同音时其形状变化是非常复杂的。 2 2 语音信号的数字模型 表示抽样语音信号的离散模型是特别重要的,为了定量描述语音处理所涉及 到的某些因素,虽然已经假定了许多不同的模型,但是可以肯定,目前还没有发 现一种可以详细描述人类语音中已观察到的全部持征的模型。建立模型的基本准 则是要寻求一种可以表达一定物理状态下的数学关系,要使这种关系不仅具有最 大的精确度,而且还要最简单。我们希望模型既是线性的又是时不变的,这是最 理想的模型。但是由于语音信号是一连串的时变过程和语音产生的偶然性,所以 不能精确地满足这两种性质。然而,可以做出一些合理的假设,在较短的时间间 隔内表示语音信号时,可以采用线性时不变模型。长期研究证实,发不同性质的 图2 2 语音信号的数学模型 音时,激励的情况是不同的大致分为两大类:l 、发浊音时。此时气流在通过 绷紧的声带时、冲激声带产生振动使声门处形成周期性的脉冲串,并用它去激 励声道。声带绷紧的程度不同时,振动频率也不同。该频率就是音调频率,其倒 数为音调周期。不同人的音调周期是不同的,男子大,女子小:老人大小孩低。 2 、发清音时。此时声带松弛而不振动,气流通过声门直接进入声道。语音信号 的数学模型如图2 2 。 2 3 声门激励模型 发浊音时,由于声带不断张开和关闭,将产生间歇的脉冲波。根据测量结果, 这个脉冲波类似于斜三角形的脉冲,因此,此时的激励信号是一个以基音周期为 4 山东大学硕士学位论文 周期的斜三角脉冲串。如图2 - 3 所示。 图2 3 周期的斜三角脉冲串 单个三角波形的数学表达式可以用r o s e n b e r g 函数( 式2 1 ) 近似表示。式 中t l 为斜三角波上升部分的时间,约占基音周期的5 0 ,t 2 ,为其下将部分的时 间,约占基音周期的3 5 。这个比例关系是和声带开启的面积与时间的关系相对 应的。 p ( r ) =f l + 咒 ( 2 1 ) 0 其它 另一种是发清音的情况。这时,无论是发阻塞音还是摩擦音,声道都被阻碍 形成湍流。所以,都可以模拟成随机白噪声。实际上可以使用均值为零,方差为 1 ,并在时间或在幅值上为白色分布的序列。 2 4 声道模型 可以用来解释语音在声道中传播过程的物理模型如图2 4 所示在这个图中, 声道被看成为一个时变的不均匀截面的声道对于波长大于声道尺寸的频率( 约 小于4 0 0 0 h z ) ) 而言,我们可以合理地假设沿声道轴向传播的是平面波。另一个进 a 伍) 都一临 图2 4 声道模型 略懵 计 ; 山东大学硕士学位论文 一步加以简化的假设是认为无论在流体中或管壁上部不存在热传导的粘滞带来 的损耗。根据这些假设,以及质量、动量和能量的守恒定律,p o r t n o f f 证明了管 中的声波满足下述方程组: 3 u1 a ( p a ) o a 良2 ,2 o t ( 2 2 ) 一塑:。旦幽 一 玉甜 其中p = p ( x ,t ) 使管内x 位置处f 时刻的声压 “= u ( x ,t ) 是x 位置处,时刻的体速度 p 是管内空气的密度 c是声音的传播速度 a = a ( x ,f ) 是管的面积函数,也就是与管轴垂直的管的横截面面积,它是 轴向距离x 和时间,的函数。 + a x + 孳, 膊 + a x + 尸i 1 图2 5 无损声道模型 上述方程的闭式解只是在最简单的情况下才能得到。然而数值解总是可以得 到的。对于确定声道截面积函数a ( x ,f ) 而言是非常困难的,但对于持续( 久) 音, 可以认为a ( x ,) 不随时间变化。最简单的声道模型是把声道看作有多个不同截面 积的管子串联而成的系统,而且这些管子是无损耗的。这就是无损声道模型( 也 有人称为行波模型) 如图2 5 。在声道模型中,每个管子可看作为一个四端网络, 这个网络具有反射系数,这些系数和线性预测的参数之间有唯一的对应关系。这 山东大学硕士学位论文 时声道可由一组截面积或一组反射系数来表示。对于语音信号的某一短时期间, 声道可表示为形状稳定的管道。在短时期间可以认为各段管子的截面积a 是常 数,设第t t 段和第行一1 段的声道的截面积分别为a 。、a 。设 k 。= ( 以一以一,) ( 爿。+ a , , - 1 ) ,称为“面积和差比”,其取值范围为- 1 心 1 。它 实际上是线性预测的反射系数。 2 5 声道模型的线性预测计算方法 线性预测作为一种工具,几乎普遍地应用于语音信号处理的各个方面。线性 预测分析所包含的基本概念是:一个语音的抽样能够用过去若干个语音抽样的线 性组合来逼近。通过使实际语音抽样和线性预测抽样之间差值的平方和( 在一个 有限间隔上) 达到最小值,即进行最小均方误差的逼近,能够决定唯一的一组预 测系数。将线性预测应用于语音,不仅希望利用其预测功能,而且要求它能提供 一个非常好的声道模型。而这样的声道模型对理论研究和实际应用都是相当有用 的。此外,声道模型的优良性能不仅意味着线性预测是语音编码的特别合适的编 码方法,而且也意味着预测系数是语音识别的非常重要的信息来源。因此线性 预测的基本原理和语音信号数字模型密切相关。在传统的经典模型( 级联声道无 损模型) 中通常认为声道是一个时变的不均匀截面的声道。对于波长大于声道尺 寸的频率( 大约小于4 k h z ) 而言,我们可以合理的假设沿声道轴向传播的是平 面波。从而可假设流体中或管壁上都不存在热传导和粘滞带来的损耗,从而可以 方便的把流体力学引入声道模型。级联声道无损模型如图2 5 。线性预测分析的 基本原理是将被分析的语音信号用一个模型来表示,即将信号看作是某个模型 ( 系统) 的输出。这样,就可以用模型参数来描述信号。 咖,咂丑一咖, 图2 61 - g 号s ( n ) 的模型化框图 图2 6 是信号s ( ,z ) 的模型化框图。图中“( n ) 表示模型的输入,s ( 竹) 表示模型的输 出。当s ( ”) 为确定性信号时,模型的输入“( ) 采用单位冲激序列,当j ( 肝) 为随机 山东大学硕士学位论文 性信号时模型的输入采用“( 聆) 白噪声序列。在此模型中忽略了声道中的辐射、流 体中或管壁上存在的热传导和粘滞带来的损耗从而简化为一个时变的数字滤波 器来等效,其系统函数为 ( 三) :黑: ( 2 3 ) u ( 2 ) 1 - 争卵一r 。7 一。 这样把s ( n ) 模型化为一个p 阶的a r 模型( 只含递归结构的全极点模型) 。这个 模型的参数有:浊音清音判决、浊音语音的基音周期、增益常数g 及数字滤波 器参数口。当然,这些参数都是随时间在缓慢变化的。采用这样一种简化的模型, 其主要优点在于能够用线性预测分析方法对滤波器系数口,和增益常数g 进行非 常直接和高效的计算。 语音信号线性预测的主要缺点: ( 1 ) 根据语音信号的产生机理,很多语音特别是清音和鼻音的场合,声道 响应都含有零点的影响。因此,理论上应该采用零极点模型,而不是简单的全极 点模型。 ( 2 ) 在模型中,会成浊音语音时激励源是一组冲击序列,而线性预测求解 滤波器参数口时却采用白噪声源的假设。 考虑到线性预测的不足,有必要在声道模型上作进一步的探索。 第三章声波的产生及声波在介质中的传播特性h i 5 】【l l 】【1 2 】【1 3 】 一切振动物体,能引起空气的振动,就产生声波。声波就是机械振动在空气 中的传播过程。在这里,所有振动物体都是声源。如振动的音叉,鼓面,各种乐 器,人的声带等等,都是声源。 3 1 波的分类 波可按不同的分类方法分成平面波和球面波,横波和纵波。 山东大学硕士学位论文 3 1 1 平面波和球面波 在波的传播过程中,波源的振动总是由近及远地向外传播,沿着波的前进方 向,振动到达的时间将顺次推迟,振动的相位将逐渐落后。这样在波向四周传 播时,就会在空间形成一系列振动相位相同的同相曲面,称为波面。其中,波到 达的最前面的波面,也即振动相位等于波源初相的被面,称为波前,亦称波阵面。 波阵面是平面的波叫做平面波,波阵面是球面的波叫做球面波。在各向同性的均 匀媒质中,波阵面与表示波传播方向的波线正交,如图3 1 所示。平面波和球面 波是两种理想的波。理想的平面波波线是垂直于波面的一组平行直线,称为平 行波束。由点被源向外发出的球面波,波线是沿球半径方向的一组射线,称为发 散波束。从太阳发出的光波是球面波,但到达远离太阳的地面上时,照射地面的 太阳光线的发散角很小,近似于平行光束,照到地面的太阳光波也就可以近似地 看成是平面波。 3 1 2 横波和纵波 诚阵面 ( d ) 一 蒸蔽 髅教 波阵面 图3 1 波面与波线 ( a ) 平面波( b ) 球面波 在机械波的传播过程中,质点的振动方向与波的传播方向垂直的波叫做横 波质点的振动方向与波的传播方向平行的波叫做纵波。在横波的传播过程中, 各媒质质点在垂直于波的传播方向上离开各自的平衡位置,发生大小不同的横向 位移,如图3 2 ( b ) 所示,媒质的形变属于切变。具有切变弹性的固体、柔软的绳 和弦线等,都可以传播横波。例如,将绳的一期固定,沿绳的横向抖动绳的另一 一 当銮奎堂堡主堂堡堡壅 一一一 。 端就会形成沿绳传播的横坡。在纵波的传播过程中,各媒质质点在平行于波的 传播方向上离开各自的平衡位置,发生相互靠拢或相互离开的纵向位移,形成质 点间稠密或稀疏状态的分布,如图3 2 ( c ) 所示,媒质的形变属于长变或体变。固 体、液体和气体都具有长度和体变弹性,它们都能传播纵波。例如,空气中传播 的声波,就是纵波。 3 2 声波的速度与声压 3 2 1 声波的速度 空气传递的声波碰到液体或固体时,就会引起液体或固体的振动,它们的振 动又会引起其他部分空气的振动,从而使声波发生传递。但必须注意的是 ( 1 ) 同一声波尽管在不同物质中的速度不同,但频率不变,因而波长也不同。 ( 2 ) 声波在所有物质中传递时波长五、速度v 、频率之间厂的关系,仍满足 v = 五,其中频率,不变。 0 八八 1 ( a ) 波形趋线 ( b ) 横波质点分布 ( c ) 纵波质点分布 山东大学硕士学位论文 3 2 2 声压 图3 2 波动过程中的质点分布 当媒质中有声波传递时,声波到达之处,媒质的质点将发生强烈的振动,这 种振动,将使任何一个与声波传递方向垂直的横截面积上,受到分子的强烈碰攫 作用,这种碰撞作用较之分子因热运动而发生的碰撞作用是不同;前者是周期性 的后者是无规则的。声波穿过截面以后,不仅位能量穿过截面,也将一部分动量 传过该截面,从而引起该截面受到的压强发生变化,以气体为例。设气体的密度 为p ,声波在气体中传递的速度为v ,波的振幅为一取传播方向的面积为s ,在 缸时间内,通过面积s 的波数为k ( 波数世表示每单位长度( 米) 内所包含的波的 个数) ,k = 2 n f v = 2 n 2 ,其单位是米。则出内与s 作用的气体最大质量为 m ,= k p s a v a t 。a t 时间内传递的最大动量为m ,v = k t 蠼a v 2 a t ,相应的平均压力 ( 最大) 为f = a p a t = m ,v a t = k f x t a v 2 。因此,压强的变化量p = f s = k p a v 2 上式表明: ( 1 ) p = k p a v 2 ,表示媒质相对于没有波传到时原压强风的最大变化,称为 压强振幅。一般情况下,p 随时间作周期性变化。 ( 2 ) 当空气中有波传递时,空气压强的最大变化与波速的平方成正比,与振 幅成正比。还需要指出的是,上述结果的导出,仅是一种粗略的推理,不能其作 科学严密的数学推导,但其结果是正确比它说明了由于声波的存在引起了媒质内 部压强的变化。 3 3 声波的折射、反射与吸收 3 3 1 声波的折射 声波从一种媒质进入另一种媒质时,要发生折射,声波在不均匀媒质中传播 时,将不沿直线传播。这是声波的另一种折射现象。 山东大学硕士学位论文 3 3 2 声波的反射 与一切机械波一样,声波在均匀媒质中的传播总是沿直线传播的,碰到障碍 物会发生反射。 3 3 3 声波的吸收 当声波等机械波在媒质中传播时,由于媒质内部摩擦等原因,机械波的一部 分能量特转换为热能,使机械波的振幅迅速成小。由于同样的原因,当声波在空 气中传播时,空气分子的振动,将一部分能量转换为热能,从而使声强迅速减 小这种现象叫做声波的吸收。即相当于媒质“吸收”了部分“声波”。 3 4 声波在介质中的传播 声音是由声源产生的振波向外传播,惠更斯于1 6 9 0 年提出如下原理:波所 达到的每一点都可看作是发射次级子波的波源;在其后的任一时刻这些子波的包 迹( 公切面) 就是新的波前。这就是惠更斯原理。 3 4 1 基本概念 声门产生的声波是球面波,但是根据惠更斯原理,由于声道的定向作用和声 道壁对声波的吸收,使得声门产生的球面波在声道中以平面波的形式传播。平面 波为波动的最简单形式这种波最普遍的解析表达式是函数。 f ( n x x + n y y + f i z z 一,) c ( 3 1 ) 其中心,疗,厅:是满足条件九:+ 珂:+ ;= 1 的三个数,并且是波阵面的法向单 位矢量在坐标轴上的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论