(信号与信息处理专业论文)hybridmelpcelp语音压缩编码算法的研究.pdf_第1页
(信号与信息处理专业论文)hybridmelpcelp语音压缩编码算法的研究.pdf_第2页
(信号与信息处理专业论文)hybridmelpcelp语音压缩编码算法的研究.pdf_第3页
(信号与信息处理专业论文)hybridmelpcelp语音压缩编码算法的研究.pdf_第4页
(信号与信息处理专业论文)hybridmelpcelp语音压缩编码算法的研究.pdf_第5页
已阅读5页,还剩79页未读 继续免费阅读

(信号与信息处理专业论文)hybridmelpcelp语音压缩编码算法的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电子辩锼大擎蕻士攀垃 龟文 摘要 语音压缩编码技术是信号处理技术的一个重爱的组成部分,它使用了 信号处理领域大量从基础性到前沿性的思想、理论和实践方法。 乍为信号 处理的主流学科之一,它的发展也一直是信号处理技术发展的驻要促避力 麓。 当今语音压缩编码算法主要分为侧重子对谱参数编码和侧燕子对时间 波形编码的两个大的簿法类型。混合激励线性预测m e l p 编码算法和码激 励线往预溅c e l p 编鸦算法是这两大类算法的主要代表。m e l p 算法的主 爱特点是使用了多带清浊音判决,并且根据各频带清浊音的相对强度将清 音成分和浊音成分按眈秘漏合起来产生线经预灞激励,其中酶浊音澈糯成 分采用傅立叶谱幅度的方法来表示。c e l p 算法的主要特点是不区分语音 信号的清洼啻类垒,褥是绞使碍蒺于a b s 蒙理酌靖域渡形嚣糙方法来产 生线性预测激励,且该激励信号通过矢量码本来表示。 本文讨论了m e l p 积c e l p 簿法豹簇理秘蒸俸实羞凳方法,并虽基于 m a t l a b ,主要是基于其s i m u l i n k 工具对两种算法进行了仿真实现。针对 m e l p 髯洼中纂音提数撩黠繁璎熬特点,本文摄出了一种麓证瓣m e l p 基 音提取算法。 混合激励线滢预测m e l p 龚碧遣合表瑷稳定淫音区的强周期语音,恧 另一方间,码激励线性预测c e l p 适合表现弱浊音及清音等语音模式的相 对不援剡匏蛰瞧,奎此产生挝二者维台怒来趣思路,髑波形缡璃魏c e l p 针对非浊音,过渡音和其他非周期的语音段,用参数编码的m e l p 针对强 浊音的慷援。但是,籀单数擦这弱穗模型产生的语音帧叠如,会带来些 问题。波形编码保斟了目标波形的形状和原始波形和合成波形之间的包络 时阔同步。丽参数缡鹞通常不保留波形形状和包络时间同步,因为它通常 不提取目标波形的相位信息。简单将二者叠接会在过渡区产生严重的不自 然的语啻感觉。为此我们采用了相位对齐技术和零相位均衡技术来解决这 个问题。 本文讨论了多模h y b r i d m e l p c e l p 编码算法的相关原理和具体实现 方法,并且利用m a t l a b 莘臣s i m u l i n k 工具对其遗行了仿真实现。相位对齐的 问题我们采用了相位参数方案,在m e l p 编码数据帧中加入了相位参数, 使用了语音僚号的菲平稳谐波模型,用多颁式内插方法产生m e l p 语音信 电子科技大学硕士学位论文 号帧的合成相位。对合成相位的相位展开问题,本文提出了一种基于动态 规划方法的相位展开算法。对于零相位均衡问题,本文提出了一种基于 p i t c h 分片的零相位均衡算法。 目前,语音编码领域对窄带低速率语音编码的兴趣集中在4 k b p s 的编 码速率上。国际电联正在制订其4 k b p s 速率的新的长话质量级语音编码标 准,本论文研究的多模h y b r i d m e l p c e l p 语音编码算法正是其候选标 准之一,它很有希望成为i t u 。t 的4 k b p s 语音压缩编码的新标准。本文对 多模h y b r i d m e l p c e l p 算法进行了主要基于s i m u l i n k 的仿真实现, 该s i m u l i n k 仿真实现对算法最终借助s i m u l i n k 的相关工具完成d s p 实现或 f p g a 实现提供了很好的快捷路径,因而具有较好的现实意义和实用价值。 i i 电子科技大学硕士学位论文 【关键词】 语音压缩编码混合激励线性预测码激励线性预测基音对齐相 位零相位均衡多模式混合编码 i i i 电子科技大学硕= b 学位论文 a b s tr a c t s p e e c hc o m p r e s s i o nc o d i n g i sa n i m p o r t a n tc o m p o n e n t o f s i g n a l p r o c e s s i n gt e c h n o l o g y ,w h i c hi n t e g r a t e s al o to f i d e o l o g y ,t h e o r i e s a n d p r a c t i c a l m e t h o d so fs i g n a l p r o c e s s i n g d o m a i nf r o mf u n d a m e n t a l p a r t s t o f r o n tl i n e a sam a i n s t r e a mo fs i g n a lp r o c e s s i n gs u b j e c t ,i tg r e a t l yb o o s t st l l e d e v e l o p m e n to fs i g n a lp r o c e s s i n gt e c h n i q u e s n o w a d a y s ,s p e e c hc o m p r e s s i o nc o d i n ga l g o r i t h mh a sb e e nd i v i d e di n t o t w om a i ns t r e a m s ,o n eo fw h i c hs t r e s s e s c o d i n gt h ep a r a m e t e r si ns p e c t r u m d o m a i n ,a n dt h e o t h e ro fw h i c hf o c u s e so n c o d i n g t h ew a v e f o r mi nt i m e d o r a a i n m a i n r e p r e s e n t a t i v e s o ft h ea b o v et w o a l g o r i t h m s a r e m i x e d - e x c i t a t i o nl i n e a rp r e d i c t i o n c o d i n ga l g o r i t h m a n dc o d e - e x c i t a t i o n l i n e a rp r e d i c t i o n c o d i n ga l g o r i t h mr e s p e c t i v e l y t h em a j o rc h a r a c t e ro f m e l pa l g o r i t h mi st h a ti tu s e sv o i c i n gd e c i s i o n sf o rd i f f e r e n ts u b b a n d s ,a n d i t p r o d u c e s l pe x c i t a t i o n b ym i x i n g v o i c e d i n g r e d i e n t s a n d u n v o i c e d i n g r e d i e n t sa c c o r d i n g t or e l a t i v e v o i c i n gs t r e n g t h o f e v e r y s u b b a n d r e s p e c t i v e l y ,a m o n gw h i c ht h ev o i c e de x c i t a t i o ni sr e p r e s e n t e db ym e t h o d so f f o u r i e r s p e c t r u mm a g n i t u d e s o n t h eo t h e rs i d e ,t h ec h a r a c t e ro fc e l p a l g o r i t h m i st h a ti td o e sn o td i s t i n g u i s hv o i c e do ru n v o i c e d s p e e c h a n di t u n i f o r m l y u s e st i m ed o m a i nw a v e f o r m m a t c h i n g m e t h o db a s e do na b s p r i n c i p l e t o p r o d u c e l p e x c i t a t i o n ,t h es i g n a l o fw h i c hi s r e p r e s e n t e db y v e c t o rc o d e 8 t h i st h e s i sd e s c r i b e s t h e p r i n c i p l e s a n dc o n c r e t e i m p l e m e n t a t i o n m e t h o d s0 fb o t hm e l p a n dc e l p a l g o r i t h m i t a l s os i m u l a t e st h e i m p l e m e n t a t i o no f t h ea b o v et w oa l g o r i t h m sb a s e do nm a t l a ba n dp r i n c i p a l l y i t ss i m u l i n kt o o l s m o r e o v e r ,an e w s i m p l i f i e d m e l pp i t c he x t r a c t i o n a l g o r i t h mh a sb e e np r e s e n t e dw i t h i nt h e t h e s i st os o l v et h ep r o b l e mo ft h e f u s s ym e c h a n i s mo fs t a n d a r dm e l p a l g o r i t h m t h em e l pc o d e ri s f a i r l y f i tf o rr e c o n s t r u c t i n gs t r o n gp e r i o d i c i t y o f s t e a d y v o i c e d r e g i o n s o nt h eo t h e rh a n d ,t h ec e l pc o d e rd o e sw e l la t r e p r e s e n t i n gi r r e g u l a r f e a t u r e so fw e a k l yv o i c e d a n du n v o i c e ds p e e c h t h e a b o v eo b s e r v a t i o n s s u g g e s t t h ei d e a so fc o m b i n a t i o no ft h et w oc o d e r 电子科技大学颂= 学位论文 m e t h o d s ,i e ,u s i n gc e l p ,aw a v e f o r mc o d e ri nu n v o i c e d ,t r a n s i t i o n a la n d o t h e r a p e r i o d i cs p e e c hs e g m e n t s ,a n du s i n gm e l p ,ap a r a m e t r i cc o d e ri n s t r o n g l yv o i c e dr e g i o n s h o w e v e r ,a nu n s o p h i s t i c a t e da d d i n go ft h e s e t w o m e t h o d sw i l ll e a dt os o m ep r o b l e m s w a v e f o r mc o d e r sp r e s e r v et h es h a p eo f t h et a r g e tw a v e f o r ma n dt h et i m es y n e h r o n yo f e n v e l o p eb e t w e e nt h eo r i g i n a l a n dt h es y n t h e s i z e ds i g n a l ;b u tp a r a m e t r i cc o d e r sa r en o tp r e s e r v ew a v e f o r m s h a p ea n dt h e t i m es y n c h r o n yb e c a u s ei t c o m m o n l yn o t e n c o d e st h e s i g n a l p h a s ec o m p o n e n t a ss i m p l ya d d i n g o ft h e s et w om e t h o d sp r o d u c e s g r e a t u n n a t u r a l f e e l i n g a tt r a n s i t i o n r e g i o n s ,w ea d o p tp h a s ea l i g n m e n t a n d z e r o p h a s ee q u a l i z a t i o nt e c h n i q u e st os o l v et h e s ep r o b l e m s t h et h e s i sa l s od e s c r i b e s p r i n c i p l e s a n dc o n c r e t e i m p l e m e n t a t i o n m e t h o d so fm u l t i m o d eh y b r i d - m e l p c e l pc o d i n ga l g o r i t h m ,a n ds i m u l a t e s i t s i m p l e m e n t a t i o nu s i n gm a t l a b a n ds i m u l i n kt o o l s a n dw e a p p l yp h a s e p a r a m e t r i ca p p r o a c hi np h a s ea l i g n m e n tp r o b l e m w ea d dp h a s ep a r a l n e t e r s i nm e l pe n c o d e dd a t af r a m e s ,u s ea n o n s t a t i o n a r ys p e c t r a im o d e l i n g o f s p e e c hs i g n a l sa n dr e c o n s t r u c ts y n t h e t i cp h a s eo fm e l ps p e e c hs i g n a lf r a m e s b yp o l y n o m i a li n t e r p o l a t i o n r e g a r d i n g t h e u n w r a p p e dp h a s ep i o b l e m ,w c p r e s e n tan e wu n w a p p i n gm e t h o db a s e do nd y n a m i cp r o g r a m m i n g a st o t h e z e r o p h a s ee q u a l i z a t i o np r o b l e m ,w ep r e s e n t an e w e q u a l i z a t i o n m e t h o d b a s e do np i t c h s e g m e n t a t i o n c u r r e n t l y ,t h em a i ni n t e r e s to fn a r r o w b a n dl o w s p e e ds p e e c hc o d i n gi s f o c u s e do nt h ed o m a i no f4 k b p ss p e e d t h ei t u th a sb e e ni nt h ep r o c e s so f s t a n d a r d i z i n gan e w4 k b p st o l l q u a l i t ys p e e c hc o d i n ga l g o r i t h m a so n eo f c a n d i d a t e s t a n d a r d s ,m u l t i m o d eh y b r i d m e l p c e l pa l g o r i t h m i s v e r y l i k e l yt o b e c o m et h en e ws t a n d a r d w i t h i nt h et h e s i s ,t h es i m u l a t i n go fs u c h m u l t i m o d eh y b r i d m e l p c e l pa l g o r i t h m ,m a i n l yb a s e do ns i m u l i n kt o o l s , h a sp r o v i d e dav e r ys h o r t l yr o a dt oe v e n t u a ld s pa n df p g ai m p l e m e n t a t i o n , w h i c hh e n c em e a n si tw o u l dh a v em u c hr e a l i s t i cs i g n i f i c a n c ea n dp r a c t i c a l v a l u e v 电子科技大学硕= 匕学位论文 【k e yw o r d s l m e l pc e l pp i t c h a l i g n m e n tp h a s e z e r o p h a s ee q u a l i z a i o n 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取祷酌磷究残暴。据我所翻,除了文中祷剐热以标注和黧鬻酶憋 方终,论文中不毽含其毽人已经发衰或撰写过黝磅究成果,也不包含 为获得电子科技大学缄其它教育机构的学位或诚书而使用过的材料。 与我同工作的同志对本研究所做的任何贡献均已在论文中作了明 确酶说疆并表示懿意。 签名;勤亟:目期:。啤j 月r 曰 关于论文使震授救的说溺 本学位论文孬簧完全了鬃毫子辩鼓大学有关僳餐、使翻学位论文 魏巍定,有权保留并囱国家有关部门或机构送交论文灼复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 髂全都或部分内容编入有关数据霹进行检索,可以采淆影印、缩印或 扫接等复豢手段保存、茳缡学蕴论文。 ( 保密的学位论文在解密后应遵守此规定) 嚣裁;0 确r 军$ 月事爱 宅子季 技大学醺圭学位逢文 a c e l p a d p c m a f l a g a m r a m r w b a b s a s e c e 己p d a m d f t d r t e v r c e f r f f t i f f t l c a s s p i t u t l d c e l p l p c l s p l s f m b e m e l p m o s m p m l q 缩略词 a l g e b r a i c c e l p a d a p t i v e d i f f e r e n c ep u l s ec o d e m o d u t a t i o n a p e r i o df l a g a d a p t i v em u l t i r a t e a d a p t i v em u l t i r a t ew i d e b a n d a n a l y s i s b y s y n t h e s i s a d a p t i v es p e c t r u me n h a n c e m e n t c o d ee x c i t a t i o nl i n e a rp r e d i c t i o n d i a g n o s t i ca c c e p t a b i l i t ym e a s u r e d i s c r e t ef o u r i e rt r a n s f o r n l d i a g n o s t i cr h y m e t e s t 嚣n h a n c e dv a r i a b l er a t ec o d e c e n h a n c e df u l lr a t e f a s tf o u r ;e rt r a n s f o r m i n v e r s e dd i s c r e t ef a s t f o u r i e rt t a n s f o r m i n t e r n a t io n a lc o i i f er e n c eo n a c o u s t i c s ,s p e e c h ,a n ds i g n a lp r o c e s s i n g i n t e r n a t i o n a lt e l e c o m u n i c a t i o n u n i o n t e l e c o m m u n i c a t i o ns e c t o r l o w - d e l a y - - c e l p l i n e a rp r e d i c t i o nc o d e l i n e a rp r e d i c t i o nc o e f f i c e n t l i n es p e c t r a lp a i r l i n es p e c t r a lf r e q u e n c y m u t i b a n de x c i t a t i o n m i x e d e x c i t a t i o nl i n e a rp r e d i c t i o n m e a r lo p i n i o ns c o r e s m u l t i p u l s e m a x i m u ml i k e h o o d v t l 代数码激励线性预测 自适应差分脓挣编鼹调 制 非周期糕志 自适应多速率 自适应多速率宽带 通过综合来分析 自适应谱增强 鹞激丽线性预溯 判断满意度测量 离散德立时交换 判断韵字测试 辔强交速率缡解码 增强全速率 捷速 毒立竹变挨 快速傅立叶逆变换 声音,语音与信号处理国 际会议 国际电联一通信分区 低时延码激励线性预测 线性颈测编弼 线性预测系数 线谱对 线谱频率 多带激励 混合激励线性预测 平均意见分 多脉冲一最大似然嚣亿 电子科技大学硕士学梅论文 m i p s m s v q p c m q c e l p 巍p 萎一l t p r 糙s s m v s 譬e t l a v b r v s e l p v q q u a n t i z a t i o n m i l l i o ni n 8 t r u c t i o n sp e rs e c o n d m u t i s t a g ev e c t o rq u a n t i z a t i o n p u l s ec o d em o d u l a t i o n q u a t e o m m c e l p r e g u l a rp u l s ee x c i t a t i o n l o n gt e r m p r e d i c t i o n r o o tm e a ns q u a r e s e l e c t a b l em o d ev o c o d e r s i n u s o i d a lt r a n s f o r mc o d e t e l e c o m m u n i c a t i o ni n d u s t r y a s s o e i a t i o n v a r i a b l eb i tr a t e v e c t o r s u m - e x c i t e d l i n e a rp r e d i c t i o n v e c t o rq u a n t i z a t i o n 百万条指令每秒 多缀矢爨量讫 脉冲编码调制 q u a l c o m m 鼹激翦线性 预测 艘粼繇坤澈融一长嚼预 测 均方摄 可选模式声码器 芷弦变换编码 电信工业协会 可变码举 矢量和激威线性预测 矢量量化 电子科技大学硕:b 学位论文 j j 语音信号的特点 第一章绪论 语音信号大致可以被分为浊音和非浊音( u n v o i c e d ,又称清音) 两种 类型,浊音信号的产生首先由肺内气流冲击声带( v o c a lc a r d s l ,造成声带周 期性开合振动,从而气流被周期性阻断,形成声门( g l o t t a l ) 周期激励,这个 激励气流通过喉,咽,口腔,鼻腔,嘴等构成的声管( v o c a lt r a c t ) ,产生空 气中的声压波,形成具有周期特征的语音信号。如果声带不产生周期振动, 紊乱的气流通过声管,则产生清音信号。因此语音信号常常被建模为周期 脉冲激励或白噪声激励信号( 用于模拟声门激励) ,通过具有某种共振峰 ( f o r m a n t ) 特性的时变线性滤波器( 用于模拟声管特性) 产生的输出。周期 脉冲激励信号的周期一般反映了语音信号谱的谐波结构,常被称为语音的 长时( 1 0 n gt e r m ) 特性,即周期特性。而共振峰即滤波器频率响应中的凸 峰,它反映滤波器频响的谱包络形状,它和激励的具体形状一起常被称为 语音的短时( s h o r t t e r m ) 特性,即波形细节。人类语音中浊音的比例大约 占6 0 ,清浊之间的过渡音大约占15 ,清音大约占2 5 【”】。不同的语 音清浊音类型往往有自己适合的语音编码模型,这导致了本文的多模语音 编码的工作。 图1 1 是单词c h i n a 的语音波形,图中c h 的发音属于清音信号区,后 面的发音属于浊音信号区,可以看到明显的周期形态,而且周期从9 帧开 始向后逐渐增大,反映音调增高。信号大致在7 ,8 ,9 帧的位置完成清浊 音的过渡。 语音信号还有一个重要的特点是短时平稳性。语音信号属于非平稳随 机过程,但是在短时的条件下又具有相对平稳的特点。在一段短时间间隔 内,语音信号的特征参数能够保持相对的稳定( 一般为1 0 3 0 m s ) ,语音信 号的分析常常分成1 0 3 0 m s 的帧进行,就是依靠这种短时平稳性。另外 语音信号的相邻短时段的参数变化也不会很大,即它们之间也存在着相关 性,这是由于人的发声器官运动速度的限制决定的。 人类听觉器官也有一定的特点。例如人耳对声音信号中的相位信息不 电子科技大学硕士学位论文 是很敏感,有时甚至被称为相位聋子( p h a s ed e a f ) ,这个特性被很多参数 编码器大大利用,它们往往把激励信号中的相位信息完全丢弃,以此达到 压缩语音的目的,但是在c e l p 等波形编码器中,仍保留较多相位信息, 这也是c e l p 等语音质量较高尤其是较自然的一个原因。 另外,人耳具有听觉掩蔽现象,即如果有两个声音成分同时存在,其 中一个成分可能对听觉的作用很小甚至完全不被人感知,即便其幅度或频 率或时间差距并非到了可以忽略的程度。人耳的听觉掩蔽可以用来屏蔽噪 声信号,例如在语音幅度谱中的突起点( 即谱共振峰) 附近,由于信号功 率更强,故人耳在这些区域对噪声的容忍能力更强,在c e l p 中这被用来 设计感觉加权滤波器。 人类发音器官的发声特性以及人耳的这些感知特性正在被用来做为更 高质量和更大压缩比率的语音压缩编码研究的基础【2 j 。 口囤固 图1 1单词c h i n a 的原始语音波形,每信号帧1 6 0 个样点 j 2 语音压缩编码算法的性能参数 衡量语音编码算法的性能主要有编码质量、编码速率、算法复杂度、 编码延迟等几个参数指标。 电子科技大学硕士学位论文 1 2 1 编码质量 编码质量就是考察合成语音的质量,其评价标准主要分为客观评价和 主观评价两种。 在客观评价中最常用的是信噪比( s n r ) 、加权信噪比( w s n r ) 等指标。 它们能够反映合成语音信号与原始语音信号在波形幅度上的差异,计算比 较简单,可以提供定量的分析。这些指标通常在其它的很多领域也在使用, 并没有针对语音信号的特点。由于语音信号的编码质量最终总是需要和人 的感觉联系在一起,而这些指标并不能准确的反映人的感受,所以其意义 一般来说是不大的。对语音编码质量评价使用得最多的还是主观评价。 主观评价中常用的方法是平均意见评分( m e a no p i n i o ns c o r e ,简称 m o s 分l 】o ) 、判断韵字测试( d i a g n o s t i cr h y m et e s t ,简称d r t 得分) 、判断 满意度测量( d i a g n o s t i ca c c e p t a b i l i t ym e a s u r e ,简称d a m f 2 2 1 ) 等几种。由于 语音信号编码的最重要的目的就是为了得到好的听觉效果,所以主观评价 就显得非常重要。m o s 分在这些评价准则中最常用,采用5 级评分标准, 如表1 2 所示。在语音编码领域中,最高为5 分;4 0 4 5 为公用电话质 量;3 5 分为通信质量,这时可以感觉到合成语音质量有所下降,但不影 响正常的通话。m o s 分3 0 以下时,合成语音具有一定的可懂度,但是自 然度较差,而且较难辨认出说话人。 表1 1m o s 分5 级标准及对应的语音质量 1 2 2 编码速率 m o s 分合成语音质量 】 糟糕 2 差 3 一般 4 好 5 优秀 编码速率即编码后的语音的数据速率,一般来说对于同一种语音算法 而言,提高编码速率可以提高合成语音质量,而降低编码速率则会降低合 成语音的质量。语音编码速率的降低可以带来语音通信系统容量的成倍提 升,这正是语音编码算法的价值所在。语音编码速率常用的单位是 b i t s ( b p s l 。最早的语音编码是p c m 的6 4 k b p s 速率,如今,编码速率在 电子科技大学硕= :学位论文 5 k b p s 一15 k b p s ,一般称为中速率语音编码,在2 k b p s 一5 b p s 一般称为低速率 语音编码,2 k b p s 以下一般称为极低速率语音编码。一般认为,语音编码 速率的申农下限为1 0 0 b p s 左右,可以称为“文字速率”,它已彻底失去语 音特征。 不同的应用以及不同的速率区间一般有自己较适合的语音编码模型, 有的语音编码算法是变速率的,这也常常导致编码器在不同的语音编码模 型之间切换。 1 2 3 算法复杂度 衡量算法复杂度的指标主要有空间复杂度和时间复杂度两种。 空间复杂度指的是算法所需消耗的存储器的空间大小,时间复杂度指 的是用数字信号处理器件进行编码时单位时间需要消耗的指令数。现在 d s p 器件的运算能力一般以m i p s ( m i l l i o n i n s t r u c t i o n sp e rs e c o n d ) 为单位, 比较常用的一些d s p 器件的运算能力都在1 0 0 m i p s 左右。 一般来说,算法的复杂度越大,语音的编码质量会更好但是相应的空 间复杂度和h 寸间复杂度也会较高。目前在实现低复杂度算法时可以采用简 单的硬件来实现,或者直接利用通用计算机软件实现;在实现低码率语音 编码算法时由于其复杂度比较高般都需要使用专用的d s p 芯片。目前随 着数字信号处理器件的集成度越来越高,速度越来越快,存储空间也越来 越大,这些都为我们实现高复杂度语音编码算法提高了便利,很多以往难 以实现的算法现在都得以实现了。 1 2 4 编码延时 编码延时是语音实时通信中一个比较重要的指标。我们使用图1 2 来 描述编码延时的具体过程。图中a 点是编码端一个语音帧的开始,b 点是 其结束,由于语音编码几乎都是基于帧的,即获取一个完整的语音帧后统 一处理,所以编码器要到b 点才能处理本帧信号,a b 的时间延迟称为 编码缓冲延时,这个延时等于帧长度,一般在2 0 3 0 m s ,有的编码中编码 器还要看下一帧开始的若干数据点,这个时间更长。对低延时编码应用, 由于其特别的处理,这个延时小于1 m s 。 然后编码器利用b c 的时间段进行编码计算,这称为编码处理延时。 4 电子科技大学硕士学位论文 编码处理延时必须小于分析帧时间长度a b ,否则就会阻塞数据外发。 然后编码端把数据编入传输比特中开始传输,传输比特到达解码端, 并且重新获得一个帧的已编码数据,对应图中c d 的时间延迟,称为传 输延迟,又常常被称为解码缓冲延迟,因为它代表了从编码器计算出一帧 的已编码数据到解码器重新收集齐这些解码数据所需要的时间间隔。这告 诉我们如果要减少总延迟时间,应当将已编码的一个帧数据尽量快地打成 一个完整的数据集突发地传输到目的端。对于高速突发的传输中,解码缓 冲延迟可以被忽略,但在传输速率等于语音生成速率,或者将已编码数据 平均分布在一个语音帧时间当中传输时,这个延迟可能超过编码缓冲延吲。 犏鹅端谱爵榭l绑粥端潞扦申l ;i a b i i 编峭避珊趱邂 c :菇嚣蕃二= 二一 馁辘延迟- d 1 ”1 ”1 。1 ”1 。 + 编躺逛趣 ( 盛蜒嬲j j 一艘箩处燃逛进 剀1 2 编码延时的不意图 解码端收齐一帧的已编数据后,开始进行解码计算,这个时问段d e 的延迟称为解码处理延迟,这个延迟也要求小于语音帧时间长度,否则 将阻塞语音信号的生成。解码处理延迟时间一般是较小的,常常可以忽略。 至此解码端开始在e 点产生原来a 点的语音信号,此时的语音已经过 了4 段时间延迟,这个总的延时称为编码延时。我们可以看到,这个延时 的最小值至少是一个语音帧的帧长,所以一般来说帧长是估计语音延刑的 主要参数,一般把实际编码延迟定为帧长的15 2 5 倍。 电子科技大学硕士学位论文 1 2 5 算法性能的综合评价 语音算法应该综合考虑上面几个指标。值得注意的是这几个指标有时 是相互矛盾的,一般而言,降低编码速率就意味着降低编码质量、或者增 加算法复杂度、增大编码延迟;而要提高编码质量则需要增加算法复杂度、 提高编码速率。每一个指标的要求提高,都由可能会造成另外的指标的性 能下降,所以要使语音编码算法满足实际应用的要求,必须在这几个指标 中进行折衷。语音编码算法还有一些其它评价指标,例如稳健性能,包括 抗误码性能,对背景噪声的适应性能,对非语音例如音乐声音的适应能力, 对不同说话人例如男女的适应能力等,以及编码信号复接性能等有时候电 是需要进行评价的。 j 3 语音压缩编码的进展和编码标准 声音信号编码如果按带宽分,可以分为3 种类型。现阶段多数语音编 码采用3 2 - 4 k h z 左右带宽,8 k h z 采样率,这样的语音编码常被称为窄带 语音编码。而如果采用7 k h z 带宽,1 6 k h z 采样率,则相对地被称为宽带 语音编码。高保真音频信号一般采用15 2 0 k h z 带宽,3 2 4 41 - 4 8 k h z 采样率,被称为音频( a u d i o ) 编码。这里我们主要讨论窄带语音编码的简 要发展历程和形成的主要标准。 1 9 3 9 年,美国的h o m e rd u d l e y 发明了最初的模拟声码器,到2 0 世纪 6 0 年代末,i t a k u r a ,s a t o , a t a l ,h a n a u e r 等人开始将线性预测技术引入 参数语音编码的中来,开始了真正意义上的语音压缩编码研究。此后数 年,语音编码算法主要按照以波形编码为重和以参数编码为重两个主线发 展1 4 1 ,按照当前的习惯趋势,我们这里将其分别称为波形编码和参数编码。 最初的语音压缩编码主要是基于参数编码,常常又被称为声码器 ( v o c o d e r ,但声码器这个名字正成为语音编码器的总称,例如变速率编码 中有一种编码称为可选模式声码器( s m v ) ,主要基于c e l p 波形编码, 但仍被称为声码器) ,参数编码又常被称为谐波编码,该类方法往往只提 取语音中的特征参数,而且往往在频域进行操作,而不是编码语音列域波 形,其合成语音通常与原始语音波形有较大差异,但是听觉效果相同。 参数编码的一个子类主要基于l p 分析,早期的声码器多使用这个方 电子科技大学硕士学位论文 案。早期的声码器主要采用周期单脉冲和随机噪声l p 建模的声道进行激 励的模型,这个模型后来发展成为联邦标准f s l 0 15 ,它采用的是增强的二 元激励1 0 阶l p 分析模型,故又称为l p c i o e 。这个子类在不断完善和改 进当中,以后提出的算法中最著名的是m c c r e e 和b a r n w e l l 的所谓混合激 励线性预测( m e l p ) 2 4 1 ,在1 9 9 7 年成为联邦标准 3 2 i f s l0 1 7 ( 或称n e w f s l 0 15 ) ,主要用于保密通信当中。 参数编码的另一个子类一般称为正弦编码( s i n u s o i d a ic o d i n g ) ,它一 般在频域上直接提取原始语音信号的参数。这类编码器主要代表是 m c a u l e y 和q u a t i e r i 等提出的f 弦变换编码( s t c ) m 】,以及l i r a 和g r i f f i n i - 等提出的多带激励编码( m b e ) ,其中m b e 成为i n m a r s a t 卫星通信的标 准以及t i a 半速率t d m a 数字蜂窝标准。 语音编码的另一个发展主线为波形编码,但是纯粹只借助波形编码技 术( 例如p c m 或a d p c m 等) 的算法如今很少研究了,现在的波形编码一 般也混合使用了很多参数编码中用到的技术,例如一般使用了l p 分析和 a b s ( a n a 】y s is - b y - s y n t h e s i s ) 技术,所以有时又被归入混合编码的类型中, 属于混合编码中侧重波形的子类型。我们讨论的波形编码主要着眼匹配语 音信号的时域波形,其合成信号往往与原始语音波形相近。它改进了原始 二元激励l p 语音编码模型,对周期脉冲激励和随机激励力求表现其激励 信号的波形细节。 最初的波形编码主要包括a t a l 和r e m d e 提出的多脉冲激励线性预测 ( m p l p c ) ,以及k r o o n ,d e p r e t t e r e 等人提出的规则脉冲激励长时预 测( r p e l t p ) ,后者后来成为g s m 的语音编码标准,获得空前广泛的应 用。 但波形编码最重要的突破是由a t a l 和s c h r o e d e r 等人在1 9 8 4 19 8 6 年 开始提出的码激励线性预测c e l p 4 8 】【4 叭,它不再具体记录激励脉冲的实际 位置,而是用码本库中的矢量码字来作激励信号,实际传输的是矢量码字 的索引,故称为码激励线性预测,其实质是对l p 分析残差的矢量量化。 有趣的是,a t a l 指出,码本库中的矢量码字不需要训练聚类,只需用白高 斯随机样本填充即可,故c e l p 编码常常又被称为随机编码( s t o c h a s t i c c o d i n g ) 。特别地,在一些早期文献中c e l p 又被称为随机激励线性预测 s e l p ( s t o c h a s t i c a l l ye x c i t e dl i n e a rp r e d i c t i o n ) ,或者矢量激励编码( v e c t o r e x c i t a t i o nc o d i n g ) ,由于c e l p 实质是对多脉冲残差激励实行矢量量化, 有时又被称为新息矢量量化编码。 奄子辩拄大学磺二卜学设论文 对c e l p 发展 笮密的主要荧献,述包箍翠期的a t a la n ds c h r o e d e r 在 19 7 9 的感知加权误差【4 “,i t a k u r a ,k a n g ,t a n a k a ,c u p e r m a n 3 3 】,k a b a l ( 3 0 等久静线谱频率及英多缀矢爨誊讫。后联畜g e r s h o 等人静稀巯鹚本良及 a d o u l 等人提出的代数码本激励 ” ,k l e i j n 等人提出的自适应码本 5 4 1 , g e r s o n 和j a s i u k 等人数矢量帮激爨线洼鞭溅( v s e l p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论