(电路与系统专业论文)g729+csacelp语音编解码算法研究及其实现.pdf_第1页
(电路与系统专业论文)g729+csacelp语音编解码算法研究及其实现.pdf_第2页
(电路与系统专业论文)g729+csacelp语音编解码算法研究及其实现.pdf_第3页
(电路与系统专业论文)g729+csacelp语音编解码算法研究及其实现.pdf_第4页
(电路与系统专业论文)g729+csacelp语音编解码算法研究及其实现.pdf_第5页
已阅读5页,还剩77页未读 继续免费阅读

(电路与系统专业论文)g729+csacelp语音编解码算法研究及其实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着多媒体技术的不断发展,语音编码作为多媒体通信中信息传输的一个重 要环节,越来越受到广泛的重视,对语音编码提出的要求也越来越高。不仅要 求低码率、低延时,而且要求很高的语音质量。而作为中低速率语音编码算法中 的佼佼者g 7 2 9 越来越受到广泛的重视。 本文对g 7 2 9 语音编码算法的基本原理和实现系统开发方面进行了深入研 究。在针对g7 29 c s - a c e l p 语音编码算法在实际应用中存在的一些问题,在 大量分析和实验的基础上,提出了新的改进算法。并给出一个基于t m s 3 2 0 c 6 7 1 l d s p 芯片的语音信号处理系统。本文主要包括以下几个方面: ( 1 )针对g 7 2 9 语音编码算法中大量利用了多级查询或多级量化的方 法。为了降低复杂度,考虑在满足精度要求的前提下,提出一种 新的改进方法,即进一步粗化第一步的搜索过程或量化过程,从而 减少了总的搜索时间。 ( 2 )针对g 7 2 9 语音解码算法在发生帧删除后语音信号的进一步衰减和 发生帧删除时最近好帧的l p 振幅含有尖锐的共振峰影响合成语音 质量的情况,提出一种新的帧删除隐蔽方法,使语音信号的进一步 衰减被得到抑制。 ( 3 )针对g 7 2 9 语音编解码算法实现中存在的问题,文中还详细介绍了 基于t m s 3 2 0 c 6 7 1 ld s p 芯片的语音信号处理系统的总体方案和 硬件设计,并给出其仿真结果。 a b s t r a c t w i t ht h ei m p r o v e m e n to ft h em u l t i m e d i ac o m m u n i c a t i o nt e c h n o l o g y , a so n e o ft h em a i n p a r t o fm u l t i m e d i a c o m m u n i c a t i o n s ,s p e e c hc o d i n g i s r e g a r d e d e x t e n s i v e l y c o m m o nu s e r sn o wa s kf o rm o r ea n dm o r ec o n v e n i e n c ef o rs p e e c h c o d i n g a s ag o o da r i t h m e t i co fl o ws p e e d s p e e c h c o d i n ga r i t h m e t i c ,g 7 2 9 i s r e g a r d e de x t e n s i v e l y i nt h i sp a p e r ,w o r k sh a db e e nc a r r i e do u tn o to n l yo nt h eb a s i cs p e e c hc o d i n g a r i t h m e t i cr a t i o n a l eb u ta l s oo nt h ep r a c t i c a ls y s t e md e s i g n i na c c o r d a n c ew i t ht h e s o m ep r o b l e m so ft h eg7 29 c s a c e lp s p e e c hc o d i n ga r i t h m e t i c ,b a s e do n a l a r g e n u m b e ro fa n a l y s i s s y n t h e s i se x p e r i m e n t s ,an e wa m e l i o r a t i v ew a sp r o p o s e d t h i s p a p e rg i v e as p e e c hs i g n a l s y s t e m t h em a i n c o n t e n t so ft h e p a p e r i n c l u d e s : ( 1 ) i na c c o r d a n c ew i t hm u c hu s eo f m u l t i l e v e lq u e r yo rm u l t i l e v e lq u a n t i z a t i o n m e t h o d u n d e rt h ep r e c o n d i t i o no fs a t i s f i n gp r e c i s i o n ,an e wa m e l i o r a t i v e w a s p r o p o s e d ,s os e a r c h i n gt i m e w a sd e c r e a s e d ( 2 ) i na c c o r d a n c ew i t ht h ec i r c u m s t a n c e so f t h em o r ed e c l i n i n go f s o u n ds i g n a l a f t e rf r a m ee r a s u r ea n db e s tl ps w i n gt h a ti n c l u d i n gs y n t h e s i z e ds o u n d q u a l i t y w i t h s h a r p f o r m a n ti nr e a l a p p l i c a t i o n ,a n e wf r a m ee r a s u r e c o n c e a l m e n tm e t h o dw a sp r o p o s e d ,s om o r ed e c l i n i n go fs o u n ds i g n a lw a s r e s t r a i n e da f t e rf r a m ee r a s u r e ( 3 ) i na c c o r d a n c ew i t h ( 3 7 2 9s p e e c hc o d i n ga r i t h m e t i ce x i s t e n tp r o b l e mo nt h e p r a c t i c a ls y s t e md e s i g n ,t h es p e e c hs i g n a lp r o c e s s i n gs y s t e m t h a tb a s e do n t m s 3 2 0 c 6 7 1id s p c h i p w a s p r o p o s e di nt h i sp a p e r , a n d i m i t a t er e s u l t w a s g i v e 2 中国科学技术大学硕士学位论文 第一带绪论 第一章绪论 语音楚语言麴声学表现,跫人类交流信惑最鑫然、最有效、最方便酶手段, 也是人类邀行思维鲍一耪恢援。人类进入信息时代以来,开娥用瑗代手段磅究港 参处理技术,使人们能更炽有效地产生,铸辕、存储和获取语音信息。这对促进 社会发展具有十分重要意义。 1 语音编码的现状及其实现的意义 髓蓑璎代信息技术的发展,特别是移动逶售和个人遁信的蓬勃发展。语音编 码作为多媒体通信中信息传输的一个重要环节,越来越受到广泛的重视,对语 凿编码提出的要求也越来越高。不仅要求低码率、低延时,而且要求很高的语音 质量。先进的语音压缩编码的目标就是要在尽可能低的比特率下,最大限度的提 取语音信号的特征信息,在接收端恢复尽可能清晰自然的语音。早期的波形编 确,语音质照好,但同时也对传输速率提出了很高的要求:盾来发展起来的参数 编码,逐步降低了编码速率,值重建语音的质薰有相对幅度的下降。为此又发展 了薪代的参数编码算法混合编码,这种算法将波形编粥帮参数编码两种方 式结合起来,兼颧了传输速率与语音溪鳖豹要求,它不纹低秘率、舔鬣对,掰釜 落音袋量嵩。 测 1 峰 | 姬 编码速率k b p s 鲻1语音质量与编码速率 19 8 5 年m a n f r e dr s c h r o e d e r 和b i s h n us a t a l 在i - c a s s p 年会上首次提 中国科学技术人学硕士学位论文第一章 绪论 出了用码本作为激励源的线性预测编码技术( c e l p ) 。它以高质量的合成语音及 良好的抗环境噪声的能力在4 8 k b p s 16 k b p s 的码速率上获得了极大的成功。 十几年来,为减少c e l p 复杂度、增强c e l p 性能,又产生了一些c e l p 的改进 形式和新的编码标准: 美国政府标准f s l 0 1 6 ( 4 8 k b p sc e l p ) ; 北美数字蜂窝语音编码i s 5 4 ( 8 k b p s 矢量和线性预测v s e l p ( 矢量和激励线 性预测编码) ) ; 同本数字蜂窝语音编码j d c ( 6 7 k b p s v s e l p ) 。 此外i t u t 以制定的国际标准有: g 7 2 8 ( 1 6 k b p s 低延时c e l p ,l d - - c e l p ) : g 7 2 3 ( 5 3 k b p s 代数码激励c e l p ,a c e l p 和6 7 k b p s 多脉冲最大似然量化 c e l p ,m p - - m l q c e l p ) g 7 2 9 ( 8 k b p s 共轭代数c e l p ( c s - - a c e l p ) ) 等。 i t u t - t 于1 9 9 6 年制定了g 7 2 9 标准,g 7 2 9 算法不仅速率低,时延小,而 且语音质量好。( 3 7 2 9 有可能成为将来的多媒体通讯,i p 网络即移动通讯系统 中语音编码的首选算法,具有广泛的应用前景。 g 7 2 9 虽然能在中低速率上提供较好的合成语音质量,成为目前语音编码算 法中最主要的方案,但计算复杂和数据存储量大却是它的固有缺陷。这使得这一 理论上性能良好的语音编码方案在实时实现或实际应用中还存在许多困难。因 此,语音编码算法的实时实现一直是该领域中的一个具有重大意义的研究课题 近年来,由于超大规模集成电路( v l s i ) t 艺的进步,极大的推动了d s p 技 术的发展。使得d s p 以其卓越的运算能力为语音信号处理领域的研究及开发提 供了有力工具。使得各种复杂的语音编解码实时实现成为可能。我们研制语音编 解码系统的目的就是提供一个适合语音编解码算法研究和实现的平台。 2 本文的安排 本文作者所做的工作是:在研究g7 29 c s - a c e lp 语音编码算法基础上, 通过分析其原理及基本特征,在实际应用中针对算法中大量利用了多级查询或 多级量化的方法、发生帧删除后语音信号的进一步衰减和发生帧删除时最近好帧 中国科学技术大学硕仁学位论文第一章绪论 的l p 振幅含有尖锐的共振峰影响合成语音质量的情况,在满足精度要求的前提 下,提出了优化算法的两种方案,从而减少了总的搜索时阳j ,大大降低了算法 复杂度;并在发生帧删除后,语音信号的进一步衰减被得到抑制。并介绍了一个 基于t m s 3 2 0 c 6 7 1 1d s p 芯片的语音信号处理系统的设计步骤,最后给出其仿 真结果。本文以后各章的主要内容分为六章,以后各章的主要内容安排如下: 第二章g 7 2 9 的基本原理。本章主要对g 7 2 9 的编码原理和解码原理的 各个部分作了详细介绍。 第三章g 7 2 9 算法改进。本章针对g 7 2 9 算法中大量利用了多级查询或 多级量化的方法、发生帧删除后语音信号的进一步衰减和发生帧删除时最近好帧 的l p 振幅含有尖锐的共振峰影响合成语音质量的情况,提出一种新的改进方法。 第四章基于t m s 3 2 0 c 6 7 1 l 型d s p 的语音编解码系统。本章主要介绍系 统的总体设计,以及c 6 7 1 1d s p 芯片的时钟、供电、电源监控和芯片模式等模 块的设计。 第五章一一t m s 3 2 0 c 6 7 1 1 与外部器件的接口。本章主要介绍c 6 7 1 1 和 s d r a m 、f l a s h 、u s b 芯片和音频c o d e c 的接口设计。并给出系统的仿真结 果。 第六章结论。本章总结了本文所完成的工作。 中阂科学技术大学硕士学位论文 第一章q 7 2 9 的甚本原理 第二章g 7 2 9 的基本原理 g 7 2 9 基于一人类声学模型上,在这模型罩,用一线性滤波器代替喉和嘴, 利用激励信号激励这个滤波器产生语音信号。g 7 2 9 语音编码算法是一种以共轭 代数码本激励线性预测为基础,且编码速率为8 k b s 的高质量的语音编码标准。 其特点是速率低( 8 k b s ) ,时延小,且语音质量好。 1 、g 7 2 9 的编码原理 g 7 2 9 语音编码算法就是一种以共轭代数码本激励线性预测为基础,且编 码速率为8 k b s 的高质量的语音编码标准。它以采样率为8 k h z 的1 6 比特线性 l p c 参数 传输码流 中国科学技术大学硕卜学位论文第一二章g 7 2 9 的基本原理 图2c s a c e l p 编码器原理图 p c m 编码作为输入语音信号。图2 显示了编码器算法框图。 在编码端,采样输入的语音信号首先经过预处理,预处理包括信号缩放和高 通滤波,以预防定点运算时的溢出和低频分量的干扰然后按每一帧提取10 阶 l p ( l i n e p r e d i c t i v e ) 参数并转化为l s p ( l i n es p e c t r u m p a i r s ) 参数进行量化、 编码;并用l p 参数分别构成感觉加权滤波器w ( z ) 以及合成滤波器l a ( z ) ;原 始语音信号与合成语音信号的差经感觉加权滤波器后除去感觉加权滤波器的零 输入响应求得目标信号,目标信号经过自适应码本搜索及固定码本搜索后产生 激励信号,分别乘以各自的增益,并共同激励合成滤波器,产生本地重建语音信 号由此可看出,c s a c e l p 语音编码算法主要包括l p 参数的提取、量化及编 码、自适应码本搜索、固定码本搜索和增益矢量量化五个部分。 1 1 l p 参数的量化、编码 l p 分析窗是由h a m m i n g 窗( 前2 0 0 个样点) 的一半和余弦窗( 后4 0 个样 点) 的四分之一合成的。3 0 m s 长的窗能使l p 滤波器的响应更光滑。加窗以后 的语音信号计算出自相关系数,并乘以一个改进系数后,利用l e v i n s o n d u r b i n 算法每一帧提取10 阶l p 滤波器参数,l e v i n s o n d u r b i n 算法用下面方式进行递 归: 砂】= r 7 ( 0 ) f o r i _ 1t o1 0 9 1 = 1 t ,= 一区“j = o 口炒( f 一,) | 一1 日卜k , f o r j 2 1t oi - 1 口j 】= 口+ 七,口譬1 e n d 州= 1 - k , 2 ) e l “】 中国科学技术大学硕士学位论文第二章g 7 2 9 的基奉原理 最后,l p 滤波器参数日,= d p ,= 1 ,l o = 1 0 。 量化时,出于l p 系数的很小变化,会引起合成滤波器极点位置的极大变化, 甚至造成不稳定现象。因此对得到的l p 滤波器参数利用c h e b y s h e v 多项式将其 转化为频域参数l s p ,就较好的解决了这一问题,然后再按均方误差( m s e ) 最 小原则,经二级量化将线谱对( l s p ) 矢量量化为1 8 b i t 二级码本索引进行传输。 1 2 l p 参数到l s p 参数转化过程 设a ( z ) 为一个l o 阶l p 滤波器,定义多项式( 1 ) 和( 2 ) : e i z ) = 爿0 ) + = - 1 1 爿g 1 ) 巧( z ) = 4 ( z _ _ z - i i 爿- 。) ( 1 ) ( 2 ) 由于f :( z ) 是对称的,e ( z ) 是反对称的,可保证所有多项式的根在单位圆 上交替出现,且f ( z ) 和e ( z ) 分别有根z = l 和z = 一1 。除去这2 个根定义新的 多项式( 3 ) 和( 4 ) : f ( 孑) = f ( :) ( 1 + z _ 1 ) ( z ) = e 0 ) ( 1 一z 。1 ) 又由于每个多项式在单位圆上有5 个共轭根,所以( 3 ) 和( 4 ) 又可写成 f 沁) = 兀( 1 2 q 。z 1 + z ) 憎1 3 ,9 e 0 ) = n ( 1 2 q ,= “+ z 。2 ) f _ 2 4 ,1 0 ( 3 ) ( 4 ) ( 5 ) 其中q ,= c o s ( o ) ,) ,r _ o ,为l s p 频率,q ,为l s p 参数。由于f :( z ) 和e ( z ) 的对称 性,所以每个多项式只需使用递推算法计算前五个多项式系数 f l ( i + 1 ) = 口1 + 口l 。一,一 ( f ) i = o ,4 ( f + 1 ) = a 。一a l 。一+ 厶( f ) i t o ,4 初始条件为:;( o ) = ( 0 ) = 1 0 。 ( 7 ) ( 8 ) 中国科学技术大学硕 学位论文第二章g 7 2 9 的罐奉j 泉理 又令z = e j 。,则 f 卜2 e - 15 w c ( x )( 9 ) 其中 c ( x ) = t b ) + s 0 ) r 4 b ) + f ( 2 皿0 ) + s ( 3 圾0 ) + 厂( 4 拓0 ) + s ( 5 ) 2 ( 1 0 ) 瓦,( x ) = c o s ( m c o ) 是m 阶切比雪夫多项式,c ( x ) 还可以由递推算法求得,即: f o rk = 4d o w n t o1 b = 2 x b k + l b i + 2 + s ( 5 一k ) e n d c ( x ) = x b l - b 2 + f ( 5 ) 2 其中b 5 = l ,b 6 = 0 ,x = c o s ( w ) 。利用式( 9 ) 计算f :( z ) 和e ( z ) 的根,即为l s p 系数。 1 3l s p 参数量化 由于l s p 特征矢量的各个分量虽然属于一个整体,但它们对幅度谱的影响 只局限于各自的频率区域内,这就使其可以将一维数较高的特征矢量分裂为两 个维数较低的特征矢量分别进行矢量量化,即分裂式矢量量化。 g7 2 9 采用两级分裂式矢量量化,首先利用m a ( 滑动平均) 滤波器结合| j 几帧的l s p 系数预测当前帧的l s p 码向量,然后根据均方误差最小原则,在码 本1 中搜索出对应的码矢,将其量化为7 b i t ;第二级量化将第一级量化得到的最 小均方误差矢量分为两个子分量,前五个构成一个子矢量,后五个分量构成一个 子矢量,分别量化为5 b i t 。采用多级分裂式矢量量化,不但可以大大减少码书的 搜索量、存储量,又使整体量化精度得以保持。 l s p 参数量化时首先令q = a r c c o s ( q ,) ,i = l ,1 0 ,q 1 0 ,1 1 】 q 是l s p 参数,然后利用和m a ( 滑动平均) 滤波器参数。根掘公式( 1 1 ) 计 算矢量l , :! m ,一圭p 时f c m 。, f l 一圭p i = 1 ,- o ( ,) l i t i j t i 中固科学技术大学硕t 学位论文第二章g , 7 2 9 的基本原理 然后用j 根据均方误差最小原则搜索上l 码本,得到码本索引l l ,将第一级量化 得到的最小均方误差矢量分为两个子分量,分别搜索r 2 和c :;码本,得到码本索 1l 2 和l 3 。 1 4 开环基音分析 为了减少自适应码本搜索的复杂度,需要计算丌环基音t o r ,使自适应码本 搜索在开坏基音值附近进行。开环分析时,在每个子帧内利用公式( 1 ) 计算出加 权语音的自相关: r ( k ) = ( 1 2 ) 冥中k 分成三组,分别为:1 ) k = 8 0 1 4 3 :2 ) k = 4 0 7 9 ;3 ) k = 2 0 3 9 ;求出各 组的最大自相关值,利用下面算法: r 。= f i r 阢) = r ( f 。) i f r o :) 0 8 5 r 忆) r 阢) = 尺7 ( f :) 乙= r 2 e n d i f r ( f 3 ) o 8 5 r 阢) r 7 口乙) = r ( f ,) f 。= ,3 e n d 对应计算出可能存在的基音周期值l a 、l - , 尼一玎 ji甜k 盘、 玎 ,i吐 s 为栅 中国科学技术大学硕士学位论文 第一章g 7 2 9 的基本原理 1 5 自适应码本搜索 g 7 2 9 自适应码本搜索先采用丌环的方法,在每个子帧内利用加权语音的相 关性计算出丌环延迟后,再用闭环方法在延时为丌环延迟的一个小范围内搜索 出最佳自适应码矢量。闭环基音搜索是通过最小化原始语音信号和重构语音信号 的加权均方误差来进行。这可由公式( 1 3 ) 完成: r ) = :。z 0 溉( 刀) 压丽丽 ( 1 3 ) 闭环分数延迟的搜索过程分两个子帧进行,第一子帧的闭环基音t 。的搜索 是局限在开环基音l 的一个小范围( 6 个采样点) 内,搜索范围的上下边界f m m 、 f 由下面的算法确定: ,。= p 一3 i f f 。 1 4 3 t h e n f 。= 1 4 3 ,。= ,一一6 e n d 第二子帧闭环基音t 2 的搜索是局限在闭环基音t 。的一个小范围内,搜索出 本子帧的最佳基音延时。搜索范围的上下边界为t r a m - - 妄、r + 寻,r 。、f 。 由下面的算法确定: ,。= n t ( t o 一5 i f t 。 1 4 3 t h e n ,。、= 1 4 3 用8 b i t s 对t 。进行编码,编码方法如公式( 1 4 ) : 怍 篡1 麓= 叫 用5 b i t s 对t z 进行编码,编码方法如公式( 1 5 ) : p 2 = 3 ( i n t ( t 2 ) 一f 。) + y r a c + 2 1 6 固定码本结构及其搜索 ( 1 4 ) ( 1 5 ) 传统的c e l p 算法中用一个自适应码本中的码字来逼近语音的长时周期 性( 基音) 结构,而用一个固定的随机码本中的码字来逼近语音的经过短时、长 时预测后的信号,即逼近由自适应预测所得的语音信号与原始语音的误差,从而 为合成语音提供更精确的误差补偿,提高语音质量。 g 7 2 9 的代数码本结构采用插入单脉冲排列( i s p p ) 设计方案,这种码本的每 个码矢都有四个位于不同样点子集的单位脉冲构成,同时又采用解析码本方案, 解码器利用传输码流本身的信息就可以重构码矢和码本增益,而不需要象通常 的矢量量化方法那样,去搜索一个具体的码本,从而提高了效率。 在这个码本中每4 0 个样本激励向量仅有四个非零脉冲,记为f 0 ,i :,i 3 ,其 幅值和位置见表l : 表1非零脉冲的幅值和位置 脉冲符号位置 l 芘5 0 : 1 m o :0 , 5 ,1 0 ,1 5 ,2 0 ,2 5 ,3 0 ,3 5 i o 中周科学技术人学倾卜学位论文第一二章g 7 2 9 的璀奉原理 j is l : 1 m ,:i ,6 ,1 1 ,1 6 ,2 1 ,2 6 ,3 1 , 3 6 1 1 s 2 : 1 聊2 :2 , 7 ,1 2 ,1 7 ,2 2 ,2 7 ,3 2 ,3 7 - f js 3 : 1 m 3 :3 , 8 ,1 3 ,1 8 ,2 3 ,2 8 ,3 3 ,3 8 4 ,9 ,1 4 ,1 9 ,2 4 ,2 9 ,3 4 ,3 9 每个激励码字可写成: c ( ”) = s 0 6 ( n m 。) + s 占o 一,押,) + j :占0 一m :) + 5 ,j ( 一m ,) n = o 3 9( 1 6 ) 其中占( ) 是时刻n 的单位冲激函数,从公式( 1 6 ) 中可看到,脉冲幅值仅为+ 1 或 一1 ,由于这种限制,再加上码字的稀疏,使得码本搜索大大简化了。 由于四个脉冲的位景都不连续,我们使用一个共轭搜索,这是局部码本搜索, 它在第三个循环之后限制码本搜索的努力,这种搜索产生的语音品质和s n r 与 全搜索相当,但码本搜索量只有它的5 。前三个脉冲的位置每个用3 比特表示, 第四个用4 比特表示,脉冲幅度每个用1 比特表示,所以每个子帧不包括增益的 比特数是1 7 比特。 固定码本可由公式( 1 7 ) 得到: s = s o + 2 + 4 5 2 + 8 5 , c = 。5 ) + 8 ( m 。5 ) + 6 4 ( m :5 ) + 5 1 2 ( 2m ,5 ) + 豇) ( 1 7 ) s 为码字符号,c 为码字,m 。,m 。,m :,m ,为四个非零脉冲在码本中的位置,其中: j x = o m ,= 3 8 ,3 8 ;j x = 1m ,= 4 9 ,3 9 1 7 增益的矢量化 增益量化分为自适应码本增益和固定码本增益两种,由于自适应码本增益 大小与语音信号准周期性强弱密切相关,它在各子帧之间变化较大,可直接进 行量化,量化方法如公式( 1 8 ) : 乩一心i i i l 7 1 i + e j 尽l f t 也i f 1 8 1 而固定码本的增益则由于语音信号的短时平稳性而具有较强的帧间相关性, 可以通过增益预测来提高增益的量化精度和量化效率,量化方法如公式( 1 9 ) : 中田科学技术大学硕士学位论文第二章g 7 2 9 的基本腺理 且一旷一:fr t 0 匕f l 7 ij 十j 尽型l ? 口j j 其中g a ,g b 伪码本索引。 2g 7 2 9 的解码原理 f 1 9 ) g 7 2 9 的解码也是按帧进行的,主要是对符合g 7 2 9 协议的码流进行解 码,得到相应的参数,根据语音产生的机理,合成语音。图3 显示了解码器算 法框图。 崮定 码失 白适应 码失 l s p 参数 g c 2 i 提取l s p 参数 数。 图3c s a c e l p 解码器原理 解码时,首先要从码流中提取l s p 参数,并将l s p 参数转换为l p 参 利用码流中的l 1 ,l 2 ,l 3 ,根据式( 2 0 ) 计算参数2 : b c i l i i - i - t 3 2 ;( l 2 1 札竺盎 , 为了避免l p 滤波器量化时的尖锐的共振,对2 。进行如下处理: 三至生堕羔旦翌受墅堂堡堡塞 丝三至垒! ! ! 塑蔓查堕堡 f o r i = 2 ,1 0 i f ( f _ l ,一j ) f 一。= ( f + f r j ) 2 f = g + f 一,) 2 e n d e n d 这个过程做两次,分别令j = o 0 0 1 2 ,j = o 0 0 0 6 。 然后根据式( 2 1 ) 计算击,: , 4 、4 西j 州= l1 - 礼一十芝饥护“ i = l ,1 0 ( 2 1 ) k m l b i 其中西j 为m 帧的西, “为m 帧的2 。由西;可算出l s p 参数。再由l s p 参 数转化成l p 参数。 2 2 l s p 参数到l p 参数的转化 l s p 参数向l p 参数转化时首先计算f i - ( z ) 和e ( z ) 的多项式系数:计算 f ;( z ) 多项式系数算法如下: f o r i 1t o5 i ( f ) = - 2 q :。f ( i 一1 ) + 2 f 。( i 一2 ) f o r j = i 一1d o w n t o 1 z 0 1 0 ) = z d 一1 1 ( ,) 一2 q 。,f t , _ 1 】o 1 ) + _ i 一1 】( ,一2 ) e n d e n d 其中3 ( 0 ) - - 1 ,i ( _ 1 ) = 0 计算e ( z ) 的多项式系数厶( f ) 的方法跟计算f ( z ) 多项式系数算法相同,只是用q :。一。替换q :。 一旦f l ( i ) 和f 2 ( i ) 被确定,f :( z ) 和乓( z ) 即可解得,方法如式( 2 2 ) : 中田科学技术人学坝f :学位论文 鹅一审g 7 2 9 的娃奉原理 币0 = 石( f ) + 彳( f 一1 ) 月( f ) = 五( f ) + 五( f 一1 ) 最后l p 系数可由式( 2 3 ) 计算出 i _ 1 ,5 i - l ,5 f 2 2 ) t i 二1 i j l + u ;,奎“ j l j ”饥c 儿_ ,t - - 3 f ! i 儿一以_ - 帆 f 2 3 ) 2 3自适应码本矢量和固定码本矢量解码 在进行自适应码本矢量解码时,先用p 1 解码出t 1 ,算法如下 i fp l 1 9 7t h e n i n t ( t 1 ) = ( p i + 2 ) 3 + 1 9 f r a c = p 1 3 i n t ( t 1 1 + 5 8 e l s e i n t 瓴) = p 1 1 1 2 f r a c = o e n d 再用t 1 算出f m m ,算法如下: f m m = i n t 亿) 一5 i f l r a i a 1 4 3 t h e n t = 1 4 3 ,。= t 。一9 e n d 再用p 2 和f 。算出t 2 ,算法如下: 1 4 ,_i,、l 中国科学技术大学硕士学位论文第二章g 7 2 9 的基本原理 i n t ( 疋) = ( p 2 + 2 ) 3 1 + ,。 f r a c = p 2 2 3 ( ( p 2 + 2 ) 3 一1 ) 由t i 和t 2 可获得自适应码本矢量v ( n ) 。 解码出固定码本矢量的四个脉冲的位置和符号,计算出固定码本矢量c ( n ) 。 c ( ) = s o s ( n m 。) + 5 ,6 ( n m 。) + s :占0 一m :) + s 3 6 ( ”一m ,) n = o 3 9( 2 4 ) 解码出固定码本预测增益g 。和固定码本增益g 。,由自适应码本增益、固 定码本矢量、自适应码本矢量和固定码本增益计算得到激励信号u ( n ) ,u ( n ) 可由公 式( 2 5 ) 获得。 “0 ) = ;。v 0 ) + ;。c ( ”) n = o 3 9( 2 5 ) 最后将激励信号u ( n ) 输入到线性预测合成滤波器中,计算出重构语音;0 ) , 重构语音;0 ) 如公式( 2 6 ) 所示: 如) = “0 ) 一;,s ( n - i ) n = o ,3 9 2 4 后滤波处理 ( 2 6 ) 后滤波处理主要是自适应后滤波。自适应后置滤波器是由三个滤波器级联而 成:长时后置滤波器,短时后置滤波器,频谱倾斜补偿滤波器。 长时后置滤波器h ,0 ) 如公式( 2 7 ) 所示: 日,( z ) 2 南( 1 饥北。) ( 2 7 ) 其中t 是基音延时,9 1 是增益系数,9 1 小于l 。如长时后置滤波器的增益小 于3 d b ,则g l = 0 。,控制长时后置滤波器的数量,并设,= o 5 。 短时后置滤波器h ,0 ) 如公式( 2 8 ) 所示: 州= 刍矧= 虿1 l + a ,z 一 1 + r a a “, q 8 中困科学技术人学硕l = 学位论文 第一章g 7 2 9 的基奉原理 其中a ( z ) 是l p 反向滤波器。o 和控制短时后置滤波器的数量,并设乃= o 7 , = 05 5 。g f 为增益系数。 频谱倾斜补偿滤波器h 。( :) 如公式( 2 9 ) e j r 7 f , : h 七) = 吉h 堆一) ( 2 9 ) 其中k i 为倾斜系数,的值依赖k i 的符号,如k i 是负数,则= o 9 ;如k i 是正 数,则r = o 2 。 在三个滤波器级联后面还接着进行一个自适应增益控制,自适应增益控制如 公式( 3 0 ) 所示: 矿= 0 9 8 7 5 9 ( “) + o 1 2 5 g n = 0 ,3 9 ( 3 0 ) 其中g ( 一1 ) 的最初值为1 0 ,在每一新子帧中g ( 一1 ) 等于前一子帻的g ( 3 9 ) 。g 是当前 子帧的增益缩放因子。因此后置滤波器的系数每个子帧更新一次。后置滤波器能 够有效的改善合成出的语音质量。 3 本章小结 本章主要对介绍g 7 2 9 的编码原理和解码原理。重点介绍了编码器中的l p 参 数的量化、编码,开环基音分析,自适应码本搜索,固定码本结构及其搜索和增 益的矢量化等。同时还对解码过程和后处理进行介绍。 1 6 中国科学技术大学硕士学位论文第三章( 3 7 2 9 算法改进 第三章g 7 2 9 算法改进 在实际应用中可以根据需要,在保证合成语音质量的前提下对g7 29 算法 进行优化优化过程就是要在满足精度的要求下,进一步将算法简化。 1 简化算法,降低计算量 在对g7 2 9 算法分析中发现,它大量利用了多级查询或多级量化的方法, 即首先根据某种原则将查询和量化范围逐步缩到某一小区域内,再进一步提高 搜索精度、缩小范围,直到找到最终结果,这样可以减小码本的搜索过程和计算 量。 g7 29 中l s p 系数的量化、基音延迟的搜索等都是这一方法的典型应用。 在算法优化过程中,为了降低复杂度,可以考虑在满足精度要求的前提下,针 对多级查询或多级量化,进一步粗化第一步的搜索过程,从而减少总的搜索时 阳】。 1 1 开环搜索改进 基音延迟的确定利用先开环搜索、进而再闭环搜索,开环搜索将基音延迟 的可能范围( 20 l4 3 ) 缩小在t m i n 与t m a x 之间,( t r n a x t m i n 一 9 ,分辨率为 1 ) ,随后的闭环搜索在小范围t r n i n 与t m a x 之间找到分辨率为l 3 的基音延迟 值,算法的优化可以通过粗化开环搜索后的范围来降低计算量。每一子帧利用 判断加权语音的相关性来计算开环基音延迟,其中相关函数可如公式( 3 1 ) 所示: 7 9 尺( 尼) = j w 0 必w 0 一七) n = o ( 3 1 ) 其中,s w ( n ) 为加权语音;r ( k ) 为相关值;k 的取值范围为2o 14 3 。简化后相 应的表达式如公式( 3 2 ) : 中国科学技术大学硕士学位论文第三章( 2 7 2 9 算法改进 ( 3 2 ) 其他相关的计算公式也作相应的修f ,即简化后由8 0 个样本点中的4 0 个偶数 点的相关性柬代替原来的计算8 0 个样本点的相关性,使计算量降低一半。 1 2l s p 系数量化改进 在l s p 系数的量化过程中,g7 2 9 采用两级分裂式矢量量化,首先利用 m a ( 滑动平均1 滤波器结合前几帧的l s p 系数预测当前帧的l s p 码向量,然后 根据均方误差最小原则,在码本l 中搜索出对应的码矢,将其量化为7 b i t ;第二 级量化将第一级量化得到的最小均方误差矢量分为两个子分量,前五个构成一 个子矢量,后五个分量构成一个子矢量,分别量化为5 b i t 。 在保证量化精度的前提下,我们可以粗化第一级量化。在量化是用和m a ( 滑 动平均) 滤波器参数量。,。以式( u ) g t 算矢量l , t = 脚,一圭k - ip 础f 如一1 j ( 一圭k - 1 多啦 t = t ,。, c t , l 然后用1 根据均方误差最小原则搜索r l 码本,上- l 码本是由1 3 0 0 个码字组 成。由于工1 码本太大,1 按均方误差最小原则逐个进行搜索时,搜索遍要搜 索1 3 0 0 次,太费时。为减少搜索时间,可对0 l 码本进行间隔搜索,这样搜索 一遍要搜索6 5 0 次,搜索时间减少一半。程序如下: f o r ( i = 0 :i n c o :i + + ) ( l t m p = 0 : i 、o f ( j = 0 :j m :j = j + 2 ) ( t m p :s u b ( r b u f j ,1 s p c b l i j ) : l t m p = l _ m a c ( l t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论