(电路与系统专业论文)g729语音编码算法及其关键部分fpga设计的研究.pdf_第1页
(电路与系统专业论文)g729语音编码算法及其关键部分fpga设计的研究.pdf_第2页
(电路与系统专业论文)g729语音编码算法及其关键部分fpga设计的研究.pdf_第3页
(电路与系统专业论文)g729语音编码算法及其关键部分fpga设计的研究.pdf_第4页
(电路与系统专业论文)g729语音编码算法及其关键部分fpga设计的研究.pdf_第5页
已阅读5页,还剩81页未读 继续免费阅读

(电路与系统专业论文)g729语音编码算法及其关键部分fpga设计的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着多媒体技术的不断发展,语音编码作为多媒体通信中信息传输的一个重要 环节,越来越受到广泛的重视,对语音编码提出的要求也越来越高。不仅要求低码 率、低延时,而且要求很高的语音质量。而作为中低速率语音编码算法中的佼佼者 g 7 2 9 也越来越受到广泛的重视。 本文对g 7 2 9 语音编码算法的基本原理和实现系统开发方面进行了深入研究。 针对g ,7 2 9 ( c s a c e l p ) 语音编码算法在实际应用中存在的一些i n - j 题,在大量分析和 实验的基础上,提出了新的改进算法。g 7 2 9 语音编码算法硬件实现方面,国内外现 在主要以d s p 为实现平台,这是由于d s p 以其卓越的运算能力为数字语音信号处理 领域的研究及开发提供了有力的工具。但( 2 7 2 9 语音编码算法具有计算复杂和数据 存储量大的固有缺陷,随着通信量的不断增加和服务的扩展,对g 7 2 9 语音编码实时 性的要求也越来越高。使得这一理论上性能良好的语音编码方案在实时实现中还存 在许多困难。近几年随着微电子制造工艺的发展,越来越多的语音编码平台采用d s p 与f p g a 或m c u 相互结合的系统,通过进行软硬件协同设计提高编码效率。在本 文中,采用f p g a 来实现g 7 2 9 语音编码算法中一些运算量较大的模块,这样可以 减少d s p 的计算量,缩短编码时间。本文工作和特色包括以下几个方面: ( 1 ) 针对g 7 2 9 语音编码算法中,线谱频率采用预测式矢量量化会造成译码端的 误差积累,导致语音质量急剧下将,提出一种新型混合式的矢量量化方法,来降低 误差积累。并且引入内插法对丢失帧的线谱频率进行还原,降低了还原量化误差。 ( 2 ) 在g 7 2 9 语音编码算法过程中,线谱频率矢量量化部分具有计算复杂和数据 存储量大,占用很大一部分编码时间,本文采用f p g a 实现线谱频率矢量量化。文中 详细介绍了整个系统和内部模块的电路设计,并给出设计电路的综合和仿真结果。 从本文电路综合和仿真结果可以看出采用f p g a 实现线谱频率矢量量化,缩短 了编码时间,提高了编码算法实时实现的效率,该设计将应用到先进语音和音频编 码的s o c 试验模型研究中。 关键字:g 7 2 9 语音编码算法,线谱频率,矢量量化,f p g a ,脉动阵列 a b s t r a c t w i t hd e v e l o p m e n to ft h em u l t i m e d i ac o m m u n i c a t i o nt e c h n o l o g y , a soneo ft h e m a i np a r to fm u l t i m e d i ac o m m u n i c a t i o n s ,s p e e c hc o d i n gt u r n so u tt ob eo fm u c h m o r ei m p o r t a n c e m o r ea n dm o r er e q u i r e m e n tw e r ea s k e df o rs p e e c hc o d i n g ,t h e s p e e c hc o d e r h a v et os a r i s f yt h em o r ea n dm o r es t r i c tr e q u i r e m e n t sf o rh i g hs p e e c h q u a l i t ya sw e l la sl o w - r a t ea n dd e l a y a sa uo u t s t a n d i n ga l g o r i t h mi nl o wr a t e c o d i n g g 7 2 9s p e e c hc o d i n gi sw i d e l yu s e d t h eg 7 2 9c o d e ri sd e e p l yr e s e a r c h e di nt h et h e s i s t h e r ea r ep r o b l e m si nt h e p r a c t i c a la p p l i c a t i o no fg 7 2 9s p e e c hc o d i n ga l g o r i t h m ,o nt h eb a s i so fal o to f a n a l y s e sa n de x p e r i m e n t s ,w eh a v ei m p r o v e do nt h eg 7 2 9s p e e c hc o d i n ga l g o r i t h m t oe n h a n c es p e e c hq u a l i t yi nr e a l - t i m es p e e c hf r a m et r a n s m i s s i o n c u r r e n tc 1 7 2 9 s p e e c he n c o d i n g d e c o d i n gh a r d w a r es y s t e m s i sb a s e do nd s po rc o m p u t e r p l a t f o r m h o w e v e r , w i t hr a p i dd e v e l o p m e n to ft e l e c o m m u n i c a t i o n ,t h e r ei sh i g h e r r e a l - t i m er e q u i r e m e n tf o rg 7 2 9c o d e rs y s t e m sh a r d w a r e g 7 2 9s p e e c ha l g o r i t h m i s i m p l e m e n t e do nt h ed s ph a r d w a r ep l a t f o r mw i t hl i m i t a t i o n si ns p e e da n d m e m o r y t h e r e f o r e ,t h e r ew en e e dab r a n d f l e ws p e e c hi n t e r f a c ep l a t f o r mw i t h s u i t a b l eh a r d w a r e w i t hd e v e l o p m e n to fm i c r e e l e c t r o n i ep r o d u c t i o np r o c e s s ,m o r e a n dm o r es p e e c hc o d i n gi si m p l e m e n t e do hd s pw i t hf p g a ,o rm c uh a r d w a r e p l a t f o r m i nt h et h e s i s ,s e v e r a lm o d u l e so fg 7 2 9a l g o r i t h ma r ei m p l e m e n t e do n f p g at or e d u c es p e e c hc o d i n gt i m e t h em a i nc o n t e n t so fp a p e ri n c l u d e : 1 ) l s f 皿i n es p e c t r u mf r e q u e n c y ) q u a n t i z a t i o ne x p l o i t sp r e d i c t i v ev e c t o r q u a n t i z a t i o n ( v q ) i ng 7 2 9c o d i n gs p e e c ha l g o r i t h m p r e d i c t i o nv ql e a d st oe r r o r p r o p a g a t i o nt h a tc a u s es p e e c hq u a l i t yd e g r a d a t i o nw h e ns p e e c hf r a m em i s si n s p e e c ht r a n s m i s s i o n i nd e e p l ya n a l y z e da n dr e s e a r c h e dt h eg 7 2 9s p e e c hc o d i n g a l g o r i t h m ,w ed e v e l o pan e ws c h e m eo fl s fv e c t o rq u a n t i z a t i o nt or e d u c ee f f e c to f e r r o rp r o p a g a t i o n ,a n di m p r o v es p e e c h q u a l i t yo fg 7 2 9 c o d e ri nr e a l - t i m e t r a n s m i s s i o n t h ep e r c e p t u a lq u a l i t yh a sb e e ni m p r o v e dw i t hi n t e r p o l a t i o nf r o m b o t ht h ep r e v i o u sa n dn e x tc o r r e c t l yr e c e i v e ds p e e c h 2 ) c o m p u t a t i o nc o m p l e x i t ya n ds t o r a g ec o n s u m p t i o na r eh i g hi nl s fv e c t o r q u a n t i z a t i o no fg 7 2 9s f e e c hc o d i n ga l g o r i t h mw h i c hc o n s u m eac o n s i d e r a b l ep a r t o ft o t a lp r o c e s s i n gt i m e i no r d e rt os p e e du ps p e e c hc o d i n g ,l s fv e c t o r q u a n t i z a t i o ni si m p l e m e n t e do nf p g a i nt h i st h e s i s ,c i r c u i t sd e s i g na n ds i m u l a t i o n o f f p g a i m p l e m e n t a t i o no f l s f v e c t o rq u a n t i z a t i o ni sa d d r e s s e d k e y w o r d :g 7 2 9c o d e r , l i n es p e c t r u mf r e q u e n c y , v e c t o rq u a n t i z a t i o n ,f p g a , s y s t o l i ca r r a y 2 第一章 绪论 1 1 语音编码的概述 第一章绪论 语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段,也 是人类进行思维的一种依托。人类进入信息时代以来,开始用现代手段研究语音处 理技术,使人们能更加有效地产生,传输、存储和获取语音信息。这对促进社会发 展具有十分重要意义。 语音编码方法按传统的概念可以分为三类:波形编码、参数编码( 声码器) 和混 合编码。 随着现代信息技术的发展,特别是移动通信和个人通信的蓬勃发展。语音编码 作为多媒体通信中信息传输的一个重要环节,越来越受到广泛的重视,对语音编码 提出的要求也越来越高。不仅要求低码率、低延时,而且要求很高的语音质量。先 进的语音压缩编码的日标就是要在尽可能低的比特率下,最大限度的提取语音信号 的特征信息,在接收端恢复尽可能清晰自然的语音。早期的波形编码,语音质量好, 但同时也对传输速率提出了很高的要求:后来发展起来的参数编码,逐步降低了编码 速率,但重建语音的质量有相对幅度的下降。为此又发展了新一代的参数编码算法 混合编码,这种算法将波形编码和参数编码两种方式结合起来,兼顾了传输速 率与语音质量的要求,它不仅低码率、低延时,而且语音质量高。 混合编码【5 】保留了声道模型的假设,而年4 用波形编码的准则优化激励信号。即 以使主观听觉失真达到最小为准则,采用带有听觉加权的闭环搜索合成分析法( a b s a n a l y s i s b y s y n t h e s i s ) 来选取激励矢量。在合成端,用不同的脉冲序列来表示激励信 号就是这类编码方法中不同种类的主要区别。c e l p 又包括矢量和激励线性预测 f v s e l p ) 编码、短时延c e l p ( l d c e l p ) 编码、和共鞔结构代数码激励线性预测 ( c s a c e l p ) 编码等。 1 9 8 5 年m a n f r e dr s c h r o e d e r 和b i s h n us a t a l 在i c a s s p 年会上首次提出了用码 本作为激励源的线性预测编码技术( c e l p ) 。它以高质量的合成语音及良好的抗环境 第一章绪论 噪声的能力在4 8 1 6k b s 的码速率上获得了极大的成功。十几年来,为减少c e l p 复杂度、增强c e l p 性能,又产生了一些c e l p 的改进形式和新的编码标准: 美国政府标准f s l 0 1 6 ( 4 8 k b p sc e l p ) ; 北美数字蜂窝语音编码i s 5 4 ( 8 k b p s 矢量和线性预测v s e l p ( 矢量和激励线性预 测编码) : 日本数字蜂窝语音编码j d c ( 6 7 k b p sv s e l p ) 此外i t u t 以制定的国际标准有: g 7 2 8 ( 1 6 k b p s 低延时c e l p ,l d c e l p ) : g 7 2 3 ( 5 3 k b p s 代数码激励c e l p ,a c e l p 和6 7 k b p s 多脉冲最大似然量化c e l p , m p - - m l q c e l p ) g 7 2 9 ( 8 k b p s 共轭代数c e l p ( c s a c e l p ) ) 2 等。 1 2 研究意义 ( 3 7 2 9 是国际电信联盟( i t u ) 于1 9 9 5 年1 1 月推出的建议,即共轭结构代数码本 激励线性预测编码方案( c s - a c e l p ) ,能够实现很高的语音质量和很低的算法延时, 因而被广泛地应用于数据通信的各个领域。g 7 2 9 有可能成为将来的多媒体通讯,i p 网络即移动通讯系统中语音编码的首选算法,具有广泛的应用前景。 c s a c e l p 思想是由共鞔结构码激励线性预钡u ( c s c e l p ) 和代数码书激励线性 预测( a c e l p ) 的思想整合而来的。其中,“共扼”( c o n j u g a t es t r u c t u r e ,c s ) 的含义是 指编码器对增益的矢量量化过程中采用了共瓠结构:而所谓“代数”( a l g e b r a i c ,a ) 码 本是指其固定码码本采用了代数结构,其特点是码本矢量为4 0 维,其中只有4 个非 零脉冲,它们的幅度为+ l 或一1 ,位置也在限定的范围内,该码本无需任何存储空 间,只要解码端获得非零脉冲的幅度和位置信息,就可以直接得到对应的输出矢量。 g 7 2 9 虽然能在中低速率上提供较好的合成语音质量,成为目前语音编码算法中 最主要的方案,但该语音编码方案在实际应用中还存在许多问题和困难。如帧丢失 和删除造成语音质量下降,回音消除等,因此g 7 2 9 语音编码算法的实际应用一直 是该领域中具有重大意义的研究课题。 第一章 在g 7 2 9 语音编码算法硬件实现方面,国内外现在主要以d s p 为实现平台 3 ,6 1 , 这是由于d s p 以其卓越的运算能力为数字语音信号处理领域的研究及开发提供了 有力的工具。但( 3 7 2 9 语音编码算法具有计算复杂和数据存储量大的固有缺陷,随着 通信量和服务的增加,尤其是多通道的语音编码,使得这一理论上性能良好的语音 编码方案在实时实现中还存在许多困难。近几年,为了提高g 7 2 9 语音编码算法在 d s p 平台上实时实现的效率,主要采取对其程序进行优化 3 ,6 ,7 ,3 3 ,但这种优化 在很大程度上并不能满足现在通信和服务的发展需求,现在语音编码平台不仅要满 足编码的实时性同时还要提供其它信息的处理。 近几年,可编程逻辑器件随着微电子制造工艺的发展取得了长足的进步。从早 期的只能存储少量数据,完成简单逻辑功能的可编程只读存储器,到今天已经发展 成为可以完成超大规模的复杂组合逻辑与时序逻辑的现场可编程逻辑器件( f p g a ) 和复杂可编程逻辑器件( c p l d ) ,随着工艺技术的发展与市场需要,超大规模、高速、 低功耗的新型f p g a 不断推陈出新。新一代的f p g a 集成了中央处理器f c p u ) 或数字 处理器( d s p ) 内核,在一片f p g a 上进行软硬件协同设计,为实现片上可编程系统 ( s o e c ) 提供了强大的支持。现在语音编码平台结构越来越多地采用d s p ,f p g a 或 m c u 相互结合的系统【8 ,9 ,1 0 】,采用软硬件协同设计来提高编码的实时效率。在该结 构中,f p g a 用来实现语音算法中一些运算量较大的模块,这样就可以减少d s p 的计 算量,缩短编码时间。 本文对g 7 2 9 中线谱频率矢量量化部分进行f p g a 设计的研究,主要是因为在 g 7 2 9 语音编码中,线谱频率矢量量化对编码的语音质量起着十分重要的作用 2 9 ,3 0 ,3 1 ,但线谱频率矢量量化部分具有计算复杂和数据存储量大,占用很大一部 分编码时间。线谱频率矢量量化占整个编码计算复杂度的1 2 1 1 ,占整个编码运算 时间的1 6 1 2 ,3 3 。采用f p g a 实现线谱频率矢量量化,可以缩短编码时间和减少 d s p 的计算量,提高编码算法实时实现的效率。 同时矢量量化是一种重要的信号压缩方法,目前已经被广泛的应用到低速率语 音编码、语音识别、图像压缩等领域。但另一方面,矢量量化的复杂度限制了其在 高速和实时系统中的应用。为了解决实际应用的问题,人们已经对设计专用的矢量 量化v l s i 展开研究 3 6 ,3 7 ,在v l s i 的设计流程中,f p g a 由于其可重构性,价 第一章 格便宜等特点,常用于v l s i 设计初期的系统构建和检测,在v l s i 设计中担当着重 要的角色。 因此对g 7 2 9 语音编码算法中线谱频率矢量量化进行f p g a 设计的研究具有十 分广泛的意义。 1 3 本文结构 本文作者所做的工作是:在g 7 2 9 ( c s a c e l p ) 语音编码算法的研究上,通过 分析其原理及基本特征,针对线谱频率采用预测式矢量量化会造成译码端误差积累, 导致语音质量急剧下将,提出了一种新型混合式的矢量量化方法,来降低误差积累。 并且引入内插法对丢失帧的线谱频率进行还原,降低了量化误差。 在硬件设计方面,采用f p g a 设计线谱频率矢量量化,给出了系统和各个模块 的电路设计,并且进行电路综合和仿真。 第二章g 7 2 9 语音编码算法的基本原理。本章详细介绍g 7 2 9 语音编码算法的编码 和解码原理。 第三章线谱频率矢量量化的改进。本章介绍了g 7 2 9 线谱频率矢量量化原理,提出 一种新型混合式的矢量量化方法,来降低误差积累。并且引入内插法对丢 失帧的线谱频率进行还原,降低了量化误差。 第四章线谱频率矢量量化f p g a 设计的研究。本章重点介绍m a ( 滑动平均) 滤波器 的f p g a 设计,给出了系统和各个模块的电路设计,以及电路综合和仿真 结果。 第五章矢量量化的f p g a 设计。本章重点介绍两级分裂式矢量量化的f p g a 设计, 给出了系统和各个模块的电路设计,以及电路综合和仿真结果。 第六章结论总结了本文的工作,对下一步的工作进行了展望。 第二章( 2 7 2 9 语音编码算法的基本原理 第二章g 7 2 9 语音编码算法的基本原理 1 9 9 5 年由n r r 、t e l e c o m c n e t 和a t & t 共同研究,基于c e l p 编码模型的编 码器得到i t u 的正式批准,命名为( 3 7 2 9 建议,即8 k b i t s 共轭结构代数码激励线 性预测编码器( c s a c e l p :c o n j u g a t es t r u c t u r e - a l g e b r a i cc o d ee x c i t e dl i n e a r p r e d i c t i o n ) 语音编码标准。编码器对语音帧处理,语音以每秒8 0 0 0 个样点采样, 每1 0 m s 对应的8 0 个样点为1 帧。每帧对语音信号进行分析,提取c e l p 模型的参 数( 1 0 阶线性预测滤波器系数,自适应与固定码书的标号和增益) 。这些参数被编 码并传输。 图lc s - a c e l p 编码器编码原理 g 7 2 9 语音编码算法就是一种以共扼代数码本激励线性预测为基础,且编码速率 为8 k b s 的高质量的语音编码标准。它以采样率为8 k h z 的1 6 l l 特线性p c m 编码作为 输入语音信号。 在编码端,采样输入的语音信号首先经过预处理,预处理包括信号缩放和高通 滤波,以预防定点运算时的溢出和低频分量的干扰,然后按每一帧提取l o 阶l p ( l i n e p r e d i c t i v e ) 参数并转化为l s p ( l i n es p e c t r u mp a i r s ) 参数进行量化、编码:并用l p 参数分 别构成感觉加权滤波器w ( z ) 以及合成滤波器i a ( z ) :原始语音信号与合成语音信号 的差值经过感知加权滤波器后除去感知加权滤波器的零输入响应求得目标信号,目 第二章( 2 7 2 9 语音编码算法的基本原理 标信号经过自适应码本搜索及固定码本搜索后产生激励信号,分别乘以各自的增益, 并通过激励合成滤波器,产生本地重建语音信号由此可看出,c s a c e l p 语音编码 算法主要包括l p 参数的提取、量化及编码、自适应码本搜索、固定码本搜索和增益 矢量量化五个部分。 2 1g 7 2 9 的编码原理 2 1 1 预处理 输入的1 6 b i t 线性p c m 语音信号,为了避免处理过程中产生溢出,要进行预处 理,预处理包括信号缩放和高通滤波,公式如下: 日m ( z ) :0 4 6 3 6 3 7 1 8 - 0 9 2 7 2 4 j 7 0 5 z - 1 + 0 4 6 3 6 t 3 7 1 8 一z - 2 ( 1 - 1 - 1 )爿m 5 t i 菇面瓦了而两百瑟i 广 通过风( = ) 滤波器后的信号为j ( 疗) ,它将被用于以后编码器的运算。 2 1 2 线性预测分析和量化 短时分析和合成滤波器是基于1 0 阶线性预测滤波器,定义为 丽。面101 l t l 一( z ) + y ,舭 ( 1 2 1 ) 这里z ( i = 1 ,1 0 ) 是量化的l p 系数。每8 0 个样点计算一次加窗语音信号的 自相关系数,并使用l e v i n s o n d u r b i n 算法计算出l p 系数,然后把l p 系数转换到 l s p 域内,用以量化和内插。内插后量化和未量化滤波器被转换回l p 系数构造合 成和加权滤波器。 1 加窗和自相关计算 l p 分析窗由两部分组成:第一部分是半个汉明窗,第二部分是四分之一周期的 余弦函数。该窗函数为: 第二章g 7 2 9 语音编码算法斡基本原理 = o ,1 9 9 ( 1 2 2 ) h = 2 0 0 ,2 3 9 在l p 分析中有5 m s 的预测时间,即l p 分析中需要使用下一语音帧的4 0 个样 本点,使编码器产生了5 m s 的附加算法时延。l p 分析窗与2 4 0 个样本点相乘,这 2 4 0 个样本点包括过去帧的1 2 0 个样本点、当前帧的8 0 个样本点以及下一帧的4 0 个样本点。l p 分析窗可以使得用自相关方法计算的l p 系数更加准确,可以使l p 滤波器的响应更加光滑,因此能提供具有更好质量的语音。 加窗后的语音信号为: j ) = 既( 功s ( n ) n = 0 ,2 3 9 ( 1 2 - 3 ) 被用于计算自相关函数: 2 3 9 r ( t ) = 5 ( ”) s ( n - k ) k = o ,1 0 ( 1 - 2 4 ) n = k 为了避免低电平信号引起的算法问题,令r ( o ) 有一个下限值r ( o ) = 1 0 。加上 6 0 h z 的带宽扩展,自相关函数还需乘上以下系数: ( 七) = e x p 一去( 攀z 】 j , 式中厶= 6 0 h z ,工= 8 0 0 0 h z ( 抽样频率) 。另外,r ( o ) 还需乘上白噪声相关系 数1 0 0 0 1 ,等效于加上一4 0 d b 的本底噪声。修正后的自相关系数为: r 。( o ) = 1 0 0 0 1 r ( 0 ) ,( o ) = g ( ) r ( 七) k = l ,1 0 2 l e v i n s o n - d u r b i n 算法 修正后的自相关系数用于计算l p 滤波器的系数a j ,扛l ,1 0 。通过下面的方程 组实现: 1 0 口州f 一七i ) = 一一( 后) k = l ,1 0 ( 1 - 2 6 ) f = i 该方程组用l e v i n s o n - d u r b i n 算法求解,使用下面方法进行递归处理 当马 瞄型转 6 ”一l 州掣 “ 啷 | | 瞰 堂三皇 垒! ! 竺堡童塑翌蔓鲨塑苎查星翌a 。二= 二二一。= h 一州w 、 : 五嘲= ,( d ) 如j = 1 t 0 1 0 口1 = 1 新= 一z j i - 1a ! - l l r , q - j ) ,卫n t , 口粤= 蕊 弦r = 1t oi 一1 妒= 雩_ 1 1 + 凇鸟” a , m 朋= 0 一乎) 庐卅 e n d 3 l p 到l s p 变换 由于l p 系数有较宽的动态范围以及在合成滤波器中的不稳定性,所以不适合于 量化,因此将得到的l p 系数转化为频域参数l s p ,以便量化及插值。 设爿( = ) 为一个1 0 阶l p 滤波器,定义下面的多项式: ( z ) = a ( z ) + z 。1 a ( z 。) e ( 2 ) = 爿( z ) 一z “a ( z 一1 ) 由于鼻( 力是对称的,爿( 力是反对称的,保证了所有多项式的根在单位圆上交 替出现。分别去除| z = 】和z = 一1 两个根,得到新的多项式: e ( 力= e ( z ) ( 1 + z - 1 ) ez ) = ( z ) ( 1 一z - i ) 又由于每个多项式在单位圆上有5 个共轭根,所以上式又可写成: e ( z ) = 兀( 1 - 2 q z 。+ = 2 ) ( = ) = h ( 1 _ 2 q 。z 。+ z 4 ) 其中吼= c o s ( a , ,) ,( - a t 为l s p 频率。由于# 0 ) 和五( z ) 的对称性,所以每个多项 式只需使用递推算法计算前五个多项式系数: z ( f + 1 ) = 口。f + q 一z ( di = o ,4 ( 1 - 2 7 ) 第二章g 7 2 9 语音编码算法的基本原理 f 2 ( i + 1 ) = a 一a l o 一,+ ( i ) i = 0 ,4 初始条件为:z ( 0 ) = a ( 0 ) = 1 0 。 计算l s p 系数的方法为:将0 到石等间隔的计算3 1 4 个点上多项式巧( z ) 和e ( z ) 的符号,如果多项式的符号改变了,说明两点之间存在一个根,再将原来两点进一 步细分,从而可以精确求得根的位置。用契比雪夫多项式来计算鼻( 力和e 时, 可以直接在余弦域上求得根。 令z = e j , a ,则: f ( c o ) = 2 e 一7 5 。c ( x ) ( 1 2 8 ) 其中: c ( x ) = 正( x ) + f ( 1 ) t 4 ( x ) + f ( 2 ) t a ( x ) + f ( 3 ) t 2 ( x ) + f ( 4 ) t l ( x ) + f ( 5 ) 2 式中乙( x ) = c o s ( r o w ) 是m 阶的契比雪夫多项式,而,( 耽i = 1 ,5 是曩( :) 和e ( z ) 的系数。使用下面的递推关系可在j = c o s ( 6 9 ) 处计算多项式c ( x ) : f o r k = 4 d o w n t 0 1 靠= 2 x b k + i b k + 2 + k 5 一肺 e n d c = x b l 一6 2 + y ( s ) t 2 其中,初始值b ;= l ,b 。= 0 。 4 l s p 系数的量化 在对l s p 系数进行量化时,考虑到:由于语音信号变化很缓慢,因此可以利用不 同帧的l p 系数间的很强的自相关性进行量化,具体地说,就是可以使用预测式矢量 量化( v q ) 技术;多级v q 系统无论在减少搜索计算量方面还是在减少码本存储量 方面都较一级v q 系统有较大的改观;l s p 特征矢量的各个分量虽然属于一个整体, 但它们对幅度谱的影响只局限于各自的频率区域内,这就使其可以将一个维数较高 的特征矢量分裂为两个维数较低的特征矢量分别进行量化,将有助于减少搜索计算 量和减少码本存储量。因此,在对l s p 系数进行量化时,使用了预测式二级分裂矢 量量化技术。下面对该量化过程进行详细的说明。 在量化l s p 系数吼时,需使用在归一化频域【o ,石】表示的,即: 9 第二章g 7 2 9 语音编码算法的基本原理 0 2 ,= a r c c o s ( q ,)i = 1 ,1 0 使用一个4 阶m a 预测器预测当前帧的l s p 系数。计算值和预测系数之间的差值 用两级矢量量化器( v q ) 量化。第一级是l o 维v q ,使用有1 2 8 码字的码本工l 。第 二级为1 0 b i t s 的v q ,它是一个分裂式v q ,用两个各包括3 2 码字的5 维码本三2 和三3 实 现。 为了解释量化过程,先描述以下解码过程,这样利于理解。每个系数由2 个码本 的和得到: e :脞+ l 2 ( 1 2 扛1 ,2 5 ( 1 - 2 - 9 ) 。【l l ( 1 l j 十l 3 ( 1 3 ) i = 6 1 0 式中的0 ,2 ,3 分别是码本索引。为了避免量化后的l p 合成滤波器具有尖锐的谐 振峰,需要重排系数f ,使相邻的,间具有最短的距离j 。重排过程如下: 力,i = 2 t 0 1 0 i f ( 1 , _ l l i d 0 1 2 ( f ,+ r 3 3 2 一j = ( + 一。+ j ) ,2 e n d 这个重排过程要做两次。第一次j = o 0 0 1 2 ,第二次j = o 0 0 0 6 。重排之后,即得 到当前帧n 的量化输出。同时将前面量化器输出( “1 进行加权处理,可得到当前 帧n 的量化后的l s f 系数谛;。 ,4、 = f1 - z 3 , p + 缸驴”( 1 _ 2 1 0 ) 公式中邪“代表前k 帧量化好的l s f 参数;。是预测系数。相应的姒预测器有 两个,具体选用那个m a 预测器由一单独的比特l o 描述。 在计算完谛,之后,还要检查滤波器的稳定性,步骤为: 1 按递增顺序排列系数访,: 2 如果讯谛;” 。 , 0 吲2 鱼 0 嵋。2 l o ( 一w 9 + o 9 2 。一1 ) z + 1 。咖。二e u 。 。 除此之外加权系数w ,和w 。还需要乘上1 2 。 当前帧的待量化矢量计算公式如下: :i w j m 厶。州f l 一厶。 心z 砌) - k - i j k = l 公式中w ”i = 1 , 2 ,3 1 0 为第n 帧的i 个l s f 频率,( n - k 代表前k 帧量化好的l s f 参数。 先搜索码本l 1 ,得到使未加权的均方误差最小的码字。然后搜索第二个码本 l 2 ,确定第二级v q 的低部分码字1 2 。l 2 码本的搜索过程如下:对码本2 中的每一个码 字都使用公式( 卜2 一l o ) 重建出协( i = 1 ,5 ) ,计算出来的彬“进行调整,使这几个 矢量之间的最小距离保证大于0 0 0 1 2 ,然后计算方程( 卜2 - 1 1 ) 的加权均方差,选 出使误差最小的码字之,然后用所选择的第一级矢量码字z 。和第二级矢量低部分码 字z :,就可以搜索第二级v q 的高部分码本l 3 ,l 3 码本的搜索过程与l 2 一样,也需要进 行重排调整。最后的结果矢量,也要进行重排调整,以保证矢量之间的距离大于 0 0 0 0 6 。每个滑动平均预测器都要进行这一过程。加权均方差最小的预测器被选中。 第二章g 7 2 9 语音编码算法的基本原理 5 l s p 系数的插值 量化和未量化的l p 系数都要用于第二子帧。对于第一子帧,量化和未量化的l p 系数是通过相邻子帧相应参数的线性插值得到的。插值是在l s p 的余弦域参数上进 行的。令g 产一为当前1 0 r e s 帧计算出来的l s p 系数,g p ”是前l o m s 帧计算出来 的l s p 系数。在每个子帧中插值得到的未量化l s p 系数为: 子帧1 :g j l = o 5 9 妒“”+ 0 5 q j 。”i = l ,1 0 子帧2 :g ;2 1 = g p i = l ,1 0 同样的过程用于量化的l s p 系数的插值,只要用牙,代替q ,即可。 6 l s p 至i j l p 变换 l s p 系数被量化并插值之后,它们将被变换回l p 系数口。下面分析该变换过程。 根据上式得到的l s p 系数,结合公式,可计算出e ( z ) 和e ( z ) 的系数。系数 z ( f ) ,i = l ,5 用下面的递推关系从q 中得到: 盎r | = 1t o5 以( f ) = - 2 q 2 1 1 6 0 一1 ) + 新o 一2 ) f o r j = f l 如t o1 铲( 7 ) = 矗卜1 1 一锄。_ l f ;l i - 1 1 分一1 ) + 芹一1 1 0 一2 ) e n d e n d 其中,初始值 ( 0 ) = l ,z ( 一1 ) = 0 。系数五( f ) 通过将g :。用g :,代替来进行类似 的计算。得到系数z ( f ) 和五( ) 之后,曩( z ) 和f a z ) 分别乘上1 + z _ 1 和1 一= ,得到 e 1 ( z ) 和e 0 ) ,即: z ( 0 = z ( f ) 4 - 石( f n i = l ,5 ( f ) = ( f ) + ( f 一1 ) i = 1 ,5 最后用下式计算l p 系数: 一 o 5 f , ( f ) + 0 5 ( j ) i = l ,5 a = 【o 5 f , ( 1 1 一i ) 一0 5 ( 1 1 一oi = 6 ,l o 上式是根据关系4 ( z ) = ( e ( z ) 4 - e ( z ) ) 2 直接得到的,因为丘( z ) 和e ( :) 分别 第二章g 7 2 9 语音编码算法的基本原理 是对称和反对称的多项式。 2 1 3 感知加权 晔,= 嬲= 筹( 1 - 3 - 1 ) 式中加权系数,。和,2 的值确定了滤波器w ( z ) 的频率响应。适当调整,和,:的值 可以使感知加权更有效。也就是说,n 和y :能根据输入信号的频谱形状进行自适应 调整。自适应调整每1 0 m s 帧进行一次,而且第一子帧还需进行插值处理,该插值处 理用于平滑这个自适应调整处理过程。输入信号的频谱形状从二阶线性预测滤波器 中得到,它是l e v i n s o n d u r b i n 算法中得到的副产品。反射系数k i 通过下式转换成对 旷崦嬲 对应于当前1 0 m s 帧的l a r 系数用于第二子帧。第一子帧的l a r 系数通过与前一 帧的l a r 系数线性插值得到。两个子帧的插值l a r 系数为: 子帧1 :d ,= o 5 d j ”“”+ 0 s o ;1 i = 1 , 2 子帧2 :d p = d ! “oi = 1 , 2 频谱形状的特征用f i a t 来表示,分为平坦的( f l a t = - 1 ) 或倾斜的( f l a t = o ) 。对每 个子帧,这个特征通过对l a r 系数使用一个门限函数来得到。为了避免快速的变化, 在分析当前帧的f i a t 时,前一帧m 1 的f i a t 值也被考虑进去: f 仉 如果d 0 6 5 _ f l a t 枷。1 = 1 f l a t “= l 血日果d f ” 一1 5 2 或d ;” 0 4 3 目f l a t ”。= 0 i 刀口f ( “其他 如果子帧的插值谱归类为平坦( f l a t ( 卅) = 1 ) ,加权系数就设为 第二章g 7 2 9 语音编码算法的基本原理 n = 0 9 4 , y 2 = 0 6 。如果谱归类为倾斜( 加f “= 0 ) ,n 的值设为o 9 8 ,2 的值 与l p 合成滤波器的响应强度相适应,但是限制在0 4 到0 7 之间。如果出现很强的响 应,的值设为接近上限。这个适应过程通过一个判据实现,该判据基于当前子帧 的2 个连续l s p 系数之间的最小距离而定。最小距离为: d 。= m i n w , + l w j 】i = l ,9 ( 1 - 3 3 ) y ,的值用下面的线性关系计算: ,2 = 一6 o d , , a 。+ 1 0边界为0 4 如0 7 每一子帧中经过感知加权的语音信号为: 1 01 0 删( ”) = s ( 功+ 口,? j q o 一q 删印一。 月= o ,3 9 ( 1 3 q i = 1i = 1 加权语音信号一( h ) 被用于在语音帧中寻找基音时延估值。 2 1 4 开环基音分析 为了减少搜索最佳自适应码本时延的复杂性,搜索范围限制在候选时延l 附 近,乙通过开环基音分析得到。开环基音分析每帧( 1 0 m s ) 进行一次。开环基音 分析需使用公式得到的加权语音信号s w ( n ) 。具体的分析过程为: 首先在如下三个范围内: i = 1 :j i = 8 0 ,1 4 3 i = 1 :k = 4 0 ,7 9 i = 1 :t = 2 0 ,3 9 寻找3 个最大的相关值: r ( 女) = s w ( n ) s w ( n - k ) ( 1 - 4 1 ) 所得的最大r ( f ,) ,i = 1 , 2 ,3 进行归一化处理: 州伊丽r ( t i ) ,2 3 ( 1 _ 4 彩 第二章g 7 2 9 语音编码算法的基本原理 三个归一化相关值还需进行下述的处理,其最佳者作为最佳开环时延乙: 砀= t l r 7 ( z 矽= 震,( f 1 ) 矿置娩) 2o 8 豫,( z 确 掣( z 矽= r q 2 ) = 也 e n d 毽囊l 蛰0 _ 8 5 r q 礤 f ( ,j 0 = 发( f 3 ) 岛= 电 e n d 上述的处理中将时延范围分为3 部分,并且寻找其最小值作为乙。其目的是为 了避免选择的乙为基音的倍数。 2 i 5 脉冲响应的计算 感知加权合成滤波器( z ) j ( z ) 的脉冲响应 ( n ) 将用于自适应码本和固定码本 的搜索。每个子帧都要计算脉冲响应 ( ”) ,将具有初始状态的滤波:器a ( z y ,) 的脉 冲响应输出通过两个滤波器1 j ( z

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论