




已阅读5页,还剩77页未读, 继续免费阅读
(信号与信息处理专业论文)g728算法改进及低码率ldcelp算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 低码率、低复杂性的l d c e l p 算法在通信领域具有十分重要的意义。 g 7 2 8 是目前低延迟码激励话音编码算法中唯一的一个1 6 k b i t s 的国际标 准。本研究以降低码率、减少复杂性为目标对g 7 2 8 算法进行改进。研究 表明,采用归一化波形码书并对激励增益精确表示,不仅大幅度减少了 g 7 2 8 计算复杂性,同时可以获得约2 d b 的信噪比提升。 本研究观察了不同递归窗对g 7 2 8 三个滤波器的影响;针对增益的固 定量化,提出了增益的自适应预测和自适应量化的方案,获得很好的结果; 以此为基础设计的码书搜索方法将g 7 2 8 码书搜索计算量降低8 5 ;进一 步进行综合滤波器降阶实验,表明在信噪比不变的前提下,g 7 2 8 算法复 杂性可以减少4 0 。 采用归一化波形码书获得的附加好处是提供了一种可能,即避开大运 算量的码书训练过程,直接构造新的波形码书。本研究尝试性地构造了每 矢量1 0 样点的归一化波形码书,设计了8 k b i t s 低延迟码激励话音编码方 案。在此基础上提出了具有基音预测的8 k b i t s 算法。上述两种算法的实 验程序为今后研究8 k b i t sl d c e l p 算法提供了实验环境。 关键词8 k b i t sl d c e l p 增益自适应量化归一化波形码书 a b s t r a c t t h el d - c e l pa l g o r i t h mw i t hl o wr a t ea n dl o wc o m p l e x i t yh a dv e r y i m p o r t a n tm e a n i n gi nt h ef i e l do fc o m m u n i c a t i o n g 7 2 8w a st h eo n l y1 6 k b i t s i t ur e c o m m e n d a t i o ni nt h el o wd e l a ys p e e c hc o d i n ga l g o r i t h m sa tp r e s e n t t h er e s e a r c ha i m e dt or e d u c ei t sr a t ea n di t sc o m p l e x i t yt oi m p r o v eg 7 2 8 a l g o r i t h m i nt h i sr e s e a r c h ,t h ec o m p l e x i t yo fg 7 2 8c o u l db eg r e a t l yr e d u c e d a n dt h ea v e r a g es e g m e n t e ds n rc o u l db ei n c r e a s e da b o u t2 d bb yu s i n g n o r m a ls h a p ec o d e b o o ka n dt h ee x a c td e n o t a t i o no fe x c i t i n gg a i n i tw a so b s e r v e dt h a th o wd i f f e r e n tr e c u r s i v e 、v i n d o w sa f f e c tu p o nt h e t h r e ef i l t e r so fg 7 2 8 t ot h ef i x e dq u a n t i z a t i o no fg a i n ,t h i sp a p e rp r o p o s e da s c h e m ea b o u tg a i na d a p t i v ep r e d i c ta n dg a i na d a p t i v eq u a n t i z a t i o n ,w h i c h b r o u g h ta b o u ts a t i s f y i n gr e s u l t s b a s e do nt h e s er e s u l t s ,w ep r o p o s e dam e t h o d o fc o d e b o o ks e a r c h ,w h i c hd e c r e a s e dt h ec o m p u t ea m o u n to fg 7 2 8c o d e b o o k s e a r c hb y8 5 t h em o r ee x p e r i m e n to fr e d u c i n gt h eo r d e ro fs y n t h e s i sf i l t e r s h o w e dt h a t ,o nt h ep r e m i s eo fn o tc h a n g i n gt h ea v e r a g es e g m e n t e ds n r ,t h e c o m p l e x i t yo fg 7 2 8c o u l db ed e c r e a s e db y4 0 a d o p t i n gn o r m a ls h a p ec o d e b o o kh a da n o t h e rg o o du s e ,w h i c ha f f o r d e d t h e p o s s i b i l i t y o fd i r e c t l y c 0 1 s t r u c t i n g an e ws h a p ec o d e b o o kw i t h o u t c o d e b o o kt r a i n i n gw h i c hn e e d e dm a s so fc a l c u l a t i o na m o u n t w et e n t a t i v e l y c o n s t r u c t e dan o r m a ls h a p ec o d e b o o ki nw h i c he v e r yc o d e v e c t o ri n c l u d e dt e n s a m p l e s a n8 k b i t sl o wd e l a yc e l pa l g o r i t h mw a sp r o p o s e d ,a n db a s e do ni t , a n8 k b i t sa l g o r i t h mw i t hp i t c hp r e d i c t o rw a sp r o p o s e dt o o t h ee x p e r i m e n t p r o g r a m so ft h e s et w oa l g o r i t h m sa f f o r d e da l le x p e r i m e n te n v i r o n m e n tf o rt h e f u t u r er e s e a r c ho f8 k b i t sl o wd e l a yc e l pa l g o r i t h m k e y w o r d s8 k b i t sl d c e l p g a i na d a p t i v eq u a n t i z a t i o n , n o r m a ls h a p ec o d e b o o k 刖舌 0 1本课题研究的背景与意义 低码率、低延迟话音编码算法是二十一世纪通信、计算机网络、视频 电话会议和远程教学系统等诸多应用领域的关键性核心技术。以数据包形 式传输话音的i p 电话,其极低廉的通话费用给传统电信网络造成极大的 冲击。面对竞争,如何使现存的数以万亿计的电信设备免遭淘汰,业界正 在努力寻找降低通信费用,提高服务质量的途径。低成本扩容是其首选方 案。支持传统电信网设备扩容的话音编码算法必须满足如下要求:数 据必须按8 位进行组织;为适应一次群交换的特点,采样延迟样点必 须是2 的整数幂,最好是8 个样点。要求话音编码方案的指标a 为:采样 延迟1 m s ( 8 个样点) :速率在8 k b i t s ( 每样点l 位) ;音质与p c m 相当。 1 9 9 2 年国际电信联盟( i t u ) 向全世界征集延迟低于5 m s ,音质与p c m 相当,速率低于8 k b p s 的话音编码方案。目前这一目标仍未实现。1 9 9 2 年公布的g 7 2 8 标准i l l 和1 9 9 6 年公布的g 7 2 9 标准,在音质上均符合要求, 是i t u 公布的i p 电话通信协议。但是,g 7 2 8 虽然延迟( 5 样点o 6 2 5 m s ) 符合要求,速度却为1 6 k b 口s ;g 7 2 9 虽然速率为8 k b p s 但延迟是8 0 样点 ( 1 0 m s ) 。 在未来几年内,具有指标a 的话音编码方案是这一领域科学工作者努 力追求的目标。具有指标a 的话音编码方案,有如下三个方面的应用前景: i ) 取代g 7 2 8 和g 7 2 9 成为更高性能的i p 话音编码标准。 i i ) 取代现有移动通信话音编码标准,成为新一代移动通信系统的 话音编码方案。 i i i ) 取代g 7 1 1 成为现有电信网络的话音编解码方案。这样,对一 次群设备稍作改动( 增加8 位样点到8 位8 样点的变换,以及相应的信 令改变) 就可形成对现有p s t n 网络的8 倍扩容。 上述三个应用的最终结果将提供这样一种可能:在p s t n 网络、i p 网络和无线移动网络三者之问使用统一的话音编码方案,形成信号在三个 网络之间的无译码交换。因此,研究开发具有指标a 的话音编码算法,对 国际国内通信产业有着十分重大的现实意义,其潜在的经济意义将以千亿 计。 1 9 9 2 年提出的i t u tg 7 2 8 标准语音压缩算法在1 6 k b i t s 速率上实现 了单路延迟不超过2 m s ,音质与p c m 相当,是数字电路倍增设备、 i n t e r n e t i p 电话网关采用的首选算法。尽管1 9 9 6 年提出的i t u t g 7 2 9 将码率降低到8 k b i t s ,但由于它的采样延迟为1 0 m s ,单路编译码延迟超 过3 0 m s ,因此在上述应用场合以及有关涉及电信网接八方面的应用中, g , 7 2 8 仍是唯一的方案。 采用前向预测和长时预测的g 7 2 9 算法对本研究基本上无参考价值。 g 7 2 8 采用时变参数模型,每2 0 个样点后向地估计一次参数;采用5 0 阶 滤波器,而不用长时预测器;设计了增益滤波器降低了码书尺寸。由此可 见,g 7 2 8 算法的优点与不足,都可以为本研究所借鉴。 本研究的主要内容是改善g 7 2 8 算法的性能,提高其编码质量,降低 它的复杂性和码率;提出两种低速率编码方案:每个矢量十样点即延迟为 1 2 5 m s 的8 k b i t s 的两种编码方案。 0 2 论文完成工作 1 理论一: 将1 6 k b i t sl d c e l p 语音编码算法的平均分段信噪比 提高约2 d b 。 2 理论二:降低i t u - tg 7 2 8 标准算法的复杂性以码书部分搜 索取代码书全搜索,降低综合滤波器的阶数。在信噪比不变的前提下, g 7 2 8 算法复杂性可以减少4 0 。 3 理论三:设计两种8 k b i t sl d c e l p 语音编码算法的方案。为今 后研究8 k b i t sl d c e l p 算法提供了实验环境。 0 3 本论文的组织 第一章介绍了本课题的研究对象i t u tg 7 2 8 语音编码标准算 法;第二章提出g 7 2 8 的改进算法;第三章、第四章提出了两种延迟为 1 2 5 m s 的8 k b i t sl d c e l p 语音编码算法方案的框架,并进行了初步实验。 走原理工走掌硕士沧文 第一章g 7 2 8 标准算法 1 1原理概述 图1 - 1g 7 2 8l d c e l p 编码器原理图 图1 - 1 和图1 - 2 分别是g 7 2 8 标准算法中编码器和解码器部分的原理 框图。编码部分的工作原理是:首先将速率为6 4 k b i f s 的4 律或t 律p c m 输入信号转换成均匀量化的p c m 信号,接着由5 个连续的语音样点s 。( 5 叻, s u ( 5 n + 1 ) ,勘( 5 押+ 4 ) 组成一个5 维语音矢量j ( h ) = k ( 5 月) ,s 。( 5 n + 1 ) , s 。( 5 甩+ 4 ) 。激励码书中共有1 0 2 4 个5 维的码矢量。对于每个输入语音矢 量,编码器利用合成分析方法从码书中搜索出最佳码矢量,然后将1 0 b i t 的码矢标号通过信道传送给解码器。每4 个相邻的输入矢量( 共2 0 个样 点) 构成一个自适应周期,或者称为帧,每帧更新一次l p c 系数。因为 在l d c e l p 算法中采用的是后向自适应预测技术,当前的激励增益和综 合滤波器的输出是分别对先前量化过的增益和语音信息进行l p c 分析而 得出的,所以向解码器传送的信息只是激励矢量的地址标号,这就使得编 码器只有5 个样点的缓冲延迟,对于8 k h z 的采样率就是0 6 2 5 m s 的延迟。 把处理延迟和传输延迟包括在内,总的一路编译码延迟不超过2 m s 。 后向矢量 增益调节器 f :一 后滤波器 葫高熊蔫鞣卜叶i 焉慕嚣 图1 - 2 g 7 2 8l d - c e l p 解码器 1 2 l p o 系数的计算 语音信号被看做短时平稳过程,通常在进行l p c 分析前都要加窗。 g 7 2 8 标准算法采用混合窗,如图1 3 所示。这种混合窗将用于三种l p c 分析中,即感觉加权滤波器、综合滤波器和对数增益滤波器中。 在计算出自相关系数之后、开始杜宾( d u r b i n ) 递推之前,通过一个 小量来增加能量r ( o ) : 即h 寻心) ( 1 - 1 ) r ( o ) 卜( 兹) r ( o ) 1 ) 这样做有一个作用,即用白噪声来填充谱谷以便降低谱动态范围和缓 和后续l e v i n s o n d u r b i n 递推的不良条件。白噪声相关因子2 5 7 2 5 6 对应 蠹| | 恩一 成音t 含语一 2 撼 于大约2 4 d b 的白噪声电平,这个电平低于平均语音能量。 型! l 一j 鬯- b 图1 - 3 混合窗 利用白噪声修正后的臼相关系数和l e v i n s o n d u r b i n 递推公式,就可 以计算出l p c 系数。令第i 阶预测器的第个系数为甜,“,则递推方法可 如下描述: e ( 0 ) = r ( 0 )( 1 - 2 ) 月( f ) + 己i - “, i - 1 ) 足( f 一,)月( f ) + 己“,足( f 一,) 。= 一e 杀( if ( 1 - 3 ) 一n 、 a ,“= k :( 1 4 ) 口j = 日“1 + 七,d ,1 勺舀一1 ( 1 5 ) e ( f ) = ( 1 一_ ? ) e ( f 1 )( 1 6 ) 方程( 1 - 3 ) n ( 1 6 ) 对i = 1 , 2 ,m ( m 是阶数) 递归计算,最终的解可给出: q ,= a 。”, 1 i m ( 1 7 ) 1 3 感觉加权滤波器 如图1 - 4 所示,当前的输入语音矢量j ( h ) 经过加权滤波器,得到加权 的语音矢量v ( n ) 。 输 图1 4感觉加权滤波器系数更新 加权滤波器的传递函数为: 叭z ) = 碉1 - q ( z r , ) ,o y 2 y l - l 上式中,q ( 力为线性预测器的传递函数: 9 ( 0 = - e q ,z 1 ( 1 8 ) ( 1 9 ) q ,即为求得的预测系数,q o = 1 。,l 和,2 为根据人耳的听觉特性经 实验得出的加权因子,在这里,y l = 0 9 ,y 2 = 0 6 。所以, 1 + ( g ,川z 1 形( z ) = 等_ ( 1 - l o ) 1 + h ,! 矿 感觉加权滤波器分子分母系数的更新每帧进行一次,更新发生在每帧 的第三个矢量。图1 4 为感觉加权滤波器系数更新框图。经过综合滤波器 后合成的语音也需经同样的加权滤波器处理,以提高听觉质量。这两个感 觉加权滤波器是完全一样的。其工作过程如下:首先对输入语音或量化语 音的前一帧加混合窗,计算出加窗后的自相关系数,利用莱文森一杜宾 ( l e v i n s o n d u r b i n ) 递推公式将自相关系数转换为预测系数,再计算出加 权滤波器系数,对当前帧的语音矢量进行滤波,输出加权后的语音矢量。 1 4 综合滤波器 在图1 - 1 中可以看到,有两个综合滤波器,它们是分别用来计算激励 的零输入响应和零状态响应的,二者有相同的滤波器系数,每帧更新一次, 更新时刻也在每帧的第三个矢量处。其传递函数为 f 2 西1 丽 l - 1 1 ) p 0 ) 是5 0 阶l p c 预测器的传递函数: p ( z ) = 一“。z 1 ( 1 1 2 ) 其中,a ,= 2 a ,0 = 1 ,2 ,3 ,s o ) ,a ,为杜宾递推计算出的l p c 系数,五 为带宽扩展因子,肛0 9 8 8 3 ,带宽扩展b = 1 5 h z 。 综合滤波器系数更新框图如图1 5 所示。 图1 - 5综合滤波器系数更新 1 5 对数增益滤波器 设矢量y ( ) 是在 时刻时的激励矢量,e ( n ) 是经过增益调节后的激励 矢量,q ( 和吼( n ) 分别对应于,( 一) 和。( ”) 的均方根( r m s ) ,a ( n ) 是 用于调节码书搜索得到的最佳码矢y ) 的能量,则有 e ( n ) = 仃0 ) ,( ”) l o g o 。( n ) 】_ i 。s 【d ”) 】+ 1 0 9 盯,0 ) 】 ( 1 - 1 3 ) ( 1 1 4 ) 本质上讲,增益滤波的目的就是想通过e ( n - 1 ) ,e ( n 一2 ) ,的增益来预测 e ) 的增益。算法中,在对数域进行l p c 分析预测。 1 0 即1 0 9 p 0 ) 】= p ,l o g o r 。n i ) - o f f s e t + o f f s e t ,= l :兰nl 。g b d f p ,o f ) 一劬虹d 坤吖 ( 1 1 5 ) 上式实际上是一个以钆0 1 ) 作为输入,仃( n ) 为输出的l o 阶零极滤 波器。 通过对先前的l 。g a 。( 叫序列加混合窗,进行l p c 分析,求得预测系 数a ( 净1 ,2 ,l o ) ,再进行带宽扩展,求得研= 爿a ( i _ 1 ,2 ,1 0 ) ,这里 九= o 9 0 6 2 5 ,扩展带宽b = 1 2 5 h z ,改善了增益调节器的坚韧性。图1 - 6 为 后向自适应增益调节器框图。 这个调节器逐个矢量更新激励增益,计算过程如下: 嘶z ) 经过一矢量延迟得到e ( n 1 ) ,对e ( n 1 ) 的均方根值r m s 取对数、 去偏,得到对数域增益氓”1 ) ,将氓n 1 ) j j 日混合窗,然后计算l p c 系数 a ,0 = 1 ,2 ,l o ) ,再将a ,与带宽扩展因子丑的i 阶指数爿相乘,得到预测系 数q ,即q = 占。,将预测系数用于对数域线性预测器得到预测值氧h ) ( 1 1 6 ) 上式中的预测系数每4 个语音矢量更新一次,在第二个语音矢量处更 新。得到烈盯) 之后,再经过反对数变换及平滑,最后得到激励增益文力。 图1 6矢量增益后向调节器 1 6 码书搜索 1 6 1目标矢量 激励 矢量 e f h 1 参见图1 - 1 码书搜索部分,码书搜索的对象就是目标矢量v ( ) 。这个 目标矢量是如何得到的? 因为码书搜索时,1 0 2 4 个候选码矢激励通过滤 波器豳刁输出的是零状态响应,所以为了和这个“零状态”具有可比性, 输入的原始语音s ( n ) 作为综合滤波器全响应逼近的目标,必须减掉一个自 身的“零输入”响应,才能得到含有原始输入语音信息的零状态响应,作 0 一 胛 文 d m 州 1 | 砖鼠 为码书搜索的逼近目标;又原始语音引入感觉加权,所以码书搜索也必须 引入感觉加权滤波w ( z 3 ,即川z ) = f ( z ) 职z ) ,f ( z ) 为综合滤波器。 1 6 2 码书结构 在1 6 k b i t sl d c e l p 算法中,使用一个固定码书,为减小计算量,采 用了乘积码书中的波形,增益码书法。设全搜索矢量编码中的码本大小为 2 m ,相应地编码时搜索一次的最小失真运算量也等于2 盯次。如果将总 位数m 分成两部分m = m l + 鸩,把m l 用于增益编码,m 2 用于波形编 码,这样,增益码本中的码字数为2 m ,波形码本中的码字数为2 m z ,总 存储量及搜索时计算距离的次数都降低到与2m i + 2m 2 相同的数量级,这 就减小了存储量和运算量。在g 7 2 8 算法中,m = 1 0 ,m 1 = 3 ,m 2 = 7 ,即 波形码书含有2 7 :1 2 8 个码字,增益码书含有2 3 = 8 个增益,且其中有一 位为符号位。 1 6 3 码书搜索算法 设加权的综合滤波器其传递函数为圈固, ( n ) 是其冲激响应,y ,是 第个波形码矢,g ,是第i 个增益电平,下标为f 、,的码矢经过日( z ) 滤波, 输出为i 。: 膏= 日盯k 。y ( 1 1 7 ) 式中的日为: 日= 厅( o ) 0 000 ( 1 ) ( o ) 0 0 0 ( 2 ) ( 1 ) 硪o ) 0 0 ( 3 ) ( 3 ) ( 1 ) ( o ) 0 ( 4 ) ( 4 ) ( 2 ) ( 1 ) ( o ) ( 1 1 8 ) 农原理z 走学碾士伦文 i 和j 的组合应使f 面的均方误差最小: d = 蜘) 一蔓。| | 2 :0 2 叠( n ) 喝l t y 川2 这里,量0 ) = x 0 ) 盯0 ) 为归一化目标矢量,展开上式 d _ - o - 2 0 ) 0 瞎o 2 2 9 ,叠7 0 ) 母,+ 反2 月,1 1 2j 使d 最小,等价于使下面的d 最小: 西= 2 9 p 7 0 h ,+ g ;2 e , 式中, p 0 ) = h7 曼( ”) e ,= 川2 又设, 6 ,= 2 9 , c 。= 毋2 ,i = o ,1 ,7 则西成为 其中 d = _ b , p + c i e j p j = p t y j ( 1 - 1 9 ) ( 1 2 0 ) ( 1 - 2 1 ) ( 1 2 2 ) f 1 - 2 3 ) ( 1 - 2 4 ) ( 1 2 5 ) ( 1 2 6 ) ( 1 2 7 ) 因为b i 、c ,和五,都可以在下一次搜索前预先计算和保存起来,所以, 当前搜索的主要计算量在于计算0 和寻找最小西值所对应的增益标号i 。 在( 1 2 5 ) 式中,设西= 。,则可得弓= 9 2 e ,。令季= 鲁= 詈,所以, 营与g ,有一定比例关系。量化营等于自的8 个增益电平之一,对应的索 引值i 即为本次搜索的增益电平下标值。但由于计算需要除法,故将此方 法稍微改变一下,以利于d s p 实现。设盔是两相邻同符号增益电平中点 值,将雪的量化看做是与4 的比较,而比较“g d ,? ”就等价于比较 “只 d t e ,? ”,这样就避免了使用除法。 1 7 后滤波器 在解码端,为在听觉上改善语音质量,除了包含有与编码器中的仿真 译码器相同的结构外,另有一个后滤波器。这个后滤波器的系数调节考虑 到了三级编码器的级联的情况,因此,它不仅满足了单路编译码器对语音 质量的要求,而且满足了三路级联的要求。因为后滤波器必然地要引入相 位误差,所以,当信道通过相位中含有信息的调制信号时,应关闭后滤波 器和感觉加权滤波器。本研究所有实验结果均未经过后滤波处理。 1 7 1 长时后滤波器 长时后滤波器是一个梳状滤波器,谱峰位于解码语音基频的整数倍 处。基频的倒数即为基音周期。令p 是基音周期,则长时后滤波器的传递 函数可以表示为: q ( z ) = g tl + b z 一9 ) ( 1 2 8 ) 毋、b 为滤波器系数,它们和p 每帧校正一次,在第三个矢量处校正。 从解码信号中检测出基音周期,并计算出一阶预测系数数据,就可以得 到长时后滤波器的系数g ,和b : 1 0卢 1 g l2 而 1 7 2 短时后滤波器 其中 瓦= 磁( o 6 5 ) 7 ,i 2 1 ,2 ,1 0 珥= 珥( o 7 5 ) 。,i = 1 ,2 ,1 0 2 ( o 15 ) k l ( 1 - 2 9 ) ( 1 3 0 ) ( 1 3 1 ) ( 1 - 3 2 ) ( 1 3 3 ) ( 1 - 3 4 ) 玩是通过对解码语音进行l p c 分析而获得的1 0 阶l p c 预测器系数, 岛是相应的一阶反射系数。 系数珥、嚣和每帧校正一次,校正发生在第一个矢量处。 1 7 3 输出增益调节单元 为防止后滤波器引起大幅度的增益偏移,在后滤波器中采用了自动增 益控制单元,使经过后滤波的语音能量与未经过后滤波的语音能量大致相 同。具体方法是:逐帧对经过后滤波的语音与未经过后滤波的语音各自的 1 4 一 盯 是 如一酗 m等剖 以 卜一卜 数 仁 酬 递 耳 传的器波滤后时短 绝对值求和,将其结果在校正因子计算器中相除,逐个矢量输出校正因子。 因为对后滤波器的解码语音要逐个样点调整,为防止“台阶”效应,让校 正因子经过一个一阶低通滤波器进行平滑。这个一阶低通滤波器的传递函 数为:o 0 i 0 一o 9 9 z - 1 1 。 盘原理z 夫掌硬士沧史 第二章改进的g 7 2 8 算法 在实际应用过程中,国际电信联盟( i t u ) 公布的话音编码标准仍要 不断地改进、完善。1 9 8 2 年公布g 7 2 1 1 2 1 后,针对算法在话带数据的通过 能力上的缺陷,于1 9 8 4 年之后陆续公布了改进版本。g 7 2 9 在公布后不久 也提出了修订版g 7 2 9 a 。g 7 2 8 算法也存在影l :多缺陷,其中某些问题限制 了它的应用: i ) g 7 2 8 算法复杂性太高。 浮点算法约3 0 m f l o p s ,定点算法也在2 0 m i p s 以上。计算量主要集 中在5 0 阶综合滤波器和1 0 2 4 个码书搜索上( 大约各占总计算量的4 0 ) 。 i i ) g 7 2 8 算法码率太高。 g 7 2 8 算法每样点2 b i t 码率( o 6 2 5 m s 延迟) 与g 7 2 1 算法每样点4 b i t ( 0 1 2 5 m s 延迟) 和g 7 2 9 算法的1 0 m s 延迟相比具有一定优势,但对g 7 2 9 算法每样点l b i t 码率来说,g 7 2 8 码率仍显得太高。 i i i ) g 7 2 8 算法波形码书使用效率太低。 g 7 2 8 算法的波形码矢按能量可划分成若干部分。只有能量与目标矢 量接近的那部分激励码矢才能真正有意义地参与激励矢量的筛选;当目标 矢量确定之后,对能量与目标矢量差距较大的激励码矢进行搜索,这实际 上是无效搜索。如果采用归一化波形码矢,其尺寸可以大大降低,搜索计 算量也随之降低,码书使用效率也能大大提高。 i v ) g 7 2 8 算法增益码书也存在缺陷。 文献 3 发现g 7 2 8 算法增益预测器的问题并提出改进方案,获得约 0 5 d b 的信噪比改善。本文将对增益预测器进行更为充分的讨论和进一步 的优化。另外,本文将对增益进行自适应量化,来取代g 7 2 8 算法的3 b i t 固定量化。 本章针对上述问题深入研究,最终提出一个解决方案,改善了上述几 方面问题。使g 7 2 8 平均分段信噪比提高约2 d b ,为进一步降低码率奠定 了基础。本章介绍改进方案的细节和实验结果。第一节介绍滤波器混合窗 函数的选择:第二节讨论改进码书搜索方案;第三、第四节分别介绍增益 的自适应预测和自适应量化:第五节讨论了改进算法对降低计算复杂性的 贡献。 2 1滤波器窗函数的研究 2 1 1问题的提出 对5 0 阶滤波器进行更新,按每阶需1 0 样点计算,需要至少5 0 0 个样 点信号。因此( 3 7 2 8 采用无穷递归窗,且窗的有效宽度在5 0 0 样点以上。 但是仅在2 4 0 样点之内( 3 0 m s 以下) 语音信号的平稳性才是有保证的, g 7 2 8 算法没有很好地解决这个冲突。为此,我们对( 3 7 2 8 标准中滤波器 的窗函数提出了质疑。我们的研究涉及到滤波器的改变,因此必须先对窗 函数进行深入讨论,寻找决定递归窗的关键参数。 2 1 2 滤波器的混合窗 2 1 2 1 g 7 2 8 混合窗 g , 7 2 8 标准算法采用混合窗,如图2 1 所示。混合窗分为递归部分和 非递归部分。采用递归混合窗是为了满足5 0 阶综合滤波器参数更新的需 要。这种混合窗将用于三种l p c 分析中,即感觉加权滤波器、综合滤波 器和对数增益滤波器中。下面给出混合窗处理过程的通用公式。 设每三个样点进行一次l p c 分析,则当前帧的信号为: 5 。) , s u ( 卅+ 1 ) ,s u + 工- 1 ) ,对于后向自适应l p c 分析,混合窗已经应用于 第m 个样点以前的所有信号。混合窗由两部分组成:一部分正弦波形窗 17 ( 非递归部分,长度为j v ) 作为前段,一部分指数窗( 递归部分) 作为后 段。其中信号样值s 。- 1 ) ,s u ( m 2 ) ,s 。伽一) 全部被这个窗的非递归部分 加权;从s u ( m - n - 1 ) 开始( 包括这个样值) ,样值左边的所有信号样值被这 个窗的递归部分加权,有值b , b a ,b a 3 ,。这里,o b l 和o a l 。 卜竺l 一塑坠一 b _ 而 ”窗函数 。f 。? j 。一。 。f f :一。+ 。,f f :+ m + j _ l 一 册一一l 在m 时刻,定义w m ( k 1 为混合窗函数: i 厶( ) = b a 【“m “。1 ”, k m n 一1 w m ( t ) 2 嚣女) = - s i n p ( i 。m ) 】,m 。:耋,:一1 加窗后的信号为: s m ( t ) = s 。 h 。g ) f 屯伍况忙) = s u 弘口【“( ”“1j j , k m n 一1 = 屯 k 。 ) = 一s u ( k ) s i n c ( k 一脚) l 坍一n k m 一1 1 0 , k m 对m 阶l p c 分析,需要计算斛1 个白相关系数r 。( f ) ,i = 0 , 1 ,2 , r 。( f ) :篁 b 。 一f ) :( f ) + 篁。似。, 一f ) 其中( f ) 是r 。( f ) 的递归部分,可用下式计算: k ( f ) = 差1 g b 。 一扣m 。- 蝥n - i 。魄( ) i o ( k ) i o ( k f ) 0 也 扎 o 4 埘 式f 2 3 ) 0 0 右边第二项为非递归部分。 为了计算下一帧的自相关系数r 。+ l ( o ,需要保存当前帧的( 玑下 一帧的样点从s u ( m + l ) 开始,当前帧信号s 。( 坍) ,5 。+ 1 ) ,s 。( 卅也- 1 ) 被移 入窗内。混合窗向右移三个样点后,新的加窗信号成为: s m + l g ) = 屯 h 。 ) f s 。0 院+ 。 ) = s u 也帆 b 。, 埘+ 三一n i = 屯伍) g ,+ 。 ) = 一矗( k ) s i n c ( k m 一三) lm + 三一n k m + 工一1 ( 2 - 5 ) l o l k m + l 如+ l ( i ) 的递归部分为: + 。( f ) :”l - n 一i + 。忙b 。 一f ) :”兰:,+ 。 p 。以j ) + ”! 巍+ 。忙砖。+ 。 一i )= + 。以p 。恤j ) + s ,+ 。忙砖。+ 。啦一) = m 。- 蝥n - i 。 玩 b 屯 一f 珑忙一f b 。+ 意舅+ 。o b 。g f ) ( 2 - 6 ) :。z e k ( f ) + ”篁芯+ 。g p 。+ 。g f ) 则自相关系数为 r 一。( f ) z 吐:密+ t 蛾+ z 一)( 2 7 ) h + ( f ) 被保存用于计算下一帧的自相关系数。 式( 2 1 ) ( 2 7 ) 中用到的参数从三、及羽以根据需要选择,在g 7 2 8 标准算法中,对应于感觉加权滤波器、综合滤波器和对数增益滤波器的m 、 厶及嘲值见表2 1 。 表2 1g 7 2 8 j 种滤波器的a 六、值 滤波器名称 m 感觉加权滤波器1 02 03 009 8 2 8 2 0 5 9 8 综台滤波器5 02 03 509 9 2 8 3 3 7 4 9 对数增益滤波器 l o42 009 “6 7 8 6 3 0 2 1 2 2 窗函数的参数选择 ( 3 7 2 8 的混合窗结构保持了递归窗函数的合成语音听觉质量最佳的优 点。因为,一方面,递归窗长度无限长,保留了充分长的过去合成语音信 号的相关性:另一方面,递归窗对当前样值的加权最大,最能反映输入语 音的迅速变化。同时正弦窗又便于定点处理。因此我们仍采用这种结构的 混合窗来加权信号。 由图2 1 和式( 2 1 ) 可知,窗函数非递归部分的陡度是由其第一个值 w 0 = w 。沏一1 ) 来决定的。当w 。确定以后,由式( 2 - 8 ) w o = 一s i n c ( m 一1 一棚) = s i n ( c )( 2 - 8 ) 可求得 c = a r c s i n ( w o )( 2 - 9 ) 为使混合窗的两部分能够连续,递归部分的第一个值按式( 2 1 0 ) 来确 定: b = w 。( ,n n 一1 ) = s i n c ( n + 1 ) ( 2 1 0 ) 我们知道混合窗的递归部分呈递减趋势,那么必有一函数值k ( 的最 接近w 0 ,不妨假定w 。( 七) = w 。,则有 b a 一2 一”一”一1 1 = w o( 2 1 1 ) 所以 口= 一 k - ( 一孑瓦了五i 刁而 ( 2 1 2 ) 由此可见,w 0 和k 是决定一个递归窗的重要因素。通过调整w o 的值 可以得到参数c 和b ,通过选择k 可以决定t 2 。因此,当滤波器更新周期三 ( 样点数) 和非递归窗长n 确定后,只要选择和k ,就可以得到不同 的窗函数供我们比较、选择。 我们知道,语音信号是一种随时间而变化的信号,但是它具有短时平 稳性,在- d , 段时间里( 一般为1 0 3 0 m s ) ,语音信号的统计特性近似不 变,浊音的基音周期以及信号幅度等都只作缓慢变化。所以,有效窗的宽 度l i m i t 不应大于2 4 0 。若令 ( m 一1 ) 一k + 1 = l i m i t jk = m l i m i t ( 2 1 3 ) 将式( 2 1 3 ) 代入式( 2 一1 2 ) ,则得 口= u ”。“j y w o s i n c ( n + 1 ) 】( 2 - 1 4 ) 我们选择、三和与g 7 2 8 完全一致,取l i m i t = 2 4 0 ,并由此得 出口的值,将此窗用于综合滤波器和感觉加权滤波器。 通过实验验证,根据上述方法选择出来的窗函数,能够使滤波器系数 很好地适应语音信号的时变性,为降低滤波器阶数提供了条件。 2 2 归一化波形码书的搜索算法 2 2 1 增益研的精确表达 g 7 2 8 算法属于c e l p 方法,c e l p 算法的核心就是码书搜索,按照 判据( 2 1 5 ) 来把原始语音信号和训练好的码书比较,进行矢量量化。 d f 0 2 ( 摊( 即) g ,圳2 邮1 其中,盯( ) 是增益滤波器对当前激励增益的估计,曼( ) 是经过增益 调节后的目标矢量,瞰n ) 是短时预测器的单位冲击响应,蛋是增益码矢, g 。是波形码矢y ,的能量,了,是归一化后的波形码矢。g 7 2 8 的波形码书 含有能量,乘积g ,g 。的个数只有1 0 2 4 个。两个矢量充分接近的必要条件 是能量相等。采用码书搜索方式进行语音信号矢量量化的过程可以这样理 解:增益预测决定待量化矢量的能量,而码书搜索决定能量在各个分量上 盘厦疆z 夫学磷士沧文 的细节分配。为了使目标矢量曼( n ) 的能量落在码书的1 0 2 4 个能量范围内, x 寸c r ( n ) 的估计必须尽可能得准确。一旦盯0 ) 确定之后,只有能量与目标 矢量叠( n ) 接近的那些区间中的码矢才有可能被选作激励矢量。由于波形 码矢刻画了能量在矢量各个分量上的精细分配,所以与叠( n ) 能量接近的 区间包含码矢个数越多,激励矢量刻画得就越细致。一个极端的情况是, 如果我们找到一个精确的增益预测算法,使量( ”) 的模等于1 ,那么,可以 用一个归一化波形码书来描述激励矢量的精细结构。此时,归一化波形码 书中每个码矢的能量都与目标矢量叠( 月) 的能量接近,都有可能被选作激 励矢量,从而可以大大提高波形码书的使用效率,或者降低波形码书的尺 寸。由此可见,精确地表达激励矢量的增益并采用归一化波形码书是改善 g 7 2 8 编码效率的一个途径。 对g 7 2 8 标准算法中的码书进行能量归一化,所有码字能量是1 ,j , 是归一化波形码矢。于是,判据( 2 i s ) 等价于使下式最大: 西。= 2 9 ,p7 ( n ) j ,一g ? e ,( 2 1 6 ) 式中 p ( ”) 2 h 。x ( ”) 2 - 1 7 ) 目= l | 母川2 ( 2 1 8 ) ( 2 1 6 ) 式对每个j ,对应的舒求导,并令a d 西,= 0 ,得: g ,:挚( 2 - 1 9 ),2 f 这就是增益码矢的精确值。对岛的自适应量化将在后面两节介绍。将野 代入( 2 1 6 ) 式可得 址隧e j = 瞥 - y p 2 。, , 、。 2 2 2 码书搜索模块的改进 对于码激励话音编码算法,在进行码书搜索时,我们一方面期望有尽 可能多的增益值来适应目标矢量能量的动态范围。另一方面,对于给定的 目标矢量的能量值,我们又需要尽可能多的波形码矢在能量上与之相同, 以便对能量在各分量的细节分配上有尽可能多的选择。换句话说,我们需 要尽可能多的波形码矢具有相同的能量。g 7 2 8 算法是对8 个增益值和1 2 8 个不同能量的波形码矢的乘积码书共1 0 2 4 个码矢进行全搜索。这1 0 2 4 个 码矢能量各不相同。不妨假定它们按能量可以聚成, 类或者说按能量可以 划成”个区间,则平均每个区间有,= 1 0 2 4 个波形码矢是对搜索有实际 意义的。对其它区间的搜索由于能量相差太远,实际上是无效的搜索。 在本算法中,使用了一个归一化固定波形码书和一个自适应增益码 书。由于波形码矢刻画了能量在矢量各个分量上的精细分配,所以当增益 精确表达时,波形码书的体积可以缩小,以提高码字使用效率。用此方法 可以很好地解决上述矛盾。 2 2 3 选择波形码书及其尺寸 下节将介绍我们对式( 2 1 9 1 求出的增益精确值进行n 电平自适应量 化,其效果要远远好于胛电平的固定量化。当我们选择 大于g 7 2 8 的固 定量化电平数8 时,其量化效果将更有保证,因此,我们取”= 1 6 。对g 7 2 8 来说,1 0 2 4 个码矢用1 6 电平固定量化能量时,实际有效搜索的波形码矢 个数小于,= 1 0 2 4 1 6 = 6 4 。我们选择归一化波形码矢尺寸为6 4 ,即可保 证搜索效果优于g 7 2 8 。 我们先对g 7 2 8 的1 2 8 个波形码矢归一化,用式( 2 一1 9 ) 计算增益的精 确值,并进行码书搜索。采用3 0 句话共6 1 0 0 0 个矢量进行训练,选出使 用频率较高的6 4 个归一化波形码矢,作为新算法的归一化波形码书。 在码书搜索过程中,对每一个输入语音矢量,求出目标矢量叠( n ) 后, 先利用式( 2 1 9 ) 求出6 4 个归一化波形码矢盯各自对应的6 4 个增益值舒, 其中使西。最大的岛就是最佳增益,相应的乃就是最佳波形码矢。图2 - 2 是改进的码书搜索模块。 冲击响应 矢量训算 坚 波形码矢 卷积 误差 计算 譬嚣陋 反馈增盐码字和码矢标号送增益冯字和杩矢标号到信道 幽2 - 2 改进的码书搜索模块 在实际程序实现中,对求导计算出的6 4 个增益值分别自适应量化, 再计算出各增益值的次最佳量化值,然后从这6 4 2 = 1 2 8 个匹配中选出使 西。最大的一组岛和,即为最佳增益和最佳波形码矢。实际测试发现, 约有3 的机会选
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 1.11 有理数的乘方 教学设计 华东师大版数学七年级上册
- 合肥市老城中心区火灾韧性评估及提升策略研究
- 国有资本参股对民营企业成本粘性的影响研究
- 人体发育学理论知识考核试题及答案
- 7.2力的测量 弹力(说课稿)2024-2025学年北师大版物理八年级下册
- 离婚协议(公司股权分割)
- 2025年煤矿安全生产知识考试题及参考答案
- 小学班主任工作创新方法
- 某河道生态修复工程治理思路
- 2025年护理品管圈主题库及答案急诊
- 乙炔气站操作规程
- 脊柱及四肢神经系统体格检查
- 《合同起草审查指南 三观四步法》读书笔记思维导图PPT模板下载
- 05G514-3 12m实腹式钢吊车梁(中级工作制 A4 A5 Q345钢)
- 羽毛球校本教材
- DZ∕T 0388-2021 矿区地下水监测规范
- 中学物理演示实验教学设计课件
- 省作家协会入会申请表
- 从词源上分析:中国“法”字的古字体为“灋”《说文解字》:灋教学课件
- 妇产科医学—宫颈上皮内病变
- CNC加工流程图最新
评论
0/150
提交评论