（信号与信息处理专业论文）8kbits低延迟语音编码算法研究.pdf

上传人：伐*** IP属地：宁夏上传时间：2019-12-19 格式：PDF 页数：66 大小：1.56MB 积分：0 举报 版权申诉

已阅读5页，还剩61页未读，继续免费阅读

（信号与信息处理专业论文）8kbits低延迟语音编码算法研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

太原理工大学硕士研究生学位论文 8 k b i t s 低延迟语音编码算法研究摘要低码率、低复杂度的l d c e l p 算法在通信领域具有十分重要的意义。 g 7 2 8 是目前低延迟码激励语音编码算法中唯一的1 6 k b i t s 的国际标准。本研究以降低码率为目的对g 7 2 8 算法进行改进，提出了三个延迟为2 5 m s 的8 k b i t s 的语音编码算法。实验表明，提出的改进算法在主客观质量上均接近于g 7 2 8 的水平。低延迟的语音编码算法必须采用实时基音检测，到目前为止基音检测都是基于帧长2 0 m s 以上的长延迟算法，不满足实时性要求。因此g - 7 2 8 算法无法采用基音检测。所谓实时基音检测，是指连续监测每帧采样信号，当采样的一帧样点里存在一个基音脉冲时，立刻将它检测出来并计算基音周期。利用小波变换，本研究设计了帧长2 5 m s 的实时基音检测算法。依据小波变换的多分辨率能力发现第4 阶小波系数极值与信号突变点之间存在强相关。以此为基础设计了基于小波变换的语音基音周期实时检测算法。该算法对语音信号分帧处理，通过结合小波域波形和时域波形，采取自适应基准、多特征参数提取小波系数极大值来确定基音周期。该算法在准确检测信号峰值点的基础上，精确提取基音周期，可以同时检测到基音周期的值和起止点，是本文后向基音预测8 k b i t s 低延迟编码算法的基础。本研究在g 7 2 8 中引入自适应码书结构，自适应码书由最近的历史激励构成。算法采用归一化的固定码书。训练固定码书时，根据其使用频率对固定码书进行优化设计，通过迭代求出最佳固定码书。增益量化时对自适应码书采用固定量化方案，固定码书采用自适应量化。本文比较了三种延迟为2 5 m s 的8 k b i t s 编码方案：方案一采用全搜索模式，对1 2 8 个自适应码矢、8 个增益值和1 2 8 个固定码矢、8 个增益值的奎堕里三奎堂堡主塑塑竺兰堡丝苎全部组合进行搜索，获得最佳的码矢标号和增益；方案二在连续的两帧里对自适应码书采用不同搜索模式：偶数帧的搜索与方案一相同；奇数帧的搜索仅在偶数帧得到的自适应码矢标号前后的小范围内进行；方案三在方案一的基础上增加了后向基音预测，在自适应码书中依据基音预测值确定 6 4 个码矢作为搜索对象，并将节省的1 个比特用于扩大固定码书尺寸，从而进一步改善编码算法的主客观质量。关键词：小波变换，基音检测，自适应码书，增益量化，信噪比，p e s q n 太原理工大学硕士研究生学位论文 r e s e a r c ho n8 k b i t sl o wd e l a y s p e e c hc o d i n ga l g o r i t h m a b s t r a c t t h el d - c e l p a l g o r i t h mw i t hl o wc o d i n gr a t ea n dl o wc o m p l e x i t yh a sv e r y i m p o r t a n tm e a n i n g i nt h ef i e l do fc o m m u n i c a t i o n ( 2 7 2 8w a st h eo n l y16 k b i t s i t ur e c o m m e n d a t i o ni nt h el o wd e l a ys p e e c hc o d i n ga l g o r i t h ma tp r e s e n t t h i s r e s e a r c hm a d ei m p r o v e m e n ti n ( 2 7 2 8a l g o r i t h ma i m i n ga tr e d u c i n gc o d i n gr a t e a n dp r e s e n t e dt h r e e8 k b i t ss p e e c hc o d i n ga l g o r i t h m sw h o s ed e l a ya r e2 5 m s t h ee x p e r i m e n t ss h o w e dt h ei m p r o v e da l g o r i t h m si nt h ea s p e c to fs u b j e c t i v e a n do b j e c t i v eq u a l i t yw e r ec l o s et ot h a to f g 7 2 8 s p e e c hc o d i n ga l g o r i t h mw i t hl o wd e l a ym u s ta d o p tr e a l - t i m ep i t c hd e t e c t i o n b u ts of a rp i t c hd e t e c t i o nh a sb e e nl o n gd e l a ya l g o r i t h mb a s e do nf r a m el e n g t h m o r et h a n2 0 m sa n dn o tm e e tt h er e q u i r e m e n tf o rr e a l t i m e s og 7 2 8c a n t a d o p tp i t c hd e t e c t i o n r e a l t i m ep i t c h d e t e c t i o ni s c o n t i n u o u s l yd e t e c t i n g s a m p l i n gs i g n a lo fe a c hf r a m e ，w h e nap i t c hp u l s ee x i s t si ns a m p l i n gp o i n t so fa f r a m e ，i ti si m m e d i a t e l yd e t e c t e da n dp i t c hi sc o m p u t e d t h i sr e s e a r c hd e s i g n e d r e a l t i m ep i t c hd e t e c ta l g o r i t h mw h o s ef l a m el e n g t hi s2 5 m su s i n gw a v e l e t c o e f f i c i e n t s e x t r e m u mo ft h e4 mo r d e rw a v e l e tc o e f f i c i e n t si ss t r o n g l yr e l a t e d w i t h s h a r pv a r i a t i o np o i n t so fs p e e c hs i g n a l b a s e do nt h em u l t i r e s o l u t i o n a n a l y s i sc h a r a c t e r so fw a v e l e t b a s e do nw h i c h ，r e a l t i m ep i t c hd e t e c ta l g o r i t h m b a s e do nw a v e l e tt r a n s f o r mw a sd e s i g n e d t h i sa l g o r i t h md e t e c t e dp i t c ht h r o u g h f r a m e ，c o m b i n i n gw a v e f o r mo fw a v e l e td o m a i nw i t ht i m ed o m a i n ，a d o p t i n g a d a p t i v ec r i t e r i o na n dm u l t i f e a t u r ep a r a m e t e rt o e x t r a c tt h em a x i m u mo f w a v e l e tc o e f f i c i e n t t h ea l g o r i t h mc o u l de x a c t l yd e t e c tp i t c h ，s t a r tp o i n t sa n d e n dp o i n t sa n dt h en u m b e r so fp i t c hb a s e do ne x t r a c t i n gp e a kv a l u eo fs i g n a l ， w h i c hw a st h eb a s eo f8 k b i t sl o wd e l a yc o d i n ga l g o r i t h mo fb a c k w a r dp i t c h l i l 太原理工大学硕士研究生学位论文 p r e d i c t o r a d a p t i v ec o d e b o o ks t r u c t u r ew a s i n t r o d u c e di ng 7 2 8 ，w h i c hw a sc o m p o s e d o fl a t e s th i s t o r i c a le x c i t e di n f o r m a t i o n a n dn o r m a l i z e df i x e dc o d e b o o kw a s a d o p t e df o rt h ep r o p o s e da l g o r i t h m w h e nf i x e dc o d e b o o kw a st r a i n e d ，i tw a s o p t i m a l l yd e s i g n e da c c o r d i n gt ot h ef l e q u e n c yf o ru s ea n dt h eo p t i m a lf i x e d c o d e b o o kw a so b t a i n e db yi t e r a t i v e l yt r a i n i n g t h e n ，f i x e dq u a n t i z a t i o nw a s u s e di n a d a p t i v ec o d e b o o ka n da d a p t i v eq u a n t i z a t i o nw a su s e d i nf i x e d c o d e b o o k t h r e es c h e m e so f8 k b i f f sc o d i n gw h o s ed e l a yi s2 5 m sw e r ec o m p a r e di n t h i sp a p e r t h ef i r s ts c h e m ea d o p t e dw h o l es e a r c hm o d e ，t h a ti ss e a r c h i n gt h e w h o l ec o m b i n a t i o no f12 8a d a p t i v ec o d e w o r d ，8g a i na n d12 8f i x e dc o d e w o r d ， 8g a i n ，t h e nt h eo p t i m a li n d e xo fc o d e w o r da n dg a i nw e r eo b t a i n e d ；t h es e c o n d s c h e m ea d o p t e dd i f f e r e n ts e a r c hm o d ef o ra d a p t i v ec o d e b o o ki nc o n t i n u o u st w o f r a m e s ：t h es e a r c ho ft h ee v e nf l a m ew a st h es a m ea st h ef i r s ts c h e m e ；t h e s e a r c ho ft h eo d df l a m ew a so n l yd o n ei nt h es m a l la r e aa c c o r d i n gt ot h ei n d e x g o r e ni nt h ee v e nf l a m e ；t h et h i r ds c h e m ea d d e db a c k w a r dp i t c hp r e d i c t o r t ot h e f i r s ts c h e m e 6 4c o d e w o r dw a ss e a r c h e da c c o r d i n gt op i t c hp r e d i c tv a l u ei n a d a p t i v ec o d e b o o k ，a n d1 b i ts a v e dw a su s e di ne x t e n d i n gt h es i z eo ff i x e d c o d e b o o k c o n s e q u e n t l y , t h es u b j e c t i v ea n do b j e c t i v eq u a l i t y o fc o d i n g a l g o r i t h mw a si m p r o v e d k e yw o r d s - w a v e l e tt r a n s f o r m ，p i t c hd e t e c t i o n ，a d a p t i v ec o d e b o o k ， g a i nq u a n t i z a t i o n ，s n r ，p e s q 声明本人郑重声明：所呈交的学位论文，是本人在指导教师的指导下，独立进行研究所取得的成果。除文中已经注明引用的内容外，本论文不包含其他个人或集体已经发表或撰写过的科研成果。对本文的研究做出重要贡献的个人和集体，均已在文中以明确方式标明。本声明的法律责任由本人承担。论文作者签名： _ 埠日期：关于学位论文使用权的说明本人完全了解太原理工大学有关保管、使用学位论文的规定，其中包括：学校有权保管、并向有关部门送交学位论文的原件与复印件；学校可以采用影印、缩印或其它复制手段复制并保存学位论文；学校可允许学位论文被查阅或借阅；学校可以学术交流为目的，复制赠送和交换学位论文；学校可以公布学位论文的全部或部分内容( 保密学位论文在解密后遵守此规定) 。签名：导师签名：日期：丑! ：! 日期：迦2 ：! 太原理工大学硕士研究生学位论文 0 1本课题研究的背景与意义刚舌低码率、低延迟话音编码算法是二十一世纪通信、计算机网络、视频电话会议和远程教学系统等诸多应用领域的关键性核心技术。以数据包形式传输话音的i p 电话，其极低廉的通话费用给传统电信网络造成极大的冲击。面对竞争，如何使现存的数以万亿计的电信设备免遭淘汰，业界正在努力寻找降低通信费用，提高服务质量的途径。低成本扩容是其首选方案。支持传统电信网设备扩容的话音编码算法必须满足采样延迟不超过5 m s ( 4 0 个样点) ；速率在8 k b i u s ( 每样点1 位) 以下：音质与p c m 相当。1 9 9 2 年国际电信联盟( i t u ，i n t e r n a t i o n a lt e l e c o m m u n i c a t i o nu i l i o n ) 向全世界征集延迟低于5 m s ，音质与p c m 相当，速率低于8 k b p s 的话音编码方案。目前这一目标仍未实现。1 9 9 2 年公布的g 7 2 8 标准【1 1 和1 9 9 6 年公布的g 7 2 9 标准【2 】在音质上均符合要求，是i t u 公布的 i p 电话通信协议。但是，g 7 2 8 虽然延迟( 5 样点0 6 2 5 m s ) 符合要求，速度却为1 6 k b p s ； g 7 2 9 虽然速率为8 k b p s 但延迟是8 0 样点( 1 0 r e s ) 。在未来几年内，具有前述指标的话音编码方案是这一领域科学工作者努力追求的目标。 1 9 9 2 年提出的i t u t g 7 2 8 标准语音压缩算法在1 6 k b i t s 速率上实现了单路延迟不超过2 m s ，音质与p c m 相当，是数字电路倍增设备、i n t e r n e ti p 电话网关采用的首选算法。尽管1 9 9 6 年提出的1 1 u t t 2 7 2 9 将码率降低到8 k b i t s 3 1 ，但由于它的采样延迟为1 0 m s ，单路编译码延迟超过3 0 m s ，因此在上述应用场合以及有关涉及电信网接入方面的应用中，g 7 2 8 仍是唯一的方案。 g 7 2 8 采用时变参数模型，每2 0 个样点后向地估计一次参数；采用5 0 阶滤波器，而不用长时预测器：设计了增益滤波器降低了码书尺寸。由此可见，g 7 2 8 算法的优点与不足，都可以为本研究所借鉴【4 j 。本研究的主要内容在深入研究g 7 2 8 算法的基础上，提出了低码率编码方案：每个矢量2 0 样点即延迟为2 5 m s 的8 k b i t s 的语音编码方案。 o 2 语音编码技术的国内外发展状况语音编码技术的研究开始于3 0 年代d u d d l e y 发明声码器。尤其是最近2 0 年来，语太原理工大学硕士研究生学位论文音编码取得突飞猛进的发展。语音编码方法，按传统的观点可分为三类：波形编码、参数编码( 声码器) 和混合编码 5 1 。【7 j 。波形编码即针对语音波形进行编码( 直接对语音信号离散样值进行编码处理) ，它不需要语音模型。尽量保持输入波形不变，即恢复的语音信号基本上与输入的语音信号波形相同。这类编码方法将语音信号作为一般的波形信号进行处理，具有适应能力强、算法简单、易于实现、语音质量好等优点，缺点是编码速率高。波形编码器一般比参数编码器强健，它可以对各种信号进行处理。当然波形编码比参数编码具有较高的码率。它们在1 6 6 4 k b i t s 的码率上能给出较高的编码质量，当编码速率进一步降低时，其性能会急剧下降。国际电报电话咨询委员会( c c i t t ，c o n s u l t a t i v ec o m m i t t e eo f i n t e r n a t i o n a l t e l e g r a p ha n dt e l e p h o n e ) 现已并入国际电信联盟( i t u ) 于1 9 7 2 年制定的g 7 1 16 4 k b i t s 的脉冲编码调制( p c m ，p u l s ec o d em o d u l a t i o n ) 和i t u 在1 9 8 4 年公布的g 7 2 13 2 k b i t s 自适应差分脉冲编码调制( a d p c m ，a d a p t i v e d i f f e r e n t i a lp u l s ec o d em o d u l a t i o n ) 编码器标准等都属于这一类编码器。参数编码是以语音信号产生的数学模型为基础，先对语音信号进行分析，提取出其参数，对参数进行编码；在解码后由这些参数重新合成出语音信号，这种编码方法称为语音信号的分析合成方法。由于编码这些参数需要较少的比特数，因此这种方法具有编码速率低的优点，可以达到2 4 k b i t s 或更低的速率，但语音音质差，而且对噪声较敏感。这种编码称作“声码器技术”。美国政府1 9 8 0 年公布的2 4 k b i f f s 线性预测编码算法标准l p c l o 就是采用的这种方法，另外，共振峰声码器、通道声码器、余弦声码器都属于此类参数编码。混合编码是上述两类方法的有机结合，混合编码技术在参数编码的基础上引入了一些波形编码的特征，在编码位率增加不多的情况下，较大幅度的提高了传输语音质量。它基于语音产生模型并采用了分析合成技术，而且同时它又利用了语音时间波形信息，增强了重建语音的自然度，使得语音质量有明显提高。其代价是编码速率一般在 1 6 2 4 k b i f f s 之问，其中的主要技术称之为“分析合成法( a b s ，a n a l y s i s b y s y n t h e s i s ) ”。根据这种方法进行编码的有1 9 8 2 年b i s h n us a r a l 和j o e lr r e m d e 提出的多脉冲激励线性预测编码1 8 】( m p l p c ，m u l t i p u l s el i n e a r p r e d i c t i v ec o d e r ) ，码率在9 6 1 6 k b i f f s 范围内； 1 9 8 5 年e d d e p r e t t e r e 和p e t e rk r o o n 首先提出的规则脉冲激励语音编码( r p e l p c ， r e g u l a rp u l s ee x c i t e d l i n e a rp r e d i c t i v ec o d e rw i t hal o n gt e r mp r e d i c t o rl o o p ) ；同年 2 太原理工大学硕士研究生学位论文 m a n f r e dr s c h r o e d e r 和b i s h n us a r a l 提出了用矢量量化技术对激励信号进行编码的码激励线性预测编码( c e l ec o d ee x c i t e dl i n e a rp r e d i c t i o n ) ，在4 8 1 6 k b i v s 范围内可获得质量相当高的合成语音。近年来码激励线性预测( c e l p ) 编码作为一种优秀的中、低速率方案得到了很好的重视和研究，在降低复杂度、增强c e l p 的性能、提高语音质量等方面取得了许多新的进展。1 9 8 9 年，m o t o r o l a 的8 k b i t s 矢量和激励线性预测编码 ( v s e l p , v e c t o rs u me x c i t e dl i n e a rp r e d i c t i o n ) 1 9 1 1 0 l 成为北美第一代数字蜂窝移动通信网的语音编码标准，与美国政府4 8 k b i t sc e l p 语音编码器标准基本相同。1 6 k b i t s 的低延迟码激励线性预测【l l l 【”( l d c e l p , l o wd e l a y c o d ee x c i t e dl i n e a rp r e d i c t i o n ) 编码已于1 9 9 2 年标准化为i t u 建议g 7 2 8 ，这个编码器与与一般的c e l p 编码器的共同点是：利用合成分析法的搜索过程、感觉加权矢量量化和线性预测技术，从码本中搜索出最佳码矢量，乘以最佳增益，代替余量信号作为激励信号：主要不同之处在于一般的 c e l p 编码器中使用前向自适应预测器( f o r w o r d - a d a p t i v ep r e d i c t o r ) 去除语音信号的冗余度，而l d - c e l p 编码器使用后向自适应预测器( b a c k w o r d a d a p t i v ep r e d i c t o r ) 对短时谱包络和增益进行预测，因而l d - c e l p 编码器向发送端传送的只是码激励矢量的地址标号。美国政府制定了f s 一1 0 1 64 8k b i t sc e l p 保密电话网标准【7 】【1 3 1 之后，提出了制定半速率2 4k b i t s 声码器的新课题。c e l p 编码方案在4 1 6k b i t s 速率上取得了很大成功，但是，当速率低于4k b i u s 时，由于码本容量变的很小，不能很好地表示预测余量信号，编码器性能会很快下降。于是，在现代数字通信系统中，为提高信道利用率，如何用尽可能少的比特数来对语音信号进行编码已越来越受到重视。这种编码方法目前主要有正弦变换( s t c ，s i n et r a n s f o r mc o d i n g ) 编码、多带激励( m b e ，m u l t i b a n d e x c i t a t i o n ) 编码、波形内插( w i ) 编码【1 4 】、混合激励线性预测【1 5 】( m e l p , m i x e d e x c i t a t i o n l i n e a rp r e d i c t i v e ) 编码等方案，而且在1 2 0 0b i t s 以下的极低速率语音编码也有广泛的应用前景和吸引力。总之，低码率和高质量将是语音编码今后研究的主要方向。表0 1 给出了i t u 对8 k b i t s 语音编码性能的主要要求。 0 3 论文完成工作工作一：用c + + 实现了基于小波变换的语音信号基音周期实时检测算法。工作二：研究设计了三个8 k b i t s 语音编码方案，用c + + 实现设计算法，通过大量实验，得到最佳的固定码书及增益码书。太原理工大学硕士研究生学位论文表o 1l t u 对8 k b i t s 语音编码性能的主要要求 t a b l e0 - 1m a i nr e q u e s to f 8 k b i t ss p e e c hc o d i n gp e r f o r m a n c e 参数要求最终目标不比g 7 2 13 2 k b i t s 无误码语音质量 a d p c m 差有误码语音不比g 7 2 13 2 k b i t s 于g 7 2 81 6 k b i t s ( b e r 1 0 3 随机误码)a d p c m 语音质量差l d c e l p 相当单次编解码延迟 f 斗_ 。? 。w。tfl 。r a4 l - 1 f 。+ t m + 2 l - 1 卅- _ i 图卜3 混合窗 fi g u r e1 - 3h y b r i dw i n d o w 利用白噪声修正后的自相关系数和l e v i n s o n d u r b i n 递推公式，就可以计算出l p c 系数。令第i 阶预测器的第，个系数为矾”，则递推方法可如下描述： 6 磊一换一黜塑格一太原理工大学硕士研究生学位论文 e ( o ) = 尺( o ) r ( o + 芝。，卜”r ( i 忌= 一 e ( i 一1 ) a “= k 。 a j ”= 口“+ ta w ( t - ”，1 对- i 一1 e ( f ) = ( 1 一七? ) e ( f 一1 ) 方程( 1 3 ) 到( 1 ，6 ) 对f = 1 , 2 ，m ( 膨是阶数) 递归计算，最终的解可给出：吼= a l ， 1 i m ( 1 2 ) ( 1 3 ) ( 1 4 ) ( 1 5 ) ( 1 6 ) ( 1 7 ) 1 3 感觉加权滤波器如图i - 4 所示，当前的输入语音矢量j ( n ) 经过加权滤波器，得到加权的语音矢量i ，( ”) 。图1 - 4 感觉加权滤波器系数更新 f i g u r ei - 4c o e 珩c i e n tu p d a t eo f p e r c e i v ew e i g h t e df i l t e r 加权滤波器的传递函数为：喇= 篙躺，o y 2 7 1 1 s ，上式中，q 0 ) 为线性预测器的传递函数： q g ) = - z q ，z 一 ( 1 9 ) 吼即为求得的预测系数，g o = 1 。y 1 和y 2 为根据人耳的听觉特性经实验得出的加权因子，在这里，l = 0 9 ，y 2 = 0 6 。所以， 7 太原理工大学硕士研究生学位论文 0 ) = + 兰( q ，i 一 t + 兰g ，死p ( 1 1 0 ) 感觉加权滤波器分子分母系数的更新每帧进行一次，更新发生在每帧的第三个矢量。图1 - 4 为感觉加权滤波器系数更新框图。经过综合滤波器后合成的语音也需经同样的加权滤波器处理，以提高听觉质量。这两个感觉加权滤波器是完全一样的。其工作过程如下：首先对输入语音或量化语音的前一帧加混合窗，计算出加窗后的自相关系数，利用莱文森一杜宾( l e v i n s o n d u r b i n ) 递推公式将自相关系数转换为预测系数，再计算出加权滤波器系数，对当前帧的语音矢量进行滤波，输出加权后的语音矢量。 1 4 综合滤波器在图1 - 1 中可以看到，有两个综合滤波器，它们是分别用来计算激励的零输入响应和零状态响应的，二者有相同的滤波器系数，每帧更新一次，更新时刻也在每帧的第三个矢量处。其传递函数为 f o ) 。西1 羽 ( 1 1 1 ) 只力是5 0 阶l p c 预测器的传递函数： p ( z ) = 一q z l ( 1 1 2 ) 其中，a ，= 名6 ，( f = l ，2 ，3 ，5 0 ) ，反为杜宾递推计算出的l p c 系数，五为带宽扩展因子，2 = 0 9 8 8 3 ，带宽扩展b = 1 5 h z 。综合滤波器系数更新框图如图i - 5 所示。量图1 - 5 综合滤波器系数更新 f i g u r e1 - 5c o e f f i c i e n tu p d a mo f s y n t h e s i sf i l t e r 太原理工大学硕士研究生学位论文 1 5 对数增益滤波器设矢量y ( n ) 是在一时刻时的激励矢量，e ( n ) 是经过增益调节后的激励矢量，盯，0 ) 和 o e 如) 分别对应于j ( 栉) 和e ( n ) 的均方根( r m s ) ，盯o ) 是用于调节p ( 一) 的后向自适应激励增益，则有： e o ) = 盯0 h o ) l o g p 。0 ) 】= i o g b 如) 】+ l o g b ，g ) j ( 1 1 3 ) ( 1 1 4 ) 本质上讲，增益滤波的目的就是想通过e ( n - 1 ) ，e ( n 一2 ) ，的增益来预测p ( n ) 的增益。算法中，在对数域进行l p c 分析预测。 l o 即l o g 4 , 0 ：只l o g a 。o f ) _ o f f s e t + o f f s e t ，= l ：兰p ，l 。g ( 疗一f b 加一f ) 一移。r 】+ 够甜上式实际上是一个以盯，o 一1 ) 作为输入，盯( n ) 为输出的1 0 阶零极滤波器。 ( 1 1 5 ) 通过对先前的l o g k 。g ) 】序列加混合窗，进行l p c 分析，求得预测系数 a ( f - 1 ，2 ，1 0 ) ，再进行带宽扩展，求得p 。= 爿a ( i = - 1 ，2 ，l o ) ，这里九= o 9 0 6 2 5 ，扩展带宽b = 1 2 5 h z ，改善了增益调节器的坚韧性。图1 - 6 为后向自适应增益调节器框图。这个调节器逐个矢量更新激励增益，计算过程如下： “胛) 经过一矢量延迟得到e ( n 一1 ) ，对d h 一1 ) 的均方根值r m s 取对数、去偏，得到对数域增益文n 1 ) ，将文n 1 ) 加混合窗，然后计算l p c 系数a ，( i = l ，2 ，l o ) ，再将a ，与带宽扩展因子五的i 阶指数相乘，得到预测系数a i ，即口，= 爿舀，将预测系数用于对数域线性预测器得到预测值占0 ) ：占o ) ：兰q 6 ( n f ) ( 1 1 6 ) 上式中的预测系数每4 个语音矢量更新一次，在第二个语音矢量处更新。得到占) 之后，加上在块4 1 中储存的对数增益补偿值3 2 d b ，然后对数增益限幅器4 7 检查得出 9 太原理工大学硕士研究生学位论文的对数增益值，增益限幅器保证线性域的增益在l 1 0 0 0 之内。再经过反对数变换及平滑，最后得到激励增益盯0 ) ，盯o ) 是一个调节因子，用来调节选择的激励矢量y ( ，z ) 。 1 6 码书搜索 1 6 1 目标矢量图1 6矢量增益后向调节器 f i g u r e1 6b a c k w a r da d j u s t e ro f v e c t o rg a i n 激励矢量 e ( h ) 参见图1 1 码书搜索部分，码书搜索的对象就是目标矢量“”) 。码书搜索时，1 0 2 4 个候选码矢激励通过滤波器肌刁输出的是零状态响应，所以为了和这个“零状态”具有可比性，输入的原始语音j ( ，z ) 作为综合滤波器全响应逼近的目标，必须减掉一个自身的“零输入”响应，才能得到含有原始输入语音信息的零状态响应，作为码书搜索的逼近目标：又原始语音引入感觉加权，所以码书搜索也必须引入感觉加权滤波瞅z ) ，即俄2 ) = ，( z ) 职z ) ，以z ) 为综合滤波器。 1 6 2 码书结构在1 6 k b i v s l d c e l p 算法中，使用一个固定码书，为减小计算量，采用了乘积码书中的波形增益码书法。设全搜索矢量编码中的码本大小为2 村，相应地编码时搜索一次的最小失真运算量也等于2 村次。如果将总位数m 分成两部分m = m l + m 2 ，把m l 用于增益编码，m ，用于波形编码，这样，增益码本中的码字数为2 m i ，波形码本中的码字数为2 地，总存储量及搜索时计算距离的次数都降低到与2 m + 2 肘：相同的数量级，这就减小了存储量和运算量。在g 7 2 8 算法中，m = i o ，m = 3 ，m 2 = 7 ，即波形码书含 o 太原理工大学硕士研究生学位论文有2 7 ：1 2 8 个码字，增益码书含有23 = 8 个增益，且其中有一位为符号位。 163 码书搜索算法设加权的综合滤波器其传递函数为麒z ) ，a ( 月) 是其冲激响应，y ，是第j ，个波形码矢，吕是第i 个增益电平，下标为i 、，的码矢经过瞰z ) 滤波，输出为砖：艺= u 4 ) g ，j ， ( 1 1 7 ) 式中的为：h = 厅( o ) 0 0 0 0 厅( 1 ) h ( o ) 0 0 0 厅( 2 ) h o ) 向( o ) 0 0 ( 3 ) h ( 3 ) h ( 1 ) h ( o ) 0 矗( 4 ) ( 4 ) h ( 2 ) h ( oh o ) i 和，的组合应使下面的均方误差最小： d = f 卜如) 一曼，| f 2 = 廖2 0 1 i 圣o ) 一g ，毋，8 2 这里，圣0 ) = x o ) 一0 ) 为归一化目标矢量，展开上式： d ：盯2 ( ”) 啦( 盯) 卜2 9 ，叠伽) b y ，+ g 硼母21 使d 最小，等价予使下面的西最小： 6 = _ 2 9 t p t yj + g ? ej 式中， p 0 ) = 日7 主0 ) e ，= 渺州2 又设， b ，= 2 9 ， q = 2 ，i = 0 , 1 ，7 则西成为： 6 = 一b i pj + c i e i 其中 ( i 1 8 ) ( 1 1 9 ) ( 1 2 0 ) ( 1 2 0 ( 1 2 2 ) ( 1 2 3 ) ( 1 2 4 ) ( 1 2 5 ) 太原理工大学硕士研究生学位论文乞= p 7 g h ， ( 1 2 7 ) 因为包、c

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（信号与信息处理专业论文）8kbits低延迟语音编码算法研究.pdf

文档简介

温馨提示

最新文档

评论

（信号与信息处理专业论文）8kbits低延迟语音编码算法研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档