(电力系统及其自动化专业论文)使用多级静音检测的g729改进算法.pdf_第1页
(电力系统及其自动化专业论文)使用多级静音检测的g729改进算法.pdf_第2页
(电力系统及其自动化专业论文)使用多级静音检测的g729改进算法.pdf_第3页
(电力系统及其自动化专业论文)使用多级静音检测的g729改进算法.pdf_第4页
(电力系统及其自动化专业论文)使用多级静音检测的g729改进算法.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(电力系统及其自动化专业论文)使用多级静音检测的g729改进算法.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

度的情况下有效改进g 7 2 9 。 本文首先详细介绍了g 7 2 9 的编解码原理,在研究经典的静子检测技术的 基础上提出了基于m & z a 的二级检测算法,并且在实验室条件下进行了仿真 测试,仿真结果说明该算法在不增加g 7 2 9 算法复杂度和运算时延的基础上充 分利用电话交谈中的间隙,实现了在低信噪比条件下比g 7 2 9 b 更加有效的静音 检测,提高了g 7 2 9 语音压缩算法的压缩率。 关键词:g 7 2 9 g 7 2 9 b 语音压缩编码静音检测技术多级检测 i m p r o v i n gg 7 2 9b ym u l t i s t a g ev a da l g o r i t h m m a j o r :e l e c t r i cp o w e rs y s t e ma n di t sa u t o m a t i o n p o s t g r a d u a t e :l i us u f a n g a d v i s o r :l is h a n j u n s p e e c hc o m m u n i c a t i o np l a y sa ni m p o r t a n tr o l ei nm o d e r n c o m m u n i c a t i o nw o r l d 口i su s e da l lo v e rt h ew o r l dw i t ht h ed e v e l o p m e n to fi n t e r a c t h o w e v e r , t h el a c k o fb a n dr e s o u r c em a d el o wb i tr a t es p e e c hc o m p r e s s i o nc o d i n gb e c o m i n gak e yp a r t o fs p e e c hc o m m u n i c a t i o n a n do n eo ft h em a i ng o a l so fn o w a d a y ss p e e c h c o m p r e s s i o nc o d i n gr e s e a r c hi sh o w t oa c h i e v eb e s ts p e e c hq u a l i t yb yl e a s tb i tr a t e i n 1 9 9 6n u - ti s s u e d g 7 2 9 c o d i n g o f s p e e c h a t8 k b s u s i n g c o n j u g a t e - s t r u c t u r ea l g e b r a i c c o d e e x c i t e dl i n e a r - p r e d i c t i o n ( c s a c e l p ) ,w h i c h i sa d o p t e db yv o 皿g 7 2 9i st h er e s e a r c ho b j e c to ft h i st h e s i sb e c a u s e o fi t se f f i c i e n c y o fc o m p r e s s i o na n dg o o dq u a l i t yo fs y n t h e s i ss p e e c h b u tg 7 2 9i st h em o s t c o m p l e x i t ya l g o r i t h mt h a t u te v e rp r o p o s e d i t sb i tr a t ei s 丘x e da n di th a v e n t c o m p r e s s e dt h es i l e n c et i m eb e t w e e ne f f e c t i v es p e e c h e s a l t h o u g hg 7 2 9 b u s e dv a d a l g o r i t h mt oc o m p r e s st h es i l e n c et i m e ,i t sv a d i st o oc o m p l i c a t e da n dc a n tw o r k e f f i c i e n t l yw h e nt h es n r i sl o w e rt h a nl o d b t h i st h e s i sa d o p t sa t w o - s t a g ev a da l g o r i t h mw h i c hw o n ta d de x t r ac o m p u t i n g c o m p l e x i t yt oi m p r o v eg 7 2 9a l g o r i t h ma n de n h a n c e i t sc o m p r e s s i o nr a t i o ,1 1 ” t w o - s t a g ev a da l g o r i t h mi sc o m p o s e d o fs h o r tt u n ea v e r a g em a g n i t u d ed i f f e r e n c e f u n c t i o na n ds h o r tt i m ez e r oc r o s s i n gr a t e f u n c t i o no rs h o r tt i m ea u t o c o r r e l a t i o n f u n c t i o n w h e nt h ez e r oc r o s s i n gr a t eo fm i x s p e e c hi sc l o s et oz e r oc r o s s i n gr a t eo f b a c kn o i s e ,w eu s et h ea u t o c o r r e l a t i o nf u n c t i o nm e t h o da st h ed e t e c t i o nm e t h o do f t h es e c o n ds t a g e o re l s e ,w eu s et h es h o r tt i m ez e r oc r o s s i n gr a t ea st h es e c o n d s t a g em e t h o d t h er e s u l to fs i m u l a t i o ns h o w st h a tt w o - s t a g ev a da l g o r i t h mc a l l w o r ke f f i c i e n t l yi nac i r c u m s t a n c eo fl o ws n ra n dw o n td e t e r i o r a t ea ss e r i o u s l ya s g 7 2 9 bw h e nt h es n ri sl o w e rt h a n1 0 d b t h i st h e s i si n t r o d u c e st h eb r i e fs c o p eo fc u r r e n ts t u d yo fs p e e c hc o m p r e s s i o n c o d i n g t h em & z at w o - s t a g ev a da l g o r i t h mi sp r o p o s e db a s e do nt h er e s e a r c ho f g 7 2 9a n dt r a d i t i o n a la l g o r i t h m so fv a d n l es i m u l a t i o no fm & z a t w o s t a g ev a d a l g o r i t h mh a sb e e nd o n ei nl a bc i r c u m s t a n c eb ym a t l a b ,a n dt h em s u l t so f s i m u l a t i o nm a d eo u tt h a tt h em & z aa l g o r i t h mi sa l m o s te q u i v a l e n tt ot h ev a d a l g o r i t h ma d o p t e db yg 7 2 9 b i nh i g hs n rc i r c u m s t a n c e b u tm o r ee f f i c i e n ta n dm o r e r o b u s tt h a ng 7 2 9 bw h e nt h es n ri sl o w e rt h a n1 0 d b k e y w o r d s :g 7 2 9 q 7 2 9 b ,s p e e c hc o m p r e s s i o n ,v o i c ea c t i v i t yd e t e c t i o n ( v a d ) , m u l t i s t a g ed e t e c t i o n 四川大学硕士学位论文 第一章绪论 1 1 课题研究的背景和意义 随着近几年通信技术以及通信业务的飞速发展,人们对通信质量的要求也 越来越高。2 l 世纪的通信应在人与人之间、人与机器之间提供高质量的无缝的 信息交换手段,而语音通信将是最基本、最重要的方式之一。无缝通信是指用 户可以方便地综合使用各种多媒体信息交换手段,包括电话、电视电话会议、 语音信箱、电子邮件、图像传真、数据传输等,可以随意地从一种通信手段转 换到另一种通信手段而不影响通信质量;高质量是指通信质量不随用户环境及 媒介的变化而降低【1 1 ,这取决于众多关键科学领域的发展,而语音压缩编码将是 最基本、最重要的技术,这是因为人是以语音作为主要通信手段的。 话带语音压缩编码领域的研究已有几十年的历史,近十多年来,人们对这 一领域的研究兴趣大大的增长,已有大量的技术应用于远程通信和存储,一些 国家和国际标准化组织相继制定了语音压缩编码的标准 2 1 1 3 1 c 4 1 ,直接推动了语音 压缩编码的发展“。 语音压缩编码研究的主要内容就是在尽量减少失真的情况下对模拟语音信 号进行高效率的数字化表示。其基本问题就足在一定的编码速率条件下,如何 使用尽可能简单的算法得到尽可能好的合成话音质量,并且尽量减少压缩编码 的处理时延。这些因素密切联系,相互制约,实际应用中没有一种压缩编码可 以达到全部的要求。随着语音处理技术的发展,静音检测技术被用于语音压缩 编码中以提高压缩率,但是单一的静音检测技术并不能很好地区分有效语音和 背景噪声,所以多级静音检测技术的应用越来越广泛。 i t u - t 提出的g 7 2 9 编码是应用非常广泛的中低速率语音压缩编码技术之 一。为了进一步提高g 7 2 9 压缩编码的压缩率和其他性能,i t u - t 推出了g 7 2 9 a 、 g 7 2 9 b 等附录,其中g 7 2 9 b 就使用了静音检测技术来提高压缩率。但是g 7 2 9 b 的静音检测算法太过复杂,不易于硬件实现,且在低信噪比环境下容易恶化, 所以在保证合成话音质量和不增加语音编码算法复杂度的前提下,使用有效的 多级静音检测技术来降低压缩编码速率,提高压缩率,这对促进语音压缩编码 技术的发展具有重要意义。 一l 一 四川大学硕士学位论文 1 2 国内外发展状况 1 2 1 语音编码技术 语音编码技术的研究开始于1 9 3 9 年荚国的h o m e rd u d l e y 发明声码器,而 在最近= 十年来语音编码取得了突飞猛进的发展。按照传统的观点,可以将语 音编码方法分为三类1 5 1 1 6 1 1 7 1 :波形编码o ”、参数编码( 声码器) 和混合编码。 波形编码即针对语音波形进行编码,尽可能重构包括背景噪声在内的模拟 波形,即恢复的语音信号基本上与输入的波形相同,由于波形编码器作用于所 有信号,因此会产生高质量的样值,具有适应能力强、算法简单、易于实现、 语音质量好等优点,然而,波形编码器工作在高比特率,他们在1 6 6 4 k b p s 的 数码率上能给出较高编码质量,当编码率进一步降低时,其性能会很快下降。 r r u - t 在1 9 7 2 年制定的6 4 k b p sg 7 1 1 标准( p c m ) 1 8 1 以及1 9 8 9 年制定的g ;7 2 6 ( a d p c m ) 1 0 1 标准都属于这一类编码器。 声码器不会再生原始波形,只是以语音信号产生的数学模型为基础,先对 语音信号进行分析,提取出其参数,对参数进行编码,这组参数被送到接收端, 在解码后由这些参数重新合成语音信号,这种编码方法称为语音信号的分析合 成方法。由于只对参数进行编码可以使用较少的比特数,所以这种方法具有编 码速率低的优点,但是在电话系统中话音质量不够好。美国政府1 9 8 0 年公布的 2 4 k b p s 线性预测编码算法l p c 1 0 就是采用这种方法,共振峰声码器、通道声 码器、余弦声码器都属于此类。 混合编码是上述两种方法的有机结合,它基于语音产生模型的假定并采用 了分析合成技术,但同时它又利用了语音时间的波形信息,增强了重建语音的 自然度,使得语音质量有明显提高,其代价是编码速率上升,一般在2 4 ,1 6 k b p s 之间,其中主要技术称之为“分析合成法【1 2 1 ”。根据这种方法进行编码的有1 9 8 2 年b s a t a l 和j r r e m d e 提出的多脉冲激励线性预测编码( m p l p c ) 1 3 1 1 w ,码 率在9 6 1 6 k b p s 范围内;1 9 8 5 年e d e d e p r e t t e r e 和p e t e rk r o o n 提出的规则脉 冲激励语音编码( r p e - l p c ) 1 3 1 1 4 】;1 9 8 5 年,m r s c h r o e d e r 和b s a t a l 提出的 码激励线性预测编码( c e l p ) l l ,在4 8 1 6 k b p s 范围内可获得质量相当高的 合成语音,闭环分析算法( l p a b s ) 从此成为主流。近年来c e l p 编码作为一 种优秀的中、低速率方案得到了很好的重视和研究,在降低复杂度、增强c e l p 四川大学硕士学位论文 性能、提高语音质量等方面取得了许多新的进展。c e l p 编码方案在4 1 6 k b s 速率上取得了很大成功,但是,当速率低于4 k b s 时,编码器性能会很快下降, 于是,在现代数字通信中,语音压缩编码的发展一直是在用尽可能低的数码率 获得尽可能好的合成语音质量的矛盾中发展的,如何用尽可能少的比特数来对 语音信号进行编码已越来越受到重视。这种编码方案目前主要有正弦变换 ( s t c ) 编码、多带激励( m b e ) 编码唧、波形内插( w i ) 编码、混合激励线 性预测( m e l p ) 编码等,而且在1 2 0 0 b s 以下的极低速率语音编码也有广泛的 应用前景。 随着因特网的发展,v o 口对语音压缩编码的需求十分迫切四【蜘。在h 3 2 3 系 列建议中规定了音频编解码算法符合i t u 标准嘲,如g 7 1 1 ( a 律或“律) 嘲、 g 7 2 3 1 、g 7 2 8 t 峋、g 7 2 9 a t l 8 等,表1 i 列出了删- t 制定的一些语音编码标准 协议及其参数。但问题在于语音数据在发送端的处理过于复杂会造成处理时延 过长、数据包在网上传送延迟时间太长( u - tg 1 9 2 建议环路延迟应保持在 3 0 0 m s 以下”7 ) 、网络带宽资源太小等都会影响v o 毋的使用。 g 7 2 9c s a c e l p t 4 1 是r r u - t 通过的最新的基于c e l p 的编码算法。它是由 加拿大s h e r b r o o k e 大学、法国电信、日本n n t 、美国a t & t 联合提出,称为“使 用共轭结构代数码激励线性预测的8 k b s 语音编码器”由于这一算法具有良好 的语音通信质量,低时延、适中的复杂度和对不同应用的适应性、并采用特殊 的码本结构简化码本查找,将成为今后主流的语音编码算法。 表1 1 语音编码标准 话音质量 编码速率 标准制定时间编码算法复杂性 时延( m s )( m o s 值 k b s 评分) g 7 1 11 9 7 26 4p c mlo 1 2 54 3 g 7 2 61 9 9 03 2a d p c m1 00 1 2 5 4 0 g 7 2 81 9 9 1 21 6u d c e l p5 00 6 2 54 0 g 7 2 91 9 9 68c s a c e l p3 01 5 4 o g 7 2 3 11 9 9 66 3 ,5 3a c e l p2 53 7 53 8 - 3 - 四川i 大学硕士学位论文 1 2 2 静音检测技术 静爵俭测技术,又称语音激活检测( v o i c ea c t i v i t yd e t e c t o r ,v a d ) ,是语 音数字处理技术的一种藿要技术| 2 a 1 1 7 3 1 7 “| 。研究表明正常语音通话过程中,对话是 不连续的,有效语音仅占整个通话时间的大约4 0 ,而其他等待或停顿等占了 对话过程的6 0 。静音检测技术通过采用各种算法检测出会话中的静音时间段, 并在这些时间段使用低比特率编码或者其他处理方式来减少发送数据,将静音 期间语音数据使用的网络带宽节省下来分配给其他应用数据流类型。静爵检测 技术在语音处理中应用广泛,可以用在语音识别中提高识别率1 2 7 1 ;在无线通讯 或者手持通讯设备中降低无话期间的设备功率,延长电池使用时间田i ;在语音 压缩编码中也可以利用静葺检测技术在不降低语音质量的前提下减少语音编码 率进而减少运行时间,改善算法的性能。 静音检测技术最初被研究用于t a s i 系统【御,后来才被用于语音识别、语聋 编码等技术中。静音检测技术的实质是提取出语音信号不同于噪声信号的特征 参数,并以此为依据在双方通话过程中检测出有效的语音片断 3 0 1 。研究人员提 出了多种静音检测算法,这些算法具有不同的时延、敏感度、精度和运算代价 等,适用于不同场合。最早期的静音检测算法是基于i t a k u r a 线性预测编码距离 测量m 1 ,后来又提出了基于能量水平、时序、基音检测和过零率等各种语音 特征参数的算法,倒谱特征1 3 2 1 、声音信号的自适应噪声模型0 3 1 、周期性测量嗍 和几何自适应能量门限等是新近应用于静葺检测的方法。 静音检测技术的关键是选取适当的特征参数来进行检测。在噪音环境下存 在一定技术困难:其一是背景噪声较大的环境下,即信噪比较低的时候,如何 检测出有效话音;其二是在有效话音与静音的转变过程中存在的一部分微弱话 音容易被剪切 3 7 1 ,在某些情况下可能造成接收端合成语音理解有困难。 由于语音和噪声的多样性,再加上语音环境复杂多变,使用单一的静音检 测算法的检测效果都不是i 常好,于是很多研究人员提出了多级检测方式鲫或 者将语音进行分段检测。8 1 1 3 9 等,目的都是为了在保证话音质量的同时尽量减少 数据率,以便使语音技术更好的应用于下一代网络1 4 1 1 1 4 2 1 。 一4 四川大学硕士学位论文 1 3 本文的主要工作 g 7 2 9 算法是中低速率语音压缩编码算法中最具应用前景的算法之一。经过 各种测试表明其带宽需求较小,仅为8 k b p s ;算法时延较短,只有1 5 m s ,并且 在8 k b p s 码率下的合成音质不低于3 2 k b p sa c p c m ,能达到长途通话性能要求 u o i 2 “,可以在y o l p 中使用。但是g 7 2 9 也有其缺点,g 7 2 9 是i t u t 推荐的语 音压缩编码的标准中算法最为复杂的一种,在硬件设备中实现比较困难;其数 据传输率固定,没有充分利用话音中的间隙,无法充分利用传输信道这些缺点 使得g 7 2 9 的应用受到限制g 7 2 9 b 采用了一种聚类模式识别方法进行话音活 动性检测,提高了语音压缩率,减少话音传输所需带宽,但是该算法非常复杂, 而且在信噪比低于1 0 d b 的环境中极易恶化。在分析研究g 7 2 9 算法和静音检测 技术的基础上提出了一种二级静音检测技术:第一级采用短时平均幅度差函数 检测,第二级采用短时平均过零率或者短时自相关函数检测。在实验室条件下 对基于m & z a 的二级检测算法进行了仿真测试,仿真结果说明该算法在不增 加g 7 2 9 算法复杂度和运算时延的基础上充分利用话音帧的特征参数来有效区 分话音和噪声,实现了在低信噪比条件下比g 7 2 9 b 更加有效的静音检测,提高 了g 7 2 9 语音压缩算法的压缩率。 本文的结构如下: 1 语音编码技术的发展概况。 2 i t u tg 7 2 9 编码方案的编解码原理。 3 静音检测技术的基本原理和g 7 2 9 b 使用的静音检测技术,多级静音检 测技术以及本文提出的基于m & 7 _ a 的二级检测算法的基本原理。 4 基于m & 7 j a 的二级静音检测算法,并在实验室条件下使用m a t l a b 对 二级静音检测算法进行仿真测试,分析仿真结果,并与g 7 2 9 b 的静音 检测算法进行比较,说明了基于m & t j a 的二级检测算法在低信噪比环 境下的静音检测比g 7 2 9 b 更加有效。 5 全文总结。 一5 一 四川大学硕七学位论文 第二章r r u 。tg 7 2 9 编解码原理 2 1 ( 2 7 2 9 概述 ( 3 7 2 9 是对电话带宽的语音信号编码的标准,对输入的模拟语音信号用 8 k h z 采样,1 6 b i t 线性p c m 量化。c s a c e l p 是基于码激励线性预测( c e l p ) 的编码模式,编码器处理1 0 m s 语音帧,对应于8 k h z 采样每8 0 个样点为一个 语音帧,对每个1 0 m s 帧进行分析并提取各种参数( 线性预测滤波器系数、自适 应码本和固定码本中码本序号、自适应码矢增益和固定码矢增益) ,把这些参数 编码发送。参数编码的比特分配表2 1 所示。 表2 18 k b sc s a c e l p 算法比特分配( 1 0 m s 帧) 参数码字子帧l子帧2 每帧总数 线谱对l ol ll 2 l 31 8 自适应码本时延 p l ,p 2 8 51 3 基音时延奇偶检验 p 0 1l 固定码本序号 c l ,c 2 1 31 32 6 固定码本符号 s i , s z 448 码本增益( 阶段1 ) g a s , g a 2 336 码本增益( 阶段2 ) g b l ,g b 2 448 总计 8 0 在解码端,把收到的比特流恢复成参数编码,解码后得到各个参数,用自 适应码矢序号从自适应码本中得到自适应码矢,用固定码矢序号从固定码本中 得到固定码矢,分别乘以它们的增益按点相加后构成激励序列。用线性预测滤 波器系数构成合成滤波器,用自适应码本方法实现长时或基音合成滤波,计算 出合成语音后,用后置滤波器进一步增强音质。 - - 6 - - 四川大学硕士学位论文 2 2 编码器原理 编码器原理见图2 1 ,输入信号先经过高通滤波预处理,预处理信号作为所 有后续分析的输入信号。每l o m s 帧作一次线性预测( l p ) 分析,计算l p 滤波 器系数,这些系数转换成线谱对( l s p ) 并用两级矢量量化方法量化为1 8 b i t 。 激励信号用综合分析搜索方法得到,在这一过程中原始信号和合成语音之间的 误差按照感觉加权最小为测度进行搜索,而感觉加权滤波器用未量化的l p 系数 构成。感觉加权的量采用自适应的方式,以保证输入信号的频率响应是平坦的, 从而提高编码器的性能。 2 2 1 预处理 崮未郾嘴流 图2 1c s - a c e l p 编码器的编码原理框图 输入1 6 b i t s 线性p c m 语音信号,预处理有两个功能:一是将输入样点值 都除2 以避免在处理中产生溢出;二是通过一个截止频率为1 4 0 h z 的高通滤波 器,增加信噪比,去掉不必要的低频成分。这两者结合起来,用日。( z ) 二阶极, 零点滤波器实现。 、0 4 6 3 6 3 7 1 8 0 9 2 7 2 4 7 0 5 z 一1 + 0 4 6 3 6 3 7 1 8 z 。2 爿“【2 j 2 西丽萌瓦而而面萨一 ( 2 1 ) - 7 - 四川大学硕士学位论文 经日。( z ) 滤波后的信号为j ( n ) ,在后面的处理中部用s ( ,1 ) 表示。 2 2 2 线性预测分析和量化 用1 0 阶l p 作短时分析,l p 合成滤波器定义为 士:0 1 1 ) _ _ ( 2 2 ) a ( z ) l + 五z 。 1 = 1 这里的函“= l ,1 0 ) 是量化线性预测系数,用3 0 m s 非对称窗加权s ( n ) ,求8 0 个样点( 1 0 m s ) 自相关系数,用l e v i n s o n 算法求l p 系数阎,然后转换为l s p 系数,在l s p 域量化和内插。 用l e v i n s o n d u b i n 算法求解l p 系数 上 将l p 系数转化 为l s p 系数 上 量化、内插l s p 系数 图2 2 线性分析和量化流程图 2 2 3 感觉加权与开环基音分析 感觉加权滤波器是基于未被量化的l s p 系数q 。 四川大学硕士学位论文 毗,= 糍= 筹 s , 其中托决定滤波器( z ) 的频响。适当调整这些值可以使加权更有效。利用 l e v i n s o n - d u b i n 求解中得到反射系数岛,将其转换为对数厩积比( l a r ) 系数q 。 d f = 培粼小l 2 ( 2 - 4 ) l a r 系数对应于当前l o m s 帧,用于第二子帧,第一子帧通过线性内插得 子帧l 钟= o 5 0 :+ 0 5 q ( 2 5 ) 子帧2 研2 ) - 研,i = l ,2 这个二阶预测器的谱包络特征或者是平( f l a t = 1 ) 或者是斜( f l a t = o ) ,每个子帧 的这个特征用l a r 的门限函数得到。如果子帧的内插频谱分类为平,那么加权 因子托= 0 9 4 ,托= 0 6 ;如果分类为斜,则托= 0 9 8 ,而托的值自适应于l p 合 成滤波器的谐振强度,其范围在0 4 到o 7 之间,如果出现强的谐振,则托的值 接近上界,根据当前子帧连续两个l s p 系数之间的最小距离准则达到自适应。 = m i l l + l q 】,f = l ,9 ( 2 6 ) 加权语音信号( 咒) 用于估计语音帧中的基音延时。 为减小最佳自适应码本延时的搜索的复杂度,由开环基音分析得到乙,搜 索范围限制在延时在乙附近。每l o m s 帧作一次,开环基音估计用加权语音信 号钆( 以) 。先找三个最大的自相关函数: r ( k ) = 毛( ) s 。( n - k ) ( 2 7 ) 四j i l 大学硕士学位论文 保留最大的r ( t ) ( f = l ,2 ,3 ) ,然后归一化: 砘) :百生 ( 2 8 ) ( s :( ,l 一) ) ”2 n = 0 按下面的算法确定最好的开环延时乙: 乙= r 7 ( 乙) = r ( t o i fr 7 ( 乞) o 8 5 r 7 ( 乙) 尺7 a 0 ) = ( f 2 ) 乙= f 2 e n d i f ( f 3 ) o 8 5 烈岛) r 7 ( 乙) = ( 岛) 乙= t 3 e n d 这个过程将延时范围分为三部分,有利于选较小的值,避免了基音的倍频。 2 2 4 脉冲嗣压和目标信号的计算 加权合成滤波器( z ) a ( z ) 的冲激响应 ( 玎) 用于自适应码本和固定码本的 搜壹。每l o m s 予帧计算一次, ( n ) 是由脉冲信号经过滤波器a ( z 托) 后,再经i 过】 )和laa(zy2a ( z y 2 ) 得到。 自适应码本搜索用的目标信号工( n ) 是从加权语音信号( n ) 中减去加权合 成滤波器( z ) a ( z ) = a ( z m ) a ( z ) a ( z 托) 的零输入响应,这些滤波器的初始 状态由滤波残差和激励信号的差来调整。残差信号r ( n ) 由下式给出: r ( n ) :j ( n ) 一1 04 j j ( ,l f ) 雄:o ,3 9 ( 2 - - 9 ) 四川大学硕士学位论文 2 2 5 自适应码本搜索 自适应码本参数足基音延迟和增益,使用的方法是基于加权均方误差最小 准则进行的闭环分析。在第一子帧中,在开环延时乙附近6 个样点搜索延时五; 对于第二子帧,在写附近去找最佳的延时瓦,搜索边界为一詈和f 。+ 。这 jj 里的。和f 一是由巧得到 闭环基音搜索的准则是使原始语音和重构语音之间的均方加权误差最小 化,即使r ( k ) 最大: 3 9 x ( n ) y k ( n ) r ( k ) = 1 产l 一( 2 - - 1 0 ) ( h ( n ) 儿o ) ) 班 y d n ) 是延时t 的过去滤波激励( 过去的激励与| i l ( 玎) 的卷积) 。 2 2 6 固定码本搜索 固定码本是代数码本结构,用正负号脉冲交错( i n t e r l e a v e ds i n g l e p u l s e p e r m u t a t i o n ,i s p p ) 设计,在这个码本中,每个码本矢量含有4 个非零脉冲, 每个脉冲的幅度或正或负,位置如表2 2 所示。 表2 2 固定码本c 的结构 脉冲符号位置 b& l m o 051 01 52 0 2 53 03 5 b墨 l ,鸭161 11 6 2 12 63 13 6 1 2 曼1 ,如2 71 2 1 7 2 2 2 73 23 7 鸭3 8 1 3 1 82 32 8 3 33 8 b焉 l 4 91 41 9 2 4 2 93 43 9 码本矢量。( 玎) 是由4 0 维零矢量,在4 个位置放上4 个单位脉冲并乘以对应 明川大学硕t 学位论文 的符号构成: c ( n ) = s o 万( n 一,) + 墨万( 肛一码) + 是占( 疗一7 他) + s 占( ,l 一,1 3 ) ,n = o ,3 9 ( 2 - - 1 1 ) 用加权输入语音) 和加权重构语音之间的均方误差最小化准则来搜索 固定码本中的码矢。其过程足目标信号x ( n ) 减去自适应码本的贡献: 工( ,1 ) = 工( ,1 ) 一g p y ( n ) ,站= 0 ,3 9 ( 2 - - 1 2 ) ) ,( ,1 ) 是经过滤波的自适应码书矢量,g 。是自适应码本增益。 2 2 7 增益的量化 自适应码本增益( 基音增益) 和固定码本增益用7 b i t s 的矢量量化。用原 始语音和重构语音之间的误差加权均方最小来搜索增益码本。 e = x x + 9 2 p y j ,+ 。2 z z 一2 9 p 工j ,- 2 9 。一z + 2 9 p g 。j ,z ( 2 一1 3 ) 这里的x 是目标矢量,j ,是滤波自适应码本矢量,z 是固定码本矢量与 ( n ) 的卷 积。 z ( ,z ) = c ( 洳( ,l f ) ,n - - 0 , ,3 9 ( 2 一1 4 ) m 固定码本增益以可以解释为 既2ygc(2-15) 这里的g c 是根据先前的固定码本能量得到的预测增益,y 是相关因子。 用两级共轭结构码本矢量量化自适应码本增益g ,和7 因子,第一级式 3 b i t s2 维码本g a ,第二级式4 b i t s2 维码本g b ,在每个码本里第一个元素 表示量化自适应码本增益宫,第二元素表示量化固定码本增益相关因子尹。如 果给出码本序号g a 和g b ,那么量化自适应码本增益为 害。= q ( g a ) + 够( g b ) ( 2 1 6 ) 量化固定码本增益为 雪。= g :尹= 占:( 1 3 如( g a ) + 1 5 岛( g 四) ) ( 2 - -

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论