(微电子学与固体电子学专业论文)针对g72x系列语音处理协议的专用dsp设计.pdf_第1页
(微电子学与固体电子学专业论文)针对g72x系列语音处理协议的专用dsp设计.pdf_第2页
(微电子学与固体电子学专业论文)针对g72x系列语音处理协议的专用dsp设计.pdf_第3页
(微电子学与固体电子学专业论文)针对g72x系列语音处理协议的专用dsp设计.pdf_第4页
(微电子学与固体电子学专业论文)针对g72x系列语音处理协议的专用dsp设计.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(微电子学与固体电子学专业论文)针对g72x系列语音处理协议的专用dsp设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着科技的发展,语音、图像、视频处理等在人民的日常生活中扮演着越来 越重要的角色。语音信号编码、解码处理技术在诸多方面得到了日益广泛地应用, 开发低成本、小型化的编解码产品成为多媒体应用领域研究的重点。 本文针对在语音编解码中应用较多的g 7 2 3 、g 7 2 8 和g 7 2 9 这三种协议( 合 称为g 7 2 x ) ,设计一个1 6 b i t s 定点专用数字信号处理器( d s p ) ,具有多协议处 理能力,以便在应用中能根据传输信道状况的变化而随意改变编码方式,从而获 得最佳的语音通信效果。 本文首先对广泛应用于g 7 2 x 协议中的线性预测分析( l p c ) 和码本激励线性 预测分析( c e l p ) 进行研究,并重点研究了g 7 2 8 协议的编解码原理。分析三种协 议的算法特点,提出一种优化的软硬件分工方法,为系统的软件和硬件实现提供 了理论依据。在介绍了g 7 2 8 协议的软件实现后,重点对针对g 7 2 x 系列协议的 专用d s p 的设计及其v l s i 实现进行介绍。 针对算法的特点,本文设计的专用d s p 拥有三条数据总线和三条数据地址 总线,配合三个辅助寄存器计算单元,可以在同一个时钟周期内读写三个数据, 这样的结构非常适用于l d - c e l p 等运算特点:同时需要从存储空间中取两个操作 数并写回运算结果到存储空间中。兼容t ic 5 4 的指令集,可以借助t i 的开发编 译环境,不需要另行开发编译器,缩短开发周期;针对算法中经常出现的对乘法 结果进行移位的运算,对传统的乘累加器进行改进,设计了乘累加移位器;针 对算法中出现的余弦及其反余弦运算,设计了专用的三角函数运算单元c d c ;针 对算法中出现的对数及其指数运算,采用线性近似的方法,并对算法进一步的优 化后,设计了专用的对数运算单元l o g 和指数运算单元a n t i l o g 。增加的运算单 元使得在t ic 5 4d s p 中需要多条指令完成的运算,本文介绍的专用d s p 使用一 条指令就可以完成,在保证精度的前提下,提高了运算速度。 在完成了专用d s p 的v l s i 设计后,对该处理器核进行了功能仿真和f p g 验证,最后用d e s i g nc o m p i l e r 工具,采用s m i co 1 8 的标准单元库对系统进行 综合,综合的时钟频率为4 0 m h z ,面积为7 6 5 3 6 4 等效门,增加的三个专用运算 单元占系统总面积的5 2 5 。与t ic 5 4d s p 相比,对于对数、指数、三角运算 及其对乘法结果移位的运算,本文介绍的专用d s p 能极大的提高运算速度,对 于g 7 2 8 协议的定点化编码程序,速度大约可以提高1 5 4 。 关键字:语音编解码,专用d s p ,运算单元,对数运算,指数运算,v l s i a b s t r a c t a b s t r a c t w i t l lt h ed e v e l o p m e n to ft h es c i e n c ea n dt e c h n o l o g y , t h es p e e c hc o d i n g , i m a g e p r o c e s s i n ga n dv i d e op r o c e s s i n gp l a ya m o r ea n dm o r ei m p o r t a n tr o l ei no u r d a i l yl i f e n 圮s p e e c hc o d i n gi si n c r e a s i n g l ya p p l i e dt om a n ya s p e c t s , a n di sav e r yi m p o r t a n t p a r to fm u l t i m e d i ad a t ap r o c e s s i n g w i t ht h ed e v e l o p m e n to fa l g o r i t h ma n d t e c h n o l o g yo fs p e e c hc o d i n g ,t h ed e s i g no fc o d i n gp r o d u c t sw i t hl o wp r i c ea n d v o l u m eb e c o m e $ a ni m p o r t a n tp a r to f t h ef i e l do f m u l t i m e d i aa p p l i c a t i o n t h i st h e s i si n t r o d u c e sas p e c i a ld s p ( d i g i t a ls i g n a lp r o c e s s o r ) w h i c hi ss p e c i f i ct o i m p l e m e n tg 7 2 3 ,g 7 2 8a n dg 7 2 9s p e e c hp r o t o c o l s ( t h e s et h r e es p e e c hc o d i n g p r o t o c o l sw i l lb cc a l l e dg 7 2 xi ng e n e r a lh e r e a f t e r ) ,w h i c ha l ew i d e l ya p p l i e di n s p e e c hc o d i n g 1 1 1 ed e s i g n e dd s p h a st h ea b i l i t yt op r o c e s sm o r et h a no n ep r o t o c o l , s oi tc a nc h a n g et h ee n c o d ep r o t o c o la c c o r d i n gt ot h es t a t eo fc o m m u n i c a t i o ne a s i l y , w h i c hm a k e st h es p e e c hc o m m u n i c a t i o nh a v i n gb e r e rq u a l i t y t l i st h e s i sf i r s tr e s e a r c h e st h el p c ( l i n e rp r e d i c t i o nc o d e ) a n dc e l p ( c o d e e x c i t a t i o nl i n e a rp r e d i c t i o n ) w h i c ha r ew i d e l ya p p l i e di ng 7 2 x , a n dt h e nf o c u s e so n t h eg 7 2 8s p e e c hc o d i n gp r o t o c 0 1 b a s e do nt h ec h a r a c t e r i s t i c so f t h e s et h r e ep r o t o c o l s , ad i v i s i o nm e t h o d o l o g yo fs o f t w a r ea n dh a r d w a r ei sp r o p o s e d , a n dt h i sd i v i s i o n p r o v i d e sat h e o r e t i c a l l yg i s t f o rb o t ht h es o f t w a r ea n dh a r d w a r ed e s i g n a f t e rt h e s o f t w a r ed e s i g nf o rg 7 2 8i si n t r o d u c e d ,t h i st h e s i sw i l lf o c u so ni n t r o d u c i n gt h e h a r d w a r e d e s i g no f t h e s p e c i a l d s pa n di t s v l s i ( v e r yl a r g e s c a l e i n t e g r a t e d c i r c u i t ) b a s e do nt h ec h a r a c t e r i s t i c so fa r i t h m e t i c ,t h es p e c i a ld s ph a st h r e ed a t ap a t h sa n d t h r e ea d d r e s sp a t h s ,w i t ht h r e ea u x i l i a r yr e g i s t e ra r i t h m e t i cu n i t s ,e n a b l i n gt h i sd s pt o r e a do rw r i t et h r e ed a t aa to n ec l o c kc y c l e t h i ss t r u c t u r ei sv e r ys u i t a b l ef o r l d - c e l pa r i t h m e t i c i nw h i c ht h ed s ph a st ol e t c ht w oo p e r a n d sf r o md a t am e m o r y a n dw r i t eb a c ko n er e s u l ti n t ot h em e m o r ya tt h es a m et i m e 1 1 ”i n s t r u c t i o no ft h e s p e c i a ld s p i sc o m p a t i b l ew i t ht ic 5 4 ,s oi tc a nu t i l i z et i sc o m p i l e ra n dn e o d n tt o e x p l o i ti t so w n t l l i st h e s i so p t i m i z e st h ec o n v e n t i o n a lm a c ( m u l t i p l i e r a d d e ru n i 0 a n d d e s i g n sam a s u ( m u l t i p l i e r a d d e r s h i f t e ru n i t ) f o r t h e c o m p u t a t i o no f m u l t i p l i c a t i o n - s h i f tw h i c ho c o l i sf i e q u e n f l yi nt h ea r i t h m e t i c as p e c i a lt r i g o n o m e t r i c f u n c t i o n a lc o m p o n e n t , c d c ,i sd e s i g n e df o rt h ec o s i n ea n da n t i - c o s i n ec o m p u t a t i o ni n t h ea r i t h m e t i c f l l r t h e r m o r e , t w os p e c i a lf u n c t i o n a lc o m p o n e n t sf o rl o g a r i t h m i ca n d a b s t m a a n t i l o g a r i t h m i cc o m p u t a t i o n a r e d e s i g n e d a f t e rt h e o p t i m i z a t i o n o fl i n e a r a p p r o x i m a t i o nf u n c t i o n a l lo ft h ea b o v e m e m i o n e ds p e c i a lf u n c t i o n a lc o m p o n e n t s r e a l i z e dt h el o g a r i t h m ,a n t i - l o g a r i t h ma n dt r i g o n o m e t r i cf u n c t i o nu s i n go n l yo n e i n s t r u c t i o n , w h i l et h et ic 5 4d s pn e e d sm o r et h a no l l e a tt h ep r e c o n d i t i o no f e n s u r i n gt h ep r e c i s i o n , i ti m p r o v e st h es p e e do f c o m p u t a t i o n a f t e rt h ec o m p l e m e n t a t i o no ft h ed s p sv l s id e s i g n ,t h i ss p e c i a ld s pi ss i m u l a t e d b ym o d e l s i ma n dv a l i d a t e db yu s i n gf p g a t h i sd e s i g ni ss y n t h e s i z e du s i n gd e s i g n c o m p i l e ra n ds m i co 1 8 u r ns t a n d a r dc m o sp r o c e s s t h ef r e q u e n c yo fs y n t h e s i si s 4 0m h z a n dt h ea r e ai s7 6 5 3 6 4c e i l s c o m p a r e d 、 ,i 也t ic 5 4d s p , t h i ss p e c i a ld s p i m p r o v e st h es p e e do fl o g a r i t h m ,a n t i - l o g a r i t h ma n dt r i g o n o m e t r i cc o m p u t a t i o n s g r e a t l y u s i n gt h ep r o p o s e dd s p , t h es p e e do fg 7 2 8e n c o d i n gf i x e d - p o i n t e dp r o g r a m i s1 5 4 g r e a t e rt h a nt h es p e e do f t h es a m ep r o g r a mn m n i n go nt ic 5 4d s e k e yw o r d s :s p e e c hc o d i n g ,s p e c i a ld s p ,f u n c t i o n a lc o m p o n e n t ,l o g a r i t h m i cc o m p u t a t i o n a n t i l o g a r i t h m i cc o m p u t a t i o n ,v l s i 论文独创性声明 本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文中除 了特别加以标注和致谢的地方外,不包含其他人或其它机构已经发表或撰写过的 研究成果。其他同志对本研究的启发和所做的贡献均已在论文中作了明确的声明 并表示了谢意。 作者签名:壶渣垫、日期:童q 豇:! :笪 论文使用授权声明 本人完全了解复旦大学有关保留、使用学位论文的规定,即:学校有权保留 送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内 容,可以采用影印、缩印或其它复制手段保存论文。保密的论文在解密后遵守此 规定。 作者签名:赶越导师签名:强嶙慨盘! 亟! 丛 第一章弓f 言 1 1 研究意义 第一章引言 随着科技的发展,语音、图像、视频处理等在人民的日常生活中扮演着越来 越重要的角色。对语音信号处理的方法,过去主要依靠模拟信号处理,现在越来 越多地使用数字信号处理技术了。数字化的语音在很多方面有优势:传输和存储 的信号质量高;易于使用纠错编码技术提高信号抗干扰能力;易于使用加密技术 提高保密性。这些优势使得数字化的音频处理在信息处理领域占据重要的地位。 但是,信号数字化后也带来了一些问题,如需要大容量的存储空间、大的传输带 宽等。在信号传输时,数字化后需要的信号传输带宽为模拟信道的3 5 倍,所以 包括音频数据在内的多媒体信号压缩处理技术就显得很重要。语音信号编码、解 码处理技术在窄带电话通讯、会议电视、高清晰度电视、i n t e r n e t 语音处理、 v o i p ( v o i c e o v e l n t c m c t p r o t o c 0 1 ) 【l 】等诸多方面得到了日益广泛地应用,是多媒 体数据压缩中非常重要的一部分。随着算法和编解码技术的发展,开发低成本、 小型化的音频编解码产品成为多媒体应用领域研究的重点。 数字信号处理( d s p ,d i g i t a ls i g n a lp r o c e s s i n g ) 和超大规模集成电路( v l s i , v e r yl a r g es c a l ei n t e g r a t e d ) 技术的发展使得各种复杂的音频编解码算法的 实现成为可能,使得各种实时的、低成本的数字语音压缩解压处理成为可能。 对于不同的语音处理算法,若按照算法的处理流程,完全用硬件来实现,则硬件 开销大,且每种算法对应一种硬件,缺乏灵活性。若全部用软件来实现,则部分 复杂的算法的实现难以满足实时性的要求。因此,设计合理的语音处理系统成为 当前多媒体和信息处理领域的重要课题。根据语音处理算法的特点,软硬件结合 的实现方法可以获得更好的性价比,是一种十分有效的设计方法。 语音信号编码解压处理的研究是多媒体数据压缩中非常重要的一部分。近 年来,国际国内都积极地建立语音编解码标准,这些标准对通信系统、企业和消 费者都产生了很大的影响。在众多的音频压缩标准中,i t u i 制定的标准成为很 多多媒体产品所遵循的规范。下面将对i t u - i 提出的一些语音编解码标准进行简 单的介绍。 i t u - i 确定的6 4 k b i t sp c m 的语音编码g 7 1 1 脚协议已极为广泛地应用于数 字通信、数字交换机以及一切语音数字化接口。 i t u i 确定的3 2 k b i t sa d p c m 语音编码g 7 2 2 “协议拥有与p c m 相同的重 建语音质量,但具有比p c m 更优良的抗误码性能,已逐渐广泛用于卫星、海缆及 第一章引言 数字语音插空设备以及可变速率编码器中。a d p c m 算法适应于可变速率的应用, 在1 6 k b i t s 到6 4 k b i t s 的速率范围内,重建语音质量稳定。 i t u i 确定的1 6 k b i t s 的低延迟激励线性预测( l d - c e l p ) 语音编码g 7 2 8 ” 协议,其算法特点是将语音短时谱预测与长时谱预测、增益因子预测等参数通过 后向预测计算来实现,而不是从输入语音中直接提取,g 7 2 8 通过只传送码本序 号来压缩传输比特率。它的激励矢量采用分析综合方法优化,5 个样本为一组。 因此,5 个样本就是基本延迟,即5 x1 2 5 u s = 0 6 2 5 m s ,远优于i t u - i 原来的要 求( 5 m s ) ,达到进入公众通信网的要求。i t u i 建议l d c e l p 的应用领域如下: 可视电话的伴音、无绳电话机、单路单载波卫星和海事卫星通信、数字插空设备、 存储和转发系统、话音信息录音、数字移动无线系统等。 i t u i 确定的“共扼结构代数码激励线性预测的8 k b i t s 语音编码”( 简称 为c s - a c e l p ) 协议g 7 2 9 嘲,它的编码基于码本激励线性预测( c e l p ) 编码模型, 通过对语音信号的分析,提取c e l p 模型的参数( l p c 系数、自适应码本和固定 码本系数和增益因子) ,所有这些参数被编码后传送。解码时,使用这些参数来 重建语音信号,重建语音质量为m o s3 9 分。8 k b i t s 语音编码主要应用于个人 移动通信、i p 语音、低c n 数字卫星系统,包括陆地移动卫星通信、海事卫星 通信、一般航空卫星通信、稀路由和s c p c 卫星通信系统、高质量移动无线通信 ( 包括d c m e 、存储、检索、分组语音和数字租用信道) 等。 语音编码器采用的编解码协议主要包括:g 7 2 9 ,它能以市话( 或长途电话) 的品质在低于8 k p s 的速率上编码语音信号:g 7 2 2 ,它能以自适应差分脉冲编码 调变( a d p c m ) 方案在4 $ k b p s 、5 6 k b p s 及6 4 k b p s 速率上对7 k h z 带宽的语音信 号进行编码;g 7 2 3 n ,能在6 3 k b p s 和5 2 k b p s 两种码率下工作,且能够在两种 速率问迸行转换;g 7 2 8 。能以低延时在1 6 k b p s 速率上对语音信号进行编码。 在选择编码方式上,人们通常考虑语音的质量、编码的复杂度、比特率这三 个因素啊。高比特率自然会带来好的语音质量,但也会占用大量的存储空间和更 多的系统处理资源。不过,低比特率下获得好的语音质量则需要较高复杂度的编 码方式,或者用较高比特率的代价来稍微降低编码的复杂度。语音编码器必须在 语音品质和比特率之间进行折中,实际运用的理想语音编译码器应该可以根据传 输信道的状态( 带宽、q o s 等) 变化而改变编码方式综合考虑上述因素及其各种 语音编解码协议的应用范围,本文选择g 7 2 3 、g 7 2 8 和g 7 2 9 这三种协议( 合 称为g 7 2 x ) ,并针对这三种协议设计一个称为g d s p 专用d s p 。其初衷在于期望 该专用d s p 具有多协议处理能力、支持多种控制方式,以便能在应用中根据传输 信道状况的变化而改变编码方式,从而获得最佳的语音通信效果,也可以基于不 同的协议系统,可以构建不同的应用系统。 2 第一章引言 1 2 本论文的结构 在本论文中,将对针对g 7 2 3 、g 7 2 8 和g 7 2 9 三种协议的实时编解码处理 的v l s i 系统的d s p 设计进行相关研究,首先将对算法进行研究分析,再设计一 个专用的d s p 处理器。 本论文组织如下: 第一章简要介绍了本论文的研究背景及其意义。 第二章在介绍了线性预测分析和码本激励线性预测分析后,以g 7 2 8 协议为 例介绍了语音编解码原理,并提出了一个软硬件划分的方案。 第三章简要介绍了t i 的c c s 编译器的特点和g 7 2 8 协议的定点化编码程序 的实现。 第四章介绍了针对g 系列语音处理协议的专用定点d s p 的框架、流水线结 构、寻址方式、指令集及译码单元的设计和运算单元的设计。 第五章介绍了专用d s p 的译码单元的设计及其实现,和针对f i 7 2 x 系列协 议的算法特点而设计的专用运算单元及其v l s i 实现。重点介绍了三个专用的运 算单元:乘、累加、移位器、三角函数运算单元和对数、指数运算单元,分别对其算 法的优化、硬件的实现和验证等方面进行详细的介绍。 第六章介绍专用d s p 处理器的功能仿真、f p g a 验证及其与t ic 5 4d s p 的 性能比较的结果、 第七章对全文进行了总结,并给出进一步工作的建议。 最后是参考文献、攻读硕士学位期间参与的项目、攻读硕士学位期间发表的 文章和致谢。 第二章c a 7 2 x 系列语音处理编解码标准 第二章g 7 2 x 系列语音处理编解码标准 g 7 2 3 、g 7 2 8 和g 7 2 9 三种协议都以线性预测编码为基础,采用了线性预 测分析 l i n e rp r e d i c t i o nc o d e ) 和码本激励线性技术( c o d ee x c i t a t i o nl i n e a r p r e d i c t i o n ) 。一般来说,标准都写得尽量简明扼要,而把背景知识,如方法的选 择、参数的选取放在附属文件中,所以需要查阅、消化许多背景文献。在下面的 章节中,将介绍在g 7 2 x 中广泛运用的线性预测分析和码本激励线性预测技术, 并选择较典型的g 7 2 8 协议为例对语音信号的编解码原理进行介绍。 2 1 语音信号的线性预测分析( l p c ) 线性预测分析是进行语音信号分析最有效、最流行的分析技术之一,在数据 数率为2 4 4 8 k b p s 之间时可获得清晰的语音。它的重要性在于:提供了一组 能较精确她表征语音信号的频谱幅度的模型参数,而分析这些参数所需的运算量 相对来讲却并不大。应用这组模型参数可以降低对语音信号进行编码时的数码 率。将l p c 参数形成模板存储,在语音识别中也可以提高识别率和减少计算时间。 此外,这种参数还可以用来有效地实现语音合成。 线性预测模型御如下图所示,假设当前语音样本能由过去语音样本与驱动项 加权求和来表示: 图2 1 线性预测模型 卫 s ( k ) = a , s ( k f ) + g j ( 豇) 式中。敏) 代表语音样本,数列a 。( i = l ,2 ,3 ,。n ) 是预测系数,n 是预测 器序号,g w ( k ) 是驱动项或者q 做第k 瞬时的输入。清音的白噪声和浊音的准周 期性脉冲都是驱动项。 在n 选定后,线性预测编码计算预测器系数和驱动项增益g 、计算相关的系 数,再将信息传到接收端,在接收端进行语音重组。下面将详细介绍l p c 的各个 组成部分。 4 第二章g 7 2 x 系列语音处理编解码标准 2 1 1 系数的计算 预测系数的选择标准是使语音信号与预测值之间的均方差达到最小,预测值 为: s ( k l k - 1 ) = a , s ( k f ) 因此。需要使下式取最小值 mmk 占= 古 s ( k ) - s ( k i 七一1 ) 】2 = 古 s k ) - y a , s ( k f ) 】2 k - ik - i,- l 该式可以进行一定转换后,用自相关函数来解出预测器系数。 2 1 2 基音周期估计 基音周期估计是l p c 分析与合成中两个最棘手的问题之一,它的长度决定了 以何种时间间隔来激励接收端的语音何处滤波器。精确、实时的基音周期是合成 高品质清晰语音的关键。 基音周期估计的方法很多,在时域,有基于短时自相关函数的方法和基于短 时平均幅度差的方法;在频域,有基于同态信号处理和线性预测编码的算法。后 两种算法所估计出的基音周期精度高,稳定性好,但算法复杂。因此本文采用前 者,下面将首先简单的介绍语音信号的短时处理方法,然后将重点介绍其中的两 种常用的处理方法:基于短时自相关函数的基因周期估计和基于短时平均幅度差 函数的基音周期估计。 ( 1 ) 语音信号的短时处理方法 语音信号的特性随时间缓慢变化,可以将其分成相续的短段来处理,每段语 音长为l o 2 0 m s ,称为一帧,相邻的帧之间可以有部分重叠。这相当于对语音 信号进行加窗处理,如s ( n ) 表示语音信号,w ( r 1 ) 表示窗函数,加窗语音则为 = s ( 强) ,( 力。对每段加窗语音进行处理就等效于对固定特性的连续语音进行处 理。在时域算法中,基音估计通常通过计算该段语音的自相关函数,或平均幅度 差函数( a m d fa v e r a g em a g n i t u d ed i f f e r e n c ef u n c t i o n ) 。所得结果分别称为 短时自相关函数、短时平均幅度差函数、短时能量等,这些都是语音信号的短时 处理方法。下面将介绍基于短时自相关函数的基音周期估计和基于短时平均幅度 差函数的基音周期估计。 ( 2 ) 基于短时自相关函数的基音周期估计 语音信号的短时自相关函数在基音周期的各个整数倍点上有很大的峰值,因 而只要找到第一个最大峰值点的位置,并计算出它与零点的间隔,便能估计出基 第二章g 7 2 x 系列语音处理编解码标准 音周期,这就是基于短时自相关函数的基音周期估计的原理。设s ( n ) 为语音信 号,w ( n 1 是一段加窗语音信号,窗长为n ,它的短时自相关函数的计算公式是: x o ) = + 以孵) j ( 疗+ 1 ) 当0 n n l 时,其计算量为n ( n + 1 ) 2 次乘法和加法运算。 实际应用中,有时第一最大峰值点的位置不能与基音周期相吻合,这主要是 一下两点引起:1 ) 窗的长度不够长。一般认为窗长至少应大于两个基音周期, 才能有比较好的效果。2 ) 声道的共振峰特性造成的干扰,即声道特性的影响, 它可以通过滤波来减少共振峰的影响,或先对语音信号进行非线性变化,再求自 相关函数来估计基音周期来解决。 ( 3 ) 基于短时平均幅度差函数的基音周期估计 语音信号的短时平均幅度差函数( a d m f ) 定义如下: e ( _ i ) = i 鼠( m + i ) 一最( 所) l 对于周期性的浊音信号,r ( k ) 表现出与语音信号相一致的周期特性,不过 r ( k ) 在周期的各个整数倍点上具有谷值特性,因而可以通过f n ( k ) 的计算来确定 基音周期。对于清音信号,r ( k ) 没有这种周期特性。因此,利用这种特性,可 以估计出浊音语音的基音周期,也可以分辨浊音和清音。 平均幅度差函数法不需要乘法运算,其算法复杂度较小。另外,在基音周期 处,短时平均幅度差的谷点比自相关函数的峰点的锐度更尖锐,因此估值精度更 高。但是,短时平均幅度差对语音信号幅度的快速变化比较敏感,它影响估计的 精度。 2 1 3 激励增益 根据前一基因周期的能量是转化到新的基因周期还是被抑制了。计算接收器 的增益有两种方法。 在将前一基音周期的能量转换到新的基音周期中的情况下,接收器输入放大 的增益在每个基音周期都从新的均方跟和新的预测器系数中计算出来。这样,输 出语音能量在同一语音片段内就等于输入的语音能量。 如果前一个基音周期的剩余能量被抑制了。对于浊音,增益的计算公式如下: g = _ ( ,( 0 ) 芝q r ( f 舻 m 对于清音,增益的计算公式如下: n g = 【r ( o ) 一口,尺( 纠i f 6 第二章g 7 2 x 系列语音处理编解码标准 其中p 为基因周期的样本数。 2 2 码激励线性预测编码( c e l p ) 码激励线性预测编码在9 6 k b p s 以下速率的语音编码中广泛应用,其目的是 将多脉冲l p c 中使用的分析一综合方法扩展到低比特率范围,其指导思想是用有 限数量的存储序列替代多脉冲激励“1 。 c e l p 按帧作l p c 分析,分帧的帧长为2 0 3 0 m s ,采用合成分析搜索、知觉 加权、矢量量化、线性预测等技术,用l p c 参数构造合成滤波器。c e l p 建立两 个码本,一个叫做自适应码本,其中码字用来逼近语音的长时周期性( 基音) 结 构,另一个叫固定码本或随机码本,其码字用来逼近语音经过短时、长时预测后 的残差信号。其中,固定码本是原来就设计好的,而自适应码本是在分析一合成 的过程中不断更新的。从两个码本中搜索出最佳码本,乘以各自的最佳增益后相 加,其和为c e l p 激励信号源。将激励信号输入一个合成滤波器,得到合成语音 j ( ”) 。合成语音j ( 功与原始语音s ( 1 3 ) 之间的差经过知觉加权滤波器,得到知觉 加权误差,根据最小均方误差准则作为搜索最佳码本及其幅度增益的量度,使得 最小均方误差值最小的码矢量即为最佳。 2 3 g 7 2 8 语音处理协议概述 g 7 2 8 语音处理协议是基于码本激励线性预测编码模型( c e l p ) ,编码延时 为0 6 2 5 m s ,重建的语音质量达到m o s 4 0 ,主要应用在h 3 2 3 视频会议系统中音 频编码、移动通讯、d c m e 等场合“1 。 它具有如下的特点: ( 1 ) 为了满足低延迟的要求,只传输激励序列,编码器参数都用一个反馈适 应的算法通过对先前已经量化的语音进行计算,不存在附加信息。 ( 2 ) 编码器中没有基音预测器,它的作用包含在一个5 0 阶的短时预测器中, 保证了系统的鲁棒性。 ( 3 ) l p c 分析窗采用混合窗,前半部分由正弦函数构成非递归部分,后半部 分由指数函数构成递归部分,有利于实时实现。 “) 为了降低码本搜索时的计算量,g 7 2 8 的固定码本由7 b i t s 的波形码本 和3 b i t s 的波形码本组合构成。 下面将分别对g 7 2 8 语音处理协议的编解码部分进行详细的介绍。 7 第二章g 7 2 x 系列语音处理编解码标准 2 3 1g 7 2 8 语音处理标准的编码器 图2 2 g 7 2 8 编码器 如图2 2 所示,g 7 2 8 的编码器首先将速率为6 4 k b s 的a 律或者u 律p c m 输入信号转换成均匀量化的p c m 信号,接着把五个连续的语音样本组成一个5 维语音矢量。对于每个输入语音矢量,编码器利用分析一合成分析法从码本中搜 索出最佳激励码矢量,然后将1 0 b i t s 的码本序号发送出去。从图中可以看出, 其中的线性预测系数是用先前合成的( 已经量化过的) 语音信号来提取和更新的。 每4 个相邻的输入矢量( 2 0 个样点) 构成一个自适应周期,或称为帧,每帧更新 一次线性预测系数。激励的增益也是利用先前量化激励信号的增益信号逐矢量地 进行提取和更新的,激励码本中共有1 0 2 4 个5 维的码矢量。 下面将依次对g 7 2 8 的解码过程进行介绍。 ( 1 ) 加窗 信号在进行线性预测分析、综合和知觉加权滤波之前,都需要进行加窗处 理。在g 7 2 8 中,使用前半部分用正弦函数构成非递归部分,后半部分用指数函 数构成递归部分的混合窗( h y b r i dw i n d o w ) 。 ( 2 ) 知觉加权滤波器 在g 7 2 8 中,知觉加权滤波器是一个1 0 阶的零极点滤波器,它的传递函数 如下所示。 瞰) :黑,o 五 l 口l 夕 j 式中,k = o 9 ,九:= 0 6 。因知觉加权滤波器只用于编码器,所以它用于输 入语音,每帧更新一次,在第三个矢量处更新。 ( 3 ) 综合滤波器 在g 7 2 8 中,综合滤波器是一个5 0 阶的全极点滤波器,它的输入是经过增 益调整的激励矢量e ( n - 1 ) ,e ( n 一2 ) ,输出是合成语音信号。它的传递函数如 第二章g 7 2 x 系列语音处理编解码标准 下: h ( z ) = # 一 l 一q , 预测系数a 。由后向预测适配器提取,其更新过程同知觉加权滤波器。 ( 4 ) 后向预测适配器 它是一个5 0 阶的线性预测器,传递函数如下所示: 晒:妻知, 它的输入信号是该帧以前的合成语音,采用的混合窗函数的参数是 1 = 2 0 ,n = 3 5 ,a = o 9 9 2 8 3 3 7 4 9 。用l e v i n s o n - o u r b i n 递推算法计算预测系数西 ( i = l ,2 ,5 0 ) 。将m 与带宽扩展因子九( x = 2 5 3 2 5 6 ) 的i 阶指数”相乘, 得到综合器的预测系数a 。: 珥= 刀讲,i = 1 ,2 ,5 0 它的更新周期是4 个矢量,更新时刻比综合滤波器迟2 个矢量。 经带宽扩展后,修正l p c 预测器传递函数为: 5 0 ,( z ) = q z 。 修正系数供给综合滤波器,同时供给脉冲响应矢量计算。这里,合成滤波器 传递函数即公式为: 1 ,( z ) 2 日( 2 ) 2 高茜 ( 5 ) 后向矢量增益适配器 后向矢量增益适配器是逐矢量更新激励增益,它的输入是经过增益调整的激 励矢量e ( n ) ,输出是激励增益,它基于e ( n 一1 ) ,e ( n - 2 ) ,在对数域的增益, 利用一个1 0 阶线性预测器来预测e ( n ) 的增益。后向矢量增益适配器的工作过程 的大体如下:e ( n ) 经过一个矢量延时,得到e ( n 一1 ) 。对e ( n - 1 ) 的均方跟值( r m s ) 取以1 0 为底的对数,再乘以2 0 得到d b 值,然后减去对数增益偏置值3 2 d b ( 当 浊音时的大约平均激励增益电平) ,得到对数增益。将对数增益输入到参数 1 = 4 ,n = 2 0 ,a - ( 3 4 ) 1 8 的混合窗,然后利用l i v e n s o n d u r b i n 解法递推计算1 0 阶l p 预测系数a i ( i = 1 ,2 ,1 0 ) 。将预测系数与带宽扩展因子的i 阶指 数相乘,得到预测系数a 。,用于对数域线性预测器得到的预测值万( 撑) 如下: 1 0 万( 行) = a8 ( n - i ) 9 第二章g 7 2 x 系列语音处理编解码标准 式中的预测系数每4 个语音矢量更新一次,在第2 个语音矢量处更新。得到 预测值后,加上对数增益偏置值( 3 2 d b ) ,经限幅器控制增益在o 6 0 d b 之间, 经反对数变换及其平滑,最后得到激励增益。 ( 6 ) 码本搜索方法 在g 7 2 8 中,激励v q 码本有1 0 2 4 个码本,其中最接近输入语音矢量的最佳 码本的序号是系统要传送的。 为了减少码本搜索复杂度,把l o b i t s 编码、1 0 2 4 个码本分解为两个部分。 其中前7 b i t s 的波形码本,含1 2 8 个独立的码矢;后3 b i t s 的增益码本,为8 个以零为对称的标量量化值。输出的序号所对应的码矢是最佳波形码失与最佳增 益电平的乘积。 把综合滤波器f ( z ) 和知觉加权滤波器w ( z ) 级联起来,即h ( z ) = f ( z ) w ( z ) , 当前激励增益艿( 行) 和1 0 2 4 个激励矢量一次一个的通过日( z ) ,而每次要求滤波器 的存储器初始化为零。 如果用y ,表示第j 个码矢量,g 。表示第i 个增益电平, h ( n ) 是级联滤波器 的脉冲响应,那么对于指定的序号i 和j 码失,级联滤波器的输出可表示为: 工= h s ( n ) g ,y i 码本搜索就是寻找序号i 和j 的最佳组合,它使失真d 的均方误差最小。 d : i “甩) 一x f0 2 = 占2 ( ,o i i 工( 以) 一g , h y , j 1 2 ( 7 ) 性能 g 7 2 8 采用混合窗的l d - c e l p ,在1 6 k b s 的速率上, a o s 分可达到4 1 7 3 , 编码延时小,以其优良的性能,全面达到了i u t i 的要求。 2 3 2g 7 2 8 语音处理协议的解码器 解码操作也是逐矢量地进行,如详细处理过程如图2 3 所示。根据接收到的 l o b i t s 码本序号,首先从激励码本中找到相应的激励矢量,经过增益调整后, 得到激励信号将激励信号输入综合滤波器,合成语音信号,再将合成语音信号 进行自适应后置滤波器,以增强语音的主观感觉质量。最后转换为需要的p c m ( u 率或a 率) 格式输出。 图2 3 q 7 2 8 解码器 1 0 第二章g 7 2 x 系列语音处理编解码标准 解码中的增益、综合滤波器、后向增益适配器和后向预测适配器与编码中的 相应模块相同。其中的后置滤波器的作用是增强解码语音的主观感觉质量,它的 三个主要部分为:长时后置滤波器、短时后置滤波器和输出增益调整单元。下面 将对这三部分分另q 进行详细介绍。 ( i ) 长时后置滤波器 长时后置滤波器是一个具有谱峰值在基频倍数上的梳状滤波器,其传输函数 为: 目( :) = 岛( 1 + 舷”) 式中p 是基音周期。从解码信号中检测出基音周期,并计算一阶预测系数, 即可得到长时后置滤波器的系数b ,g ;。 j 0 , 1 l “1 + 6 基音周期、长时后置滤波器系数每帧更新一次,在第三个矢量处更新。 ( 2 ) 短时后置滤波器 短时后置滤波器是由一个1 0 阶零极点滤波器与一个1 阶零点滤波器级联而 成的。l o 阶零极点滤波器的作用是衰减共振峰之间的频率分量,1 阶零点滤波器 的作用是补偿由1 0 阶零极点滤波器引起的频谱倾斜。 短时后置滤波器的传递函数只( z ) 如下所示。 皿= 筹( 1 + o 1 5 q z - 1 ) 滤波器系数每帧更新一次,在第一个矢量处更新。 ( 3 ) 输出增益调整单元 为了防止后置滤波器引起大幅度的增益偏移,在g 7 2 8 中采用了一个自动 增益控制单元,使经过后置滤波器的语音能量与未经过后置滤波器的语音能量大 致相同。 在g 7 2 8 中,逐帧对经过后置滤波器的语音和未经过后置滤波器的语音各自 的绝对值求和,将其结果在校正因子计算器中相除,逐个矢量输出校正因子。因 为后置滤波器的解码语音要逐点调整,为了防止“台阶”效应,让校正因子经过 一个一阶低通滤波器进行平滑。 第二章g 7 2 x 系列语音处理编解码标准 2 4 软硬件的划分 本文设计的d s p 主要是针对g 7 2 9 ,g 7 2 8 ,g 7 2 3 这三种协议,对三种协议 的算法进行详细分析归纳

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论