




已阅读5页,还剩59页未读, 继续免费阅读
(微电子学与固体电子学专业论文)基于fpga的ldcelp语音编解码器设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
哈尔滨理t 人学丁学形! i j 学位论义 基于f p g a 的l d c e l p 语音编解码器设计 摘要 l d c e l p ( l o wd e l a y c o d ee x c i t e dl i n e a rp r e d i c t i o n ) 语音编码技术 是i t u t 1 9 9 2 年颁布的低延迟语音编码标准,其单向编码延迟小于2 m s , 主观评价m o s 分为4 o 。该标准采用向后自适应技术。其指标参数达到了 进入公众通信网的要求。该标准被广泛应用于数字卫星系统、数字线路倍增 设备( d c m e ) 、综合业务数字网( i s d n ) 、公共交换电话网( p s t n ) 、话音存储 转发系统等领域。 本文对l d c e l p 语音编解码算法进行研究,根据该标准算法特点,设 计编码器硬件的体系构架。语音编解码算法中的运算功能由内嵌d s p 软核 完成,编解码输入输出部分由专门的输入输出控制模块处理并缓存,编解码 过程中的常数存储在常数r o m 中,中间变量存储在片上s r a m 中。软件 设计方面,采用d s p 嵌入软件代码实现运算部分的功能,嵌入软件通过编 写汇编代码实现。汇编代码通过专用编译器被编译成二进制指令集,并最终 存储在程序r o m 中。 本文基于n c v e r i l o g 和s i m v i s i o n 仿真软件进行软硬件的协同仿 真,仿真输入采用i t u 标准测试向量,仿真产生的波形验证了本设计功能 的正确性。将上述设计下载到f p g a 开发系统,完成f p g a 上最终功能的 实现。本设计共包含2 0 k 逻辑门,1 0 k 片上r o m ,l o k 片上s r a m ,工作 频率小于3 0 m h z 。所采用的f p g a 为x i l i n x 公司s p a t r a ni i i 系列产品 中的x c 3 s 1 0 0 0 芯片,此芯片拥有1 0 0 万系统门,1 7 2 8 0 个逻辑单元。最后 通过在f p g a 外部添加一些外围电路对f p g a 中下载的编解码器电路进行 验证,实验结果表明本设计完全符合i t u t 的各项技术指标。 关键词l d c e l p ;编码器;解码器;f p g a 哈尔滨理丁人学t 学硕i j 学位论文 t h e d e s i g no fl d c e l ps p e e c hc o d e r b a s e do nf p g a a b s t r a c t l d c e l p ,al o w d e l a ys p e e c hc o d i n gt e c h n o l o g y ,w a sp r o m u l g a t e db y i t u ti n1 9 9 2 t h i st e c h n o l o g yu s i n gb a c k w a r da d a p t a t i o n st oa c h i e v et h eo n e w a yd e l a yl e s st h a n2m s i t sm o ss c o r e so fs u b i e c t i v ee v a l u a t i o ni s4 0 t h e c o d e rp a r a m e t e r sm e e t st h ep u b l i cc o m m u n i c a t i o n sn e t w o r kr e q u i r e m e n t s t h e s t a n d a r di sw i d e l yu s e di nd i g i t a ls a t e l l i t es y s t e m s ,d i g i t a lc i r c u i tm u l t i p l i c a t i o n e q u i p m e n t ( d c m e ) ,i n t e g r a t e ds e r v i c e sd i g i t a ln e t w o r k ( i s d n ) ,p u b l i cs w i t c h e d t e l e p h o n en e t w o r k ( p s t n ) ,v o i c es t o r e - a n d f o r w a r ds y s t e m s ,a n do t h e rf i e l d s t h ea l g o r i t h mo ft h el d - c e l pc o d e rw a ss t u d i e df i r s t 。a n dt h e n t h e h a r d w a r ea r c h i t e c t u r ew a sd e s i g n e d t h ep r o c e s s i n go fc o d e rw a sc o m p l e t e db y a ne m b e d d e dd s pi pc o r e t h ei n p u ta n do u t p u tm o d u l ep r o c e s s i n ga n dc a c h et h e i n p u ta n do u t p u to ft h ec o d e r t h ec o n s t a n ti nt h ep r o c e s ss t o r e di nt h ec o n s t a n t r o m 。w h i l et h ei n t e r m e d i a t ev a r i a b l e ss t o r e di ns r a m a b o u tt h es o f t w a r e d e s i g n ,t h eo p e r a t i o nd e t e r m i n e db yt h ee m b e d d e dc o d e sw r o t ei n “a s s e m b l e l i k e ”l a n g u a g e as p e c i f i cc o m p l i e rt r a n s l a t e dt h ee m b e d d e dc o d e st ob i n a r y i n s t r u c t i o n s w h i c hu l t i m a t e l ys t o r e di np r o g r a mr o m t h eh a r d w a r ea n ds o f t w a r ec o s i m u l a t i o na p p r o v e dt h ef u n c t i o no ft h el d c e l pc o d e rb yn c v e r i l o ga n ds i m v i s i o nu s i n gi t u ts t a n d a r dt e s t v e c t o r sa si n p u ts i g n a l s f i n a l l y , t h ed e s i g nw a sd o w i l l o a d e dt ot h ef p g a s y s t e m , f i n i s h e dt h ef u n c t i o ni m p l e m e n t a t i o no n 踟a t h ed e s i g no n l yi n c l u d e s2 0k l o g i cg a t e s ,10kr o ma n d10 ks r a m t h ew o r k i n gf r e q u e n c yi sl e s st h a n3 0 m h z t h ef p g a c h i pu s e dx i l i n xx c 3 s lo o ow h i c hc o n t a i n slm i l l i o nl o g i c g a t e sa n dl7 2 8 0l o g i cu n i t s t h ev e r i f i c a t i o no ft h ec i r c u i t si nf p g an e e ds o m e a c c e s s i o n a lc i r c u i tc o n n e c t e dt oi t t h et e s tr e s u l ti n d i c a t e dt h ed e s i g nf u l f i l l e d t h ea p p l i c a t i o n k e y w o r d sl d c e l p ;e n c o d e r ;d e c o d e r ;f p g a n 哈尔滨理t 人学t 学硕l j 学位论文 第1 章绪论 1 1 本课题研究目的和意义 近年来,随着人类社会信息化进程的加快,语音编码技术也正在迅速发 展,在移动通信、卫星通信和i p 电话通信中得到了广泛的应用i 。除此之外, 语音编码技术也广泛应用在语音邮件、网络通信、存储检索、公共电话群路 系统等领域。现代中低速率语音编码体制主要沿着两个方向发展,即线性预测 编码( l i n e a rp r e d i c t i v ec o d i n g ,简称l p c ) 和子带编码,注意力都集中在提 供高质量、低码率、鲁棒性( r o b u s t n e s s ) 好、编码时延恰当等1 2 1 。现代众多的 语音编码方法中采用线性预测编码的居多,线性预测编码技术应用的更为广 泛。 当今使用的大多数语音编解码系统是基于电话带宽的窄带语音,这种语音 带宽通常被限制在约2 0 0 h z 。3 4 0 0 h z 范围内,采样速率为8 k h z 。这种带宽限制 了通讯质量的进步提高,致使在语音的自然度、音乐处理以及一些特殊音处 理等方面还不尽如人意。而在宽带语音编解码中,信号以1 6 k h z 的频率采样, 带宽限制在5 0 h z 7 0 0 0 h z ,这样的语音质量接近于面对面交流感觉的通讯质 量。同窄带电话语音相比,增加了从5 0 h z 2 0 0 h z 的低端频率,提高了自然 度、表现力、舒适度。扩展了3 4 0 0 h z 一7 0 0 0 h z 的高频部分可以更好地区分摩擦 音,所以更易于理解。5 0 h z 7 0 0 0 h z 的带宽不仅提高了可理解性和语音自然 度,而且使说话人识别变得简单1 3 i 。 随着语音编码技术的不断发展和成熟以及大规模集成电路技术的发展,专 用高速语音信号处理芯片无论从设计方面还是生产方面,都达到了很高的水 平,得到了大量的应用,但是由于国内i c 设计技术与国外的差距,这类芯片 目前主要是由国外进1 2 1 ,比如i n f i n e o n 、a g e r e 、l s il o g i c 、a m c c 、p m c 、 v i t e s s e 、a l c a t e l 等公司的专用芯片嗍。国内关于语音编码芯片的研究大多还是 采用基于d s p 的方法实现i 铺i 。鉴于目前这种状况,哈尔滨工业大学深圳研究 生院微电子专业的王明江副教授联合哈尔滨理工大学应用科学学院微电子与固 体电子学专业共同进行此方面课题的研究。本课题采用f p g a 实现l d - c e l p 语音编解码算法具有十分广阔的应用前景。通过本论文的实施,可以填补国内 信息压缩和解压缩芯片的硬件实现的空白,更好的掌握音频压缩和解压缩的核 呛尔滨理t 人学下学硕i j 学位论义 心技术,促进建立具有自主知识产权的数字音频编解码标准体系。同时,完成 音频编解码技术的产品化,实现具有自主知识产业的音频解压缩编解码芯片的 批量生产。 1 2 国内外研究现状 语音编、解码芯片是语音编解码技术的成熟1 9 i 和大规模集成电路技术发展 的共同产物。随着大规模集成电路技术的发展,复杂的语音编码技术得以在单 片集成电路上实现。下面分别介绍语音编解码技术的国内外研究现状。 1 2 i 语音编码技术分类 现代通信的重要标志是实现数字化,而要实现数字化首先得把模拟信号转 变为数字信号,这种变换对语音信号来说就是语音编码。为了提高语音编码和 语音信号数字传输的有效性,通常还要进行语音压缩编码。经过近二、三十年 的努力,人们在语音信号的压缩方面取得了很大的进展,提出许许多多的压缩 方法f l 们,其中的一些成为了国际和地区的编码标准 1 1 , 1 2 l 。语音压缩编码技术有 多种,归纳起来大致可分为三类:即波形编码、参量编码和混合编码。 1 波形编码波形编码的目标是让解码器恢复出的模拟信号在波形上尽 量与编码前原始波形相一致,也即失真要最小。由于语音信号的全部信息都蕴 含在原始波形里,所以这种方法编码后的合成语音质量非常好,且适应能力 强,抗信道干扰性能好。它通常将语音信号作为一般的波形信号来处理。所采 用的压缩方法一般是基于各种有效的数学变换,通过将波形从一个域变换为另 一个更易于提取特征参数的域来达到对变换后的参数进行量化编码的目的,在 数学上,这实质上是一个曲线拟合或数据近似的问题。典型的波形编码有:脉 冲编码调制( p c m ) 、自适应增量调制( a d m ) 、自适应差分编码( a d p c m ) 等。 2 参数编码参数编码又称声码器,是根据人的发生机理,基于某种语音 产生模型假定,在编码端分析出该模型的参数并对之编码,在解码端则利用模 型参数重新合成语音。它力图使合成语音具有尽可能的可懂性,保持原语音的 语意,而合成语音的波形与原始语音的波形可能有相当大的差别。声码器编码 后的码率可以做得很低,如1 2 k b p s ,2 4 k b p s ,但是也有其缺点。首先是合成语 音质量较差,往往清晰度可以而自然度没有,难于辨认说话人是谁,其次是复 杂度比较高。 哈尔滨艘7 1 人学下学形ji j 学位论文 3 混合编码混合编码是波形编码和参数编码两种系统优点的结合。简单 声码器模型之所以合成语音质量不高,是将模型激励过于简化为清浊音两 种,而混合编码对此进行了改进。这种编码器既具备了声码器的特点( 利用语 音生成模犁提取语音参数) ,又具备了波形编码的特点( 优化激励信号,使其与 输入语音波形相匹配) ,同时还可利用感知加权最小均方差的准则使编码器成 为一个闭环优化的系统,从而在较低的比特率上能获得较高的语音质量。例 如,多脉冲激励线性预测编码( m p e l p c ) 、规则脉冲激励线性预测编码 ( r p e _ l p c ) 、码激励线性预测编码( c e l p ) 、l d c e l p 、a c e l p 、c s a c e l p 等 都属于这一种,这种编码方式能在4 k b i t s 一1 6 k b i t s 的中低编码速率上得到高 质量的重建语音。基于其显著的优点,混合编码得到了广泛的应用和研究。 1 2 2 主要语音编码标准 近几十年来,数字语音压缩编码技术取得快速发展,涌现了多种压缩编码 方法和标准,有些已成为区域性或国际性的语音编码标准。 1 g 7 1 l 标准3 j1 9 7 2 年,c c i t t ( 现在的i t u t ) 通过了6 4 k b p s 语音编码标 准g 7 1 1 。该标准采用对数p c m ( 脉冲编码调制) 编码方式。规定以8 k h z 采样 率对语音信号进行采样,采用非线性a 律或u 律进行编码,样值编码位数为8 比特,编码速率为6 4 k b p s 。 2 g 7 2 1 标准f 1 4 l1 9 8 4 年,c c i t t 制定了3 2 k b p s 语音编码标准g 7 2 1 。该标 准采用a d p c m ( 自适应差分脉冲编码调制) 编码方式。采样率与g 7 11 一样为 8 k h z ,所不同的是g 7 2 1 采用的a d p c m 编码方式是对语音预测误差进行量 化编码,每个采样值的预测误差采用4 b i t 。在一个p c m 话路中可同时传送两 路电话,并能实现g 7 1 1 标准的6 4 k b p s p c m 信道与3 2 k b p s 信道之间的相互转 换。 3 g 7 2 3 标准f 1 5 】c c i t t 在1 9 8 8 年制定的语音编码标准,采用2 4 k b p s 和 4 0 k b p s 的a d p c m 编码。2 4 k b p s 码率用在瞬时话务量超过传输容量时的 d c m e ( 数字电路增容设备) 中,4 0 k b p s 码率能通过9 6 k b p sm o d e m 传输。 4 g 7 2 6 标准1 1 6 1g 7 2 6 标准是g 7 2 1 和g 7 2 3 标准的结合,另外增加了 1 6 k b p s 的a d p c m 编码,主要用于d c m e 。其1 6 k b p s 和2 4 k b p s 编码的语音质 量达不到长途话音的质量。 5 g 7 2 8 标准【1 7 11 2 7 2 8 标准是c c i t t 于1 9 9 2 年公布的1 6 k b p s 的l d c e l p ( 短时延码激励线性预测) 编码标准。该算法以c e l p ( 码激励线性预测) 为 基础,采用后向自适应线性预测、5 0 阶合成滤波和短激励欠量等改进方法,算 法编码时延小于2 m s 。本文就是采用f p g a 实现该标准所规定的语音编解码算 法。 6 g 7 2 3 1 标准8 i1 9 9 5 年,c c i t t 制定的一种多媒体语音编码标准,其传 输码率有5 3 k b p s 和6 3 k b p s 两种,在编码过程中可随时切换。5 3 k b p s 的编码 器采用a c e l p ( 代数码激励线性预测) 编码方式,6 3 k b p s 的编码器采用m p m l q ( 多脉冲最大似然量化) 编码方式。该标准的主要应用是在p 电话业务、 h 3 2 4 视频电话、无线电话、数字卫星系统、d c m e ( 数字电路增容设备) 、 p s t n ( 公共交换电话网) 、i s d n ( 综合业务数字网) 等。 7 g 7 2 9 标准i j 川1 9 9 6 年,c c i t t 公布了8 k b p s 的g 7 2 9 标准,该标准采用 了c s a c e l p ( 共轭结构代数码激励线性预测) 算法。该算法采用线性预测、矢 量量化和代数码本搜索等技术,在略微增加算法复杂度的情况下,大大降低了 编码速率,同时又保证了良好的语音质量。 8 f s l 0 1 6 2 0 if s l 0 1 6 是美国政府公布的一种语音编码标准,它基于c e l p 的编码算法,编码速率为4 8 k b p s 。该算法利用线性预测提取语音特征参数, 用一个激励码书作为激励矢量,每次编码时在码书中搜寻一个最佳的激励矢 量,将该激励矢量在码书中的对应编号作为编码结果。 9 v s e l p t 2 l lv s e l p 是北美蜂窝电话工业组织( c t u ) 在1 9 8 9 年公布的 8 k b p s 矢量和激励线性预测( v s e l p ) 语音编码方案。该算法采用两个随机码本 和一个自适应码本作为激励信号,最终使用的激励为这三个激励矢量的和。 1 0 g s m 0 6 1 0 t 翊g s m 0 6 1 0 是e t s i ( 欧洲电信标准化组织) 为g s m 制定的 全速率语音压缩编码标准,该标准采用r p e - l t p ( 规则脉冲激励一长期预测) 编 码算法,压缩后语音数码率为1 3 k b p s 。 1 1 g s m 0 6 2 0 p 3 g s m 0 6 2 0 是e t s i 为g s m 制定的半速率语音压缩编码 标准,该标准采用v s e l p 语音编码方案,编码后的语音数码率为5 6 k b p s 。 语音编码算法具有计算量大、处理数据多等特点。因此语音编码算法的实 现方案多选用d s p 来完成 2 4 , 2 5 1 。从作者目前所掌握的国内外研究进展来看,尚 未发现有使用f p g a 实现l d c e l p 语音编解码算法的报道。究其原因,主要 因为d s p 是用于数字信号处理的专用器件,它在结构设计上考虑了数据信号 处理中计算量大、处理数据多的特点,又能够达到比单片机高得多的运行速 度,在实际应用中也能够达到语音编码的实时要求。另一方面是f p g a 在发展 初期由于受到半导体工艺方面的影响,集成度、运行速度等方面都存在有一定 的不足。使得人们当时在选择实现方案更趋向于采用d s p 。 。 n 尔演理t 人学丁学硕i j 学位论义 随着半导体工艺的发展,f p g a 已经取得了很大的突破,在集成度方面, 已经出现了上千万可用门的单片p p g a 。在速度方面,由于引入了高速时钟管 理电路,使得f p g a 的运行速度也得到了快速提高。另外,f p g a 内置的高速 乘法器、加法器及b r a m 也极大的增强了f p g a 进行数字信号处理的能力。 采用f p g a 方式实现的l d c e l p 语音编解码算法可以达到比d s p 更短的编解 码延时,因此当需要对多路语音信号进行编解码处理时,采用时分方式也可处 理更多的话音信号,获得比采用d s p 更好的编解码性能。 1 3 本课题主要研究内容 本课题来自哈尔滨工业大学深圳研究生院多媒体芯片设计实验室系列语音 编解码器设计项目。 本课题在深入研究l d c e l p 编解码算法的基础上,考虑到设计周期及设 计费用,决定采用基于d s p 软核软硬件联合实现的方式实现编解码体系。硬 件设计方面,利用d s p 软核实现编解码运算中的各种运算,单独分出专用输 入、输出模块控制编解码器的输入、输出信号,运算过程中需要用到的常数、 变量和控制d s p 软核进行运算的二进制指令集存储在专用存储单元中。软件 设计方面,参考d s p 软核可识别汇编指令集,根据g 7 2 8 标准中推荐的算法, 采用汇编语言实现编解码算法。汇编程序的测试输入为n u - t 公布的专用测试 输入,可对比若干中间变量值及最终结果。软硬件都设计完毕后,需进行软硬 的协同仿真。协同仿真基于l i n u x 系统,采用n c v e r i l o g 和s i m v i s i o n 软 件进行。观察仿真波形即可确定设计是否正确。f p g a 实现采用x i l i n x 公司 s p a t r a ni i i 系列器件中的x c 3 s 1 0 0 0 芯片。此芯片拥有1 0 0 万系统门, 1 7 2 8 0 个逻辑单元,块存储器位数为4 3 2 k ,分布式存储器位数为1 2 0 k 。f p g a 的验证需要添加一些外围的辅助电路,最终的f p g a 验证体系可以实时对模拟 语音信号进行编解码,并以模拟语音形式输出。 本论文中采用以d s p 软核完成主要运算、补充一些接口及存储单元的方 法实现编解码体系结构。采用这种特殊的实现方式可以明显缩短产品开发周 期,降低研发费用。此外,本论文以f p g a 为载体实现此体系结构,在验证了 其功能的基础上,也可以使用a s i c 实现此结构,进一步缩小芯片面积、降低 生产成本。 呛尔滨理t 人学t 学硕i :学位论文 第2 章l d c e l p 编解码器原理 2 1l d c e l p 算法概述 l d c e l p 算法的目的,是将6 4 k b s 的p c m 码流压缩成1 6 k b s 的低速率 码流。该算法保留了传统的c e l p 技术的精髓,即通过分析一合成的方法进行 激励码本搜索。不同之处在于它采用后向自适应预测方式,也就是说激励增益 和预测器系数并不是从原始输入语音中提取,而是从编码器己合成的语音中根 据l p c 预测分析来获得。更重要的是,它只需缓存一个矢量( 即子帧,含5 个 样值,0 6 2 5 m s ) 长度的输入语音,整个编解码系统的单向编码时延大约为3 个 矢量长度,编码时延很小但6 刀i 。 2 1 1l d c e l p 编码器 图2 1 是编码器原理图。编码器首先将速率为6 4 k b i t s 的a 律或肛律p c m 输入信号转化为均匀p c m 信号,再把连续的五个语音信号划分为一个语音矢 量。对每一个输入语音矢量,编码器通过增益调整单元和合成滤波器产生相应 的量化输出矢量。在1 0 2 4 种备选码书矢量( 存储于激励码书) 中,相对于输 入信号矢量拥有最小频率加权均方误差的备选码书矢量就是最佳码书矢量。最 佳码书矢量的1 0 b i t 码书序号被传输到解码器。 图2 - 1 编码器原理图 f i g 2 1s c h e m a t i cd i a g r a mo fl d - c e l pe n e o d e r 哈尔滨理t 人学丁学硕i :学位论文 同时,码书序号也被传输到增益调整单元和合成滤波器,用于建立正确的 滤波器存储单元,为下一个输入矢量的计算做好准备。增益和合成滤波器系数 周期性的更新,基于过去时刻的量化语音和经过增益调整后的激励,采用后向 自适应方法获得。 2 1 2l d c e l p 解码器 图2 2 是解码器框图。解码操作也是逐矢量进行,l d c e l p 解码器每接收 到一个1 0 b i t 最佳码书序号,首先从激励码书中提取相关码矢。提取出来的码 矢通过增益调整单元和合成滤波器产生当前解码信号矢量。合成滤波器和增益 系数的更新和编码器采用相同方法。 图2 2 解码器原理图 f i g 2 - 2s c h e m a t i cd i a g r a mo fl d - c e l pd e c o d e r 解码信号还可以通过一个自适应后置滤波器来增强听觉质量,后滤波系数 由解码语音周期更新。经过后滤波的信号矢量每五个样点被转化为a 律或弘 律p c m 输出。 2 2 编解码主要技术 l d c e l p 算法主要包括合成滤波器、听觉加权滤波器和激励增益模块, 滤波器系数的更新和激励增益的预测都采用后向自适应技术进行l p c 分析获 得。 2 2 1 使用混合窗进行l p c 分析 在l d - c e l p 算法中,合成滤波器系数、听觉加权滤波器系数和激励增益 都是采用l p c 分析技术来自适应更新的。l p c 分析采用自相关法,并使用杜 宾递推( l e v i n s o n d u r b i n ) 求解,求自相关系数前要对输入信号加窗。在l d 哈尔滨理丁人学t 学硕i j 学位论义 c e l p 算法中采用了一种新型的混合窗,下面将给出这种混合窗处理过程的通 用公式。 设每l 个样点进行一次l p c 分析,则当前帧的信号为:s u ( m ) ,s 。( m + 1 ) , s 。( m + 2 ) ,s u ( 聊+ l - 1 ) ,对于后向自适应l p c 分析,混合窗应用于第m 个 样点以前的所有信号。混合窗由两部分组成:一部分指数窗( 递归部分) 作为前 段,一部分正弦波形窗( 非递归部分,长度为n ) 作为后段。 在m 时刻,定义w 卅( 足) 为混合窗函数: c七,=f(k)=ba-fk-(-n-ij,, k m n l m n k t n 一1 ( 2 - 1 ) k m f s u ( j | ) 厶( 足) = j 。( k ) b o t 小一舻肛d 1 , k m n l 5 。( 七) = j 。( 足) ( 忌) = s u ( 七) g 。( 七) = 一j 。( k ) s i n c ( k m ) 】, m n ksm 一1 【o k m ( 2 - 2 ) 对m 阶l p c 分析,需要计算m + 1 个自相关系数尺。( f ) : r ( f ) = s m ( k ) s m ( k - i ) = r ( i ) + s m ( k ) s m ( k - - i ) , o i m ( 2 3 ) l = m k = r a - 其中r m ( i ) 是屯( f ) 的递归部分,可用下式计算: r m ( i ) = s m ( 七) s m ( 七一f ) = j 。( k ) s u ( k i ) f m ( k ) f 朋( k 1 ) ,o i m + l ( 2 5 ) r 肿l ( f ) 的递归部分为: l ( f ) = s m + l ( j | 2 ) 5 。+ ( 七一f ) = s m + l ( 足) s 。+ l ( 七一f ) + j 。+ l ( 碱札( 忌一f ) t = t = - k = m - n m + z 一n l删4 - l j v l = s 。( 七) 厶( 足) s 。( k - i ) f ( k - i ) a + s 。+ l ( 足) s 。“( 足一f ) 女= - k = m - n m a r l - 一l = 0 1 2 工r m ( f ) + j m + i ,( 七) s 舭( k - o o i m k = m - n ( 2 6 ) 则自相关系数为: m i - l - 1 g m + ( f ) = r m + l ( f ) + s 。+ l ( 足) s 斛l ( 七一f ) , o i m ( 2 7 ) + l ( f ) 被保存用于计算下一帧的自相关系数。 这样不仅利用递推部分节约了运算量,而且利用非递推部分对当前自适应 周期的样值进行了较大的加重,从而保持了对语音信号的局部动态特征进行有 效地跟踪,保证了l p c 分析的精度【2 8 1 。 在l d - c e l p 算法中,合成滤波器、对数增益预测器、听觉加权滤波器中 采用三类不同的混合窗函数。其混合窗参数如表2 - 1 所示。 表2 - 1 混合窗参数表 t a b l e2 - 1p a r a m e t e r so fh y b r i dw i n d o w s 滤波器名称m ln 听觉加权滤波器 1 02 03 00 9 8 2 8 2 0 5 9 8 合成滤波器 5 02 03 50 9 9 2 8 3 3 7 4 9 对数增益滤波器 1 0 4 2 0 0 9 6 4 6 7 8 6 3 0 哈尔滨理丁人学下学硕l j 学化论义 计算出自相关系数、开始杜宾( ( d u r b i n ) 递推之前,将i = 0 ( 0 茎i p ) 时的自相 关值r ( o ) 乘以白噪声修正因子w n c f = i 0 0 3 9 0 6 2 5 。 利用白噪声修正后的自相关系数和l e v i n s o n d u r b i n 递推公式,就可以计 算出l p c 系数。 2 2 2 听觉加权滤波器 如图2 1 所不,当前的输入语音矢量s ( n ) 经过听觉加权滤波器,得到加权 的语音矢量v ( n ) 。传统的c e l p 编码器中听觉加权滤波器的传输函数为: w ( z ) :粼 o 托 y l l ( 2 - 8 ) q ( 一 卜 z ln ) “ 上式中,q ( z ) 为线性预测器的传递函数: q ( z ) = 一吼z 一 ( 2 9 ) q ,即为求得的预测系数,q 。= i 。靠和托为根据人耳的听觉特性经实验得 出的加权因子,在这里,托= 0 9 ,y 2 = 0 6 。所以 l + z ( q 。r 1 ) z 一 w ( z ) = ( 2 一l o ) 1 + y ( 吼以) z 。 f ;i 听觉加权滤波器分子分母系数的更新每帧进行一次,更新发生在每帧的第 三个矢量。 2 2 3 合成滤波器 设户( z ) 为5 0 阶的l p c 预测器的传输函数,它的形式为: 5 0 户( z ) = 一幺z 。 ( 2 - 1 1 ) 其中a 是预测器系数。由后向合成滤波器自适应器对合成的语音作5 0 阶 l p c 分析来完成。为了改善对信道误码的抵抗能力,需要对这些系数进行修 正,以使l p c 频谱中的峰值具有稍微大一些的带斜2 9 i 。带宽扩展模块按下述 哈尔滨理t 人学丁学硕f j 学位论文 方法完成带宽扩展过程。给定l p c 预测器系数a ,一组新的系数a ,按下式 计算: a f = 刀a f , i = l ,2 ,5 0 ( 2 一1 2 ) 此处的九取值为: 五= 堡:o 9 8 8 2 8 1 2 5 ( 2 - 1 3 ) 2 5 6 式( 2 1 2 ) 具有把合成滤波器所有极点径向地移向原点的作用。由于极点由 单位圆移开,所以扩展了频率响应的峰值。带宽扩展后,修正的l p c 预测器 的传输函数为: 户( z ) = 一色z 一 ( 2 1 4 ) 合成滤波器表示为: 砌= 而1 丽 ( 2 1 5 ) 2 2 4 对数增益滤波器 l d c e l p 采用后向矢量增益自适应器来为每个矢量更新激励增益。为 选择的激励矢量定标,它的输入是经过增益调整的激励矢量e ( n ) ,输出是激励 增益。由于人耳对声音响度大小的感知与声音信号的d b 值成线性关系,因而 激励矢量增益自适应器对激励增益的自适应线性预测是基于对数域进行的,其 实现框图如图2 3 所示。图中对数增益偏移值保持器里存储的是3 2 d b 的对数 增益偏移值,它粗略地等于浊音的平均激励增益电平。故在线性预测之前,先 从激励增益里减去这个偏移值,在更新时再补偿回去。 对数增益预测器是个1 0 阶预测器,之所以采用l o 阶是因为该预测器对每 个矢量预测一个增益,1 0 阶相当于跨越5 0 个样点,可以去除大部分女声激励 增益中遗留的基音冗余,原理与l p c 预测器阶数取5 0 阶相同1 3 0 1 。 设矢量y ( n ) 是在n 时刻时的激励矢量,e ( n ) 是经过增益调整后的激励矢 量,仃,( ,z ) 和吒( ,z ) 分别为y ( n ) 和e ( n ) 的均方根( r m s ) ,盯研) 是时刻n 的增益因 子,用于调节码书搜索得到的最佳码矢y ( n ) 的能量,则有: 哈尔滨理t 人学t 学硕i j 学位论义 e ( n ) = c r ( n ) y ( n ) ( 2 1 6 ) l o g ,( ,z ) 】= l o g 盯( ,z ) 】+ l o g 仃y ( 玎) 】 ( 2 1 7 ) 本质上讲,增益滤波的目的就是想通过e ( n 1 ) ,e ( n 2 ) ,的增益来预测e ( n ) 的增益。算法中,在对数域进行l p c 分析预测。 1 0 l o g o r ( n ) = p fl o g o e ( n - i ) - o f f s e t + o f f s e t i l = o l ( 2 1 8 ) 1 0 、- = p fl o g o ( n - i ) o y ( n - i ) - o f f s e t + o f f s e t i = l 在m 时刻,定义w m ( 足) 为混合窗函数:通过对先前的l o g 【吒( ,1 ) 】序列加混 合窗,进行l p c 分析,求得预测系数p 撕= l ,2 ,1 0 ) ,再进行带宽扩展,求 得a ,= 名幺,( i l ,2 ,1 0 ) ,这里l - - - o 9 0 6 2 5 ,扩展带宽b = 1 2 5 h z ,改善了增益 调节器的坚韧性。 图2 - 3 后向自适应增益调节器 f i g 2 3b a c k w a r dv e c t o rg a i na d a p t e r 将预测系数用于对数域线性预测器得到预测值彦( ,1 ) : 哈尔演理t 人学t 学颁i j 学位论文 1 0 彦( ,1 ) = 口,j ( n - i ) ( 2 - 1 9 ) 上式巾的预测系数每4 个语音矢量更新一次,在第二个语音矢量处更新。 得到彦( ,z ) 之后,再经过反对数变换及平滑,最后得到激励增益仃( 咒) 。 2 2 5 码书搜索 在8 k h z 的采样频率下,1 6 k b s 语音编码要求每样值2 比特。这样,一个 矢量( 5 个样值) 则需要1 0 比特,所以码本长度应为1 0 2 4 。在算法实现时,为减 少码本搜索运算量,将1 0 比特1 0 2 4 个码字的码本,分解为7 比特“形状码 本”( 包含1 2 8 个独立码矢) 和3 比特“增益码本”( 包含8 个零对称的标量值,因 此l 比特代表符号,2 比特代表量值) ,量化输出的码矢是最佳形状码矢和最佳 增益电平的乘积。 “形状码书”基于听觉加权最小均方误差( m s e ) 准则并采用闭环优化设计而 成。同时,为了提高抗信道误码的能力,7 比特码矢量使用了格雷码进行编 址。这样矢量序号在传输过程中如果发生1 比特的错误,解码器仍然能够解码 出最为接近的码矢量。同随机编址相比,这种技术显著提高了在噪声信道上的 解码信噪比f 3 1 1 。在高误码率的情况下( 比如达到1 0 刁) ,改善了解码语音的主观 质量。 原则上,码本搜索模块把1 0 2 4 个待选码矢的每一个用当前激励增益仃( 咒) 进行定标,然后把得到的1 0 2 4 个矢量一次一个地通过包括合成滤波器f ( z ) 和 听觉加权滤波器w ( z ) 组成的级联滤波器,得到听觉加权后的合成语音矢量( 注 意,为零状态响应) ,并与听觉加权后的原始语音矢量作比较,得到的最佳激 励码矢应该使二者的均方误差最小。 在具体实现时,l d c e l p 作了数学上等效的简化。 令弘为7 比特形状码本中第j 个码矢量,蜀为3 比特增益码本中第i 个电 平。仃伽) 是激励增益, h ( n ) 代表级联滤波器的脉冲响应序列。那么当码本索 引号i 和j 规定的码矢量馈送到级联滤波器h ( z ) 时,滤波器输出可表示为: 而= h c r ( n ) g fy ( 2 2 0 ) 式中的h 为: 哈尔演理丁人学t 学硕l j 学位论文 h = h ( 0 ) 0 000 矗( 1 ) h ( 0 ) 0 00 h ( 2 ) h ( 1 ) h ( 0 ) 0 0 z ( 3 ) h ( 2 ) h 0 ) h ( 0 ) 0 h ( 4 ) h ( 3 ) h ( 2 ) h ( 1 ) h ( 0 ) i 和j 的组合应使下面的均方误差最小: ( 2 2 1 ) d = ) 一再0 2 = o - 2 ( 雌( n ) 一g ,h y 2 ( 2 - 2 2 ) 这里,舅( ,z ) = x ( n ) c r ( n ) 为归一化目标矢量,展开上式: d = o 2 ( 甩) k 唧一2 9 。曼r ( 玎) 毋,+ g 剁2 脚,1 1 2 】( 2 - 2 3 ) 使d 最小,等价于使下面的西最小: 6 = - 2 9 f p r ( ,z ) ) ,j + ge j 式中: p ( ,1 ) = h7 戈( n ) e j - - u h y 川2 又设, b f = 2 9 。 则6 成为: 其中, q = g ; i = o ,1 , 2 ,7 d = 一b i p j + c t ei - 1 4 ( 2 2 4 ) ( 2 2 5 ) ( 2 2 6 ) ( 2 2 7 ) ( 2 - 2 8 ) ( 2 2 9 ) 哈尔滨理- e 人学t 学硕i j 学位论文 0 = p r ( ,2 ) y ( 2 3 0 ) 因为b i 、c i 和e j 都可以在下一次搜索前预先计算和保存起来,所以,当前 搜索的主要计算量在于计算p j 和寻找最小西值所对应的增益标号i 。 在( 2 - 2 9 ) 式中,设d = 。,则可得巴= i g ie 。令喜= 苦= 了g i ,所以,雪与 g ,有一定比例关系。量化雪等于g ,的8 个增益电平之一,对应的索引值i 即为 本次搜索的增益电平下标值。但由于计算需要除法,故将此方法稍微改变一 下。设d ,是两相邻同符号增益电平中点值,将喜的量化看做是与d j 的比较,而 比较“蓉 d i ”就等价于比较“弓 d ,e ”,这样就避免了使用除法。 一旦找出最佳的索引号i 和j ,就可以连在一起形成码本搜巡模块的输 出,即1 0 比特最佳码书序号。 2 2 6 后滤波器 l d c e l p 的解码端使用了一个自适应后置滤波器,解码语音在输出前先 进行后置滤波。其作用是使解码语音的频谱谷值衰减、共振峰增强,从而减少 噪声、提高主观音质【3 2 i 。其原理如图2 _ 4 所示。 图2 4 后滤波原理图 f i g 2 - 4s c h e m a t i cd i a g r a mo fp o s t f i l t e r 这个后滤波器的系数调节考虑到了三级编码器的级联的情况,因此,它不 哈尔演理t 人学丁学硕i j 学位论文 仅满足了单路编译码器对语音质嚣的要求,而且满足了三路级联的要求。冈为 后滤波器必然地要引入相位误差:所以,当信道通过相位中含有信息的调制信 号时,应关闭后滤波器和感觉加权滤波器。 1 长时后滤波器 长期后置滤波器也称为“音调后置滤波器”,它是一个梳状滤波器,频谱的 峰值点都在待滤波语音信号的基频整数倍上。基频的倒数就是音调周期,可以 用音调周期抽取器从解码语音中抽取出来。令p 为基频音调周期( 所含样值个 数) ,那么长期后置滤波器的传输函数为: h f ( z ) = g f ( 1 + b z 叩)( 2 - 3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 某大型制造集团“十五五”产业数字化转型规划方案
- 2025年军队文职人员统一招聘面试( 大数据)专项练习含答案
- 2025年民办学校教师招聘笔试(国际部双语数学)题库附答案
- 2025年村级综治长制综治长助理招聘面试模拟题及答案
- 2025年供销社业务人员招聘笔试预测试题及答案
- 2025年新高一英语暑假衔接讲练(人教版)专题02要求式动词与asif从句中的虚拟语气用法
- 2025训练基地租赁合同
- 公共设施托管协议
- 农产品直供直销合作合同
- 假如我是一条鱼600字13篇
- 钻孔桩安全培训
- 2025年山东高考化学真题及答案
- 2025年云南省中考道德与法治试卷真题(含标准答案及解析)
- 子宫腺肌症教学护理查房
- 操作手册/西门子/软件/Simotion Programming-MCC
- DBJ53T-44-2021云南省建筑工程资料管理规程
- 五金件盐雾测试报告
- 肛管鳞状细胞癌临床诊疗要点
- 选择测试题大全及答案
- 陕西西安工业投资集团有限公司招聘笔试题库2025
- 废旧船买卖合同协议书
评论
0/150
提交评论