![(电路与系统专业论文)基于Nios+Ⅱ实现G729语音压缩解压算法[电路与系统专业优秀论文].pdf_第1页](http://file.renrendoc.com/FileRoot1/2019-12/13/32f48c0a-ffe5-4c8a-bfaf-20b53477a772/32f48c0a-ffe5-4c8a-bfaf-20b53477a7721.gif)
![(电路与系统专业论文)基于Nios+Ⅱ实现G729语音压缩解压算法[电路与系统专业优秀论文].pdf_第2页](http://file.renrendoc.com/FileRoot1/2019-12/13/32f48c0a-ffe5-4c8a-bfaf-20b53477a772/32f48c0a-ffe5-4c8a-bfaf-20b53477a7722.gif)
![(电路与系统专业论文)基于Nios+Ⅱ实现G729语音压缩解压算法[电路与系统专业优秀论文].pdf_第3页](http://file.renrendoc.com/FileRoot1/2019-12/13/32f48c0a-ffe5-4c8a-bfaf-20b53477a772/32f48c0a-ffe5-4c8a-bfaf-20b53477a7723.gif)
![(电路与系统专业论文)基于Nios+Ⅱ实现G729语音压缩解压算法[电路与系统专业优秀论文].pdf_第4页](http://file.renrendoc.com/FileRoot1/2019-12/13/32f48c0a-ffe5-4c8a-bfaf-20b53477a772/32f48c0a-ffe5-4c8a-bfaf-20b53477a7724.gif)
![(电路与系统专业论文)基于Nios+Ⅱ实现G729语音压缩解压算法[电路与系统专业优秀论文].pdf_第5页](http://file.renrendoc.com/FileRoot1/2019-12/13/32f48c0a-ffe5-4c8a-bfaf-20b53477a772/32f48c0a-ffe5-4c8a-bfaf-20b53477a7725.gif)
已阅读5页,还剩61页未读, 继续免费阅读
(电路与系统专业论文)基于Nios+Ⅱ实现G729语音压缩解压算法[电路与系统专业优秀论文].pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 本文采用了n i o sii 技术实现g 7 2 9 算法。论文首先对g 7 2 9 算法原理进行 了深入的剖析,然后详细介绍了g 7 2 9 语音处理系统的硬件系统构成;在软件设 计方面,本文以i t u 提供的参考源代码为模版,采用了各种优化方法对其进行改 进,以保证系统处理的实时性,最后给出了改进后的软件代码在n i o si i 系统上 的加载及调试方法,并将实时测试结果进行了分析评价。 本文出发点是g 7 2 9a s c 预研,因此,文中侧重于g 7 2 9 算法理论分析及 在f p g a 上实现方法探索。 关键词:语音编码g 7 2 9 协议n i o si i 处理器 a b s t r a c t o n er e a l i z a t i o nm e t h o d ,n i o si it e c h n o l o g y , o fg 7 2 9a r i t h m e t i ci si n t r o d u c e di n t h i st h e s i s f i r s t l y t h ep r i n c i p l eo f t h ea r i t h m e t i ci sa n a l y z e di 1 1d e t a i l s e c o n d l y , t h eh a r d w a r e s y s t e mo ft h ea r i t h m e t i c w h i c hi sd e v o l v e db yw r i t e r , i si n t r o d u c e d ,a n d t h i sw o r ki s f i n i s h e db a s eo ns t u d y i n gk n o w l e d g eo fn i o si is o p c t h i r d l y , t h es o f t w a r eo ft h e a r i t h m e t i cr e f e r e n c e dt h ecc o d ew h i c hp r o v i d e db yi t u ,i ti so p t i m i z e db ys e v e r a l m e t h o d si no r d e rt op r o c e s sv o i c ei nr e a l - t i m e f i n a l l y , t h el o a d i n ga n dd e b u g g i n g m e t h o do ft h eo p t i m i z e dc o d ei sg i v e n ,t h eo n - s y s t e mt e s tr e s u l ti sl i s ta n da n a l y z e d a l s o t h eb a s i co ft h ep a p e ri sp r e r e s e a r c h i n ga s i co fg 7 2 9a r i t h m e t i c ,s oi t sm a i n w o r ki sa n a l y z e dt h et h e o r yo fg 7 2 9a r i t h m e t i ca n df o u n dt h er e a l i z a t i o nm e t h o d k e y w o r d s :s p e e c hc o d i n g g 7 2 9p r o t o c o ln i o si ic p u 西北工业大学硕士学位论文第一章绪论 第一章绪论 第一节语音编码技术简介 在语音信号处理技术发展过程中,人们研究发现语音虽然变化多样,但可以 近似看着是- 4 中多相位的准周期信号,可以用语音的抽样波形来描述语音信号, 也可以用这些语音信号的特征描述语音信号。语音信号的特征提取为参数分析法 和非参数分析法。采用参数法来摇述语音信号,通常要首先建立语音模型,然后 进行特征提取。非参数分析法则是从统计方法出发直接从语音信号中获得有关性 质。采用参数分析法也叫参数编码,而采用非参数分析法的通常叫波形编码。参 数编码则是首先把语音信号的产生用某种语音生成模型来表示,然后用语音的特 征提取方法提取其必要参数。波形编码的方法通常是利用语音信号的一些统计性 质及听觉上的一些特征而对语音型号进行量化以达到压缩语音编码速率的目的, 而波形编码仅仅是通过抽样和量化过程表示模拟语音波形。参数编码方法则是仅 仅对那些表示语音特征的参数进行编码,如l p c ( 线性预测系数:l i n e a r p r e d i c t i o nc o e f f i c i e n t ) 模型下的声道特性参数,清浊音判决及基音信息。波 形编码方法不适用于低速率语音编码,这是由于较大的量化间隔造成大量的量化 噪声从而降低了语音质量。简单的参数编码方法虽然降低了语音编码速率,但合 成语音质量较差。 从编码之后的语音恢复出来的再生语音,其质量通常采用清晰度( 又称可 懂度) 与自然度来评价。前者是衡量语音中的字、单词和句涵义的可懂度,而后 者则是针对讲话人的辨识水平而言。这些都和人的主观听觉感知有密切关系,是 一种主观判定标准,虽较为繁杂但应用较多。m o s ( 平均主观打分:m e a no p i n i o n s c o r e ) 是一种常用的主观判定方法,以其平均主观打分来度量,用5 级确定语 音质量等级,分为优、良、中、差和劣等5 级。如果m o s 为4 0 分以上,则为高 质量语音,接近信道透明编码,常称为网络质量,再生语音质量符合长途要求。 合成语音质量,指采用参数语音综合技术再生的语音,它一般具有高的可懂度, 但自然度和语音质量等级不够,这类语音一般m o s 不会超过3 0 分。 除了参数编码与波形编码外,还有第三类编码方法一混合编码,它兼有参 数编码和波形编码的特点,因此受到了广泛重视。波形编码方法通常称为调整编 码,其比特率在3 2 k b s 以上;参数编码方法其速率通常在4 8 k b s 以下,称为 两北i 业大学硕士学位论文第一章绪论 低速编码:介于中间的编码方法为中速语音编码,即混合编码。 在相当一段时间内语音编码停留在波形编码的研究上,再生语音质量没有突 破性进展。随着微电子技术的迅速发展,一些复杂的算法得以硬件实现,突破了 波形编码与参数编码的界限,提出了混合编码的算法。 得到最广泛研究的语音混合编码算法是基于线性预测技术的分析一合成编 码方法简称l p h s ( i i n e a rp r e d i c t i o na n a l y s i sa n ds y n t h e s i s ) ,一个l p a s 编 码器具有3 个基本要素o ,: ( 1 ) 合成滤波器。基于l p ( 线性预测:l i n e a rp r e d i c t i o n ) 技术的线性时 变合成滤波器通过对当前帧语音作l p 分析获得的参数而周期地更新。这个合成 滤波器作为整形滤波器,将一个具有平坦谱的激励信号映射成相关函数及频谱包 络都与原始相似的输出信号。 ( 2 ) 分析一合成激励编码。编码器通过将侯选的激励信号送入合成滤波器的 一个副本产生输出,从中选择输出信号与原始语音的感知加权失真最小的候选信 号作为量化激励信号。 ( 3 ) 基本解码器结构。解码器根据从信道发送的数据确定激励信号和合成滤 波器的参数,重建语音则由激励信号作用于合成滤波器而产生。 最早的l p a s 编码思路是1 9 8 1 年提出来的,但最早实用的l p a s 方案是由a t a l 和r e m e d e 提出的多脉冲线性预测编码( m p l p c ) ,另外较典型的方案有规则脉 冲激励线性预测编码( r p e - - l p c ) 等。但最重要的种l p a s 算法是由h t a 和 s c h r o e d e r 提出的码激励线性预测编码( c e l p ) ,也称随机编码,矢量激励编码 ( v x c ) ,或称随机激励线性预测编码( s e l p ) 。c e l p 对于m p l p c 的主要改进是 采用v q 技术对激励信号编码,即激励信号以码矢量的形式存储于码本中,编码 器只将最佳码矢量的地址送入信道。 由此可见,c e l p 具有波形编码和参数编码两方面特点,所以称为混合编码, 它在4 1 6 k b s 刈以得到比其他算法更高的重建语音质量这事实已得到公认。 而且以c e ! p 为基础的多种算法已成为国际标准其中包括g 7 2 8 建议的l d c e l p 算法和g 7 2 9 建议的c s a c e l p 算法。 第二节语音编码技术分类 ( 1 ) c c i t t1 9 7 2 年确定,6 4 k b sp c m 语音编码g 7 1 1 建议。它已极为广泛 地应用于数字通信,数字交换机以及一切语音数字化接口。 ( 2 ) c c i t t1 9 8 2 年确定,3 2 k b sa d p c m 语音编码g 7 2 1 建议。它不仅与p c m 西北工业人学硕士学位论文第一章绪论 有相同再生语音质量,而且具有比p c m 更优良的抗误码性能,已逐渐广泛应用于 卫星,海缆及数字语音插空设备以及可变速率编码器中,因为这种a d m p c m 算法 在1 6 k b s 到6 4 k b s 的速率范围内其再生语音质量平坦,很适宜于可变率的应用。 ( 3 ) c c i t t1 9 9 5 年5 月采纳了由a t & t 公司提出的一种称为低延迟激励线性 预测( l d c e l p ) 语音编码方案作为1 6 k b s 速率的国际标准,并定名为g 7 2 8 建议。 i 。d c e l p 算法特点是语音短时谱与长时谱预测、增益因子预测等参数不是 从输入语音中直接提取,而是用一5 0 阶长的预测器在后向来实现,传送的信息 则只是激励矢量,这就压缩了传输比特率。它是用分析综合方法优化出来的5 个 抽样为一组的激励矢量,因此5 个采样就是基本延迟,为5x1 2 5 r s ,也就是 0 6 2 5 m s 。而原c c i t t 提出,要求编码迟延5 m s 。所以,该算法远优于要求的指 标,达到了进入公众通信网的标准。 l 旷_ c e l p 的应用领域,c c i t t 建议如下:可视电话伴音;无绳电话机; 单路单载波卫星通信;数字插空设备;存储和转发系统:话音信息录音: 数字移动无线系统;分组化话音。 ( 4 ) 泛欧数字移动通信标准r p e l t p ( 1 3 k b s ) 。这一标准从1 9 8 2 年到 1 9 8 8 年经过优选及严格试验,是从6 种提案中选出并制定的。p r e l t p 是以等问 隔( 每3 个抽样) 的规则脉冲序列来模拟音源,以线性预测残差信号的振幅值为 基准决定脉冲位置,残差信号,以包含长周期预测( l t p ) 的反馈型的量化结果 为脉冲振幅。算法亦属于分析综合法。由于用帧长为2 0 m s 间隔处理,在正向提 取谱包络参数与增益因子等参数,其编码迟延达2 5 m s ,对编译码处理则总迟延 将达6 0 m s 。r p e l t p 编码比特率为1 3 k b s ,若加入3 k b s 纠错码保护其中重要 参数,这种算法能在误码率为1 0 1 时有足够的可懂度,比l d c e l p 在同样比特 率下有更大的鲁棒性( r o b u s tt oe r r o r ) 。 ( 5 ) 8 k b s 语音编码标准。1 9 9 5 年1 1 月i t u _ t s g l 5 全会通过“共轭结构代 数码激励线性预测的8 k b s 语音编码( 简称c s _ a c e l p ) 建议g 7 2 9 。1 9 9 6 年6 月还通过了g 7 2 9 a 建议作为g 7 2 9 的附件。 c s a c e l p 编码基于码激励线性预测( c e l p ) 编码模型。帧长为lo m s ( 8 0 个样点) 。通过对语言信号的分析,提取c e l p 模型的参数( l p c 参数、自适应和 固定码本指标和增益因子) 。所有这些参数被编码后传送。在解码端,这些参数 用刊荻复激励信号来重建语音信号。短时综合滤波器是一只l o 阶线性预测滤波 器。长时或基音综合滤波采用称之为自适应码本逼近方法来实现。最后,用一个 后滤波器增强重建语音质量。再生语音m o s 质量为3 9 分。 西北i 业大学硕十学位论文第一章绪论 8 k b s 语音编码主要应用于个人移动通信:低c n 数字卫星系统,包括 陆地移动卫星通信、海事卫星通信、一般航空卫星通信、路由和s c p c 卫星通信 系统;高质量移动无线通信、d c m e 、存储检索、分组语音和数字租用信道等。 ( 6 ) 4 8 k b s 语音编码标准。由于2 4 k b s 语音编码技术( 声码器) 还没有 突破性进展,因此为了克服4 8 k b s 语音编码缺点以适用于下一代保密电话, 1 9 8 8 年1 2 月美国防部颁布了4 8 k b s 语音编码码技术标准,该标准是集中全美 9 个研究单位多年研究成果经分析比较后产生的,其质量较好,抗干扰和环境噪 声能力强,清晰度测试得分优于1 6 k b s ,m o s 达到3 2 分,可以和3 2 k b s 连续 可变斜率增量调制质量相比较。这一标准算法仍属于c e l p 编码技术。 第三节语音编码技术的实现现状 传统上,实用的语音编码通常以两种方式实现:第一种是用一台计算机( 微 型机,小型机或工作站) 插上一块或者若干块数字信号处理板来构成,处理板由 通用或专用的数字信号处理芯片( d s p 芯片) 及相应的存储芯片,接口芯片和a d , d a 芯片组成。第二种由专用或者通用的d s p 芯片及其它辅助芯片构成一个独立 工作的系统。 但是,近年来随着f p g a 技术的迅速发展,高逻辑密度及大内存容量的f p g a 芯片已经十分容易获得,而且有较高的性价比,如:a l t e r a 公司的c y c l o n e 系 列等;另一方面,随着f p g a 内部l e ( 逻辑单元) 集成度越来越高,生产商开发出 了强大的软件包,使得在f p g a 内部可以由用户根据需要,十分简便地集成一至 多个c p u 及用户逻辑电路,也即s o p c 设计思想,这为语音信号处理提供了新的 实现思路。本文正是采用了这种方法,利用a l t e r a 公司推出的n i o st ic p u 软 核技术,设计了6 7 2 9 语音处理的s o p c 系统。 第四节本文研究的主要内容及意义 1 4 1 本文研究的内容 奉文研究内容主要有三个方面:其一、学习i t u 提出的g 7 2 9 踟议内容,对g 7 2 9 算法模型的原理和架构进行分析和研究,弄懂协议所涉及的各种算法;其二二, 设计制作g 7 2 9 语音处理系统的f p g a 硬件系统;其三、根据国际电信联盟( i t u ) 所提供的c 语4 - 实现代码,采用算法优化和汇编优化等措施对该c 源代码进行优化 4 两北工业大学硕士学位论文 第一章绪论 和改进,减少f p g an i o si ic p u 掣j 处理时延,达到实时的要求。 1 4 2 本文研究的意义 目前国内外对g 7 2 9 的研究绝大部分都是采用软件实现,或者采用工业处理 器如:d s p 、单片机结合软件实现的办法,这在某些具体( 如手持式通讯设备) 的 运用领域上就会存在着对处理器速度要求较高,需要较多系统资源等不足之处。 如果将其独立出来,做成a s i c ,这样就能很好解决上述问题,且能满足实时性 的要求。3 g 时代即将到来,个人通讯服务将会发生重大改变,体现在手持通讯 的多媒体化,其中语音短信功能是其重要特色之一,如果开发出g 7 2 9 的a s i c , 将会在这一方面担任重要角色。 本论文的结构安排如下:第一章简要介绍语音编码和其在f p g a 上实现概况。 第二章对g 7 2 9 协议用到的算法进行探讨和分析。第三章对本文研究所设计的硬 件系统作了介绍。第四章较详细的论述了n i o si i 的相关知识,并详细介绍如何 利用它构成系统。第五章对g 7 2 9 语音处理系统软件设计进行详细介绍。第六章 介绍整个系统的联调及测试分析。 西北上业大学硕士学位论文第二章g 7 2 9 基本原理及其语音编码技术 第二章g 7 2 9 基本原理及其语音编码技术n 们 多脉冲激励线性预测编码( c e l p ) 等都属于这类新型编码器。作为一种c e l p 声码器,g 7 2 9 所描述的c s - a c e l p 声码器采用了c e l p 声码器的体系结构。因此 在具体讨论g 7 2 9 之前,有必要对g 7 2 9 中的一些基础技术作简单的回顾性的介 绍。 第一节g 7 2 9 基本原理 将模拟信号首先经过g 7 1 2 协议所规定的电话带通滤波器滤波,经8 k h z 抽 样,再转化为1 6 b i t 线性p c m 码,就得n - ;g 7 2 9 的编码器所使用的输入数字信 号,解码器的输出应该由类似的方法转化为模拟信号,从编码器到解码器的比特 流也在g 7 2 9 协议中作了规定。这些参数经过编码与传输,在解码器端解出激励 信号与合成滤波器参数。编码器参数的比特分配见表2 一l 。 表2 lg 7 2 9 协议编码参数的比特分配 参数码字 第一子帧第二子i 赜每帧共计 线谱对( l s p )i 。0 ,l 1 ,l 2 ,l 31 8 自适应码本延迟p 1 p 2851 3 基音延迟校验p o1l 固定码本索引c 1 ,c 21 31 32 6 固定码本符号 s l 。s 2 448 码本增益( 第一线)g a l ,g a 2336 码本增益( 第二级)g b l ,g b 2 4 48 总计 8 0 g 7 2 9 编码器对语音和其它音频信号进行l o m s 一帧的编码。另外,还有5 m s 的d 订瞻,结果,全部的算法时延共有1 5 m s 。在实际的实现中,这个编码器的附 加时延还取决于下列因素: 编码和解码运算处理所需的时间; 通信链路的传输时延; 将音频数据与其它数据复接所需的时间。 西北工业人学硕士学位论文第二章 g 7 2 9 基本原理及其语音编码技术 1 1 概述 掰2 一l 岱一 c 张p 粕鼢器朐辅硝琢艘椭稠 图2 1 描述了编码器的工作原理。输入信号在预处理模块中通过一个高通 滤波器而且其幅度被缩小1 2 。经过预处理的信号作为后边所有分析的输入信号。 每一帧( 1 0 m s ) 作一次线性预测( l p ) 分析,计算线性预测滤波器的系数。这些 系数被转化为线谱对,然后使用两级矢量量化( v q ) 量化为1 8 比特。激励信号 是通过一个合成分析搜索过程来选出的,在这个过程中,原始语音与重建语音的 误差按照一个感知加权滤波器的系数由未量化的线性预测滤波器得出。为了改进 编码器的性能,使输入信号能有一个平坦的频率响应,感知加权滤波器的参数值 被作成自适应的。 每予帧( 5 m s ) 使用的量化和未量化的线性预测滤波器系数是经过插值的, 而第二予帧的线性预测滤波器直接使用这些参数。每l o m s 估计一次开环基音周 期,这个估计使用的是经过感知加权的语音信号。下面提到的这些运算则是每 5 m s 重复一次。将线性预测的残差信号与激励信号之间的误差通过上述滤波器就 可以更新这些滤波器的初始状态,这等同于通常的从加权后的语音信号中减去加 权合成滤波器的零输入响应。加权合成滤波器的冲激响应 ( 盯) 是必须计算的。然 后要做的就是在开环基音周期的附近,利用目标信号茁( 珂) 与加权台成滤波器的冲 激响应| l l ( ,1 ) 进行闭环基音周期分析,以寻找自适应码本的延迟与增益。在这一过 程用l 3 插值方法来计算分数基音。在第一予帧,用8 比特对基音周期进行编码; 在第二个子帧则用5 比特对基音周期进行编码。将目标信号x ( n ) 减去自适应码本 的贡献,就得到了新的目标信号z 7 ( 行) ( 二次残差信号) ,这个新的目标信号在国 西北 :业大学硕十学位论文第二章 g 7 2 9 基本照理及其语音编码技术 定码本搜索过程中用于寻找最优激励信号。固定码本激励使用的是1 7 比特的代 数码本。固定码本与自适应码本的增益被量化为7 比特的矢量,其中,固定码本 增益的编码使用了移动平均( m a ,m o v i n ga v e r a g e ) 预测。最后,用计算出的激 励信号来更新滤波器的存储记忆。 1 2 预处理 编码器的输入语音信号为1 6 比特的线性p c m 码。在进行编码之前,要对输 入语音信号进行下述操作: 1 ) 信号幅度的缩小: 2 ) 高通滤波。 幅度缩小过程就是输入p c m 信号的幅度除以2 ,以减小定点实现中溢出的可 能性。高通滤波器是对低频噪声信号的预防措施。此处采用的高通滤波器的下截 止频率为1 4 0 h z 。预处理的两个过程合在一块由以下式子给出: h 。,( z 1 :0 4 6 4 6 4 7 1 8 - 0 9 2 7 2 4 1 7 0 5 z - t + 0 4 6 4 6 ,4 7 1 8 一z - 2 ( 2 1 ) 爿“t 。) 2 t t 菇丽面了而丽百砑i 广 1 ) 输入h 。( 三) 后记为s ( 一) ,将会在后续的操作中用到。 1 3 线性预测分析与量化 短时分析与合成滤波器是基于l o 阶线性预测( l p ) 滤波器的。 线性预测合成滤波器被定义为: 11 l = 可 ( 2 2 ) 爿( z 1 + 萝五,z r 智 其中a ,f = 1 ,1 0 是量化后的线性预测系数,处理每帧时,都要先加一个 3 0 m s 的不对称窗,对加窗后的语音信号计算其自相关函数,弭利用自相关函数 进行短时预测,或称为线性预测分析。每8 0 个样值( 1 0 m s ) 对加窗后的语音数 据计算一次自相关函数,并用l e v i n s o n 算法将自相关函数转化为线性预测系数。 为了便于进行插值和量化,再把线性预测系数转化为线性线谱对( l s p ) 。插值后 量化和未被量化的滤波器系数又被转化为线性预测系数来为每子帧建立合成 加权滤波器。 ( 1 ) 加窗与自相关函数的计算 西北工业大学硕士学位论文第二章g 7 2 9 基本原理及其语音编码技术 线性预测分析窗口包含两个部分:第一部分分为半个汉明窗,第二部分为 一个余弦的1 4 。窗函数的计算公式为: 0 5 4 - o ,4 6 c 。s ( 两2 y r ) c o s2 z ( n - 2 0 0 ) ) 、 1 5 9 加窗后语音信号表示为 n = 0 ,1 9 9 h = 2 0 0 一2 3 9 ,( n ) = w 0 ( n ) s ( ”)n = 0 ,2 3 9 用它来计算自相关函数: 2 3 9 r ( 七) = s ( n ) j ( n - k ) l j = o ,l o n = k ( 2 3 ) ( 2 4 ) ( 2 5 ) 为避免输入值太小而引起的运算问题,r ( o ) 的下限设为1 0 。通过将自相关 系数乘以( 七) ,对自相关系数进行6 0 h z 的带宽扩展: 一帕1 芋,2 - 。 ( 2 6 ) 其中f o = 6 0 h :是扩展带宽,工= 8 0 0 0 h :是抽样频率。另外,r ( o ) 还要乘以 一个白噪声校正因子1 0 0 0 1 ,这相当于加一个一4 0 d b 的噪声背景。修正后的自相 关系数由下式给出: ,( 0 ) = 1 0 0 0 1 r ( o ) ;r ( 女) = w l a g ( k ) r ( k ) k = 1 一,1 0 ( 2 7 ) ( 2 ) l e v i d s o n d u r b i n 算法 用修正自相关函数,( 后) 求解线性预测滤波器系数臼。( f = l ,l o ) ,即求解下 列方程组: 口,( 1 , - k 1 ) = 一r 7 ( t ) k = 1 ,1 0( 2 8 ) 在本算法中采用的是经典的l e v i n s o n d u r b i n 算法求解,该算法的实现是用下面 的递归进行: 两北t 业大学硕十学位论文 第二章 g 7 2 9 基本原理及其语音编码技术 e o l :,7 ( o ) 缸a o , 亍- q t 匹1 三a j - l r ( i - j ) ,e 川 d i , i = k 加,= 1 t oi 一1 。口:口? 一1 】一f a i r 3 砂i = 1 一k :) e i 圳 最后的结果是给出滤波器的系数口,j = l ,, 1 0 ,且有口。= 1 0 。 ( 3 ) 线性预测( l p ) 系数到线谱对( l s p ) 的转化 为了便于量化和插值,线性预测滤波器的系数日,i = 0 ,1 0 要转化为线谱对 ( l s p ) 。对于1 0 阶的线性预测滤波器,线谱对参数定义为下面两个式子的根: f ( z ) = 爿( z ) + z 。1 1 a ( z 。) ( 2 9 ) 和疋( z ) = 4 ( z ) 一2 。1 a ( z 。) ( 2 1 0 ) 多项式e 。( z ) 是对称的,而( z ) 是非对称的。所以每个多项式只计算前5 个系数即 可。用下列递推关系很容易得到: f l ( “i + + 1 1 ) ) = :a 口, 。+ 1 + 一a 口l ,o 。_ 一, ,- + f ,i l ( ( i 力)i ! 。0 :i :i 薯4 ( 2 11 ) 0 + 1 ) = 口;+ l 一口l o 一,+ 正( f ) = , 、。 这里,:( 0 ) = ( 0 ) = 1 0 。 ( 4 ) 线谱对系数的量化 线谱对系数q 。的量化使用的是规范化频域f o ,i t 】中的线谱频的形式的 q = a r c o s ( q )i = l ,l o( 2 1 2 ) 一个可切换的4 阶移动平均( 姒) 预测滤波器用于当前帧的线谱频系数。 计算得到的和预测得到的系数之间的差用一个两级矢量量化器量化。第一级使用 的码本l 是个有1 2 8 个码字( 7 b i t s ) 的l o 维矢量化。第二级为两个5 维码本 上:,l ,的矢量量化,每个码本包含3 2 个码字。 首先从第个码本上l 中选出使未加权的拘方误差最小的码字厶,再对定义 在第二级低端部分的第一:个码本l 2 进行搜索。计算( 2 2 ) 定义的加权均方差m s e , 西北t 业大学硕士学位论文 第二章g 7 2 9 基本原理及其语音编码技术 选出使误差最小的码字:。利用选出的第一级码本的码字厶和第二级的低端部 分厶,从码本3 中选出第二级的高端部分,最后选出使均方误差最小的矢量 3 。 ( 5 ) l s p 系数的内插 量化的( 非量化的) l p 系数用于第二子帧。对第一子帧,量化的( 非量化 的) l p 系数是用相邻子帧的对应参数线性内插得到的。l s p 系数在正弦域进行, 令玑“是当前l o m s 帧的l s p 系数,吼”是前一帧l o m s 的l s p 系数,那么两 个予帧的l s p 系数内插由下式给出: 予帧1 :扩1 = 0 5 q ,”9 + o 5g “”“ 子帧2 :吼”= 口,渤”“i = l ,1 0( 2 1 3 ) 此式同样适用于量化的辱。 ( 6 ) l s p 转换为l p 系数 当l s p 系数完成量化和内插,还要再转换为l p 系数a 。用g ,迭代计算系数 z ( f ) 和五( f ) 。由a ( o , ( f ) 可以得到巧( z ) 和易( z ) ,分别乘以( 1 + z - i ) 和( 1 一z _ 1 ) 就得到f ( z ) l 和f ( z ) 2 即 z ,( ) 2 z ( f ) + z ( f 1 ) ,f = 1 。,5 ( 2 1 4 ) 厶( i ) = ( f ) 一,2 ( j 1 ) ,i = 1 ,5 最后计算l p 系数: f, l o 5 ( f ) 4 - 0 5 五( i ) i = 1 ,5 q2 1, ( 2 1 5 ) l o s f , ( 1 1 一i ) - 0 5 ( 1 1 一i ) i = 6 ,1 0 1 4 感知加权 感知加权滤波器是基于未量化的线性预测滤波器系数a ,的,可由下式给出 阿北工业大学硕七学位论文 第二章g 7 2 9 基本原理及其语音编码技术 一糍= 篆筹 b 旧 由变量和r z 来确定滤波器( z ) 的频率响应,所以适当调整这两个变量的值可 以使感知加权获得更为有效的效果,这可以通过将_ 和吃作为输入信号谱形状的 函数来实现。如果子帧的内插频谱分类为平坦( f l a t = 1 ) ,那么加权因子 1 = 0 9 4 ,r 2 = 0 6 ;如果分类为倾斜( f i a t = o ) ,则_ = o 9 8 而乇的值接近上界, 根据当前子帧连续两个l s p 系数之间的最小距离准则达到自适应,以获得 的白 适应变化值: d m 。= r a i n b “一甜,】i = 1 ,9( 2 1 7 ) 用线性内插计算 的值: r 2 = 一0 6 d 。i + 1 0 ,0 4 r 2 ( 0 7 ( 2 1 8 ) 予帧中加权语音信号由下式给出: 1 0 1 0 s 。( ”) = s ( ”) + ,r 。s ( n f ) 一q s 。( n - i ) ,n = o ,3 9 ( 2 1 9 ) i = lj = l 加权语音信号用于估计语音帧中的基音周期。 1 5 开环基音分析 为了减少最佳自适应码本搜索的复杂度,将搜索范围限制在一个候选的基音 周期。附近。由开环基音周期分析得到。开环基音分析每l o m s 帧进行一次, 它使用的是加权语音信号s 。( ”) 。先计算三个最大的自相关函数r ( f ,) ( f = 1 , 2 ,3 ) 然后归一化。在选择较小范围的归一化相关函数的条件下,先出三个归一化相关 函数中的最大值,即较低范围内的短延时被选中,对应自相关较长的延时。下面 的算法就是确定最好的开环延时乙: 西北i :业大学硕士学位论文第二章g 7 2 9 基本原理及其语音编码技术 乙= t i r ( 乙) = r ( fl ) 矿r ( f 2 ) o 8 5 r ( 乙) r ( k ) = r ( f :) 乙= t 2 e n d i f r 1 ( 岛) 0 8 5 r ( 乙) r ( 乙) = r ( f ,) 毛= r 3 e n d 这个过程将延时范围分为三个部分,有利于选出较小的值,避免了基音的 倍频。 1 6 脉冲响应的计算 加权合成滤波器肜( z ) j ( :) 的冲激响应 ( 聆) 用于自适应码本和固定码本的 搜索。每个子帧计算一次。脉冲信号经滤波器a ( z r , ) 后,再相继经1 五( z ) 和 l 五( z r 2 ) 得到 ( ) 。 1 7 目标信号的计算 自适应码本搜索用的目标信号x ( 盯) 是从加权语音信号s 。( 聍) 中减去加权合 成滤波器的残差,( n ) 通过合成滤波器l j ( z ) 和加权滤波器的组合,然后决定予帧 的激励,这些滤波器的初始状态由滤波残差和激励信号的差来调整。这些滤波器 的存储器的调整将在后面详细说明。 。 残差信号的计算方法由下面的公式给出: 1 0 “ r ( h ) = s ( n ) - 口。s ( n - i ) n = o ,3 9 ( 2 2 0 ) 1 8 自适应码本搜索 自适应码本参数( 或基音参数) 是延迟和增益,在自适应码本实现基音滤 西北t 业大学硕七学位论文 第_ 二章g 7 2 9 基本原理及其语音编码技术 波器逼近过程中,激励信号在一个子帧长度内不断重复。在搜索阶段,l p 残差 扩展激励使闭环搜索简单化,每一子帧( 5 m s ) 作一次自适应码本搜索。在第 子帧,基音延时i 在 1 9 ;,8 4 封范围,分辨率为l 3 分数延时,在【8 5 1 4 3 】范围 1 -?2 内是整数延时。在第二予帧,基音延时疋始终在1 i n t ( 五) 一5 亏,缸( 五) + 4 纠的范 围内搜索,其分辨率为i 3 的分数延时,其中i n t ( t ,) 是指第一子帧基音分数延时 正的整数部分。这个范围适合于互跨在延时范围的边的情形下。 用闭环分析的最小化的加权方误差来决定每一子帧的最佳延时。第一子帧 的基音延时正的搜索是在丌环基音延时乙附近一个小范围( 6 个样点) 内进行 的。闭环基音搜索的准则是使原始语音和重建语音之间的均方误差最小化,即使 r ( t ) 最大。 x ( n ) y k ( n ) r ( 七) = 昔 一 ( 2 2 1 ) 、z y , ( ) y 。( n ) yn = o 这里x q ) 是目标信号,n ( ”) 是在延时k 的过去滤波激励( 过去的激励与 ( n ) 卷 积) 。 对于确定正的毛,如果最佳整数闭环延时小于8 5 ,那么在最佳整数延时附 近的分数应作测试。插值的过程是利用基于汉明窗的正统函数的f i r 滤波器b z ( 其系数如表2 2 所示) ,窗函数的截断在1 1 处,在1 2 处( b u 0 2 ) = 0 ) 填充 0 ,滤波器的截止频率( 一3 d b ) 为3 6 0 0 h z ,用下面的公式计算r ( k ) 内插分数一2 3 、 1 3 、0 、1 3 、2 3 的值: 月( 七) 。= e r ( j 】 一f ) 6 1 2 ( f + 3 f ) + r ( k + i + 1 ) b 1 2 ( 3 - t + 3 0 ,= o ,1 ,2 ( 2 2 2 ) 这里t = 0 , i ,2 对应分数0 ,1 3 ,z 3 。 西北工业大学硕士学位论文第二章g 7 2 9 基本原理及其语音编码技术 表2 - 2f i r 滤波器6 1 2 的系数 o0 9 0 0 8 3 940 1 0 5 5 7 0 8 0 0 3 1 2 1 7 10 7 6 0 0 8 450 1 2 1 1 2 0 9 o 0 1 5 7 3 8 20 4 2 4 0 8 260 0 4 7 6 2 4 1 0 0 0 0 0 0 0 30 0 8 4 0 7 870 0 1 6 2 8 5“一0 1 1 5 9 2 5 ( 1 ) 自适应码本矢量的产生 确定基音延时后,在给出的整数延k 和分数延时t 处内插过去的激励”( n ) 来 计算自适应码本矢量v : 99 v c n ) = u ( n - k + i ) b 3 。( f + 3 f ) + u ( n - k + 1 + i ) b 3 。( 3 - t + 3 i ) l = 0j = 0 h = 0 ,3 9 ,t = 0 ,l ,2 ( 2 2 3 ) 这个插值滤波器6 0 ,是由在2 9 处截断的汉明正弦函数j j 0 9 ,在+ 3 0 处填 充0 ( b 3 0 ( 3 0 ) = 0 ) ,其截止频率为3 6 0 0 h z ( 一3 d b ) 。表2 - 3 所示为6 3 0 系数。 表2 - 3 滤波器6 3 0 系数 o 0 8 9 8 5 1 7 6- 0 0 8 4 9 1 91 20 0 5 0 8 3 51 80 0 1 9 3 4 02 4 0 0 0 3 6 5 8 l0 7 6 9 2 7 170 0 3 6 9 2 51 30 0 1 9 3 4 01 9o 0 1 3 7 5 52 5 _ o 0 0 5 0 2 7 2 0 4 4 8 6 3 58 0 0 9 5 5 3 3 1 40 0 2 3 0 8 3 2 0 o 0 0 0 0 02 6- o 0 0 2 4 0 5 3 0 0 9 5 9 1 5 90 0 6 8 9 3 6 1 50 0 3 3 5 4 3 2 l 0 0 0 9 4 0 0 2 7 o 0 0 1 0 5 0 40 1 3 4 3 3 31 00 o o 0 0 01 60 0 1 6 7 7 42 20 0 0 9 0 2 92 8 0 0 0 2 7 8 0 5一o 1 7 8 5 2 81 1- o 0 5 0 4 0 4 1 7- 0 0 0 7 4 6 6 2 3 0 0 0 2 3 8 l2 90 0 0 2 1 4 5 ( 2 ) 自适应码本延时码字的计算 第一子帧基音延时z 用8 b i t 编码,第二子帧5 b i t 编码。分数延时t 分别 用它的整数部分i n t ( t ) 和分数部分f r a c l 3 ( f r a c = 一1 , 0 ,1 ) 来表示。基问索引p 1 按 如下编码: 肛3 x ( i n t ( t 1 ) - 1 9 ) + f r a c 矿f ( i n t ( t t ) 8 5 ) 1 9 7糍 8 6 篡1 4 3 蜘1 f r a c 挈0 1 1 ( 2 :4 , 矿正= = 。 基音延时t 的值编码与墨的值有关,与前面的说明相同,分数延时7 2 也是用整 数部分i n t ( t 2 ) 分数部分加c 3 ( f r a c = 一1 , 0 ,1 ) 来表示,编码表示为p 2 : p 2 = 3 x ( i n t ( t 2 ) 一t 。) + f r a c + 2( 2 2 5 ) 两北i :业大学硕士学位论文第二章g 7 2 9 基本原理及其语音编码技术 这罩的f m m 是由t 推出( 即前面所述的五的边界) 。 为增强编码的抗随机比特误码性能,在第一子帧基音延时索引p 1 引入奇偶 校验位p o ,对p l 的高6 位作异或操作即得到p o 。 ( 3 ) 自适应码本增益的计算 自适应码本增益的延时确定后,其增益g 。可由下式计算 3 9 x ( ) y ( ”) g p = 等l 一0 - g ,s 1 2 j ,( h ) y ( n ) r 2 2 6 ) 这里x ( n ) 是目标信号,y ( h ) 是自适应码本矢量滤波信号( 即矿( z ) 五i z ) x c v ( n ) 的 零状态响应) ,也就是v ( n ) 和 ( 月) 的卷积: h y ( ”) = v ( i ) h ( n 一0 = o ,3 9 ,一0 1 9 固定码本的结构和搜索 f 2 2 7 ) 固定码本是代数码本结构,用正负号脉冲交错( i n t e r l e a v e ds i n g e p u l s e p e r m u t a t i o n ,i s p p ) 设计。在这个码本中,每个码矢量含有4 个非零脉冲,每 个脉冲的幅度或正或负,如表2 4 所示给定的位置: 表2 4 固定码本的结构 脉冲符号位置 10s + - 1m o051 01 52 02 53 03 5 1 ls l+ 一lm il6 l l 1 62 l2 63 l3 6 1 2s 2+ 一1m 2271 21 72 22 73 23 7 13 s 3+ 一1m 3381 31 82 32 83 33 8 码本矢量c ( n ) 由4 0 维零矢量在4 个位置放上4 个单位脉冲并乘以对应的符 号构成: c ( n ) = s o 艿( 刀一, o ) + s l t $ ( n m 1 ) 十j 2 8 ( n 一脚2 ) + s 3 3 ( n m 3 ) 以= 0 ,3 9 ( 2 2 8 ) 这里的8 ( 0 ) 是单位脉冲。 ( 1 ) 固定码本搜索过程 用加权输入语音s 。( ) f 和加权重构语音之间的均方误差最小化准则来搜索 1 两北工业人学硕+ 学位论文第二章g 7 2 9 基本原理及其语音编码技术 固定码本中的码矢。其过程是目标信号z ( m 减去自适应码本的贡献 x ( ”) = z ( n ) 一g p y ( ) , = 0 ,3 9 ( 2 2 9 ) 定义矩阵h 为下三角t o e p l i t z 卷积矩阵,主对角线元素依次为 h ( o ) ,h 【1 ) ,h ( 3 9 ) 。矩阵o = h 7 h ,对这个矩阵的元素由下式给出: 3 9 q 6 ( i ,) = h ( n - i ) h ( n - j ) ,i = o ,3 9 ;f _ o ,3 9 ( 2 3 0 ) n = j 目标信号x 。( ”) 与脉冲响应h ( n ) 的卷积得到相关信号d ( n ) : 3 9 d ( n ) = 互。( h ) ( h 一,) ( 2 3 1 ) 如果c 。是第k 个固定码本矢量,则使下式最大的码本矢量即为固定码本所 搜索的目标: q e ( d ( 一) g ( 妒) c a - c k ( 2 3 2 ) 这里的t 为矩阵转置。 为简化搜索过程,应用集中搜索法。即在进入最后循环之前,预先算出一个 试验门限值,仅在超过这个门限时进入选手循环,进入循环的最大次数是固定的, 因此只有很小比例的码本搜索。门限值的计算是基于相关系数c 的。在进入搜索 前,要先计算与前三个脉冲相对应的相关系数的最大绝
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东省荣成市第二十一中学七年级地理上册 3.1多变的天气说课稿 新人教版
- 2.雄伟的塔教学设计-2025-2026学年小学美术二年级上册人美版(常锐伦、欧京海)
- 4.14.2 保护生物圈是全人类的共同义务2025-2026学年七年级下册生物同步说课稿(北师大版)
- 1.2 复杂多变的关系 说课稿-2024-2025学年统编版道德与法治九年级下册
- 2025年中考数学试题分类汇编:圆的有关性质(9大考点39题)(第1期)解析版
- 我的太阳教学设计-2025-2026学年初中音乐人音版七年级上册-人音版
- Lesson 12 Whose is this This is myyourhisher Whose is that That is myyourhisher 教学设计-2025-2026学年初中英语第一册 上半册新概念英语
- 2023三年级英语下册 Unit 4 Where is my car配套说课稿 人教PEP
- 2025年全国中式面点师理论考试题库(含答案)
- 第五课 做守法的公民教学设计-2025-2026学年初中道德与法治统编版五四学制八年级上册-统编版五四学制2018
- 中医护理在疼痛中的应用
- GB/T 44977-2024卫星导航定位基准站网终端定位服务安全技术规范
- 人教PEP版五年级上册英语全册教案(6个单元整体教学设计)
- 七年级体育 立定跳远测验教案 人教新课标版
- 学校保洁外包服务投标方案(技术方案)
- Pep小学英语六年级上册教案-全册
- 人教鄂教版六年级科学上册全册教学设计教案
- 关爱流浪小动物(教学设计)-2024-2025学年三年级上册综合实践活动教科版
- 2024年新高考试题分析及2025届备考策略建议课件
- 中东及非洲天然甜菊行业现状及发展机遇分析2024-2030
- 《山区公路桥梁典型病害手册(试行)》
评论
0/150
提交评论