




已阅读5页,还剩56页未读, 继续免费阅读
(信号与信息处理专业论文)g729语音压缩编解码协议的理解及其dsp的实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 h 3 2 3 协议作为国际电信联盟( i t u ) 制定的标准,能同时提供话音、数据和多 媒体等多种业务,为通信产业带来了广阔的发展空间。g 7 2 9 做为h 3 2 3 支持的语 音压缩编码协议,具有低延迟,高语音质量的优点,被i t u 确定为8 k b s 语音编码 标准。 数字信号处理因其实时快速的处理能力在通信领域得到了广泛的应用,本文 讨论的是在d s p 上实现g 7 2 9 语音编码算法。为了满足数据的大动态范围、高精 度和实时性的要求,选用美国德州仪器公司( t o 的高性能浮点d s pt m s 3 2 0 c 6 7 1 3 。 本文首先介绍了f i 7 2 9 的算法原理,它是共轭结构代数码本激励线性预测的算 法标准。为了提供低速率的高质量的语音,( 1 7 2 9 协议采用了三种新的技术方案: 使用帧间插值预测的线谱对量化,码本搜索的预选和利用后向预测的增益矢量量 化。 接着说明该算法在d s p 上实现的硬件环境。 最后讨论了基于上述硬件系统的软件设计,主要分为三个部分:d s p 的初始 化程序、中断服务程序和语音编解码程序。利用基音的特点对算法中的开环基音 分析进行了简化,减少了计算量;针对6 7 1 3 体系结构特点,对c 代码提出了一些 有效的优化措施,包括使用编译器选项和软件流水等。 实验结果表明,优化后的g 7 2 9 算法在一定程度上降低了该算法的复杂度,其 输出语音仍然保持了很高的合成品质。 关键词:语音压缩编码,g 7 2 9 算法,d s p ,优化,开发环境 a b s t r a e t a b s t r a c t h 3 2 3i sa ni t us t a n d a r dw h i c hp r o v i d e ss e v e r a ls e r v i c e si n c l u d i n gs p e e c h d a t a a n dm u l t i m e d i ae t c b e i n gas p e e c hc o m p r e s s i o nc o d e rp r o t o c o ls u p p o r t e db yh 3 2 3 , g 7 2 9h a st h ea d v a n t a g e so fl o wb i t r a t ea n dh i 曲s p e e c hq u a l i t ya n db e e ns e l e c t e db y i t u ta s8 k b ss t a n d a r d d i g i t a ls i g n a lp r o c e s s i n gi sw i d e l ya p p l i e df o ri t sr e a l t i m ep r o c e s sa b i l i t y t h e p r i n c i p l e sa n di m p l e m e n t a t i o no fg 7 2 9a l g o r i t h mo nd s pp r o c e s s o ra r ed i s c u s s e di n t h i sp a p e r t om e e tt h er e q u i r e m e n tf o rd a t al a r g ed y n a m i cr a n g e ,h i 曲p r e c i s i o na n d r e a l t i m ep r o c e s s i n g , t e x ah a s t r t u m e n th i 曲p e r f o r m a n c e3 2 一b i t f l o a t i n g - p o i n td s p t m $ 3 2 0 c 6 7 1 3i ss e l e c t e d f i r s t l y i ti n t r o d u c e dt h e a l g o r i t h m o f ( 2 7 2 9w i t h c o n j u g a t e s t r u c t u r e a l g e b r a i c c o d e - e x c i t e d l i n e a r - p r e d i c t i o n i tu s e st h r e en e wt e c h n i q u e si no r d e rt og e t l o wb i t - r a t ea n dh i g hs p e e c hq u a l i t y , w h i c ha r eq u a n t i z a t i o na n di n t e r p o l a t i o nf o rl s p c o e f f i c i e n t s ,p r e s e l e c t i o nf o rc o d e b o o ks e a r c ha n dp r e d i c t i o nf o rv e c t o rq u a n t i z a t i o no f g a i n s s e c o n d l yt h i sp a p e rd i s c u s s e dt h eh a r d w a r ee n v i r o n m e n t f i n a l l y , t h i sp a p e rd i s c u s s e dt h es o f t w a r es y s t e md e s i g nb a s e do na b o v eh a r d w a r e p l a t f o r m ,i n c l u d i n gt h ed s pi n i t i a l i z a t i o np r o g r a m ,t h ei n t e r r u p tr e q u e s ts e r v i c ea n d s p e e c hc o d i n g na l s op r o p o s e ds o m ee f f e c t i v eo p t i m i z e dm e t h o d sa c c o r d i n gt ot h e c h a r a c t e r i s t i c so f t h ea l g o r i t h ma n dd s p c h i p s i m u l a t i o n ss h o wt h ea l g o r i t h mc a nc o n s i d e r a b l yr e d u c et h ec a l c u l a t i o nb u r d e na n d t h eo u t p u ts p e e c hh a sah i 曲r e c o n s t r u c t e dq u a l i t y k e y w o r d s :s p e e c hc o m p r e s s i o nc o d i n g , g 7 2 9a l g o r i t h m ,d s p , o p t i m i z a t i o n , d e v e l o p m e n te n v i r o n m e n t i i 表目录 表目录 表2 1 ( 3 7 2 9 协议编码参数的比特分配5 表2 2 固定码本的结构9 表3 1d s p 上电时工作状态的配置1 8 表4 1c s l 命名规范2 2 表4 2 不同,7 值所节省的计算量的比较3 l 表4 3 段类型信息表3 3 表4 4c 6 7 1 3 存储器映射一3 4 表4 5 部分函数优化4 6 v 图目录 图目录 图1 1 语音信号处理框图1 图2 1 编码工作原理图6 图2 2 解码工作原理图7 图2 3 矢量量化原理图8 图2 - 4 线性预测关系图1 2 图2 - 5 合成分析原理1 4 图2 - 6 语音合成分析原理1 5 图3 - 1 系统原理框图1 6 图3 2 a c 0 1 内部原理框图1 9 图3 3a c 0 1 工作时序1 9 图3 - 4 a c 0 1 与t m s 3 2 0 c 6 7 1 3 的m c b s p 的连接示意图。2 0 图4 1 程序流程图2 1 图4 2p l l 工作原理图2 4 图4 - 3m c b s p 串口控制寄存器2 5 图4 - 4 编码流程图2 9 图4 5p r o f i l e r 的信息3 2 图4 - 6 m a p 文件信息| 3 3 图4 7 函数调用次数3 4 图4 8 优化前的函数时钟周期3 6 图4 9 编译选项3 7 图4 1 0 使用编译选项后的时钟周期数3 7 图4 - 1l 调用库函数后c o rhx 的时钟周期数一3 9 v l 图目录 图4 1 2 软件流水线信息4 0 图4 - 1 3 函数s y n _ f i l t o 优化前的时钟周期数4 1 图4 1 4 函数s y n _ f i l t 0 优化后的时钟周期数一4 1 图4 1 5 函数r e s i d u 0 优化前的时钟周期数4 2 图4 1 6 函数r e s i d u 0 优化后的时钟周期数4 3 图4 1 7 查表法的时钟周期数4 4 图4 1 8 动态计算的时钟周期数4 4 图4 一1 9 优化后部分函数时钟周期4 6 图4 2 0 输入语音波形4 6 图4 2 l 输出语音波形4 6 缩略词表 缩略词表 c o d e - e x c i t e d码本激励线性预测 c e l p l i n e a r - p r e d i c f i o n c s l c h i ps u p p o r tl i b i a r y 片上支持库 c o n j n g a t e - s t r u c t u r e 共轭结构代数码本激励线 c s a c e l p a l g e b r a i c - c e l p 性预测 d s p d i g i t a ls i e n a lp r o c e s s o r 数字信号处理器 e n h a n c e dd i r e c tm e m o r y 增强的直接存储器存取 e d m a a c c e s s e l e c t r i c a l l ye r a s a b l e 电可擦除可编程 e e p r o m p r o r r a m m a b l er o m只读存储器 e m i fe x t e m a lm e m o r yi n t e r f a c e 外部存储器接口 g e n e r a lp u r p o s e通用输入输出 g p i o i n p u t o u t p u t h p ih o s t p o r ti n t e r r a c e主机接口 i c i n t e g r a t e dc i r c u i t集成电路 i n t e r l e a v e ds i n g l e - p l u s e交错单一脉冲排列 i s p p p e r m o t a f i n n i r q i n t c n - u p tr e q u e s t 中断请求 i n t e m a t i o n a 】国际电信联盟 r f u t e l c c o l m n u n i c a t i o n su n i o n ,i a gj o i n tt e s ta c t i o ng r o u p 联合测试行动小组 l s pl i n es p e c 仃a lp a i r线谱对 l s fl i n es o e c t r a lf r e q u e n c y线谱频 l pl i n e a rp r e d i c t i o n 线性预测 m a m o v i n ga v e r a g e 移动平均 m o sm e a no p i n i o ns c o r e平均意见得分 m i p s m i l l i o ni n s t r u c t i o n sp e r百万条指令每秒 v 缩略词表 s e c o n d p c mp l u s ec o d em o d u l a t i o n脉冲编码调制 p l l p h a s e l o c k e d - l o o p 锁相环 r e d u c e di n s t r u c t i o ns e t 精简指令集 r j s c c o m p u t i n g r r d xr e a lt i m ed a t ae x c h a n g e实时数据交换 s t a t i cr a n d o ma c c c s s静态随机存取存储器 s r a m m e m o r y s y n c h r o n o u sd y n a m i c 同步动态随机存取存储器 s d r a m r a n d o ma c c e s sm e m o r y s y n c h r o n o u sb u r s ts t a t i c 同步突发静态存储器 s b s r a m r a n d o ma c c e s sm e m o r y s p is e r i a lp e r i p h e m li n t e r r a c e串行外设接口 v l i w v e r yl o n gi n s t r e c t i o nw o r d 超长指令宇 v o v e c t o ro u a n t i z a t i o n矢量量化 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名:围熟蕉銎日期:2 6 年岁月珥日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:导师签名: 日期:乡们 第一章绪论 第一章绪论 通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形 式。语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科, 其系统框图如图1 - 1 所剥1 ) 【2 ) 【3 】: 叵囚 至 也堕h 巫丑 广上 l 传输或存储l 【j 图1 - 1 语音信号处理框图 但是依靠上述简单的数字化过程得到的信号数据量太大,不能适应当今带宽 资源日趋紧张的社会需求,因此压缩编码技术应运而生。语音压缩编码技术是语 音信号在数字化过程中,为了尽可能减少编码量所采用的某种技术或算法,其目 标是一定的程度上保证音质的前提下,去掉冗余信息,力求以最小的编码字表示 原来的语音信息,以降低编码速率,减少占用的带宽和存储空间。 1 1 语音压缩编码技术 1 1 1 语音压缩编码技术的分类 语音压缩编码归纳起来可以分成三大类:波形编码、参数编码、混合编码。 1 1 1 1 波形编码 波形编码的目标是让解码器恢复出的模拟信号在波形上尽量与编码前的原始 波形一致,也即失真最小。其方法简单,具有适应能力强、语音质量好的优点, 但所需编码速率高,占用的带宽大,在6 4 k b i t s 至3 2 k b i t s 之间音质优良,当编码 率低于3 2 k b i t s 的时候,音质明显降低,1 6k b i t s 时音质非常差。 1 1 1 2 参数编码 参数编码又称为声码器,提取语音信号的特征参数进行编码,在解码端根据 电子科技大学硕士学位论文 接收的参数再合成声音。声码器编码后的码率可以做得很低,如2 4 k b i t s 。其缺点 是合成语音质量较差,往往清晰度可以而自然度很差,难于辨认说话人是谁;算 法的复杂度比较高,且对噪声十分敏感。常用的音频参数有共振峰、线性预测参 数等。 1 1 1 3 混合编码 综合考虑上述两种编码方式的优缺点和现实需求,所形成的新的编码方式。 混合编码。其编码速率约在4 k b i t s - - 16 k b i t s 之间,音质比较好,复杂程度在波形 编码器和声码器之间。码激励线性预钡i j ( c e l p ) 语音编码算法,是目前国际上低速 语音编码的热点之一。在围绕它所制定的标准中,i t u t g 7 2 3 ,i t u t g 7 2 9 在多 媒体终端协议h 3 2 3 和i p 电话的语音编码部分,获得了广泛应用吲【5 】【6 】f 7 1 。 1 1 2 语音压缩编码的性能 语音编码研究的基本问题是,在给定编码速率条件下,如何得到尽可能好的 重建语音质量,并保证尽可能小的编码时延和适当的算法复杂度。或者说是在给 定编码质量、编码时延及算法复杂度的条件下,如何降低语音编码所需的比特率。 其性能包括四个部分:编码速率、编码的复杂度、编码的时延和合成语音质量。 1 1 2 1 编码速率 编码速率又称比特率,是指一个编码器的信息速率,它决定编码器工作时占 用的信道带宽。电话语音信号的频率范围是3 0 0 3 4 0 0 h z ,所以,按照n y q u i s t 准则, 采样频率取正28 k h z 【8 】。 1 1 _ 2 2 编码算法复杂度 编码算法复杂度与语音编码的质量密切相关。在相同比特率情况下,采用相 对复杂的一些算法,会获得更好的语音质量;或者说,对于相同的语音质量,采 用相对复杂的算法会降低编码比特率。 编码算法的复杂度与硬件的实现有密切关系,它决定了硬件实现的复杂程度、 体积、功耗及成本。 1 1 2 3 编码时延 编码时延表示运行编码算法所引入的延迟。这个延迟是算法本身引起的,与 处理时间无关。语音编码是以帧为单位进行的,只有在收到当前帧的最后一个样 2 第一章绪论 点后,才会输出编码参数。这时,编码时延就是帧的时间长度。在实时语音通信 系统中,语音编码时延同线路传输时延一样,对通信质量有很大的影响。一般的, 编码的算法越复杂,时延越大。 1 1 2 4 合成语音质量 合成语音质量通常从主客观两个方面来度量。主观评价方法通常用平均意见 打分的办法,最常用的是m o s 。m o s 采用5 级评分标准,在数字通信中,通常认 为m o s 在4 0 4 5 分为高质量数字化语音,达到长途电话网的质量要求,接近透 明信道编码,也常称为网络质量或长途质量。m o s 在3 5 左右称为通信质量,这 时可以感到重建语音质量的下降,但不影响正常通话。m o s 在3 0 以下称为合成 语音质量,重建的语音具有足够的可懂度,但自然度及说话人的确认方面不好。 1 2 数字信号处理 数字信号处理( d i g i t a ls i g n a lp r o c e s s i n g ,简称d s p ) 是- - f 涉及许多学科而 又广泛应用于许多领域的新兴学科。2 0 世纪6 0 年代以来,随着计算机和信息技术 的飞速发展,数字信号处理技术应运而生并得到迅速的发展。在过去的二十多年 时间里,数字信号处理已经在通信等领域得到极为广泛的应用【9 】【1 0 】。 d s p ( d i g i t a ls i g n a lp r o c e s s o r ) 芯片,即数字信号处理器,主要用于实现实时 快速的各种数字信号处理算法。根据数字信号处理的要求,d s p 芯片一般具有如 下主要特点: 硬件乘法器,可在一个指令周期内可完成乘累加运算; 哈佛结构,程序和数据空间分开,可以同时访问指令和数据; 独立的直接存储器访问总线及其控制器; 具有低开销或无开销循环及跳转的硬件支持; 快速的中断处理和硬件i o 支持; 专门的数据地址发生器; 支持流水线操作,使取指、译码和执行等操作可以并行执行; 丰富的外设,可与外部环境协调工作; 3 1 3 本文组织结构 本文主要介绍g 7 2 9 语音编解码协议并在d s p 芯片t m s 3 2 0 c 6 7 1 3 上的实现。, 组织结构如下: 第二章介绍g 7 2 9 协议的原理及特点。 第三章d s p 实现的硬件环境。 第四章d s p 实现的软件设计,并给出了基于算法和6 7 1 3 结构的优化方法,以 及最终的实验结果。 第五章总结。 4 第二章g 7 2 9 语音编码原理 第二章g 7 2 9 语音编码原理及特点 g 7 2 9 是i t u t 制定的编码速率为8 k b s 的语音编码标准,算法是共轭结构代 数码本激励线性预测( c s a c e l p ) 。将模拟信号首先经过带通滤波器滤波,8 0 0 0 h z 抽样,再转化为1 6 b i t 线性p c m 码,就得到了g 7 2 9 的编码器所使用的输入数字 信号。解码器的输出由类似的方法转化为模拟信号。从编码器到解码器的比特流 也在g 7 2 9 协议中作了规定【7 儿副h 。 该算法的帧长为1 0 m s ,对应于抽样率为8 0 0 0 h z 的语音数据流的8 0 个样值。 对于每一帧,语音信号经过分析,得到编码参数( 线性预测滤波器系数,自适应 码本与固定码本的索引与增益) 。编码器参数的比特分配见表2 - 1 。 表2 1g 7 2 9 协议编码参数的比特分配 参数 码字第一子帧第二子帧每帧共计 线谱对( l s p )l 0 ,l 1 ,l 2 ,l 3 1 8 自适应码本延迟 p 1 ,p 2 851 3 基音延迟校验 p 01l 固定码本索引 c 1 ,c 2 1 31 32 6 固定码本符号s 1 ,s 2 448 码本增益( 第一级) g a l ,g a 2 336 码本增益( 第二级) g b l ,g b 2 448 总计 8 0 g 7 2 9 编码器对语音信号进行1 0 m s 一帧的编码,另外,还有5 m s 的前瞻,所 以全部的算法时延为1 5 m s 。在实际的实现中,这个编码器的附加时延还取决于下 列因素: 编码和解码运算处理所需的时间; 通信链路的传输时延; 将音频数据与其它数据复接所需的时间。 2 1 编码端的算法原理 图2 - 1 描述了编码端的工作原理。 图2 - 1 编码工作原理图 在预处理模块,输入语音被高通滤波定标,处理后的信号作为后边所有后续 分析的的输入信号。对每个1 0 m s 语音帧都进行一次线性预测( l p ) 分析,计算出 1 0 阶l p 滤波器的系数。这些系数转化为线谱对( l s p ) 并用两级矢量量化( v q ) 器进行1 8 比特的量化。激励信号的选定,通过一个合成分析过程实现,以使原始 语音与重建语音翅间的误差,在感知加权失真测量中最小。 对每个子帧( 5 m s ,4 0 个样值) 求出其激励参数伺定和自适应码本参数) 。 第一子帧使用的量化和未量化的线性预测滤波器系数是经过插值的,第二子帧的 线性预测滤波器直接使用这些参数。每一帧根据感知加权语音信号估计出开环基 音延迟。然后对每一子帧进行以下操作:将线性预测的残差信号通过感知加权滤 波器,得到目标信号h “j ,计算出加权合成滤波器的冲激响应“m j 。利用目标信号 即2 j 与加权合成滤波器的冲激响应“坼j ,在开环基音延速的附近,进行闭环基音延 迟分析,得出自适应码本的延迟与增益。第一子帧的基音延迟编码为8 比特;第 二个子帧采用用5 比特差分编码。将目标信号。婶j 减去自适应码本的贡献,就得到 了新的目标信号x ( n ) ( 二次残差信号) 。这个新的目标信号,在固定码本搜索过程 中用于寻找最优激励信号。固定码本激励使用的是1 7 比特的代数码本。固定码本 与自适应码本的增益,被量化为7 比特的矢量。最后,用计算出的激励信号来更 新滤波器的状态。 6 蔓三童垒! ! ! 堕童塑塑堕望 一 2 2 解码端的算法原理 相对于编码来说,译码是其反过程,算法比较简单。图2 2 描述了解码器的原 理。 首先从接收到的比特流中,解出参数索引。用这些索引来获得相应于一帧的 编码器参数。这些参数包括线谱对系数、两个分数基音延迟、两个固定码本矢量、 两套自适应码本与固定码本增益。对每一个子帧,将线谱对系数进行插值并将其 转化为线性预测滤波器的参数。然后,对每一个子帧进行下列操作: 自适应码本和固定码本矢量分别乘以它们的增益之后相加就得到了激励 信号; 将激励信号通过线性预测合成滤波器,就得到重建语音; 重建语音要经过一个后处理阶段。这个阶段包括一个基于长时和短时合成 滤波器的后滤波器,接着是一个高通滤波器和幅度加倍的操作。 2 3 g 7 2 9 语音编码特点 图2 2 解码工作原理图 为了提供低速率的高质量语音,( 2 7 2 9 协议采用了三种新的技术:帧间插值预 测的线谱对矢量量化、固定码本搜索的预选和利用后向预测的增益矢量量化。 2 3 1 线谱对矢量量化 l s p 是频域上的线性预测分析方法。由于它是频域参数,所以和语音信号谱 包络的峰有更紧密的联系。同时,用线谱对参数构成合成滤波器容易保证稳定性, 甲甲 厂_ 习广f 1 篡于 叫竺1 , 2 卫m 罔鹏本褥l 掣卜l | i =一j 茁 明天重誓 i 8 第二章g 7 2 9 语音编码原理 2 3 2 固定码本的结构与搜索 固定码本采用代数结构,其特点是交错单一脉冲锕i j ( i s p p ) ,每个码本矢量仅 有4 个非零脉冲,幅度为+ 1 或1 ,并且可以呈现在固定位置。脉冲的可能位置列 于表2 2 。固定码书的搜索,实际上就是找出这4 个非零脉冲的位置。 表2 2 固定码本的结构 脉冲 符号位置 l o j 0 :i 肌o :0 , 5 ,1 0 ,1 5 , 2 0 ,2 5 ,3 0 ,3 5 l l 5 :1 m l :1 , 6 ,1 1 ,1 6 ,2 1 ,2 6 ,3 1 ,3 6 1 2 5 2 :1 m 2 :2 ,7 ,1 2 ,1 7 ,2 2 ,2 7 ,3 2 ,3 7 b 墨:1 m 3 :3 , 8 ,1 3 ,1 8 ,2 3 ,2 8 ,3 3 ,3 8 4 ,9 ,1 4 ,1 9 ,2 4 ,2 9 ,3 4 ,3 9 固定码本搜索的理论依据是,使加权输入语音和加权合成语音之间的均方差 最小。假设吼是第k 个固定码本矢量,则使下式的值最大的码本矢量,就是固定码 本搜索的目标: 。2 ( 鼢m ) 2 & 一l 萎曲坠) j e t c :q b c k 其中,d g ) 是目标信号与合成滤波器的冲激响应间的相关信号 转置。矩阵包含了合成滤波器的冲激响应的相关系数。 ( 2 - 1 ) t 代表矩阵的 由于一个代数结构的码本矢量,只包含有4 个非零脉冲,因此可以对其进行 快速搜索。对于一个给定的矢量& ,式( 2 一1 ) 的分子由下式给出: 3 c = s ,d ( m ,) i = 0 ( 2 - 2 ) 其中,m ,是第i 个脉冲的位置,5 ,是其幅度。式( 2 1 ) 的分母的能量由下式给 出: 323 e = 妒( m m ) + 2 叩,矿( m m ) 4 0 “4 “ ( 2 3 ) 为了简化搜索过程,脉冲的幅度通过量化信号d 如) 预先决定。这是通过将某 一位置上的脉冲的幅度设为与d 忡j 在那个位置的符号相同来实现的。在码本搜索 之前,先要进行以下步骤。首先,信号d 0 ) 被分解为两个部分:绝对值p ( n l 和符 号s i g n d ( n ) 。然后,通过引入符号信息来修正矩阵西: 9 皇王型垫奎兰堡主堂篁笙苎 妒( f ,j ) = s f g n p ( f 诳瞎n p u ) p ( f ,j ) i = 0 ,3 9 j = f + 1 ,3 9 ( 2 - 4 、 式( 2 3 ) 中的矩阵西的主对角线元素要除以2 : o ,f ) = o 5 ( f ,i ) i = o ,3 9 f 2 5 1 式( 2 2 ) 中的相关系数由下式给出: c = l d ( m 。i + l d ( m - 】+ p :l + p 】( 2 - 6 ) 式( 2 3 ) 中的能量由下式给出: e 2 = ( m 。,珊。) + m ,m 。) + 妒m 。,m ) + :,m :) + 妒7 。,m :) + 。,m :) + 妒幻,m ,) + 妒( 研。,m ,) + b t ,研,) + 妒m :,m ,) ( 2 - 7 ) 为进一步简化搜索过程,在搜索之前在第四个循环前设定一个互相关项的阈 值,只有当前三个脉冲所给出的互相关项c 超过这个阈值时才进入第四个循环进 行搜索。同时,为了控制码本搜索的最大计算量,算法规定了各子帧能够进入第 四循环的最大次数,这样便可实现对代数码本快速有效的搜索。 2 3 3 增益量化 自适应码本增益和固定码本增益用7 比特量化编码。增益码本搜索是使原始 语音与重建语音之间的均方加权误差最小,这可以由下式给出: e = x t x g2 p y | y + g :z t z - - 2 9 p x ? y 一2 9 c x t z + 2 9 p g t y f z ( 2 - 8 ) 其中x 是目标矢量,y 是自适应码本矢量通过加权合成滤波器的零状态响应, z 是固定码本矢量与 ( n ) 的卷积: z ( ”) = c ( f m 0 一i ) n = o ,3 9 i = 0 ( 2 - 9 ) 2 3 3 1 增益预测 固定码本增益可以表示为: g c2 y g c r 2 一l o ) 其中g c 是基于以前的固定码本能量的预测增益,y 是校正系数。 固定码本贡献的平均能量由下式给出: 1 0 第二章g 7 2 9 语音编码原理 耻1 0 1 。蝙萎。o ) 2 j 矢量。0 ) 用固定码本增益g f 修正后,被修正的固定码本能量由2 0 1 0 9 9 c + e 给出。用占( ”) 表示第m 子帧的减去平均能量( 用d b 表示) 的固定码本贡献: e = 2 0 1 0 9 9 。+ e c e r 2 。1 2 ) 其中,= 3 0 d b ,是固定码本激励的平均能量。增益g c 可以表示为e ( m ) ,e 。, 和岳的函数: g 。= 1 0 m 5 一灿 f 2 - 1 3 ) 由以前的固定码本贡献的对数能量,预测当前固定码本对数能量,就得到了预 测增益g c 。四阶的预测按如下步骤进行。预测能量由下式给出: 4 剧2 善旷” ( 2 - 1 4 ) f i l 1 2 - 1 4 l 其中【6 1 ,b :,b 3 ,6 4 】- 【o 6 8 ,0 5 8 ,0 3 4 ,0 1 9 】是移动均值( m a ) 预测系数,d ( 是 第m 子帧的预测误差的的量化值,定义为: u ( ”) = e 枷) 一童( ”) f 2 1 5 ) 预测增益g c ,通过式( 2 1 3 ) d p 将e 忡由它的的预测值来代替而得到: 季。= 1 0 叭5 一丘扣。 f 2 一1 6 1 校正系数y ,通过下式与增益预测误差相联系: u ( “) = e “一言”= 2 0 l o g ( 7 ) f 2 1 7 ) 2 3 3 2 增益量化码本的搜索 自适应码本增益g p 和校正系数,是使用两级共轭结构码本量化的矢量。名 词“共轭”是指每一个输入矢量被量化为两个码本的线性合成。这种结构同时减 少了计算的复杂程度和对存储量的要求。第一级包含一个3 比特的二维码本f ,第 二级包含一个4 比特的二维码本g 。每个码本的第一个元素,代表量化自适应码 本的一部分,第二个元素代表固定码本增益校正系数的一部分。在分别给定码本f 和g 的索引,和。时,量化的自适应码本增益由下式给出: g ,= e ( f ,) + g 。也) ( 2 _ 1 8 ) 电子科技大学硕士学位论文 量化固定码本增益由下式给出: 季。= 或尹= 芭忆( f ,) + g 2 【f gj ) r 2 _ 1 9 、 这种共轭结构,通过使用预选过程而简化了码本搜索。预选所用的最佳自适 应增益和固定码本增益,从式( 2 8 ) 中继承得到的。码本f 包含了8 个码字,其中 第二个元素( 相应于g c ) 一般比第一个元素( 相应于占,) 的值要大。这个偏移允 许使用g c 的值来进行预选。在这一预选过程中,四个第二个元素接近g c 的一串矢 量被选出。类似地,码本g 包含1 6 个码字,其偏移指向第一个元素( 相应于g p ) 。 八个第一个元素接近g ,的一串矢量被选出。因此,对于每个码本,选出了5 0 的 最佳候选矢量。然后对剩余的4 8 = 3 2 种可能性进行完全搜索,这两个矢量的组 合,使得式( 2 8 ) 的加权均方误差最小。这一预选过程,在没有引入相对于完全搜 索明显的质量降低的情况下,减少了搜索的复杂度。 同时,在该协议中还使用了以下的关键技术: 2 3 4 线性预测分析 线性预测是语音信号处理中的核心技术,目的是去除语音信号间存在的短时 相关性。其重要性在于,它能极为精确地估计语音参数( 例如基音、共振峰、谱、 声道面积函数等) ,而且计算简单快捷。线性预测分析所包含的基本概念是,一个 语音的抽样,能用过去若干个语音抽样的线性组合来逼近。通过使实际的语音抽 样和线性预测值之间的差值的平方和( 在一个有限的间隔上) 达到最小值,能够 决定唯一的一组预测系数。其时域表示如下: j ( n ) = 口。s ( n - i ) + c u ( n ) 式中,口j 为预测系数,j ( n ) 为语音信号,“( n ) 为预测误差 性,p 为线性预测的阶数。由此可确定一个数字滤波器( :) : 日( z ) = 1 一q :1 h ( z i 、s ( n ) 和( n ) 的关系如图2 - 4 所示。 图2 4 线性预测关系图 2 ( 2 2 0 ) 具有白噪声的特 r 2 - 2 1 ) 第二章g 7 2 9 语音编码原理 预测误差滤波器一( z ) 是系统传递函数日( z ) 的逆滤波器,即: 上 彳( z ) = g h ( z ) = 1 一口f z l i = 1 ( 2 2 2 ) 语音信号通过预测误差滤波器a ( 2 ) 后得到的输出,就是预测误差信号8 l 川, 它的定义是 e ( n ) = s ( n ) 一口声( n f ) 2g u ( n ) ( 2 2 3 ) 如果一个p 阶时变线性预测器,与实际产生的语音信号的系统越接近,则8 t 圳 就越接近信号源。对于准周期的浊音信号,在每一基音周期的开始处预测误差较 大,利用这一原理,可以用8 【”j 来检测基音周期。将线性预测应用于语音,不仅 希望利用其预测功能,而且要求它提供一个非常好的声道传递模型。- 2 ) ,它是 一个全极点模型。在基于参数模型的系统辨识研究中,常常假定其中系统的传输 函数为有理函数,即变量z 的有理分式。这种有理函数分为三种情况:只有零点没 有极点,称为滑动平均模型,即m a 模型;只有极点没有零点,称为自回归模型, 即a r 模型;既有零点又有极点,称为自回归滑动平均模型,即a r m a 模型。这 三种模型中,最常用的是a r 模型,我们的预测分析正是基于全极点模型假设的。 全极点模型计算简单,其作参数估计是对线性方程求解的过程,较为容易。如果 不考虑鼻音和摩擦音,语音的声道传递函数就是全极点模型。 2 3 5 感知加权 感知加权的依据,是人耳的掩蔽效应,即在语音频谱中能量较高的频段即共 振峰处的噪声,相对于能量较低频段的噪声而言,不易被感知。因此,在度量原 始语音与合成语音之间的误差时可以计入这一因素。在语音能量高的频段,允许 二者的误差大一些,反之则小一些。为此,可以引入一个频域感知加权滤波器, 以【_ ,j 来计算二者的误差: , 8 = i i s ( 厂) 一s ( ,) i ( ,) 矽 ;。 ( 2 - 2 4 ) 其中,工是抽样率,s ( 厂) ,s ( ,) 分别是原始语音与合成语音的傅立叶变换。 为使e 达到最小值,在整个积分域内应保持常数值。这可以通过调整激励参数,使 p 达到最小值来实现。这样,只要在能量较大的语音频段内使w 【,) 较小,而能量 较小的频段内l _ ,j 较大,就能拾高前者的误差能量而降低后者的误差能量。为此, 可取的感知加权滤波器形( 厂) 在z 域的表达式缈( z ) 为: 电子科技大学硕士学位论文 ,i - - 职驴参2 芝z 乙万g j z , - ”1 r1 ( 2 2 5 ) 感知加权滤波器的特性,由预测系数 口r ,和加权因子y 来确定。y 取值在0 1 :l f 日q ,由它控制共振峰区域误差的增加。当y 为1 时,矿( z ) 为1 ,没有加权。y 为0 时,形( z ) 等于一( z ) ,由此得到的噪声能量,分别与语音频谱的能量一致。 2 3 6 合成分析技术 合成分析技术的原理如图2 - 5 所示。预先假定信号的生成模型,由于这种模型 的生成值与观测值存在误差,通过反馈控制,可求出误差最小的模型参量,并作 为模型的特性值。因此,在这种方法中,重要的是生成模型的选择,参量的初始 值设定,误差评价尺度及误差为最小的算法的选择。 图2 5 合成分析原理 根据这种方法进行语音编码时,一般在编码端配备编码和解码两个部分,本 地解码就是完成合成功能。为了获得更好的听觉效果,使合成语音和原始语音的 差值通过一个感知加权滤波器,找出使得均方误差最小的一组语音参数,其原理 如图2 - 6 所示: 1 4 第二章g - 7 2 9 语音编码原理 图2 6 语音合成分析原理 将解码引入编码过程,是低速率语音编码的又一项重要技术。当解码与编码 的误差达到最小时,编码即可输出,从而降低了误码率,提高了音质。 1 5 电子科技大学硕士学位论文 3 i 概述 第三章硬件系统 语音信号经由a d 转换成数字信号,送入d s p 的m c b s p 0 中的d r r 寄存器, 由e d m a 中断程序读入,存放于主程序开辟的接收缓冲区中。每当缓冲区满,立 即调用语音编码程序,进行编解码处理,并将处理后的数据存储到发送缓冲区中, 由e d m a 中断写入m c b s p 0 的d x r 寄存器。这样,重构的语音数字信号,由 m c b s p 0 的d x 引脚输出,经d a 转换为模拟信号,再现语音。系统原理框图如图 3 1 所示: 图3 i 系统原理框图 由上图可以看出,该系统主要由两个部分组成:d s p 及其辅助电路,a d 、 d a 转换模块,同时为了能处理大量的数据,外扩了一片4 m 的s d r a m 。 3 2 硬件系统的设计 3 2 1 d s p 模块设计 以浮点d s p - - t m s 3 2 0 c 6 7 1 3 为整个系统的核心,完成算法的执行,并控制整 个系统的协调工作。 3 2 1 1 d s p 的选择 在本系统中,选用t i 公司浮点d s p 中性价比较高的t m s 3 2 0 c 6 7 1 3 ,能够满 足算法的高精度及实时的要求。 t m s 3 2 0 c 6 7 1 3 的主要特点如下 【1 2 】 1 3 】 1 4 1 : 高性能浮点d s p ,最高主频可达2 2 5 m h z ,运算
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届山东省东营市四校连赛化学九年级第一学期期中监测模拟试题含解析
- 离婚协议书:婚姻终止后财产保值增值合作协议
- 离婚协议签订中关于子女抚养权纠纷的法律解决途径
- 离婚协议中赡养费支付期限与方式创新性研究
- 离婚协议书范本:融合心理辅导、情感疏导的合同样本
- 文化传媒私人工厂影视制作人员劳务派遣合作协议
- 宁波市精装修商品房买卖合同及售后装修质保服务协议
- 理发店员工培训与发展聘用一体化服务协议
- 婚姻破裂房产过户合同范本:合法合规操作指南
- 离婚协议书附带债务偿还及财产分割细则
- 一、长方体和正方体表面涂色的
- 《广播电视编导概论》课程教学大纲
- kinetix6200和6500模块化多轴伺服驱动器用户手册
- DB51∕T 2502-2018 中国川菜烹饪技术用语及菜名翻译规范
- 国外期刊运作的主要模式及发展趋势
- 区域性再生资源集散市场实施方案
- 液氨使用与储存安全技术规范
- 《幼儿园大班第一学期家长会》 PPT课件
- 施工手册柱式桥台
- PCR室作业指导书_检验SOP文件
- 上海市初级中学英语学科教学基本要求
评论
0/150
提交评论