(通信与信息系统专业论文)基于tms320dm642的g726音频编解码器实现与应用.pdf_第1页
(通信与信息系统专业论文)基于tms320dm642的g726音频编解码器实现与应用.pdf_第2页
(通信与信息系统专业论文)基于tms320dm642的g726音频编解码器实现与应用.pdf_第3页
(通信与信息系统专业论文)基于tms320dm642的g726音频编解码器实现与应用.pdf_第4页
(通信与信息系统专业论文)基于tms320dm642的g726音频编解码器实现与应用.pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

(通信与信息系统专业论文)基于tms320dm642的g726音频编解码器实现与应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士论文基于t m $ 3 2 0 d m 6 4 2 的g 7 2 6 音频编解码譬实现与应用 摘要 玎u t 是通信行业的国际标准化组织,语音编码技术是该组织的一个分支,曾经 制定了大量语音压缩标准,包括o - 7 2 1 ,g 7 2 3 ,g 7 2 6 。g 7 2 8 和g 7 2 9 等,这些编码 器在程控交换机,多媒体存储和语音通信包括v o i p 等领域得到了广泛应用。本文讨 论了基于数字信号处理器( d s p ) 的g 7 2 6 实时编解码的实现与应用。涉及到的芯片 为1 1 公司的t m s 3 2 0 d m 6 4 2 。主要的研究内容包括g 7 2 6 的压缩算法、实时编解码 器系统的搭建和g 7 2 6 代码的优化。 本文首先研究了g 7 2 6 压缩理论。重点讨论了a 律和i l 律对数压缩、自适应预 测、自适应量化。在此基础上,分析了编解码器各模块的对应代码。接着介绍了基于 n 公司的1 m s 3 2 0 d m 6 4 2 芯片的g 7 2 6 实时编解码器系统。然后重点讲解了在c c s 开发环境下,对g 7 2 6 代码的优化工作。它的主要工作流程为:在c c s 开发环境下, 按照要求对代码修改并编译成功后,利用c c s 的p r o f i l e r - r 具,对全部代码进行剖析, 找出消耗时钟周期较长的代码进行优化。以满足系统的实时性要求。最后,本文还分 析了g 7 2 6 在不同码率下语音压缩编解码的质量并对比了优化前后代码消耗的时钟周 期数。 关键词:g 7 2 6 、数字音频压缩、数字信号处理器、代码优化 硕士论文 基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编解码器实现与应用 a b s t r a c t r 1 1j 玎i sa l li m e m a t i o n a ls t a n d a r d i z a t i o n 讲羽n i z a l i o fc o m m u n i c a t i o n si n d u s w a sab r a n c ho ft h i so r g a n i z a t i o n , s p e e c h - c o d i n gt e c h n o l o g yh a se s t a b l i s h e dag r e a tl o to f s p e e c hc o m p r e s s i o ns t a n d a r d s , i n c l u d i n gg 7 2 1 ,g 7 2 3 ,g 7 2 6 ,g 7 2 8 ,g 7 2 9 a n de t c t h e s e c o d e r sh a v eb e e nw i d e l ya p p l i e di nm a n y 蝴ss u c ha ss p ce x c h a n g e m u l t i m e d i a m e m o r y , s p e e c hc o m m u n i e 斌i o n sa n dv o i p t h i sa r t i c l ew i l lm a i n l yd i s c u s sa b o u tt h e i m p l e m e n t a t i o na n da p p l i c a t i o no fr e a lt i m ec o d c co fg 7 2 6b a s e do nd s et h er e f e r r e d c h i pi st m s 3 2 0 d m 6 4 2f m m t ic o m p a n y t h ek e yt e s e a r c h e si n c l u d et h ec o m p a s s i o n a l g o r i t h mo fg 7 2 6 ,e s t a b l i s h m e n to fr e a lt i m ec o d e cs y s t e m , a n do p t i m i z a t i o no fg 7 2 6 a l g o r i t h m f i r s t l y , t h ea r t i c l ei n t r o d u c e sa b o u tt h ec o m p r e s s i o na l g o r i t h mo fg 7 2 6 t h ek e y p o i n t sa r ea b o u ta - l a wa n di l - l a wl o g a r i t h m i c r n p r e s s i o n , a d a p t i v ep r e d i c t i o n , a n d a d a p t i v eq a a n t i z a t i o n s e c o n d l y , i ti n u v d u c e sa b o u tr e a lt i m ec o d e cs y s t e mo f g 7 2 6b a s e d o nt m s 3 2 0 d m 6 4 2f r o mt ic o m p a n y t h i r d l y , i te x p l a i n sa b o u tt h eo p t h n i z a t i o no fg 7 2 6 a l g o r i t h mu n d e rc c s t h em a i nw o r k i n gp r o c e s si sa sb e l o w :t om o d i f ya n dc o m p i l et h e c o d ea sr e q u i r e d , t oa n a l y z et h eg l o b a lc o d ei nv i r t u eo fp r o f i l et o o l s , t of i n do u tt h ec o d e w h i c hc o n s u n l c sl o n g e ri p ca n do p t i m i z ei no r d e rt or e a l i z er e a lt i m e i nt h ee n d ,t h i s a r t i c l ea n a l y z e st h eq u a l i t yo fs p e e c hc o m p r e s s i o nc o d c co fg7 2 6u n d e rd i f f e r e n tc a d e r a t e s ,a n dc o m p a r e st h ei p cb e f o r ea n da f t e ro 砸m i z a f i o n k e yw o r d :g 7 2 6 、d i g i t a la u d i oc o m p r e s s i o n 、d i g i t a ls i g n a lp r o c e s s o r ( d s p ) 、c o d eo p t i m i z a t i o n n 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成粟,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生签名: 蔓亟聋 7 月,日 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的部分或全部内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名:塞啦玺2 呻年7 月午日 硬士论文基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编解码嚣实现与应用 1 绪论 1 1 引言 为了能在数字信道中传输模拟话音或图像信号,必须使模拟信号数字化 9 1 。若采 用1 3 折线a 律p c m 的方法,一路话音信号数字化后的数码率或传信率为6 4 k b s , 而彩色电视信号数字化后的传信率高于1 0 0 m b s 。它们在传输时需占用的信道带宽要 比原始模拟信号带宽大许多倍。为节约带宽,需要降低该传信率,于是人们在过去几 十年内,研究开发了多种话音或图像信号压缩编码技术。 早在1 9 7 2 年,c c l 2 一i ( 现已改称为n u t ) 已制定出关于p c m 话音编码的国际 建议g 7 1 1 。其规定每话路抽样率为8 k h z ,每样点量化为8 b i t ,即每话路数码率为 6 4 k b s 。为了压缩编码速率,i t u t 又于1 9 8 4 年制定出3 2 k b s 每话路数码率的建议, 并建议采用自适应差分脉码调制。后来,为了进步降低每话路数码率,1 1 u - t 相继 制定出1 6 k b s 每话路数码率的建议g 7 2 8 、8 k b s 的建议g 7 2 9 和5 3 6 3k b s 双速率 的建议g 7 2 3 1 。更低速率的话音编码国际标准尚未制定出来,但有一些地区性或国 家标准。在各种1 6 k b s 以下的低速率话音压缩建议中,大多采用基于线性预测理论 的方法。在线性预测理论中还要涉及到有关话音生成方面的理论。 a ) 话音生成 从话音声学的观点来看,不同的话音是由于发音器官的声音激励源和口、鼻腔 内声道的不同形状而引起的。话音主要分为浊音和清音。 浊音,又称有声音。此时的声音激励是声带。来自肺部的气流,流经声带,使 声带产生振动。由声带产生声波,经过口、鼻腔,从嘴唇和鼻孔辐射出去。该浊音是 一种准周期。此波形周期t p 称为基音周期,t p 通常在3 1 5 m s 内,一般女声的基 音周期较短,男声较长。话音频谱有小峰点,出现在基音点和基音谐波点上,能量主 要集中在低于3 k h z 范围内。 清音又称为无声音。此时,声带不振动;肺部产生的准平稳气流通过发音器官 某部分,产生较小幅度的声波。清音波形很像随机起伏的噪声波形,没有准周期特性。 它的频谱能量主要集中在话音带的高端,不存在明显的小峰点,即无谐波峰点。 口、鼻腔声道是截面不均匀的,形状随时间而变化的音响管道,此可等效为时 变谐振、反谐振系统。声道端口嘴唇,对声波起辐射作用。声道的这些特性,可用一 个时变线性系统来模拟由于声道的频率特性与谐振曲线类似,在浊音频谱上包络上 出现几个高峰,称之为共振峰。清音频谱中没有共振峰存在。 b ) 话音信号产生模型 根据以上发音过程的分析,可将话音信号发声过程抽象为图1 l l 的数学模型。 硕士论文基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编解码器实现与应用 图中,周期信号源表示浊音激励源,该源需输入一个参数“基音周期”;随机噪声源 表示清音激励源;“清一浊”选择开关,用来选择语音种类,以便形成所需的语音; g 是增益系数,它的大小控制着话音的强度,主要决定于气流的强度;图中时变线性 系统对应于物理声道,它的特性代表着声道特性。 图1 1 1 话音信号数学模型 在这里,最广泛地被采用的是线性预测编码,这时“话音信号数学模型”中的 声道特性取离散时间全极点滤波器,它的传输函数为: 日( z ) = g 1 一罗口。z “ 乞- ( 1 1 1 ) 式( 1 1 1 ) 中吼滤波器的( 时变) 系数; h ( z ) 传输函数的z 变换形式。 式( 1 1 1 ) 已把图中相乘g 的因素考虑在内。由此得到该滤波器的输出序列为: 式( 1 1 2 ) 中k 输入话音信号的时域抽样值; 毛输出话音信号的时域抽样值。 c ) 线性预测编码( l p c ) 声码器: 最广泛地被采用的基于模型的编码方法,是线性预测编码。声源编码器或声码 器,不是跟踪话音信号的波形,而是提取“形成话音信号”的特征参数,所以又称之 为参数编码的声码器。该声码器以图1 1 1 模型为基础,认为不同话音是不同的激励 信号参数和声道滤波器参数所决定。因而可以把较短时间段( 常设定为2 0 m s ) 内的 2 )2l(2俨 g + i卜 x i 口 ,矧 = h x 硬士论文 基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编解码器实现与应用 话音参数,比如音类型、基音周期、增益参数和滤波器参数等,提取出来,然后把这 些已提取参数加以编码和发送。不同的2 0 m s 时间段有不同的话音参数。在接收端译 出数码,获得话音特征参数,恢复话音。从原始话音求得特征参数的过程称为l p c 分析;由编码参数重新获得话音的过程称为l p c 合成。 为了提取原始话音的特征参数,采取以下步骤。首先设毛为源输出样序列,我 们可以构成毛的预测值采用已加权的线性组合: 磊= 窆q 柚 ( 1 1 3 ) 这是一个p 阶预测器的输出,吼称之为预测系数。此预测器根据第n 个样值前的p 个样值矗_ 1 毛- 2 而,的线性组合,计算出当前的第n 个预测值磊第二步是定义一 个预测误差为: 岛2 磊一翰2 一z 阱_ 一171 箱 ( 1 1 4 ) 然后,令预测误差的均方值e 心2 ) 最小,就可以解出增益g 和一组预测系数i q i 。 1 2g 7 x x 音频编码标准的发展 当前编码技术发展的一个重要方向就是综合现有的编码技术,制定全球的统一 标准,使信息管理系统具有普遍的互操作性并确保了未来的兼容性【4 2 j 。国际上,对语 音信号压缩编码的审议在c c i t r 下设的第十五研究组进行,相应的建议为g 系列, 多由i t u 发表。 , i t u t 和国际标准化组织( i s o ) 先后提出一系列有关音频编码的建议。 1 9 7 2 年首先制定了g 7 1 16 4 k b p sa 律p c m 编码标准。 1 9 8 4 年又公布了g 7 2 1 标准( 1 9 8 6 年修订) 。它采用的是自适应差分脉冲编码 ( a d p c m ) ,数据率为3 2 k b p s 。这两个标准适用于2 0 0 3 4 0 0 h z 窄带话音信号,已 用于公共电话网。针对宽带语音( 5 0 7 k h z ) 。 、 i t u - t 制定的0 7 2 2 编码标准,它的数据率为6 4 k b p s 。它可用于综合业务数据 网( i s d n ) 的b 通道上传输音频数据。之后公布的g 7 2 3 建议中码率为4 0 k b p s 和2 4 k b p s 。 g 7 2 6 中码率为1 6 k b p s 。 m 1 于1 9 9 0 年通过了1 6 - 4 0 k b p s 镶嵌式a d p c m 标准g 7 2 7 。低码率、短延时、 高质量是人们期望的目标。在a t & tb e l l 实验室,1 6 m , p s 短延时码激励( l d - c e l p ) 编码方案的基础上,经过优化。 n u t 在1 9 9 2 年和1 9 9 3 年分别公布了浮点和定点算法的g 7 2 8 标准。该算法延 3 硕士论文基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编解码嚣实现与应用 时小于2 m s ,话音质量可达m o s 4 分以上。i s 0 的运动图像专家组在制定运动图像编 码标准的同时,为图像伴音制定了2 0 k h z 带宽的1 2 8 k b p s 标准。 1 9 8 8 年欧州数字移动通信g s m 制定了泛美数字移动通信网的1 3 k b p s 长时预测 规则码激励( ,l l t p ) 语音编码标准。1 9 8 9 年北美蜂窝电话工业组织( c t i a ) 公 布了北美数字移动通信标准。它采用自适应码本激励日本的数字移动通信标准是 6 7 k b p s 的v s e l p ( 矢量和激励线性预测) 1 3d s p 芯片的应用 自从2 0 世纪7 0 年代末第一片数字信号处理芯片( d i g i t a ls i g r 山p t o t s s o i - s , d s p s ) 问世以来,d s p s 就以数字器件特有的稳定性、可重复性、可大规模集成,特别是可 编程性高和易于实现自适应处理等特点,给数字信号处理( d i g i t a ls i g n a lp r o c e s s i n g , d s p ) 的发展带来了巨大机遇,并使信号处理手段更灵活,功能更复杂,其应用领域 也拓展到国民经济生活的各个方面【2 l 】。近年来,随着半导体制造工艺的发展和计算机 体系结构等方面的改进,d s p s 芯片的功能越来越强大,使信号处理系统的研究重点 又重新回到软件算法上,而不再像过去那样过多地考虑硬件可实现性。而且随着d s p s 运算能力的不断提高,能够实时处理的信号带宽也大大增强,数字信号处理的研究重 点也由最初的非实时应用转向高速实时应用。 1 4 本文所做的工作 本文在第二章对g 7 2 6 涉及到的理论进行了分析与研究,重点讨论了其中的三个 模块:g 7 1 1 标准模块、自适应量化模块、自适应预测模块。在对各个模块的理论分 析之后,于第三章提供了编解码器的模块组成框图,并讨论了对应各模块的函数,还 给出了在c c s 开发环境,s i m u l a t o r 模式下的各码率编解码结果的对比以及编解码结 果的时域波形图和频谱图。第四章介绍了编解码器的系统硬件,包括1 m s 3 2 0 d m “2 这款芯片以及系统的硬件组成。第五章重点讨论了基于t m s 3 2 0 d m 6 4 2 平台的g 7 2 6 代码的优化,有针对性的介绍了优化代码的各种方法,并给出了编解码后的语音效果 评测以及代码优化前后消耗时钟周期的对比。这一步骤至关重要,它的结果直接影响 到代码的执行效率。最后对编解码器的设计做了总结并指出了需要进一步完成的工 作。 4 硕士论文基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编 码嚣实现与应用 2g 7 2 6 编解码的原理及技术 2 1 非均匀量化 非均匀量化是根据信号的不同区间来确定量化间隔的。对于信号取值小的区间, 其量化间隔v 也小;反之,量化间隔就大。它与均匀量化相比,有两个突出的优点 首先,当输入量化器的信号具有非均匀分布的概率密度( 实际中常常是这样) 时,非 均匀量化器的输出端可以得到较高的平均信号量化噪声功率比;其次,非均匀量化时, 量化噪声功率的均方根值基本上与信号抽样值成比例。因此量化噪声对大、小信号的 影响大致相同,即改善t 4 信号时的信号量噪比f 9 】。 实际中,非均匀量化的实现方法通常是将抽样值通过压缩再进行均匀量化。所 谓压缩是用一个非线性变化电路将输入变量x 变换成另一个变量y ,即: y = f 【x ) ( 2 1 1 ) 非均匀量化就是对压缩后的变量y 进行均匀量化。接收端采用一个传输特性为: x = f 劬 1 时,a y 2 与a x 2 的比值就是压缩后量化间隔精度提高的倍数,也就是 非均匀量化对均匀量化的信噪比改善程度。当用分贝表示时,并用符号q 表示信噪 比改善程度,那么: _ 2 0 l g 怠) = 2 0 l ) ( 2 1 r 5 ) 例如,i l = 1 0 0 盯,对于,j 、佰号【x - o ) 阴情况: 睦h = 雨赤而b = 高= 丽1 0 0 这时,信号量噪比的改善程度为: = 2 0 l g 噻) = 2 6 7 翘 在大信号时,若x = l ,那么: 睦k t = 而瓦盎而= 而而而1 0 0 丽= 丽1 其改善程度为: o i l , = 2 0 l g 浮) = 2 0 1 9 ( 4 南6 7 ) = - 1 3 3 d b a x0 郾大信号时质量损失约1 3 d b 。根据以上关系计算得到的信号质量信嗓比改善程 度与输入电平的关系如表2 1 1 所列。这里,最大允许输入电平为o d b ( 即x = 1 ) ; q d b o 表示提高的信嗓比,而 q d b 0 表示损失的信噪比。图2 1 3 画出了有无压 扩时的比较曲线,其中,u = o 表示无压扩的信噪比,u = 1 0 0 表示有压扩的信噪比。 由图可见,无压扩时,信噪比随输入信号的减小迅速下降:而有压扩时,信噪比随输 入信号的下降却比较缓慢。若要求量化器信噪比大于2 6 d b ,那么,对于u = o ,输入 信号必须大于- 1 8 d b ;而对于p = 1 0 0 ,输入信号只要大于3 6 d b 即可。可见,采用压扩 提高了小信号的信噪比,从而相当于扩大了输入信号的动态范围。 7 硕士论文 基于t m $ 3 2 0 d m “2 的g 7 2 6 音频编解码嚣实现与应用 表2 1 1 信号量噪比改善程度与输入信号电平的关系 xlo 3 1 60 1o 0 3 1 20 o l0 0 0 3 输入信号电 o1 0 2 03 0 4 0,5 0 平f d b 【q 】d b 1 3 3 - 3 55 81 4 4 2 0 62 4 4 l | d b 图2 1 3 有无压扩的比较曲线 a 压缩率 所谓a 压缩律也就是压缩器具有如下特性的压缩律; 垆l + a j l l x a , o x _ l a ( 2 1 6 ) y :l + l n a x ,一1s 善s l。 l + i n 爿4 ( 2 1 7 ) 式中x 归一化的压缩器输入电压; y 一归一化的压缩器输出电压; a 压扩参数,表示压缩程度。 假设图2 1 4 所示的归一化曲线y = 胀) 是我们所要求的特性曲线,x 、y 均在1 与 + i 之同,且曲线在第一象限与第三象限奇对称。为了简便,第三象限部分的特性曲 线未画出。由于在y 方向上从1 到+ l 被均匀划分为n 个量化区间,因此,量化间隔 应为: 缈= 万2 s 硕士论文 基于t m s 3 2 0 d m 8 4 2 的g 7 2 6 音频编解码嚣实现与应用 图2 1 4a 律压缩特性 当n 很大时,司得: 蝇= 嘉缈b = 吾妄b鲫n 鲫 。 因此: 熹k :n a x , (218)2 方 式中五第i 个量化区间的中间值。 为了使信号量噪比不随信号x 变化,即保证小信号时的信号量化噪声比不因x 下降而变小,那么,应使各量化间隔随x 成线性关系,这样式( 2 1 8 ) 可以写成: 缸一 眨, 式中i p 比例常数。 当量化区间数很多( 即量化间隔很小) 时,可以将它看成连续曲线,因而式( 2 1 9 ) 成为线性微分方程: 妾屯 ( 2 1 1 0 ) 咖 。 将此微分方程求解得如下结果: y = 1 + 丢l l l z ( 2 1 若压缩特性满足式( 2 1 i i ) ,则可获得理想的压缩效果,即信号量噪比与信号 硕士论文基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编解码嚣实现与应用 幅度无关。图2 1 5 画出了该方程的曲线。由图可见,它没有通过坐标原点,但在 x = o 时,y - - 。这和我们要求的压缩特性曲线有一定差距,因此需要对它做一定的 修改。 a 律压扩函数就是对式( 2 1 1 1 ) 修改后的一种函数。在图2 1 5 中,通过原点 傲理想压缩特性的切线o b ,以o b 、b c 作为我们所要求的压缩特性。这样修改以后, 就必须用两个不同的方程来描述这两端曲线,且以切点b 为分界点。对于线段o b , 由于它是直线,所以仅需确定其斜律。设切点b 的坐标为( x l , y 1 ) ,则斜率为: 立i 1 “。1 其值由式( 2 1 1 1 ) 可得: 生l ,:三土 出蚋k 一置 暴 o 余 7 y t 。1 k l x l 图2 1 5 理想压缩特性曲线 故o b 匿线方程为: y = 瓦1 x(2112) 由此可见,当x = x l 对,y l = l k ,将它们代入式( 2 1 1 1 ) ,可得: 三k = l + k k 为 j 因而: 董= e 一耻。 所以,切点坐标为( p “,i k ) 。若将切点坐标x l 记为i a ,即令: i o 颈士论文 基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编解码器实现与应用 工= 二= e - ( - 1 ) 4 则: k = - l + l n a 再把它代入式( 2 1 1 2 ) 便可得到以切点o b 为边界的o b 段的函数式为: y :生。0 x 土 。 l + i n a a ( 2 1 1 3 ) 至于b c 段曲线的方程,由于它满足式( 2 1 1 1 ) ,故由此式可得: ) - - l + 志i n x = i n a 等1i n a ,三a 1 1 2 8 到x = l 的绝大部分范围内,l + 2 5 5 x 都是很接近原来的 2 5 6 x 的。所以,在绝大部分范围内的压缩特性仍和a 律非常接近,只是在x 寸o 的 小信号部分才和a 律有些差别。 如果式( 2 1 1 8 ) 中的2 5 5 用另一参数弘来表示。即令p = 2 5 5 ,那么,上式变 成: v :i n ( 1 + u x ) 。 i n ( 1 + z ) ( 2 1 1 9 ) 由于它是以l l 为参数的,故称为p 律压缩特性。此式与式( 2 1 3 ) 完全相同。 再来讨论鲡何霹;折线逼近式 ) 。这种方法要求首先计算 出r ( i ) ,再计算 幽o p t ( 1 【) ) ,称为前向自适应预测算法。但是,前向自适应预测会产生较 长的编码延迟时间( 约为1 5 - - 2 0 m s ) ,其运算量比较大,而且还要将 眼( k ) 传输给 接收端。因此,它只应用在低于1 6 k b s 的语音压缩编码系统中。 后向序贯自适应预测算法则采用序贯地不断修正预测系数 儡) 的方法来减少 瞬时平方差值d q 2 信号,使 啦( k ) 逐渐接近于最佳预测系数ho p l ) ,以达到最佳预测 状态。w i d r o w 提出的l m s 算法中,预测系数的序贯修正准则朝着负梯度方向来修正 伍k ) 。而且,它是以包含量化误差d q 的重建信号s 式k ) 为基础的。由图2 2 1 可知: 上 哝( 七) = 墨( 七) 一艺q ( 七) s ( 七一力 d q j 的梯度: v 哝2 ( 七) = 2 ( 七) v 吒( | ) ( 2 2 1 6 ) 1 7 硕士论文基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编解码罂实现与应用 q ( 七+ 1 ) = q ( 七) + 届( 七) 以( 七) 母( 七一o ( 2 2 1 7 ) 其中b i 是梯度系数,它决定了预测系数自适应速率。当b i 很小时,从理论 上说,自适应系统能使 系数接近于 啦o p t ,或者说,围绕 o p t 只有很小波动。但 既值不能太小,否则当信号统计特性有很快变化时,预测系数a i 将不能跟上其变化 关键问题是通过大量实验来确定最合理的梯度系数。 2 2 3 自适应量化 在实际电话网中,由于说话人声音强弱不同,传输电路衰耗不同,语音信号的 功率变化范围可达4 5 d b 左右。而最佳量化器的所有 d f i 、 d 。) 值均与输入量化器的 功率有关。为了使量化器始终能处于最佳状态或接近于最佳状态,量化器的量化电平 d 。) 、分层电平 d ,i ) 应能够自适应于输入方差5 d 的变化。 自适应量化方法有很多种,若严格根据输入方差6 d 2 来确定 d l i ) 与 d 。) 值,则称为 前向自适应量化;若根据前一时刻输出数字码i 或量化器输出值c l 硼( k - i ) 来确定 d “k ) ) 与 d q 。o c ) ) 值,则称为后向自适应量化。显然,后向自适应法比前向自适应法 易于实现,但必须合理选择算法使其能收敛于最佳量化器参数。 设均匀量化器第k 时刻量化间隔定义为。( _ i ) = 以+ ,( 七) 一以( 后) = ( | j ) ,第k 时刻 量化器短时输出方差估值艿;( 七) 可由如下递推公式推导出: 孑乙( 七) = q 艿孑( | i 一1 ) + ( 1 一嘶) 刃( 七一1 ) ( 2 2 1 8 ) 式中,田是常数,o 硼 1 。否乙( 七一1 ) 是( k 1 ) 时刻的估值。将式( 2 2 1 8 ) 两端除以 舌乙( 七一1 ) 项,可得: 1 善盟:q + ( 1 一时( k - d ( 2 2 1 9 ) 艿由( 七一1 )6 由( k - 1 ) 假定量化误差比较小,则量化器输入方差估值: 彦;( 七) * 蔬( t ) 量化间隔应自适应于输入方差估差z ( 七) 的变化,所以式( 2 2 1 9 ) n - - j 化成: 垒盟: ( | | 一1 ) = 【口:,+ ( 1 一q ) 孥生尘# ( 2 2 2 0 ) 占由( 七一1 ) 硕士论文基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编解码嚣实现与应用 由于上式中右端只取决于d 4 k - d ,即输出数字码1 1 ( k - i ) i ,所以上式又可写成: ( 七) = ( t - i ) 肘a i ( k - i ) i )( 2 2 2 1 ) 式( 2 2 2 1 ) 算法在有传输误码情况下,会产生误差扩散闯题,因此采用修正式: a ( k + 1 ) = ( 七) 4 + ,( i i ( k ) i ) ( 2 2 2 2 ) 式中,p 为抗误码因子,在有传输误码情况下,能使接收端。( 七) 与发送端 相接近。m 称为量化间隔调整因子,它取决于量化器输出码字1 0 0 ,即量化电平等级。 对于非均匀量化器,式( 2 2 2 1 ) 不能直接引用,而要引入定标因子y 。固定 非均匀量化器的输入信号d o 【) 先进行一次归一化运算: d ( k ) fd ( k ) y ( k ) ( 2 2 2 3 ) 对于语音信号,如k ) 可以采用式( 2 2 2 2 ) 形式进行自适应。它是一种快速瞬时 自适应,能较好的与语音信号电平变化规律相适应。对于数据调制解调器或音频信令 信号,其信号功率电平变动范围远小于语音,因而式( 2 2 2 3 ) 的瞬时自适应反而会 使量化器的量化间隔随最佳参数的起伏而引起过大波动,因此应选择慢自适应算法。 2 3 本章小结 本章主要研究了g 7 2 6 编解码所涉及到的理论知识,重点讨论了非均匀量化、自 适应量化和自适应预测。这些是做好本文工作的理论基础。相对于均匀量化,非均匀 量化的好处在于对小信号电平时,信噪比明显提高。但是对于大信号电平时,信噪比 相对低一些。由于线性p c m 码是对抽样信号电平的直接量化。所以,需要的比特位 较多。而a d p c m 编码则是对待量化值及其预测值的差值进行量化。因为该差值相对 于原始信号的电平值小很多,所以只需要相对较少的比特位。而本章所讨论的自适应 预测则能提供较为理想的预测电平值。在实际电话网中。语音信号的功率变化范围很 大,本章研究的自适应量化可以使量化器始终处于最佳状态或接近于最佳状态。 1 9 颈士论文基于1 m s 3 2 0 d m “2 的g 7 2 6 音频编解码嚣实现与应用 3g 7 2 6 编解码算法及代码模块 3 1g 7 2 6 编码算法框图及流程图介绍 3 1 1g 7 2 6 编码算法框图介绍 图3 1 1 表明了编码部分各模块的组成,其中k 为样本序列口1 1 图3 i 1g 7 2 6 编码组成模块 a ) 输入信号转换( n p n tp c m f o r m a tc o n v e r s i o n ) 该模块把输入信号从a 律或p 律转化为线性p c m 信号。 ”差值计算( d i f f e r e n c 圮c o m p u t a t i o n ) 该模块计算转换后的线性p c m 信号同预测信号的差值。 d ( 七) = 墨( 七) 一& ( 七) ( 3 1 1 ) c ) 自适应量化( a d a p t i v eq t u m t i z e r ) 根据初始参数的设置。对差值进行量化。为了提高代码的执行效率,本代 码的量化部分采用查表的方式。量化前先求1 0 9 ( d ( k ) ) ,并减去因子y ,该因子由 其它模块计算。 丸( _ j ) = l 0 9 2 ( d t ( k ) ) - y ( k ) ( 3 1 2 ) d ) 自适应反量化( i n v 黜a d a p t i v eq u a n t i z e r ) 在该算法中,反量化也是通过查表来完成的。这样可以提高代码的执行效 率。 d q ( 七) = 2 4 仙 ( 3 1 3 ) c ) 量化因子自适应( q u a n t i z e rs c a l ef a c t o ra d a p t a t i o n ) 硕士论文 基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编解玛嚣实现与应用 该模块是用来计算因子y ( k ) 的。该因子在量化和反量化中使用,输入参数 分别为:量化输出i ,自适应速度控制a i 。 咒( j | ) = ( 1 2 4 ) 贝七) + 2 - 5 w i j ( 七) i ( 3 1 4 ) 其中:1 0 6 儿( 七) 1 0 0 0 日自适应预测及信号重建( a d a p t i v ep r e d i c t o ra n dr e c o n s t r u c t e ds i g n a l c a l c u l a t o r ) 该模块的主要功能为通过信号差值的量化值山来计算预澳9 信号s e ( k ) 。该 预测器由两个预测器组成。一个为六阶的全零点预测器,另一个为两阶的全极点 预测器。 s a k ) 2 t - iq ( 七一1 ) 舅( 七一0 + ( 扪 ( 3 1 5 ) 其中: & ( 七) = b , ( k - 0 d , ( k - 0 g ) 信号检测( t o n ea n dt r a n s i t i o nd e t e c t o r ) 该模块的功能可由如下两个式子表示: 厂t d 体) = t d ( k ) - l 如果a 2 ( k ) - 0 7 1 8 7 5 1t d k ) = t d 如果a 2 ( k ) 2 - o 7 1 8 7 5 ( 3 1 。6 ) r t f ( k ) 2 o 【) 一l t 瞄2 如果a 2 ( k - 1 ) - o 7 1 8 7 5 且i d q p 2 4 2 ”1 其他情况( 3 1 7 ) ”自适应速度控制( a d a p t a t i o ns p e e dc o n t r 0 1 ) 控制参数a i ( k ) 的值在0 到1 之问。 ,0 ( 七) = ( 1 2 5 ) d 二( _ | 一1 ) + 2 。f i ,( | i ) td 0 ( 七) = ( 1 2 7 ) z “( _ j 一1 ) + 2 。f i ,( t ) 3 1 2g 7 2 6 编码算法流程图介绍 g 7 2 6 编码流程图如下: ( 3 1 8 ) 2 i 磺士论文基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编解码嚣实现与应用 图3 1 2g 7 2 6 编码流程图 a ) 选择编码码率及码律 这一步用来确定编码器输入信号的码律( a 律、l i 律或是线性p c m ) 同时初始 化编码器输出信号的码率。 b ) 创建一个g 7 2 6 结构体 g 7 2 6 结构体内包括自适应预测器以及自适应量化器的参数。还有编码的各个模 块。 硕士论文基于t m s 3 2 0 d m 6 4 2 的g 7 2 6 音频编解码器实现与应用 3 2 g 7 2 6 解码算法框图及流程图介绍 3 2 l1 2 7 2 6 解码算法框图介绍 图3 2 1 表明了解码部分各模块的组成,其中k 为样本序列。 编解码模块中,除了解码中的同步功能外,各模块的功能基本相同。这里不再 阐述。 同步校正模块( s y n c h r o n o u sc o d i n ga d j u s t m e n t ) : 同步编码调整单元的功能主要是为了防止在同步级联( 即a d p c m p c m a d p c m p c m a d p c m 全数字转换) 的情况下,可能发生的量化噪声的积累问题。 同步编码调

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论