(电路与系统专业论文)基于arm的heaac音频解码滤波器组的优化研究.pdf_第1页
(电路与系统专业论文)基于arm的heaac音频解码滤波器组的优化研究.pdf_第2页
(电路与系统专业论文)基于arm的heaac音频解码滤波器组的优化研究.pdf_第3页
(电路与系统专业论文)基于arm的heaac音频解码滤波器组的优化研究.pdf_第4页
(电路与系统专业论文)基于arm的heaac音频解码滤波器组的优化研究.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(电路与系统专业论文)基于arm的heaac音频解码滤波器组的优化研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 j i i iii ii i1 i ii ii i iiiiil y 2 0 6 7 4 4 9 h e a a c 是目前最先进的感知音频编解码技术,它具有多声道、多采样率、高 压缩比、高音质等特点,比:l a c 的效率提高3 0 。在许多领域得到广泛的应用,。 支持h e - a a c 的消费电子产品成为电子市场需求的热点。 h e a a c 解码器中的滤波器组包含逆向改进余弦变换( i m d c t ) 、分析滤波器组 和合成滤波器组三个模块。滤波器组的基本功能是允许信号的某一部分频率顺利 通过,而另外一部分频率则受到较大抑制。滤波器组在整个音频编解码系统中, 运算量占6 0 以上,具有很重要的作用。随着音频解码技术的不断提高,滤波器组 的研究也越来越深。 本文主要研究基于a r m 的h e - a a c 音频解码滤波器组的优化。首先对h e a a c 音频标准里的三个滤波器组模块的原始算法作了分析,然后分别采用基4 i f f t 算 法、d c t - i i i 算法、d c t - i i i 和d c t - i i 的组合算法优化i m d c t 模块、分析滤波器组以 及合成滤波器组。其次,针对a r m 平台的特点,依据定点实现原理,对滤波器组 进行定点转换。最后在a r m 平台上利用n e o n 语法的优势,分别实现了上述三个 优化算法,并对滤波器组在寄存器分配、函数参数、循环变量、函数调用、除法 运算、乘法移位运算、通用数据处理、加载存储数据等方面进行了改进。经过n e o n 语法优化后的滤波器组比c 语言和a r m v 6 语法优化的代码大小都小,使得存储器 的使用大大减少了。并且在系统运行后,通过了h e a a c 音频标准规定的 c o n f o r m a n c e 测试,提高了解码效率。 关键词:h e a a ca r mn e o n 滤波器组优化 i i i a b s t r a c t h i g he f f i c i e n c ya d v a n c e da u d i od e c o d i n g ( h e - a a c ) i st h em o s ta d v a n c e d t e c h n o l o g yo ft h ep e r c e p t u a la u d i od e c o d i n g ,w h i c hc a l ld e l i v e rb e t t e ra u d i oq 砌i t y , h i g h e rc o m p r e s s i o nr a t e s ,m o r ec h a n n e l sa n dv a r i e t i e so fs a m p l i n gr a t e s ,i m p r o v ea t l e a s t3 0 t h a nt h ee f f i c i e n c yo fa d v a n c e da u d i od e c o d i n go 认c ) i th a sb e e nw i d e l y u s e di nq u i t eal o tf i e l d s a n dt o d a y , t h ec o n s u m e re l e c t r o n i cp r o d u c t s 、i 1h e - a a c d e c o d e rh a v eb e c o m ev e r yh o t h e - a a ca u d i od e c o d e rh a v et h r e ef i l t e rb a n km o d u l e s ,r e s p e c t i v e l yi si m d c t , a n a l y s i sf i l t e rb a n ka n ds y n t h e s i sf i l t e rb a n k t h eb a s i cf u n c t i o no f f i l t e rb a n ki sa l l o w e d ap o r t i o nf r e q u e n c yo ft h es i g n a ls m o o t h l yt h r o u g h , a n dt h eo t h e rp a r tf r e q u e n c yo fi ti s l a r g ei n h i b i t i o n t h ef i l t e rb a n ka c c o u n t sf o rm o r et h a n6 0 o ft h ec o m p u t a t i o n a l c o m p l e x i t yt h ew h o l ed e c o d i n gs y s t e m , h a sv e r yi m p o r t a n tr o l e w i t hd e c o d i n g t e c h n o l o g yi m p r o v ec o n t i n u o u s l y , t h er e s e a r c ho ff i l t e rb a n ki s a l s om o r ea n dm o r e d e e p l y t h i sp a p e rm a i n l ys t u d i e st h eo p t i m i z a t i o no fh e - a a ca u d i od e c o d e rf i l t e rb a n k b a s e do na r m f i r s t l y , t h i sp a p e rr e s e a r c ha n da n a l y s i so r i g i n a la l g o r i t h ma l g o r i t h mo f t h ef i l t e rb a n k t h e nr e s p e c t i v e l ya d o p tt h eb a s e4i f f ta l g o r i t h m ,d c t - i i ia l g o r i t h m , d c t - i i ia n dd c t - i ic o m b i n a t i o na l g o r i t h mt oo p t i m i z et h ei m d c tm o d u l e ,a n a l y s i s f i l t e rb a n ka n ds y n t h e s i sf i l t e rb a n k s e c o n d l y , a c c o r d i n gt ot h ec h a r a c t e r so fa r m p l a t f o r m , w ew r i t ee f f i c i e n tf i ) 【e dp o 缸a r i t h m e t i cc o d eb a s e do nt h ep r i n c i p l eo ff i x e d w eu s i n gt h ea d v a n t a g eo fn e o ng r a m m a r , r e a l i z e dr e s p e c t i v e l yt h ea b o v et h r e e o p t i m i z a t i o na l g o r i t h ma n di m p r o v e df i l t e rb a n ki nd i s t r i b u t i o no ft h er e g i s t e r , f u n c t i o n p a r a m e t e r s ,c i r c u l a t i o nv a r i a b l e ,f u n c t i o nc a l l s ,d i v i d e ,m u l t i p l ys h i f to p e r a t i o n , g e n e r a l d a t ap r o c e s s i n g ,l o a d s t o r ed a t a f i l t e rb a n ka f t e rn e o ng r a m m a ro p t i m i z e dc o d es i z e c h a n g es m a l l e ra n dt h r o u g hc o n f o r m a n c et e s to ft h eh e - a a ca u d i os t a n d a r d ,r e d u c e m e m o r yr e q u i r e m e n ta n di m p r o v ed e c o d i n ge f f i c i e n c y k e y w o r d :h e a a c a r mn e o nf i l t e rb a n k o p t i m i z a t i o n i v 第一章绪论 第一章绪论 1 1研究背景和意义 数字技术的出现与应用给人们的生活带来了深远的影响,随着人们对物质生 活的追求,这几年人们对音频研究的热度也越来越高。在诸多的数字技术中,数 字音频技术是应用最广泛的数字技术之一1 1 。随着数字音频技术的发展,音频数字 化后的数据量非常庞大,对存储器的要求十分苛刻。p c m 音频流的码率通过采样 率值、采样大小值和声道数相乘得到的。例如一个采样率为4 4 1 k h z ,采样大小为 1 6 b i t ,双声道p c m 编码的w a v 格式的音频文件,它的码率为4 4 1 k x1 6 2 等于 1 4 1 1 2k b p s ,这个参数也被称为数据带宽。将码率除以8 就可以得到这个w a v 的数 据速率,即1 7 6 4 k b s 。这表示存储一秒钟采样率为4 4 1 k h z ,采样大小为1 6 b i t , 双声道的p c m 编码的音频信号,需要1 7 6 4 k b 的空间,一分钟则需要1 0 3 4 m 空间。 通常情况下,一首歌时长大约为两至三分钟,即一首歌是不可能存入1 2 8 k 大小的 m p 3 的,这对大部分电子用户是无法接受的。因此,在保证高质量的音质条件下, 最大限度的压缩音频信号,减少其带宽的占有率的音频编码技术必然会得到广泛 的应用。同时,减少音频信号对带宽的占有率,还可以提高和改进数字音视频和 数字电视的质量。 为了在高音质的前提下提高音频信号的压缩率,1 9 8 8 年,国际标准化组织 i s o ( i n t e m a t i o n a ls t a n d a r d so r g a n i z a t i o n ) 和国际电子委i e c ( i n t e m a t i o n a l e l e c t r o t e c h n i c a lc o m m i s s i o n ) 联合成立了运动图像专家组m p e g ( m o v i n gp i c t u r e s e x p e r t sg r o u p ) t 2 1 ,专门负责为c d 建立视频和音频标准,其成员均为视频、音频及 系统领域的技术专家。m p e g 组织研究和采纳时域编码、变换编码、子带编码和感 知音频编码技术等压缩编码技术【3 1 ,先后提出了多种音频标准,如m p e g 1 的 l a y e f l 、l a y e r l i 、l a y e r l i i | 引,m p e g 2 的l a y e r i 、l a y e r l i ,以及m p e g 2a a c t 副和 m p e g - 4a a c ( a d v a n c e da u d i oc o d i n g ) 】。在这些音频标准中的编码技术,仍然能 满足很大部分的市场需求,如以前比较流行,现在依然占很大市场份额的m p 3 编 码技术,以及比m p 3 编码技术压缩率提高3 0 的a a c 编码技术1 4 j 。 m p 3 编码技术和a a c 编码技术都是感知音频编码技术 7 1 ,是近年来音频编码技 术中最为普遍流行的一种编码技术,也为音频编码技术的革新做了重大贡献。但 是,在基于有限带宽的条件下,想要满足更高要求音频质量以及日益增多的数字 电视和数字音频需求量,目前现有的感知音频编码技术已经不能满足常规的音频 编解码技术的要求。感知音频编码的数据率在1 2 8 k b p s p j , 下的编码质量开始大幅下 2 基于a r m 的h e - a a c 音频解码滤波器组的优化研究 降【5 】,所以更高的服务品质要求音频编码具有更低的压缩率和更好地音质。 基于以上音频编码技术的发展,2 0 0 3 年,m p e g 组织提出了一种比a a c 编码效 率高出3 0 的音频编码技术,脏a a c ( i - i i g he f f i c i e n c ya d v a n c e da u d i o ) 标准t 引。它 是一种在高音质的前提下压缩率很高的音频编码,这种算法在l ca a c ( l o w c o m p l e x i t y a a c ) 编码算法的基础上增加的频带复制( s p e c t r a lb a n d r e p l i c a t i o n , s b r ) 1 9 ,1o 1 1 1 技术而得出的数字音频编码标准。在h e a a c 编解码技术中, m p e g - 4a a c 是核心解码器,m p e g - 4s b r 是频带扩展工具,它与核心解码器结合 在一起,使平滑的音乐更加细腻,用来扩大音频播放带宽,进一步提高音频质量 服务。 h e a a c 的特点【l 1 2 】: 1 ) 采用了最先进的音频编码技术a a c 和最新频段扩宽技术s b r ; 2 ) 压缩效率高于a a c 和m p 3 。其压缩效率约为m p 3 的2 7 倍。经比较1 2 8 k b p s 的m p 3 与4 8 k b i t 秒的h e a a c 的音质几乎相刚1 3 】; 3 ) 具有多声道、多采样率等特点; 4 ) 已被许多音频标准收纳【1 4 l ,如d a b ( d i g i t a la u d i ob r o a d c a s t i n g ) ,3 g p p 等。 由于h e a a c 音频的高音质和高压缩性,现在各个国家的音视频和网络协议已 经开始以h e a a c 为音频编解码标准,在电子领域发挥着重要的功能。然而在 h e a a c 音频解码器中,由于滤波器组的计算效率对音频编解码的速度有关键的影 响,造成了很大的阻碍,因此,研究h e a a c 滤波器组的算法优化以及用软件平台 实现具有重要的意义。本论文以h e a a c 解码器中滤波器组算法为研究对象,在保 证高音质高效率压缩比的前提下,优化滤波器组的算法,并在a r m 平台上用n e o n 7 汇编语言实现。 1 2h e a a c 音频解码关键技术 我们对h e a a c 的解码过程做简单的介绍。首先,音频码流作为输入经码流解 析器分割为频谱数据信息和s b r 数据信息。数据频谱信息经a c c 核心解码器进行 解码,得到时域的低频数据。同时分割出来的s b r 数据信息经过s b r 解码,得到重 建的高频部分。最后,低频数据和高频数据经过s b r 解码器整合得到输出的p c m 样本值。 由此可知,h e a a c 的关键技术包括先进感知音频编码技术( a d v a n c e d a u d i oc o d i n g ,简称a a c ) 、频带复制技术【l q ( s p e c t r a lb a n dr e p l i c a t i o n ,简称s b r ) 。 h e a a c 的解码流程图如图1 1 所示。 第一章绪论 3 图1 1h e - a a c 解码流程图 1 2 1a a c 先进音频解码技术 a a c 音频解码技术是一种感知音频解码技术。人耳对音频信号的听觉灵敏度 有其规律性,因此对不同频段或不同声压级的声音有特殊的敏感特性。在感知音 频编解码技术中,主要应用了听觉阈值及掩蔽效应等人类听觉心理特性,建立了 心理声学模型。若引入的噪声能控制在掩蔽阀值之下,则人耳是听不出重建信号 与原始信号的差别的i 引。 a a c 核心解码器是h e a a c 音频解码器的基础,它主要负责解码出音频信号的 低频段。它是由m p e g - 4 a a c 来构成。而m p e g - 4 a a c 分为6 个层次【6 j ,分别为主, 框架、低复杂度框架、可分级采样框架、长期预测框架、低延迟框架、高效率框 架。在h e a a c 音频标准中,采用了m p e g - 4a a c 的低复杂度框架。m p e g - 4a a c 低复杂度框架的解码流程图如图1 2 所示。 。 篱商剥墓呈h 鬈h 攀h 麓h 篓h 霉h 输出 比特流格式器 音频码流 图1 2a a c 框架解码流程图 a a c 解码技术包含8 个步骤,分别为无噪声解码( h u f f m a n 解码) 、逆量化、比例 因子解码、m s 立体声解码、强度立体声解码、感知噪声代替、时域噪声整形、 i m d c t 滤波器组。解码过程如下所述。 通过码流分析器分离出来的信息经过h u f f r n a n 解码,得到已经量化的频谱和被 h u f f m a n 编码的比例因子。读取增益值,在比例因子带中将比例因子经差分解码解 4 基于a r m 的h e a a c 音频解码滤波器组的优化研究 出,乘以以量化的频谱数据得到实际的频谱值。经过m s 立体声模块时,由于是对 左右声道频谱数据的和与差进行编码,所以解码时则需通过相应的矩阵加以变换 得出频谱值。在强度立体声模块中,左声道传输频谱数据的实际值,而右声道传 输的数据是“强度立体声位置”信息,解码时,在每个比例因子带中将左声道的频谱 实际值乘以相应于右声道的“强度立体声位置”即得到实际的右声道,则可以恢复左 右声道。在编码时,若频谱数据进行感知噪声替代和时域噪声整形i l ,则解码时 也需要进行逆操作。而最后一个模块i m d c t 滤波器组由于量化和编码都是在频域 上进行的,因此解码时需要把频域数据转化为时域数据。i m d c t 滤波器组首先对 频谱数据进行i m d c t 变换滤波,再根据指定的窗长进行加窗处理,加窗处理后的 数据与前一帧需经过5 0 的叠加,最后得到解码的低频数据。 1 2 2s b r 技术 现今,许多流行的感知音频编码技术,为了满足过高的压缩比,一方面往往 抛弃音频数据中的高频信息,另一方面,由于奈奎施特采样定理要求输入信号的 最高频率要小于采样频率的二分之一,很多数字音频编码技术采用低通滤波器来 限制输入信号的频率,从而使得原始音频数据中的高频成分受到损失,造成音质 的下降。然而,在追求高品质音质的今天,s b r 技术【1 2 】就成为了一条必经之路。 s b r 技术作为h e a a c 编解码技术的后操作部分,也是核心部分,是h e a a c 区别与m p e g - 4 a a c 的本质之处。它主要研究基于a a c 核心解码器解码出的低频 信号的基础上怎样重建高频信号。由于只需编码音频信号的低频段数据和高频段 的包络信息,所以能最大程度地压缩信号。解码时,可由s b r 解码器重建和还原高 频信号。 s b r 技术的基本思想是根据声源的物理特性所决定的声音信号的普波特性,使 得低频信号和高频信号有着高度相关性的原理,把低频信号变换到高频信号,可 以得到与原始信号高频带相近的特性,在变换到高频带后,结合谱包络对高频带 信号进行修正重建高频带【1 2 , 1 3 l ( 图1 3 和图1 4 所示) ,从码流中分解出来的s b r 控制 信息所控制。对于一些无法修正的高频带信号,则需要采取一些综合方法来处理, 如反向滤波、正弦和加噪等【l 引。 第一章绪论5 图1 3经过a a c 解码器得到的低频信号 图1 4 经过s b r 重建和修正的完整频带信号 s b r 技术解码之前必须先进行编码。采用s b r 技术编码时,s b r 模块对原始的 音频信号进行分析,编码低频数据的相关特性和高频带的包络,形成s b r 数据,与 a a c 核心编码器编码的数据进行多路复用。解码时,s b r 数据先被解码出来,其 它数据分为两部分进行解码。一部分,被编码的音频码流经a a c 核心解码器( l c a a c ) 解码得到时域的低频带数据。另一部分,进行s b r 解码操作,将时域低频 数据作为输入经过分析滤波器滤波变换,再结合解码出的s b r 数据使低频数据复制 到高频段,然后对高频数据进行包络调整和加噪等整形操作,最后经过合成滤波 器将低频数据和高频数据进行综合和变换等整合操作,得到频带完整的时域信号。 s b r 解码过程流程图如图1 5 所示。 6 基于a r m 的h e - a a c 音频解码滤波器组的优化研究 is b r 数据i i一 图1 5s b r 解码过程流程图 s b r 解码器中的分析滤波器和合成滤波器都属于正交镜像滤波器组,在正交镜 像滤波器域中系统完成了对信号中整个高频信号的滤波和重建,这是h e 一从c 解码 器的重要组成部分。正交镜像滤波器完成的是一种子带编码,因此它具有子带编 码的所有特点。而子带编码的基本思想是将信号分解为若干子频带内的分量之 和,然后对各子带分量根据其不同的分布特性采取不同的压缩策略以降低码率 【嘲。传统的滤波器组在亚采样后会造成子带频谱间的混叠,而正交镜像滤波器就 可以抵消或避免这种情况【1 9 1 。 1 3h e - a a c 实现方案的研究 随着h e a a c 解码器的普遍应用,要求也越来越高,越来越多的实现方法被 采纳。当前的解码器实现方法主要有4 种,分别为专用硬件实现方案【2 l ,2 2 1 、基于软 硬件协同的实现方案【2 0 】。基于d s p 结合r i s c 的实现方案、基于r i s c 或d s p 的实现 方案f l 引。本论文选择一种基于r i s c 的c o r t e x a 8 微处理器的方案来实现h e - a a c 音频的解码过程。基于r i s c 处理器系统具有指令简单、使用硬布线控制逻辑、处 理能力强、速度快、低功耗、低成本等优点。采用完全软件式的方法,大大提高 了系统的性能,降低了解码周期。 在h e a a c 音频解码过程中针对算法的很多优化方法已经被开发或采用。尤其 是对h e a a c 音频解码中的滤波器组模块包括有i m d c t 变换滤波、分析滤波器组 和合成滤波器组,其中分析滤波器和合成滤波器都属于正交镜像滤波器( q m f ) 。实 现方法总结如下: 1 ) i m d c t 的优化方法【2 3 刀,2 5 2 6 2 7 】:文献 2 3 】提出基于4 点i 拘d c t d s t 的有 效计算方法;l e e 【2 4 】对此算法提出了改进,进一步减少了计算复杂度:李琳【2 5 】等提 出了基于n 8 点f f t 变换核的i m d c t 快速实现方案;文献【2 6 】还提出m d c t 变 第一章绪论 7 换为n 2 点的d c t - w ,再由d c t - w 变换为d c t - i i ,文献【2 7 】基于4 点的一对 d c t - w 来优化,与已有的一些i m d c t 快速算法相比,新的分解算法计算效率提高 了3 倍。 2 ) q m f 的优化方法【2 1 ,2 羽:献【2 1 】提出使用f f t 共同优化分析滤波器和合成滤 波器的方法,这种方法考虑到了资源共享,却没有考虑比例因子处理,导致提高 解码速度受限。文献【2 8 】提出了用d c t - w 共同优化分析滤波器和合成滤波器的方 法,这种方法也考虑到资源共享,但是解码效率不高,适合硬件设计,不适合软 件优化。 分析和总结了脏a a c 音频解码器中滤波器组模块的优化算法之后,可知滤波 器组的模块均有进一步改进的空间,本文在滤波器运算模块的算法优化和实现方 面做了一定的工作,获得成果如下: 1 ) i m d c t 的实现方法:采用了基于“q 点的i f f t 来优化,将2 0 4 8 点的i m d c t 变换转换为2 5 6 或6 4 点的i f f t 变换,减少计算复杂度,提高了处理速度。最后对这 种优化算法使用n e o n 汇编语言来进一步优化,进一步提高解码效率。j 2 ) q m f 的实现方法:采用d c t - i i i 来实现分析正交镜像滤波器,采用d c t - i i i 和d c t - i i 的组合来实现合成正交镜像滤波器。对算法用n e o n 汇编语言优化,进一 步提高处理速度。 总结了滤波器组的优化算法后,由于在h e a a c 音频标准中只对编码后码流格 式做了固定,以及对编解码的流程和步骤进行了定义,没有对编解码算法的具体 实现方法做严格的规定,则可以对算法的实现方法进行自由的选择,这就给 h e a a c 标准中模块算法的优化和实现留下了进一步发展的空间,因此,在高音质 的前提下,不断提高压缩比,从而能不断的改进编解码算法。 1 4本文的主要工作和内容安排 在本文中我们选择a r m 平台的c o r t e x a 8 处理器对h e a a c 中滤波器组进行 了实现和优化,c o r t e x a 8 微处理器是r i s c 处理器中的一种,它包含n e o n 技术, n e o n 是6 4 1 2 8 位混合式s i m d ( 单指令多数据) 体系结构,广泛用于便携式嵌入 式设备。基于c o r t e x - a 8 处理器对h e a a c 中滤波器组具有一定的研究价值和很高 的实用性。 本论文详细地分析了h e - a a c 中的i m d c t 变换滤波模块、分析滤波器组模块 和合成滤波器组模块的原始算法和优化算法。对其已经优化的算法用a r m y 6 指令 和a r m v 7 指令( 也就是n e o n 指令) 的实现和优化。最后比较c 代码、a r m v 6 汇 编语言、a r m v 7 汇编语言对滤波器组优化之后的解码效率。 本论文的安排如下: 8 基于a r m 的h e - a a c 音频解码滤波器组的优化研究 第一章是绪论。通过数字音频解码技术的发展过程提出了本论文对音频解码 技术的研究背景和意义,简单介绍了h e a a c 音频解码的关键技术,包括有a a c 解码技术及频带复制技术( s b r ) 。 第二章h e a a c 解码过程及模块算法分析。对h e a a c 音频标准的解码流程和 解码过程中各个功能模块作了详细地介绍和分析。 第三章滤波器组算法分析。分析了h e a a c 解码过程中滤波器模块的原始 算法,并对其使用优化算法来代替。 第四章是优化方案。我们采用a r m v 6 和n e o n 语言定点实现了h e a a c 解 码器中的滤波器组,并对其在a r m 平台上进行了优化。 第五章实验结果。给出了优化后解码器的测试结果。 第六章对本论文进行了总结与展望。总结全文,指出不足之处,提出改进空 间。 第二章h e _ a a c 音频解码流程介绍 9 第二章h e m c 音频解码流程介绍 在实现优化算法之前,需分析标准算法中提出的原始算法方案,本章介绍了 h e - a a c 解码器的整个解码过程以及码流的格式和各个模块的功能。 2 1h e - a a c 音频解码过程概述 h e a a c 音频解码器主要分为a a c 核心解码器和s b r 解码器两部分,前者是利 用感知特性来解码的,后者是负责重建高频数据的。如图2 1 所示。a a c 核心解码 器解码出低频段数据后,s b r 解码器将低频信号作为输入,依据比特流格式器分解 出高频信号的控制信息将低频段数据向高频段复制并开始重建和调整高频信号。 s b r 控制信息 一 图2 1h e - a a c 解码过程简易图 a a c 核心解码器( 低复杂度框架) 包含模块有比特流格式解码器、h u f f m a n 解码、逆量化、m s 立体声、强度立体声、感知噪声替代、时域噪声整形、滤波器 组模块。s b r 解码器包含模块有分析滤波器组、高频重建、高频整形、合成滤波器 组模块【4 5 6 】。如图2 2 所示。 在图2 2 中,音频码流信息从比特流格式器分解出来后需同时进行两部分工作, 一是向a a c 核心解码器提供含有频谱线和比例因子的h u f f m a n 码,另一部分是获得 各个模块的控制信息和s b r 数据信息,提供给s b r 解码器。h u f f m a n 解码模块分解 出比例因子和反量化频谱。反量化频谱经逆量化得到缩放的频谱值,再经比例因 子加权,恢复音频频谱数据。m s 立体声和强度立体声操作都是对左右两个声道的 数据信息进行处理,以恢复左右声道的实际频谱值,还原立体声。感知噪声替代 解码模块计算出与编码时被标记的噪声信号类似的噪声信号。经时域噪声整形模 块处理过预回声的频域数据,再经i m d c t 滤波器从频域变换到时域就可以解码出 时域信号的低频数据。 1 0 基于a r m 的h e a a c 音频解码滤波器组的优化研究 对于高频部分,是利用低频信号和s b r 解码器共同作用重建的。s b r 参数分析 器解析出高频信号的控制信息,并通过h u f f m a n 解码和反量化恢复出控制信息的实 际值。时域信号的低频数据通过分析滤波器组变换到正交镜像滤波器域( 因为量 化和编码都是基于这个域进行的) ,得到频域的低频数据,经过高频重建模块得到 重建的高频数据,然后经过高频整形模块,对重建的高频数据进行调整和加噪, 得到和原始的高频信号相似的高频数据,最后低频数据和高频数据经合成滤波器 组合成全频带的音频数据,最终通过时域转换生产p c m 数据。 图2 2h e - a a c 解码流程图 2 2h e a a ce i , 特流解码 比特流格式器模块从音频码流中分离出数据信息和控制信息,并提供控制信 息给各个解码模块,以便对各个解码模块操作进行控制。而比例因子是以差分脉 冲编码调制形式编码的,所有的比例因子都是相对于前一个比例因子作差分后进 第二章h e _ a a c 音频解码流程介绍 行h u f f m a n 编码。如果编码时强度系数穿插在比例因子中间,那么解码时它们将被 送往强度立体声模块进行解码,与比例因子解码无关。 由于a a c 码流包含两种音频码流格式,一种是音频数据交换格式( a u d i od a t a i n t e r c h a n g ef o r m a t , 简称a d i f ) 。这种格式的特征是必须在音频数据指定的开始处进 行解码,不能在音频数据流中间开始解码,即它的解码必须在明确定义的开始处 进行。故这种格式常用在磁盘文件中。一种是音频数据传输流( a u d i od a t at r a n s p o r t s t r e a m ,简称a d t s ) 。这种格式的比特流中含有一个同步字,使得解码时非常灵活, 可以在码流中的任何地方开始解码。它的特征类似于r a p 3 数据流格式。 h e a a c 码流数据块中增加了s b r 数据单元,其中包含了重建高频段需要用到 的基本信息。这是h e a a c 的码流和a a c 的码流唯一的不同之处。 2 3基本模块算法分析 按照解码顺序,对各个模块的功能进行详细的介绍。 1 ) h u f f i n a n 解码 h u f f m a n ( 哈夫曼) 编码是无噪编码,它编码经滤波变换和量化后的数据,即编 码比例因子和量化后的频谱数据,它的作用在于进一步减少比例因子和量化后频 谱的冗余。 h u f f m a n 编码是一种无损压缩编码,也是一种可变字长编码( v l c ) ,它是依据 字符出现的概率来构造平均长度最短的码字的基本思想来进行编码的。如果一个 字符在一段数据中出现的次数多,它的编码就相应的短,如果一个字符在一段数 据中出现的次数少,它的编码就对应的长。 根据音频样本的统计特性,a a c 核心编码标准编制了15 个h u f f m a n 表,编码的 时候通过每一个源字符的概率建立的哈夫曼树来进行h u f f m a n 编码。在这1 5 个 h u f f m a n 表中,对频谱数据进行编码的码表有1 1 个,对差分后的比例因子编码的码 表有1 个,还有1 个用于比例因子和频谱数据为零的码表。此外对独立声道的编码 有2 个增强码表。s b r 解码器有l o 个码表【8 1 ,其中5 个用来表示高频数据的包络,另外 5 个用来表示高频数据的控制参数。 h u f f r n a n 解码过程是编码过程的逆过程,h u f f m a n 解码时通过查询码表从码流 中解码出信息,得到量化频谱、差分编码的比例因子。 2 ) 反量化 量化就是把经过m d c t 滤波变换后的频域数据分割为若干相邻并具有唯一量 值的区间,凡落在某区间的频谱值都用一组指定的量值来表示该区间。使用量化 方法对数据进行压缩,减少了音频的比特率,很大程度上提高了解码效率。 反量化的作用是对以量化的频谱和经解码得出的比例因子做反量化,得到重 1 2 基于a r m 的h e a a c 音频解码滤波器组的优化研究 建的频谱值。在a a c 核心解码器中,逆量化频谱系数是用不同的量化步长解析不 同的频谱系数,采用非均匀量化方法来实现的,最大程度上减少了量化误差,从 而减少了对音质的影响。反量化公式如式2 1 : x i n v q u a n f = s i g n ( x _ q 铭口刀f ) 木j x q u a n tj ( 2 1 ) 其中: xq u a n t :量化的频谱值。 xi n v q u a n t :反量化的频谱值。 量化频谱值的范围限制在8 1 9 1 之间。 3 ) 逆比例因子 比例因子的作用就是用来改变频谱的振幅值。把频谱数据分成若干个频谱区 间,不同频谱区间对应不同比例因子,而在特殊情形下有些频谱区间是不含比例 因子信息的,那么该频谱区间的比例因子就设为1 。编码时,比例因子为某区间量 化的频谱系数除以该区间的增益值。解码时,将经过h u f f m a n 解码后的比例因子乘 以反量化后的频谱数据,得到实际的频谱值。噪声整形也是在频域使用比例因子 来调整量化噪声的。 将比例因子转化为增益系数,其计算公式如式2 2 : g a i n = 2 0 2 5 矿- $ f 一删 ( 2 2 ) 其中: s f :比例因子 s fo f f s e t :常数,设为1 0 0 g a i n :增益 4 ) m s 立体声 m s 立体声模块编码应用于成对出现的音频通道,例如,左声道与右声道,左 环绕通道与右环绕通道。编码时,根据左右声道的相关性,利用“和 与“差 方法产生中间( m i d d l e ) 和边( s i d e ) 声道代替原来的左、右声道来消除冗余数据。 m s 立体声模块也叫矩阵立体声模块,顾名思义是利用矩阵来计算的。解码时,计 算公式如式2 3 : 二 = :二。 : ( 2 - 3 ) 5 ) 强度立体声 强度立体声模块研究的是声道间的不相关性,只能应用于右声道【2 9 1 。它利用 第二章h e _ a a c 音频解码流程介绍 1 3 人耳对左右声道的强度差较敏感的听觉特性,用左声道来传输频谱实际值,右声 道传输左右声道的联合立体声系数,代替同时传递两个声道的频谱值,这样就减 少了编码的数据量。 强度立体声的数据是由“强度立体声的位置 ( i n t e n s i t ys t e r e op o s i t i o n ) 来表示 的,对强度立体声的编码类似于比例因子的编码。 由于m s 立体声模块与强度立体声模块是二者只能选其一的,在解码时选择哪 种立体声模块,是根据编码时的音频特征来决定的。若编码进行了哪种立体声编 码,解码时就选择哪种立体声进行解码。解码时,用左声道乘以右声道的联合立 体声系数即得到右声道数据。强度立体声的计算公式如式2 - 4 : s p e c r = s p e c l 宰2 - o 2 5 l , p o s i t i o n ( 2 - 4 ) 其中: s p e c l :左声道的反量化谱线值 s p e c r :右声道的反量化谱线值 i s p o s i t i o n :强度立体声的位置 6 _ ) 感知噪声替代 感知噪声替代模块的基本原理是当一种噪声信号类似于另一种噪声信号且这 种噪声信号对整个音频信号的主观感知影响比较小时,则在编码过程中对这种噪 声的频谱信息不进行处理,而只是简单的做个标记,在该频谱段的总功率上添加 一些附加信息,来说明存在一个类似于某种噪声的信号【3 0 1 。它的作用是为了进一 步提高h e a a c 音频解码效率。解码过程中,首先在频谱上找到类似噪声的频谱信 息的位置,它总是包含一个或几个比例因子带,计算并生成与这种类似噪声作用 长度相等的一组伪随机向量,然后根据标记和附加信息的内容把随机产生的向量 插入相应的频谱段,使总的统计能量和编码时达到相同的程度。通过感知噪声代 替模块,可以有效的减少对噪声的分析和处理,提高编码效率。 7 ) 时域噪声整形 当音频信号含有突变信号时,在突变信号之前的量化噪声会在时域上扩散开 来,如响板的乐器声,量化噪声会有明显的扩散痕迹。编码时若在频域产生的瞬 时量化噪声会在解码时被扩散到时域的变换块内的这种现象称作预回声【1 7 1 。预回 声产生了人耳能听见的噪声,对音频质量有所损害f 3 l 】。然而时域噪声整形【3 2 1 是控 制预回声的方法之一,它利用对信号频谱的处理,在频域使用开环预测来减少时 域噪声的影响,解决了掩蔽阀值和量化噪声之间的错误匹配问题。 8 ) 滤波器组 滤波器组作为a a c 核心解码器的最后一个模块,也是最重要的组成部分之一, 主要功能是实现音频信号丛时域变换到频域。滤波器组模块是由i m d c t ( 逆向改 进的离散余弦变换) 和窗函数构成。在编码器中,使用正向的m d c t 进行滤波变换, 1 4 基于a r m 的h e - a a c 音频解码滤波器组的优化研究 m d c t 计算的优点是更接近人耳的工作原理,降低了时频转换时所引入的块边界 噪声。在解码器中,先进行i m d c t 滤波计算,然后利用适当的时域样本块进行重 叠和合适的窗加以调整,使滤波器组能够获得所需要的频率范围。每一样本块与 其前后都有5 0 的重叠。 由于m d c t 和i m d c t 都只需要做余弦变换,而余弦变换一定存在边界不连续 性,因此,在块边界处引入了很大的噪声。而时域混叠抵消技术( t d a c ) 使相邻 块的采样值在时间上重叠,有效的克服了由于不连续性引起的边界效应,有利于 消除这种现象所出现的噪声。时域混叠抵消技术是子带编码的一种,顾名思义是 在时域抵消混叠失真,而正交镜像滤波器是在频域内抵消混叠失真,它们之间具 有对偶性。 由于信号是离散的,产生了边界效应,若窗函数能满足主瓣宽度窄、旁瓣衰 减高的要求,则既消除了边界效应的影响,又可以提高对信号频率的选择。a a c 核心解码器为加窗操作提供了两种窗函数,正弦窗( s i n ef u n c t i o nw m d o w ,简称 s i n 窗) 和凯塞贝尔生成窗( k a i s e r - b e s s e ld e r i v e dw i n d o w , 简称k b d 窗) 。正弦窗在 音频编解码中是最常用的,它的频率选择性比较好,在频谱数据间隔比较小时, 能够使滤波器组较好的分离出相邻的频谱分量,可以提高解码效率。而对于k b d 窗可以用于一些旁瓣衰减大的信号,也能提高解码效率。h e a a c 音频系统允许正 弦窗和k b d 窗之间连续进行无缝切换【4 5 ,6 1 ,而且在切换时,滤波器组能保证精确的 重建和临界采样。 h e a a c 音频系统的滤波器组中有三种块类型:长块、短块、过渡块。短块用 于突变信号,长块用于时域上较平稳的信号,为了无缝切换,短块与长块之间是 由过渡块连接的,而且过渡时不能处于瞬时的,切换的规则是根据心理声学模型 的计算结果来确定的。 9 1s b r 参数分析器 s b r 解码部分码流结构如图2 3 所示,s b r 数据单元被包含在a a c 数据块 ( r a wd a t a下元素填充语法单元 l 里的 语法单元b l o c k ) ( i 1 1 e l e m e n t ) e x t e n s i o np a y l o a d 中。e x t e n s i o np a y l o a d 语法单元的参考文献【引。 从图2 3 中可以看出,s b re x t e n s i o nd a t a 语法单元包含了h e a d e r 息) 、s b r _ _ h e a d e r ( s b r 头信息) 和s b r _ d a t a ( s b r 数据信息) 三部分。兰h h e a d e r _ f l a g 为1 时, 解析码流s b rh e a d e r 。在解码前,s b r 的s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论