(系统分析与集成专业论文)音频解码系统算法的优化及在dsp上的定点化研究.pdf_第1页
(系统分析与集成专业论文)音频解码系统算法的优化及在dsp上的定点化研究.pdf_第2页
(系统分析与集成专业论文)音频解码系统算法的优化及在dsp上的定点化研究.pdf_第3页
(系统分析与集成专业论文)音频解码系统算法的优化及在dsp上的定点化研究.pdf_第4页
(系统分析与集成专业论文)音频解码系统算法的优化及在dsp上的定点化研究.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录 j 9 s 要。i a b s t r a c t i i 第一章绪论l 1 1 选题目的及意义1 1 2 国内外研究现状l 1 3 问题的提出4 1 4 本文工作与论文结构4 第二章音频解码的基本理论5 2 1 听觉系统的感知特性5 2 2 音频编解码的分类8 2 3m p e g 1 层3 的解码原理9 2 3 1m p 3 文件格式9 2 3 2 同步与c r c 校验1 2 2 3 3 数据解码。1 2 2 3 4 逆量化与顺序重排1 3 2 3 5 立体声处理1 4 2 3 6 混叠重建与i m d c t 处理1 5 2 3 7 频率倒置与子带综合滤波o 1 7 2 4 本章小结18 第三章音频解码算法的优化1 9 3 1h u f f m a n 模块的解码优化1 9 3 1 1 常见h u f f m a n 解码算法1 9 3 1 2 基于码表特点的h u t f m a n 解码快速算法:。2 1 3 2i m d c t 优化2 5 3 2 1 利用余弦函数对称性的优化2 5 3 2 2 基于递归方法的i m d c t 算法的优化2 7 3 3 本章小结3 6 第四章音频解码算法在d s p 上的定点化研究3 7 4 1c 5 4 1 6 芯片的原理3 7 4 1 1c 5 4 1 6 处理器3 7 4 1 2c 5 4 1 6 的指令系统和定点化方案3 8 4 2 解码程序的定点化3 9 4 2 1 数的定点表示与浮点表示3 9 4 2 2 基本数学运算的浮点到定点转换4 0 4 2 3 解码过程的定点化4 1 4 2 4 定点化结果的m t a l a b 仿真与误差分析4 3 4 3 在c c s 上对定点化结果的验证。4 5 4 3 1c c s 开发平台介绍。4 5 4 3 2 解码算法代码定点化4 6 4 3 3 仿真结果分析4 7 4 4 基于c 5 4 1 6 d s p 的解码测试4 8 4 4 1 测试环境4 8 4 4 2 测试内容和结果4 9 4 5 本章小结。5 0 第五章全文总结5 l 5 1 全文总结5 1 5 2 进一步的工作5 l 参考文献5 3 j 目【谢5 6 攻读硕士学位期间发表的论文5 7 摘要 摘要 随着单片机、d s p 、a r m 等嵌入式芯片的出现,音频编解码技术发展迅猛。 当前音频编解码正朝着高压缩比、高保真的方向发展,国际上相继出现了多种 格式标准,如m p e g - i ,从c ,a c 3 等。在众多音频标准中,h u f f m a n 解码和i 肋c 1 - ( i n v e r s em o d i f i e dd i s c r e t ec o s i n et r a n s f o r m ,修正的离散余弦逆变换) 处理一直是音频解码的重要组成部分,在解码过程中占有较高的比重。本文主 要对音频解码过程中的h u f f m a n 快速查表算法和快速i m d c t 处理算法进行研究, 在原有算法的基础上进行进一步的优化,提高了查表效率和计算效率。 本文所做的主要工作如下: ( 1 ) 分析了音频解码系统和解码算法的国内外研究现状,分别比较了多篇 文献中的解码系统和解码算法的性能。 ( 2 ) 分析了编码过程中的心理感知特性和掩蔽效应,通过仿真实验进一步 验证了声音的掩蔽性能。详细分析了音频解码系统的解码流程,主要研究了 h u f f m a n 解码算法的查表方式和i m d c r 处理过程。 ( 3 ) 在h u f f m a n 直接查表法的基础上提出了一种快速h u f f m a n 查表算法。 针对h u f f m a n 码表的特点,在对h u f f m a n 码表按码字大小重排序时,根据代码 以“0 开头或以“1 刀开头将h u f f m a n 码表分成两类。在解码时先进行起始位 判断,若是“0 查找以“o 开头的表,若是“1 则查找以“1 开头的表, 再根据码字的码长确定它在h u f f m a n 码表中的位置。理论分析表明本文提出的 快速查表算法比原算法的查表时间减少了一半。 ( 4 ) 对计算数长为n 的i j 脱- t 处理算法进行了改进,在i 肋c 1 i 处理中n 取 4 的倍数的基础上提出n 取8 的倍数,推导了n 点i f 1 ) c t 序列公式,把n 点i m d c r 处理转化为四个n 8 点的离散正余弦变换。改进的优化算法比n 取4 的倍数的 原算法减少了计算周期,提高了计算效率。 ( 5 ) 对基于t m s 3 2 0 c 5 4 1 6 的音频解码的定点化问题进行了研究。在解码过 程中,对浮点运算密集的步骤进行定点化处理,将可替换的部分用定点运算替 换,并对定点后的结果进行仿真分析。仿真结果表明定点化前后音频的波形差 别不大,符合音质要求。 关键词:音频解码,h u f f m a n ,i m d c t ,定点化,d s p 南京信息工程大学硕士学位论文 a b s t r a c t w i t ht h ea p p e a r a n c eo fm c u , d s p , a r ma n do t h e re m b e d d e dc h i p st h e r e ,a u d i oc o d e c t e c h n o l o g yi sd e v e l o p i n gr a p i d l y t h ec u r r e n ta u d i oc o d e ci sd e v e l o p i n g 诵ml l i g hc o m p r e s s i o n r a t i oa n dh i g hf i d e l i t yd i r e c t i o n , t h es t a n d a r d sh a v em e r g e di nav a r i e t yo ff o r m a t so n ea f t e r a n o t h e ri nt h ei n t e r n a t i o n a l ,s u c ha sm p f h 3 - l ,a a c ,a c - 3a n ds oo n i nn u m e r o u sa u d i os t a n d a r d , h u f f m a nd e c o d i n ga n di m d c th a sa l w a y sb e e na ni m p o r t a n tp a r to ft h ea u d i od e c o d i n g , h o l d s t h eh i g hp r o p o r t i o ni nt h ed e c o d ep r o c e d u r e t h i sa r t i c l eh a sm a i n l yr e s e a r c h e dt h ea l g o r i t h mo f h u f f m a nf a s tt a b l el o o k - u pa n df a s ti m d c tp r o c e s s i n gi nt h ea u d i od e c o d i n gp r o c e s s a n o p t i m a la l g o r i t h mh a sb e e np r o p o s e db a s e do nt h eo r i g i n a la l g o r i t h m , a n dt h ee f f i c i e n c yo f l o o k - u pt a b l ea n dc a l c u l a t i o nh a sb e e nr a i s e d t h em a i nj o b so f t h i st h e s i sa 把f o l l o w s : ( 1 ) t h er e s e a r c hs t a t u so f a u d i od e c o d i n gs y s t e ma n dd e c o d i n ga l g o r i t h mh a sb e e na n a l y z e d t h ep e r f o r m a n c eo fd e c o d i n gs y s t e m sa n dd e c o d i n ga l g o r i t h mh a sb e e nc o m p a r e ds e p a r a t e l yi n m a n yl i t e r a t u r e s ( 2 ) t h i sp a p e rh a sa n a l y z e dt h ep s y c h o l o g i c a lp e r c e p t i o nc h a r a c t e r i s t i c sa n dm a s k i n ge f f e c t o ft h ee n c o d i n gp r o c e s s t h ep e r f o r m a n c eo ft h es o u n dm a s k i n gh a sb e e nv e r i f i e db yt h e s i m u l a t i o ne x p e r i m e n t t h i sp a p e rm a k e sad e t a i l e da n a l y s i so ft h ea u d i od e c o d i n gs y s t e m d e c o d i n gp r o c e s s i tm a i n l ys t u d i e dt h el o o k - u pt a b l em e t h o do fh u f f m a nd e c o d i n ga l g o r i t h ma n d i m d c t p r o c e s s ( 3 ) i nt h i sp a p e r , h u f f i n a nd i r e c tq u e r y i n gm e t h o di sp r o p o s e do nt h eb a s i so fr a p i dh u f f m a n l o o k - u pt a b l ea l g o r i t h m a c c o r d i n gt ot h ec h a r a c t e r i s t i c so fh u f f m a nc o d et a b l e , w h e nt h e h u f f m a nc o d et a b l er e - s o r t e di nt h ec o d ew o r ds i z e ,a c c o r d i n gt ot h ec o d et o ”o ”a tt h eb e g i n n i n g o r ”l ”a tt h eb e g i n n i n go ft h eh u f f i n a nc o d et a b l ei sd i v i d e di n t ot w oc a t e g o r i e s i nd e c o d i n g , t h e f i r s ts t e pi st od e t e r m i n et h es t a r tb i t i fi ti s ”0 ”t oc h e c kt h et a b l ea tt h eb e g i n n i n go f ”0 ”i fi ti s ”l ”t oc h e c kt h et a b l ea tt h eb e g i n n i n go f ”l ”,t h e na c c o r d i n gt ot h el e n g t ho fc o d ew o r dt h e p o s i t i o ni nt h et a b l eo fh u f f m a nc o d ew i l lb ed e t e r m i n e d t h e o r e t i c a la n a l y s i ss h o w st h a tt h e p r o p o s e da l g o r i t h mf o rf a s tl o o k u pt a b l el o o k - u pt a b l eo ft i m et h a nt h eo r i g i n a la l g o r i t h mi s r e d u c e db yh a l f ( 4 ) t h ea l g o r i t h mo fi m d c tp r o c e s s i n gw i t ht h ec a l c u l a t i o nl e n g t ho fnh a sb e e n i m p r o v e d i nt h ea l g o r i t h m so fi m d c tp r o c e s s i n g , b a s e do nt h ee x i s t i n go p t i m i z a t i o na l g o r i t h m nt a k eam u l t i p l eo f4i sp r o p o s e do l lt h eb a s i so f nt a k e8m u l t i p l e s n - p o i n ti n ) c ti sd e r i v e d s e q u e n c eo ft h ef o r m u l a i nt h i sp a p e r , t h enp o h 吐i m d c tp r o c e s s i n gi n t of o u rn 8p o 硫 d i s c r e t ec o s i n et r a n s f o r m a c c o r d i n gt ot h e 嘶g i i l a la l g o r i t h mf o rt h ec o r r e s p o n d i n gf o r m u l a s , i m p r o v e do p t i m i z a t i o na l g o r i t h mf o rc a l c u l a t i n gt h a nt h eo r i g i n a la l g o r i t h mr e d u c e st h ec y c l e ,t h e c o m p u t a t i o ne f f i c i e n c yi si m p r o v e d ( 5 ) t h i sa r t i c l ei sa l s os t u d i e dt h ep r o b l e mo ft h ef i x e d - p o i n tt oa u d i od e c o d e rb a s e do n t m s 3 2 0 c 5 4 1 6 i nt h ed e c o d i n gp r o c e s s ,t h es t e p so ff l o a t i n g - p o i n tc a l c u l a t i o n sw h i c ha r ed e n s e w i l lb ef i x e d r e p l a c e m e n tp a r t sw i l lb er e p l a c e d 诵t l lf i x e d - p o i n ta r i t h m e t i c ,a n dc a r r i e so nt h e s i m u l a t i o na n a l y s i sa _ p l 把rt h ef i x e d - p o i n tr e s u l ts i m u l a t i o nr e s u l t ss h o wt h a tt h ea u d i ow a v e f o n n a b s t r a c t i sn o tv e r yd i f f e r e n ta f t e rt h ef i x o dp o i n t , m e e t st h ea c o u s t i cf i d e l i t yr e q u i r e m e n t k e y w o r d s :a u d i od e c o d i n g , h u f f m a n , i m d c t , f i x - p o i n t , d s p m 第一章绪论 1 1 选题目的及意义 第一章绪论 音频解码系统有广泛的应用场合,随着微处理技术以及嵌入式技术的不断进步,音频 解码系统的可移植性不断增强,近十年来已经广泛应用于汽车、摩托车等车载多媒体,婴 儿床、高档马桶等家具以及手机、p s p 等个人消费电子产品中。此外,由于人民的生活水 平越来越高,人们对音效质量的追求也在不断提高。如高档轿车、高端手机、高精度语音 识别开关等产品中需要高性能的音频解码系统,而解码系统性能的高低在很大程度上取决 于解码芯片性能的好坏。传统的音频解码系统以采用专用音频解码芯片为主,这种解码系 统虽然价格便宜,但是对音质有一定的牺牲,而且解码的格式比较固定,不便于后期软件 的升级。市场上常见的音频解码系统大都采用国外的解码标准和解码芯片,尤其在高端市 场,几乎被日韩和欧美的公司长时间垄断,因此,研究音频解码系统有很大的现实意义。 通过对音频解码技术的深入研究,可以掌握各种不同的音频解码格式,在软件的发展支持 下设计出多样化的产品。在不断地研究过程中,可以逐步提高音频的质量比,从而提高系 统的性能。 在音频解码的过程中,解码算法的复杂度直接影响解码的速度和存储器的利用率,效 率高的算法可以显著提升系统的性能。如何在现有技术水平和硬件条件下研究出合理、优 化、实时的音频解码算法一直是近年来研究人员关注的方向。音频解码算法的优化最主要 集中于h u f f m a n 解码算法、i m d c t 处理和子带滤波处理。h u f f m a n 解码算法的实现是音频解 压缩的关键,对于频道带宽或者存储容量有限的系统而言是非常重要的。另一方面,自从 1 9 7 4 年a i m e d 以及r a o 提出d c t ( d i s c r e t ec o s i n et r a n s f o r m ,离散余弦变换) 算法后, d c t 、如c t ( m o d i f i e dd i s c r e t ec o s i n et r a n s f o r m ,修正的离散余弦变换) 和i m d c r 已经 成为音频解压缩编码的重要工具和技术,广泛应用于多种等音频标准中。由于这类变换被 广泛采用,对于这类变换的快速算法的研究显得更为重要。 1 2 国内外研究现状 音频解码系统的研究在国外出现的比较早,国内近十年来也相继发表了多篇文献。总 的来说研究可分为三个方向。第一个是硬件方向,硬件方向的研究是伴随着集成电路的发 展而发展。第二个是软件方向,此方向的研究偏重于算法的改进与优化。第三个是软硬件 的协同设计方向,此方向的研究主要着眼于提升系统的总体性能。关于以上提到的三个方 向,已经有多篇文献分别进行了阐述。 硬件方向,文献 2 对一款采用0 2 5 册工艺的音频解码器进行了研究,该解码器的 工作频率伽z ,解码两声道从c m c 音频,采样率4 8 k h z ,功耗为4 5 4 肼。文献 3 j 分别优 南京信息工程大学硕士学位论文 _ _ _ _ _ _ _ - _ - - _ _ _ _ _ _ _ _ _ _ _ _ _ i _ - _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ - - _ _ 一ia , _ _ _ _ i _ _ _ _ _ - _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ - _ _ _ _ - _ - _ _ - _ _ - _ _ _ _ _ - _ - _ _ - _ - - _ _ _ - - _ _ - _ _ _ _ _ - _ - - - - - _ _ _ _ _ _ _ - _ _ _ - _ _ _ _ _ _ _ _ _ _ _ _ - _ _ _ _ 一 化了能实现m p 2 和从c 解码的a s i c 解码器,解码m p 2 和a a c 的功耗分别为l o m w 和2 0 r o w 。 文献e 4 2 对了一款a s i c 音频解码器进行了改进,采用流水线技术对左右声道并行处理,实 现了两声道l c 级别的a a c 解码。文献 5 研究的a s i c 音频解码器用于实现两声道l c 级别 的a a c 解码,工作频率3 姗z ,采用o 1 8 a m 工艺,功耗为2 4 5 r o w 。文献 6 提出了一个 高效的m p e g 一2 音频解码器架构。设计工作频率为2 7m i l z ,采用0 6 p m 工艺,功耗为 1 5 0 r o w 。 通过比较以上文献中研究的解码器发现它们的优点是:解码芯片可以针对专门的算法 进行高度优化,专用的音频解码模块不需要取址、译码等过程,功耗低,控制器所需要的 硬件开销可以减小到最小,因此就可以获得更高的处理速度,而且占用更少的硬件电路。 缺点是在算法进行修改时,大量的专用模块无法适应新的算法,需要重新设计。因此系统 的开发周期较长,风险大,不方便升级。比较适合运用成熟稳定的音频标准。 软件方向,文献e t 提出了一种音频解码由软件实现的策略,基于r i s c 处理器( 类似 于w i p s 3 0 0 0 处理器) 可以在l o o w l z - 3 0 0 m h z 工作频率范围内以不同的时钟频率分别获得4 种不同的解码精度,降低了解码精度从而减小工作频率和功耗。文献c 8 采用德州仪器公司 的t h s 3 2 0 d m 6 4 数字信号处理器实现了数字电视( d t v ) 的解码功能,其中2 4 m i p s 的计算能 力用于音频解码系统的实时解码。文献 9 对一款基于2 4 位d s p ( a d s p ) 的解码系统进行 了研究,用8 1 姗l z 的工作频率通过软件实现肝e g - 4b s a c 音频解码。文献 1 0 基于a r m 9 处 理器实现了a v s - p 3 的实时解码,优化了核心的解码程序,时钟频率为i o o m h z 。文献 1 1 介绍了一款基于a r w 核为处理器核的m c u ,采用内嵌汇编语句、修改了乘法精度、减少了 存储器访问等优化技术,实现3 5 姗z 的肝e g 一2 层3 、肝e g 一2a a cl c 的实时解码。 通过比较发现,侧重软件方向的文献研究中,系统的硬件主要基于专用的解码芯片、 通用的数字信号处理器以及a r w 系列处理器。这样做的优点是可以利用当前最新的硬件资 源以及较强的软件工具,而且通用d s p 架构和a r m 架构提供了完整的指令集和流水线技术, 便于提升性能。软件解码通过修改或者配置多种解码程序,能很好地适应音频标准的升级 和多标准解码的实现。没有流片失败的风险,如果解码出问题,只需重新加载新的解码程 序或更换程序存储器。因此音频解码器的开发更加灵活,开发周期更短,平台的限制更小。 缺点是导致所采用的处理器功耗大,主频以及工艺要求比较大,增加了开发成本,并且当 前的a v sa u d i o 以及肝e g - 2 从c 解码复杂度大大增加,很难在软件平台上实现。 软硬件的协同方向,文献 1 2 对一款基于d s p 核的肝3 从c 双解码系统进行了优化, 该解码系统芯片采用0 3 5p m 工艺,工作频率4 0 w h z ,解码芯片在肝3 模式下运行速度为 1 3 3 3 m i p s ,在a a c 模式下为1 6 9 w i p s 。该d s p 核数据位宽为2 0 位,实现l h f f m a n 解码的 操作可以通过专用的硬件加速器控制,其指令集包含实现码流分解、执行解码操作的专用 指令。文献 1 3 介绍了一种基于软硬件协同设计的w p 3 音频解码的方法,解码器的软件和 硬件部分被分为前处理单元和后处理单元。专用硬件处理单元采用改进的快速算法,对w p 3 音频解码流程进行密集计算。该架构在减小内存和硬件复杂度的基础上实现了较高的吞吐 量。采用o 3 5l a m 工艺,最高工作频率为2 0m h z 。文献 1 4 提出了一种基于m c u i d s p 混和 2 第一章绪论 处理器的音频解码优化方案,针对m c u d s p 混和处理器的特点,从解码算法、s a 跚( 静态 随机存储内存) 和e 姒c 指令等方面,对肝3 解码软件进行性能优化。 软硬结合方向的研究中,大多数学者对解码器的功能进行软硬划分,克服了偏硬件或 偏软件实现的缺陷。对于容易用硬件实现的模块或者计算量较大且功能比较固定的模块采 用硬件实现。由于纯粹的硬件实现复杂度和技术难度都比较高,因此在硬件上嵌入处理器, 处理器中实现算法的软件编程,这样可以选用性能较低的解码芯片,从而降低了开发成本, 提高了开发的灵活性。 在音频解码算法的研究中,由于h u f f m a n 解码算法和i m i k :t 运算在解码中应用普遍n 讫1 , 而且计算量大,针对h u f f m a n 解码算法和i m d c t 的快速算法研究已经成为研究热点11 2 4 o 文 献 2 5 2 提出了一种快速h u f f m a n 解码算法,将解码过程变得像编码一样,可以一次性地读入 若干位码流,使占码流中大部分的短码字能迅速解码,从而提高系统整体的运行效率。运 行结果表明,在增加为数不多的系统资源的情况下,该算法的执行效率有了大幅度的提高。 文献 2 6 根据h u f f m a n 码表的特点提出了一种快速h u f f m a n 解码算法,该算法在原有h u f f m a n 码表的基础上建立了一个定位表,通过定位表得到查表地址,在增加了为数不多的存储空 间的情况下,解码速度有了大幅度的提高。文献 2 7 对肝e g 一1 音频解码系统中的快速 h u f f m a n 解码算法进行有效地改进。通过码表的变换,可以快速定位码表范围,从而大大提 高整个音频系统的执行效率。文献e 2 8 介绍了一种根据码字长度列表生成h u f f m a n 码表的新 型算法,该算法与数的结构及特点密切相关,且步骤简单,存储空间利用率高。通过文献 中的算法实例证明,该算法具有简单灵活地优点。 文献 2 9 根据定点d s p 的特点,利用时间抽取( d i t ) 分裂基快速傅立叶变换,设计了 适用于定点d s p 的蝶形岫c t 快速算法。该算法适用于任意长度的正向邶c t ,比一般皿c t 算法 的应用节省了2 3 的运算量,而且随着长度的增加,运算量的节省优势更加明显。文献e 3 0 提出了一种用递归方法求解m d c t 和i 蛐c 1 的算法,并且用同一种结构实现了- f 1 ) c t 和i 肋c t , 从而节省了硬件资源。该算法只用n 4 的递归次数完成了如c t 和i m d c r 的运算,由于采用递 归的结构,很适合并行v l s i 的实现。文献 3 1 提出了一种新的肋c t i 如c t 快速实现方案, 基于n 8 点f f t 变换,采用奇偶双路并行和蝶形单元技术,与现有的快速算法相比,运算速 度和吞吐能力均提高一倍。此外该方案既可以实现胁c t 正变换,也可以实现相应的逆变换。 文献 3 2 3 3 针对_ t p e 6 一l 和_ l p e g - 2 标准中的n 为1 2 以及n 为3 6 的情况,设计了3 点和9 点的d c r 三型和d s t 三型快速算法。该算法对1 2 点的i 如c r 运算需要1 3 次乘法计算和3 3 次加法计算, 对3 6 点1 1 脱 7 需要5 1 次乘法计算和1 5 1 次加法计算。 综上所述,基于d s p 进行音频解码是一种合理的软硬件协同实现的解码方式。可以在 d s p 核中针对计算量大且运算有规律的解码部分如h u f f m a n 解码部分和i 如c t 部分进行优 化,提高解码效率。统一的i 姗c t 快速算法在实现多标准音频解码时可以复用,基于软件 实现可以减少程序存储空间,基于硬件实现可以减小芯片面积。i l i d c t 的迭代算法对变换 长度没有严格的限制,能够应用于多种音频标准,并且能够保证同一标准中长短多种变换 的算法一致。 3 南京信息工程大学硕士学位论文 1 3 问题的提出 音频解码系统性能的提高关键在于各种解码算法的优化。在众多解码算法中h u f f m a n 解码部分和i m d c r 是复杂音频解码副引瞄1 中的两个运算密集型模块,对音频解码过程的实 时性有重要影响。h u f f m a n 解码过程中,应用快速有效的查表算法能够提升h u f f m a n 解码 的执行效率。本文在文献 2 5 提出的快速查表算法的基础上对该算法进行了优化。 在音频解码过程中,针对i m d c r 迭代算法计算效率低的现象,文献 3 4 提出了新的算 法,该算法把i m i ) c r 的计算时延减少了5 0 ,但该算法由于实现结构不能进一步分解,因 此计算效率进一步提高的空间不大。本文在文献 3 4 算法的基础上提出了优化。 1 4 本文工作与论文结构 本文分别从软件,硬件,软硬件结合等三个方向阐述了音频解码系统的研究现状,对 解码过程中各种算法优化后的性能进行了讨论。详细分析了音频编码中的心理感知特性, 并分别仿真了纯音和噪声对纯音的掩蔽效应图。系统地分析了胛e g 一1 层3 的解码原理和解 码流程,着重针对h u f f m a n 解码过程、i m d c r 处理和子带综合滤波进行了较详细地分析。 本文主要的创新是对已有的h u f f m a n 解码优化算法和i m i ) c t 优化处理进行进一步优化,提 高了算法的计算效率。研究了基于t m s 3 2 0 c 5 4 1 6 的音频解码系统的定点化问题,并在c c s 上进行了仿真分析。 本文共分五章。本章简单介绍了选题的目的和意义,国内外研究现状和本文的主要工 作。第二章首先分析了听觉系统的感知特性,介绍了音频编解码各种标准的分类和发展, 然后主要对m p e g - 1 层3 的解码原理进行研究了音频解码的基本理论,对听觉系统的感知特 性进行了研究。第三章首先分析了常见的h u f f m a n 解码算法,并对快速h u f f m a n 查表算法 进行了优化,然后分析了常见的i m d c r 优化处理,并对已有的优化处理算法进行进一步的 优化。第四章首先介绍了t 惦3 2 0 c 5 4 1 6 芯片的特点和指令系统,然后对解码过程进行定点 化处理,在m a t l a b 和c c s 上进行仿真实验,并对结果进行分析。第五章对全文的工作进行 了总结,指出了本文的不足之处,提出了有待完善的地方。 4 第二章音频解码的基本理论 第二章音频解码的基本理论 音频解码是音频技术的重要组成部分,根据不同的编码方式,音频解码相应的可以分 为很多种类。m p e g 1 层3 标准编码充分利用人耳的听觉特性,是一种具有很高压缩比编 码方法。采用这种编码方法可以得到较高的音乐回放质量。比如将c d 格式的音乐数据压 缩成m p e g - 1 层3 格式,音效相差无几,文件至少可压缩至1 1 0 。每首c d 歌曲大约有 4 0 m b - 5 0 m b 的数据量,而采用m p e g 1 层3 格式,每首歌曲的数据量只有4 m b 5 m b 。 由于这种编码的复杂性,解码的过程也有一定的难度。在解码过程中,由于h u f f m a n 编码 是可变的,音频帧的数据长度也是变化的。在解码后,音频数据要进行一系列的变换处理, 每一步都关系到最终的解码效果。 2 1 听觉系统的感知特性 声音中存在一些人很难感觉到的信号,在音频编码时,为了得到很高的压缩比又不牺 牲音频质量,就要去掉那些人很难感觉到的信号。这种压缩编码称为感知声音编码m 1 ,肝阱 音频标准所采用的感知编码主要应用了心里声学模型陋圳的三个特性:响度、音高和掩蔽 效应。 响度就是声音的强弱。人耳对响度的感觉有一个范围,即从听阈到痛阈。当声音的强 弱小到人的耳朵刚刚可以听见时称为听阈,如果加大声音强度使它达到人的耳朵感到疼痛, 这个阈值称为痛阈。人耳的听觉范围就是从听阈到痛阈的中间区域。 物理上用频率表示声音的音调,其单位是h z ,人主观感觉音调是一个心理过程,用音 高来表示。人耳对不同频率的声音的敏感程度差别很大,其中对2 k h z - - 一4 k h z 范围的信号最 为敏感,在这个频率范围内,幅度很低的信号都能被人耳听到。而在之外的低频区和高频 区,能被人耳听到的信号幅度要高得多。 一个声音的听觉感受受到同时听到的另一个声音的影响的现象称为掩蔽效应。此时前 者称为被掩蔽音,后者称为掩蔽音。被掩蔽音单独存在时的听阈分贝称为绝对听阈。由于 低于绝对听阈曲线的声音不能被人耳感觉到,数字音讯在做压缩处理的时候,可以将这部 份声音直接舍去。如图2 - 1 所示,在纯音对纯音的掩蔽效应实验中,对中等掩蔽强度来说, 纯音最有效的掩蔽出现在它的频率附近,低频的纯音可以有效地掩蔽高频的纯音,而高频 的纯音对低频纯音的掩蔽作用很小。如图2 2 所示,在噪音对纯音的掩蔽效应实验中,可 把噪音视为许多纯音组成的宽带音,掩蔽作用最明显的是被掩蔽纯音频率附近的一个窄带 的掩蔽分量,如果在这一频带内噪声功率等于该纯音的功率,这时该纯音处于刚好能被听 到的临界状态,这一带宽称为临界带宽。临界频带的位置不固定,以任何频率为中心都有 一个临界频带。连续的临界频带序号记为临界频带率,或称为b a r k 域。在2 0 h z 1 6 k h z 范 围内,可分为2 4 个频率群或者2 4 个巴克( b a r k ) 。 心理声学模型用f f t 分析信号中包含的频率分量,将每个频率处受到其他所有频率分 量掩蔽的值加起来,连线得到的曲线是频率的函数。当某频率分量的能量处曲线下方时, 5 塑室笪星三垦奎兰堡主堂垡丝苎 不能被人耳感觉到,则该频率分量可用零比特编码;另一方面,选择量化阶时若能保证量 化噪声低于掩蔽曲线,也不被人耳察觉,所以掩蔽值越大的频率分量量化阶可以越大。因 此用掩蔽阈值作为量化编码的依据,就能够保证压缩后的声音质量。绝对听阈的曲线“捌 可以用以频率f 为输入变量的数学公式表示如下: 乙_ 3 6 4 ( 志) - - o s _ 6 5 e - 。6 锅f + 10 - 3 岳) 4 ( 2 - 1 ) 当被掩蔽声音在前,掩蔽声音在后时,称为后掩蔽。如果被掩蔽声音在后,而掩蔽声 音在前则称为前掩蔽。后掩蔽的特点是当掩蔽声音消失一段时间以后,掩蔽作用依然会持 续一段时间。前掩蔽的特点是当被掩蔽声音出现后,如果在相隔0 0 5 0 2 秒之内出现了 掩蔽声,则该掩蔽声同样可以起到掩蔽作用。掩蔽效应还具有其它特点: 低比 乐。 ? ? 幺- 一 )0 511 52 2 5 测试音频率肫 x1 0 4 一一一一一一一一一一 一 )51 01 52 02 5 临界频带值b a r k 图2 1 测试音频纯音调问的掩蔽阈值曲线 方真了各种不同的掩蔽效应,掩蔽效应是一个较为复杂的心理和生理现象,在 e 缩编码中起着重要的作用。m 胡a b 仿真实验的测试音频为一段5 秒钟的轻音 矿以看出,掩蔽阈值曲线的低频段陡峭,高频段比较平坦。 6 第二章音频解码的基本理论 3 0 0 要2 0 0 鼯 爱1 0 0 伽 鬟0 1 罩 鬟 圈 韫 枷 经 翳 商件? f ? 轷2 0 0 5 1 1 52 测试音频率1 l z 2 5 x1 0 4 罩 疑 幽 散 铷 ,墨 爨 临界频带率髓r i 图2 - 2 测试音频噪声对纯音调的掩蔽阈值曲线 临界频带率b a r k 图2 - 3 各种不同的掩蔽效果曲线 7 南京信息工程大学硕士学位论文 2 2 音频编解码的分类 2 0 世纪8 0 年代,杜比实验室开始了感知编码算法和标准化工作的研究,相继开发了 a c - 2 和a c 一3 等算法。其中a c - 3 算法应用得最广泛。a c _ 3 是为了使用于多声道音频编码而 发展出来的,编码器可以对5 1 声道的一个音频数据块进行编码,其中搿o 1 一声道为输入 音频中低于1 2 0 h z 的低频部分,其它五个声道分别是左声道,右声道,中间声道,左环绕 声道和右环绕声道。 1 9 8 8 年胛e g ( 运动图象专家组) 工作组成立n 射,开始着手制定m p e g 音频标准。 1 9 9 2 年m p f 2 ;- 1 音频编码标准完成,该标准采用了多种编码方法,。m p f i ;- 1 音频层3 接受采样频 率为3 2k h z 、4 4 1 k h z 和4 8k h z 的1 6 比特p c m 格式信号作为输入数据,传输速率为每声 道3 2 k b p s - - - 4 4 8 k b p s 。同时m p f - i 提供单声道,立体声道,双声道立体声和联合立体声四 种音频声道模式。m p f b - i 音频编码包括三层:层1 ,层2 和层3 ,每一个更高的层比上一 层有更高的编解码复杂度和更好的音质。 1 9 9 4 年肝e g 针对数字电视开发了肝e g 一2 u ,它是- i p e g - 1 的扩展。接受采样频率为 1 6 k h z 、2 2 5 k h z 和2 4 1 0 i z 的信号作为输入数据,支持更先进的多声道( 环绕立体声) 编码模 式,加上低频扩展声道达到五声道编码。由于存在必须向下兼容的限制,该标准在编码6 4 0 k b p s 以下的五声道音频数据时效果不太好,1 9 9 7 年胛e g 发展了不向下兼容的音频编码标 准m p e g - 2 a a c 。a a c 标准采用了许多以前的音频标准每使用的技术,如自适应窗类型选择, 频谱系数预测,时域噪声成型,比特率带宽缩放操作等。同时a a c 与其它音频编码标准一 样,采用了复杂的无噪声编码和比特分配技术。 1 9 9 8 年胛e g 开始制定新的标准肝e g - 4 u 引n 射,肝e g - 4 音频编码除了采用必须的感知编 码策略外,还使用了一系列其它的编码技术,如基于目标的编码等。另外,肝e g - 4 音频标 准要求编码器提供多种功能,主要有编码器复杂度可分级性、解码器复杂度可分级性、码 率可分级性和带宽可分级性等。编码的音频即可以是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论