




已阅读5页,还剩58页未读, 继续免费阅读
(电路与系统专业论文)aac编码器的dsp实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 从2 0 世纪8 0 年代开始,人们开始致力于将声音、图形和图像作为新的信息 媒体输入输出计算机,于是,有关视频和音频的获取技术、数据的压缩编码和解 码技术、视频音频的实时处理技术等就成为需要研究的课题。传统的信息压缩方 法都是基于信号的统计特性,这种方式忽略了人体的生理特性,而m p e g 提出 的音频压缩标准是一种考虑了人体生理特性的高保真感知音频编码标准,其中 m p 3 已是现在最广泛流行的编码方式。本文介绍和实现了m p e g 新的感知音频 压缩标准a a c ( a d v a n c e da u d i o c o d i n g ) 。 a a c 编码方案的算法比较复杂,但是它在很多应用场合都有实时性的要求。 现在多媒体的处理越来越多的使用d s p 以构成各种应用系统,构建一个d s p 的 试验平台并进行a a c 编码方案在d s p 上的试验也就很有必要。针对这些情况, 我们做了以下几点工作: 1 ) 我们对算法进行了快速实现的研究,通过对量化编码方案修改,减少了 量化过程的循环次数,提高了编码速度,而在对改进后的编码效果的测试中,我 们发现编码速度提高了2 0 ,音频质量却并没有明显降低。 2 ) 我们采用t i 的t m s 3 2 0 c 6 7 1 l d s k 对编码器作了实现,并针对d s p 作 了一些优化,将指数函数计算改为查表计算,并根据t s u n g h a r t t s a i 【3 0 1 提出的精 度校正函数缩小了表格大小,同时调用d s p l i b 库函数,以及对部分代码直接采 用汇编实现。 3 ) 针对a a c 算法的高复杂度,我们设计了一个双d s p + f p g a 的编码器硬 件系统,分为两块电路板实现。我们详细叙述了系统的原理,并给出了f p g a 的 逻辑和仿真结果。 4 ) 在对两块电路板布局布线之后,针对电路扳的高密度,高频率特点,特 别对系统进行了信号完整性仿真。通过调整信号线端接,改善了信号质量。 2 a b s t r a c t f r o m1 9 8 0 s ,e n g i n e e r sh a v ee n g a g e dt oi n p u t o u t p u ta u d i o ,p i c t u r ea n di m a g e t o f r o mc o m p u t e ra su e wm e d i ai n f o r m a t i o n t h e r e f o r e ,t h ep r o b l e m so fs a m p l i n g v i d e o a u d i o ,c o m p r e s s i n g d e c o m p r e s s i n gd i g i t a l d a t aa n dp r o c e s s i n gv i d e o a u d i o i n f o r m a t i o ni nr e a lt i m eb e c a m et h er e s e a r c h i n gt a s k s t h et r a d i t i o n a ld a t ac o m p r e s s m e t h o d sa r eb a s e do nt h e s i g n a l s s t a t i s t i c ,b u ti g n o r e d t h eh u m a np e r c e p t u a l c h a r a c t e r s m p e ga u d i oc o m p r e s ss t a n d a r d sa r es t a n d a r d s o f p e r c e p t u a la u d i oc o d i n g , o n eo ft h e mi sm p 3 _ 也em o s tg e n e r a l l yu s e da u d i oc o m p r e s s i n gm e t h o d t h i sp a p e r i n t r o d u c e dt h ea a c ( a d v a n c e da u d i oc o d i n g ) s t a n d a r d - an e wc o m p r e s sm e t h o d , a n dr e a l i z e dt h ep r o c e d u r ei ns o f t w a r ei np c t h ea a c e n c o d i n gp r o c e s sh a sav e r yh i g l lc o m p l e x i t y t h er e q u e s to f r e a l - t i m e i s v e r y c o m m o ni n t o d a y sa p p l i c a t i o n s ,s o t h ed s p sa r e c o r a l t i o n l y u s e di n m u l t i m e d i as y s t e m s f o rt h e s er e a s o n s ,i ti sv e r yi m p o r t a n tf o ru st od e s i g nad s p p l a t f o r mt o t e s to u ra a c a l g o r i t h ma n df i t o u ra p p l i c a t i o n i nt h i ss i t u a t i o n ,w e f i n i s h e dt h ef o l l o w i n gt a s k s f i r s t ,w ea p p l i e ds o m ef a s ta l g o r i t h mi nt h ep r o c e s s i n gp r o c e d u r e t h e f a s t q u a n t i z i n gm e t h o d r e d u c e dt h el o o pt i m e s ,a n da f t e rt h en e wr e a l i z m i o n ,w et e s t e dt h e a u d i o q u a :i t ya n d c o u l dn o td e t e c td i s t i n c td i f f e r e n c ef r o mt h eo l do n e s e c o n d l y , w ea p p l i e d t h ea a ce n c o d e ro nt h et m s 3 2 0 c 6 7 1 1d s ka n d o p t i m i z e di t f o re x a m p l e ,w eu s e dd s p l i bl i b r a r ya n du s e dt a b l e s e a r c ha l g o r i t h m i n s t e a do f c a l c u l a t i n ge x p o n e n t sd i r e c t l y t h i r d l y , w ed e s i g n e dad o u b l ed s p s + f p g a c o d i n gs y s t e m ,a n dr e a l i z e di ti na t w op c b ss c h e m e w ee x p l m n e dt h ep r i n c i p l eo ft h es y s t e m ,a n dg a v et h ee m u l a t i n g r e s u l t s l a s t l y , a f t e rp l a c i n ga n dr o u t i n g ,f o rt h eh i g hd e n s i t ya n dh i g hf r e q u e n c yo f t h e p c b w ed i ds i ( s i g n a li n t e g r i t y ) e m u l a t eb yu s i n gh y p e r l y n x ,as o f t w a r eo fm e n t o r b yr e g u l m i n gt h ev a l u e so f t h ep o r tc o n n e c t i n gr e s i s t o r s ,w ei m p r o v e dt h eq u a l i t yo f t h es i g n a l si nt h ec i r c u i tb o a r d s 3 第一章绪论 第一章绪论 第一节数字音频压缩技术的发展 音频信号是指频率在2 0 h z 到2 0 k h z 的信号,自从1 8 7 7 年爱迪生发明留声机, 便开始了模拟音频技术发展的历程。随着计算机技术的发展,数字技术开始深入 每个领域,从2 0 世纪8 0 年代开始,人们开始致力于将声音、图形和图像作为新 的信息媒体输入输出计算机,于是,有关视频和音频的获取技术、数据的压缩编 码和解码技术、视频音频的实时处理技术等就成为需要研究的课题。 就音频的存储和传播来说,数字化了的音频的数据量之大是非常惊人的,举 例来说,对于双声道的立体声激光唱盘,如果采样频率为4 4 1 k h z ,精度为1 6 b i t 样本,一张容量为6 5 0 m b 的c dr o m 只能存储约一个小时的音乐。如果不经 压缩,如此庞大的数据量,将给存储器的存储量带来过高的要求,尤其是在网络 化的今天,如此巨大的数据传输量将使得网络多媒体根本不可能实现1 1 i 。幸运的 是,当今数据压缩技术的不断发展使得数字音频的存储和传输都可以高效地进 行。 传统的压缩方法是基于香农信息论的,用统计概率模型来描述信源,而没有 考虑到信息接受者的主观特性。一般来说,这种压缩方法复杂度低,压缩率也比 较低,而且压缩后的音频质量不高,如u 率压缩和a d p c m 。现在流行的音频压 缩编码方法一般都考虑了信息接受者的主观判断,在使用有损压缩提高压缩率的 同时,利用了人耳对音频频率的分辨能力的局限性,以及不同频率之间的掩蔽特 性,从而达到听觉上的“无损”,提高了音频压缩质量。使用这种压缩方法的如 m p e g l 2 的音频部分,杜比a c 3 音频编码标准。 第二节m p e g 音频标准简介 运动图像压缩编码组织,简称m p e g ( m o v i n gp i c t u r ee x p e r tg r o u p ) ,正式 名称是i s 0 i e c j t c l s c 2 9 w g l l f 2 1 ,是国际标准化组织( i s o ) 于1 9 8 8 年成立 的,主要致力于制定运动图像的压缩编码标准,其压缩标准中有一个部分就是 音频编码。虽然m p e g 的最初的主题是为数字存储媒介( d 8 m ) 进行视频及其 4 第一章绪论 伴音的编码,但实际上m p e g 标准已经成功应用在了很多地方,包括数字音频 广播,广播信号的存储,广播信号在i s d n 的传播数字电视伴音以及网络流 媒体和便携式音频播放等。 m p e g 的音频压缩标准是第一个高保真音频压缩的国际标准,另外的一些压 缩算法一般都是关于语音压缩,或者普通质量的音频压缩,前者如c e l p ,后 者如a d p c m 。 1 9 9 3 年,正式编辑出版了m p e g li s o i e c1 1 1 7 2 ,其音频编码部分为1 1 1 7 2 3 , 主要特性如下 l : 1 ) 音频采样率为3 2 ,4 4 1 ,4 8 k h z ; 2 ) 压缩比特流可以支持一到两个声道; 3 ) 可以预先指定编码比特率,范围为3 2 k b p s c h a n n e l 到 2 2 4 k b p s c h a r m e l ; 4 ) 有可选三层编码方式,从上到下编码复杂度依次增加,编码质量 也越高,其第三层编码方案,就是现今流行的m p 3 。 1 9 9 4 年,编辑出版了m p e g 2i s o i e c1 3 8 1 8 ,其音频编码标准是m p e g l 的 扩充,可以分为低采样率标准,多声道标准和多语种标准。特性如下: 1 ) 增加了三个采样率,分别为1 6 ,2 2 0 5 ,2 4 k h z : 2 ) 增加了多通道格式,9 种输入格式,7 种输出格式; 3 ) 对m p e g l 的前后向兼容。 在1 9 9 1 年斯德哥尔摩和汉诺威对m p e g l 音频标准进行测试过程中,采用5 分制标准,其结果是1 2 8 k b p s 在5 分左右,6 4 k b p s 在4 分左右,3 2 k b p s 在3 分 上下。然而在1 9 9 3 年至1 9 9 4 年在柏林和伦敦进行的对m p e g 2 音频m c 算法的 测试中,结果没能达到多数人能接受的水平,也就是在4 分以下,因此m p e g 开始进行后向不兼容算法的研究,从而导致了m p e g 2 中的改进音频算法的出现, 这就是先进音频编码算法,简称a a c 。 除m p e g 1 ,m p e g 2 之外,m p e g 还发展了m p e g 3 ,用于高清晰度数字 电视,不过由于m p e g - 2 几乎完成了视频的定义,所以他最终并入m p e g - 2 :另 外于1 9 9 9 年发展了m p e g 4 ,除压缩算法外,主要侧重于方便网络应用;于2 0 0 1 年发展了m p e g 7 ,主要用于多媒体的搜索,管理和处理等。 第一章绪论 第三节a a c 技术发展现状及趋势 m p e g 2a a c ( a d v a n c e da u d i oc o d i n g ) ,简称a 2 b 或a a c ,是目前m p e g 音频家族中较新的成员【i 】。由于在1 9 9 4 年初对m p e g 2 的音效测试中,效果并 不令人满意,所以m p e g 最终放弃了对音频编码的后向兼容,发展出a a c 。a a c 依然遵从了m p 3 的基本编码规范,如高频率解析度,非均匀量化,哈夫曼编码 等,但在许多细节上作了改进,并使用了许多新的编码模块,从而提高了编码效 率。 1 9 9 7 年,正式形成了i s o i e c1 3 8 1 8 7 ,a a c 成为m p e g 最新的高数码率音 频编码算法。在b b c ,n h k ,c r c 进行的听觉测试中,依据i t ub s 1 1 1 6 ,对 于5 1 通道的音频在比特率3 2 0 k b p s 下,立体声信号在比特率1 2 8 k b p s 下,只有 a a c 算法达到了“透明”的标准。测试结果如图1 1 所示: j 7 + j w q :l c i4 l 1 q p 1 r 】ij n m_ il - 1 。f , 图1 1a a c 测试结果 正是由于a a c 的这种高质量的压缩编码性能,使得它有广阔的发展和应用 前景。m p 4 是基于这一技术而形成的一种商品。之所以说m p 4 是一个商品,是 因为m p 4 出现的主要目的就是意图采用一种带有版权限制的音乐格式去取代目 前在网络上泛滥的m p 3 。a t & t 公司对m p e g 2a a c 技术进行了一些改良,增 加了最关键的音乐传播认证技术,这样就形成了m p 4 这一种东西。不过虽然m p 4 有很多先进的优点,但在与m p 3 竟争的过程中鹿死谁手还有待分晓。关键原因 是m p 3 的使用没有任何限制,这种特性在本来就没有限制的网络上得到充分体 现。相反的是虽然a a c 技术是公开的,但m p 4 本身却是受到严格的专利和使用 许可证保护的。毫无疑问这肯定使得m p 4 的应用范围非常狭窄。而且,现在网 络上应用了a a c 技术的声音格式、编码器、播放器等由于最终文件格式的原因 而基本上互不兼容。另一方愿,与m p 4 的在个人音频设备方面的争议性相比, 6 第一章绪论 a a c 在数字广播方面的前景可能更为明朗,它已成为日本数字广播和电视行业 的标准,而且极可能成为未来的3 g 无线设备中多媒体传输的标准。现在越来越 多的便携式音频播放器开始支持a a c 编码,例如在2 0 0 1 年,s a n y o 公司推出了 s s d p d 7 便携式播放器。在市面上,出现了m p 3 ,a a c ,w m a ,q d e s i g n 几种 主流编码方式,这几种编码方式都有一些广泛使用的编码播放器支持。 就目前的发展趋势来看,对编码方案的研究大多是在一些研究机构进行的, 主要集中在对算法实现速度的改进方面,以及使得编码过程易于被硬件实现。而 作为编码方面的产品开发,所考虑的不仅是编码算法,而要包括一系列复杂的周 围设备完成采集等工作。s o n y 公司就采用t i 的d s p 开发了包括音频采集,混 音,编码等一系列功能的音频处理平台。在解码方面,作为数字音频的解码端系 统,需要将搔放,便携性等特定的需求考虑在内。解码可以很方便的用软件在计 算机上实现,但还存在许多脱离了计算机的情况下需要使用硬件实现。一般实现 方式分为几个方向:通用d s p 实现+ 外围设备,这种实现所需开发代价最小,开 发速度最快,一般是在d s p 之后加上数字放大器,再到数模转换后输出。这种 方法关键在于提高算法在d s p 上运行时的效率,外围设备的设计要复杂一点。 上海交大已经有使用t i 的c 5 4 系列实现m p 3 和a a c 的解码的例子。第二个方 向就是采用专用集成了特定功能的d s p ,这种实现方式有特定的目的,对应用场 合很有针对性,其实这种实现种d s p 的结构依然与成熟的通用d s p 结构类似, 一般是由已有基础的大公司开发的。例如t i 公司开发的一款集成了h dr a d i o 基带处理功能的音频芯片t m s 3 2 0 d i 己1 2 0 0 ,其d s p 结构就是基于t i 公司的c 6 0 0 0 系列d s p 构架的,这种芯片的目的在于提供了数字a m 和f m 接收的单芯片解 决方案。第三个方向是使用a r m 的s o c 方案,这种方案实现的难度适中,灵活 性比较大,以a r m 作为核心处理单元,可以通过运行不同的程序完成不同的功 能。这种实现与第一个方向的通用d s p 实现有些类似,但效率大大提高了,而 且通过集成一些其他功能模块可以提供系统的单芯片解决方案。c i r r u sl o g i c 开 发的e p 7 3 1 2 就是一款以a r m 7 2 0 t 为核心的带控制设备输入输出的音频解码芯 片,可以完成m p 3 ,a a c 等的解码。最后是采用特定的音频解码a s i c ,这种实 现成本比较大,但性能最好。其基本构架也是d s p r i s cp r o c e s s o r + 音频附加模 块,编解码程序置于芯片内部的f l a s h 中,提供自己的指令集,c c + + 编译器。 7 第一章绪论 如c r o s s s e m i 的c s t 2 3 c 0 0 ,其d s p 复杂程度小于通用d s p ,但与控制功能 结合较多,加上u s b 等外设接口,支持m p 3 ,a a c ,w m a 等,在专用音频设 备上能更好的应用。 第四节本文组织结构 本文从第二章开始,阐述了l s o i e c l 3 8 1 8 7 所定义的a a c 编码过程,然后 在第三章给出了软件实现及其计算过程上的改进,以及在d s k 上所作的试验。 随后,在第四章当中,我们叙述了多d s p 工作原理以及双d s p 编码方案,并分 析了双d s p 编码系统方案实现方式的一些问题。双d s p 系统板与控制其高效通 信和协同工作的f p g a 模块分别用电路板的实现,其设计原理和逻辑结构在第五 章中得到了说明。最后,在第六章中我们讨论了有关在设计过程中的信号完整性 问题,进行了仿真并作了一些调整,以尽可能确保系统的可靠性。我们在最后的 总结中概括了全文的内容,并分析了此后应该进行的工作。参考文献列在论文的 最后,因为所用到的器件比较多,所以没有列出这些器件的d a t as h e e t 。 本章小结 本节主要阐述了数字音频技术的发展历史及其现况,初步介绍了m p e g 2 a a c 的特点及其在音频处理方面的优势。在本章的最后一节,我们大体介绍了 本篇论文所作的工作,并给出了论文的组织结构。从下一章开始,我们将开始讨 论a a c 具体的实现过程。 8 第二章a a c 算法原理 第二章a a c 算法原理 a a c 属于感知音频编码。与所有感知音频编码类似,其原理是利用人耳听 觉的掩蔽效应,对变换域中的谱线进行编码,去除将被掩蔽的信息,并控制编码 时的量化噪声不被分辨7 。a a c 编码过程由一些必要模块和一些可选模块组成, 在三种方案里,通过选用不同模块来在编码质量和编码算法复杂度之间进行折 衷,我们采用的是其中的l c 方案。编码流程如图2 1 所示。 图2 1a a c 编码流程图 在编码过程中,时域信号先通过滤波器组( 进行加窗m d c t 变化) 分解成 频域谱线,同时时域信号经过m p e g 中i i 型心理声学模型获得信掩比,掩蔽域 值,m s 以及强度立体声编码需要的控制信息,还有滤波器组中应使用长短窗选 择信息。暂态噪声整形( t n s ) 模块将噪声整形为与能量谱包络形状类似,控制 噪声的分布。强度立体声编码和预测以及m s 立体声编码都能有效降低编码所 需比特数,随后的量化模块用两个嵌套循环进行了比特分配并控制量化噪声小于 掩蔽域值,之后就是改进了码本的哈夫曼编码。这样,与前面各模块得到的边带 信息起,就能构成a a c 码流了。 与m p e g l a y e r l 3 相比,a a c 提高了频率分辨率,增加了预测和噪声整形, 改进了联合立体声编码以及哈夫曼码本,在时频变换中使用了自适应的长短窗 切换机制,有效地增加了压缩比,提高了音频质量。 9 第二章a a c 算法原理 第一节心理声学模型 心理声学模型是感知音频编码的基础。人体的听觉系统对声音信号的感知并 非简单的依赖与声压,还与声音的冲击及听觉系统的感知特性有关。随着数字信 号处理技术的发展,在以后所有的声音通讯系统中都会考虑到这种效应l 。 在心理声学模型的计算中,输入的时域采样信号值以及采样率等信息,由此 得到掩蔽域值和进行m d c t 处理时所应该采用的块类型,以及对本处理块编码 所需比特数的一个大致估计。心理声学模型的计算流程如图2 _ 2 所示,实现时按 如下步骤进行: 图2 2 心理声学模型计算流程 首先计算掩蔽值的扩展函数,各临界频带内的掩蔽效应并不仅局限于一个频 带内,也会在频带之间产生一种可预先估定的掩蔽效应,称为扩展掩蔽效应,计 算函数如下: 1 0 第二章a a c 算法原理 矿, = it e m p x = 3 ( j i ) e l s e t e m p x = 1 5 0 一f 1 t e m p z = 8 + m i n ( ( t e m p x 一0 5 ) 2 2 ( t e m p x o 5 ) ,0 ) t e m p y = 1 5 8 1 1 3 8 9 + 7 5 ( t e m p x + 0 4 7 4 ) 一1 7 5 1 1 0 + ( t e m p x + 0 4 7 4 ) 2 o 5 矿t e m p y 一1 0 0s p r d n g f ( i ,- ,) = 0 e l s e s p r d n g f ( i ,) = 1 0 ”+ ”川0 1 其中i 为导致扩展的频带( b a r k ) ,j 为被扩展影响的频带。 然后将新输入的1 0 2 4 个采样点会同前一帧的1 0 2 4 个样点值组成一个2 0 4 8 点的处理块s ( i ) ,给这个处理块加上一个h a r mw i n d o w 之后,对s w ( i ) 做f f t 变 换,得到处理块的复数谱r ( i ) ,f ( w ) ,分别代表幅度部分和相位部分。 s w ( i ) = s ( i ) ( 0 5 一o 5 c o s 【( 石( f + 0 5 ) 1 0 2 4 】 再由前两个处理块的结果计算出本处理块的可预测部分: r p r e d ( i ) = 2 r _ 1 ( f ) 一r _ 2 ( f ) f p r e d ( i ) = 2 f _ 。( f ) 一正2 ( f ) r _ 。工。及l 2 f :代表前一帧的r f 值以及在前一帧得r f 值。 根据可预测部分及本帧的频谱值,可以得到不可预测的度量: c ( i ) = ( r ( i ) c o s i f ( f ) 一r p r e d ( ) c o s i f p r e d ( f ) ) 2 + ( r ( i ) s i n i f ( f ) 卜,一p r e d ( i ) s i n i f p r e d ( i ) ) 2 】o 5 【r ( f ) + a b s ( r p r e d ( i ) ) 这个公式用于对短块的计算,对长块而言,最低频的6 个系数用此公式,而高频 部分则全部设为0 4 。 在此之后,对每一个掩蔽域值计算频率区域计算区域能量e ( b ) 以及不可预测 的能量部分c ( b ) ,其中b 是区域的序号,不同的采样率对应不同的区域划分,在 低频时,一条频线就组成一个区域,而在高频时,可能很多根频线才组成一个区 域。在标准中提供了个采样率的区域划分参数。e ( b ) 和c ( b ) 的计算公式如下: m 缸l i n e p ( 6 ) = ,( m ) 2 r n = m m _ l i n e m a xl i n e c ( 6 ) = ,( 坍) 2 c ( m ) m - r a i n _ l i n e 在此处得到的e ( b ) 值将用于后面所提到的联合立体声编码部分。随后,我们需要 第二章a a c 算法原理 对以上两个结果是用扩展函数进行修正,考虑相邻区域之间的相互影响,得到修 正后的结果e c b ( b ) 和c t ( b ) : n 吼r e t t l o n e c b ( b ) = e ( 肌) s p r d n g f b v a l ( m ) ,b v a l ( b ) m = l m a x 口w t h i o c t ( b ) = c ( m ) s p r d n g f b v a l ( m ) ,b v a l ( b ) m = l 因为c ( b ) 是经过能量,也就是r ( m ) “2 加权过的,将之重新标准化得到c b ( b ) : c b ( b ) = c t ( b ) e c b ( b ) 再将能量也标准化得到e n ( b ) : 从以上结果可以得到音调索引t b ( b ) : t b ( b ) = - o 2 9 9 一o 4 31 n c b ( b ) 】 现在可以求出区域所需要的信噪比s n r ( b ) : s n r ( b ) = t b ( 6 ) t m n ( b ) + ( 1 一曲( 6 ) ) n m t ( b ) 其中的t m n ( b ) i 司定为1 8 d b ,n m t ( b ) 则固定为6 d b 。于是可以算出实际能量域 值: n b ( b ) = e n ( b ) 1 0 一6 这个值还反馈到后面提及的联合立体声编码过程,等于x t h r ,x 为【l ,凡s ,m 】之 一。为了避免前向回声,并考虑安静域值q s t h r ( b ) ,修正n b ( b ) 如下: n b ( b ) = m a x q s t h r ( b ) ,m i n ( r i b ( b ) ,n b l ( b ) r p e l e v ) n b _ l ( b ) 表示i - - - 帧得n b ( b ) 数据,r p e l e v 则在短块时为1 ,长块时为2 。为了确定 编码所用块类型,求出编码块的感知熵: p e = 艺一 w h i g h ( b ) 一w l o w ( b ) l g 肋( 6 ) ,( p ( 6 ) + 1 ) 】 r d = i 式中w _ h i g h ( b ) 并f l l l o w ( b ) 分别表示区域b 的上限频率和下限频率。然后执行如 下判决过程: 1 2 第二章a a c 算法原理 如果p e 大于s w i t c h _ _ p e ,采用s h o r t _ b l o c k _ t y p e ,否则采用l o n g _ b l o c k _ t y p e ; 如果上一帧采用长块编码而本次判断为短块编码,采用l o n g _ s t a r t _ t y p e ,否则采 用s h o r t _ b l o c k _ t y p e 。 接下来,对于每一个尺度因子带,我们先定义两个变量,这两个变量的值可 以在标准文献提供的表中查出: w _ l o w ( n ) 5 s w f _ _ o f f s e t _ l o n g s h o r tw i n d o w ( n ) ; w _ h i g h ( n ) 5 s w b _ o f f s e tl o n g s h o r t _ w i n d o w ( n + 1 ) - l 每个尺度因子带内的信号f f t 能量和噪声能量分别为: wh i g h e p a r t ( n ) = j ( m ) 2 m w i o ” n p a r t ( n ) = m i n t h r ( w l o w ( n ) ,t h r ( w h i g h ( n ) 】【w h i g h ( n ) + 1 一w l o w ( n ) 其中t h r ( x ) 是每一根频线的掩蔽域值,由掩蔽域值分区计算得到: t h r ( b ) = t h r ( x ,x 【w l o w ( 6 ) ,w h i g h ( b ) ) ;n b ( b ) ( w h i g h ( b ) + l w l o w ( b ) ) 这时就可以得到最终作为量化编码模块的量化依据的信掩比s m r ( n ) : s m r ( n ) = e p a r t ( n ) n p a r t ( n ) 同样也很方便的得到m d c t 的允许的最大能量误差x m i n ( n ) : b i c h x 。m = n p a r t ( n ) 肌撕一l i n e ( m ) 2 e p a r t ( 玎) 一l o w 最后根据感知熵估计一下所需要的编码比特数: b n a l l o c a t i o n = p e w l p e + p e w 2 、i 弹 其中所用为长块时,p e w l = 0 3 ,p e w 2 = 6 ;所用为短块时,p e w l = 0 6 ,p e w 2 = 2 4 。 很明显,需要的附加比特数为: m o r e b i t s = b i t a l l o c a t i o n 一( a v e r a g e b i t s s i d e i n f o b i t s ) 第二节滤波器组 音频编码过程中一个基本的过程就是将时域信号变换成频域信号,与以前的 m p e g _ l a y e r l 3 不同,a a c 编码舍弃了子带编码的方式,采用了长度自适应 的m d c t 。对于频率比较稳定的信号,为了得到最高的编码增益,使用2 0 4 8 点 第二章a a c 算法原理 的m d c t ,这样可以提高频域解析度;而在信号频率变化较快时,使用8 个2 5 6 点的m d c t ,可以提高时域解析度,以得到随时间急剧变化的掩蔽域值。a a c 中还可以在两种不同的窗函数之间进行选择: 第一种是k b d 窗,定义如下: w c 8 dl w ,n q 旬= w k b d g m n 0 心。 o n n 2 2 ” n 其中w 为k a i s e r - b e s s e l 窗函数,n 为窗长( 2 0 4 8 或2 5 6 ) ,w 的定义如下: 俐:型芸掣川小套t ( x 2 ) k 九吲4 6 f o r n = 2 :0 。4 。8 第二种是正弦窗,定义如下: w s m 一,( 疗) = s i n ( - 寺( 盯+ 1 2 ) ) 0 疗 n 2 w s m m r ,( n ) = s i n ( - 告( + 1 2 ) ) n 2 n n 对应于处理时采用的长短窗以及它们之间切换时的过渡,在标准中分为 四类:其一为l o n gw i n d o w ,其二为s h o r tw i n d o w ,其三为 l o n gs t a r tw i n d o w ,其四为l o n gs t o pw i n d o w 。选择窗的形状 时,窗的前半段的形状( 如果是8 个s h o r tw i n d o w ,则是第一个 s h o r tw i n d o w 的前半段) 取决于上一个处理块的窗形状,而 l o n g _ s t a r t _ w i n d o w 和l o n g _ s t o pw i n d o w 的形状也都有其特点 f 睨m 冲8 ( 玎) f o r o r l 1 0 2 4 睨0 g s m r w i n d o ( 疗) = 1 f o r l 0 2 4 n 1 4 7 2 阡名,s 一删r ,2 拍( 一+ 1 2 8 1 4 7 2 ) , f o r l 4 7 2 盯 1 6 0 0 0 f o r l 6 0 0 n 2 0 4 8 1 4 第二章a a c 算法原理 gs m p d 0 0 ) = 0 f o ,0 r 4 4 8 2 ( ”一4 4 8 ) f o r 4 4 8 n 5 7 6 i f o r 5 7 6 墨n 1 0 2 4 w 一m 眠2 0 4 8 ( ) , f o r l 0 2 4 n 2 0 4 8 输入信号序列x 【n 】,在加窗后得到z n 】- x n 】w n 】,对z 【n 】作m d c t ,得到 频谱: x k = 2 薹孙0 s 等【胛+ ( n 2 + 1 ) 2 】( k + l 2 ) 加。七 2 第三节暂态噪声整形t n s t n s ( t e m p o r a l n o i s es h a p i n g ) 是一种控制前向回声的处理技术,适用于通 过预测发现可能产生前向回声的信号块。这种技术对通过第一节得到的频谱系数 进行处理,将量化噪声的包络整形为与需要使用t n s 的处理块的信号形状类似。 首先要选定应用的频带,这根据实现的方案的不同稍有区别,一般是从 1 5 k h z 直到最高频。然后再对选定频率范围对应的谱系数进行线性预测编码 ( l p c ) ,一般来说,普通的预测方法都能够完成任务,例如l e v i n s o n d u r b i n 算 法,得到预测增益和折射系数数组r t n s _ m a x _ o r d e r + 1 ,如果预测增益小于 域值1 4 ,则不使用t n s ,将对应标志t n sd a t a 置为。之后,将折射系_present 0 适用预留比特数进行量化,一般预留比特数值为4 。这个过程如下: i q f a c = ( ( 1 ( c o e f _ _ r e s 1 ) ) 0 5 ) ,( n 2 0 ) ; i q f a c _ m = ( ( 1 6 k h z , 然后用平方和的方式计算出左右通道及和通道的能量值e l s f b ,e r s f b 】,e s s f b 。 在每一个量化因子子带内,求出该子带的强度位置信息: 1 6 第二章a a c 算法原理 吣o s i t i o n = n i n t 2 1 0 9 2 ( 器) 然后计算谱系数强度信号: 艘, i = ( s p e c i i + s p e c r 嗣,藤 最后将左通道的谱系数用强度信号取代,右通道的相应信号则全部置为0 ,这样 得到的信号送入后面的量化和编码模块。 第五节量化和编码 a a c 的量化过程分为内外两个循环过程,在外循环过程中调用内循环,在 不断的循环过程中,内层循环调整共享尺度因子,以求将量化所需的比特数限定 在可用比特数范围之内,而外层循环则检查量化误差,调整各编码带的尺度因子, 以保证在量化噪声不超过掩蔽域值的情况下,尽可能的得到大的编码带增益。图 2 3 至2 5 显示了量化模块的循环过程。 量化过程公式如下: 三r 蜘k ,a c m m k 6 虻i b r 一3 x q u a n t = i n t ( ( a b s ( m d c t l i n e ) + ( 2 4 。 一。 ) ) 4 + m a g i c n u m b e r ) 其中m a o i c _ n u m b e r = 0 4 0 5 4 ,s c a l e f a e t o r 是编码子带的尺度因子, c 0 l 1 1 1 n 0 1 1s c a l
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 重庆火锅绘画课件
- 重庆幼小衔接课件加盟
- 老年人购物安全知识培训课件
- 重力与质量关系课件
- 老年人口腔干燥护理课件
- 老年人关节疾病课件
- 人教版八年级英语上册专练:书面表达(含答案)
- 《高纯锰》行业标准编制说明
- 配电线路工课件
- 2025年度航空航天卫星发射与运营单项工程承包施工协议
- GB/T 15166.4-1994交流高压熔断器通用试验方法
- 2023年威宁彝族回族苗族自治县财政局系统事业单位招聘笔试模拟试题及答案解析
- 急性胃炎诊断证明书
- 新疆生产建设兵团第六师五家渠市事业单位公开招聘284人(必考题)模拟卷和答案
- 润滑油脂性能指标解读课件
- 北师大版数学九年级上册全册同步练习附答案
- 《中华人民共和国职业分类大典》电子版
- 2022学校校服选用工作自查整改报告
- 2019修订《城市规划设计计费指导意见》
- 星级酒店工程部培训课件精品ppt
- 五年级下册数学开学第一课.ppt课件
评论
0/150
提交评论