(电路与系统专业论文)ac3编码器的优化设计和实现.pdf_第1页
(电路与系统专业论文)ac3编码器的优化设计和实现.pdf_第2页
(电路与系统专业论文)ac3编码器的优化设计和实现.pdf_第3页
(电路与系统专业论文)ac3编码器的优化设计和实现.pdf_第4页
(电路与系统专业论文)ac3编码器的优化设计和实现.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(电路与系统专业论文)ac3编码器的优化设计和实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国科学技术大学硕士论文摘要 摘要 数字音频压缩编码技术为人们提供了一种有效的音频存储和传输方法。音 频压缩编码的算法很多,它们的复杂度、音频压缩质量以及压缩比都有很大的 差别。近年来,利用人类听觉系统的特性来达到高保真、高压缩比的感知编码 算法取得了很大进展。在已有的多种方案中以国际标准化组织i s o 所提出的m p e g 系列标准和d o l b y 公司的a c 系列标准影响较大,尤其以d o l b ya c - 3 技术和a a c 音 频编码技术代表了当前两种主要的发展应用方向。d o l b ya c 一3 是一种高效灵活 的数字压缩标准,d v d 和美国数字电视的音频都采用a c - 3 标准,另外在卫星数字 广播、家庭影院、娱乐媒体设备等领域也得到广泛应用。 本文首先a c 一3 音频编码设计进行了探讨,然后分模块描述了编码设计的过 程,并对a c 一3 编码器的关键模块进行了优化,以改善编码质量、提高编码速度, 同时用c 语言实现了优化后的编码器,实验结果表明,在获得良好音频质量的 同时,其运算复杂度有所降低,使处理速度得到提高,取得了良好的效果。 本文的主要工作和特色如下: 1 ) 提出了一种动态可变参数的耦合策略,根据编码的比特率和编码的声道 数目及对应频率系数值是否相近来确定是否采用耦合、耦合子带的数目、如何 划分耦合带,以提高压缩效率。 2 ) 利用音频块的相关性确定指数编码策略和传送指数信息的次数,提高编 码质量,相关的音频块多,表示频谱相对稳定,采用高分辨率模式,几个音频 块共用一个音频块指数信息,否则采用低分辨率模式。 3 ) 提出了量化参数搜索算法来完成比特分配中信噪比偏移量的计算,同时 利用指数编码策略来简化听觉模型参数;另外,在分析滤波器组中的m d c t 变 换中采用了n 4 点f f t 快速算法,这些优化使运算量得以大幅度地减少。 4 ) 实现了优化后的编码算法,并从编码速度和编码质量两方面分析了优化 后的 c 一3 编码算法:算法经优化改进后,编码处理速度比未改进前提高大约2 7 , 大大提高了编码实时性;在编码质量方面,经过对音频质量的主客观评测,结 果显示编码质量也得到了改善。 关键词音频压缩编码分析滤波器组耦合技术比特分配指数编码 中国科学技术大学硕七论文摘要 a b s t r a c t d i g i t a la u d i oc o m p r e s s i o nt e c h n o l o g yp r o v i d e sp e o p l ea ne f f e c t i v em e t h o d t os a v ea n ds e n da u d i os i g n a l t h e r ea r em a n yk i n ds o a l g o r i t h m s ,w h i c hd i f f e r f r o me a c ho t h e ri nt h ec o m p l e x i t y ,q u a l i t ya n dc o m p r e s s i o nr a t i o i nr e c e n t y e a r s ,t h ep e r c e p t u a la u d i oe n c o d i n ga l g o r i t h m sh a v em a d eg r e a tp r o g r e s sf o r a c q u i r eh i g hf i d e l i t ya n dh i g hc o m p r e s s i o nr a t i ot h r o u g hu s i n gt h ep e r c e p t u a l c h a r a c t e r i s t i c so ft h eh u m a nb e i n g m a n ys c h e m e sh a v eb e e np u tf o r w a r d ,a m o n g w h i c h ,t h em p e gs t a n d a r ds e r i e sp r o p o s e db yi n t e r n a t i o n a ls t a n d a r do r g a n i z a t i o n ( i s o ) a n dt h ea c s t a n d a r ds e r i e sd e v e l o p e dd o i b yc o m p a n ya r em o r ei m p o r t a n t , e s p e c i a l l yt h ea a c a n da c - 3t e c h n o l o g i e sa r et h et w om a i nt e n d e n c y d o l b ya c 3i s ah i g l l l ye f f i c i e n ta n df l e x i b l ed i g i t a la u d i oc o m p r e s s i o ns t a n d a r d ,a d o p t e di nd v d a n da m e r i c a nh d t va u t os y s t e m s w i d e l yu s e di ns a t e l l i t ed i g i t a lb r o a d c a s t , h o m e t h e a t r ea sw e l la se n t e r t a i n m e n te q u i p m e n t s t h et h e s i sf i r s td i s c u s sa c 3a u d i oe n c o d i n gd e s i g n ,t h e nd e s c r i b et h ec o u r s eo f e n c o d i n gd e s i g no fc o m p o s i n gm o d u l e s ,a n dt h e no p t i m i z et h ek e ym o d u l e si no r d e r t oi m p m v i n gc o d i n gq u a l i t ya n di n c r e a s i n gc o d i n gs p e e d ,a tt h es a m et i m er e a l i z i n g t h ee n c o d e ra f t e ri m p r o v e m e n tb yc l a n g u a g e r e s u l t ss h o wt h a tt h o s em e t h o d s n o t o n l yp r o d u c eh i g hq u a l i t ya u d i oo u t p u t s ,b u ta l s om a k ec o d i n gs p e e di m p r o v en d s a t i s f i e dr e s u l t sw e r eg a i n e da f t e rr e a l i z a t i o n t h em a l nw o r k sa n dt h ec h a r a c t e r i s t i c so ft h i st h e s i sa sf o l l o w s : 1 ) c o u p l i n gm o d u l eu s eap r o j e c to fd y n a m i c a l l yv a r i a b l ec o u p l i n gp a r a m e t e 俗 t oi n e a s i n ge f f i c i e n c yo f c o m p r e s s i n g , w h i c hm a k es u r ew h e t h e ro rn o ta d o p t c o u p l i n g , t h en u m b e r o ft h ec o u p li n gs u b b a n da n dh o w s e to f fc o u p l i n gb a n d 2 1e x p o n e n t se n c o d i n gm o d u l em a k es u e x p o n e n t se n c o d i n gm o d ea n dt i m e o f c a r r y i n ge x p o n e n t so fu s i n ga u d i o - b l o c kr e l a t i v i t yi no r d e r t oi m p r o v i n gc o d i n g q u a l i t y i fm a n yc o r r e l a t i v ea u d i o - b l o c ks h o ws p e c t r u mr e l a t i v e l ys t a b i l i z a t i o nw h i c h m a ya d o p tf i n ef r e q u e n c yr e s o l u t i o nm o d e ,o t h e r w i s el o wf r e q u e n c yr e s o l u t i o nm o d e 3 ) t 0r e d u c i n go p e r a t i o nq u a n t i t y ,u s i n gq u a n t i t yp a r a m e t e rs e a r c ha l g o r i t h m c o m p u t es i g n a l - t o n o i s eo f f s e to fb i ta l l o c a t i o n ,a n dc o m p u t i n go fa c o u s t i c sm o d e l p a r a m e t e r si sp r e d i g e s t e d a n dm d c t i na n a l y z i n gf i l t e rb a n kc h o o s e st h en 4f f r 2 主望型兰堡查奎兰堡丝奎主! ! l f a s ta l g o r i t h mt od e c r e a s i n go p e r a t i o n 2 1r e a l i z i n gt h ee n c o d e ra f t e ri m p r o v e m e n tb ycl a n g u a g ea n da n a l y z i n g a c 一3 e n c o d in ga l g o r i t h mf r o mc o d i n gq u a l i t ya n dc o d i n gs p e e d :c o d i n gs p e e de n h a n c e a b o u t2 7p e r c e n tt h a nn o to p t i m i z a t i o n ;r e s u l t ss h o wt h a tt h o s em e t h o d sp r o d u c eh i g h q u a l i t ya u d i oo u t p u t sb ys u b j e c t i v ea n d e x t e r n a le v a l u a t i n g k e yw o r d s : a u d i oc o m p r e s s i o ne n c o d e , a n a l y s i sf i l t e rb a n k , c o u p l i n g t e c h n i q u e ,b i ta l l o c a t i o n ,e n c o d ee x p o n e n t s 3 中国科学技术大学硕士论文第一章绪沦 第一章绪论 1 1 引言 自从1 9 6 6 年日本广播协会研制出第一台数字磁带录音机起,数字音频技术 在几十年内得到了迅速的发展,与传统的模拟技术相比,数字技术使高质量音 频信号的采集、存储、后处理、交换和分配更为方便,质量也更高,并且易于 大规模集成,所以一经出现便得到了迅速发展,但它也有自身相应的缺点,即 数字化后音频信息数据非常庞大,它给信息的存储和传输造成较大的困难,例 如采样率为4 4 i k h z 量化精度为1 6 比特的c d 唱片,其1 分钟的立体声音频信 号需占约1 0 m 字节的存储容量,容量为6 7 0 m 比特的c d r o m 只能存放1 5 首歌左 右。如何减少处理和传输的数据量就成为一个关键的技术问题,研究发现,直 接采用p c m 码流进行存储和传输存在非常大的冗余度。事实上,在无损的条件下 对声音至少可进行4 :1 压缩,即只用2 5 的数字量保留所有的信息,而在视频领 域压缩比甚至可以达到几百倍。因而,为利用有限的资源,压缩技术从一出现 便受到广泛的重视。对音频压缩技术的研究和应用由来己久,如a 律、u 律编码 就是简单的准瞬时压扩技术,并在i s d n 话音传输中得到应用。对语音信号的研 究发展较早,也较为成熟,并已得到广泛应用,如自适应差分p c m ( t o p c m ) 、线 性预测编码( l p c ) 等技术。在广播领域,n i c a m ( n e a ri n s t a n t a n e o u sc o m p a n d e d a u d i om u l t i p l e x - - 准瞬时压扩音频复用) 等系统中都使用了音频压缩技术。到 了2 1 世纪9 0 年代,音频压缩编码在d a b ( 数字音频广播) 、数字音频工作站,卫 星广播和高清晰度电视伴音等方面都有着广泛的应用。 1 2 多声道数字音频压缩标准 随着数字音频压缩技术的发展,人们已经不能满足于单声道、立体声的音 响效果,提出了更高的要求一环绕声,最广泛采用的多声道环绕声配置是i t 卜r 建议的5 1 声道配置。环绕声不但应用在电影、家庭影院中,也渗透到了数字电 视和数字广播中。5 1 声道指五个独立的全频带声道( 左、中、右、左环绕和 右环绕) 以及一个为那些在电影中极具震撼力的强劲的低频效果l f e 设计的第 六声道,由于它仅仅需要其它声道大约十分之一的带宽,l f e 声道因此被称为 0 1 声道。 4 中国科学技术大学硕士论文第一章绪论 目前多声道音频压缩技术常用的有三种:数字影院系统公司的d t s 系统、 杜比实验室的杜比数字立体声( a c - 3 ) 和m p e g 一2a a c 。 1 ) d o l b ya c 一3 d o l b ya c - 3 技术是由美国杜比实验室主要针对环绕声开发的一种音频压缩 技术。它是在2 声道a c 一2 的基础上发展起来的。在5 1 声道的条件下,可将码 率压缩至3 8 4k b p s ,压缩比约为1 0 :1 。d o l b ya c 一3 最初是针对影院系统开发 的,但目前已成为应用最为广泛的环绕声压缩技术之一。它能够提供从单声道 到5 1 声道环绕声的各种制式的声音。 “混录”是杜比数字声的一种独特的特性。用户可用任何一种系统对杜比 数字编码的信号还音,不论声道的数目如何,都可对5 1 声道的杜比数字节目 进行还音。单声道和两声道用户解码器可从多声道节目中自动产生单声道,立 体声或杜比环绕声。 2 ) d t s 系统 d t s 系统是1 9 9 3 年在影片侏罗纪公园中首次推出的。d t s 将数字音轨存储 在c d - r o m 光盘上,使用的编码算法为相干声学编码,相干声学编码策略涉及两 项主要处理,即子带滤波和自适应差分编码调制( a d p c m ) 。滤波处理将整个未压 缩的全带宽信号分割成许多带宽较窄的子带,各子带互相独立地分别处理。每 个子带内实施差分编码( 子带a d b c m ) ,从信号中去除客观的冗余信息。同时,实 施心理声学和瞬态分析以确定感知上的不相关信息。差分编码和心理声学建模 的噪声掩蔽门限相结合,能高效地降低比特率。这种算法可在4 :i 压缩比的情 况下提供质量更高的多声道音频信息。与d o l b ya c - 3 相比,它的优点是声音质 量更好,但由于数据量过大而不能存储在d v d 上。 3 ) m p e g 一2 从c m p e g 一2a a c 是m p e g 一2 标准中的一种非常灵活的声音感知编码标准。就像 所有感知编码一样,l i p e g 一2a a c 主要使用听觉系统的掩蔽特性来减少声音的数 据量,并且通过把量化噪声分散到各个子带中,用全局信号把噪声掩蔽掉。 从c 支持的采样频率可从8 9 6k h z ,a a c 编码器的音源可以是单声道的、立 体声的和多声道的声音。a a c 标准可支持4 8 个主声道、1 6 个低频音效加强通道 l f e ( 1 0 wf r e q u e n c ye f e c t s ) 、1 6 个配音声道( o v e r d u b c h a n n e l ) 或称多语言声道 ( m u h i l i n g u a lc h a n n e l ) 和1 6 个数据流。m p e g 一2a a c 在压缩比为1 l :1 ,即每个 声道的数据率为( 4 4 1 x 1 6 ) 1 1 = 6 4k b p s ,而5 个声道的总数据率为3 2 0k b p s 的 情况下,很难区分还原后的声音与原始声音之间的差别。与m p e g 一1l a y e r l l 相 5 中国科学技术大学硕士论文第一章绪论 比,m p e g 一2a a c 的压缩率可提高l 倍,而且质量更高,与m p e g 一2 的层3 相比,在 质量相同的条件下数据率是它的7 0 。 表1 1 列出了这几种编码方式比较,从表中可以清楚地比较出它们的压缩 比、数据率和适用的声道数等。 d o l b ya c 一3 讲r sm p e g 一2a c 声道数1 5 1l 8l 4 8 采样频率l d 乜3 2 4 4 1 4 88 1 9 28 9 6 量化精度b i t 1 6 2 41 6 2 41 6 2 4 压缩比1 0 :1约4 :i1 6 :1 数据帧大小样值 1 5 3 65 1 21 0 2 4 数据率3 2 6 4 0k b s 最高1 4m b s 最高5 7 6k b s 主要应用 h d t v 、d v d 和电影院电影院数字电视、广播和通信 4 ) m p e g - 2a a c 与a c - 3 比较 m p e g 一2 从c 与a c 3 作为目前应用最广泛的多声道音频编解码技术,同属于 波形编码的范畴,两者都采用了m d c t 的算法和基于人耳特性的掩蔽效应的比特 分配。不同的是,m p e g 音频编码标准( i s o1 1 1 7 2 3 ) 以子带编码为核心,而d o l b y a c - 3 方案则是另外的变换编码方案。 在音质效果上,a c 一3 编码技术与m p e g - 2 相较而言,它们都能实现多种码率 的传输,都能保证在每声道压缩到l o o k b i t s 左右( 压缩比6 :1 8 :1 ) 时,解码端的 重建质量能与c d 质量相当。两种算法不仅都具有很高的主观评价质量和适中的 复杂度,而且其解码复杂度低,延时小,独立性强,因而被广泛地采用。 但是,由于m p e g 音频压缩算法做为高保真声音数字压缩的第一个国际标准, 它必须兼顾考虑图象的处理和传输,因而在算法实现以及传输格式的设计中存 在着一些限制。m p e g 一2 虽然对m p e g 一1 进行了低取样率和多声道的扩展,可以对 m p e g l 的半取样率和5 1 声道进行处理,但是它的帧格式仍然是与m p e g - i 兼容 的,即m p e g 一2 的编解码器也可以编解码m p e g - i 的音频,而a c 一3 编码技术不考虑 兼容问题,具有更大的灵活度,算法对人耳掩蔽曲线的逼近也更为接近,压缩 的效果也相对较好。 6 中国科学技术大学硕七论文第一章绪论 1 3d o l b ya c - 3 的发展和特点 a c 一3 技术起源于为高清晰度电视( h d t v ) 提供高质量声音。美国联邦通信委 员会f c c 的高级电视咨询委员会a c a t s ( a d v i s o r yc o m m i t t e e0 na d v a n c e d t e l e v i s i o ns e r v i c e ) 于1 9 8 7 年开始美国h d t v 制式的研究。最初的h d t v 系统方案 是模拟图象和数字声音传输,其中声音编码采用d o l b ya c l 数字编码器。a c 一1 通过4 - 2 4 多声道矩阵方式把声道数减少一半( 这样就可以减少传输容量) ,然后 采用增量调制( 调制) 技术进行数字编码。因此,a c i 的压缩倍数为两倍。到 1 9 8 9 年,随着声音编码技术和数字信号处理器d s p 的进步,a c - i 系统发展成为基 于变换编码技术的a c 一2 系统,在提高质量的同时,压缩倍数进一步变为4 倍,但 是多声道矩阵处理技术仍然保留着。 为了最大限度地发挥矩阵方式的特性,必须把编码的信号再解码,而且要 边监听效果边加以确认,对于电视现场节目,有时一次解码很难确认其效果, 所以用两声道码率提供多声道编码性能的a c - 3 系统由此诞生。 到了1 9 9 1 年中期,a c - 3 逐渐被公众所知,并被美国h d t v 声音组织接受。1 9 9 3 年1 1 月,高级电视咨询委员会a c a t s 正式批准g ah d t v 系统采用a c 一3 算法方案。 1 9 9 4 年a t s c 的建议草案的声音部分采用a c - 3 算法,1 9 9 6 年底美国f c c 已采纳a t s c i ) t v 标准,将a c - 3 作为未来高清晰度电视的伴音标准。北美及日本这些采用n t s c 制式的国家将d o l b ya c - 3 作为新一代影碟d v d 的音频标准。事实上,a c _ 3 很快被 其它国家接受为多声道音频编码标准。d v d - r o m 、个人计算机产品、家庭影院、 数字有线电视系统以及一些直播卫星( d b s ) 系统都采用a p 3 作音频编解码器。 a c - 3 的编解码器被设计成一个完整的音频子系统的解决方案,它拥有普通 的低码率编解码所没有的许多特性。这些特性包括适用于消费类音频回放系统 的动态范围压缩特性( d y n a m i cr a n g ec o m p r e s s i o n ) 、兼容性和扩展性、对话归 一( d i a l o g n o r m a l i z a t i o n ) 以及缩混特性( d o r n m i x i n g ) ,动态范围控制( d y n a m i c r a n g ec o n t r 0 1 ) 的控制字是嵌入在a c 一3 比特流内,并被解码器应用,可以由听 众选择全动态范围、部分压缩动态范围和高度压缩动态范围的重建声音;兼容 性和扩展性使它可根据特定的应用选定比特率和声道数,所有的类型采用相同 的原理,保证了格式间的兼容性和对将来需求的扩展性;向下混合技术可使a c 一3 解码器根据输出设备的实际声道数提供最优的声道缩减方案,将多声道音频进 行转换为特定数目的声道输出。 7 中国科学技术大学硕士论文第一章绪论 1 4 研究意义 随着我国经济的高速发展,人们消费水平进一步提高,我国必将会形成一 个庞大的数字家庭影院系统市场。在这个大市场中,d o l b ya c 一3 是广泛使用 的家庭影院环绕声系统,通过采用a c - 3 宽带音频压缩技术,在数字家庭影院系 统中实现了用十分之一的标准数字音频空间来存储高质量的多声道声音数据。 并且d o l b ya c - 3 在美国的h d t v ,卫星数字广播,数字演播室等领域也广泛应用, 潜力很大。但我国尚未出现具有自主知识产权的d o l b ya c 一3 编解码器,需求量 较大的国产d v d 机中的芯片全为美国及日本的厂家所垄断,它限制着国内d v d 产 业及音响产业的迅速发展。因此研究a c 一3 技术对我国有着重大的现实意义,它既 可以改变依赖进口的尴尬局面,也增强了开发各种数字多媒体编解码器的能力。 1 5 论文的主要工作及组织结构 本文的目的是对d o l b ya c - 3 音频编码技术进行研究,设计一个a c 一3 编码器, 在保证算法精度的前提下,优化编码算法,希望能提高编码速度,改善编码性 能,并用c 语言进行实现,为最终实现专用的硬件编码芯片打下基础。 全文共分四章,第一章是绪论,简要阐述了音频编码技术的概况,研究几 种当前主要的多声道音频编码标准并作了比较,介绍了d o l b y a c - 3 的发展及特 点。第二章介绍了a c - 3 音频编解码原理,研究了a c 一3 码流结构,分析了a c 一3 编 码器设计时考虑的问题。第三章提出了一个a c 一3 编码器设计的方案,详细的给 出了各个模块的算法分析。第四章对a c 一3 编码器一些关键模块进行了编码算法 的优化。第五章从编码速度和编码质量两个方面对仿真实现的结果进行分析。 第六章对全文做出了总结,对未来工作进行了展望。 1 6 本章小结 本章是全文的绪论部分,主要包括: 1 ) 简要阐述了音频编码技术的概况,对当前主要的多声道音频编码d t s 系 统、杜比a c 一3 和m p e g 一2a a c 作了研究并比较它们优缺点,得出结论a c 一3 编码技 术具有更大的灵活度,算法对人耳掩蔽曲线的逼近也更为接近,压缩的效果也 相对较好。 2 ) 概述t d o l b ya c - 3 的发展过程及其具有的普通的低码率编解码所没有 的许多特性,包括动态范围压缩特性、兼容性和扩展性、对话归一以及缩混特 性,动态范围控制等。 8 中国科学技术大学硕十论文第一章绪论 3 ) 介绍了本课题的研究意义,研究a c 一3 技术具有着重大的现实意义,它既 可以改变芯片完全依赖进口的尴尬局面,也增强了开发各种数字多媒体编解码 器的能力。 4 ) 列出了本文的主要工作和组织结构。 9 中国科学技术大学硕士论文 第二章a c 3 算法标准 第二章a c - 3 算法标准口1 2 1 概述 为了更有效地广播或记录音频信号,可以减少表达音频信号所需的信息量。 就数字音频信号而言,通过应用一种“数字压缩”算法,来减少正确再现原始 脉码调制( p c m ) 样本所需的数字信息量,得出原始信号经数字压缩后的表达式。 a 5 2 文件规定的a c 一3 数字压缩算法,可将1 至5 1 声道的信源音频,从p c m 的表达 式编码成一个串行的数码流,其数据率范围从3 2 k b i d s 至6 4 0 k b i t s ,而0 1 声 谴是指部分带宽的声道,打算只运送低频信号( 甚低频扬声器( s u b w o o f e r ) 。 算法应用的一个典型例子是a c 一3 在卫星音频传输的应用,如图2 1 所示。在 此例中,一个5 1 声道的音频节目,用p c k t 表示需要5 m b p s ( 6 声道4 8 k h z 1 8 b i t s = 5 1 8 4 f o p s ) 以上的码率,通过a c 一3 编码器可转换为3 8 4 k b p s 的串行数码 流。卫星发射设备将这个码流发射出去,接收设备接收信号,经解调后还原成 3 8 4 k b p s 的连续码流,再由a c 一3 解码器进行解码,得出原始的5 1 声道音频节目。 t n n m b 1 0 n l 蜘i e q 岫删i l 翁 e r k o m s r e c e p t l o n e c l u i p n 瑚t0 a c - 3d e c o d e r 图2 一la c 一3 在卫星音频传输的应用 1 0 巾国科学技术大学硕士论文第:章a c 3 算法标准 2 2a c 一3 编码 a c - 3 算法通过对声音信号在频域( f r e q u e n c yd o m a i n ) 进行量化 ( q u a n t i z i n g ) ,可以达到很高的编码增益( c o d i n gg a i n ) ( 输入码率对输出码率 之比) 。a c 一3 编码器原理如图2 - 2 所示。编码过程的第一步是把时域内的p c m 样值 ( t i m es a m p l e ) 送入分析滤波器组( a n a l y s i sf i l t e rb a n k ) ,进行加窗( w i n d o w ) 处理,再经过m d c t 变换将时域样值转换为频率系数( f r e q u e n c yc o e f f i c i e n t s ) 块序列。每个变换系数由二进制指数( e x p o n e n t s ) 部分和尾数( 妇n t i s s a s ) 部分组成。在编码时对指数部分和尾数部分进行分别处理。指数被编码为信号 频谱的粗略表示,称为频谱包络( s p e c t r a le n v e l o p e ) ,可以粗略的代表信号的 频谱,也就是信号的大致形状。运用前后向混合的动态比特分配( b i t a l l o c a t i o n ) 计算出需给每个系数的尾数分配多少比特,对尾数量化。最后将 尾数、频谱包络以及相关的信息按照a c 一3 的格式进行打包后,得到a c 一3 输出码 流。6 个音频块的频谱包络与量化的尾数( 1 5 3 6 个音频样值) 形成一个a c 一3 同步帧 ( a c 一3f r a m ef o r m a t t i n g ) 。a c - 3 码流是连续的a c 一3 帧序列。 p c m 帆 s 副刊酿黔 图2 - 2a c 一3 编码过程原理图 实际的a c 一3 编码器比图2 - 2 中所表示的更为复杂。它还包括前面未说明的下 述功能: 1 a c 一3 同步帧的帧头包含与编码的数据流同步以及把解码数据帧的信息 ( 比特率、取样率、编码的声道数目等) 。 2 为了使解码器能检测接收的数据帧是否有误码,插入误码检测码字。 中国科学技术大学硕+ 论文第:章a c 3 算法标准 3 为了使每一个音频样本块的时域频域特性匹配的更好,可以动态的改变 分析滤波器组的频谱分辨率。 4 频谱包络可以用可变的时间频率分辨率进行编码。 5 可以采用较复杂的比特分配,并修改核心比特分配例行程序的一些参数, 以便产生更加优化的比特比特分配。 6 在较低比特率时,为了得到更高的编码增益,可以将声道的高频部分耦 合在一起。 7 在双声道模式中,可以有选择的实行矩阵重置( r e m a t r i x i n g ) ,以便提 供附加的编码增益,以及当两信道的信号解码时使用一个矩形环绕声解码器 ( m a t r i xs u r r o u n dd e c o d e r ) ,还能获得改进的效果。 2 3 c 一3 解码 解码过程基本上是编码过程的逆过程。a c - 3 解码器原理如图2 3 所示,解码 器必须同编码数码流同步,检查误码,以及将不同类型的数据( 例如编码的频谱 包络和量化的尾数) 进行解格式化。运行比特分配程序,将其结果用于数据解包 ( u n p a c k ) 和尾数的解量化( d e - q u a n t i z e ) 。将频谱包络进行解码而产生各个指 数。各个指数和尾数被变换回到时域成为解码的p 例时间样本。 图2 3a c 一3 解码过程原理图 实际的a c - 3 解码器比起图2 - 3 中所示的更复杂,它还包括前面未说明的下述 功能: 1 如果检测出一个数据误码后,可以使用误码掩盖或静噪。 2 对于进行了高频耦合的声道必须去耦合。 1 2 中国科学技术大学硕十硷文第:章a c 3 算法标准 3 被重新设置矩阵的声道,必须去除矩阵化( 在双声道模式中) 。 4 与编码器分析滤波器组在编码过程中使用的方法相同,解码器必须动态 地改变综合滤波器的分辨率。 2 ,4a c - 3 码流结构 a c 一3 比特流是由一系列的同步帧( f r a m e ) 组成,每一个a c - 3 的帧的都具有 固定的尺寸,只由采样频率和编码数据率决定,帧与帧之间是互相独立的。 2 4 1 同步帧 a c 一3 帧结构如图2 4 所示。每个a c 一3 同步帧由同步信息( s y n ci n f o r m a t i o n , s i ) 开始,后接一个比特流信息块( b s i ) ,每个同步帧包含6 个编码的音频样本块 ( a u d i on l o c k ) ,其中每个音频块含有各个编码声道2 5 6 个新的音频信息,随后 是一个辅助数据区( a u xd a t a ) ,同步帧以循环码冗余效验字c r c 结束,c r c 字用 于出错校验。 s ij 蹦i 黜躲蚣艘,搬磁删裂黑出测踹 同步帧 图2 - 4a c - 3 帧结构 ( 1 ) 同步信息( s d 同步信息中包含为了获得同步和维持同步所需要的信息。包括:同步字 ( o x o b 7 7 ) :第一个循环码冗余效验字c r c l ( 应用于同步帧的前5 8 部分) , 用 于校验数据帧的前5 8 。;音频采样率码字;帧长码字。 ( 2 ) 比特流信息( b s i ) 比特流信息( b s i ) 包括比特流识别码、比特流模式、音频编码模式、中心混 音电平、环绕混音电平、d o l b y 环绕模式、低频效果标志、压缩率存储标志、压 缩率等31 个参数。 b s i 描述了编码数码流业务的各种信息,如音频编码模式参数a c n m d ,它有3 个比特,描述环绕声道是否正在使用中;中心声道是否在使用中:全带宽声道 参数的数 j n f c h a n s ;声道数目的次序等。如表2 - 1 所示。 中国科学技术大学硕十论文 第。章a c - 3 算法标准 表2 - 1 音频编码模式 a c m o da u d i oc o d i n gm o d en f c h a n s c h a n n e la r r a yo r d e r i n g 0 0 0 1 十12c h l c h 2 0 0 1 1 ,o1c 0 1 0 钓2l r 0 1 1 髫o3l c r 。1 鲋倒13l r s 1 0 创4l c r s 。1 1o t2 忽4l r s ls r 1 1 3 j f 25 l c rs l s r ( 3 ) a u d b l k 音频块 每个a c 一3 帧中有六个音频块,每一个音频块每声道包含2 5 6 个音频样点,如 图2 - 5 在音频块中包含有块切换标志( b l o c ks w i t c hf l a g s ) 、抖动标志( d i t h e r f l a g s ) 、动态范围控制( d y n a m i cr a n g ec o n t r 0 1 ) 、耦合方法( c o u p l i n g s t r a t e g y ) ,耦合坐标( c o u p l i a gc o o r d i n a t e s ) 、指数编码策略( e x p o n e n t s t r a t e g y ) 、指数( e x p o n e n t s ) 、比特分配参数( b i ta l l o c a t i o np a r a m e t e r s ) 、 尾数( m a n t i s s a s ) 。第一个数据块须包括正确解码比特流所需的全部必要信息, 而其它五个数据块可重用前面数据块的一些信息。音频块中的主要部分是指数 和尾数值。这里的指数包括耦合指数、声道指数以及低频效果声道指数,同样, 尾数值包括耦合尾数、声道尾数以及低频效果声道尾数。 b i t i鬻block d i t h c r d y n a m i c c她oup中lingc o 瓣u p 叫嬲 e x o n e m s a i l o c a t i o n m a n t i s s a s r a n g e f l a g s c o n t r o i p a r a m e t e r s 图2 - 5a c 一3a u d i o 音频块结构 数据在一帧内部具有共享性,例如在b l o c k o 中出现的信息可能会被该帧中 后续音频块所利用。这样,在后续音频块中若要用到之前音频块中已经出现的 数据,可设置重复使用以前的参数标志,就可不必重传这些数据,以达到减少 数据量的目的。由于各个块并不包含全部所需的信息,于是在音频帧中的各个 块大小各异,但所有块的总和必须装进固定大小的帧,个别块可以分配较多的 比特,相应的其它会要减少比特,但对解码器而言,带来的后果是必须保存一 帧中出现的数据,以备为后续音频块解码所需,从而增加了缓冲区的开销, ( 4 ) 辅助数据字段和帧误码校验字段 1 4 巾国科学技术大学硕十论文 第:章a c - 3 算法标准 不论何时编码器从不将全部可获得的数据用于音频信号的编码,在帧的最 后总存在一些未用的数据。这种情况出现在假使最后的比特指派没有用全部可 获得的比特,或假使输入音频信号仅仅是不需要把全部可获得的比特都进行编 码。或者,指令编码器有意留出一些比特不用于音频,让它们能用于辅助数据。 因辅助数据需要的比特数少于在任一特指帧中可获得的比特数( 它们随时间变 化) ,提供了一种方法通过信号告知在各帧中实际辅助数据的比特数。 各a c 一3 数据帧包含两个1 6 比特c r c 字,c r c i 处在帧头,紧随在同步字之后。 c r c 2 处在帧尾,是数据帧的最后一个1 6 比特字,恰在下一个帧同步字之前。c r c i 用于前5 8 帧,不包括同步字。c r c 2 覆盖后3 8 帧以及全帧( 不包括同步字) 。 2 4 2 同步帧约束条件 a c 一3 同步帧须满足以下约束条件,这些约束条件可减少a c 一3 解码器的输 入存储缓冲区的大小。 1 ) s i 区域、b s i 区域以及块0 和块1 的总长度之和不大于帧长的5 8 ; 2 ) 块5 的尾数与辅助数据长度及帧误码校验字段之和不大于帧长的3 8 , 3 ) 块0 总包含有正确解码比特流所需的全部必要信息; 4 ) 当耦合标志从o f f 变到o n 时,所有耦合信息都包含在此耦合标志为o n 的 数据块中,而以前耦合标志为o i l 的数据块中的耦合信息不再使用。 5 ) 在两个单声道模式( i + i ) 和单声道模式( i 0 ) 中不采用耦合。耦合时 至少有两个声道参与。 6 ) 数据在一帧内可以共享,但当其它参数变化引起某些数据尺寸发生变 化,则不能重复使用前一个音频块的这些数据。 2 5 c - 3 编码器设计考虑叫1 不像解码,a c - 3 编码没有固定的过程,它更要求对可选择的操作进行方案 分析,以期达到最理想的性能。几乎所有的通过比特流方式传递给解码器的参 数,必须是被编码器根据信号的特征有选择地决定。例如,使用暂态检测程序 来决定是否切换m d c t 变换长度;处理检查频域的指数和其他固定数据,以便决 定是否在每个声音块中重复传递不同的数据,还是在声音块之间分享相同的值; 决定合适的比特分配模型来确认比特分配参数以求达到最佳的主观听音质量。 因此,我们无法详细说明a c - 3 编码器的复杂度上限。 通常,为了决定可选择的比特指派参数和固定数据的重新使用( r e u s e ) 策 略,编码器必须考虑到一帧中所有音频块的所有声道。解码器可以一次对一个 中国科学技术大学硕十论文第= 章a c 3 算法标准 声道进行反变换( 或是一次一个块) ,然而编码器在进行任何的编码操作之前, 通常必须对六个音频块的所有声道进行变换。这样,编码器的存储空间要求将 是a c 一3 解码器的好几倍。 并且,编码器的比特分配过程一般是一个迭代的过程,因为编码器需要在 不超出允许码率的情况下分配尽可能多的比特数。最后编码器的任务是产生几 个被解码器简单采用的控制值,例如耦合参数和动态范围压缩字。考虑到编码 的策略分析是一个复杂的过程,编码器的m i p s 要求将大于解码器的很多,现在 编码器的设计根据它们经验性的程度,相应于解码器要求2 - 6 倍的m i p s 。对于双 声道超过1 9 2 k b p s 的数据率,或6 声道超过3 8 4 k b p s 的数据率,只需要中等的编码 器复杂性。 最后,因为编码器的字长会影响解码器的动态范围,在进行进一步变换前 应仔细计算。编码器使用浮点或者2 4 位的定点处理器,从而保证至少1 8 比特的 p c m 精度。 2 6 本章小结 本章首先介绍了a c 一3 标准的引入,概述了a c 一3 音频压缩标准的编码和解码 原理,并提出了编码器和解码器还应包括标准中未说明的一些功能。然后详细 介绍了a c 一3 比特流结构,a c - 3 比特流是由一系列的同步帧( f r a m e ) 组成,每一 个a c 一3 的帧的都具有固定的尺寸,只由采样频率和编码数据率决定,帧与帧之 间是互相独立的,设计的a c 一3 编码器所输出的基本比特流必需符合a c - 3 标准 中码流格式,这样才能得到正确解码。最后给出了设计a c 一3 编码器时所要考虑 的一些问题。下一章将详细介绍a c 一3 编码的设计。 1 6 中国科学技术大学硕士论文第三章a c 一3 编码器设计 第三章a 0 - 3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论