(计算机应用技术专业论文)j2a音频压缩技术的研究与应用实践.pdf_第1页
(计算机应用技术专业论文)j2a音频压缩技术的研究与应用实践.pdf_第2页
(计算机应用技术专业论文)j2a音频压缩技术的研究与应用实践.pdf_第3页
(计算机应用技术专业论文)j2a音频压缩技术的研究与应用实践.pdf_第4页
(计算机应用技术专业论文)j2a音频压缩技术的研究与应用实践.pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

(计算机应用技术专业论文)j2a音频压缩技术的研究与应用实践.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华东师范大学顾士学位论文摘要 摘要 随着计算机技术、现代通信技术、网络和信息处理技术的发展,多媒体技术 在社会生活中的应用越来越广泛。目前,多媒体技术所涉及的数据源包括:文字、 声音、图形、图像、动画等等。如何处理、组织这些数据,提高处理、存储和传 输的效率是多媒体技术所要解决的重要问题。在这些数据中,声音信号的信息量 越来越大,因此必须采用压缩技术。 目前关于音频压缩已有一些标准和算法,本文主要对一种新颖的音频压缩算 法j 2 a 音频压缩算法进行研究和应用实践。该算法是一种基于j p b g 2 0 0 0 标准, 同时结合“知觉音频编码技术”的新的压缩算法。j p e g 2 0 0 0 标准的理论基础是小 波变换;所以本文在前言和第二章分别对j p e g 2 0 0 0 标准及其特点、小波变换理论 做了比较详细的介绍,同时阐述了j e p g 2 0 0 0 的压缩算法以及基于该算法的j 2 a 音 频压缩算法的改进和实现:最后给出了一个基于上述理论和算法的音频播放器的 应用实例。该应用实例包括系统的硬件实现、软件实现以及对试验板功能进行的 测试和样机产品的推广调查。系统的硬件实现主要包括对控制接口电路的设计实 现,以及p c b 板的设计与布局。系统的软件实现采用模块化的方法实现,主要分 为音频处理模块、控制模块和存储模块三部分。其中音频处理包括音频的采集、 a d 转换、d a 转换、放大、压缩、鼹压缩等等;控制模块包括对音频处理时序、 命令等的控制;存储模块主要是存储已压缩好的音频数据。 本文所介绍的j 2 a 音频播放器是作者所在的研究小组和义统公司合作研究完 成,j 2 a 播放器的试验板由本研究小组独立完成;j 2 a 播放器样机则是和义统公司 共同完成,并已做过推广测试,测试报告见第五章“关于“带u 盘功能的j 2 a 播放 器”产品的调查情况汇报”。 本系统完成的功能有:音频播放、音质压缩率选择、u s b 通信功能、录音功 能。其中硬件方面极具优势,和同类产品比较,使用的器件少,只需要三块芯片, 需要的附加器件少,成本价低:系统功耗低,具有很好的应用接口和可扩展性, 应用前景良好。 本人在该系统中的贡献有: 1 、分析研究j 2 a 音频压缩算法的基础理论,以及该算法的正确性、可行性; 2 、研究e t 8 3 x 4 3 2 芯片的应用,构成一个音频播放器试验板,并对其进行测 试和结果分析: 3 、协助义统公司开发j 2 a 音频播放器样机,进行样机的性能分析和市场调查。 华东师范大学硕士学位论文摘要 关键词:j p e g 2 0 0 0 小波变换音频压缩解压缩j 2 a 音频播放器 儿 华东师范大学硕士学位论文 a b s t r a c t a b s t r a c t n o w a d a y s ,w i t ht h ed e v e l o p m e mo fc o m p u t e rt e c h n o l o g y ,m o d e mc o m m u n i c a t i o n t e c h l o l o gy ,n e t w o r kt e c t m 0 1 0 9 y a i l di 1 0 n n a t i o n p r o c e s s i n gt e c h n o l o g y , t h e a p p l i c a t i o no f m u l d m e d i at e c h n o l o g yi sb e c o m i n gm o r ca n dm o r ep o p l l l 腻a tp r e s e n t , m em u l t i r i l e d i ad a t as o u r c e 如c l u d et e x t ,a u d i o ,v i d e o ,掣印h i c ,i m a g e ,a n i m 砒i o ne t c t h ei m p o r t a n ti s s u e si nm u l t i m e d i at e c h n o l o g ya r eh o wt od e a lw i t ha i l do r g a i l i z e t l e s ed a 诅,a n dh o wt oi m p r o v et h ee 伍c i e n c yo fd a t as t o r a g ea n dt r 柚s i i l i s s i o na m o n g m e s em u l t i m e d i ad a t a ,廿l ea u d i oi n f o 加a t i o ni sm o r ea 1 1 dm o r eh u g e ;i ti sq u i t e r l e c e s s a r yt oo f f 醯s u i t a b l ec o m p r e s s i o nt c c h n o l o g i e sf o ra u d i od a t a n o wt h e r ea r ca l r c a d y 囊o m es t a r l d a r d sa i l da l g o 矗也m sf o ra u d i oc o d e c an e w a u d i oc o d e cm e t l l o d s j 2 a ,姐c hc a i lb cr e a l i z e db ye t 8 3 x 4 3 2c h i p ,i ss t u d i e da i l d i n t r o d u c e di nt h j sp a p e lt h ej 2 ac o d e c a l g o r i 血mi sb a s e do ns t a l l d a r dj p e g 2 0 0 0 1 e o r ya i l dt 1 1 ep e r c e p ta u d i oc o d i n gt e c h n o l o g 矿t h et h e o r yf o l l i l d a t i o no fs t a n d a r d j p e g 2 0 0 0i sw 打e l e tt r 趾s f b m l ,s om e 吐1 e o r i e sa i l d p r o p e 币e so fm ew a v e l c t t r a n s f o n i la i l d 也ej p e g 2 0 0 0a r ei n 廿o d u c e di nt h ep r e f a c ea n dc h a p t c rt 、v oo ft h i s p a p e lt h ed e t a i l e di i 血o d u c t i o na b o u tm ej 2 aa l g o r i m mi sa l s od i s c u s s e di nm i s p a p e las i m p l eb u tm g h l ye f n c i e n tj 2 aa u d i op l a y e ri si m p l e m e n t e db y 印p l y i n gm e j 2 ac o d e ct e c h n o l o g y 办ed c s i g nm e t h o d sa n di m p l e m c n 诅t i o nt e c h n o l o g i e sf o r m ej 2 aa u d i op l a y e ra r ea i s od i s c u s s e di nt h i sp a p e lat e s t i n gj 2 aa u d i op i a y e ri s p r e s e m e da sa na p p l i c a t i o ne x a m p l e t h eh a r d w a r eo ft h ej 2 ap l a y e ri n c l u d e st 1 1 r e e c h j p s n l e ya r ce t 4 4 m 2 l om c uc h i p e t 8 3 x 4 3 2a u d i oc o d e cc h i pa n da1 6 m n a n dn 硒hc h i pr e s p e c t i v e i y i h cs o 讯v a r eo 九h ej 2 ap l a y e ri n c l u d e st h r e em o d u i e s t h e ya r e 叭l d i op r o c e s s 加gm o d u l e ,s i 驴a lc o n 仃0 1 i i n gm o d u l ea r l dd a t as t o r a g em o d u l e t h ea u d i op r o c e s s i n gm o d u l ep e r f o n n sd a t as 锄p l i n g ,a d c 巾a c ,a m p l i 匆i n g , c o m p 豫s s i o na n dd e c o m p r e s s i o ne t c ;t 1 1 ec o n 仃o lm o d u l ep e r f 0 廿n sd e m a n dc o n t r o l l i n g , d m 血gc o n 价o l l i i l ge t c ;t h es t o r a g em o d u l cp e b m l st h ed a t as t o r a g e , t h e j 2 ap l a y e ri sc o i m p l e n l e n t e db yo u rr c s e a r c hg r o u pa n dt h ee t o m sc o t h e j 2 ap l a y e rt e s tm a c ei si m p l e m e n t e db yo u rr e s e a r c hg m u p ;t h ej 2 ap l a y e r s 卸1 p l em a c h i n ei si m p i e m e n t e db yt h ce t o m sc o i nt l l i sp a p er ,m e r ei sa n i 1 1 v e s t i g a t i o nr e p o r ta b o u tt h e “j 2 aa u d i op l a y e r 谢t hau s b ” o u rj 2 aa u d i op l a y e r sf e a n l r e si n c l u d e :p l a y i n gm u s i c ,t h ec o m p r e s s i o nr a t i o s e l e c t i o n ,u s bc o m m u n i c a t i o n 是n c t i o n ,e t c i t ;sal o w p o w e r l o w c o s ts y s t e m i t i i i 华东师范大学硕士学位论文 a b s t r n c t p e r f b 肌sag o o di m e r f a c ea 1 1 d a 1 1e x c e l l e me x p a n s i b i l i t y w bb e i i e v ei t 、v i l lh a v ea g l o r i o u sa p p l i c a t i o n 矗帅r e t h e 踟“h o r sc o n l n b l m o l l sa r el i s 钯da s b l l o w s : 1 a n a l y z i n ga n ds t u d y i n gt h er a t i o n a l e ,m ec o r r e c m e s sa n dt 1 1 ef c a s i b i l i t yo fj 2 a c o d e c “g o r i t h m ; 2 r c s e a r c h i n gt h es p e c i f i c a t i o na i l da p p l i c a t i o no fe t 8 3 x 4 3 2c h i p ,d i s c u s s i n g 血e d e s i g nm e m o df o rm ej 2 ap l a y e r ,a 1 1 da i l a l y z i n gt h et e s t i n gr e s u i t s 3 c o - d e v e l o p i n g 也ej 2 ap l a y e rs 柚1 p l em a c l i n ea n dm a k i n gap e r f b m a n c ea 1 1 a i y s i s a n dm a r k e t i n gi n v e s t i g a t i o n k 町w o r d s :j p e g 2 0 0 0w t ( w a v e l e tt r a n s f o 珊) a u d i oc o d e c j 2 ap l a y e r 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及 取得的研究成果。据我所知,除文中已经注明引用的内容外,本论文 不包含其他个人已经发表或撰写过的研究成果。对本文的研究做出重 要贡献的个人和集体,均已在文中作了明确说明并表示谢意。 作者签名:缕兰皇塾日期:塑! :! :三! 学位论文授权使用声明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版。有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅。有权将学位论文的内容编入有关数据库进 行检索。有权将学位论文的标题和摘要汇编出版。保密的学位论文在 解密后适用本规定。 学位论文作者签名:弓_ l c 兰奴 二2 往 导师签名: 7 一 华东师范大学硕士学位论文 第一章前言 第一章前言 1 1 音频压缩技术的现状 随着计算机技术、现代通信技术、网络和信息处理技术的发展,多媒体技术 在社会生活中的应用越来越广泛。目前,多媒体技术所涉及的数据源包括:文字、 声音、图形、图像、动画等等。如何处理、组织这些数据,提高处理、存储和传 输的效率是多媒体技术所要解决的重要问题。在这些数据中,声音的信息量越来 越大。这样,声音的传输和存储面临一个非常重要的问题,就是必须对声音数据 进行压缩,以减小数据量。声音数据之所以可以压缩是因为有以下两个原因:一 是利用人耳的听觉特性,在不被主观听觉察觉的范围内,通过减少表示信号的精 度,以一定的客观失真来换取数据压缩;二是声音数据中存在大量的冗余度可供 压缩。 音频压缩技术指的是对原始数字声音信号流运用适当的数字信号处理技术, 在尽可能不损失有用信息的情况下降低( 压缩) 其码率。音频压缩也称为音频编 码。它必须具有相应的逆变换,称为音频解压缩或解码。不过,音频信号在通过 一个编解码系统后可能引入大量的噪声和定的失真。 音频信息包括两种类型,一种是语音信息,所占用的频率范围较小,一般在 4 k h z 以下;另一种是指一般意义上的音频,这种声音信息占用的频率范围很大, 一般在2 0 0 h z 到2 0 k h z 之间。这两种音频信息的压缩技术具有很大的差别。 音频压缩编码发展至今,己拥有多种不同的算法标准,适用于不同的场合和 要求。目前使用较多的音频压缩标准主要是m p e g 系列和i t u 的g 系列音频编码标 准。 1 1 1 肝e g 标准 m p e g ( m o v i n gp i c t u r ee x p e r t sg r o u p ) 是运动图像专家组的简称,是隶属 于i s o i e c 的一个专家工作组。m p e g 标准是面向运动图像压缩的一个系列标准。 最初m p e g 专家组的工作项目是3 个,即在1 5 m b p s 、l o m b p s 、4 0 m b p s 传输速率下对 图像编码,分别命名为m p e g 一1 、h i p e g 一2 、m p e g 一3 。1 9 9 2 年,m p e g 一2 适用范围扩大 到高清晰度电视( h d t v ) ,能支持m p e g 一3 的所有功能,因而m p e g 一3 被取消。同时 为了满足不同的应用要求,m p e g 又陆续增加了其他一些标准,比如m p e g 一4 、 m p e g 一7 。 1 、m p e g 一1 1 】 华东师范大学硕士学位论文 第一章前言 “用于数字存储媒体运动图像及其伴音速率为1 5 m b p s 的压缩编码”简称 m p e g l ,作为i s o i e c l l l 7 2 号建议于1 9 9 2 年通过。该标准分为4 个部分: ( 1 ) m p e g 系统( n 1 7 2 1 ) :定义音频、视频及有关数据的同步; ( 2 ) m p e g 视频( 1 1 1 7 2 2 ) :定义视频数据的编码和重建图像所需的解码过 程,亮度信号分辨率为3 6 0 2 4 0 ,色度信号分辨率为1 8 0 1 2 0 ; ( 3 ) m p e g 音频( “1 7 2 3 ) :定义音频数据的编码和解码; ( 4 ) 一致性测试( 1 1 1 7 2 4 ) 。 m p e g 音频压缩算法是第一个高保真音频数据压缩国际标准,它同时可完全独 立地应用。m p e g 音频压缩标准有以下特点: ( 1 ) 音频信号采样率可以是3 2 k h z ,4 4 1 k h z 或4 8 k h z ; ( 2 ) 压缩后的比特率可以按以下4 种模式之一支持单声道或双声道: 提供给单音频通道的单声道模式; 提供给两个独立的单音频通道的双一单声道模式; 提供给立体声通道的立体声模式; 联合立体声模式,利用立体声通道之间的关联或通道之间相位差的无 关性,或者对两者同时利用; ( 3 ) 压缩后的比特流具有预定义的比特率之一。m p e g 音频标准也支持用户 使用预定义比特率之外的比特率; ( 4 ) m p e g 音频标准提供3 个独立的压缩层次,用户可以在复杂性和压缩质量 之间权衡选择。 层1 最简单,使用比特率3 8 4 k b p s ,主要用于d c c ( d i g i t a lc o m p a c t c a s s e t t e ) 。 层2 的复杂度中等,使用比特率1 9 2 k b p s 左右,主要应用于数字广播的 音频编码,c d r o m 上的音频信号以及c d i 和v c d 。 层3 最复杂,但音质最佳,使用比特率6 4 k b p s ,简称m p 3 。尤其适用于 i s d n 上的音频传播。 ( 5 ) 编码后的比特率支持循环冗余校验c r c ( c y c l i cr e d u n d a n c yc h e c k ) ; ( 6 ) m p e g 音频标准还支持在比特率中载带附加信息。 2 、m p e g 一2 1 1 1 9 9 2 年1 1 月,成为国际标准的m p e g 一1 视频部分主要是针对1 5 m b p s 的应用, 其约柬参数码流是针对s i f ( s t a n d a r di 皿a g ef i l e ) 格式( 3 5 2 2 4 0 3 0 帧秒或 相当) 得到优化参数。i s 0 i e c l 3 8 1 8 标准m p e g 一2 视频利用网络提供的更高的带宽 ( 1 5 m b p s 以上) 来支持具有更高分辨率图像的压缩和更高的图像质量。与m p e g l 视频比较,m p e g 一2 可支持交迭图像序列( 即每帧图像由交替的两个场组成) ,支 2 华东师范大学硕士学位论文 篇一章前言 持可调节性编码,并且具有其他许多先进的选择,多种运动估计方式和两种扫描 方式,因而取得更好的压缩率和图像质量。 为了适应不同应用的要求,并保证数据的可交换性,m p e 争2v i d e o 定义了不 同的功能档次( p r o f i l e s ) ,每个档次又分为几个等级( l e v e l s ) ,一个等级为 n 的解码器能够对最高为该等级的数码流解码。 档次和等级定义了解码器的能力和复杂度。实际上m p e g 一2 视频只是定义了码 流的格式( 相应定义了解码器) 。至于编码器,m p e g 一2 未作定义,唯一的要求是 所产生的码流要符合m p b g 一2 规定的格式,因而设计编码器有较大的自由度。 为了保证与m p e g 一1 向下兼容及广播、通信、计算机、家用视听设备的要求, m p e g 一2 还定义了1 1 种规范。 m p e g 一2 音频的基本特性之一是向后与 f p e g l 音频兼容。肝e g 一2 音频可以是 5 1 声道也可以是7 1 声道的环绕立体声。5 1 声道也称为“3 2 立体声加l f e ”, 它的含义是播音现场的前面可有3 个喇叭声道( 左、中、右) ,后面可有两个环 绕声喇叭声道。l f e ( l o wf r e q u e n c ye f f e c t s ) 是低频音效的加强声道。7 1 声 道环绕立体声与5 1 声道类似,它另有中左、中右2 个喇叭声道。 m p e g 一2 音频对m p e g l 音频进行了扩充,它由两部分构成:部分是与m p b g l 音频兼容的部分,主要是增加了对2 2 1 k h z 等较低采样频率的支持和对多通道音 频节目的支持;另一部分则是a a c 音频编码标准,它和m p e g l 音频并不兼容,但 因为它使用了更先进音频压缩技术,能够在更低的比特率下提供较高的音频质 量。a 是c 反映了音频编码技术的新进展,在压缩位率、音频质量方面,相对于旰e g - l 音频都有明显的优势。 3 、姗e g 一4 2 1 m p e g 一4 是i s 0 公布的“超低比特率( 6 4 k b p s ) 的运动图像和语音压缩标准”, 它被称为“全能”标准。1 9 9 8 年1 0 月批准第一版,它是一种新型的多媒体标准。 可以用在现有电话线、移动通信网的可视电话等领域中。其目的是寻求支持数字 音频视频数据通信、存取和管理的新途径。它的显著特点是基于内容的编码, 新增加一些重要的多媒体功能,提供高度的交互性、互操作性和灵活性。 1 9 9 8 年微软开发了第一个在p c 上使用的m p e g 一4 编码器,它包括m sm p e g 一4v 1 、 i sm p e g 一4v 2 、m sm p e g 一4v 3 的系列编码。随后,人们开发了d i v x ,它改良了m s 的肝e g 一4v 3 ,是目前互联网上普遍采用的m p e g 一4 编码器之一。为了强化m p e g 一4 核心的开放,最近网上又出现了一种新的m p e g 一4 编码x v i d ,被认为是目前最 快的m p e g 一4 编码。 由于m p e g 一4 技术出色的压缩速率和良好的图像效果,目前无论是压缩电影、 视频电话,还是数码摄像机、数码相机,都采用m p e g 一4 作为视频压缩标准。随着 华东师范大学硕士学位论文 第一章前言 宽带网络的普及,m p e g 一4 将带动网络视频应用的发展。 在音频方面,m p e g 一4 将以前分离的高质量音频压缩编码、语音编码和计算机 音乐融合。通过m p e g 一4 音频编码,可以存储或传输以下信息:“ 高质量音频信号( 单声道、立体声和多声道) ; 中间质量音频信号; 宽带语音信号( 如,7 k h z 带宽) : 窄带( t o l l0 u a l i t y ) 语音信号; 可理解语音信号; 合成语音信号( 如文本合成语音) ; 合成音频。 m p e g 一4 音频是对m p e g 一2 的进一步扩充。就音频压缩技术来说,它相对m p e g 一2 的主要进步在于提供了a a c 的一些加强工具。 4 、m p e g 7 m p e g 一7 于2 0 0 1 年推出,它本身并不试图定义一种新的数字压缩方法,而主要 是针对基于内容的多媒体描述问题。 m p g 一7 是m p e g 继m p e g l 、m p e g 一2 、m p e g 一4 之后制定的新标准,但它与前三个 标准不同,它超越基于波形或基于样本、基于压缩( 如m p e g l 和m p e g 一2 ) 甚至是基 于对象( 如m p e g 一4 ) 的表示,也超越具体的存储方式( 如可以应用于存储在磁带、 影片等上的模拟信号,也可以应用于存储在磁盘、光盘上的数字信号,甚至可以 应用于存在于纸上的图形、图片) ,其目的是建立一种基于多媒体内容的描述方 式。以便更有效地支持多媒体资料在产生、存储、交换、传输等过程中的各种应 用,这些应用包括搜索引擎、编辑工具和个性化的检索机制等。但m p e g 一7 并不涉 及这些在具体的应用,而是仅仅定义了多媒体内容的描述方法,下图卜l 是关于 m p e g 一7 标准内容的抽象描述。 m p e g - 7 标准的范围 图卜lm p e g 一7 标准内容描述 m p e g 一7 对多媒体信息的描述目前主要包括以下几个方面( 当然,随着应用的 不断深入,m p e g 一7 也在不断的扩充和完善) : 有关媒体制作方面的信息( 如媒体的制作商、标题等) : 有关媒体使用方面的信息( 如媒体的版权、使用记录等) : 华东师范丈学硕士学位论文 第一蕈前言 有关媒体存储方面的信息( 如媒体的编码方式、存储格式等) ; 有关媒体时间域、空间域方面的信息( 如媒体中的场景切换、区域分割等) ; 有关媒体特征方面的信息( 如媒体的灰度、纹理、音频特征等) ; 有关媒体内容表述方面的信息( 如媒体中包括的对象、事件及其之间的相 互关系等) 。 m p e g 标准的算法编码过程和解码过程是一种非镜像对称算法,也就是说运动 图像的压缩编码过程与解码过程是不对称算法,解码过程要比编码过程相对简单 些。实际上,m p e g 一1 和m p e g 一2 只是规定了解码方案,重点将解码算法标准化。 1 1 2g 系列音频编码技术 g 系列 是i ,r u t (i n t e r n a t i o n a lt e l e c o m u n i c a t i o nu n i o n t e l e c o 硼u n i c a t i o n ) 国际电信联盟一电信标准化组织的一套音频压缩标准,其 中大部分标准是用来进行语音压缩的。目前使用较多的有g 7 2 l 、g 7 2 9 等,它们 在最低可达8 k b p s 的位率下能够提供较好的语音压缩效果。下表卜1 说明了g 系列 标准的基本情况。 表卜1g 系列音频( 语音) 压缩标准 标准名称 。; u b 特率( k b 自g 卜 采样颁察强h z ) g 7 1 13 2 8 g 7 2 13 28 g 7 2 26 41 6 g 7 2 2 12 4 、3 21 6 g 7 2 32 4 、4 08 g 7 2 3 15 6 、6 38 g 7 2 81 68 g 7 2 988 g 系列在g 7 2 1 、g 7 2 9 这两个系列之外,还存在其他的音频语音压缩标准, 如f s ( f e d e r a ls t a n d a r d ) 系列、f s l o l 6 的4 8 k b p sc e l p ( 码激励线性预测) 编解 码方案等。 1 1 3 多声道环绕声音频压缩技术 随着技术的不断进步和生活水准的不断提高,原有的立体声形式已不能满足 听众对声音节目的欣赏要求,具有更强定位能力和空间效果的三维声音技术得到 蓬勃发展。而在三维声音技术中最具代表性的就是多声道环绕声技术。 华东师范大学硕士学位论文 第一章前言 更准确地说,环绕声应该是一种声音恢复形式,其新技术的含量实际表现在 随着这种形式发展起来的一些数字压缩标准上。环绕声技术发展至今已相当成 熟,已日渐成为未来声音形式的主流。有鉴于此,1 9 9 2 年c c i r ( c o n s u n a t i v e c o 衄i t t e eo ni n t e r n a t i o n a lr a d i o ) 国际无线电咨询委员会( i t u r ) 以建议 的形式约定了多声道声音系统的结构及向下兼容变换的标准,即c c i r r e c o 哪e n d a t i 。n7 7 5 。其中主要约定了大家熟知的5 1 声道形式及7 1 声道形式, 而在对环绕声压缩的研究上也产生了许多专利技术,如d o l b ys u r r o u n d p r o l o g i c 、t h x 、d o l b ya c 一3 、d t s 及m p e g 一2 等。这些技术在不同的场合,尤其 是在影剧院、家庭影院系统,以及高清晰度电视( h d t v ) 等系统中得到广泛的应 用。 1 、d o l b ya c 一3 d o l b ya c 一3 技术是由美国杜比实验室针对环绕声开发的一种音频压缩技术。 在5 1 声道的条件下,可将码率压缩至3 8 4 k b p s ,压缩比约为l o :1 。d o l b ya c 一3 最初是针对影院系统开发的,但目前已成为应用最为广泛的环绕声压缩技术之 一o d o l b ya c 一3 是一种感知型压缩编码技术。在d o l b ya c 一3 中,音频输入以音频 块为单位,块长度为5 1 2 个样值,在4 8 k h z 采样率时即为1 0 6 6 毫秒,各声道单独 处理:音频输入在经过3 h z 高通滤波器去除直流成分后,通过另一高频带通滤波 器以检测信号的瞬变情况,并用它来控制t d a c 变换的长度,以期在频域分辨率和 时域分辨率之间得到最好的折中效果;t d a c 变换的长度一般为5 1 2 点,而数据块 之间的重叠长度为2 5 6 点,即t d a c 每5 3 3 毫秒进行一次;在瞬变条件下,t d a c 长 度披等分为2 5 6 点,这样d o l b ya c 一3 的频域分辨率为9 3 7 5 h z ,时域最小分辨率为 2 6 7 毫秒:定点浮点转换类似于m p e g 一1 中比例因子计算的作用,主要是为了获 得宽的动态范围,而在分离后的指数部分经编码后则构成了整个信号大致的频 谱,又被称为频谱包络;比特分配主要是通过计算解码后的频谱包络( 视为功率 谱密度) 和掩蔽曲线的相关性来进行的;由于比特分配中采用了前后向混合自 适应比特分配以及公共比特池等技术,因而可使有限的码率在各声道之间,以及 不同的频率分量之间获得合理的分配:在对尾数的量化过程中,可对尾数进行抖 晃处理,抖晃所使用的伪随机数发生器可在不同的平台上获得相同的结果;d o l b y a c 一3 的帧结构由同步字、c r c 、同步信息( s i ) 、码流信息( b s i ) 、音频块和附 加数据等组成,帧长度与t d a c 变换的长度有关,在长度为5 1 2 点时,帧长为3 2 毫 秒,即每秒3 1 2 5 帧。 在d o l b ya c 一3 中,使用了许多先进的、行之有效的压缩技术,如前后向混 合自适应比特分配、公共比特池、t d a c 滤波、频谱包络编码、及低码率条件下使 华东师范大学硕士学位论文 第一章前言 用的多声道高频耦合等。而其中许多技术对其它的多声道环绕声压缩技术的发展 都产生了一定的影响。 可以说,d o l b ya c 一3 的出现是杜比公司几十年来在声音降噪及编码技术方面 的结晶,在技术上它具有很强的优势。因而即使作为一项专利技术,d o l b ya c 一3 仍然在影院系统、h d t v 、消费类电子产品( 如l d 、d v d ) 及直播卫星等方面获得 了广泛的应用,得到了众多厂商的支持,成为业界事实上的标准。 2 、m p e g 一2b c m p e g 一2b c ( 后向兼容方式) ,即i s o i e c l 3 8 1 8 3 ,是另一种多声道环绕声 音频压缩技术。早在1 9 9 2 年初,该方面的讨论工作便己初步开展,并于9 4 年1 1 月正式获得通过。m p e g 一2b c 主要是在m p e g l 和c c i r r e c 7 7 5 的基础上发展起来 的。与m p e g l 相比较,m p e g 一2b c 主要在两方面做了重大改进。一是支持多声道 声音形式,二是为某些低码率应用场合,如多语声节目、体育比赛解说等而进行 的低采样率扩展。同时,标准规定的码流形式还可与m p e g 一1 的第l 和第2 层做到前、 后向兼容,并可依据c c i rr e c 7 7 5 做到与双声道、单声道形式的向下兼容,还能 够与d 0 1 b ys u r r o u n d 形式兼容。 在m p e g 一2b c 中,由于考虑到其前、后向兼容性以及环绕声音形式的新特点, 在压缩算法中除承袭了m p e g l 的绝大部分技术外,为在低码率条件下进一步提高 声音质量,还采用了多种新技术。如动态传输通道切换、动态串音、自适应多声 道预测、中央声道部分编码( p h a n t o m c o d i n go fc e n t e r ) 、预编码( p r e d i s t o r t i o n ) 等。 m p e g 一2b c ( b a c k w a r d s c o m p a t i b l e ) 通过如下矩阵置换: l = 上+ 口 c + 6 十。 及 r ,= 月+ 口十c + 6 + 工 t 和足表示左、右环绕声道,c 表示中央声道, f p e g l 解码器可以解m p e g 一2b c 的码流。m p e g 一2b c 中,根据对m c ( m u l t i c h a n n e l ) 的不同扩展,分为三个层次, 与m p e g 一1 一样,m p e g 一2b c 的第三层扩展最为灵活,扩展声道数也可以灵活选择 。 然而,m p e g 一2b c 的发展和应用并不如m p e g l 那样帆风顺。通过对一些相 关资料的比较可以发现。1 ,m p e g 一2b c 的编码框图在标准化过程中发生了重大的 变化,上述的许多新技术都是在后期引入的。事实上,正是与m p e g l 的前、后向 兼容性成为m p e g 一2b c 最大的弱点,使得m p e g 一2b c 不得不以牺牲码率的代价来换 取较好的声音质量。一般情况下,m p e g 一2b c 需6 4 0 k b p s 以上的码率才能基本达到 e b u “无法区分”的声音质量要求。由于m p e g 一2b c 标准化的进程过快,其算法自 身仍存在一些缺陷。这一切都成为m p e g 一2b c 在世界范围内得到广泛应用的障碍。 3 、d v d 华东师范丈学硕士学位论文 第一章前言 d v d ( d i g i t a lv e r s a t i l ed i s k ) 是新一代的多媒体数据存储和交换的标准。 在视频d v d 的伴音方式及音频d v d 的声音格式选择上,d 0 1 b ya c 一3 和m p e g 一2b c 之 间的争夺十分激烈,最后达成的协议。可见,多声道环绕声音频压缩技术标准亟 待统一。 4 、肝e g 一2a a c 1 9 9 4 年,在d e u t s c h et e l e k o m 和b b c 举行的测试中,m p e g 一1b c 标准在 3 2 0 k b p s 5 c h 时不能达到欧广联的广播音质要求,而在同样条件下,d o l b ya c 一3 与a t t 的m p a c 虽然也没有达到目标,但在总体上比m p e g 一1b c 的效果好很多,鉴 于这种情况,m p 踮组织开始致力于菲后向兼容的音频压缩标准的制定,这就是先 进的音频压缩编码标准( a d v a n c e da u d i oc o d i n g ,简称a a c ) 。a a c 具有以下特点 盯】: 支持采样率包括4 8 k h z ,4 4 1k h z ,3 2 k h z ; 支持出入声道数配置包括i o ( 单声道) 、2 0 ( 立体声) 和其它多声道配置, 例如3 2 + 1 配置( 环绕立体声加超重低音) ,最多可支持4 8 个声道编码; 支持从多声道码流中复制出较少声道的信号: 在3 8 4 k b s 5 ,1 条件下,达到i t u r 广播音质; 预先定义接入单元,使剪辑粒度最小化: 在误码环境下保持正确的同步,并支持误码隐藏。 a a c 系统开发以模块为基础,而 i p e g 一2b c 及m p e g l 则以整个系统为基础,所 以,在有利于提高整个系统的前提下,a a c 的每个模块或工具都可以单独优化。 如果不同的方法获得相同的改进质量,则其它标准,例如复杂度、可剪辑度、可 调整度、误码健壮性等因素将被纳入考虑范围1 。 1 2j 2 a 音频压缩技术的由来 l 。2 1j p e g 2 0 0 0 图像压缩技术 j p e g 2 0 0 0 是关于静态图像压缩的最新国际标准。j p e g 缩写代表“联合图片专 家组( j o i n tp h o t o g r a p h i ce x p e r t sg r o u p ) ”。j p e g 2 0 0 0 既作为i s o i e c 标准, 又作为i t u t 建议被发布。i s 0 i e c 缩写代表“国际标准化组织国际电工技术委 员会 ( i n t e r n a t i o n a lo r g n i z a t i o nf o rs t a n d a r d i z a t i o n i n t e r n a t i o n a l e l e c t r o t e c h n i c a lc o 舢i s s i o n ) ”,i t u t 缩写代表“国际电信同盟一终端部门 ( i n t e r n 8 t i o n a lt e l e c o f i l m i n i c a t i o n su n i o n t e r m i n a ls e c t t o r ) ”。 另夕卜, 联合二值图像专家组( j o i n tb 卜l e v e li m a g e r ye x p e r t sg r o u p ,j b i g ) 经常与 华东师范太学硕士学位论文 第一章前言 j p e g 委员会亲密合作。在j p e g 2 0 0 0 的整个发展过程中,j p e g 和j b i g 委员会在 i s o i e c j t c l s c 2 9 w g l 的支持下运作,该缩写代表“i s o i e c 联合技术第1 委员会 第2 9 研究委员会第1 工作组。目前j p e g 2 0 0 0 己经由i s o i e c j t c l s c 2 9 标准化小组 正式命名为“i s o l 5 4 4 r ,其基本部分( p a r t l ) 已经作为i s o 标准公布于世。 j p e g 2 0 0 0 图像压缩标准基于小波变换理论,采用s t a t e o f t 1 1 e a r t 压缩技术。 该标准共有1 2 部分,其中p a r t l 是j p e g 2 0 0 0 的核心编码系统,已在2 0 0 0 年1 2 月成 为国际标准,其目标是提供一个最小化的无知识产权问题的j p e g 2 0 0 0 可用系统; p a r t 2 是扩展系统,与p a r t l 比较,它采用的技术更复杂,性能也更优良;p a r t 2 p a r t 6 已完成或基本完成,其中p a r t 3 是关于运动图像部分,p a r t 4 是一致性部分, p a r t 5 是参考软件部分,如j a v a 、c ,p a r t 6 是混合图像文件格式部分,如文档成 像、传真等应用;p a r t 7 目前已取消;p a r t 8 p a r t l 2 正在发展中,p a r t 8 是关于 安全的部分,p a r t 9 是关于交互式协议与应用编程接口部分,p a r t l 0 是三维立体 图像部分,p a r t l l 是关于无线应用部分,p a r t l 2 是关于i s o 基本媒体文件格式部 分( 其功能与m p e g 一4 功能同) 。 本论文主要基于j p e g 2 0 0 0 的第1 部分完成的,所以重点讨论j p e g 2 0 0 0 的第l 部分:下面论述的特点和算法也都是针对j p e g 2 0 0 0 的第l 部分而言。 j p e g 2 0 0 0 标准提供了一套新的特征,这些特征对于一些新产品的应用是非常 重要的,它把j p e g 的四种模式( 顺序模式、渐进模式、无损模式和分层模式) 集成 在一个标准之中。j p e g 2 0 0 0 的应用领域包括互联网、彩色传真、打印、数字摄像、 遥感、移动通信、医疗图像和电子商务等等,由于采用了离散小波变换和最新的 嵌入式编码技术,所以具备了传统的j p e g 所无法比拟的优势。j p e g 2 0 0 0 最主要的 特征如下: ( 1 ) 超低比特率性能:j p e g 2 0 0 0 在所有位率下都具有出众的性能。在高比 特率时,j p e g 2 0 0 0 的压缩优势平均比j p e g 高约2 0 ;在低

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论